Afsnit 5.5: Simulationsbaseret metode

Ophobningsloven, som præsenteret i de to foregående afsnit, giver en simpel approksimation til beregning af standard error på en transformeret måling. Approksimationen bygger på, at funktionen, der indgår i beregningen, næsten er lineær i et område, der dækker det meste af variationsområdet for input til funktionen. I dette afsnit vil jeg beskrive en simuleringsmetode, der kan bruges, når vi ikke stoler på approksimationen.

Jeg starter med et simpelt eksempel for at illustrere ideerne. Udgangspunktet er en måling $\hat\mu$ af parameteren $\mu$ og en tilhørende standard error $\text{std}_s(\hat\mu)$ . I forbindelse med ophobningsloven forestiller vi os, at vi approksimativt har, at $\hat\mu$ er normalfordelt med middelværdi $\mu$ og en varians $\sigma^2,$ hvor $\text{std}_s(\hat\mu)^2$ er et skøn over $\sigma^2.$ Vores primære interesse er ikke parameteren $\mu,$ men derimod parameteren $\theta=\mu^2.$ For denne parameter har vi skønnet $\hat\theta=\hat\mu^2,$ og da $\frac{d\theta}{d\mu}=2\mu,$ har vi fra ophobningsloven, at $\text{std}_s(\hat\theta)=2|\hat\mu|\cdot\text{std}_s(\hat\mu).$ Lad os som et konkret numerisk eksempel sige, at $\hat\mu=3.0$ og $\text{std}_s(\hat\mu)=1.0,$ så får vi $\hat\theta=3.0^2=9.0$ og fra ophobningsloven, at $\text{std}_s(\hat\theta)=2\cdot 3.0\cdot 1.0=6.0.$ For at undersøge om denne værdi rammer rigtigt, ville det være optimalt at simulere et stort antal (nSim) observationer $x_m,$ $m=1,\ldots,\text{nSim},$ fra en $N(\mu,\sigma^2)$ -fordeling og beregne spredningen (RMSE) på de kvadrerede værdier $x_m^2,$ det vil sige $\sqrt{\frac{1}{n}\sum_{m=1}^{\text{nSim}}(x_m^2-\theta)^2}$ med $\theta=\mu^2.$ Denne optimale tilgang kan vi ikke gennemføre, da $\mu$ og $\sigma^2$ er ukendte. Vi gør i stedet det, at i simulationsprocessen erstatter vi $\mu$ med $\hat\mu$ og $\sigma$ med $\text{std}_s(\hat\mu).$ Vi simulerer således observationer $\tilde\mu_m,$ $m=1,\ldots,\text{nSim},$ fra en $N(\hat\mu,\text{std}_s(\hat\mu)^2)$ -fordeling og beregner $\text{std}_\text{sim}(\hat\theta)= \sqrt{\frac{1}{n}\sum_{m=1}^{\text{nSim}}(\tilde\mu_m^2-\hat\theta)^2}$ med $\hat\theta=\hat\mu^2.$ Hvis antallet af simulationer er stort, får man en simuleret standard error omkring $6.25$ , som er 4 procent over værdien 6.0 fra ophobningsloven.

Lad os fortsætte med et andet simpelt eksempel, hvor parameteren vi er interesseret i er $\theta=1/\mu$ , og hvor både parameter $\mu$ og måling $\hat\mu$ altid er positive. Lad os betragte samme numeriske eksempel som ovenfor med $\hat\mu=3.0$ og $\text{std}_s(\hat\mu)=1.0.$ Da $\frac{d\theta}{d\mu}=-1/\mu^2,$ giver ophobningsloven $\text{std}_s(\hat\theta)=(1/3.0^2)\cdot 1.0=0.11.$ Simulerer vi nu igen nye målinger $\tilde\mu_m,$ $m=1,\ldots,\text{nSim},$ som ovenfor, og beregner simuleret spredning som $\text{std}_\text{sim}(\hat\theta)= \sqrt{\frac{1}{\text{nSim}}\sum_{m=1}^{\text{nSim}} (1/\tilde\mu_m-\hat\theta)^2}$ med $\hat\theta=1/\hat\mu,$ får vi tal, der varierer kraftigt ved gentagelse af simuleringseksperimentet. Den følgende tabel viser dette i den øverste del, hvor der for hver værdi af nSim er lavet fire gentagelser af simuleringseksperimentet.

$\begin{aligned} & \text{Uden begrænsning:} \\ & \begin{array}{lcccc} \hline \text{nSim}=1000 & 0.31 & 7.54 & 5.60 & 1.26\\ \text{nSim}=10000 & 43.78 & 3.70 & 0.55 & 2.71 \\ \text{nSim}=100000 & 7.59 & 4.94 & 9.85 & 3.09 \\ \hline \end{array} \\ & \\ & \text{Med begrænsning:} \\ & \begin{array}{lcccc} \hline \text{nSim}=1000 & 0.23 & 0.23 & 0.18 & 0.20\\ \text{nSim}=10000 & 0.20 & 0.21 & 0.20 & 0.21 \\ \text{nSim}=100000 & 0.20 & 0.20 & 0.20 & 0.21 \\ \hline \end{array} \end{aligned}$ Grunden til den kraftige variation er, at der blandt de nSim simulerede værdier af $\tilde\mu$ vil være nogle få, der kommer tæt på nul, hvorved vi får meget store værdier af $1/\tilde\mu$ (enten store positive eller store negative). I simuleringen bliver vi nødt til at sikre os, at vi ikke får værdier, der kommer for tæt på nul (alle værdier skal være positive og holde sig borte fra nul). Her vil jeg implementere dette krav ved kun at betragte situationer, hvor $\hat\mu>3\cdot\text{std}_s(\hat\mu)$ , og i simuleringen tager jeg kun værdier med, for hvilke $\tilde\mu>\hat\mu-2.6\cdot\text{std}_s(\hat\mu).$ Alle de simulerede værdier vil således være over $0.4\cdot\text{std}_s(\hat\mu).$ Med dette valg vil der cirka være $0.5$ procent af de oprindelige simulerede værdier fra en $N(\hat\mu,\text{std}_s(\hat\mu)^2)$ -fordeling, der frasorteres. Den nederste del i ovenstående tabel viser resultatet, når der simuleres som just beskrevet. Vi kan se, at vi får et stabilt resultat med en standard error på omkring 0.20. Dette er noget over (relativt set) værdien 0.11 fra ophobningsloven, og simuleringen giver her et vigtig korrektiv til resultatet fra ophobningsloven. Den store forskel skyldes, at standard error for $\hat\mu$ er forholdsvis stor. Hvis vi ændrer denne fra 1.0 til 0.1, giver ophobningloven $\text{std}_s(1/\hat\mu)=0.011,$ og simuleringseksperimentet giver også denne værdi.

5.5.1 Simuleret konfidensinterval

I de to eksempler ovenfor blev simuleringerne brugt til at forbedre skønnet over standard error for det transformerede skøn $\hat\theta$ i tilfælde, hvor ophobningsloven ikke er præcis. I tilfælde hvor ophobningsloven ikke er præcis, vil det approksimative 95%-konfidensinterval $\hat\theta\pm 1.96\cdot\text{std}_s(\hat\theta)$ fra Resultat 5.1.1 ofte heller ikke være præcist. Heldigvis kan vi bruge simuleringerne til også at forbedre konfidensintervallet. For at forstå dette lad os først bemærke, at konfidensintervallet ovenfor fremkommer ved at tage de værdier af $\theta$ , for hvilke

$-1.96\leq\frac{\hat\theta-\theta}{\text{std}_s(\hat\theta)}\leq 1.96.$ Grunden til dette er, at fordelingen af $(\hat\theta-\theta)/\text{std}_s(\hat\theta)$ approksimativt er en standard normalfordeling. Forbedringen består i at erstatte $-1.96$ og $1.96$ med værdier fundet ved simuleringen, således at der cirka er sandsynlighed 2.5 procent for at få værdier udenfor til hver sin side.

Til proceduren skal vi for hver simuleret værdi $\tilde\theta_m$ , $m=1,\ldots,\text{nSim},$ beregne standard error $\text{std}_s(\tilde\theta_m)$ via ophobninsloven, hvor vi bruger $\text{std}_s(\tilde\mu)=\text{std}_s(\hat\mu).$ I det første eksempel ovenfor med $\theta=\mu^2$ giver dette $\text{std}_s(\tilde\theta_m)=2|\tilde\mu_m|\text{std}_s(\hat\mu),$ og i det andet eksempel med $\theta=1/\mu^2$ får vi $\text{std}_s(\tilde\theta_m)=(1/\tilde\mu_m^2)\cdot\text{std}_s(\hat\mu).$ For hver simuleret værdi kan vi nu konstruere en standardiseret $t$ -værdi på formen

$t_m=\frac{\tilde\theta_m-\hat\theta}{\text{std}_s(\tilde\theta_m)}.$ Ideen er nu, at fordelingen af disse $t$ -værdier forhåbentligt ligner fordelingen af $(\hat\theta-\theta)/\text{std}_s(\hat\theta).$ Vi finder derfor 2.5% og 97.5% fraktilerne, $q_{2.5}$ og $q_{97.5}$ , blandt $t$ -værdierne, og laver et nyt konfidensinterval bestående af de værdier af $\theta$ for hvilke

$q_{2.5}\leq\frac{\hat\theta-\theta}{\text{std}_s(\hat\theta)}\leq q_{97.5}$ Gennemføres proceduren i eksemplet med $\theta=1/\mu$ , $\hat\mu=3.0$ og $\text{std}_s(\hat\mu)=1.0,$ får vi $q_{2.5}=-3.25$ og $q_{97.5}=0.75,$ og det forbedrede konfidensinterval bliver $[0.25,\,0.69].$ Dette skal sammenlignes med det oprindelige konfidensinterval $\hat\theta\pm 1.96\cdot\text{std}_s(\hat\theta)=[0.12,\,0.55],$ og med konfidensintervallet, hvor vi bruger den simulerede værdi for standard error, $\hat\theta\pm 1.96\cdot\text{std}_{\text{sim}}(\hat\theta)= [-0.07,\, 0.74].$

Resultat 5.5.1. (Simuleret konfidensinterval)

Lad $q_{2.5}$ og $q_{97.5}$ være 2.5% og 97.5% fraktilerne blandt $t_1,\ldots,t_{\text{nSim}},$ det vil sige, at 2.5% af værdierne ligger under $q_{2.5}$ og 2.5% af værdierne ligger over $q_{97.5}$ . Så er

$\big[\hat\theta-q_{97.5}\cdot\text{std}_s(\hat\theta),\, \hat\theta+q_{2.5}\cdot\text{std}_s(\hat\theta)\big]$ et forbedret approksimativt 95%-konfidensinterval.

Ovenstående procedure til at forbedre henholdsvis standard error og konfidensinterval for en transformeret måling kan også gennemføres i et generelt setup, hvor $\theta$ er en funktion af $k$ underliggende parametere, $\theta=f(\mu_1,\ldots,\mu_k)$ . Jeg vil kun beskrive proceduren i situationen, hvor målingerne $\hat\mu_1,\ldots,\hat\mu_k$ er uafhængige, således at nye målinger kan simuleres uafhængigt af hinanden som beskrevet ovenfor for en enkelt måling. Følgende Resultat beskriver simulationsmetoden trin for trin.

Resultat 5.5.2. (Algoritme til simulationsbaseret ophobninglov)

Til rådighed er målte værdier $\hat\mu_1,\ldots,\hat\mu_k$ og deres standard errors $\text{std}_s(\hat\mu_j)$ , $j=1,\ldots,k$ , samt en parameterfunktion $\theta=f(\mu_1,\ldots,\mu_k).$ Det antages at de $k$ målinger $\hat\mu_1,\ldots,\hat\mu_k$ er uafhængige.
Beregn $\hat\theta=f(\hat\mu_1,\ldots,\hat\mu_k)$ og standard error $\text{std}_s(\hat\theta)$ via ophobningsloven (hertil skal bruges de partielt afledede af $f$ , $\frac{\partial f}{\partial \mu_j}$ , $j=1,\ldots,k,$ udregnet i $(\hat\mu_1,\ldots,\hat\mu_k)$ ).
For $m=1,\ldots,\text{nSim}$ simuleres nye "målte" værdier $(\tilde\mu_{m1},\ldots,\tilde\mu_{mk}).$ Den $j$ 'te værdi $\tilde\mu_{mj}$ simuleres fra en $N(\hat\mu_j,\text{std}_s(\hat\mu_j))$ -fordeling, eller fra denne fordeling begrænset til værdier større end $\hat\mu_j-2.6\cdot\text{std}_s(\hat\mu_j)$ hvis den $j$ 'te måling kun kan være positiv og der divideres med denne i funktionen $f.$
Udregn, for $m=1,\ldots,\text{nSim}$ , de målte transformerede værdier $\tilde\theta_m=f(\tilde\mu_{m1},\ldots,\tilde\mu_{mk})$ og deres tilhørende standard error $\text{std}_s(\tilde\theta_m)$ via ophobningsloven (hertil indgår de partielt afledede af $f$ udregnet i $(\tilde\mu_{m1},\ldots,\tilde\mu_{mk})$ , og standard errors $\text{std}_s(\tilde\mu_j)=\text{std}_s(\hat\mu_j)$ ).
Udregn simuleret standard error
$\text{std}_\text{sim}(\hat\theta)= \sqrt{\frac{1}{\text{nSim}}\sum_{m=1}^{\text{nSim}} (\tilde\theta_m-\hat\theta)^2}.$
Udregn standardiserede $t$ -værdier,
$t_m=\frac{\tilde\theta_m-\hat\theta} {\text{std}_s(\tilde\theta_m)}, \quad m=1,\ldots,\text{nSim}.$ Find 2.5% og 97.5% fraktilerne, $q_{2.5}$ og $q_{97.5}$ , blandt $t_1,\ldots,t_{\text{nSim}}.$ Konstruer det simulerede approksimative 95%-konfidensinterval for $\theta$ som
$\big[\hat\theta-q_{97.5}\cdot\text{std}_s(\hat\theta),\, \hat\theta-q_{2.5}\cdot\text{std}_s(\hat\theta) \big].$

5.5.2 Implementering af simuleret konfidensinterval

Koden nedenfor kan bruges generelt til at lave et simulationsbaseret konfidensinterval når de indgående variable er uafhængige. Man skal to steder indsætte eksempelspecifikke dele. I den første del angiver man først hvilke variable, der skal begrænses nedadtil, i form af en liste med 1 og 0, hvor 1 betyder, at variablen skal begrænses. Dernæst angiver man de målte værdier og deres standard errors. Formlen for den transformerede værdi skal så angives, og de afledede af denne med hensyn til de indgående variable, udregnet i de målte ærdier, skal angives. I den anden eksempelspecifikke del skal igen angives formlen for den transformerede værdi, nu udregnet for de simulerede værdier.

Den generelle kode eksemplificeres med Ohms lov fra afsnit 5.2, $R=U/I.$ Dette svarer i det generelle setup til $\theta=R$ , $k=2$ målinger, $\mu_1=U$ og $\mu_2=I$ . Vi betragter situationen med målte værdier som i følgende tabel.

$\begin{array}{lcc} \hline & \mu_1\,(U) & \mu_2\,(I) \\ \hline \text{Måling} & 2.0 & 1.0 \\ \text{Standard error} & 0.1 & 0.25 \\ \hline \end{array}$

Prøv at bruge den ovenstående generelle kode på det simple eksempel ovenfor med $\theta=1/\mu$ , $\hat\mu=3.0$ og $\text{std}(\hat\mu)=1.0.$

Svar: Bruge kode

Da vi i $\theta=1/\mu$ dividerer med $\mu$ , ønsker vi at simulere denne således, at den holder sig positiv. Vi tager derfor poslist=[1]. De målte værdier indskrives i vektoren mu som [3], og de tilhørende standard errors indskrives i vektoren stds som [1.0]. Den transformerede værdi er hatTheta=1/mu, og den afledede er dthetaDmu=np.array([-1/mu**2]).

I den anden eksempelspecifikke del af koden bliver de transformerede værdier tildeTheta=1/muSim[:,0], og de afledede beregnes som dtildeDmu=np.array([-1/mu[:,0]**2]).

En web-version af et mere omfattende program kan findes via The NIST Uncertainty Machine.

Foregående Næste