Afsnit 4.8: Standard Error

For en stokastisk variabel XX er varians defineret som Var(X)=E((XE(X))2),\text{Var}(X)=E\big((X-E(X))^2\big), og spredning eller standardafvigelsen er defineret som std(X)=Var(X).\text{std}(X)=\sqrt{\text{Var}(X)}. Notationen her refererer til det engelske navn standard deviation for spredning. Udover ordet spredning har vi på dansk også ordet usikkerhed. I fysik bruges dette ord i forbindelse med spredningen på en måling fra et måleapperat.
For en statistisk model med en parameter θ,\theta, og et skøn θ^\hat\theta over denne, kan vi tale om spredningen på den stokastiske variabel θ^,\hat\theta, std(θ^).\text{std}(\hat\theta). For binomialmodellen Xbinom(n,p)X\sim\text{binom}(n,p) er spredningen på skønnet p^=X/n\hat p=X/n givet ved std(p^)=p(1p)/n.\text{std}(\hat p)=\sqrt{p(1-p)/n}. For normalfordelingsmodellen XiN(μ,σ2),X_i\sim N(\mu,\sigma^2), i=1,,n,i=1,\ldots,n, har vi skønnet μ^=Xˉ\hat\mu=\bar X med spredning std(μ^)=σ/n.\text{std}(\hat\mu)=\sigma/\sqrt{n}. Som det ses, vil spredningen på et parameterskøn ofte indeholde ukendte parametre. Hvis spredningen skal bruges i en udregning, må vi derfor indsætte skøn over disse parametre. Den resulterende værdi kaldes standard error for parameterskønnet, og betegnes i denne bog med stds(θ^),\text{std}_s(\hat\theta), hvor det nedre fodtegn ss står for "skøn over". For normalfordelingsmodellen har vi stds(μ^)=s/n\text{std}_s(\hat\mu)=s/\sqrt n med s2=i(XiXˉ)2/(n1).s^2=\sum_i(X_i-\bar X)^2/(n-1).
Med indførslen af standard error kan man udtrykke konfidensintervallet baseret på tt-fordelingen på simpel vis. Konfidensintervallet fra Resultat 4.4.2 bliver
μ^±t0stds(μ^),t0=tinv(0.975,n1). \hat\mu \pm t_0\cdot \text{std}_s(\hat\mu),\quad t_0=t_{\text{inv}}(0.975,n-1).
I det næste kapitel omkring ophobningsloven vil vi generelt udtrykke resultaterne gennem standard error.
ForegåendeNæste