For en stokastisk variabel X er varians defineret som
Var(X)=E((X−E(X))2), og spredning
eller standardafvigelsen
er defineret som sd(X)=Var(X).
Notationen her refererer til det engelske navn
standard deviation for spredning. Udover ordet
spredning har vi på dansk også ordet usikkerhed. I
fysik bruges dette ord i forbindelse med spredningen på
en måling fra et måleapperat. For en statistisk model med en parameter θ, og et
skøn θ^ over denne, kan vi tale om spredningen på den
stokastiske variabel θ^,sd(θ^).
For binomialmodellen X∼binom(n,p)
er spredningen på skønnet p^=X/n givet ved
sd(p^)=p(1−p)/n.
For normalfordelingsmodellen Xi∼N(μ,σ2),i=1,…,n, har vi skønnet μ^=Xˉ med spredning
sd(μ^)=σ/n. Som det ses, vil spredningen
på et parameterskøn ofte indeholde ukendte parametre. Hvis
spredningen skal bruges i en udregning, må vi derfor indsætte skøn over
disse parametre. Den resulterende værdi kaldes standard error
for parameterskønnet, og betegnes i denne bog med
sds(θ^), hvor det nedre fodtegn s står for
"skøn over". For normalfordelingsmodellen har vi
sds(μ^)=s/n med s2=∑i(Xi−Xˉ)2/(n−1). Med indførslen af standard error kan man udtrykke konfidensintervallet
baseret på t-fordelingen på simpel vis.
Konfidensintervallet fra Resultat 4.4.2 bliver
μ^±t0⋅sds(μ^),t0=tinv(0.975,n−1).
Konfidensintervallet for forskellen mellem to middelværdier
δ=μ1−μ2 fra Resultat 4.10.1 bliver
δ^±t0⋅sds(δ^),t0=tinv(0.975,n1+n2−2), med
sds(δ^)=s1/n1+1/n2 og s2 det
fælles variansskøn. I tilfældet med to normalfordelinger
med forskellig varians bliver konfidensintervallet også
δ^±t0⋅sds(δ^), hvor nu
t0=tinv(0.975,dfw) og
sds(δ^)=s12/n1+s22/n2
(Resultat 4.11.1).I de følgende kapitler skal vi bruge funktionen lm i R,
hvor standard error automatisk er en del af output. ForegåendeNæste