Afsnit 4.12: Teste varianser ens

Jeg har ovenfor indført to tests af hypotesen om ens middelværdier i to normalfordelte populationer. Et test i situationen hvor varianserne er ens og et andet, når varianserne i de to grupper er forskellige. Hvorfor bruger vi to test i stedet for blot at nøjes med testet, hvor det ikke antages, at varianserne er ens ? Svaret er, at hvis data ikke strider mod fælles varians, så får vi et stærkere test for hypotesen om samme middelværdi. Et stærkere test betyder, at man har nemmere ved at opdage en forskel i middelværdi, hvilket kan aflæses i, at konfidensintervallet for forskellen mellem de to middelværdier er smallere (97.5%-fraktilen i en

t(\mathit{df})

-fordeling falder med antalllet af frihedsgrader, og frihedsgraderne i tilfældet med forskellige varianser er

\mathit{df}_W\leq n_1+n_2-2

For at kunne afgøre hvilket af de to tests der skal brugs, skal man overveje, om de to varianser er ens. Vi betragter derfor hypotesen

\sigma_1^2=\sigma_2^2

i Statistisk Model 4.9.1 med

X_{ji}\sim N(\mu_j,\sigma_j^2).

Samme varians svarer i et qqplot af de to observationssæt til, at data snor sig om parallelle linjer. I et boxplot skal de to kasser være cirka lige store.

For at kunne bruge det test jeg nu vil indføre i andre modelsammenhænge, betragter jeg en lidt mere generel situation. Antag, at vi har to uafhængige variansskøn

s_1^2\sim\sigma_1^2\chi^2(\mathit{df}_1)/\mathit{df}_1,\quad s_2^2\sim\sigma_2^2\chi^2(\mathit{df}_2)/\mathit{df}_2. \tag{4.12.1}

Situationen under Statistisk Model 4.9.1 svarer til

\mathit{df}_1=n_1-1

\mathit{df}_2=n_2-1.

For at teste hypotesen om samme varians

\sigma_1^2=\sigma_2^2,

vil jeg benytte forholdet

s_1^2/s_2^2,

som bør være tæt på 1 under hypotesen. Da

\frac{s_1^2}{s_2^2}=\frac{s_1^2/\sigma^2}{s_2^2/\sigma^2} =\frac{s_1^2/\sigma_1^2}{s_2^2/\sigma_2^2}

under hypotesen, vil fordelingen af

s_1^2/s_2^2

være fordelingen af

V_1/V_2,

hvor

V_1

V_2

er uafhængige og

V_j\sim\chi^2(\mathit{df}_j)/\mathit{df}_j.

Definition 4.12.1. (

F

-fordeling)

Lad

V_1

V_2

være uafhængige,

V_1\sim\chi^2(\mathit{df}_1)/\mathit{df}_1

V_2\sim\chi^2(\mathit{df}_2)/\mathit{df}_2.

Så siges

V_1/V_2

at følge en

F

-fordeling med

\mathit{df}_1

frihedsgrader i tæller og

\mathit{df}_2

frihedsgrader i nævner. Fordelingsfunktionen betegnes

F_{\text{cdf}}(\cdot,\mathit{df}_1,\mathit{df}_2)

og fraktiler betegnes

F_{\text{inv}}(\cdot,\mathit{df}_1,\mathit{df}_2).

I R er de tilsvarende funktioner

\text{pf}(\cdot,\mathit{df}_1,\mathit{df}_2)

\text{qf}(\cdot,\mathit{df}_1,\mathit{df}_2).

$F$ -fordeling i R

I nedenstående kodevindue tegnes tætheden for en

F(\mathit{df}_1,\mathit{df}_2)

-fordeling, og 2.5% og 97.5% fraktilerne markeres. Desuden er medianen for fordelingen markeret. Tætheden findes i R med kommandoen

\text{df}(\cdot,\mathit{df}_1,\mathit{df}_2)

. Prøv at køre koden med forskellige valg af frihedsgradsantallene

\mathit{df}_1

\mathit{df}_2.

Ved det test, der laves nedenfor, bliver 2.5% og 97.5% fraktilerne grænserne for, hvornår vi accepterer, og hvornår vi forkaster.

xxxxxxxxxx
 
# parametre vælges
df1=10
df2=10
​
# tæthed tegnes
x=c(1:600)/100
plot(x,df(x,df1,df2),type="l")
abline(v=qf(c(0.025,0.975),df1,df2),col=2)
med=qf(0.5,df1,df2)
lines(c(med,med),c(0,df(med,df1,df2)),col=4,lty=3)
c("Figur er dannet")

Når man laver et test for hypotesen

\sigma_1^2=\sigma_2^2

mod alternativet

\sigma_1^2\neq \sigma_2^2,

er både store og små værdier (værdier langt fra 1) af

s_1^2/s_2^2

kritiske. Hvis derfor den observerede værdi

F_{\text{obs}}

s_1^2/s_2^2

er større end medianen, bruger vi som

p

-værdi 2 gange sandsynlighed for at få en værdi over

F_{\text{obs}},

og hvis

F_{\text{obs}}

er mindre end medianen, bruger vi 2 gange sandsynlighed for at få en værdi mindre end

F_{\text{obs}}.

Med andre ord siger vi, at der er lige så stor en sandsynlighed for kritiske værdier på den anden side af medianen som på den side af medianen, hvor

F_{\text{obs}}

ligger. For at undgå at finde medianen implementerer vi beregningen som i det følgende resultat.

Resultat 4.12.2. (Teste to varianser ens)

For test af hypotesen

\sigma_1^2=\sigma_2^2

mod

\sigma_1^2\neq \sigma_2^2

i Statistisk Model 4.9.1 benyttes

s_1^2/s_2^2\sim F(\mathit{df}_1,\mathit{df}_2),

p

-værdi beregnes som

p\text{-værdi}= 2\cdot \min\{ F_{\text{cdf}}(F_{\text{obs}},\mathit{df}_1,\mathit{df}_2), 1-F_{\text{cdf}}(F_{\text{obs}},\mathit{df}_1,\mathit{df}_2) \},

hvor

F_{\text{obs}}

er den observerede værdi af

s_1^2/s_2^2.

Eksempel 4.12.3. (Menneske-maskine-interaktion)

Jeg vender tilbage til Eksempel 4.11.2 omkring tidsforbruget til at skrive en SMS-tekst på enten en smartphone eller en tripelkodende mobil. Vi fandt i eksemplet, at de to variansskøn er

s_{\text{sm}}^2=45.46,\enspace\mathit{df}_{\text{sm}}=27-1=26,\quad s_{\text{tr}}^2=172.42,\enspace\mathit{df}_{\text{tr}}=33-1=32.

Herudfra kan man beregne

F

-teststørrelsen for hypotesen om samme varians,

\sigma_{\text{sm}}^2=\sigma_{\text{tr}}^2,

F=\frac{45.46}{172.42}=0.264,\quad p\text{-værdi}=2\cdot F_{\text{cdf}}(0.264,26,32)=0.00085.

p

-værdien er langt under 0.05, bliver konklusionen, at data strider mod samme varians ved brug af de to metoder til at skrive SMS-teksten: der er større varians under brug af den tripelkodende mobil.

Foregående Næste