Afsnit 4.10: Teste middelværdier ens når varianser er ens
Ofte er data indsamlet med henblik på at sammenligne middelværdierne i to
grupper. Vi kan formulere dette, som at vi vil teste
hypotesen om ens middelværdier, μ1=μ2, inden for
normalfordelingsmodellen
Statistisk Model 4.9.2, hvor vi antager samme
varians i de to grupper. Intuitivt vil vi se på om
μ^1−μ^2=xˉ1−xˉ2 er tæt på nul, men dette
kan vi ikke afgøre uden at se på spredningen σ i de to grupper.
Vi laver derfor en standardisering ved hjælp af det fælles
spredningsskøn s, som beskrevet i det følgende resultat.
Resultat 4.10.1.
(Test af ens middelværdier)
Til test af hypotesen μ1=μ2 i Statistisk
Model 4.9.2, hvor de to grupper har samme varians,
bruges t-teststørrelsen
T=s2(n11+n21)Xˉ1−Xˉ2∼t(n1+n2−2).
P-værdien, når alternativet er μ1=μ2, er
2⋅tcdf(−∣tobs∣,n1+n2−2), hvor
tobs er den observerede værdi af T. Endvidere er et 95%-konfidensinterval for forskel
i middelværdi, det vil sige for parameteren δ=μ1−μ2,
givet ved formlen
Disse resultater følger på samme måde som resultaterne i
Resultat 4.4.2.
Specielt benytter vi, at med δ=μ1−μ2 er
(Xˉ1−Xˉ2−δ)∼N(0,σ2(1/n1+1/n2)),
som sammen med fordelingen af s2 i formel (4.9.1) giver, at
T∼t(n1+n2−2). Konfidensintervallet følger af
P(−t0≤(Xˉ1−Xˉ2−δ)/s2(1/n1+1/n2)≤t0)=0.95.
Eksempel 4.10.2.
(Tykhed af rullesten)
Vi vender tilbage til data omkring formen af rullesten,
målt i form af tykheden,
beskrevet i afsnit 4.8.
Lad Kysti og Flodi betegne de tilhørende
stokastiske variable, og betragt den statistiske model
hvor s2 er det fælles variansskøn fra (4.9.1).
Den geologiske problemstilling består i at undersøge, om data peger på en
forskel i de to populationer. Dette kan formuleres som
hypotesen, at de to middelværdier er ens, μK=μF,
og vi ønsker ikke på forhånd at lægge os fast på et
alternativ i en bestemt retning, således at alternativet er
μ1=μ2.T-teststørrelsen for denne hypotese
bliver
og den tilhørende p-værdi fra en t(50+49−2)-fordeling
er
p-værdi=2⋅(0.0000319)=0.0000639.
Da denne er meget mindre end 0.05, bliver konklusionen, at data strider mod
samme middelværdi, og da
kyst<flod, tyder data altså på,
at rullesten fra et flodområde i middel har en større tykhed end
rullesten fra et kystområde. En lavere tykhed for kyststen
svarer til, at stenen bliver slidt ned, når den skubbes rundt af bølgerne. Vi kan kvantificere forskellen i middelværdi mellem
rullesten fra kystområder og flodområder
ved at lave et 95%-konfidensinterval.
Hertil bruges 97.5%-fraktilen i en t(97)-fordeling,
t0=tinv(0.975,97)=1.9847, og konfidensintervallet bliver
Med 95% sikkkerhed ligger middelværdien af tykheden for
rullesten fra flodområdet mellem 4.9 og 13.9 over
middelværdien fra kystområdet. Man taler somme tider om forskel i middelværdi divideret med spredning
som standardiseret effektstørrelse, og en
effektstørrelse større end 1 anses for stor. I tilfældet her er skønnet
over den standardiserede effektstørrelse (54.8245−45.4140)/11.1992=0.84.
Den teoretiske standardiserede effektstørrelse er
(μ1−μ2)/σ. Den beskriver, hvor adskildte de
to populationer er. I kodevinduet nedenfor kan I afprøve forskellige
effektstørrelser og se den tilhørende adskillelse.
I analysen ovenfor har jeg kun betragtet to ud af i alt 20
datasæt i den
bagvedliggende artikel.
I alle tilfælde er gennemsnittet af tykheden større for flodområder end
for kystområder, men der er også variation fra flod til flod og fra
et kystområde til et andet. De flodområder, der ligger tæt på udløb
i havet, har en mindre tykhed og kommer dermed tættere på rullesten
fra kystområder.