Afsnit 4.10: Teste middelværdier ens når varianser er ens

Ofte er data indsamlet med henblik på at sammenligne middelværdierne i to grupper. Vi kan formulere dette, som at vi vil teste hypotesen om ens middelværdier, μ1=μ2\mu_1=\mu_2, inden for normalfordelingsmodellen Statistisk Model 4.9.2, hvor vi antager samme varians i de to grupper. Intuitivt vil vi se på om μ^1μ^2=xˉ1xˉ2\hat\mu_1-\hat\mu_2=\bar x_1-\bar x_2 er tæt på nul, men dette kan vi ikke afgøre uden at se på spredningen σ\sigma i de to grupper. Vi laver derfor en standardisering ved hjælp af det fælles spredningsskøn ss, som beskrevet i det følgende resultat.
Resultat 4.10.1. (Test af ens middelværdier)
Til test af hypotesen μ1=μ2\mu_1=\mu_2 i Statistisk Model 4.9.2, hvor de to grupper har samme varians, bruges tt-teststørrelsen
T=Xˉ1Xˉ2s2(1n1+1n2)t(n1+n22). T=\frac{\bar X_1-\bar X_2}{\sqrt{s^2\big(\frac{1}{n_1}+\frac{1}{n_2} \big)}} \sim t(n_1+n_2-2).
PP-værdien, når alternativet er μ1μ2,\mu_1\neq\mu_2, er 2tcdf(tobs,n1+n22),2\cdot t_{\text{cdf}}(-|t_{\text{obs}}|,n_1+n_2-2), hvor tobst_{\text{obs}} er den observerede værdi af T.T.
Endvidere er et 95%-konfidensinterval for forskel i middelværdi, det vil sige for parameteren δ=μ1μ2,\delta=\mu_1-\mu_2, givet ved formlen
xˉ1xˉ2±t0s2(1n1+1n2),t0=tinv(0.975,n1+n22). \bar x_1-\bar x_2\pm t_0\sqrt{s^2\big(\frac{1}{n_1}+\frac{1}{n_2}\big)}, \quad t_0=t_{\text{inv}}(0.975,n_1+n_2-2).
Disse resultater følger på samme måde som resultaterne i Resultat 4.4.2. Specielt benytter vi, at med δ=μ1μ2\delta=\mu_1-\mu_2 er (Xˉ1Xˉ2δ)N(0,σ2(1/n1+1/n2)),(\bar X_1-\bar X_2-\delta)\sim N(0,\sigma^2(1/n_1+1/n_2)), som sammen med fordelingen af s2s^2 i formel (4.9.1) giver, at Tt(n1+n22).T\sim t(n_1+n_2-2). Konfidensintervallet følger af P(t0(Xˉ1Xˉ2δ)/s2(1/n1+1/n2)t0)=0.95.P\big(-t_0\leq (\bar X_1-\bar X_2-\delta)/ \sqrt{s^2(1/n_1+1/n2)}\leq t_0\big)=0.95.
Eksempel 4.10.2. (Tykhed af rullesten)
Vi vender tilbage til data omkring formen af rullesten, målt i form af tykheden, beskrevet i afsnit 4.8. Lad Kysti\text{Kyst}_i og Flodi\text{Flod}_i betegne de tilhørende stokastiske variable, og betragt den statistiske model
KystiN(μK,σ2),i=1,,50,FlodiN(μF,σ2),i=1,,49,\begin{aligned} \text{Kyst}_i & \sim N(\mu_K,\sigma^2),\enspace i=1,\ldots,50, \\ \text{Flod}_i & \sim N(\mu_F,\sigma^2),\enspace i=1,\ldots,49, \end{aligned}
hvor (μK,μF,σ2)(\mu_K,\mu_F,\sigma^2) kan variere frit.
Fra data udregnes de følgende størrelser (beregningerne er lavet i kodevinduet længere fremme),
kyst=45.4140,skyst=10.1246,flod=54.8245,sflod=12.1989,s2=125.4220,s=11.1992,\begin{aligned} \overline{\text{kyst}} &=45.4140 , & s_{\text{kyst}} &=10.1246 , \\ \overline{\text{flod}} &=54.8245 , & s_{\text{flod}} &=12.1989 , \\ s^2 &=125.4220 , & s & =11.1992 , \end{aligned}
hvor s2s^2 er det fælles variansskøn fra (4.9.1). Den geologiske problemstilling består i at undersøge, om data peger på en forskel i de to populationer. Dette kan formuleres som hypotesen, at de to middelværdier er ens, μK=μF,\mu_K=\mu_F, og vi ønsker ikke på forhånd at lægge os fast på et alternativ i en bestemt retning, således at alternativet er μ1μ2.\mu_1\neq\mu_2. TT-teststørrelsen for denne hypotese bliver
tobs=45.414054.824511.1992(1/50+1/49)=4.1801, t_{\text{obs}}=\frac{45.4140-54.8245} {\sqrt{11.1992\cdot(1/50+1/49)}}=-4.1801,
og den tilhørende pp-værdi fra en t(50+492)t(50+49-2)-fordeling er
p-værdi=2(0.0000319)=0.0000639. p\text{-værdi}=2\cdot(0.0000319)= 0.0000639.
Da denne er meget mindre end 0.05, bliver konklusionen, at data strider mod samme middelværdi, og da kyst<flod,\overline{\text{kyst}}<\overline{\text{flod}}, tyder data altså på, at rullesten fra et flodområde i middel har en større tykhed end rullesten fra et kystområde. En lavere tykhed for kyststen svarer til, at stenen bliver slidt ned, når den skubbes rundt af bølgerne.
Vi kan kvantificere forskellen i middelværdi mellem rullesten fra kystområder og flodområder ved at lave et 95%-konfidensinterval. Hertil bruges 97.5%-fraktilen i en t(97)t(97)-fordeling, t0=tinv(0.975,97)=1.9847,t_0=t_{\text{inv}}(0.975,97)=1.9847, og konfidensintervallet bliver
45.414054.8245±1.984711.1992(1/50+1/49)=[13.9,4.9]. 45.4140-54.8245\pm 1.9847\cdot\sqrt{11.1992\cdot(1/50+1/49)} =[-13.9,\, -4.9].
Med 95% sikkkerhed ligger middelværdien af tykheden for rullesten fra flodområdet mellem 4.9 og 13.9 over middelværdien fra kystområdet.
Man taler somme tider om forskel i middelværdi divideret med spredning som standardiseret effektstørrelse, og en effektstørrelse større end 1 anses for stor. I tilfældet her er skønnet over den standardiserede effektstørrelse (54.824545.4140)/11.1992=0.84.(54.8245-45.4140)/11.1992=0.84.

Effektstørrelse

Den teoretiske standardiserede effektstørrelse er (μ1μ2)/σ.(\mu_1-\mu_2)/\sigma. Den beskriver, hvor adskildte de to populationer er. I kodevinduet nedenfor kan I afprøve forskellige effektstørrelser og se den tilhørende adskillelse.

I analysen ovenfor har jeg kun betragtet to ud af i alt 20 datasæt i den bagvedliggende artikel. I alle tilfælde er gennemsnittet af tykheden større for flodområder end for kystområder, men der er også variation fra flod til flod og fra et kystområde til et andet. De flodområder, der ligger tæt på udløb i havet, har en mindre tykhed og kommer dermed tættere på rullesten fra kystområder.

Beregninger i R

Se opstartskoden (til/fra)

ForegåendeNæste