Afsnit 8.3: Teste middelværdierne ens
I dette afsnit indfører jeg på intuitiv vis et test for
hypotesen om ens middelværdier i
k grupper af observationer.
Ideen er, at vi vil sammenligne variationen indenfor grupper,
givet ved variansskønnet
s2(M1) fra den ensidede
variansanalysemodel, og variationen mellem grupper
givet ved
s2(M1,M2) fra foregående afsnit.
Den følgende figur illustrerer
de to variationer for data fra
afsnit
8.2
omkring fire måder at vaske hænder på.
Ideen er, at
s2(M1) giver os viden om den ukendte
varians
σ2, og med denne viden er vi i stand til
at vurdere, om variationen mellem grupperne er større, end
hvad der forventes, hvis middelværdierne er ens.
Situationen ligner den i afsnit
6.4, hvor
to uafhængige variansskøn sammelignes.
Vi vælger at betragte forholdet
F=s2(M1)s2(M1,M2)∼F(k−1,n−k),
hvor fordelingen følger af Definition
6.4.1.
En lille værdi er udtryk for, at gruppegennemsnittene ligger tæt på
hinanden, som forventet under hypotesen om samme middelværdi i de
k grupper, og en stor værdi tyder på, at de underliggende
middelværdier ikke er ens. Formelt er store værdier af
F-teststørrelsen kritiske for hypotesen om ens middelværdier, og
p-værdien for testet er
p-værdi=1−Fcdf(F,k−1,n−k). Eksempel 8.3.1.
(Vaske hænder)
For de 32 målinger af bakterietal ved fire metoder til håndvask
fra afsnit
8.2,
hvor data er vist i figuren ovenfor, finder man, at
variansen inden for grupper er
s2(M1)=1410.1=37.552,
og variansen mellem grupper er
s2(M1,M2)=9960.7=8⋅35.292,
hvor 37.55 og 35.29 er spredningerne vist med rødt og blåt i figuren.
Forholdet mellem disse er
F=9960.7/1410.1=7.06.
Sandsynligheden for at få en værdi større end 7.06 i en
F(4−1,32−4)-fordeling er 0.0011. Da denne er langt under 0.05,
siger vi, at data strider mod hypotesen om samme middelværdi
af bakterietallet ved de fire metoder til håndvask.
Direkte beregninger i
python, uden brug af
ols,
fremgår af det følgende kodevindue.
Direkte beregninger i python
ForegåendeNæste