Afsnit 8.3: Teste middelværdierne ens

I dette afsnit indfører jeg på intuitiv vis et test for hypotesen om ens middelværdier i kk grupper af observationer. Ideen er, at vi vil sammenligne variationen indenfor grupper, givet ved variansskønnet s2(M1)s^2(M_1) fra den ensidede variansanalysemodel, og variationen mellem grupper givet ved s2(M1,M2)s^2(M_1,M_2) fra foregående afsnit. Den følgende figur illustrerer de to variationer for data fra afsnit 8.2 omkring fire måder at vaske hænder på.
Ideen er, at s2(M1)s^2(M_1) giver os viden om den ukendte varians σ2,\sigma^2, og med denne viden er vi i stand til at vurdere, om variationen mellem grupperne er større, end hvad der forventes, hvis middelværdierne er ens. Situationen ligner den i afsnit 6.4, hvor to uafhængige variansskøn sammelignes. Vi vælger at betragte forholdet
F=s2(M1,M2)s2(M1)F(k1,nk), F=\frac{s^2(M_1,M_2)}{s^2(M_1)}\sim F(k-1,n-k),
hvor fordelingen følger af Definition 6.4.1. En lille værdi er udtryk for, at gruppegennemsnittene ligger tæt på hinanden, som forventet under hypotesen om samme middelværdi i de kk grupper, og en stor værdi tyder på, at de underliggende middelværdier ikke er ens. Formelt er store værdier af FF-teststørrelsen kritiske for hypotesen om ens middelværdier, og pp-værdien for testet er
p-værdi=1Fcdf(F,k1,nk). p\text{-værdi}=1-F_{\text{cdf}}(F,k-1,n-k).
Eksempel 8.3.1. (Vaske hænder)
For de 32 målinger af bakterietal ved fire metoder til håndvask fra afsnit 8.2, hvor data er vist i figuren ovenfor, finder man, at variansen inden for grupper er s2(M1)=1410.1=37.552,s^2(M_1)=1410.1=37.55^2, og variansen mellem grupper er s2(M1,M2)=9960.7=835.292,s^2(M_1,M_2)=9960.7=8\cdot 35.29^2, hvor 37.55 og 35.29 er spredningerne vist med rødt og blåt i figuren. Forholdet mellem disse er F=9960.7/1410.1=7.06.F=9960.7/1410.1=7.06. Sandsynligheden for at få en værdi større end 7.06 i en F(41,324)F(4-1,32-4)-fordeling er 0.0011. Da denne er langt under 0.05, siger vi, at data strider mod hypotesen om samme middelværdi af bakterietallet ved de fire metoder til håndvask. Direkte beregninger i python, uden brug af ols, fremgår af det følgende kodevindue.

Direkte beregninger i python

Se opstartskoden (til/fra)

ForegåendeNæste