Afsnit 4.12: Teste varianser ens

I de to foregående afsnit har vi undersøgt, om det kan antages, at middelværdierne er ens i to grupper. Det kan også være af interesse at undersøge, om varianserne er ens. For eksempel kan man se på, om der er forskel i måleusikkerheden i to laboratorier eller i to forskellige måleinstrumenter. Forskelle i to populationer (population forstået bredt) kan både påvirke middelværdi og varians, og her kan det også være af interesse at sammenligne varianserne, et eksempel kan være, hvor hurtigt man kan udføre en bestemt opgave ved brug af to forskellige apps på en smartphone.
For to grupper af normalfordelte observationer betragter vi hypotesen i Statistisk Model 4.9.1 med Samme varians svarer i et qqplot af de to observationssæt til, at data snor sig om parallelle linjer. I et boxplot skal de to kasser være cirka lige store.
For at kunne bruge det test jeg nu vil indføre i andre modelsammenhænge, betragter jeg en lidt mere generel situation. Antag, at vi har to uafhængige variansskøn
Situationen under Statistisk Model 4.9.1 svarer til og For at teste hypotesen om samme varians vil jeg benytte forholdet som bør være tæt på 1 under hypotesen. Da
under hypotesen, vil fordelingen af være fordelingen af hvor og er uafhængige og
Definition 4.12.1. (-fordeling)
Lad og være uafhængige, og Så siges at følge en -fordeling med frihedsgrader i tæller og frihedsgrader i nævner. Fordelingsfunktionen betegnes og fraktiler betegnes I R er de tilsvarende funktioner og

$F$-fordeling i R

I nedenstående kodevindue tegnes tætheden for en -fordeling, og 2.5% og 97.5% fraktilerne markeres. Desuden er medianen for fordelingen markeret. Tætheden findes i R med kommandoen . Prøv at køre koden med forskellige valg af frihedsgradsantallene og Ved det test, der laves nedenfor, bliver 2.5% og 97.5% fraktilerne grænserne for, hvornår vi accepterer, og hvornår vi forkaster.

Når man laver et test for hypotesen mod alternativet er både store og små værdier (værdier langt fra 1) af kritiske. Hvis derfor den observerede værdi af er større end medianen, bruger vi som -værdi 2 gange sandsynlighed for at få en værdi over og hvis er mindre end medianen, bruger vi 2 gange sandsynlighed for at få en værdi mindre end Med andre ord siger vi, at der er lige så stor en sandsynlighed for kritiske værdier på den anden side af medianen som på den side af medianen, hvor ligger. For at undgå at finde medianen implementerer vi beregningen som i det følgende resultat.
Resultat 4.12.2. (Teste to varianser ens)
For test af hypotesen mod i Statistisk Model 4.9.1 benyttes og -værdi beregnes som
hvor er den observerede værdi af
Endvidere er et 95%-konfidensinterval for forholdet mellem de to varianser, det vil sige for parameteren givet ved
Konfidensintervallet for forholdet mellem de to varianser fås ved at bruge
Eksempel 4.12.3. (Menneske-maskine-interaktion)
Jeg vender tilbage til Eksempel 4.11.2 omkring tidsforbruget til at skrive en SMS-tekst på enten en smartphone eller en tripelkodende mobil. Vi fandt i eksemplet, at de to variansskøn er
Herudfra kan man beregne -teststørrelsen for hypotesen om samme varians,
Da -værdien er langt under 0.05, bliver konklusionen, at data strider mod samme varians ved brug af de to metoder til at skrive SMS-teksten: der er større varians under brug af den tripelkodende mobil.
Et 95%-konfidensinterval for forholdet bliver
Skønnet over forholdet mellem de to varianser er 0.26, og konfidensintervallet viser, at forholdet kan være så lavt som 0.13 og så højt som 0.57.
ForegåendeNæste