I den ensidede variansanalysemodel,
Statistisk Model 6.2.3,
antager vi, at der er samme varians i alle grupperne. Det vil være
naturligt at starte en analyse af data med at vurdere, om dette
er rimeligt, det vil sige, starte analysen med Statistisk Model
6.2.2.
Vi ved fra afsnit 4.12,
hvordan man kan lave et test for, at to varianser er ens,
men hvordan gør vi, når det skal vurderes, om mere end to varianser
er ens. Der er ikke en intuitiv oplagt måde at gøre dette på.
Vi kan imidlertid bruge det generelle princip til at
konstruere en teststørrelse omtalt i
afsnit 3.2 (likelihood ratio test).
Testet konstrueret på denne måde
forbedrede M.S.Bartlett i 1937, og det kendes derfor
i dag som Bartletts test. Antag, at der er grupper af observationer, og for hver gruppe
er
der lavet et variansskøn med frihedsgrader:
og disse variansskøn er uafhængige. Vi ønsker at teste hypotesen, at
varianserne er ens,
For at beskrive teststørrelsen indføres først et
fælles variansskøn under hypotesen,
Bartletts test for ens varianser er på formen
Store værdier af Ba er kritiske for hypotesen, og -værdien
for testet kan findes approksimativt som
I R kan Bartletts test beregnes med funktionen
bartlett.test. For den ensidede variansanalysemodel
6.2.3 kan man blot benytte modelformlen
xG som input. Hvis data er inddelt efter to faktorer
og kan man først definere en ny faktor fGH=G:H
og så bruge kaldet bartlett.test(xfGH).
Endelig kan input også være en liste med output fra
forskellige kørsler af lm, der hver især giver et variansskøn.
I output fra bartlett.test angives teststørrelsen
under Bartlett's K-squared.
Eksempel 6.5.1.
(Vaske hænder)
For datasættet beskrevet i starten af afsnit 6.2
lader vi være bakteritallet for den 'te måling
og lader være den tilhørende metode til
håndvask.
Vi betragter Statistisk Model
6.2.2, her skrevet som
hvor både middelværdien og variansen afhænger af gruppen.
I det følgende kodevindue beregnes Bartletts test for hypotesen
om ens varianser
I output ses, at teststørrelsen er
og den approksimative -værdi fra en -fordeling er
Da denne er over 0.05, er konklusionen, at data ikke strider mod
hypotesen om samme varians for de fire metoder til håndvask.
I det følgende kodevindue beregnes der variansskøn og
frihedsgradsantal for hver af de fire metoder til håndvask.
Tilføj kode til en direkte beregning af fra
(6.5.1).
Det fælles variansskøn beregnes som
df=sum(dfg) og
s2=sum(dfg*varg)/df. Tælleren i Bartletts teststørrelse
beregnes som
df*log(s2)-sum(dfg*log(varg)), og nævneren beregnes som
1+(sum(1/dfg)-1/df)/(3*(4-1)).