I den ensidede variansanalysemodel (4.2.1)
antager vi, at der er samme varians i alle grupperne. Det vil være
naturligt at starte en analyse af data med at vurdere, om dette
er rimeligt. Vi ved fra afsnit 2.12,
hvordan man kan lave et test for, at to varianser er ens,
men hvordan gør vi, når det skal vurderes, om mere end to varianser
er ens. Der er ikke en intuitiv oplagt måde at gøre dette på.
Vi kan imidlertid bruge det generelle princip til at
konstruere en teststørrelse omtalt i
afsnit 1.3 (Likelihoodratio test).
Testet konstrueret på denne måde
forbedrede M.S.Bartlett i 1937, og det kendes derfor
i dag som Bartletts test. Antag, at der er grupper af observationer, og for hver gruppe
er
der lavet et variansskøn med frihedsgrader:
og disse variansskøn er uafhængige. Vi ønsker at teste hypotesen, at
varianserne er ens,
For at beskrive teststørrelsen indføres først et
fælles variansskøn under hypotesen,
Log likelihoodratio testoren for hypotesen om ens varianser baseret på fordelingerne
af er
Bartletts test fremkommer ved at dividere dette udtryk med en konstant, således at
middelværdien kommer tættere på middelværdien af en
-fordeling,
Store værdier af Ba er kritiske for hypotesen, og -værdien
for testet kan findes approksimativt som
I R kan Bartletts test beregnes med funktionen
bartlett.test. For den ensidede variansanalysemodel
i (4.2.1) kan man blot benytte modelformlen
xG som input. Hvis data er inddelt efter to faktorer
og kan man først definere en ny faktor fGH=G:H
og så bruge kaldet bartlett.test(xfGH).
Endelig kan input også være en liste med output fra
forskellige kørsler af lm, der hver især giver et variansskøn.
I output fra bartlett.test angives teststørrelsen
under Bartlett's K-squared. Konstanten i Bartletts test er fundet ved at bruge taylorudviklingen
med eller
.
Eksempel 4.5.1.
(Vaske hænder)
For datasættet beskrevet i starten af afsnit 4.2
lader vi være bakteritallet for den 'te måling
og lader være den tilhørende metode til
håndvask. Vi betragter modellen
hvor både middelværdien og variansen afhænger af gruppen.
I det følgende kodevindue beregnes Bartletts test for hypotesen
om ens varianser
I output ses, at teststørrelsen er
og den approksimative -værdi fra en -fordeling er
Da denne er over 0.05, er konklusionen, at data ikke strider mod
hypotesen om samme varians for de fire metoder til håndvask.
I det følgende kodevindue beregnes der variansskøn og
frihedsgradsantal for hver af de fire metoder til håndvask.
Tilføj kode til en direkte beregning af fra
(4.5.2).
Det fælles variansskøn beregnes som
df=sum(dfg) og
s2=sum(dfg*varg)/df. Tælleren i Bartletts teststørrelse
beregnes som
df*log(s2)-sum(dfg*log(varg)), og nævneren beregnes som
1+(sum(1/dfg)-1/df)/(3*(4-1)).