I de forskellige -tests i dette kapitel blev -værdien beregnet
fra en -fordeling under en antagelse om, at alle de
forventede antal er større end eller lig med 5.
Hvis dette krav
ikke er opfyldt, bruges sommetider en svagere regel, der siger, at
de forventede skal alle være større end 1 og højst 20% må være under 5.
Reglen må kun bruges, hvis antallet af frihedsgrader er større end 1.
Dette kaldes
Cochran regel.Hvis heller ikke Cochran regel er opfyldt i forbindelse med
homogenitetstestet, kan man benytte et andet
test, der kaldes
Fishers eksakte test.
Jeg vil ikke beskrive
testet her, men blot nævne, at det er implementeret i R i
funktionen fisher.test.
Før -testet, baseret på et likelihood ratio test, blev indført,
benyttede man et andet test kaldet
chi-squared test.
Hvis vi kalder teststørrelsen for er de to teststørrelser
-teststørrelsen vurderes i den samme -fordeling
som -teststørrelsen og med samme krav om, at de forventede antal
skal være større end eller lig med 5. Chi-squared testet benyttes stadigt meget, men jeg foretrækker,
at I bruger -testet på grund af dets forbindelse til generelle metoder.
De indbyggede funktioner i R bruger også som standard
-testet.
3.8.1 Test for uafhængighed
Når man inddeler observationer efter to inddelingskriterier,
hvor det ene inddeler i kasser og det andet i kasser,
betragter man multinomialmodellen med i alt kasser,
som vi for overskuelighedens skyld kalder celler.
Det vil være naturligt at bruge et dobbeltindeks, således at
angiver antallet, der falder i kasse med hensyn
til det første inddelingskriterie og i kasse med hensyn
til det andet inddelingskriterie, altså dem der falder i celle
.
Sandsynligheden for at falde i
celle kalder vi ,
. Lad nu , , være sandsynligheden for, at
en observation falder i kasse med hensyn til det første
inddelingskriterie, og lad
, , være sandsynligheden for, at
en observation falder i kasse med hensyn til det andet
inddelingskriterie,
Hypotesen om uafhængige inddelingskriterier siger, at
Man kan vise matematisk, at likelihood ratio teststørrelsen på
formen er identisk med -teststørrelsen (3.7.1)
for homogenitetstestet i multinomialfordelinger.
Man kan derfor bruge
Resultat 3.7.1 også i situationen beskrevet her.
ForegåendeNæste