Afsnit 3.8: Diverse

I de forskellige -tests i dette kapitel blev -værdien beregnet fra en -fordeling under en antagelse om, at alle de forventede antal er større end eller lig med 5. Hvis dette krav ikke er opfyldt, bruges sommetider en svagere regel, der siger, at de forventede skal alle være større end 1 og højst 20% må være under 5. Reglen må kun bruges, hvis antallet af frihedsgrader er større end 1. Dette kaldes Cochran regel.
Hvis heller ikke Cochran regel er opfyldt i forbindelse med homogenitetstestet, kan man benytte et andet test, der kaldes Fishers eksakte test. Jeg vil ikke beskrive testet her, men blot nævne, at det er implementeret i R i funktionen fisher.test.

Chi-square test i stedet for $G$-test

Før -testet, baseret på et likelihood ratio test, blev indført, benyttede man et andet test kaldet chi-squared test. Hvis vi kalder teststørrelsen for er de to teststørrelser
-teststørrelsen vurderes i den samme -fordeling som -teststørrelsen og med samme krav om, at de forventede antal skal være større end eller lig med 5.
Chi-squared testet benyttes stadigt meget, men jeg foretrækker, at I bruger -testet på grund af dets forbindelse til generelle metoder. De indbyggede funktioner i R bruger også som standard -testet.

3.8.1 Test for uafhængighed

Når man inddeler observationer efter to inddelingskriterier, hvor det ene inddeler i kasser og det andet i kasser, betragter man multinomialmodellen med i alt kasser, som vi for overskuelighedens skyld kalder celler. Det vil være naturligt at bruge et dobbeltindeks, således at angiver antallet, der falder i kasse med hensyn til det første inddelingskriterie og i kasse med hensyn til det andet inddelingskriterie, altså dem der falder i celle . Sandsynligheden for at falde i celle kalder vi , .
Lad nu , , være sandsynligheden for, at en observation falder i kasse med hensyn til det første inddelingskriterie, og lad , , være sandsynligheden for, at en observation falder i kasse med hensyn til det andet inddelingskriterie,
Hypotesen om uafhængige inddelingskriterier siger, at
Man kan vise matematisk, at likelihood ratio teststørrelsen på formen er identisk med -teststørrelsen (3.7.1) for homogenitetstestet i multinomialfordelinger. Man kan derfor bruge Resultat 3.7.1 også i situationen beskrevet her.
ForegåendeNæste