Afsnit 3.2: Indledning til G-test

Hvis vi betragter er dette et specialtilfælde af multinomialmodellen, idet I afsnit 2.1 blev likelihoodfunktionen brugt til at finde et skøn over idet vi brugte den værdi der gav maksimum af likelihoodfunktionen. Dette er illustreret i følgende figur med logaritmen til likelihoodfunktionen baseret på observationen 19 fra en -fordeling.
I afsnit 1.3 blev holdbarheden af hypotesen vurderet ved at se på, hvor langt ligger fra det forventede eller ækvivalent hermed, hvor langt ligger fra Dette svarer til afstand markeret med blåt på førsteaksen i ovenstående figur. Vi kan imidlertid også bruge likelihoodfunktionen til at konstruere et test af hypotesen Til dette betragtes forholdet (likelihood ratio teststørrelsen). Dette svarer til afstand markeret med rødt på andenaksen i figuren ovenfor med logaritmen til likelihoodfunktionen. Fordelen ved at bruge er, at denne metode nemt kan generaliseres til mere komplekse situationer, hvilket vi vil gøre i næste afsnit for test af hypotese i multinomialmodellen.
Per konstruktion ligger værdien af mellem 0 og 1, og små værdier er kritiske for hypotesen. En lille værdi betyder, at sandsynligheden for det observerede er meget mindre under end under Traditionelt transformerer man til hvor det nu er store værdier, der er kritiske for hypotesen. Da får man
og dermed
Idet vi tænker på som multinomialfordelt, er og de forventede antal i de to kasser under hypotesen Ovenstående udtryk for kan derfor læses som 2 gange summen over kasser af det observerede antal ganget med logaritmen til det observerede antal divideret med det forventede antal. I næste afsnit genfinder vi dette udtryk mere generelt.

3.2.1 Eksempel på hypotese i multinomialmodellen

Inden for geologi og fysik kan mange empiriske observationer beskrives ved en potenslov. Til illustration af dette er der i tabellen nedenfor angivet antallet af kratere på Mars i området mellem 0 og 15 graders bredde og 0 og 45 graders længde for fire størrelsesintervaller. Data er fundet fra Mars Crater Database (database as of 2020).
Givet, at vi betragter 1508 kratere, er det naturligt at tænke på data i tabellen som et udfald fra en multinomialmodel,
Da bredden af størrelsesintervallerne fordobles fra det ene interval til det næste, kan teorien om en potenslov formuleres ved, at sandsynligheden for at falde i et interval skal være en fast værdi ganget på sandsynligheden for at falde i det foregående interval. Vi kan skrive dette på følgende vis,
hvor vi per konstruktion har
En beskrivelse af potenslove til beskrivelse af kraterstørrelse kan findes i artiklen Power-Law Scaling of the Impact Crater Size-Frequency Distribution on Pluto.
ForegåendeNæste