Afsnit 3.2: Indledning til G-test
Hvis vi betragter
er dette et specialtilfælde
af multinomialmodellen, idet
I afsnit
2.1
blev likelihoodfunktionen
brugt til at finde et
skøn over
idet vi brugte den værdi
der gav maksimum af
likelihoodfunktionen. Dette er illustreret i følgende figur med
logaritmen til likelihoodfunktionen baseret på observationen 19 fra en
-fordeling.
I afsnit
1.3
blev holdbarheden af hypotesen
vurderet ved
at se på, hvor langt
ligger fra det forventede
eller
ækvivalent hermed, hvor langt
ligger fra
Dette svarer til afstand markeret med blåt på førsteaksen i
ovenstående figur.
Vi kan imidlertid også bruge likelihoodfunktionen til at
konstruere et test af hypotesen
Til dette betragtes
forholdet
(
likelihood ratio teststørrelsen).
Dette svarer til
afstand markeret med rødt på andenaksen i figuren ovenfor med logaritmen
til likelihoodfunktionen. Fordelen ved at
bruge
er, at denne metode nemt kan generaliseres til mere
komplekse situationer, hvilket vi vil gøre i
næste afsnit for test af
hypotese i multinomialmodellen.
Per konstruktion ligger værdien af
mellem 0 og 1, og små værdier er kritiske for hypotesen.
En lille værdi betyder, at sandsynligheden for det observerede er
meget mindre under
end under
Traditionelt transformerer man
til
hvor det nu
er store værdier, der er kritiske for hypotesen. Da
får man
og dermed
Idet vi tænker på
som multinomialfordelt, er
og
de forventede antal i de to kasser under hypotesen
Ovenstående udtryk for
kan derfor læses som
2 gange summen over kasser af det observerede antal ganget med
logaritmen til det observerede antal divideret med det forventede antal.
I
næste afsnit genfinder vi dette udtryk mere generelt.
3.2.1 Eksempel på hypotese i multinomialmodellen
Inden for geologi og fysik kan mange empiriske observationer
beskrives ved en potenslov. Til illustration af dette er der i tabellen
nedenfor angivet antallet af kratere på Mars
i området mellem 0 og 15 graders bredde og 0 og 45 graders længde
for fire størrelsesintervaller. Data er
fundet fra
Mars Crater Database (database as of 2020).
Givet, at vi betragter 1508 kratere, er det naturligt
at tænke på data i tabellen som et udfald fra
en multinomialmodel,
Da bredden af størrelsesintervallerne fordobles fra det ene
interval til det næste, kan teorien om en potenslov formuleres ved,
at sandsynligheden for at falde i et interval skal være en
fast værdi ganget på sandsynligheden for at falde i det
foregående interval. Vi kan skrive dette på følgende vis,
hvor vi per konstruktion har
En beskrivelse af potenslove til beskrivelse af kraterstørrelse kan findes
i artiklen
Power-Law Scaling of the Impact Crater Size-Frequency Distribution on Pluto.
ForegåendeNæste