Afsnit 3.2: Indledning til -test
Hvis vi betragter
er dette et specialtilfælde
af multinomialmodellen, idet
I afsnit
2.1
blev likelihoodfunktionen
brugt til at finde et
skøn over
idet vi brugte den værdi
der gav maksimum af
likelihoodfunktionen. Dette er illustreret i følgende figur med
logaritmen til likelihoodfunktionen baseret på observationen 21 fra en
-fordeling.
I afsnit
1.2
blev holdbarheden af hypotesen
vurderet ved
at se på, hvor langt
ligger fra det forventede
eller
ækvivalent hermed, hvor langt
ligger fra
Dette svarer til afstand markeret med blåt på førsteaksen i
ovenstående figur.
Vi kan imidlertid også bruge likelihoodfunktionen til at
konstruere et test af hypotesen
Til dette betragtes
forholdet
(
likelihood ratio teststørrelsen).
Afstanden markeret med rødt i figuren ovenfor svarer til
hvor en stor værdi svarer til en lille værdi af
og en
lille værdi svarer til en værdi af
tæt på 1.
Fordelen ved at
bruge
er, at denne metode nemt kan generaliseres til mere
komplekse situationer, hvilket vi vil gøre i
næste afsnit for test af
hypotese i multinomialmodellen.
Per konstruktion ligger værdien af
mellem 0 og 1, og små værdier er kritiske for hypotesen.
En lille værdi betyder, at sandsynligheden for det observerede er
meget mindre under
end under
Traditionelt transformerer man
til
hvor det nu
er store værdier, der er kritiske for hypotesen. Da
får man
og dermed
Idet vi tænker på
som multinomialfordelt, er
og
de forventede antal i de to kasser under hypotesen
Ovenstående udtryk for
kan derfor læses som
2 gange summen over kasser af det observerede antal ganget med
logaritmen til det observerede antal divideret med det forventede antal.
I
næste afsnit genfinder vi dette udtryk mere generelt.
3.2.1 Eksempel på hypotese i multinomialmodellen
Når nanopartikler bruges i produkter vil partiklerne med tiden
spredes i naturen og kan påvirke økosystemer negativt.
Til at undersøge betydningen af sølvnanopartikler, AgNP,
har man lavet et
eksperiment,
hvor 90 embryoer af zebrafisk
befinder sig i en opløsning med
nanopartikler. Tabellen nedenfor viser, hvor mange
zebrafisk der dør i forskellige tidsintervaller (målt i timer).
Det er naturligt at tænke på data i tabellen som et udfald fra
en multinomialmodel,
Hvis der er samme dødsrate gennem de 96 timer, hvor eksperimentet
løber, er det relevant at betragte hypotesen
hvor
er den teoretiske andel, der dør i løbet af 24 timer.
For, som et eksempel, at dø i tidsintervallet 24-48 timer skal
man ikke dø i de første 24 timer
(sandsynlighed
) og dø i den anden tidsperiode
(sandsynlighed
), hvorfor sandsynligheden
er
Sandsynligheden for ikke at dø i nogen af de 4
første tidsperioder er
Hypotesen, beskrevet her, svarer til at sige, at antal tidsperioder
til og med zebrafisken dør er geometrisk fordelt.
En stokastisk variabel
siges at være
geometrisk fordelt
med parameter
hvis
ForegåendeNæste