Afsnit 3.2: Indledning til -test

Hvis vi betragter er dette et specialtilfælde af multinomialmodellen, idet I afsnit 2.1 blev likelihoodfunktionen brugt til at finde et skøn over idet vi brugte den værdi der gav maksimum af likelihoodfunktionen. Dette er illustreret i følgende figur med logaritmen til likelihoodfunktionen baseret på observationen 21 fra en -fordeling.
I afsnit 1.2 blev holdbarheden af hypotesen vurderet ved at se på, hvor langt ligger fra det forventede eller ækvivalent hermed, hvor langt ligger fra Dette svarer til afstand markeret med blåt på førsteaksen i ovenstående figur. Vi kan imidlertid også bruge likelihoodfunktionen til at konstruere et test af hypotesen Til dette betragtes forholdet (likelihood ratio teststørrelsen). Afstanden markeret med rødt i figuren ovenfor svarer til hvor en stor værdi svarer til en lille værdi af og en lille værdi svarer til en værdi af tæt på 1. Fordelen ved at bruge er, at denne metode nemt kan generaliseres til mere komplekse situationer, hvilket vi vil gøre i næste afsnit for test af hypotese i multinomialmodellen.
Per konstruktion ligger værdien af mellem 0 og 1, og små værdier er kritiske for hypotesen. En lille værdi betyder, at sandsynligheden for det observerede er meget mindre under end under Traditionelt transformerer man til hvor det nu er store værdier, der er kritiske for hypotesen. Da får man
og dermed
Idet vi tænker på som multinomialfordelt, er og de forventede antal i de to kasser under hypotesen Ovenstående udtryk for kan derfor læses som 2 gange summen over kasser af det observerede antal ganget med logaritmen til det observerede antal divideret med det forventede antal. I næste afsnit genfinder vi dette udtryk mere generelt.

3.2.1 Eksempel på hypotese i multinomialmodellen

Når nanopartikler bruges i produkter vil partiklerne med tiden spredes i naturen og kan påvirke økosystemer negativt. Til at undersøge betydningen af sølvnanopartikler, AgNP, har man lavet et eksperiment, hvor 90 embryoer af zebrafisk befinder sig i en opløsning med nanopartikler. Tabellen nedenfor viser, hvor mange zebrafisk der dør i forskellige tidsintervaller (målt i timer).
Det er naturligt at tænke på data i tabellen som et udfald fra en multinomialmodel,
Hvis der er samme dødsrate gennem de 96 timer, hvor eksperimentet løber, er det relevant at betragte hypotesen
hvor er den teoretiske andel, der dør i løbet af 24 timer. For, som et eksempel, at dø i tidsintervallet 24-48 timer skal man ikke dø i de første 24 timer (sandsynlighed ) og dø i den anden tidsperiode (sandsynlighed ), hvorfor sandsynligheden er Sandsynligheden for ikke at dø i nogen af de 4 første tidsperioder er
Hypotesen, beskrevet her, svarer til at sige, at antal tidsperioder til og med zebrafisken dør er geometrisk fordelt. En stokastisk variabel siges at være geometrisk fordelt med parameter hvis
ForegåendeNæste