Hvis vi betragter er dette et specialtilfælde
af multinomialmodellen, idet
I afsnit 6.1.1 i MSRR
bliver likelihoodfunktionen brugt til at finde et
skøn over idet vi bruger den værdi der giver maksimum af
likelihoodfunktionen. Dette er illustreret i følgende figur med
logaritmen til likelihoodfunktionen baseret på observationen 19 fra en
-fordeling.
I afsnit 8.1.2 i MSRR bliver
holdbarheden af hypotesen vurderet ved
at se på, hvor langt ligger fra det forventede eller
ækvivalent hermed, hvor langt ligger fra
Dette svarer til afstand markeret med blåt på førsteaksen i
ovenstående figur.
Vi kan imidlertid også bruge likelihoodfunktionen til at
konstruere et test af hypotesen Til dette betragtes
forholdet (likelihoodratio teststørrelsen).
Dette svarer til
afstand markeret med rødt på andenaksen i figuren ovenfor med logaritmen
til likelihoodfunktionen. Fordelen ved at
bruge er, at denne metode nemt kan generaliseres til mere
komplekse situationer, hvilket vi vil gøre i
næste afsnit for test af
hypotese i multinomialmodellen. Per konstruktion ligger værdien af
mellem 0 og 1, og små værdier er kritiske for hypotesen.
En lille værdi betyder, at sandsynligheden for det observerede er
meget mindre under end under
Traditionelt transformerer man til hvor det nu
er store værdier, der er kritiske for hypotesen. Da
får man
og dermed
Idet vi tænker på som multinomialfordelt, er
og de forventede antal i de to kasser under hypotesen
Ovenstående udtryk for kan derfor læses som
2 gange summen over kasser af det observerede antal ganget med
logaritmen til det observerede antal divideret med det forventede antal.
I næste afsnit genfinder vi dette udtryk mere generelt.
Betragt binomialmodellen hvor vi ønsker
at teste hypotesen baseret på en observation Hvis
alternativet er tosidet, , angiver MSRR i afsnit 8.1.2
-værdien som
Metoden med at gange med to skyldes, at man vil gøre beregningerne
simple, men det betyder, at denne -værdi ikke følger den generelle
definition, hvor -værdien er sandsynligheden for det, der er
lige så kritisk eller mere kritisk end det observerede. Med R til
rådighed kan vi sagtens lave metoder, der følger definitionen.
Jeg vil her nævne tre metoder. Med
brug af R-notation for binomialsandsynligheder kan alle tre metoder
skrives på formen
hvor de tre metoder svarer til valgene
Alle tre metoder er vist i kodevinduet nedenfor. Metode 2 er
implementeret i R i funktionen binom.test.
I kodevinduet har jeg kastet en terning 100 gange og fået en
sekser 10 gange, og jeg tester, om dette er i overensstemmelse
med en sandsynlighed på . -værdien ved metode 1
kan i dette eksempel beregnes på simpel vis som
pbinom(10,100,1/6)+1-pbinom(23,100,1/6).
I opgaverne anbefaler jeg, at I bruger metode 1.
Som konfidensinterval for sandsynlighedsparameteren i
binomialmodellen bruger vi (7.15) og (7.16) i MSRR, som
kan skrives kort som
hvor for at få et approksimativt 95%-konfidensinterval.
Konfidensintervallet kan findes i R med kommandoen
prop.test(x,n,correct=FALSE)conf.int.
1.2.1 Eksempel på hypotese i multinomialmodellen
Data i nedenstående tabel viser for 100 kvinder, der alle er rygere
og som alle prøver på at blive gravide, hvor mange menstruelle cykler
der går, inden det lykkes at blive gravid. Der er 29 ud af de 100,
der bliver gravide i første forsøg, 16 i andet forsøg, og så videre.
Det er naturligt at tænke på data i tabellen som et udfald fra
en multinomialmodel,
Hvis sandsynligheden for at blive gravid i et enkelt forsøg er
for alle kvinderne, er det relevant at betragte hypotesen
For, som et eksempel, at blive gravid i det andet forsøg skal man
ikke blive gravid i det første forsøg (sandsynlighed )
og blive gravid i det andet forsøg (sandsynlighed ),
hvorfor sandsynligheden er Sandsynligheden
for ikke at blive gravid i nogen af de 6 første forsøg er
Hypotesen beskrevet her, svarer til at sige, at antal forsøg indtil
graviditet opnås er geometrisk fordelt.
En stokastisk variabel siges at være geometrisk fordelt
med parameter hvis
Data i dette eksempel stammer fra artiklen
The Beta-geometric distribution applied to comparative fecundability studies.
ForegåendeNæste