Jeg vil indføre multinomialmodellen ved først at vende tilbage til
binomialmodellen. Hvis kan vi skrive
som hvor 'erne er uafhængige og enten
0 eller 1 med sandsynlighederne og
Dette kan billedligt opfattes, som at data deles op i to
kasser: alle -erne med værdien 0 kommer i den ene kasse og
alle med værdien 1 kommer i den anden kasse.
I multinomialmodellen er der flere end to kasser, lad os sige kasser,
og vi kan tænke på modellen som en beskrivelse af
uafhængige kast med en generaliseret -sidet terning.
Hvert kast svarer til en stokastisk variabel, hvor
de mulige værdier for 'erne er
Jeg omtaler dette som at i hvert kast, kan man ramme
ned i n ud af kasser.
Statistisk Model 3.1.1.
(Multinomialmodellen)
Den stokastiske variabel
angiver, hvor mange af de kast der lander i kasse
Sandsynligheden i det enkelte kast for at lande i kasse er
hvor og
Vektoren af antallene i de kasser siges at
være multinomialfordelt med antalsværdi og sandsynlighedsparameter
hvilket vi skriver som
For multinomialmodellen har vi følgende resultater:
Multinomialkoefficienten er defineret
som og fortolkes som antallet af måder, man
kan vælge således at af disse har værdien 1,
har værdien 2 og så videre op til at har værdien
At er binomialfordelt følger af, at vi kan reducere til, om
det enkelte kast falder i kasse eller ikke falder i kasse
I R kan man beregne sandsynlighederne i en multinomialfordeling med
kommandoen dmultinom().
Man kan simulere nye udfald som vist i følgende kodevindue.
Her simuleres 1 udfald fra en multinomialfordeling, svarende til at
en ærlig sekskantet terning kastes 3 gange. Kør koden, og bemærk
at output skrives som en søjle. Prøv at ændre det første "1" til "4". Prøv også at beregne sandsynligheden for hvert af de tre udfald
og
når en sædvanlig terning kastes 3 gange.
Kan du på forhånd regne ud, hvilken af de tre sandsynligheder
der er størst ?Kan du regne ud (dette er ikke et R-spørgsmål,
men et tænke-spørgsmål),
hvilken af følgende tre sandsynligheder der er størst:
Sandsynligheden for at få tre forskellige tal når terning kastes
3 gange, sandsynligheden for kun at få to forskellige tal når terning kastes
3 gange, og endelig sandsynligheden for kun at få et tal
når terning kastes 3 gange ?
Sandsynlighederne for de tre udfald er 0.0278 for
0.0139 for og 0.0046 for
Sandsynligheden for tre forskellige tal er antallet af måder at
vælge 3 positioner ud af 6 og gange dette med 0.0278.
Dette giver
For at beregne sandsynligheden for to forskellige tal bruger vi, at der er
15 måder at vælge to positioner ud af 6, og for hver af disse er der to
muligher for at skrive 1 og 2 på de to positioner. Dette giver 30
muligheder der skal ganges med 0.0139 som giver 0.417.
Endelig er der 6 måder at vælge 1 position, svarende til kun at få et tal,
og ganges dette med 0.0046, får vi 0.028.
3.1.1 Estimation i den fulde model
I multinomialmodellen
er
likelihood-funktionen
og maksimum af denne funktion over området
(kaldet den fulde model),
fås i punktet
Eftersom er dette helt i overensstemmelse
med estimationen i binomialmodellen i
Eksempel 2.1.2. I ord
estimeres sandsynligheden for at falde i kasse med den observerede
frekvens i kasse
ForegåendeNæste