Afsnit 3.1: Multinomialmodellen

Jeg vil indføre multinomialmodellen ved først at vende tilbage til binomialmodellen. Hvis kan vi skrive som hvor 'erne er uafhængige og enten 0 eller 1 med sandsynlighederne og Dette kan billedligt opfattes, som at data deles op i to kasser: alle -erne med værdien 0 kommer i den ene kasse og alle med værdien 1 kommer i den anden kasse. I multinomialmodellen er der flere end to kasser, lad os sige kasser, og vi kan tænke på modellen som en beskrivelse af uafhængige kast med en generaliseret -sidet terning. Hvert kast svarer til en stokastisk variabel, hvor de mulige værdier for 'erne er Jeg omtaler dette som at i hvert kast, kan man ramme ned i n ud af kasser.
Statistisk Model 3.1.1. (Multinomialmodellen)
Den stokastiske variabel angiver, hvor mange af de kast der lander i kasse Sandsynligheden i det enkelte kast for at lande i kasse er hvor og Vektoren af antallene i de kasser siges at være multinomialfordelt med antalsværdi og sandsynlighedsparameter hvilket vi skriver som
For multinomialmodellen har vi følgende resultater:
Multinomialkoefficienten er defineret som og fortolkes som antallet af måder, man kan vælge således at af disse har værdien 1, har værdien 2 og så videre op til at har værdien At er binomialfordelt følger af, at vi kan reducere til, om det enkelte kast falder i kasse eller ikke falder i kasse

Multinomialfordelingen i R

I R kan man beregne sandsynlighederne i en multinomialfordeling med kommandoen dmultinom(). Man kan simulere nye udfald som vist i følgende kodevindue.
Her simuleres 1 udfald fra en multinomialfordeling, svarende til at en ærlig sekskantet terning kastes 3 gange. Kør koden, og bemærk at output skrives som en søjle. Prøv at ændre det første "1" til "4".
Prøv også at beregne sandsynligheden for hvert af de tre udfald og når en sædvanlig terning kastes 3 gange. Kan du på forhånd regne ud, hvilken af de tre sandsynligheder der er størst?
Kan du regne ud (dette er ikke et R-spørgsmål, men et tænke-spørgsmål), hvilken af følgende tre sandsynligheder der er størst: Sandsynligheden for at få tre forskellige tal når terning kastes 3 gange, sandsynligheden for kun at få to forskellige tal når terning kastes 3 gange, og endelig sandsynligheden for kun at få et tal når terning kastes 3 gange?

Svar: Multinomialsandsynligheder

  1. Sandsynlighederne for de tre udfald er 0.0278 for 0.0139 for og 0.0046 for
  2. Sandsynligheden for tre forskellige tal er antallet af måder at vælge 3 positioner ud af 6 og gange dette med 0.0278. Dette giver For at beregne sandsynligheden for to forskellige tal bruger vi, at der er 15 måder at vælge to positioner ud af 6, og for hver af disse er der to muligher for at skrive 1 og 2 på de to positioner. Dette giver 30 muligheder der skal ganges med 0.0139 som giver 0.417. Endelig er der 6 måder at vælge 1 position, svarende til kun at få et tal, og ganges dette med 0.0046, får vi 0.028.

3.1.1 Estimation i den fulde model

I multinomialmodellen er likelihood-funktionen
og maksimum af denne funktion over området (kaldet den fulde model), fås i punktet
Eftersom er dette helt i overensstemmelse med estimationen i binomialmodellen i Eksempel 2.1.2. I ord estimeres sandsynligheden for at falde i kasse med den observerede frekvens i kasse
ForegåendeNæste