Afsnit 1.1: Multinomialmodellen

Jeg vil indføre multinomialmodellen ved først at vende tilbage til binomialmodellen. Hvis kan vi skrive som hvor 'erne er uafhængige og enten 0 eller 1 med sandsynlighederne og Dette kan billedligt opfattes, som at data deles op i to kasser: alle -erne med værdien 0 kommer i den ene kasse og alle med værdien 1 kommer i den anden kasse. I multinomialmodellen er der flere end to kasser, lad os sige kasser, og vi kan tænke på modellen som en beskrivelse af uafhængige kast med en generaliseret -sidet terning. Hvert kast svarer til en stokastisk variabel, hvor de mulige værdier for 'erne er Jeg omtaler dette som at i hvert kast, kan man ramme ned i n ud af kasser.
Den stokastiske variabel angiver, hvor mange af de kast der lander i kasse Sandsynligheden i det enkelte kast for at lande i kasse er hvor og Vektoren af antallene i de kasser siges at være multinomialfordelt: med antalsværdi og sandsynlighedsparameter For multinomialmodellen har vi følgende resultater:
Multinomialkoefficienten er defineret som og fortolkes, som antallet af måder man kan vælge således at af disse har værdien 1, har værdien 2 og så videre op til at har værdien At er binomialfordelt følger af, at vi kan reducere til, om det enkelte kast falder i kasse eller ikke falder i kasse

Multinomialkoefficienten

Binomialkoefficienten angiver, på hvor mange måder vi kan tage ud af elementer. Dette kan vises ved induktion. Hvis vi lader være antallet af måder, vi kan tage ud af elementer, er det nemt at argumentere for, at idet man deler op efter, om man blandt de første har taget eller elementer. Ved induktion kan man nu vise, at
Hvis vi nu i stedet betragter antallet af måder, hvorpå man kan dele elementer op på kasser med i kasse kan man først vælge dem, der skal i kasse 1, dernæst dem der skal i kasse to, og så videre. Dette giver at antallet af måder er
Dette giver formlen for multinomialkoefficienten

Multinomialfordelingen i R

I R kan man beregne sandsynlighederne i en multinomialfordeling med kommandoen dmultinom(). Man kan simulere nye udfald som vist i følgende kodevindue.
Her simuleres 1 udfald fra en multinomialfordeling, svarende til at en ærlig sekskantet terning kastes 3 gange. Kør koden, og bemærk at output skrives som en søjle. Prøv at ændre det første "1" til "4".
Prøv også at beregne sandsynligheden for hver af de tre udfald og når en sædvanlig terning kastes 3 gange. Kan du på forhånd regne ud, hvilken af de tre sandsynligheder der er størst?
Kan du regne ud (dette er ikke et R-spørgsmål, men et tænke-spørgsmål), hvilken af følgende tre sandsynligheder der er størst: Sandsynligheden for at få tre forskellige tal når terning kastes 3 gange, sandsynligheden for kun at få to forskellige tal når terning kastes 3 gange, og endelig sandsynligheden for kun at få et tal når terning kastes 3 gange?

Svar: Multinomialsandsynligheder

  1. Sandsynlighederne for de tre udfald er 0.0278 for 0.0139 for og 0.0046 for
  2. Sandsynligheden for tre forskellige tal er antallet af måder at vælge 3 positioner ud af 6 og gange dette med 0.0278. Dette giver For at beregne sandsynligheden for to forskellige tal bruger vi, at der er 15 måder at vælge to positioner ud af 6, og for hver af disse er der to muligher for at skrive 1 og 2 på de to positioner. Dette giver 30 muligheder der skal ganges med 0.0139 som giver 0.417. Endelig er der 6 måder at vælge 1 position, svarende til kun at få et tal, og ganges dette med 0.0046, får vi 0.028.

1.1.1 Estimation i den fulde model

I multinomialmodellen er likelihood-funktionen
og maksimum af denne funktion over området (kaldet den fulde model), fås i punktet
Eftersom er dette helt i overensstemmelse med estimationen i binomialmodellen i Proposition 6.1.1 i MSRR. I ord estimeres sandsynligheden for at falde i kasse med den observerede frekvens i kasse

Bevis for estimater

I ved fra binomialmodellen, at maksimum af opnås for (MSRR side 152). Dette gælder også, hvis eller Når skal maksimeres over området laver vi en omparametrisering og skriver
Med denne omparametrisering opnås
og maksimum findes ved at maksimere hvert led for sig. Det første led er som likelihoodfunktionen i binomialmodellen, og vi ved derfor, at
I ovenstående argument lavede vi omparametriseringen med udgangspunkt i men kunne have brugt et vilkårligt som udgangspunkt. Vi har derfor generelt, at

ForegåendeNæste