Afsnit 1.1: Multinomialmodellen

Jeg vil indføre multinomialmodellen ved først at vende tilbage til binomialmodellen. Hvis $X\sim\text{binom}(n,p),$ kan vi skrive $X$ som $X=B_1+B_2+\cdots+B_n,$ hvor $B_i$ 'erne er uafhængige og enten 0 eller 1 med sandsynlighederne $1-p$ og $p.$ Dette kan billedligt opfattes, som at data deles op i to kasser: alle $B_i$ -erne med værdien 0 kommer i den ene kasse og alle med værdien 1 kommer i den anden kasse. I multinomialmodellen er der flere end to kasser, lad os sige $k$ kasser, og vi kan tænke på modellen som en beskrivelse af $n$ uafhængige kast med en generaliseret $k$ -sidet terning. Hvert kast svarer til en stokastisk variabel, $B_i,$ $i=1,\ldots,n,$ hvor de mulige værdier for $B_i$ 'erne er $1,2\ldots,k.$ Jeg omtaler dette som at i hvert kast, kan man ramme ned i $\acute{\text{e}}$ n ud af $k$ kasser.

Den stokastiske variabel $A_j,$ $j=1,\ldots,k,$ angiver, hvor mange af de $n$ kast der lander i kasse $j.$ Sandsynligheden i det enkelte kast for at lande i kasse $j$ er $\pi_j,$ hvor $\pi_j\geq 0$ og $\pi_1+\cdots+\pi_k=1.$ Vektoren $(A_1,\ldots,A_k)$ af antallene i de $k$ kasser siges at være multinomialfordelt: $(A_1,\ldots,A_k)\sim\text{multinom}(n,$ $(\pi_1,\ldots,\pi_k))$ med antalsværdi $n$ og sandsynlighedsparameter $(\pi_1,\ldots,\pi_k).$ For multinomialmodellen har vi følgende resultater:

$\begin{aligned} & \text{Model:}\enspace (A_1,\ldots,A_k)\sim\text{multinom}(n,(\pi_1,\ldots,\pi_k)),\enspace \pi_j\geq 0,\enspace \pi_1+\cdots+\pi_k=1:\\ & P\big((A_1,\ldots,A_k)=(a_1,\ldots,a_k)\big)= \binom{n}{a_1,\ldots,a_k} \pi_1^{a_1}\cdots\pi_k^{a_k},\enspace a_j\geq 0,\enspace a_1+\cdots+a_k=n, \\ & A_j\sim\text{binom}(n,\pi_j),\quad E(A_j)=n\pi_j, \quad \text{Var}(A_j)=n\pi_j(1-\pi_j). \end{aligned}$ Multinomialkoefficienten $\binom{n}{a_1,\ldots,a_k}$ er defineret som $n!/(a_1!\cdots a_k!)$ og fortolkes, som antallet af måder man kan vælge $b_1,\ldots b_n,$ således at $a_1$ af disse har værdien 1, $a_2$ har værdien 2 og så videre op til at $a_k$ har værdien $k.$ At $A_j$ er binomialfordelt følger af, at vi kan reducere til, om det enkelte kast falder i kasse $j$ eller ikke falder i kasse $j.$

Multinomialkoefficienten

Binomialkoefficienten $\binom{n}{x}=n!/(x!(n-x)!)$ angiver, på hvor mange måder vi kan tage $x$ ud af $n$ elementer. Dette kan vises ved induktion. Hvis vi lader $c_{n,x}$ være antallet af måder, vi kan tage $x$ ud af $n$ elementer, er det nemt at argumentere for, at $c_{n+1,x}=c_{n,x-1}+c_{n,x},$ idet man deler op efter, om man blandt de $n$ første har taget $x$ eller $x-1$ elementer. Ved induktion kan man nu vise, at $c_{n,x}=n!/(x!(n-x)!).$

Hvis vi nu i stedet betragter antallet af måder, hvorpå man kan dele $n$ elementer op på $k$ kasser med $a_j$ i kasse $j,$ $j=1,\ldots,k,$ kan man først vælge dem, der skal i kasse 1, dernæst dem der skal i kasse to, og så videre. Dette giver at antallet af måder er

$\begin{aligned} & c_{n,a_1}c_{n-a_1,a_2}c_{n-a_1-a_2,a_3}\cdots c_{a_k,a_k} =\frac{n!}{a_1!(n-a_1)!}\frac{(n-a_1)!}{a_2!(n-a_1-a_2)!} \frac{(n-a_1-a_2)!}{a_3!(n-a_1-a_2-a_3)!}\cdots 1 \\ &= \frac{n!}{a_1!a_2!\cdots a_k!}. \end{aligned}$ Dette giver formlen for multinomialkoefficienten $\binom{n}{a_1,a_2,\ldots,a_k}.$

Multinomialfordelingen i R

I R kan man beregne sandsynlighederne i en multinomialfordeling med kommandoen dmultinom( $(a_1,\ldots,a_k),n,(\pi_1,\ldots,\pi_k)$ ). Man kan simulere nye udfald som vist i følgende kodevindue.

Her simuleres 1 udfald fra en multinomialfordeling, svarende til at en ærlig sekskantet terning kastes 3 gange. Kør koden, og bemærk at output skrives som en søjle. Prøv at ændre det første "1" til "4".

Prøv også at beregne sandsynligheden for hver af de tre udfald $(a_1,\ldots,a_6)=(1,1,1,0,0,0),$ $(a_1,\ldots,a_6)=(1,2,0,0,0,0)$ og $(a_1,\ldots,a_6)=(3,0,0,0,0,0),$ når en sædvanlig terning kastes 3 gange. Kan du på forhånd regne ud, hvilken af de tre sandsynligheder der er størst ?

Kan du regne ud (dette er ikke et R-spørgsmål, men et tænke-spørgsmål), hvilken af følgende tre sandsynligheder der er størst: Sandsynligheden for at få tre forskellige tal når terning kastes 3 gange, sandsynligheden for kun at få to forskellige tal når terning kastes 3 gange, og endelig sandsynligheden for kun at få et tal når terning kastes 3 gange ?

Svar: Multinomialsandsynligheder

Sandsynlighederne for de tre udfald er 0.0278 for $(1,1,1,0,0,0),$ 0.0139 for $(1,2,0,0,0,0)$ og 0.0046 for $(3,0,0,0,0,0)$
Sandsynligheden for tre forskellige tal er antallet af måder at vælge 3 positioner ud af 6 og gange dette med 0.0278. Dette giver $20\cdot 0.0278=0.556.$ For at beregne sandsynligheden for to forskellige tal bruger vi, at der er 15 måder at vælge to positioner ud af 6, og for hver af disse er der to muligher for at skrive 1 og 2 på de to positioner. Dette giver 30 muligheder der skal ganges med 0.0139 som giver 0.417. Endelig er der 6 måder at vælge 1 position, svarende til kun at få et tal, og ganges dette med 0.0046, får vi 0.028.

1.1.1 Estimation i den fulde model

I multinomialmodellen $(A_1,\ldots,A_k)\sim\text{multinom}(n,(\pi_1,\ldots,\pi_k))$ er likelihood-funktionen

$L(\pi_1,\ldots,\pi_k)= \binom{n}{a_1,\ldots,a_k}\pi_1^{a_1}\cdots\pi_k^{a_k}, \tag{1.1.1}$ og maksimum af denne funktion over området $\pi_j\geq 0,$ $\pi_1+\cdots+\pi_k=1$ (kaldet den fulde model), fås i punktet

$\hat\pi_j=\frac{a_j}{n},\enspace j=1,\ldots,k.$ Eftersom $A_j\sim\text{binom}(n,\pi_j),$ er dette helt i overensstemmelse med estimationen i binomialmodellen i Proposition 6.1.1 i MSRR. I ord estimeres sandsynligheden for at falde i kasse $j$ med den observerede frekvens i kasse $j.$

Bevis for estimater

I ved fra binomialmodellen, at maksimum af $p^x(1-p)^{n-x},$ $0\leq p\leq 1$ opnås for $\hat p=x/n$ (MSRR side 152). Dette gælder også, hvis $x=0$ eller $x=n.$ Når $\pi_1^{a_1}\pi_2^{a_2}\cdots\pi_k^{a_k}$ skal maksimeres over området $\{\pi_j\geq 0, \pi_1+\cdots+\pi_k=1\},$ laver vi en omparametrisering og skriver

$\begin{aligned} & \pi_1=p,\,\pi_2=(1-p)v_2,\,\pi_3=(1-p)v_3,\ldots,\,\pi_k=(1-p)v_k, \\ & (p,v_2,\ldots,v_k)\in [0,1]\times \{v_j\geq 0, v_2+\cdots+v_k=1\}. \end{aligned}$ Med denne omparametrisering opnås

$\pi_1^{a_1}\pi_2^{a_2}\cdots\pi_k^{a_k}= \Big\{p^{a_1}(1-p)^{n-a_1}\big\}\cdot \Big\{ v_2^{a_2}\cdots v_k^{a_k} \Big\},$ og maksimum findes ved at maksimere hvert led for sig. Det første led er som likelihoodfunktionen i binomialmodellen, og vi ved derfor, at

$\hat\pi_1=\hat p=\frac{a_1}{n}.$ I ovenstående argument lavede vi omparametriseringen med udgangspunkt i $\pi_1,$ men kunne have brugt et vilkårligt $\pi_j,$ $j=1,\ldots,k,$ som udgangspunkt. Vi har derfor generelt, at $\hat\pi_j=a_j/n,$ $j=1,\ldots,n.$

Foregående Næste