Afsnit 3.7: Estimation og Test

Under model M0M_0 kan estimation foretages for hver af de rr multinomialmodeller under brug af resultatet i underafsnit 3.1.1. Dette giver
M0:π^ij=Aijni,j=1,,k,i=1,,r. M_0:\quad \hat\pi_{ij}=\frac{A_{ij}}{n_i},\enspace j=1,\ldots,k,\enspace i=1,\ldots,r.
Under model M1M_1 skal det fælles sæt sandsynligheder (π1,,πk)(\pi_1,\ldots,\pi_k) estimeres. Opstiller man likelihoodfunktionen, kan man indse, at estimaterne opnås ved at bruge
(A1,A2,,Ak)multinom(n,(π1,,πk)), (A_{\bullet 1},A_{\bullet 2},\ldots,A_{\bullet k}) \sim\text{multinom}(n_\bullet,(\pi_{1},\ldots,\pi_{k})),
hvor Aj=A1j+A2j++ArjA_{\bullet j}=A_{1j}+A_{2j}+\cdots+A_{rj} er den jj'te søjlesum og n=n1+n2++nr.n_\bullet=n_1+n_2+\cdots+n_r. Igen kan vi bruge resultatet i underafsnit 3.1.1 og får
M1:π^j=Ajn,j=1,,k. M_1:\quad \hat\pi_{j}=\frac{A_{\bullet j}}{n_\bullet},\enspace j=1,\ldots,k.
Vi kan nu beregne de forventede under model M1.M_1. Idet eije_{ij} er det forventede antal i kasse jj for population i,i, er denne
eij=niπ^j=niAjn,j=1,,k,i=1,,r. e_{ij}=n_i\hat\pi_j=\frac{n_iA_{\bullet j}}{n_\bullet}, \enspace j=1,\ldots,k,\enspace i=1,\ldots,r.
Denne formel kan læses som "rækkesum gange søjlesum divideret med den totale sum".

3.7.1 Test

For at lave et test for reduktion fra model M0M_0 til model M1M_1 bruges igen likelihood ratio teststørrelsen på formen G=2log(Q),G=-2\log(Q), hvor QQ er forholdet mellem maksimum af likelihoodfuktionen under de to modeller:
Q=maxM1LmaxM0L=ijπ^jAijπ^ijAij=ij1(Aij(niAj)/n)Aij,\begin{aligned} Q & = \frac{\max_{M_1}L}{\max_{M_0}L}=\prod_i\prod_j \frac{ \hat\pi_j^{A_{ij}} }{ \hat\pi_{ij}^{A_{ij}} } = \prod_i\prod_j \frac{1}{ \big( \frac{A_{ij}}{(n_iA_{\bullet j})/n_\bullet} \big)^{A_{ij}} }, \end{aligned}
og dermed
G=2i=1rj=1kAijlog(Aijeij).(3.7.1) G=2\sum_{i=1}^r\sum_{j=1}^k A_{ij} \log\Big(\frac{A_{ij}}{e_{ij}}\Big). \tag{3.7.1}
I ord kan vi sige dette, som at GG er 2 gange sum over celler af det observerede antal ganget med logaritmen til det observerede antal divideret med det forventede antal. Med celler mener vi indgangene i r×kr\times k matricen med antallene Aij.A_{ij}.
Resultat 3.7.1. (Homogenitetstest)
Betragt modellerne M0M_0 og M1M_1 som beskrevet i dette afsnit. Hvis alle de forventede er større end eller lig med 5, eij5,e_{ij}\geq 5, kan vi approksimativt beregne p-p\text{-}værdien for test af reduktion fra model M0M_0 til model M1M_1 baseret på den observerede værdi GobsG_{\text{obs}} af teststørrelsen GG ved
p-værdi=P(GGobs)=1χcdf2(Gobs,(r1)(k1)). p\text{-værdi}=P(G\geq G_{\text{obs}})= 1-\chi^2_{\text{cdf}}(G_{\text{obs}},(r-1)(k-1)).
Antallet af frihedsgrader følger den generelle regel med antallet af frie parametre i M0M_0 minus antallet af frie parametre i M1M_1:
(r(k1))(k1)=(r1)(k1). \big(r(k-1)\big)-(k-1)=(r-1)(k-1).

Illustration gennem R

Nedenstående kode viser eksplicit beregningen af de forventede antal. I eksempel 3.7.2 nedenfor er vist en kortere version a koden, og det er denne I skal bruge i forbindelse med opgaverne. I kodevinduet er Obs en 3×23\times 2 matriks med følgende data:
12Sum110102021030403202040Sum4060100 \begin{array}{l|cc|c|} & 1 & 2 & \text{Sum} \\ \hline 1 & 10 & 10 & 20 \\ 2 & 10 & 30 & 40 \\ 3 & 20 & 20 & 40 \\ \hline \text{Sum} & 40 & 60 & 100 \\ \hline \end{array}
Kør koden, og forklar, hvad de forskellige dele af output indeholder.

Svar: Homogenitetstest

Funktionen rowSums beregner rækkesummer, og giver derfor en vektor af længde 3. Funktionen colSums beregner søjlesummer, og giver derfor en vektor af længde 2. Funktionen outer tager to vektorer som input og danner en matriks, hvor den (i,j)(i,j)'te indgang er den ii'te indgang i den første vektor ganget med den jj'te indgang i den anden vektor, hvorfor ex bliver matricen med de forventede antal. Endelig indeholder GG og pval henholdsvis GG-teststørrelsen og den tilhørende pp-værdi. Koden i linjerne 5-8 kan skrives samlet som ex=outer(rowSums(obs),colSums(obs))/ sum(obs).

Eksempel 3.7.2. (Tillægge robotter menneskelignende egenskaber)
Vi fortsætter med data omkring antropomorfe indlæg på tre diskussionsfora fra Eksempel 3.6.1.
Først opstilles en statistisk model for data. Lad Indlaegij,\text{Indlaeg}_{ij}, i=iP,Ro,Aii=\text{iP},\text{Ro}, \text{Ai} (iPad, Roomba, Aibo), j=ja,nejj=\text{ja},\text{nej} (indeholder antropomorft indhold: ja, nej), være den stokastiske variabel, der angiver antal indlæg med indhold givet ved jj og med forum givet ved ii. Vi benytter modellen
(IndlaegiP,ja,IndlaegiP,nej)multinom(451,(πiP,ja,πiP,nej)),πiP,j0,πiP,ja+πiP,nej=1,(IndlaegRo,ja,IndlaegRo,nej)multinom(402,(πRo,ja,πRo,nej)),πRo,j0,πRo,ja+πRo,nej=1,(IndlaegAi,ja,IndlaegAi,nej)multinom(355,(πAi,ja,πAi,nej)),πAi,j0,πAi,ja+πAi,nej=1. \begin{aligned} & (\text{Indlaeg}_{\text{iP,ja}},\text{Indlaeg}_{\text{iP,nej}})\sim \text{multinom}(451, (\pi_{\text{iP,ja}},\pi_{\text{iP,nej}})),\enspace \pi_{\text{iP},j}\geq 0, \pi_{\text{iP,ja}}+\pi_{\text{iP,nej}}=1, \\ & (\text{Indlaeg}_{\text{Ro,ja}},\text{Indlaeg}_{\text{Ro,nej}})\sim \text{multinom}(402, (\pi_{\text{Ro,ja}},\pi_{\text{Ro,nej}})),\enspace \pi_{\text{Ro},j}\geq 0, \pi_{\text{Ro,ja}}+\pi_{\text{Ro,nej}}=1, \\ & (\text{Indlaeg}_{\text{Ai,ja}},\text{Indlaeg}_{\text{Ai,nej}})\sim \text{multinom}(355, (\pi_{\text{Ai,ja}},\pi_{\text{Ai,nej}})),\enspace \pi_{\text{Ai},j}\geq 0, \pi_{\text{Ai,ja}}+\pi_{\text{Ai,nej}}=1. \end{aligned}
Under denne model ønsker vi at teste hypotesen om samme frekvens af antropomorfe indlæg på de tre fora,
(πiP,ja,πiP,nej)=(πRo,ja,πRo,nej)=(πAi,ja,πAi,nej). (\pi_{\text{iP,ja}},\pi_{\text{iP,nej}})= (\pi_{\text{Ro,ja}},\pi_{\text{Ro,nej}})= (\pi_{\text{Ai,ja}},\pi_{\text{Ai,nej}}).
Først findes de forventede antal under hypotesen som rækkesum gange søjlesum divideret med det totale antal. Dette giver følgende tabel (afrundet til en decimal).
ApperatAntropomorftIkke AntropomorftTotaliPad96.3354.7451Roomba85.9316.1402Aibo75.8279.2355 \begin{array}{lccc} \text{Apperat} & \text{Antropomorft} & \text{Ikke Antropomorft} & \text{Total} \\ \hline \text{iPad} & 96.3 & 354.7 & 451 \\ \text{Roomba} & 85.9 & 316.1 & 402 \\ \text{Aibo} & 75.8 & 279.2 & 355 \\ \hline \end{array}
Dernæst beregnes GG-teststørelsen,
G=2{10log(1096.3)++154log(154279.2)}=381.2. G=2\Big\{10\cdot\log\big(\frac{10}{96.3}\big)+\cdots+ 154\cdot\log\big(\frac{154}{279.2}\big)\Big\} =381.2.
Da alle de forventede er større end fem (den mindste er 75.8), bruges χ2\chi^2-approksimationen til fordelingen af GG, og vi får
p-værdi=1χcdf2(381.2,(31)(21))=1.71083. p\text{-værdi}= 1-\chi^2_{\text{cdf}}\big(381.2,(3-1)(2-1)\big)= 1.7\cdot 10^{-83}.
Denne pp-værdi er meget lille, hvorfor data strider mod hypotesen om samme frekvens af antropomorfe indlæg på de tre fora. Kigger vi på data, kan vi også se, at der er en høj frekvens af antropomorfe indlæg på Aibo-forummet, men en lav frekvens på iPad-forummet. Roomba-forummet ligger mellem de to andre fora, men nok tættere på iPad-forum end på Aibo-forum, hvilket ikke var forventet af forfatterne til artiklen. Beregningerne er lavet i R som vist nedenfor.

3.7.3 Beregning i R af homogenitetstest

ForegåendeNæste