Afsnit 1.2: Indledning til $G$ -test

Hvis vi betragter $X\sim\text{binom}(n,p),$ er dette et specialtilfælde af multinomialmodellen, idet $(X,n-X)\sim\text{multinom}(n,(p,1-p)).$ I afsnit 6.1.1 i MSRR bliver likelihoodfunktionen $L(p)$ brugt til at finde et skøn over $p,$ idet vi bruger den værdi $\hat p,$ der giver maksimum af likelihoodfunktionen. Dette er illustreret i følgende figur med logaritmen til likelihoodfunktionen baseret på observationen 19 fra en $\text{binom}(25,p)$ -fordeling.

I afsnit 8.1.2 i MSRR bliver holdbarheden af hypotesen $p=p_0$ vurderet ved at se på, hvor langt $X$ ligger fra det forventede $np_0,$ eller ækvivalent hermed, hvor langt $\hat p=\frac{X}{n}$ ligger fra $p_0.$ Dette svarer til afstand markeret med blåt på førsteaksen i ovenstående figur. Vi kan imidlertid også bruge likelihoodfunktionen til at konstruere et test af hypotesen $p=p_0.$ Til dette betragtes forholdet $Q=L(p_0)/L(\hat p)$ (likelihoodratio teststørrelsen). Dette svarer til afstand markeret med rødt på andenaksen i figuren ovenfor med logaritmen til likelihoodfunktionen. Fordelen ved at bruge $Q$ er, at denne metode nemt kan generaliseres til mere komplekse situationer, hvilket vi vil gøre i næste afsnit for test af hypotese i multinomialmodellen.

Per konstruktion ligger værdien af $Q$ mellem 0 og 1, og små værdier er kritiske for hypotesen. En lille værdi betyder, at sandsynligheden for det observerede er meget mindre under $p=p_0$ end under $p=\hat p.$ Traditionelt transformerer man $Q$ til $G=-2\log(Q),$ hvor det nu er store værdier, der er kritiske for hypotesen. Da $\hat p=X/n,$ får man

$Q=\frac{\binom{n}{X}p_0^X(1-p_0)^{n-X}} {\binom{n}{X}(\frac{X}{n})^X(1-\frac{X}{n})^{n-X}}= \frac{1} {(\frac{X}{np_0})^X(\frac{n-X}{n(1-p_0)})^{n-X}},$ og dermed

$G=-2\log(Q)=2\Big( X\log\big(\frac{X}{np_0}\big)+(n-X)\log\big(\frac{n-X}{n(1-p_0)}\big)\Big).$ Idet vi tænker på $(X,n-X)$ som multinomialfordelt, er $np_0$ og $n(1-p_0)$ de forventede antal i de to kasser under hypotesen $p=p_0.$ Ovenstående udtryk for $G$ kan derfor læses som 2 gange summen over kasser af det observerede antal ganget med logaritmen til det observerede antal divideret med det forventede antal. I næste afsnit genfinder vi dette udtryk mere generelt.

Inferens om fraktion

Betragt binomialmodellen $X\sim\text{binom}(n,p),$ hvor vi ønsker at teste hypotesen $p=p_0$ baseret på en observation $x.$ Hvis alternativet er tosidet, $p\neq p_0$ , angiver MSRR i afsnit 8.1.2 $p$ -værdien som

$p\text{-værdi}=\begin{cases} 2 P(X\leq x) & x\leq np_0, \\ 2 P(X\geq x) & x>np_0. \end{cases}$ Metoden med at gange med to skyldes, at man vil gøre beregningerne simple, men det betyder, at denne $p$ -værdi ikke følger den generelle definition, hvor $p$ -værdien er sandsynligheden for det, der er lige så kritisk eller mere kritisk end det observerede. Med R til rådighed kan vi sagtens lave metoder, der følger definitionen. Jeg vil her nævne tre metoder. Med brug af R-notation for binomialsandsynligheder kan alle tre metoder skrives på formen

$p\text{-værdi}= \sum_{z\in K(x)} \text{dbinom}(z,n,p_0),$ hvor de tre metoder svarer til valgene

$\begin{aligned} & \text{Afstand:}\enspace K(x)=\{z:|z-np_0|\geq |x-np_0|\}, \\ & \text{Tæthed:}\enspace K(x)=\{z:\text{dbinom}(z,n,p_0)\leq \text{dbinom}(x,n,p_0)\}, \\ & \text{Likelihoodratio:}\enspace K(x)=\{z:Q(z)\leq Q(x)\}. \end{aligned}$ Alle tre metoder er vist i kodevinduet nedenfor. Metode 2 er implementeret i R i funktionen binom.test. I kodevinduet har jeg kastet en terning 100 gange og fået en sekser 10 gange, og jeg tester, om dette er i overensstemmelse med en sandsynlighed på $\frac{1}{6}$ . $P$ -værdien ved metode 1 kan i dette eksempel beregnes på simpel vis som pbinom(10,100,1/6)+1-pbinom(23,100,1/6). I opgaverne anbefaler jeg, at I bruger metode 1.

Som konfidensinterval for sandsynlighedsparameteren $p$ i binomialmodellen bruger vi (7.15) og (7.16) i MSRR, som kan skrives kort som

$\frac{x+\frac{u^2}{2}\pm u\sqrt{\frac{x(n-x)}{n}+\frac{u^2}{4}}}{n+u^2},$ hvor $u=1.96$ for at få et approksimativt 95%-konfidensinterval. Konfidensintervallet kan findes i R med kommandoen prop.test(x,n,correct=FALSE) $\text{{\textdollar}}$ conf.int.

1.2.1 Eksempel på hypotese i multinomialmodellen

Data i nedenstående tabel viser for 100 kvinder, der alle er rygere og som alle prøver på at blive gravide, hvor mange menstruelle cykler der går, inden det lykkes at blive gravid. Der er 29 ud af de 100, der bliver gravide i første forsøg, 16 i andet forsøg, og så videre.

$\begin{array}{lccccccc}\hline \text{Cykelnummer} & 1 & 2 & 3 & 4 & 5 & 6 & \geq 7 \\ \text{Antal kvinder} & 29 & 16 & 17 & 4 & 3 & 9 & 22 \\ \hline \end{array}$ Det er naturligt at tænke på data i tabellen som et udfald fra en multinomialmodel,

$(A_1,\ldots,A_7)\sim\text{multinom}(100,(\pi_1,\ldots,\pi_7)),\enspace \pi_j\geq 0,\enspace \pi_1+\cdots+\pi_7=1.$ Hvis sandsynligheden for at blive gravid i et enkelt forsøg er $\theta$ for alle kvinderne, er det relevant at betragte hypotesen

$\pi_1=\theta,\enspace \pi_2=(1-\theta)\theta,\enspace \pi_3=(1-\theta)^2\theta,\, \cdots,\, \pi_6=(1-\theta)^5\theta,\enspace \pi_7=(1-\theta)^6.$ For, som et eksempel, at blive gravid i det andet forsøg skal man ikke blive gravid i det første forsøg (sandsynlighed $1-\theta$ ) og blive gravid i det andet forsøg (sandsynlighed $\theta$ ), hvorfor sandsynligheden er $\pi_2=(1-\theta)\theta.$ Sandsynligheden for ikke at blive gravid i nogen af de 6 første forsøg er $\pi_7=(1-\theta)^6.$

Hypotesen beskrevet her, svarer til at sige, at antal forsøg indtil graviditet opnås er geometrisk fordelt. En stokastisk variabel $X$ siges at være geometrisk fordelt med parameter $\theta,$ hvis

$P(X=x)=(1-\theta)^{x-1}\theta,\quad x=1,2,3,\ldots.$ Data i dette eksempel stammer fra artiklen The Beta-geometric distribution applied to comparative fecundability studies.

Foregående Næste

Afsnit 1.2: Indledning til G-test

1.2.1 Eksempel på hypotese i multinomialmodellen

Afsnit 1.2: Indledning til $G$ -test