Afsnit 2.2: Konfidensinterval

I Eksempel 2.1.3 fik vi skønnet 0.82 for sandsynligheden for, at vores klassifikationregel ville klassificere en ryger korrekt. Dette tal i sig selv siger ikke så meget. Hvis skønnet er foreneligt med, at den sande værdi af sandsynligheden for korrekt klassifikation er meget lavere, vil klassifiktionsreglen ikke være et særligt godt værktøj til udnyttelsen af fingeraftrykket. Vi har behov for at vide noget om usikkerheden på vores skøn. Jeg vil nu indføre en metode til i stedet for blot at give en enkelt værdi som skøn over en parameter, at give et helt interval af værdier med den fortolkning, at alle værdier i intervallet er relevante som mulige værdier for den sande underliggende parameter. Jeg kalder intervallet for et konfidensinterval. Størrelsen af konfidensintervallet er bestemt af et procenttal, og i dette kursus holder vi os til et 95%-konfidensinterval. I overensstemmelse med at udvide fra et skøn til et interval kan I for binomialmodellen gå tilbage til figuren af likelihoodfunktionen i Eksempel 2.1.2. Her kommer konfidensintervallet til approksimativt at bestå af alle værdier af parameteren, hvor likelihoodfunktionen ligger over en fraktion af den maksimale værdi af likelihoodfunktionen (dette vises i Eksempel 2.2.3 nedenfor).

Definition 2.2.1. (95%-Konfidensinterval)

Betragt en statistisk model, hvor vi måler en stokastisk variabel

X,

og hvor fordelingen af

X

afhænger af parameteren

\theta.

For hver mulig værdi

x

X

laves et interval

[\hat\theta_-(x),\hat\theta_+(x)].

Vi betragter nu det stokastiske interval

[\hat\theta_-(X),\hat\theta_+(X)]

og forlanger, at sandsynligheden for at intervallet indeholder den sande værdi

\theta

af parameteren er 0.95. Når dette er opfyldt, kaldes intervallet et 95%-konfidensinterval. Skrevet op som en formel, er betingelsen

P_\theta\big([\hat\theta_-(X),\hat\theta_+(X)]\ni \theta\big) =0.95.

Hvis vi for eksempel i stedet ønsker et 90%-konfidensinterval, skal 0.95 i ovenstående definition ændres til 0.90. Figuren nedenfor viser på generisk form ideen i et konfidensinterval: et eksperiment er gentaget 20 gange, og hver gang er der lavet et konfidensinterval for parameteren

\theta,

19 ud af 20 gange (95%) indeholder intervallet den sande værdi af parameteren. Konfidensintervallerne er vist som lodrette linjestykker i figuren.

2.2.1 Konfidensinterval i binomialmodellen

I binomialmodellen

X\sim\text{binom}(n,p)

er det ikke muligt at lave et konfidensinterval for sandsynlighedsparameteren

p,

der opfylder betingelsen i Definition 2.2.1 eksakt. I stedet benytter man følgende approksimative konfidensinterval.

Resultat 2.2.2. (Konfidensinterval i binomialmodellen)

For modellen

X\sim\text{binom}(n,p)

er et approksimativt 95%-konfidensinterval for

p

baseret på observationen

x

givet ved

\Bigg[\frac{x+\frac{u^2}{2}-u\sqrt{\frac{x(n-x)}{n}+\frac{u^2}{4}}}{n+u^2}, \, \frac{x+\frac{u^2}{2}+u\sqrt{\frac{x(n-x)}{n}+\frac{u^2}{4}}}{n+u^2} \Bigg],\quad u=1.96.

Hvis værdien af

u

ændres til 1.645 får man i stedet et approksimativt 90%-konfidensinterval.

Eksempel 2.2.3. (Rygerklassifikation ud fra fingeraftryk)

I Eksempel 2.1.3 omkring rygerklassifikation baseret på fingeraftryk har vi

X\sim\text{binom}(33,p)

og en måling

x=27.

I kodevinduet nedenfor udregnes det approksimative 95%-konfidensinterval. Resultatet viser, at med "95% sikkerhed" er den sande værdi af sandsynligheden for korrekt klassifikation et sted mellem 0.66 og 0.91. Hvis sandsynligheden er helt nede på 0.66, giver klassifikationsreglen kun det rigtige svar i 2 ud af 3 tilfælde.

Udtrykket "95% sikkerhed" er blot en omformulering af, at hvis formlen for dette konfidensinterval bruges mange gange, så vil vi i 95% af gangene have, at intervallet indeholder den sande værdi af

p

2.2.4 Beregning i python af konfidensinterval for andel

Den følgende kode kan bruges generelt til beregning af konfidensintervallet for en andel, hvis man selv indskriver det observerede antal (

x

) og antal forsøg (

n

xxxxxxxxxx
 
import numpy as np
​
# data indskrives
x=27
n=33
​
# konfidensinterval beregnes
u=1.96
lower=(x+u**2/2-u*np.sqrt(x*(n-x)/n+u**2/4))/(n+u**2)
upper=(x+u**2/2+u*np.sqrt(x*(n-x)/n+u**2/4))/(n+u**2)
print(format(lower,'.4f'),format(upper,'.4f'))

Det næste kodevindue viser likelihoodfunktionen med konfidensintervallet indtegnet (rødt interval) og intervallet, hvor likelihoodfunktionens værdi er over

L(\hat p)\cdot e^{-1.96^2/2}

(blåt interval). Figuren viser, at de to intervaller er tæt på at være ens.

xxxxxxxxxx
 
import matplotlib.pyplot as plt
import numpy as np
import scipy.stats as st
​
# data indskrives
x=27
n=33
​
# konfidensinterval beregnes
u=1.96
pm=np.array([-1,1])
KI=(x+u**2/2+pm*u*sqrt(x*(n-x)/n+u**2/4))/(n+u**2)
​
# figur med likelihoodfunktion dannes
plt.figure()
p=np.arange(0,1001)/1000
prob=st.binom.pmf(x,n,p)
plt.plot(p,prob,'-')
plt.plot(KI,[0, 0],'r',linewidth=2.5)
afskaering=(st.binom.pmf(x,n,x/n))*exp(-3.84/2)
pOver=p[(prob>=afskaering)]
plt.plot([min(pOver),max(pOver)],[afskaering,afskaering],'b')
plt.show()

Prøv at lege lidt med koden for at få en fornemmelse for bredden af konfidensintervallet. Prøv for eksempel med

x=3

n=10,

og prøv med det samlede resultat af Kipping og Popes 46 deleksperimenter fra afsnit 1.1.

Test dig selv: Konfidensinterval

Quiz

Betragt den statistiske model

X\sim\text{binomial}(n,p)

og et 95%-konfidensinterval

[p_-(x),p_+(x)]

for sandsynlighedsparameteren

p.

Marker de korrekte udsagn.

Jeg er sikker på, at den sande værdi af parameteren ligger i intervallet.

Hver gang jeg gentager eksperimentet, vil jeg få et nyt interval.

Ved uafhængige gentagelser vil intervallet indeholde den sande værdi af parameteren i 95% af tilfældene.

Ved gentagelser er intervallet fast, men jeg får en ny værdi af

p

hver gang.

Konfidensinterval og $p$ -værdi: sammenhæng

I ord er meningen med et konfidensintervallet at angive de værdier af parameteren, der virker rimelige til beskrivelse af data. Denne formulering er tæt på at sige, at intervallet giver de værdier, vi kan acceptere, hvis vi laver et formelt test.

Mere præcist kan man sige, at hvis vi for hver værdi

\theta_0

af parameteren betragter hypotesen

\theta=\theta_0,

og laver et test med tilhørende

p

-værdi

p\text{værdi}(\theta_0,x),

så kan man lave et 95%-konfidensinterval bestående af alle de værdier af

\theta_0,

for hvilke

p\text{værdi}(\theta_0,x)> 0.05.

At dette giver et konfidensinterval følger af resultatet for fejl af type I nævnt i det skjulte punkt Fejl af type 1 og type 2 i afsnit 1.3 (giver at konfidensintervallet indeholder den sande værdi af parameteren med sandsynlighed større end eller lig med 0.95). Omvendt kan man så afgøre, om

p\text{-}

værdien er større end 0.05 ved at se, om parameterværdien ligger i konfidensintervallet.

Man kan dog lave forskellige udgaver af konfidensintervaller og af sine tests. For de fleste situationer vi betragter i denne bog, hører test og konfidensinterval sammen som beskrevet ovenfor. Dog gælder dette ikke fuldstændig for binomialmodellen. Testet i Resultat 1.2.3 er baseret på eksakte sandsynligheder i binomialfordelingen, hvorimod konfidensintervallet 2.2.2 er baseret på en approksimation. I praksis har dette ikke nogen væsentligt betydning.

2.2.2 Konfidensinterval for transformeret parameter

Ovenfor er beskrevet et konfidensinterval for sandsynlighedsparameteren

p

i binomialmodellen. Hvad gør jeg, hvis jeg for eksempel gerne vil sige noget om

p^2

Hvis 95%-konfidensintervallet for

p

betegnes med

[p_-(x),p_+(x)],

virker det naturligt at bruge

[p_-(x)^2,p_+(x)^2].

At dette virker, ses af det simple udsagn

P\big([p_-(X)^2,p_+(X)^2]\ni p^2\big)=P\big([p_-(x),p_+(x)]\ni p\big),

hvor den sidste sandsynlighed er cirke 0.95.

Dette er et generelt princip. Hvis

\theta

er en parameter i en statistisk model og

[\theta_i(X),\theta_+(X)]

er et 95%-konfidensinterval, så vil

[h(\theta_i(X)),h(\theta_+(X))]

være et 95%-konfidensinterval for den transformerede parameter

\varphi=h(\theta)

(for en voksende (eller aftagende) funktion

h

Foregående Næste