Afsnit 4.6: Konfidensinterval for varians og spredning
I normalfordelingsmodellen,
lavede vi ovenfor
inferens om middelværdien, og spredningen
var blot en
nødvendig del af metoden. Spredningen kan imidlertid også være af
interesse i sig selv. I en eksperimentel situation fortæller spredningen os
noget om reproducerbarheden af målingen, og dermed hvor mange gange vi må
gentage eksperimentet for at få en ønsket præcision.
I andre sammenhænge afspejler spredningen
en iboende variation over en population, som vi ikke kan kontrollere,
men som har betydning for den process, der studeres (for eksempel
virkningen af et medicinsk præparat).
Jeg vil her give et konfidensinterval for variansen
og for spredningen
Konfidensintervallerne baserer sig på Resultat
4.3.2,
hvoraf det fremgår, at
Jeg betragter her en lidt mere generel situation for at
kunne bruge resultatet i andre modeller.
Jeg minder om, at fraktiler i en
-fordeling
betegnes med
Resultat 4.6.1.
(Konfidensinterval for varians)
Lad
være en stokastisk variabel med tilknyttet antal frihedsgrader
og hvor
Så er et 95%-konfidensinterval for variansen
givet ved
og et 95%-konfidensinterval for spredningen
er givet ved
Det første resultat følger af, at
Det andet resultat følger ud fra en generel observation af, at hvis
er et 95%-konfidensinterval for en
parameter
så er
et 95%-konfidensinterval for den transformerede parameter
hvor
er en voksende funktion. Dette ses af
Eksempel 4.6.2.
(Jordens massetæthed)
Dette er en fortsættelse af Eksempel
4.2.1
og afsnit
4.5 med Cavendish's
23 uafhængige målinger af Jordens massetæthed.
Den empiriske spredning af de 23 målinger er
Ved opslag i tabel (python) ses, at 0.025-fraktilen i en
-fordeling er 10.98, og 0.975-fraktilen er 36.78.
Et 95%-konfidensinterval for spredningen bliver derfor
Vi kan her se, at med 23 observationer kan vi kun
bestemme spredningen op til en faktor to: øvre grænse i
konfidensintervallet er næsten dobbelt så stor som den nedre grænse.
Beregningerne i
python ser ud som følger.
ForegåendeNæste