Afsnit 4.4: Test og konfidensinterval for middelværdi
Vi ønsker nu at lave et test for, om middelværdien har en bestemt
værdi det vil sige et test for hypotesen inden
for normalfordelingsmodellen 4.3.1.
Intuitivt baseres testet på, om ligger tæt på
eller langt fra, men tæt på eller langt fra skal ses
i lyset af spredningen i fordelingen.
Umiddelbart inddrages spredningen gennem en standardisering
på formen
baseret på at
Da spredningen
ikke kendes, erstattes denne med vores skøn,
den empiriske spredning Dette giver teststørrelsen
Jeg har indført teststørrelsen ud fra et intuitivt argument,
men en beregning viser, at store værdier af er
ækvivalent med små værdier af likelihoodratio teststørrelsen
som er forholdet mellem den maksimale værdi af likelihoodfunktionen
under hypotesen og den maksimale værdi af likelihoodfunktionen
under den model 4.3.1, hvor kan variere frit.
For at kunne bruge teststørrelsen er det nødvendigt at kende fordelingen
af denne. Hertil skal vi bruge følgende definition.
Definition 4.4.1.
(-fordeling)
Betragt uafhængige stokastiske variable
og Så siges
at følge en -fordeling med
frihedsgrader, hvilket vi skriver som
Fordelingsfunktionen i en -fordeling beregnes i
python med kommandoen t.cdf(t,df)
(MATLAB: tcdf(t,df)), som er sandsynligheden
for at ligge til venstre for Fraktiler findes som
t.ppf(p,df) (MATLAB: tinv(p,df)), som er den værdi, hvor
sandsynligheden for at ligge til venstre for værdien er
I kodevinduet nedenfor vises fordelingfunktionen for tre
-fordelinger og for standard normalfordelingen.
Desuden er 97.5%-fraktilen markeret,
det vil sige punktet,
hvor der ligger 97.5% sandsynlighed til venstre for og
2.5% sandsynlighed til højre for. Kan du på forhånd gætte, om
-fraktilerne ligger til højre eller til venstre for den
tilsvarende fraktil i en standard normalfordeling ?
Fraktiler i en fordeling findes i python
med kommandoen t.ppf(p,df) og i MATLAB ed kommandoen
tinv(p,df).
Fraktilen i en -fordeling
findes med kommandoen t.ppf(0.975,1)
(MATLAB: tinv(0.975,1)) og har værdien
12.7.
Resultat 4.4.2.
(-test)
Betragt Statistisk Model 4.3.1 og hypotesen
Under hypotesen er
Hvis alternativet
til hypotesen er , udregner vi -værdien
for testet som
hvor er den observerede værdi af .
Desuden er et 95%-konfidensinterval for middelværdien
givet ved
hvor er 97.5%-fraktilen i en -fordeling,
Konfidensintervallet skrives ofte på kort
form som
For at forstå at følger en -fordeling, skal vi blot skrive
og bruge definitionen på en -fordeling med
og
Fordelingsresultaterne i Resultat 4.3.2 giver nu det ønskede. Benyttes nu at og at -fordelingen er
symmetrisk omkring nul (hvilket følger af, at
standard normalfordelingen er symmetrisk omkring nul), fås
ForegåendeNæste