Afsnit 4.4: Test og konfidensinterval for middelværdi
Vi ønsker nu at lave et test for, om middelværdien har en bestemt
værdi det vil sige et test for hypotesen inden
for normalfordelingsmodellen fra Statistisk Model 4.3.1.
Intuitivt baseres testet på, om ligger tæt på
eller langt fra, men tæt på eller langt fra skal ses
i lyset af spredningen i fordelingen.
Umiddelbart inddrages spredningen gennem en standardisering
på formen
baseret på at
Da spredningen
ikke kendes, erstattes denne med vores skøn,
den empiriske spredning Dette giver teststørrelsen
Jeg har indført teststørrelsen ud fra et intuitivt argument,
men en beregning viser, at store værdier af er
ækvivalent med små værdier af likelihoodratio teststørrelsen
som er forholdet mellem den maksimale værdi af likelihoodfunktionen
under hypotesen og den maksimale værdi af likelihoodfunktionen
under den fulde model 4.3.1.
For at kunne bruge teststørrelsen er det nødvendigt at kende fordelingen
af denne. Hertil skal vi bruge følgende definition.
Definition 4.4.1.
(-fordeling)
Betragt uafhængige stokastiske variable
og Så siges
at følge en -fordeling med
frihedsgrader, hvilket vi skriver som
Fordelingsfunktionen i en -fordeling beregnes i
R med kommandoen pt(t,df), som er sandsynligheden
for at ligge til venstre for
I kodevinduet nedenfor vises fordelingfunktionen for tre
-fordelinger og for standard normalfordelingen.
Desuden er 97.5%-fraktilen markeret,
det vil sige punktet,
hvor der ligger 97.5% sandsynlighed til venstre for og
2.5% sandsynlighed til højre for. Kan du på forhånd gætte, om
-fraktilerne ligger til højre eller til venstre for den
tilsvarende fraktil i en standard normalfordeling ?
Fraktiler i en fordeling findes i R
med kommandoen qt(p,df).
Hvad er 97.5%-fraktilen i en -fordeling, henholdsvis i en
fordeling ?
Fraktilen i en -fordeling
findes med kommandoen qt(0.975,1) og har værdien
12.7.
Resultat 4.4.2.
(-test)
Betragt Statistisk Model 4.3.1 og hypotesen
Under hypotesen er
Hvis alternativet
til hypotesen er udregner vi -værdien
for testet som
hvor er den observerede værdi af .
Desuden er et 95%-konfidensinterval for middelværdien
givet ved
hvor er 97.5%-fraktilen i en -fordeling,
Konfidensintervallet skrives ofte på kort
form som
For at forstå at følger en -fordeling, skal vi blot skrive
og bruge definitionen på en -fordeling med
og
Fordelingsresultaterne i Resultat 4.3.2 giver nu det ønskede. Benyttes nu at og at -fordelingen er
symmetrisk omkring nul (hvilket følger af, at
standard normalfordelingen er symmetrisk omkring nul), fås
ForegåendeNæste