Afsnit 4.4: Test og konfidensinterval for middelværdi

Vi ønsker nu at lave et test for, om middelværdien har en bestemt værdi det vil sige et test for hypotesen inden for normalfordelingsmodellen fra Statistisk Model 4.3.1. Intuitivt baseres testet på, om ligger tæt på eller langt fra, men tæt på eller langt fra skal ses i lyset af spredningen i fordelingen. Umiddelbart inddrages spredningen gennem en standardisering på formen baseret på at Da spredningen ikke kendes, erstattes denne med vores skøn, den empiriske spredning Dette giver teststørrelsen
Jeg har indført teststørrelsen ud fra et intuitivt argument, men en beregning viser, at store værdier af er ækvivalent med små værdier af likelihoodratio teststørrelsen som er forholdet mellem den maksimale værdi af likelihoodfunktionen under hypotesen og den maksimale værdi af likelihoodfunktionen under den fulde model 4.3.1. For at kunne bruge teststørrelsen er det nødvendigt at kende fordelingen af denne. Hertil skal vi bruge følgende definition.
Definition 4.4.1. (-fordeling)
Betragt uafhængige stokastiske variable og Så siges at følge en -fordeling med frihedsgrader, hvilket vi skriver som Fordelingsfunktionen i en -fordeling beregnes i R med kommandoen pt(t,df), som er sandsynligheden for at ligge til venstre for

Vise $t$-fordeling i R

I kodevinduet nedenfor vises fordelingfunktionen for tre -fordelinger og for standard normalfordelingen. Desuden er 97.5%-fraktilen markeret, det vil sige punktet, hvor der ligger 97.5% sandsynlighed til venstre for og 2.5% sandsynlighed til højre for. Kan du på forhånd gætte, om -fraktilerne ligger til højre eller til venstre for den tilsvarende fraktil i en standard normalfordeling? Fraktiler i en fordeling findes i R med kommandoen qt(p,df).
  1. Hvad er 97.5%-fraktilen i en -fordeling, henholdsvis i en fordeling?

Svar: T-fraktiler

  1. Fraktilen i en -fordeling findes med kommandoen qt(0.975,1) og har værdien 12.7.

Resultat 4.4.2. (-test)
Betragt Statistisk Model 4.3.1 og hypotesen Under hypotesen er Hvis alternativet til hypotesen er udregner vi -værdien for testet som
hvor er den observerede værdi af . Desuden er et 95%-konfidensinterval for middelværdien givet ved
hvor er 97.5%-fraktilen i en -fordeling, Konfidensintervallet skrives ofte på kort form som
For at forstå at følger en -fordeling, skal vi blot skrive
og bruge definitionen på en -fordeling med og Fordelingsresultaterne i Resultat 4.3.2 giver nu det ønskede.
Benyttes nu at og at -fordelingen er symmetrisk omkring nul (hvilket følger af, at standard normalfordelingen er symmetrisk omkring nul), fås
ForegåendeNæste