Jeg har nu indført -værdien i et statistisk test af en hypotese.
-værdien måler sandsynligheden for at få en observation ved
gentagelse af eksperimentet, der afviger mere fra det forventede
end den oprindelige observation. Nogle af jer skal nok lige vænne jer til,
at i statistikfaget hedder det "et test" for det teksniske begreb
at stille en hypotese op, lave en teststørrelse og beregne en -værdi.
Vælg de udsagn nedenfor du synes er mest korrekte.
Hvis -værdien er over 50%, accepterer jeg hypotesen, og
hvis den er under 50%, forkaster jeg hypotesen.
Hvis -værdien er over 5%, forkaster jeg hypotesen, og
hvis den er under 5%, accepterer jeg hypotesen.
Hvis -værdien for en observation er større end
-værdien for en observation har jeg mest
tiltro til hypotesen ved observationen
Hvis -værdien er over 5%, accepterer jeg hypotesen, og
hvis den er under 5%, forkaster jeg hypotesen.
Hvis -værdien for en observation er stor, betyder dette,
at det er nemt at få noget, der afviger mere fra det forventede
end observationen Dette betyder, at ligger tæt på det
forventede, og vi siger, at data ikke strider mod hypotesen. Omvendt,
hvis -værdien er lille, betyder dette,
at observationen ligger langt fra det
forventede, og vi siger, at data strider mod hypotesen. Spørgsmålet
er, hvor man skal lægge grænsen ?
Der er ikke noget "korrekt" svar på dette.
I dette kursus bruges en grænse på 0.05 (5 procent). Dette er en
grænse, der bruges meget ofte, men der kan også være situationer,
hvor man vil benytte en lavere grænse. Hvis, for eksempel, man tester
en ny medicin, så vil man gerne være meget sikker på, at den nye
medicin virker bedre, inden man skifter over til denne.
Generelt kan man sige, at det er vigtigere at angive -værdien end
blot at angive, om denne er over eller under 0.05.Her er en generel formulering af 5%-reglen.
Resultat 1.3.1.
(Statistiske beslutningsregel)
Hvis -værdien for et test er mindre end eller lig med
0.05 (signifikansniveauet), siger vi, at data
strider mod hypotesen, eller at vi
forkaster hypotesen. Omvendt, hvis
-værdien for et test er større end
0.05, siger vi, at data ikke strider mod hypotesen, eller at vi
accepterer hypotesen.
Man vil også ofte se sprogbrugen, at hvis man har lavet et test og
fået en -værdi mindre en 0.05, siger man, at den egenskab man tester for
er signifikant.
1.3.1 Type I og II fejl og styrke
Et statistisk test kan formelt beskrives som en procedure, der ud fra data
enten accepterer eller forkaster en hypotese. Dette giver anledning
til to typer fejl. Type I fejl er når vi forkaster en
sand hypotese, og type II fejl er når vi accepterer en falsk hypotese.
På skemaform er det som følger,
For et test, hvor vi forkaster, hvis -værdien er
mindre end eller lig med 0.05, gælder der
Hvis den teststørrelse, der bruges i testet, kan antage alle mulige værdier
(ikke blot heltallige værdier), vil der gælde lighedstegn i ovenstående udsagn.Hvis hypotesen vi tester ikke er sand, vil vi gerne opdage dette med
vores test. Man taler ofte om styrken af et test, som er
sandsynligheden for at forkaste hypotesen beregnet under et alternativ
til hypotesen (dette er også 1 minus sandynligheden for fejl af type II).
Styrken afhænger af den alternative værdi af parameteren og vises
ofte som en kurve. For test af andel i binomialmodellen,
hvor vi tester , er styrken sandsynligheden for at
få et udfald, hvor den tilhørende -værdi er mindre end eller
lig med 0.05, udregnet når den sande værdi af er forskellig fra
. I kodevinduet nedenfor beregnes styrken for test i binomialmodellen
beskrevet i resultat 1.2.3.
Styrken vises som funktion af alternativet for fast værdi af
antalsværdien . Bemærk, at styrken er cirka 0.05, når er lig med
, hvor styrken er sandsynligheden for fejl af type I.
Leg med koden og værdien af således at styrken for at teste
er mindst 0.80, når den sande værdi af er 0.75.
ForegåendeNæste