Afsnit 1.4: Statistisk beslutningsregel

Jeg har nu indført -værdien i et statistisk test af en hypotese. -værdien måler sandsynligheden for at få en observation ved gentagelse af eksperimentet, der afviger mere fra det forventede end den oprindelige observation.

Test dig selv: $p$-værdi

Quiz
Vælg de udsagn nedenfor du synes er mest korrekte.
Hvis -værdien er over 50%, accepterer jeg hypotesen, og hvis den er under 50%, forkaster jeg hypotesen.
Hvis -værdien er over 5%, forkaster jeg hypotesen, og hvis den er under 5%, accepterer jeg hypotesen.
Hvis -værdien for en observation er større end -værdien for en observation har jeg mest tiltro til hypotesen ved observationen
Hvis -værdien er over 5%, accepterer jeg hypotesen, og hvis den er under 5%, forkaster jeg hypotesen.

Hvis -værdien for en observation er stor, betyder dette, at det er nemt at få noget, der afviger mere fra det forventede end observationen Dette betyder, at ligger tæt på det forventede, og vi siger, at data ikke strider mod hypotesen. Omvendt, hvis -værdien er lille, betyder dette, at observationen ligger langt fra det forventede, og vi siger, at data strider mod hypotesen. Spørgsmålet er, hvor man skal lægge grænsen? Der er ikke noget "korrekt" svar på dette. I dette kursus bruges en grænse på 0.05 (5 procent). Dette er en grænse, der bruges meget ofte, men der kan også være situationer, hvor man vil benytte en lavere grænse. Hvis, for eksempel, man tester en ny medicin, så vil man gerne være meget sikker på, at den nye medicin virker bedre, inden man skifter over til denne. Generelt kan man sige, at det er vigtigere at angive -værdien end blot at angive, om denne er over eller under 0.05.
Her er en generel formulering af 5%-reglen.
Resultat 1.4.1. (Statistiske beslutningsregel)
Hvis -værdien for et test er mindre end 0.05, siger vi, at data strider mod hypotesen, eller at vi forkaster hypotesen. Omvendt, hvis -værdien for et test er større end 0.05, siger vi, at data ikke strider mod hypotesen, eller at vi accepterer hypotesen.
Man vil også ofte se sprogbrugen, at hvis man har lavet et test og fået en -værdi mindre en 0.05, siger man, at den egenskab man tester for er signifikant.

Fejl af type 1 og type 2

Når vi laver et formelt test, hvor vi enten accepterer eller forkaster hypotesen, kan der optræde to forskellige slags fejl. Hvis hypotesen er sand, og vi ud fra data forkaster hypotesen, taler man om en fejl af type I. Omvendt, hvis hypotesen er falsk, men vi ender med at acceptere hypotesen, taler man om en fejl af type II. For et test, hvor vi forkaster, hvis -værdien er mindre end ellerlig med 0.05, gælder der
Hvis den teststørrelse, der bruges i testet, kan antage alle mulige værdier (ikke blot heltallige værdier), vil der gælde lighedstegn i ovenstående udsagn.

ForegåendeNæste