Nogle gange vil man i medierne høre udtrykket "statistisk signifikant". Det kan for eksempel være et udsagn om, at "det er statistisk signifikant, at vælgertilslutningen til parti NN er mindre end ved det seneste valg". Kort fortalt betyder dette, at hvis man forestiller sig, at der ikke er sket en ændring i vælgertilslutningen, så er resultatet, af den måling man har lavet (for eksempel en Gallupundersøgelse), meget usædvanligt. Vi benytter således begrænset viden fra en del af en population til at slutte noget om forholdene i hele populationen. Typisk vil man ikke ud fra en delmængde kunne sige noget med sikkerhed om hele populationen, og i et dagligdags sprog må man nøjes med udsagn som: "data tyder på at

\ldots\,\,

". Brugen af Statistiske metoder går ud på at kvantificere denne usikkerhed i vores konklusioner.

Den forståelsesramme, man bruger i en statistisk analyse, er, at data er styret af en tilfældighedsmekanisme. I tilfældet med vælgertilslutningen kan dette være, at et antal personer udtrækkes tilfældigt fra hele populationen af vælgere. En statistisk model går ud på at beskrive de tilfældighedsmekanismer, der frembringer data. Modellen vil indeholde parametre, hvis værdi er ukendt, og vi ønsker ud fra data at slutte tilbage til værdien af parametrene. Udtrykket statistisk signifikant optræder, når der formuleres en hypotese om en parameter, og man finder, at data strider mod denne. For eksemplet med vælgertilslutningen er hypotesen, at der ikke er sket en ændring fra valget til tidspunkt for undersøgelsen. I dette første kapitel indfører jeg den metode, der ligger bag udtrykket statistisk signifikant. Gennem et eksempel indføres begrebet $p$ -værdi. En

p

-værdi er en sandsynlighed, og når

p

-værdien er lille, har vi ringe tiltro til hypotesen, hvorimod hvis

p

-værdien er stor, så understøtter data hypotesen.

Metodedelen af kapitel 1 præsenteres i afsnit 1.1 og i afsnit 1.3 med udgangspunkt i et krystaliseringseksperiment af Kipping og Pope. Den generelle metode gøres konkret for binomialmodellen i 1.2 og 1.4. Det sidste afsnit 1.5 er teknisk, hvor nogle sandsynlighedsteoretiske begreber nævnes, som I også har set i jeres calculuskursus. En kort introduktion til python kan findes i afnit 1.6.

Foregående Næste

Kapitel 1: Statistisk signifikant - p-værdi