Nogle gange vil man i medierne høre udtrykket
"statistisk signifikant". Det kan for eksempel være et udsagn
om, at "det er statistisk signifikant, at vælgertilslutningen til
parti NN er mindre end ved det seneste valg".
Kort fortalt betyder dette, at hvis man forestiller sig, at der
ikke er sket en ændring i vælgertilslutningen, så er resultatet,
af den måling man har lavet (for eksempel en Gallupundersøgelse),
meget usædvanligt. Vi benytter således begrænset viden fra en del
af en population til at slutte noget om forholdene i hele
populationen. Typisk vil man ikke ud fra en delmængde kunne
sige noget med sikkerhed om hele populationen, og i et
dagligdags sprog må man nøjes med udsagn som: "data tyder på
at
". Brugen af
Statistiske metoder går ud på at
kvantificere denne usikkerhed i vores konklusioner.
Den forståelsesramme, man bruger i en statistisk analyse, er, at data
er styret af en tilfældighedsmekanisme. I tilfældet med
vælgertilslutningen kan dette være, at et antal personer
udtrækkes tilfældigt fra hele populationen af vælgere. En
statistisk model går ud på at beskrive de
tilfældighedsmekanismer, der frembringer data.
Modellen vil indeholde parametre, hvis værdi er ukendt, og vi
ønsker ud fra data at slutte tilbage til værdien af
parametrene. Udtrykket
statistisk signifikant optræder,
når der formuleres en hypotese om en parameter, og man finder, at
data strider mod denne. For eksemplet med vælgertilslutningen
er hypotesen, at der
ikke er sket en ændring fra valget
til tidspunkt for undersøgelsen.
I dette første kapitel indfører jeg den metode, der ligger
bag udtrykket statistisk signifikant. Gennem et eksempel indføres begrebet
-værdi. En
-værdi er en sandsynlighed, og når
-værdien er lille, har vi ringe tiltro til hypotesen, hvorimod
hvis
-værdien er stor, så understøtter data hypotesen.
Metodedelen af kapitel 1 præsenteres i afsnit
1.1
og i afsnit
1.3 med udgangspunkt i et
krystaliseringseksperiment af Kipping og Pope.
Den generelle metode gøres konkret for binomialmodellen i
1.2 og
1.4.
Det sidste afsnit
1.5 er teknisk, hvor nogle
sandsynlighedsteoretiske begreber nævnes, som I også har set i
jeres calculuskursus. En kort introduktion til
python
kan findes i afnit
1.6.
ForegåendeNæste