Afsnit 1.1: Mendels ærter og p-værdi
Udover at fungere som lærer og abbed studerede
Gregor Mendel,
hvordan egenskaber nedarves i ærteplanter. Ud fra sine eksperimenter
formulerede han arvelighedslove, og man kan sige, at de numeriske resultater
overbeviste Mendel om korrektheden i lovene. Udfaldet af et
krydsningseksperiment er af natur stokastisk, men arvelighedslovene siger
noget om, hvordan det stokastiske element er, og det er dette, vi kan
efterprøve ved et eksperiment. I et af sine eksperimenter
så Mendel på farven af den umodne ærtebælg, som enten kan være
gul eller grøn.
Sådan som eksperimentet var udformet, mente Mendel,
at han skulle se en 1:3 udspaltning i gule og grønne. Baseret på
580 planter fik Mendel:
En 1:3 udspaltning betyder, at vi forventer, at
vil være gule. Her kommer stokastikken ind.
Typisk får man ikke lige præcis 145, men noget der ligger omkring
145. Gentages eksperimentet med 580 nye planter, får vi en
ny stokastisk værdi i stedet for de 152 i Mendels eksperiment.
Vi kan derfor ikke sige, at udfaldet af Mendels eksperiment "beviser"
Mendels arvelighedslov, men må formulere os lidt mere forsigtigt i
retning af at sige, at de 152 gule enten
strider eller
ikke strider mod arvelighedsloven. Hvor skal man lægge
grænsen
 ?
Intuitivt må det være sådan, at jo længere væk antallet af gule ligger fra
det forventede 145, jo mindre tiltro har vi til loven.
For at vurdere om 152 gule bælge ud af ialt 580 planter er typisk
eller usædvanligt, kan vi efterligne stokastikken ved at kaste
en
firesidet terning
580 gange og lade side 1 repræsentere gul.
I stedet for at kaste en fysisk terning vil jeg bruge
R
til at simulere typiske udfald af et
eksperiment med 580 planter, og hvor sandsynligheden for gul ærtebælg er
En introduktion til
R følger senere i
næste afsnit. Her følger, hvad jeg kalder et
kodevindue med kode i
R. Når du trykker på
compute-knappen, sendes koden til en ekstern server, der
foretager beregningen og sender svaret tilbage.
Den viste kommando trækker 580 gange enten 0 eller 1, hvor
sandsynlighederne for de to muligheder er 0.75 og 0.25. Derefter
tælles der op, hvor mange gange vi fik 1 (hvor 1 tolkes som gul ærtebælg).
Prøv at køre kommandoen nogle gange for at se variationen i
resultatet. Overvej, om du ofte får noget, der afviger mere fra det
forventede 145 end Mendels observation på 152. Synes du, at dine
simulationer peger på, at observationen 152 er tæt på 145
 ?
Hvis I gentager kommandoen ovenfor mange gange, vil I finde, at cirka
53 procent af gangene får I en værdi, hvor afvigelsen fra 145
er 7 eller derover, hvor 7 netop er afvigelsen mellem Mendels 152 og
det forventede på 145. Vi får altså meget ofte noget, der afviger mere end
Mendels 152 gule bælge, hvorfor vi konkluderer, at en observation
på 152 stemmer godt overens med det forventede.
Lad os uddrage et princip af gennemgangen af Mendels ærteeksperiment.
Vi ønsker at vurdere holdbarheden af en
hypotese omkring den
stokastiske mekanisme, der frembringer data. I Mendels eksperiment er
hypotesen, at sandsynligheden for at få en gul bælg er
Mendels hypotese vurderes ved at se på
afstanden mellem det observerede 152 og det forventede 145.
Denne afstand kalder vi en
teststørrelse.
Definition 1.1.1.
(-værdi)
De mulige udfald af et eksperiment rangordnes på en
skala, således at vi kan tale om, at en observation er mere kritisk end
en anden observation For en given observation kan vi finde
alle de mulige udfald, der er lige så kritiske eller mere kritiske,
og beregne sandsynligheden for disse under antagelsen om, at hypotesen
er sand. Denne sandsynlighed kaldes -værdien
for test af hypotesen. Rangordningen sker typisk gennem en
teststørrelse således at "mere kritisk" betyder en større
værdi af teststørrelsen.
ForegåendeNæste