Afsnit 1.1: Mendels ærter og p-værdi

Udover at fungere som lærer og abbed studerede Gregor Mendel, hvordan egenskaber nedarves i ærteplanter. Ud fra sine eksperimenter formulerede han arvelighedslove, og man kan sige, at de numeriske resultater overbeviste Mendel om korrektheden i lovene. Udfaldet af et krydsningseksperiment er af natur stokastisk, men arvelighedslovene siger noget om, hvordan det stokastiske element er, og det er dette, vi kan efterprøve ved et eksperiment. I et af sine eksperimenter så Mendel på farven af den umodne ærtebælg, som enten kan være gul eller grøn.
Sådan som eksperimentet var udformet, mente Mendel, at han skulle se en 1:3 udspaltning i gule og grønne. Baseret på 580 planter fik Mendel:
En 1:3 udspaltning betyder, at vi forventer, at vil være gule. Her kommer stokastikken ind. Typisk får man ikke lige præcis 145, men noget der ligger omkring 145. Gentages eksperimentet med 580 nye planter, får vi en ny stokastisk værdi i stedet for de 152 i Mendels eksperiment. Vi kan derfor ikke sige, at udfaldet af Mendels eksperiment "beviser" Mendels arvelighedslov, men må formulere os lidt mere forsigtigt i retning af at sige, at de 152 gule enten strider eller ikke strider mod arvelighedsloven. Hvor skal man lægge grænsen? Intuitivt må det være sådan, at jo længere væk antallet af gule ligger fra det forventede 145, jo mindre tiltro har vi til loven.
For at vurdere om 152 gule bælge ud af ialt 580 planter er typisk eller usædvanligt, kan vi efterligne stokastikken ved at kaste en firesidet terning 580 gange og lade side 1 repræsentere gul. I stedet for at kaste en fysisk terning vil jeg bruge R til at simulere typiske udfald af et eksperiment med 580 planter, og hvor sandsynligheden for gul ærtebælg er En introduktion til R følger senere i næste afsnit. Her følger, hvad jeg kalder et kodevindue med kode i R. Når du trykker på compute-knappen, sendes koden til en ekstern server, der foretager beregningen og sender svaret tilbage.
Den viste kommando trækker 580 gange enten 0 eller 1, hvor sandsynlighederne for de to muligheder er 0.75 og 0.25. Derefter tælles der op, hvor mange gange vi fik 1 (hvor 1 tolkes som gul ærtebælg). Prøv at køre kommandoen nogle gange for at se variationen i resultatet. Overvej, om du ofte får noget, der afviger mere fra det forventede 145 end Mendels observation på 152. Synes du, at dine simulationer peger på, at observationen 152 er tæt på 145?
Hvis I gentager kommandoen ovenfor mange gange, vil I finde, at cirka 53 procent af gangene får I en værdi, hvor afvigelsen fra 145 er 7 eller derover, hvor 7 netop er afvigelsen mellem Mendels 152 og det forventede på 145. Vi får altså meget ofte noget, der afviger mere end Mendels 152 gule bælge, hvorfor vi konkluderer, at en observation på 152 stemmer godt overens med det forventede.
Lad os uddrage et princip af gennemgangen af Mendels ærteeksperiment. Vi ønsker at vurdere holdbarheden af en hypotese omkring den stokastiske mekanisme, der frembringer data. I Mendels eksperiment er hypotesen, at sandsynligheden for at få en gul bælg er Mendels hypotese vurderes ved at se på afstanden mellem det observerede 152 og det forventede 145. Denne afstand kalder vi en teststørrelse.
Definition 1.1.1. (-værdi)
De mulige udfald af et eksperiment rangordnes på en skala, således at vi kan tale om, at en observation er mere kritisk end en anden observation For en given observation kan vi finde alle de mulige udfald, der er lige så kritiske eller mere kritiske, og beregne sandsynligheden for disse under antagelsen om, at hypotesen er sand. Denne sandsynlighed kaldes -værdien for test af hypotesen. Rangordningen sker typisk gennem en teststørrelse således at "mere kritisk" betyder en større værdi af teststørrelsen.
ForegåendeNæste