Afsnit 1.1: Kipping og Popes krystaller og p-værdi

Louis Pasteur, opfinderen af pasteurisering i 1862, påviste i 1848, at krystaller af tartarsyre kan optræde i to former (D for dextrorotatory og L for levorotatory), der bøjer polariseret lys i forskellige vinkler. Han fandt også at for tartarsyre lavet ved en kemisk syntese, optræder de to former i lige store mængder (racemic mixture).
Dette var den første påvisning af chiralitet af molekyler (på Aarhus Universitet arbejder blandt andet Karl Anker Jørgensen med chiralitet af molekyler). Hvad betyder det, når vi siger, at de to former optræder i lige store mængder? Det er rimeligt at tænke på dette som en stokastisk proces, hvor der er lige stor sandsynlighed for, at der dannes en D-form som en L-form. Der er ikke data i Pasteurs oprindelige artikel der kan bruges til at studere dette, men Kipping and Pope lavede i 1898 en optælling af D- og L-krystaller der dannes ved at en vandig opløsning af natriumklorat () stilles til fordampning. Natriumkloratmolekylet er ikke i sig selv enantiomorft, men krystallerne der dannes er. Kipping og Popes eksperiment bestod af i alt 46 deleksperimenter, hvor der dannedes mellem 26 og 133 krystaller, og hvor procentdelen af D-krystaller svingede mellem 24 og 77 procent. Lad os her betragte et af de 46 deleksperimenter, hvor resultatet var
En lige stor sandsynlighed for D- som L-krystaller betyder, at vi forventer, at vil være D-krystaller. Her kommer stokastikken ind. Typisk får man ikke lige præcis 17, men noget der ligger omkring 17. Gentages eksperimentet, og hvis der igen dannes 34 krystaller, får vi en ny stokastisk værdi i stedet for de 13 i Kipping og Popes eksperiment. Vi kan derfor ikke sige, at udfaldet af Kipping og Popes eksperiment "beviser" at de to former optræder lige ofte, men må formulere os lidt mere forsigtigt i retning af at sige, at de 13 D-krystaller enten strider eller ikke strider mod den formulerede lovmæssighed. Hvor skal man lægge grænsen? Intuitivt må det være sådan, at jo længere væk antallet af D-krystaller ligger fra det forventede 17, jo mindre tiltro har vi til loven.
For at vurdere om 13 D-krytaller ud af ialt 34 krystaller er typisk eller usædvanligt, kan vi efterligne stokastikken ved at kaste en mønt 34 gange og lade krone repræsentere D-krystal. I stedet for at kaste en fysisk mønt vil jeg bruge python til at simulere typiske udfald af et eksperiment med 34 krystaller, og hvor sandsynligheden for D-krystal er Her følger, hvad jeg kalder et kodevindue med kode i python. Når du trykker på compute-knappen, sendes koden til en ekstern server, der foretager beregningen og sender svaret tilbage.
Den viste kommando trækker 34 gange enten 0 eller 1, hvor sandsynlighederne for de to muligheder er 0.5 og 0.5. Derefter tælles der op, hvor mange gange vi fik 1 (hvor 1 tolkes som D-krystal). Prøv at køre kommandoen nogle gange for at se variationen i resultatet. Overvej, om du ofte får noget, der afviger mere fra det forventede 17 end Kipping og Popes observation på 13. Synes du, at dine simulationer peger på, at observationen 13 er tæt på 17?
Hvis I gentager kommandoen ovenfor mange gange, vil I finde, at cirka 23 procent af gangene får I en værdi, hvor afvigelsen fra 17 er 4 eller derover, hvor 4 netop er afvigelsen mellem Kipping og Popes 13 og det forventede på 17. Vi får altså meget ofte noget, der afviger mere end Kipping og Popes 13 D-krystaller, hvorfor vi konkluderer, at en observation på 13 stemmer godt overens med det forventede.
Lad os uddrage et princip af gennemgangen af Kipping og Popes eksperiment med natriumkloratkrystaller. Vi ønsker at vurdere holdbarheden af en hypotese omkring den stokastiske mekanisme, der frembringer data. I Kipping og Popes eksperiment er hypotesen, at sandsynligheden for at få en D-krystal er Kipping og Popes hypotese vurderes ved at se på afstanden mellem det observerede 13 og det forventede 17. Denne afstand kalder vi en teststørrelse.
Definition 1.1.1. (-værdi)
De mulige udfald af et eksperiment rangordnes på en skala, således at vi kan tale om, at en observation er mere kritisk end en anden observation For en given observation kan vi finde alle de mulige udfald, der er lige så kritiske eller mere kritiske, og beregne sandsynligheden for disse under antagelsen om, at hypotesen er sand. Denne sandsynlighed kaldes -værdien for test af hypotesen. Rangordningen sker typisk gennem en teststørrelse således at "mere kritisk" betyder en større værdi af teststørrelsen.
Når man samler resultaterne fra Kipping og Popes 46 deleksperimenter, får man, at der er dannet 1571 D-krystaller ud af i alt 3137 krystaller. Synes du, at det samlede resulatet tyder på, at D- og L-krystaller optræder lige ofte?

Svar: Kipping og Pope

Man kan bruge kodevinduet ovenfor og erstatte 34 med 3137. Ved at køre koden nogle gange vil man se, at i langt de fleste tilfælde vil man få udfald, der afviger mere fra end det faktisk observerede antal på 1571 D-krystaller. Data strider derfor ikke mod hypotesen om, at de to former optræder lige ofte.

ForegåendeNæste