Afsnit 1.1: Kipping og Popes krystaller og p-værdi
Louis Pasteur, opfinderen af pasteurisering i 1862, påviste i 1848,
at krystaller af tartarsyre kan optræde i to former
(D for dextrorotatory og L for levorotatory), der bøjer polariseret lys
i forskellige vinkler. Han fandt også at for tartarsyre lavet ved en
kemisk syntese, optræder de to former i lige store mængder
(racemic mixture).
Dette var den første påvisning af
chiralitet
af molekyler
(på Aarhus Universitet arbejder blandt andet
Karl Anker Jørgensen
med chiralitet af molekyler). Hvad betyder det, når vi siger, at de to former
optræder i lige store mængder ? Det er rimeligt at tænke på dette som en
stokastisk proces, hvor der er lige stor sandsynlighed for, at der dannes en
D-form som en L-form. Der er ikke data i Pasteurs oprindelige artikel
der kan bruges til at studere dette, men
Kipping and Pope
lavede i 1898 en optælling af D- og L-krystaller der dannes ved at en
vandig opløsning af natriumklorat () stilles til
fordampning. Natriumkloratmolekylet er ikke i sig selv enantiomorft, men
krystallerne der dannes er. Kipping og Popes eksperiment bestod af i alt 46
deleksperimenter, hvor der dannedes mellem 26 og 133 krystaller, og
hvor procentdelen af D-krystaller svingede mellem 24 og 77 procent.
Lad os her betragte et af de 46 deleksperimenter, hvor resultatet var
En lige stor sandsynlighed for D- som L-krystaller betyder, at vi forventer, at
vil være D-krystaller. Her kommer stokastikken ind.
Typisk får man ikke lige præcis 17, men noget der ligger omkring
17. Gentages eksperimentet, og hvis der igen dannes 34 krystaller,
får vi en ny stokastisk værdi i stedet for de 13 i Kipping og Popes eksperiment.
Vi kan derfor ikke sige, at udfaldet af Kipping og Popes eksperiment "beviser"
at de to former optræder lige ofte, men må formulere os lidt mere forsigtigt i
retning af at sige, at de 13 D-krystaller enten strider eller
ikke strider mod den formulerede lovmæssighed. Hvor skal man lægge
grænsen ?
Intuitivt må det være sådan, at jo længere væk antallet af D-krystaller ligger fra
det forventede 17, jo mindre tiltro har vi til loven.For at vurdere om 13 D-krytaller ud af ialt 34 krystaller er typisk
eller usædvanligt, kan vi efterligne stokastikken ved at kaste
en mønt
34 gange og lade krone repræsentere D-krystal.
I stedet for at kaste en fysisk mønt vil jeg bruge python
til at simulere typiske udfald af et
eksperiment med 34 krystaller, og hvor sandsynligheden for D-krystal er
Her følger, hvad jeg kalder et
kodevindue med kode i python. Når du trykker på
compute-knappen, sendes koden til en ekstern server, der
foretager beregningen og sender svaret tilbage.
Den viste kommando trækker 34 gange enten 0 eller 1, hvor
sandsynlighederne for de to muligheder er 0.5 og 0.5. Derefter
tælles der op, hvor mange gange vi fik 1 (hvor 1 tolkes som D-krystal).
Prøv at køre kommandoen nogle gange for at se variationen i
resultatet. Overvej, om du ofte får noget, der afviger mere fra det
forventede 17 end Kipping og Popes observation på 13. Synes du, at dine
simulationer peger på, at observationen 13 er tæt på 17 ?Hvis I gentager kommandoen ovenfor mange gange, vil I finde, at cirka
23 procent af gangene får I en værdi, hvor afvigelsen fra 17
er 4 eller derover, hvor 4 netop er afvigelsen mellem Kipping og Popes 13 og
det forventede på 17. Vi får altså meget ofte noget, der afviger mere end
Kipping og Popes 13 D-krystaller, hvorfor vi konkluderer, at en observation
på 13 stemmer godt overens med det forventede.Lad os uddrage et princip af gennemgangen af Kipping og Popes eksperiment med
natriumkloratkrystaller.
Vi ønsker at vurdere holdbarheden af en hypotese omkring den
stokastiske mekanisme, der frembringer data. I Kipping og Popes eksperiment er
hypotesen, at sandsynligheden for at få en D-krystal er
Kipping og Popes hypotese vurderes ved at se på
afstanden mellem det observerede 13 og det forventede 17.
Denne afstand kalder vi en teststørrelse.
Definition 1.1.1.
(-værdi)
De mulige udfald af et eksperiment rangordnes på en
skala, således at vi kan tale om, at en observation er mere kritisk end
en anden observation For en given observation kan vi finde
alle de mulige udfald, der er lige så kritiske eller mere kritiske,
og beregne sandsynligheden for disse under antagelsen om, at hypotesen
er sand. Denne sandsynlighed kaldes -værdien
for test af hypotesen. Rangordningen sker typisk gennem en
teststørrelse således at "mere kritisk" betyder en større
værdi af teststørrelsen.
Når man samler resultaterne fra Kipping og Popes 46 deleksperimenter, får man,
at der er dannet 1571 D-krystaller ud af i alt 3137 krystaller.
Synes du, at det samlede resulatet tyder på, at D- og L-krystaller optræder
lige ofte ?
Man kan bruge kodevinduet ovenfor og erstatte 34 med 3137. Ved at køre
koden nogle gange vil man se, at i langt de fleste tilfælde vil man få
udfald, der afviger mere fra end det
faktisk observerede antal på 1571 D-krystaller. Data strider derfor ikke
mod hypotesen om, at de to former optræder lige ofte.