I afsnit 4.5 omkring
Jordens massetæthed blev -testet for hypotese om middelværdien
lavet ved at bruge python som en lommeregner.
Testet, og det tilhørende konfidensinterval, kan laves
direkte i python ved brug af funktionen ttest.
Funktionen ligger i pytFunktioner.py,
der er omtalt under punktet Egne funktioner i python i
afsnit 1.6. (Python har en indbygget
funktion ttest1samp, der kan lave
-testet, men denne funktion beregner ikke konfidensintervallet.)
Et kald til ttest er på formen
hvor er en vektor med data, mu er den værdi af middelværdien vi
ønsker at teste, og resultatet af testet placeres i tUD.
Hvis mu ikke specificeres i kaldet, laves der et test for,
at middelværdien er nul. De forskellige dele af output er som følger:
Nedre og øvre grænse er for et 95%-konfidensinterval.
I det næste skjulte punkt gentages beregningen af -testet
for Cavendish's målinger af Jordens massetæthed. Kør koden
og sammenlign med de beregnede værdier i afsnit 4.5.
Vi aflæser i output -teststørrelsen til -0.844 og -værdien til
0.408. Konfidensintervallet aflæses til
Eksempel 4.7.2.
(Sammenligne to måleinstrumenter)
I starten af dette kapitel omtalte jeg en
sammenligning af to måleinstrumenter fra Roche
til måling af mængden af luteotropichormone (LH) i en prøve.
Jeg viste der et histogram af 72 målinger, hvor hver måling er
differens mellem den målte værdi på de to instrumenter for
den samme prøve. De 72 målinger er fremkommet ved at analysere
36 prøver med et indhold omkring 65 mIU/mL og 36 prøver med
et indhold omkring 19 mIU/mL. Hvis man laver et plot af differenserne
afsat mod gennemsnit af målingerne for de to instrumenter
(Bland–Altman plot)
vil man tydeligt se, at der er større spredning på differensen
for prøverne med et indhold omkring 65 end for prøverne med et indhold
omkring 19. Hvis man i stedet betragter logaritmen til
mængden af LH, vil et tilsvarende plot ikke vise en forskel i
spredningerne. I kodevinduet nedenfor er indskrevet de 72 forskelle mellem logaritmen
til LH målt på de to instrumenter.
Det er naturligt at undersøge hypotesen, at middelværdien
af differenserne er nul, svarende til at der ikke er systematisk
forskel mellem de to instrumenter. Spredningen i målingerne er også
interessant som udtryk for måleusikkerheden i den type måling, der
betragtes (spredning på differens er gange måleusikkerheden
på en enkeltmåling). Lad være differensen af log-værdierne
for den 'te prøve.
Vi benytter modellen
Middelværdien repræsenterer her den
systematiske forskel der er mellem de to instrumenter.
I kodevinduet nedenfor laves først et qqplot af data, og derefter
undersøges hypotesen
mod alternativet at
Output giver også automatisk et konfidensinterval for
Desuden beregnes i kodevinduet et konfidensinterval for
spredningen
I output ses at -værdien fra -testet er 0.0119. Da denne
er noget under 0.05, strider data
mod hypotesen om Data tyder altså på en systematisk
forskel mellem de to instrumenter.
Fra output aflæses
95%-konfidensinterval for middelværdien:
Da -værdien for test af hypotesen er under 0.05, ligger
nul ikke i konfidensintervallet.
Antallet af frihedsgrader er som er 71 (df i output).
Spredningen må formodes (95%-konfidensinterval) at ligge i
intervallet Skønnet er 0.032 og skønnet over måleusikkerheden
for en enkeltmåling bliver derfor Da dette er for
logaritmetransformerede værdier svarer dette til en måleusikkerhed på
cirka 2.2 procent.