Afsnit 4.7: One sample -test i python

I afsnit 4.5 omkring Jordens massetæthed blev -testet for hypotese om middelværdien lavet ved at bruge python som en lommeregner. Testet, og det tilhørende konfidensinterval, kan laves direkte i python ved brug af funktionen ttest. Funktionen ligger i pytFunktioner.py, der er omtalt under punktet Egne funktioner i python i afsnit 1.6. (Python har en indbygget funktion ttest1samp, der kan lave -testet, men denne funktion beregner ikke konfidensintervallet.) Et kald til ttest er på formen
hvor er en vektor med data, mu er den værdi af middelværdien vi ønsker at teste, og resultatet af testet placeres i tUD. Hvis mu ikke specificeres i kaldet, laves der et test for, at middelværdien er nul. De forskellige dele af output er som følger:
Nedre og øvre grænse er for et 95%-konfidensinterval. I det næste skjulte punkt gentages beregningen af -testet for Cavendish's målinger af Jordens massetæthed. Kør koden og sammenlign med de beregnede værdier i afsnit 4.5.

4.7.1 Beregne t-test i python

Her i webbogen har jeg ikke adgang til filen pytFunktioner.py, og jeg har derfor indsat koden til ttest i opstartskoden nedenfor.

Se opstartskoden (til/fra)

Vi aflæser i output -teststørrelsen til -0.844 og -værdien til 0.408. Konfidensintervallet aflæses til

Eksempel 4.7.2. (Sammenligne to måleinstrumenter)
I starten af dette kapitel omtalte jeg en sammenligning af to måleinstrumenter fra Roche til måling af mængden af luteotropichormone (LH) i en prøve. Jeg viste der et histogram af 72 målinger, hvor hver måling er differens mellem den målte værdi på de to instrumenter for den samme prøve. De 72 målinger er fremkommet ved at analysere 36 prøver med et indhold omkring 65 mIU/mL og 36 prøver med et indhold omkring 19 mIU/mL. Hvis man laver et plot af differenserne afsat mod gennemsnit af målingerne for de to instrumenter (Bland–Altman plot) vil man tydeligt se, at der er større spredning på differensen for prøverne med et indhold omkring 65 end for prøverne med et indhold omkring 19. Hvis man i stedet betragter logaritmen til mængden af LH, vil et tilsvarende plot ikke vise en forskel i spredningerne.
I kodevinduet nedenfor er indskrevet de 72 forskelle mellem logaritmen til LH målt på de to instrumenter. Det er naturligt at undersøge hypotesen, at middelværdien af differenserne er nul, svarende til at der ikke er systematisk forskel mellem de to instrumenter. Spredningen i målingerne er også interessant som udtryk for måleusikkerheden i den type måling, der betragtes (spredning på differens er gange måleusikkerheden på en enkeltmåling).
Lad være differensen af log-værdierne for den 'te prøve. Vi benytter modellen
Middelværdien repræsenterer her den systematiske forskel der er mellem de to instrumenter. I kodevinduet nedenfor laves først et qqplot af data, og derefter undersøges hypotesen mod alternativet at Output giver også automatisk et konfidensinterval for Desuden beregnes i kodevinduet et konfidensinterval for spredningen

Se opstartskoden (til/fra)

Spørgsmål

  1. Aflæs skøn over middelværdien
  2. Kan det antages, at middelværdien er ?
  3. Angiv et 95%-konfidensinterval for middelværdien
  4. Hvor mange frihedsgrader har -fordelingen, der bruges i konstruktionen af konfidensintervallet?
  5. Hvad kan du sige om spredningen ?

Svar: To Instrumenter

  1. Skønnet er fra aflæsning i output.
  2. I output ses at -værdien fra -testet er 0.0119. Da denne er noget under 0.05, strider data mod hypotesen om Data tyder altså på en systematisk forskel mellem de to instrumenter.
  3. Fra output aflæses 95%-konfidensinterval for middelværdien: Da -værdien for test af hypotesen er under 0.05, ligger nul ikke i konfidensintervallet.
  4. Antallet af frihedsgrader er som er 71 (df i output).
  5. Spredningen må formodes (95%-konfidensinterval) at ligge i intervallet Skønnet er 0.032 og skønnet over måleusikkerheden for en enkeltmåling bliver derfor Da dette er for logaritmetransformerede værdier svarer dette til en måleusikkerhed på cirka 2.2 procent.

ForegåendeNæste