Jeg vender tilbage til data omkring kontrol af
min køkkenvægt i eksempel 4.2.1. Der er foretaget
10 uafhængige målinger af vægten af cirka 600 ml vand.
Vi lader være den 'te måling af vægten og
benytter Statistisk Model 4.3.1,
med erstattet af :
Ønsket er at teste hypotesen mod alternativet
Fra python-beregninger nedenfor fremgår, at og den
empiriske spredning er Herudfra beregnes -teststørrelsen
-værdien i -testet findes
som Da -værdien er
langt under 0.05, konkluderer vi, at data strider mod hypotesen om
en middelværdi på 600. Jeg må derfor erkende, at det måske er på
tide at skifte min køkkenvægt ud! Lad os også lave et 95%-konfidensinterval for middelværdien,
som kan regnes om til et konfidensinterval for vægtens fejlvisning.
Ved opslag finder vi, at 97.5%-fraktilen i en -fordeling er
Dermed bliver konfidensintervallet for middelværdien af
målingerne
Konfidensintervallet for middelværdien af fejlmålingen er dermed
Køkkenvægten viser altså
med 95% sikkerhed et sted mellem 7 og 29 gram for lidt.
Bemærk udtrykket med 95% sikkerhed, som blot er en anden
måde at sige, at det er et 95%-konfidensinterval. Man må
ikke sige med 95% sandsynlighed, hvilket giver intryk af, at
parameteren (her midelfejlvisningen) er stokastisk.I kodevinduet nedenfor er vist de nødvendige beregninger i python
(i afsnit 4.7 omtales en funktion i python, der kan lave
alle beregningerne).
Funktionen mean beregner gennemsnit af
værdierne i inputvektoren, og funktionen std beregner den empiriske
spredning af værdierne i (bemærk, at i python er det
nødvendigt at lave indstillingen ddof=1 for at få den empiriske
spredning som defineret i afsnit 4.3).
Frihedsgraderne er det andet argument i funktionen, der
beregner
hvorfor det er en -fordeling, der bruges.