Afsnit 4.7: One sample t-test i R

I afsnit 4.5 omkring Jordens massetæthed blev -testet for hypotese om middelværdien lavet ved at bruge R som en lommeregner. R har dog også en indbygget funktion beregnet til at lave dette test, nemlig funktionen t.test. Hvis data ligger i en vektor og vi ønsker at teste hypotesen, at middelværdien er for eksempel 9.81, bliver kaldet
t.test(x,mu=9.81)
Hvis mu ikke specificeres i kaldet, laves der et test for, at middelværdien er nul. Hvis output fra t.test placeres i tUD, vil denne blandt andet indeholde følgende:
I det næste skjulte punkt gentages beregningen af -testet for Cavendish's målinger af Jordens massetæthed. Kør koden og sammenlign med de beregnede værdier i afsnit 4.5.

4.7.1 Beregne t-test i R

Vi aflæser i output -teststørrelsen til -0.844 og -værdien til 0.408. Konfidensintervallet aflæses til

Eksempel 4.7.2. (Flytte mus fra A til B og tilbage)
I starten af dette kapitel omtalte jeg en sammenligning af tiden til at flytte computermusen frem og tilbage mellem to områder. Jeg viste der et histogram af 46 målinger, hvor hver måling er differens mellem den målte værdi af tiden for at flytte musen fra A til B og tiden for at flytte musen fra B til A.
Vi ønsker at se på differensen mellem tiden for de to bevægelsesretninger. Før vi gør dette, kan det være relevant at se på om spredningen i de målte tider stiger med værdierne selv. Til dette kan man lave et plot af differenserne afsat mod gennemsnit af målingerne for de to bevægelsesretninger (Bland–Altman plot). Denne figur viser ingen tendens til stigende spredning. I kodevinduet nedenfor er indskrevet de 46 forskelle mellem tiden fra A til B og tiden fra B til A. Det er naturligt at undersøge hypotesen, at middelværdien af differenserne er nul, svarende til at der ikke er systematisk forskel mellem tiden for de to bevægelsesretninger. Spredningen i målingerne er også interessant, både som et element i beskrivelse af processen, og som et nødvendigt element for at sige, hvor velbestemt middelværdien er.
Lad være differensen af log-værdierne for den 'te prøve. Vi benytter modellen
Middelværdien repræsenterer her den systematiske forskel der er mellem de to bevægelsesretninger. I kodevinduet nedenfor laves først et qqplot af data, og derefter undersøges hypotesen mod alternativet at Output giver også automatisk et konfidensinterval for

Spørgsmål

  1. Aflæs skøn over middelværdien
  2. Kan det antages, at middelværdien er ?
  3. Angiv et 95%-konfidensinterval for middelværdien
  4. Hvor mange frihedsgrader har -fordelingen, der bruges i konstruktionen af konfidensintervallet?
  5. Hvad kan du sige om spredningen ?

Svar: To bevægelsesretninger

  1. Skønnet er fra aflæsning i output.
  2. I output ses at -værdien fra -testet er 0.66. Da denne er langt over 0.05, strider data ikke mod hypotesen om Data tyder altså ikke på forskel i de to bevægelsesretninger.
  3. Fra output aflæses 95%-konfidensinterval for middelværdien: Da -værdien for test af hypotesen er over 0.05, ligger nul i konfidensintervallet.
  4. Antallet af frihedsgrader er som er 45 (df i output).
  5. Spredningen må formodes (95%-konfidensinterval) at ligge i intervallet Skønnet er 0.30, og da dette er spredningen på en differens mellem to målinger, er spredningen på en enkeltmåling givet ved

ForegåendeNæste