Afsnit 4.13: Two sample tests i R

I alle eksemplerne ovenfor omkring to normalfordelte observationssæt er de forskellige tests lavet ved at bruge R som en lommeregner. R har dog også indbyggede funktioner beregnet til at lave disse tests.

4.13.1 Two samples: Teste varianser ens

I Statistisk Model 4.9.1 med to normalfordelte observationssæt kan man lave

F

-testet for hypotesen om ens varianser med R-funktionen var.test. Hvis data ligger i to vektorer x1 og x2 bliver kaldet

var.test(x1,x2)

I output kan man finde

F

-testtørrelsen (statistic), de tilhørende frihedsgradsantal (parameter), og

p

-værdien (p.value). Der angives også et 95%-konfidensinterval for forholdet mellem de to variansparametre

\sigma_1^2/\sigma_2^2

(dette har jeg ikke omtalt ovenfor). Gå nu tilbage til Eksempel 4.12.3, og find de beregnede værdier der i output fra et kald af vartest.

4.13.1 Bruge var.test til at teste to varianser ens

xxxxxxxxxx
 
# data indskrives
smart=c(34,33,24,31,35,35,42,47,35,28,42,43,32,23,31,38,27,
23,25,32,38,37,35,29,29,40,21)
tripel=c(80,79,46,50,27,31,23,27,35,45,33,30,28,43,53,39,40,
60,34,33,37,46,45,46,47,40,46,41,50,26,51,36,50)
​
# test udføres
var.test(smart,tripel)

Vi aflæser i output at

F

-tesstørrelsen er 0.264 og

p

-værdien er 0.00084. Hvilken

F

-fordeling bruges til beregningen af

p

-værdien ?

Svar: Aflæsning

I output fra var.test aflæses, at der er 26 frihedsgrader i tæller og 32 frihedsgrader i nævner. Den anvendte fordeling er derfor en

F(26,32)

-fordeling.

4.13.2 Two samples: Teste middelværdier ens

For at teste at middelværdierne er ens i to normalfordelinger, skal man enten bruge

t

-testet, hvis de to varianser er ens, eller også bruge Welchs test, hvis de to varianser ikke er ens. Begge de to tests udregnes med R-funktionen t.test. Hvis data ligger i to vektorer x1 og x2 bliver kaldet

t.test(x1,x2,var.equal=TRUE) $\quad$ hvis de to varianser er ens,

t.test(x1,x2,var.equal=FALSE) $\quad$ hvis de to varianser er forskellige,

Output indeholder

t

-tesstørrelsen (statistic), antallet af frihedsgrader (parameter) og

p

-værdien (pvalue) for test af hypotesen, om at de to middelværdier er ens. Desuden angives et 95%-konfidensinterval for forskellen i middelværdi (conf.int), det vil sige for parameteren

\delta=\mu_1-\mu_2.

Gå nu tilbage til Eksempel 4.10.2 og Eksempel 4.11.2 og gentag beregningerne ved hjælp af t.test.

4.13.2 Bruge t.test til at teste to middelværdier ens

Se opstartskoden (til/fra)

xxxxxxxxxx
 
# data indskrives
kyst=c(25.8,61.5,41.9,55.4,51.9,42.7,68.5,54.6,36.2,47.3,
60.4,46.9,37.7,42.7,41.5,36.9,35.4,41.2,59.6,46.5,40.0,66.9,
50.0,44.6,38.1,40.8,61.2,38.1,31.2,40.8,26.5,52.3,56.2,45.4,
52.7,41.9,44.2,21.5,47.7,42.3,45.0,48.8,47.3,53.8,41.9,41.5,
48.5,30.0,56.9,40.0)
flod=c(50.6,69.5,54.8,75.7,58.7,35.5,54.1,54.1,52.9,54.1,
43.2,49.4,74.2,71.1,35.5,37.8,66.5,52.9,55.2,30.8,40.1,59.5,
73.0,61.4,68.8,70.7,71.5,51.4,37.0,77.7,55.2,45.2,63.4,50.6,
62.6,49.0,57.2,45.2,58.3,71.9,57.5,37.8,50.6,39.0,48.3,51.7,
44.0,67.6,43.6)
​
c("Opstart er gennemført: kyst og flod er indskrevet")

xxxxxxxxxx
 
# Opstart ovenfor skal være kørt
​
# t-test beregnes
t.test(kyst,flod,var.equal=TRUE)

Vi aflæser her

t

-teststørrelsen til

-4.18,

p

-værdien fra en

t(97)

-fordeling er 0.000064, og et 95%-konfidensinterval for forskel i middelværdi er

[-13.88,\,-4.94].

Vi betragter dernæst beregningerne hørende til Eksempel 4.11.2.

xxxxxxxxxx
 
# data indskrives
smart=c(34,33,24,31,35,35,42,47,35,28,42,43,32,23,31,38,27,23,25,32,38,
37,35,29,29,40,21)
tripel=c(80,79,46,50,27,31,23,27,35,45,33,30,28,43,53,39,40,60,34,33,37,
46,45,46,47,40,46,41,50,26,51,36,50)
​
# t-test beregnes
t.test(smart,tripel,var.equal=FALSE)

Vi aflæser her

t

-teststørrelsen til

-3.58,

p

-værdien fra en

t(49.606)

-fordeling er 0.00078, og et 95%-konfidensinterval for forskel i middelværdi er

[-14.7,\,-4.1].

Hvordan kan du i output se, om du betragter modellen med fælles varians i de to normalfordelinger, eller modellen med forskellig varians ?

Svar: Aflæse fra output

Output starter med enten "Two Sample t-test" eller "Welch Two Sample t-test".

4.13.3 Eksempel: log-data

I eksemplerne 4.11.2 og 4.12.3 så vi, at tidsforbruget ved at skrive en SMS-tekst både havde større middelværdi og større varians ved brug af tripelkodende mobil i forhold til en smartphone. Dette er ikke helt atypisk, når data vedrører en positiv størrelse (her tidsforbrug). I sådanne situtioner vil der ofte ske det, at hvis data logaritmetransformeres, vil der efterfølgende være større lighed mellem varianserne.

Lad os betegne logaritmen til tidsfrobruget med henholdsvis

\text{logSM}_{i}

\text{logTR}_{i}

for den

i

'te prøve i de to grupper (sm: smartphone, tr: tripelkodende mobil). Vi betragter Statistisk Model 4.9.1, her skrevet som

\begin{aligned} \text{LogSM}_i & \sim N(\nu_1,\tau_1^2),\enspace i=1,\ldots,27, \\ \text{LogTR}_i & \sim N(\nu_2,\tau_2^2),\enspace i=1,\ldots,33,\\ & (\nu_1,\nu_2,\tau_1,\tau_2)\in \mathbf{R}^2\times\mathbf{R}_+^2, \end{aligned}

hvor

\nu_j

er middelværdien af logaritmen til tidsforbruget. Man kan matematisk vise sammenhængen

\mu_j=\exp(\nu_j+\frac{1}{2}\tau_j^2),

hvor

\mu_j

er middelværdien af tidsforbruget. I kodevinduet nedenfor laves der qqplots for de logaritmetransformerede data, og disse giver ikke anledning til at forkaste modellen.

Først undersøges hypotesen om samme varians i de to grupper for de logaritmetransformerde værdier. Beregningen er vist i kodevinduet nedenfor:

F

-teststørrelsen er 0.519, og

p

-værdien (to gange sandsynlighed for værdi mindre end 0.519) fra en

F(26,32)

-fordeling er 0.090. Da

p

-værdien er over 0.05, siger vi, at data ikke strider mod samme varians på logaritmeskalaen.

I kodevinduet laves der også et 95%-konfidensinterval for forskel i middelværdi,

\delta=\nu_{\text{sm}}-\nu_{\text{tr}},

under antagelsen om samme varians. Konfidensintervallet er baseret på

t(58)

-fordelingen, og bliver

[-0.364,\,-0.095].

Vi kan oversætte dette konfidensinterval til et konfidensinterval for forholdet mellem middelværdierne på den oprindelige skala.

Resultat 4.13.3. (Fra log til ikke-log)

Da vi har samme varians

\tau_1^2=\tau_2^2=\tau^2

på logaritmeskalaen, giver sammenhængen

\mu_j=\exp(\nu_j+\frac{1}{2}\tau^2),

\frac{\mu_1}{\mu_2}= \frac{\exp(\nu_1+\frac{1}{2}\tau^2)} {\exp(\nu_2+\frac{1}{2}\tau^2)} =\exp(\nu_1-\nu_2).

Her står, at forholdet mellem middelværdierne på den oprindelige skala er exponentialfunktionen taget på differensen mellem middelværdierne på logaritmeskalaen. Et konfidensintervsal for forholdet

\frac{\mu_1}{\mu_2}

fås derfor ved at tage eksponentialfunktionen på intervalendepunkterne for konfidensintervallet for

\delta=\nu_1-\nu_2.

For data omkring tidsforbruget for at skrive en SMS-tekst giver dette intervallet

[e^{-0.364},\,e^{-0.095}]=[0.69,\, 0.91].

Her står, at med 95% sikkerhed er middelværdien for tidsforbruget med smartphone mellem 69% og 91% af middelværdien ved brug af tripelkodende mobil.

Beregninger i R

xxxxxxxxxx
 
# data indskrives
smart=c(34,33,24,31,35,35,42,47,35,28,42,43,32,23,31,38,27,23,25,32,38,
37,35,29,29,40,21)
tripel=c(80,79,46,50,27,31,23,27,35,45,33,30,28,43,53,39,40,60,34,33,37,
46,45,46,47,40,46,41,50,26,51,36,50)
logSmart=log(smart)
logTripel=log(tripel)
​
# qqplots dannes
par(mfrow=c(1,2))
qqnorm(smart,ylim=range(smart,tripel),main="Ikke Log")
points(qqnorm(tripel,plot=FALSE),col=2,pch=20)
qqnorm(logSmart,ylim=range(logSmart,logTripel),main="Log")
points(qqnorm(logTripel,plot=FALSE),col=2,pch=20)
​
# test udføres
list(varTest=var.test(logSmart,logTripel),
tTest=t.test(logSmart,logTripel,var.equal=TRUE))

Foregående Næste