Afsnit 4.7: Det generelle F-test
I eksemplet omkring stresspåvirkning af soyabønner
i foregående afsnit kunne vi teste interaktionen mellem
stress og
lys væk ved et
-test, da interaktionen
kun bestod af en enkelt parameter.
Generelt i den tosidede variansanalysemodel
fjernes
parametre, når vi går fra den
fulde model til den addititve model,
hvor
og
er antallet af niveauer i de to faktorer.
Hvordan laver vi et test for denne reduktion
 ? Ligesom i den ensidede
variansanalysemodel skal varians "mellem grupper" sammenlignes
med varians "inden for grupper". Jeg beskriver nu testet i en meget
generel ramme.
En generel lineær normal model er på formen:
hvor
er et lineært underrum af
Det sidste
betyder blot, at der findes et
og faste vektorer
,
således at vektoren
af middelværdier kan skrives på formen
hvor
er ukendte parametre,
som vi ønsker at estimere ud fra data. Dette kan virke noget
abstrakt, men tænk på følgende to eksempler. For
to grupper af observationer med hver sin
middelværdi, hvor gruppe 1 kommer først,
kan vi skrive
eller for den simple regressionsmodel, kan
vi skrive
I det generelle
-test ønsker vi at teste reduktionen
fra en model
til en undermodel
hvor
er et
underrum af
I praksis betyder det sidste typisk, at
man tester en hypotese om, at nogle angivne parametre er nul.
Resultat 4.7.1.
(Det generelle -test)
Betragt to modeller
og
hvor
er en undermodel af
Lad
og
,
, være de forventede
værdier i de to modeller, og definer
.
Så er
-teststørrelsen for reduktion fra
model
til model
givet ved
Under model
beregnes
-værdien for testet som
Testet beregnes i
R ved kommandoen
Output fra kaldet af
anova er en
testtabel med
2 rækker og 7 søjler:
Første række vedrører model
og anden række model
.
Søjlen
RSS indeholder
for de to modeller, og
Res.Df de tilhørende frihedsgrader. Indholdet i anden række i
søjlen
Df er differensen mellem de to værdier under
Res.Df,
og
Sum of Sq er differensen mellem de to værdier under
RSS.
De to sidste søjler indeholder selve
-teststørrelsen og den
tilhørende
-værdi.
Måske har I bemærket, at i output fra
summary(lm(modelformel)) står der til sidst "F-statistics:".
Hvis
modelformel ikke indeholder "-1", er dette
-testet
fra kommandoen
anova(lm(x1),lm(modelformel)),
hvor
er vektoren med responsværdier. Selvom slutmodellen
i dette test altid er modellen, hvor alle de stokastiske variable har den
samme middelværdi, vil
-værdien også afhænge af startmodellen
givet gennem
modelformel.
I kan se dette konkret i output fra det skjulte kodevindue i
eksempel
4.6.3.
Hvis man har en række modeller
, hvor model
model
er en undermodel af model
, benytter
man ofte en teststrategi med successive
-test. I det
'te
test
antager man, at data kan beskrives med modellen
, og
undersøger, om data understøtter en reduktion til model
ved at bruge
-testet, som beskrevet i
Resultat
4.7.1
med
og
svarende til
og
.
Man fortsætter med successive test, indtil data ikke længere
understøtter en reduktion.
Eksempel 4.7.2.
(Stress af soyabønner)
I kodevinduet nedenfor vises beregningen af
-test for reduktion fra
den tosidede variansanalysemodel til den additive mode. Derudover
vises de to
-test for henholdsvis ingen effekt af stress og
ingen effekt af lys.
4.7.3 Test for additive model
ForegåendeNæste