Afsnit 8.7: Det generelle F-test
I eksemplet omkring fremføring af medicin i kroppen
i foregående afsnit vurderede vi, at der ikke så ud til at være
interaktion mellem
prodrug og
tid.
Vi lavede ikke et formelt test, eftersom hypotesen om
additivitet svarer til at sætte fire parametre lig med nul,
og dermed ikke kan aflæses fra parametertabellen.
Generelt i den tosidede variansanalysemodel, her betegnet med
fjernes
parametre, når vi
reducerer til den addititve model, her betegnet med
hvor
og
er antallet af niveauer i de to faktorer.
Hvordan laver vi et test for denne reduktion
 ? Ligesom i den ensidede
variansanalysemodel skal varians "mellem grupper" sammenlignes
med varians "inden for grupper". Jeg beskriver nu testet i en meget
generel ramme.
En generel lineær normal model er på formen:
hvor
er et lineært underrum af
Det sidste
betyder blot, at der findes et
og faste vektorer
,
således at vektoren
af middelværdier kan skrives på formen
hvor
er ukendte parametre,
som vi ønsker at estimere ud fra data. Dette kan virke noget
abstrakt, men tænk på følgende to eksempler. For
to grupper af observationer med hver sin
middelværdi, hvor gruppe 1 kommer først,
kan vi skrive
eller for den simple regressionsmodel, kan
vi skrive
I det generelle
-test ønsker vi at teste reduktionen
fra en model
til en undermodel
hvor
er et
underrum af
I praksis betyder det sidste typisk, at
man tester en hypotese om, at nogle angivne parametre er nul.
Resultat 8.7.1.
(Det generelle -test)
Betragt to modeller
og
hvor
er en undermodel af
Lad
og
,
, være de forventede
værdier i de to modeller, så er
-teststørrelsen for reduktion fra
model
til model
på formen
Under model
beregnes
-værdien for testet som
Testet beregnes i
python og MATLAB ved kommandoen
hvor
lmUD1 og
lmUD2 er output
fra
ols i
python
eller fra
fitlm i MATLAB
for de to modeller
og
Output fra kaldet af
anova er en
testtabel med
to rækker og seks søjler:
Første række vedrører model
og anden række model
.
Søjlen
ssr indeholder
for de to modeller, og
dfresid de tilhørende frihedsgrader.
Indholdet i anden række i
søjlen
dfdiff er differensen
mellem de to værdier under
dfresid,
og
ssdif er differensen
mellem de to værdier under
ssr.
De to sidste søjler indeholder selve
-teststørrelsen og den
tilhørende
-værdi i anden række.
Måske har I bemærket, at i output fra
summary2 i
python (eller i output fra
fitlm i MATLAB)
står der inde i øverste tabel "F-statistics".
Dette er
-teststørrelsen, hvor modellen fra kaldet af
estimationsfunktionen sammenlignes med modellen
med konstant middelværdi, svarende til modelformlen
respons1.
Selvom slutmodellen i dette test altid er den samme,
vil
-værdien afhænge af startmodellen
givet gennem kaldet til estimationsfunktionen.
I kan se dette konkret i output fra det skjulte kodevindue i
eksempel
8.6.1.
Eksempel 8.7.2.
(Fremføring af medicin)
I kodevinduet nedenfor vises beregningen af
-test for reduktion fra
den tosidede variansanalysemodel til den additive model. Derudover
vises de to
-test for henholdsvis ingen effekt af prodrug og
ingen effekt af tid.
8.7.3 Test for additive undermodel
ForegåendeNæste