Afsnit 8.7: Det generelle F-test

I eksemplet omkring fremføring af medicin i kroppen i foregående afsnit vurderede vi, at der ikke så ud til at være interaktion mellem prodrug og tid. Vi lavede ikke et formelt test, eftersom hypotesen om additivitet svarer til at sætte fire parametre lig med nul, og dermed ikke kan aflæses fra parametertabellen. Generelt i den tosidede variansanalysemodel, her betegnet med fjernes parametre, når vi reducerer til den addititve model, her betegnet med hvor og er antallet af niveauer i de to faktorer. Hvordan laver vi et test for denne reduktion? Ligesom i den ensidede variansanalysemodel skal varians "mellem grupper" sammenlignes med varians "inden for grupper". Jeg beskriver nu testet i en meget generel ramme.
En generel lineær normal model er på formen:
hvor er et lineært underrum af Det sidste betyder blot, at der findes et og faste vektorer , således at vektoren af middelværdier kan skrives på formen
hvor er ukendte parametre, som vi ønsker at estimere ud fra data. Dette kan virke noget abstrakt, men tænk på følgende to eksempler. For to grupper af observationer med hver sin middelværdi, hvor gruppe 1 kommer først, kan vi skrive
eller for den simple regressionsmodel, kan vi skrive
I det generelle -test ønsker vi at teste reduktionen fra en model til en undermodel hvor er et underrum af I praksis betyder det sidste typisk, at man tester en hypotese om, at nogle angivne parametre er nul.
Resultat 8.7.1. (Det generelle -test)
Betragt to modeller og hvor er en undermodel af Lad og , , være de forventede værdier i de to modeller, så er -teststørrelsen for reduktion fra model til model på formen
Under model beregnes -værdien for testet som
Testet beregnes i python og MATLAB ved kommandoen
hvor lmUD1 og lmUD2 er output fra ols i python eller fra fitlm i MATLAB for de to modeller og
Output fra kaldet af anova er en testtabel med to rækker og seks søjler:
Første række vedrører model og anden række model . Søjlen ssr indeholder for de to modeller, og dfresid de tilhørende frihedsgrader. Indholdet i anden række i søjlen dfdiff er differensen mellem de to værdier under dfresid, og ssdif er differensen mellem de to værdier under ssr. De to sidste søjler indeholder selve -teststørrelsen og den tilhørende -værdi i anden række.
Måske har I bemærket, at i output fra summary2 i python (eller i output fra fitlm i MATLAB) står der inde i øverste tabel "F-statistics". Dette er -teststørrelsen, hvor modellen fra kaldet af estimationsfunktionen sammenlignes med modellen med konstant middelværdi, svarende til modelformlen respons1. Selvom slutmodellen i dette test altid er den samme, vil -værdien afhænge af startmodellen givet gennem kaldet til estimationsfunktionen. I kan se dette konkret i output fra det skjulte kodevindue i eksempel 8.6.1.
Eksempel 8.7.2. (Fremføring af medicin)
I kodevinduet nedenfor vises beregningen af -test for reduktion fra den tosidede variansanalysemodel til den additive model. Derudover vises de to -test for henholdsvis ingen effekt af prodrug og ingen effekt af tid.

8.7.3 Test for additive undermodel

Se opstartskoden (til/fra)

MATLAB-kode

Kør koden og genfind -værdierne fra Eksempel 8.6.1.

ForegåendeNæste