Afsnit 6.7: Det generelle F-test

I eksemplet omkring evapotranspirationen fra grønne tage i foregående afsnit så vi at interaktionen mellem taethed og hoejde involverer tre parametre. Generelt i den tosidede variansanalysemodel, Statistisk Model 6.6.3, fjernes parametre, når vi går fra den fulde model til den addititve model, hvor og er antallet af niveauer i de to faktorer. Hvordan laver vi et test for denne reduktion? Ligesom i den ensidede variansanalysemodel skal varians "mellem grupper" sammenlignes med varians "inden for grupper". Jeg beskriver nu testet i en meget generel ramme.
En generel lineær normal model er på formen:
hvor er et lineært underrum af Det sidste betyder blot, at der findes et og faste vektorer , således at vektoren af middelværdier kan skrives på formen
hvor er ukendte parametre, som vi ønsker at estimere ud fra data. Dette kan virke noget abstrakt, men tænk på følgende to eksempler. For to grupper af observationer med hver sin middelværdi, hvor gruppe 1 kommer først, kan vi skrive
eller for den simple regressionsmodel, kan vi skrive
I det generelle -test ønsker vi at teste reduktionen fra en model til en undermodel hvor er et underrum af I praksis betyder det sidste typisk, at man tester en hypotese om, at nogle angivne parametre er nul.
Resultat 6.7.1. (Det generelle -test)
Betragt to modeller og hvor er en undermodel af Lad og , , være de forventede værdier i de to modeller, så er -teststørrelsen for reduktion fra model til model på formen
Under model beregnes -værdien for testet som
Testet beregnes i R ved kommandoen
Output fra kaldet af anova er en testtabel med 2 rækker og 7 søjler:
Første række vedrører model og anden række model . Søjlen RSS indeholder for de to modeller, og Res.Df de tilhørende frihedsgrader. Indholdet i anden række i søjlen Df er differensen mellem de to værdier under Res.Df, og Sum of Sq er differensen mellem de to værdier under RSS. De to sidste søjler indeholder selve -teststørrelsen og den tilhørende -værdi.
Måske har I bemærket, at i output fra summary(lm(modelformel)) står der til sidst "F-statistics:". Hvis modelformel ikke indeholder "-1", er dette -testet fra kommandoen anova(lm(x1),lm(modelformel)), hvor er vektoren med responsværdier. Selvom slutmodellen i dette test altid er modellen, hvor alle de stokastiske variable har den samme middelværdi, vil -værdien også afhænge af startmodellen givet gennem modelformel. I kan se dette konkret i output fra det skjulte kodevindue i eksempel 6.6.6.
Eksempel 6.7.2. (Grønne tage)
I kodevinduet nedenfor vises beregningen af -test for reduktion fra den tosidede variansanalysemodel til den additive mode. Derudover vises de to -test for henholdsvis ingen effekt af plantetæthed og ingen effekt af pottehøjde. Den første del af analysen er med alle 8 kombinationer af plantetæthed og pottehøjde, og derefter laves en analyse hvor gruppen med den store pottehøjde og en enkelt plante udelades.

6.7.3 Test for additive undermodel

Se opstartskoden (til/fra)

Kør koden og genfind -værdien for ingen effekt af pottehøjden fra Eksempel 6.6.6. Kommenter på resultaterne, i tilfældet hvor gruppen med den store pottehøjde og en enkelt plante udelades.

ForegåendeNæste