Afsnit 4.7: Det generelle F-test

I eksemplet omkring stresspåvirkning af soyabønner i foregående afsnit kunne vi teste interaktionen mellem stress og lys væk ved et -test, da interaktionen kun bestod af en enkelt parameter. Generelt i den tosidede variansanalysemodel fjernes parametre, når vi går fra den fulde model til den addititve model, hvor og er antallet af niveauer i de to faktorer. Hvordan laver vi et test for denne reduktion? Ligesom i den ensidede variansanalysemodel skal varians "mellem grupper" sammenlignes med varians "inden for grupper". Jeg beskriver nu testet i en meget generel ramme.
En generel lineær normal model er på formen:
hvor er et lineært underrum af Det sidste betyder blot, at der findes et og faste vektorer , således at vektoren af middelværdier kan skrives på formen
hvor er ukendte parametre, som vi ønsker at estimere ud fra data. Dette kan virke noget abstrakt, men tænk på følgende to eksempler. For to grupper af observationer med hver sin middelværdi, hvor gruppe 1 kommer først, kan vi skrive
eller for den simple regressionsmodel, kan vi skrive
I det generelle -test ønsker vi at teste reduktionen fra en model til en undermodel hvor er et underrum af I praksis betyder det sidste typisk, at man tester en hypotese om, at nogle angivne parametre er nul.
Resultat 4.7.1. (Det generelle -test)
Betragt to modeller og hvor er en undermodel af Lad og , , være de forventede værdier i de to modeller, og definer . Så er -teststørrelsen for reduktion fra model til model givet ved
Under model beregnes -værdien for testet som
Testet beregnes i R ved kommandoen
Output fra kaldet af anova er en testtabel med 2 rækker og 7 søjler:
Første række vedrører model og anden række model . Søjlen RSS indeholder for de to modeller, og Res.Df de tilhørende frihedsgrader. Indholdet i anden række i søjlen Df er differensen mellem de to værdier under Res.Df, og Sum of Sq er differensen mellem de to værdier under RSS. De to sidste søjler indeholder selve -teststørrelsen og den tilhørende -værdi.
Måske har I bemærket, at i output fra summary(lm(modelformel)) står der til sidst "F-statistics:". Hvis modelformel ikke indeholder "-1", er dette -testet fra kommandoen anova(lm(x1),lm(modelformel)), hvor er vektoren med responsværdier. Selvom slutmodellen i dette test altid er modellen, hvor alle de stokastiske variable har den samme middelværdi, vil -værdien også afhænge af startmodellen givet gennem modelformel. I kan se dette konkret i output fra det skjulte kodevindue i eksempel 4.6.3.
Hvis man har en række modeller , hvor model model er en undermodel af model , benytter man ofte en teststrategi med successive -test. I det 'te test antager man, at data kan beskrives med modellen , og undersøger, om data understøtter en reduktion til model ved at bruge -testet, som beskrevet i Resultat 4.7.1 med og svarende til og . Man fortsætter med successive test, indtil data ikke længere understøtter en reduktion.
Eksempel 4.7.2. (Stress af soyabønner)
I kodevinduet nedenfor vises beregningen af -test for reduktion fra den tosidede variansanalysemodel til den additive mode. Derudover vises de to -test for henholdsvis ingen effekt af stress og ingen effekt af lys.

4.7.3 Test for additive model

Se opstartskoden (til/fra)

Kør koden og genfind -værdierne fra Eksempel 4.6.3.

ForegåendeNæste