Efter 16 dages
vækst er det totale bladareal målt. Planterne er delt op i to grupper,
hvor den ene gruppe ikke udsættes for stress, og den anden gruppe
udsættes for stress (faktoren stress).
Planterne er desuden delt op i to grupper
med hensyn til lysforhold i vækstperioden, hvor den ene gruppe vokser
under en lav lysmængde og den anden under en højere lysmængde
(faktoren lys). På
denne måde inddeles data i fire grupper svarende til
produktet stress*lys af de to faktorer.
Rådata er ikke gengivet i artiklen, men den del, jeg vil bruge her, kan findes
i bogen
Statistics for the Life Sciences.I kodevinduet nedenfor laves en figur med boxplot for de fire grupper og
en figur med qqplots for de fire grupper.
Den sidste figur viser, at det er rimeligt at bruge
en normalfordeling til beskrivelse af data i hver af de
fire grupper, og den første figur peger på forskel i
middelværdi mellem grupperne.
Jeg vil nu beskrive den tosidede variansanalysemodel generelt.
Data består af målinger fra uafhængige stokastiske variable
Disse inddeles i grupper ved hjælp
af to faktorer og
hvor har niveauer og har niveauer.
Vi starter med en model, hvor både middelværdi og varians
afhænger af, hvilken af de grupper observationen
tilhører
hvor niveauerne for de to faktorer for nemheds skyld betegnes
med tal. Hvis det kan antages, at varianserne er ens,
får vi modellen
som kaldes den tosidede variansanalysemodel. I analysen
af modellen betragtes følgende undermodeller:
Model kaldes den additive model, og er vigtig
på grund af fortolkningen af parametrene, som bliver
beskrevet nedenfor. For modellerne og
er vi tilbage ved den ensidede variansanalysemodel fra
afsnit 4.2. For at få en fornemmelse af om data kan beskrives med den
additive model, kan man lave et interaktionsplot.
Den indbyggede funktion i R er lidt mangelfuld på dette punkt,
så i stedet anbefaler jeg en funktion additivitetsPlot,
som findes i filen Rfunktioner.txt, jævnfør
underafsnittet Egne funktioner i R i afsnit 1.9. I et interaktionsplot beregner man gennemsnit i alle grupperne
givet ved opdeling efter Gennemsnit afsættes mod
niveauerne for den ene faktor, og alle gennemsnit, der ligger
på det samme niveau af den anden faktor, forbindes.
Hvis data kan beskrives med model ovenfor, afspejler
gennemsnittene i figuren altså afsat mod
for eksempel og punkterne
med samme værdi af forbindes. De kurver, der fremkommer,
svarer altså til kurven der parallelforskydes
med værdierne fra I et interaktionsplot prøver vi derfor
at vurdere, om kurverne ser ud til at være parallelle.
I det følgende kodevindue vises interaktionsplots baseret på
den indbyggede funktion interaction.plot i R.
Input til denne funktion er
de to faktorer, der bruges til at dele data op i undergrupper,
og vektoren med responsværdierne.
Når I kører på jeres egen R-installation, kan I benytte
additivitetsPlot fra filen Rfunktioner.txt, hvor
input er som til interaction.plot.
Begge figurer viser approksimative parallelle kurver, hvilket tyder på,
at data kan beskrives med den additive model.
4.6.1 Analyse i R og parametrisering
Model hvor hver gruppe har sin egen middelværdi,
analyseres med kaldet xG*H. Den additive model
analyseres med kaldet xG+H. Lad os starte med at forstå
output fra summary for den sidste model. Vi kan forstå output
ved, for og at skrive
hvor højresiden viser de parametre, der bruges ved kaldet
xG+H. Vi ser her at modellen kan parametriseres med
parametre, nemlig ,
og
.
Går vi nu tilbage til model skriver vi
i stedet
hvor den anden linje viser de parametre, der bruges ved kaldet
xG*H. Det sidste led kaldes interaktionen mellem
de to faktorer.
I den fulde model, model er Gu således
forskel mellem niveau og niveau 1 for faktoren
når faktoren ligger på niveau 1, og vice versa
for Hv.
Det nyttige ved den additive model er, at Gu nu er
forskel mellem niveau og niveau 1 for faktoren
uanset hvilket niveau faktoren befinder sig på,
og Hv er
forskel mellem niveau og niveau 1 for faktoren
uanset hvilket niveau faktoren befinder sig på.
Som for den ensidede variansanalyse
i afsnit 4.4 betragtes simulerede
data med spredning således at vi direkte kan se
parametrene, der bruges i R.
Vi betragter den additive model inden for
den tosidede variansanalysemodel.
Hvad er middelværdien for en observation med gFak på niveau
"2" og hFak på niveau "B" ? Hvad er værdien af Intercept+gFak2+hFakB ?
Udtryk R-parametrene
Intercept, gFak2, hFakB og hFakC ud fra
eta og zeta.
Opskriv de statistiske modeller svarende til henholdsvis kaldet
lm(x~gFak*hFak) og til kaldet lm(x~gFak+hFak).
Fra gFak kommer bidraget 3 til middelværdien og fra hFak bidraget
0, hvorfor middelværdien er som
er middelværdien, vi lige har udregnet.
Intercept=eta[1]+zeta[1], gFak2=eta[2]-eta[1], hFakB=zeta[2]-zeta[1] og
hFakC=zeta[3]-zeta[1].
Det 'te respons er og den 'te værdi af de to faktorer er
og Model svarende til det første kald siger, at hver
undergruppe
givet ved de to faktorer har sin egen middelværdi, Model svarende til det andet
kald siger, at middelværdien består af et bidrag fra gruppen bestemt
af faktoren gFak plus et bidrag fra gruppen bestemt af faktoren hFak,
Eksempel 4.6.3.
(Soyabønner udsat for stress)
Vi betragter data omtalt i starten af dette afsnit omkring
stresspåvirkning af soyaplanter. Lad være den
stokastiske variabel, der angiver respons (bladareal), og lad
og være de tilhørende værdier for
de to faktorer lys og stress. Lad os starte med modellen
hvor hver gruppe bestemt af lys*stress har sin egen middelværdi
og sin egen varians, og de fire middelværdier og varianser
kan variere frit. Først undersøges hypotesen om fælles varians:
Beregningerne nedenfor i R viser, at Bartlett teststørrelsen er
1.16, og den tilhørende -værdi fra en -fordeling er
0.76. Data strider således ikke mod hypotesen om samme varians i de fire
grupper, og model kan reduceres til model :
hvor de fire middelværdier og den fælles varians kan variere frit.
Vi ønsker nu at teste reduktionen til den additive model
Vi har ovenfor lavet interaktionsplots, der viser overensstemmelse med
den additive model.
Parametertabellen hørende til model viser, at der kun er en
enkelt parameter, der vedrører interaktionen mellem
lys og stress nemlig lysLav:stressUden.
Test for, at denne parameter kan sættes lig med nul, aflæses under
-testet i parametertabellen, og giver en -værdi på
0.86. Konklusionen er derfor, at data ikke strider mod
hypotesen om additivitet. Vi laver nu en parametertabel for den additive model Fra denne
ses, at modellen ikke kan reduceres yderligere, idet
et test for ingen effekt af lys giver -værdi på
og test for ingen effekt af stress giver en
-værdi på 0.00015. Konfidensintervaller for de to effekter er
og for henholdsvis
og
Endelig er
skønnet over spredningen 29.6. Der er således
en tydelig effekt af både lys og stress.