Afsnit 5.1: Gruppespecifik regression
De fleste af jer har nok set reportager i nyhederne fra
mudderskred
rundt omkring i verdenen. For geologer er dette et af bidragene til
sedimenttransport
på skrånende flader. Det er forventeligt, at sedimenttransporten
vil være større, jo større hældning en flade har, og geologerne
formulerer dette som relationen
Dette svarer lidt til en diffusionstypeligning.
Det følgende billede viser et mudderskred i Virginia efter en
orkan i 2004.
Jeg vil ikke her komme ind på, hvordan man estimerer en værdi af
transportkoefficienten
men i stedet se på en undersøgelse, hvor man prøver at beskrive
ud
fra andre forhold såsom nedbørsmængde og jordforhold.
I artiklen
Influences of climate and life on hillslope sediment transport
relateres data for
til et tørhedsindeks
(
aridity index AI) og til
overfladestuktur
(
lithology)
delt op på de to kategorier
unconsolidated og
igneous/metamorphic. Tørhedsindekset beregnes som
gennemsnitlig årsnedbør divideret med et gennemsnitligt
potentiel årsfordampningstal. Et tørhedsindeks på 1 svarer derfor til
en form for "ligevægt" mellem nedbør og fordampning.
Løseligt sagt, jo større tørhedsindeks jo mere vand er der til rådighed
til sedimenttransport.
Figuren nedenfor viser logaritmen til transportkoefficienten tegnet
op mod logaritmen til tørhedsindekset for 102 områder
delt op på 37 unconsolidated og 65 igneous/metamorphic.
Vi vil betragte en model, hvor der for hver af de to overfladegrupper
er en lineær sammenhæng mellem
og
og benytte denne model til at undersøge eventuelle forskelle mellem de to
grupper.
I en generel formulering har vi data fra
uafhængige stokastiske
variable
en forklarende variabel
og en faktor
gr, der inddeler data
i
grupper (som her betegnes med tallene
).
Modellen, vi vil analysere, er
Denne model siger, at hver undergruppe, givet ved et bestemt
niveau af
gr, har sin egen lineære sammenhæng mellem den
forklarende variabel
og middelværdien af respons
Model
har følgende naturlige undermodeller:
hvor
er regressionsmodellen med fælles hældning og
gruppespecifik skæring,
er regressionsmodellen med fælles skæring og
gruppespecifik hældning, og
er modellen med både fælles hældning og
fælles skæring.
Den mest simple modelformel i
R til analyse af
model
er
For at forstå den parametrisering,
som
R bruger, skal man vide, at
R omskriver
modelformlen til
Leddet
gr giver den
gruppebestemte skæring
og i overensstemmelse
med den ensidede variansanalysemodel fra
afsnit
4.4
bruges parametrene
og forskellene
der betegnes
grg,
Leddet
giver regressionen for den første gruppe, det vil sige
parameteren
og
giver afvigelserne fra denne
i de andre grupper, det vil sige
som
betegnes
grg:t.
Den følgende tabel giver alternative måder at skrive modelformlen på
og de tilhørende parametriseringer i
R.
Blandt undermodellerne
og
er den første
den vigtigste. Når
har vi en
"additiv struktur" af
gr og
: uanset hvilken undergruppe
der betragtes, er forskellen i middelværdier mellem to værdier af den
forklarende variabel
den samme, og uanset hvilken værdi af den
forklarende variabel der betragtes, er forskellen mellem to
grupper den samme. I
R laves
-testet fra
Resultat
4.7.1 for reduktion fra model
til
model
med kommandoen
anova(lm(xgr+t),lm(xgr*t))
-værdien for dette test findes fra en
-fordeling.
ForegåendeNæste