Afsnit 7.1: Gruppespecifik regression
De fleste af jer har nok set reportager i nyhederne fra
mudderskred
rundt omkring i verdenen. For geologer er dette et af bidragene til
sedimenttransport
på skrånende flader. Det er forventeligt, at sedimenttransporten
vil være større, jo større hældning en flade har, og geologerne
formulerer dette som relationen
Dette svarer lidt til en diffusionstypeligning.
Det følgende billede viser et mudderskred i Virginia efter en
orkan i 2004.
Jeg vil ikke her komme ind på, hvordan man estimerer en værdi af
transportkoefficienten
men i stedet se på en undersøgelse, hvor man prøver at beskrive
ud
fra andre forhold såsom nedbørsmængde og jordforhold.
I artiklen
Influences of climate and life on hillslope sediment transport
relateres data for
til et tørhedsindeks
(
aridity index AI) og til
overfladestuktur
(
lithology)
delt op på de to kategorier
unconsolidated og
igneous/metamorphic. Tørhedsindekset beregnes som
gennemsnitlig årsnedbør divideret med et gennemsnitligt
potentiel årsfordampningstal. Et tørhedsindeks på 1 svarer derfor til
en form for "ligevægt" mellem nedbør og fordampning.
Løseligt sagt, jo større tørhedsindeks jo mere vand er der til rådighed
til sedimenttransport.
Figuren nedenfor viser logaritmen til transportkoefficienten tegnet
op mod logaritmen til tørhedsindekset for 102 områder
delt op på 37 unconsolidated og 65 igneous/metamorphic.
Vi vil betragte en model, hvor der for hver af de to overfladegrupper
er en lineær sammenhæng mellem
og
og benytte denne model til at undersøge eventuelle forskelle mellem de to
grupper.
Her følger først en grundmodel, hvor hver gruppe bestemt af en faktor
har sin egen lineære sammenhæng og sin egen varians. I eksemplet
ovenfor vil faktoren kode for de tre hæmmere INH1, INH2 og INH3.
Statistisk Model 7.1.1.
(Gruppebestemt regression og varians)
Vi betragter
uafhængige stokastiske
variable
en forklarende variabel
og en faktor
der inddeler data
i
grupper (som her betegnes med tallene
).
Modellen, vi vil analysere, er
Når vi forlanger, at der er samme varians i alle grupperne,
får vi følgende model.
Statistisk Model 7.1.2.
(Gruppespecifik regression)
Vi betragter
uafhængige stokastiske
variable
en forklarende variabel
og en faktor
der inddeler data
i
grupper (som her betegnes med tallene
).
Modellen, hvor hver gruppe har sin egen lineære sammenhæng er
Vi vil også betragte følgende undermodeller af den gruppespecifikke
regressionsmodel,
Den mest simple modelformel i
R til analyse af
model den gruppespecifikke regressionsmodel
er
For at forstå den parametrisering,
som
R bruger, skal man vide, at
R omskriver
modelformlen til
Leddet
giver den
gruppebestemte skæring
og i overensstemmelse
med den ensidede variansanalysemodel fra
afsnit
4.4
bruges parametrene
og forskellene
der betegnes
Gg,
Leddet
giver regressionen for den første gruppe, det vil sige
parameteren
og
giver afvigelserne fra denne
i de andre grupper, det vil sige
som
betegnes
G:t.
Den følgende tabel giver alternative måder at skrive modelformlen på
og de tilhørende parametriseringer i
R. I tabellen er
den gruppespecifikke regressionsmodel,
er
undermodellen med gruppespecifik skæring,
er
undermodellen med gruppespecifik hældning, og
modellen
med fælles skæring og fælles hældning i alle grupperne.
Blandt de to undermodeller af den gruppespecifikke regressionsmodel
7.1.2 er modellen med gruppespecifik
skæring den vigtigste.
Når
har vi en
"additiv struktur" af
og
: uanset hvilken undergruppe
der betragtes, er forskellen i middelværdier mellem to værdier af den
forklarende variabel
den samme, og uanset hvilken værdi af den
forklarende variabel der betragtes, er forskellen mellem to
grupper den samme.
Hvis man vil lave et
-test for
reduktion fra gruppespecifikke regressionsmodel til modellen med
en gruppespecifik skæring bruges
Resultat
6.7.1 med de to modelformler
xG*t og
xG+t.
-værdien for dette test findes fra en
-fordeling.
ForegåendeNæste