Afsnit 5.1: Gruppespecifik regression

De fleste af jer har nok set reportager i nyhederne fra mudderskred rundt omkring i verdenen. For geologer er dette et af bidragene til sedimenttransport på skrånende flader. Det er forventeligt, at sedimenttransporten vil være større, jo større hældning en flade har, og geologerne formulerer dette som relationen
Dette svarer lidt til en diffusionstypeligning. Det følgende billede viser et mudderskred i Virginia efter en orkan i 2004.
Jeg vil ikke her komme ind på, hvordan man estimerer en værdi af transportkoefficienten men i stedet se på en undersøgelse, hvor man prøver at beskrive ud fra andre forhold såsom nedbørsmængde og jordforhold. I artiklen Influences of climate and life on hillslope sediment transport relateres data for til et tørhedsindeks (aridity index AI) og til overfladestuktur (lithology) delt op på de to kategorier unconsolidated og igneous/metamorphic. Tørhedsindekset beregnes som gennemsnitlig årsnedbør divideret med et gennemsnitligt potentiel årsfordampningstal. Et tørhedsindeks på 1 svarer derfor til en form for "ligevægt" mellem nedbør og fordampning. Løseligt sagt, jo større tørhedsindeks jo mere vand er der til rådighed til sedimenttransport. Figuren nedenfor viser logaritmen til transportkoefficienten tegnet op mod logaritmen til tørhedsindekset for 102 områder delt op på 37 unconsolidated og 65 igneous/metamorphic. Vi vil betragte en model, hvor der for hver af de to overfladegrupper er en lineær sammenhæng mellem og og benytte denne model til at undersøge eventuelle forskelle mellem de to grupper.
I en generel formulering har vi data fra uafhængige stokastiske variable en forklarende variabel og en faktor gr, der inddeler data i grupper (som her betegnes med tallene ). Modellen, vi vil analysere, er
Denne model siger, at hver undergruppe, givet ved et bestemt niveau af gr, har sin egen lineære sammenhæng mellem den forklarende variabel og middelværdien af respons Model har følgende naturlige undermodeller:
hvor er regressionsmodellen med fælles hældning og gruppespecifik skæring, er regressionsmodellen med fælles skæring og gruppespecifik hældning, og er modellen med både fælles hældning og fælles skæring.
Den mest simple modelformel i R til analyse af model er For at forstå den parametrisering, som R bruger, skal man vide, at R omskriver modelformlen til Leddet gr giver den gruppebestemte skæring og i overensstemmelse med den ensidede variansanalysemodel fra afsnit 4.4 bruges parametrene og forskellene der betegnes grg, Leddet giver regressionen for den første gruppe, det vil sige parameteren og giver afvigelserne fra denne i de andre grupper, det vil sige som betegnes grg:t. Den følgende tabel giver alternative måder at skrive modelformlen på og de tilhørende parametriseringer i R.
Blandt undermodellerne og er den første den vigtigste. Når har vi en "additiv struktur" af gr og : uanset hvilken undergruppe der betragtes, er forskellen i middelværdier mellem to værdier af den forklarende variabel den samme, og uanset hvilken værdi af den forklarende variabel der betragtes, er forskellen mellem to grupper den samme. I R laves -testet fra Resultat 4.7.1 for reduktion fra model til model med kommandoen
anova(lm(xgr+t),lm(xgr*t))
-værdien for dette test findes fra en -fordeling.
ForegåendeNæste