Afsnit 7.2: Analyse af sediment transport

Jeg vil i dette afsnit lave en analyse af data i det foregående afsnit omkring transportkoefficienten i sedimenttransport. Lad være logaritmen til den beregnede transportkoefficient lad være logaritmen til tørhedsindeks og lad være overfladeforhold for det 'te område, hvor kan have de to værdier og for unconsolidated og metamorphic/igneous. Jeg starter med modellen 7.1.1 med gruppebestemt regression og varians, her formuleret som
hvor målingerne er uafhængige, og alle parametrene kan variere frit. Denne model siger, at hver gruppe har sin egen lineære sammenhæng, og hver gruppe har sin egen spredning omkring den lineære sammenhæng. Et qqplot af residualer for hver af de to overfladegrupper viser ikke afvigelse fra en normalfordeling. Et test for hypotesen om samme varians, kan udføres som i afsnit 4.13 under brug af R-funktionen var.test. Input er de to output fra lm anvendt på hver af de to grupper af observationer. Kørsel af koden nedenfor viser, at -værdien fra dette test er 0.56, og data strider derfor ikke mod hypotesen om samme varians. Koden viser også, hvordan man kan kalde Bartlett.test i denne situation.

7.2.1 QQplots og Bartletts test for varianshomogenitet

Se opstartskoden (til/fra)

Da vi kan antage, at de to varianser er ens, betragtes nu den gruppespecifikke regressionsmodel, Statistisk Model 7.1.2, her skrevet som
Det venstre delplot i figuren nedenfor viser data med de to estimerede linjer indtegnet. Inden for dataområdet ligger linjen for unconsolidated sedimenter under linjen for igneous/metamorphic gruppen, selvom unconsolidated har en større hældning. Den større hældning er imidlertid ikke signifikant. Hvis vi laver -testet for reduktion fra den gruppespecifikke regressionsmodel til den gruppespecifikke skæringsmodel (se Statistisk Model 7.1.2), hvor de to grupper af observationer har den samme hældning i den lineære sammenhæng, får vi en -værdi på 0.28. Data strider altså ikke mod hypotesen Skøn og konfidensintervaller for parametrene i modellen med samme hældning er,
Data med de estimerede linjer under den gruppespecifikke skæringsmodel er vist i det midterste delplot i figuren nedenfor. Da vores model er for logaritmetransformerede data, kan vi skrive de estimerede relationer kortfattet på formen for unconsolidated gruppen, og for igneous/metamorphic gruppen. For samme værdi af tørhedsindekset har igneous/metamorphic gruppen en transportkoefficient, der næsten er dobbelt så stor som for unconsolidated gruppen (her taler vi om middelværdier). Et test, under den gruppespecifikke skæringsmodel, for hypotesen om samme skæring, giver en -værdi på 0.0006. Modellen kan altså ikke reduceres til modellen, hvor begge grupper har den samme lineære sammenhæng.
Vi reducerede ovenfor beskrivelsen af data fra den gruppespecifikke regressionsmodel til den gruppespecifikke skæringsmodel, hvor de to grupper har samme hældning. For disse data kan det imidlertid også give mening at betragte den gruppespecifikke hældningsmodel, hvor de to skæringer er ens. Dette skyldes, at når logAI er nul, så er AI lig med 1, som betyder, at den årlige gennemsnitsnedbør er lig med den årlige gennemsnitsfordampning. En fælles skæring vil således være et udsagn om, at transportkoefficienten er uafhængig af overfladetype, når Et test for reduktion fra den gruppespecifikke regressionsmodel til den gruppespecifikke hældningsmodel giver en -værdi på 0.12, og vi siger derfor, at data ikke strider mod denne reduktion. De estimerede linjer under den gruppespecifikke hældningsmodel er vist i det højre delplot i figuren ovenfor. Data i dette eksempel kan således lede frem til to vidt forskellige modeller, der begge synes fagligt rimelige. At dette kan lade sig gøre hænger sammen med, at data udviser en meget stor spredning omkring de estimerede linjer.
I artiklen, hvor data stammer fra, deles data også op efter, hvordan transportkoefficienen beregnes, og der laves en analyse analog til analysen ovenfor, når data i stedet deles op efter beregningsmetoden. Desværre giver dette anledning til en stor usikkerhed omkring fortolkningen af resultaterne, vi kom frem til ovenfor. Det viser sig nemlig, at opdeling efter metode til beregning af transportkoefficienten i store træk er den samme som opdeling efter overfladetype (unconsolidated eller igneous/metamorphic). Vi kan derfor ikke vide, om de forskelle, der ses i data, skyldes overfladeforholdene eller skyldes beregningsmetoden!

7.2.2 F-tests og parametertabel

Se opstartskoden (til/fra)

ForegåendeNæste