Afsnit 1.5: Homogenitetstest: hypotesen
Indtil nu har vi i dette kapitel udelukkende set på
observationer fra
n multinomialfordeling. Ofte vil man
have observationer fra flere "populationer" og ønsker at
sammenligne disse for at se, om der er samme forhold i
populationerne.
Her skal population forstås bredt. Det kan være biologiske
populationer, men kan også være undersøgelser lavet på
forskellige tidspunkter, eller for eksempel eksperimenter der
gentages.
Eksempel 1.5.1.
(Aktivitet af delfingrupper)
Data i dette eksempel vedrører aktivitetsmønster for grupper af delfiner.
Datasættet består af 72 delfingrupper observeret om morgenen, og
79 delfingrupper observeret om aftenen tæt på Keflavik på Island.
Data er af Marianne Rasmussen (SDU) lagt op på
StatSci.org.
Delfingrupperne er klassificeret efter hovedaktivitet, som kan være enten
Rejse,
Spise eller
Leg.
Fordelingen på de tre aktivitetskategorier er som følger.
Biologerne ønsker at vurdere,
om der er samme aktivitetsmønster om
morgenen som om aftenen.
Jeg formulerer nu situationen generelt. Vi betragter
populationer, og i den
'te er der i alt
observationer.
For hver population kategoriseres data i
kasser, og
antallene i disse kasser tælles:
er antallene i den
'te
population,
Som statistisk model benyttes
og de
populationer er uafhængige.
Vi ønsker at teste hypotesen, at der er samme forhold i de
populationer. Med dette menes, at sandsynligheden for at falde
i kasse
er den samme i de
populationer, og dette gælder
for alle kasser
Dette kan skrives formelt som
en ny model
hvorunder der findes et sæt sandsynligheder
således at
Hvis vi samler alle sandsynligheder i en
matriks,
kan hypotesen skrives på formen
Hypotesen kaldes
homogenitetshypotesen for kategoriske data.
ForegåendeNæste