Afsnit 3.6: Homogenitetstest: hypotesen
Indtil nu har vi i dette kapitel udelukkende set på
observationer fra
n multinomialfordeling. Ofte vil man
have observationer fra flere "populationer" og ønsker at
sammenligne disse for at se, om der er samme forhold i
populationerne.
Her skal population forstås bredt. Det kan være biologiske
populationer, men kan også være undersøgelser lavet på
forskellige tidspunkter, eller for eksempel eksperimenter der
gentages.
Eksempel 3.6.1.
(Dannelse af biofilm)
Bakterier kan danne biofilm på overflader. I artiklen
Biofilm formation by avian Escherichia coli in relation to media, source and phylogeny
deles evnen til at danne biofilm op i de tre kategorier
weak,
moderate og
strong. Opdelingen
baserer sig på en længere eksperimentel procedure, hvor der til sidst
måles en
optical density (OD) ved 600 nm, og værdien af denne
bestemmer de tre kategorier.
I artiklen betragtes 105 eksperimenter med
bakterietypen
avian pathogenic Escherichia coli (pathogenic)
og 103 eksperimenter med
avian faecal commensal E. (faecal).
I artiklen betragtes tre vækstmedier, og data vi betragter er tilfældet med
en 1/20 fortynding af bakteriekulturen.
Fordelingen på de tre kategorier for dannelse af biofilm er som følger.
Det faglige spørgsmål som ønskes undersøgt er om de to bakterietyper
reagerer ens.
Jeg formulerer nu situationen generelt.
Statistisk Model 3.6.2.
(Flere Multinomialfordelinger)
Vi betragter
populationer, og i den
'te er der i alt
observationer.
For hver population kategoriseres data i
kasser, og
antallene i disse kasser tælles:
er antallene i den
'te
population,
Som statistisk model benyttes
og de
populationer er uafhængige. Nedenfor vil jeg
betegne denne model med
Vi ønsker at teste hypotesen, at der er samme forhold i de
populationer. Med dette menes, at sandsynligheden for at falde
i kasse
er den samme i de
populationer, og dette gælder
for alle kasser
Dette kan skrives formelt som
en ny model
hvorunder der findes et sæt sandsynligheder
således at
Hvis vi samler alle sandsynligheder i en
matriks,
kan hypotesen skrives på formen
Hypotesen kaldes
homogenitetshypotesen for kategoriske data.
ForegåendeNæste