Afsnit 3.6: Homogenitetstest: hypotesen

Indtil nu har vi i dette kapitel udelukkende set på observationer fra n multinomialfordeling. Ofte vil man have observationer fra flere "populationer" og ønsker at sammenligne disse for at se, om der er samme forhold i populationerne. Her skal population forstås bredt. Det kan være biologiske populationer, men kan også være undersøgelser lavet på forskellige tidspunkter, eller for eksempel eksperimenter der gentages.
Eksempel 3.6.1. (Dannelse af biofilm)
Bakterier kan danne biofilm på overflader. I artiklen Biofilm formation by avian Escherichia coli in relation to media, source and phylogeny deles evnen til at danne biofilm op i de tre kategorier weak, moderate og strong. Opdelingen baserer sig på en længere eksperimentel procedure, hvor der til sidst måles en optical density (OD) ved 600 nm, og værdien af denne bestemmer de tre kategorier. I artiklen betragtes 105 eksperimenter med bakterietypen avian pathogenic Escherichia coli (pathogenic) og 103 eksperimenter med avian faecal commensal E. (faecal).
I artiklen betragtes tre vækstmedier, og data vi betragter er tilfældet med en 1/20 fortynding af bakteriekulturen. Fordelingen på de tre kategorier for dannelse af biofilm er som følger.
Det faglige spørgsmål som ønskes undersøgt er om de to bakterietyper reagerer ens.
Jeg formulerer nu situationen generelt.
Statistisk Model 3.6.2. (Flere Multinomialfordelinger)
Vi betragter populationer, og i den 'te er der i alt observationer. For hver population kategoriseres data i kasser, og antallene i disse kasser tælles: er antallene i den 'te population, Som statistisk model benyttes
og de populationer er uafhængige. Nedenfor vil jeg betegne denne model med
Vi ønsker at teste hypotesen, at der er samme forhold i de populationer. Med dette menes, at sandsynligheden for at falde i kasse er den samme i de populationer, og dette gælder for alle kasser Dette kan skrives formelt som en ny model hvorunder der findes et sæt sandsynligheder således at
Hvis vi samler alle sandsynligheder i en matriks, kan hypotesen skrives på formen
Hypotesen kaldes homogenitetshypotesen for kategoriske data.
ForegåendeNæste