Afsnit 3.6: Homogenitetstest: hypotesen
Indtil nu har vi i dette kapitel udelukkende set på
observationer fra
n multinomialfordeling. Ofte vil man
have observationer fra flere "populationer" og ønsker at
sammenligne disse for at se, om der er samme forhold i
populationerne.
Her skal population forstås bredt. Det kan være biologiske
populationer, men kan også være undersøgelser lavet på
forskellige tidspunkter, eller for eksempel eksperimenter der
gentages.
Eksempel 3.6.1.
(Tillægge robotter menneskelignende egenskaber)
Hvornår tillægger vi robotter menneskelignende egenskaber
 ?
I artiklen
Anthropomorphic language in online forums about Roomba,
AIBO and the iPad
forsøges dette belyst ved at sammenligne indlæg på tre
diskussionsfora, der vedrører henholdsvis iPad'en, en robotstøvsuger
Roomba og en robot legehund Aibo.
Hvert indlæg (egentligt
delindlæg eftersom lange indlæg
deles op i delindlæg) klassificeret som indeholdende
(antropomorft)
eller ikke indeholdende menneskelignende ud fra 6 beskrevne
muligheder. Tabellen nedenfor indeholder det samlede antal
indlæg og antallet med antropomorft indhold for de tre
fora.
I artiklen laves der et test for, om der er samme
frekvens af antropmorfe indlæg i de tre fora. Dette test
beskrives generelt i det følgende.
Jeg formulerer nu situationen generelt.
Statistisk Model 3.6.2.
(Flere Multinomialfordelinger)
Vi betragter
populationer, og i den
'te er der i alt
observationer.
For hver population kategoriseres data i
kasser, og
antallene i disse kasser tælles:
er antallene i den
'te
population,
Som statistisk model benyttes
og de
populationer er uafhængige. Nedenfor vil jeg
betegne denne model med
Vi ønsker at teste hypotesen, at der er samme forhold i de
populationer. Med dette menes, at sandsynligheden for at falde
i kasse
er den samme i de
populationer, og dette gælder
for alle kasser
Dette kan skrives formelt som
en ny model
hvorunder der findes et sæt sandsynligheder
således at
Hvis vi samler alle sandsynligheder i en
matriks,
kan hypotesen skrives på formen
Hypotesen kaldes
homogenitetshypotesen for kategoriske data.
ForegåendeNæste