Afsnit 6.2: Teste middelværdier ens når varianser er ens
Ofte er data indsamlet med henblik på at sammenligne middelværdierne i to
grupper.
Vi kan bedst fortolke en forskel i middelværdi hvis de to grupper har den
samme varians (eller samme spredning).
Hvis for eksempel spredningen udelukkende er en måleusikkerhed, og der bruges
samme målemetode i de to grupper, kan dette være et argument for
samme varians (tag som et eksempel afæsning af volumen i et måleglas).
Hvis vi antager samme varians, kan vi formulere
hypotesen om ens middelværdier som i
normalfordelingsmodellen
Statistisk Model 6.1.2.
Det virker rimeligt at se på, om
er tæt på nul, men dette
kan vi ikke afgøre uden at se på spredningen i de to grupper.
Vi laver derfor en standardisering ved hjælp af det fælles
spredningsskøn fra (6.1.1),
som beskrevet i det følgende resultat.
Resultat 6.2.1.
(Test af ens middelværdier)
Til test af hypotesen i Statistisk
Model 6.1.2, hvor de to grupper har samme varians,
bruges -teststørrelsen
-værdien, når alternativet er er
hvor
er den observerede værdi af Endvidere er et 95%-konfidensinterval for forskel
i middelværdi mellem gruppe 1 og gruppe2,
det vil sige for parameteren
givet ved formlen
Disse resultater følger på samme måde som resultaterne i
Resultat 4.4.2.
Specielt benytter vi, at med er
som sammen med fordelingen af i formel (6.1.1) giver, at
Konfidensintervallet følger nu af
Eksempel 6.2.2.
(Cell free DNA)
Vi vender tilbage til data omkring mængden af ekstraheret
cell free DNA, baseret på to protokoller
Qiagen og Triton,
beskrevet i indledningen til kapitel 6.
Lad og betegne de tilhørende
stokastiske variable, og betragt
Statistisk Model 6.1.2 skrevet her som
hvor kan variere frit. Fra data udregnes de følgende størrelser (beregningerne er
lavet i kodevinduet længere fremme),
hvor er det fælles variansskøn fra (6.1.1).
Forfatterne ønsker at undersøge, om data peger på en
forskel i de to protokoller for ekstrahering. Dette kan formuleres som
hypotesen, at de to middelværdier er ens,
og vi ønsker ikke på forhånd at lægge os fast på et
alternativ i en bestemt retning, således at alternativet er
-teststørrelsen for denne hypotese
bliver
og den tilhørende -værdi fra en -fordeling
er
Da denne er meget mindre end 0.05, bliver konklusionen, at data strider mod
samme middelværdi, og da
tyder data altså på,
at der i middel ekstraheres mindre CFDNA med Qiagen-metoden
sammenlignet med Triton-metoden. Vi kan kvantificere forskellen i middelværdi mellem Qiagen og Triton
ved at lave et 95%-konfidensinterval.
Hertil bruges 97.5%-fraktilen i en -fordeling,
og konfidensintervallet bliver
Med 95% sikkkerhed ligger middelværdien
af den ekstraherede mængde CFDNA ved Qiagen-metoden
mellem 15.7 og 24.4 (procentpoint)
under middelværdien ved Triton-metoden. Man taler somme tider om forskel i middelværdi divideret med spredning
som standardiseret effektstørrelse, og en
effektstørrelse større end 1 anses for stor. I tilfældet her er skønnet
over den standardiserede effektstørrelse
som derfor vil omtales som en stor effekt.
Den teoretiske standardiserede effektstørrelse er
Den beskriver, hvor adskilte de
to populationer er. I kodevinduet nedenfor kan I afprøve forskellige
effektstørrelser og se den tilhørende adskillelse i form af
tæthedsfunktionerne i de to fordelinger.
Jeg viser i kodevinduet nedenfor hvordan testet for ens middelværdier
kan laves direkte i python. I afsnit 6.5 laves testet
mere simpelt under brug af mere avancerede pythonfunktioner.