Afsnit 6.2: Teste middelværdier ens når varianser er ens

Ofte er data indsamlet med henblik på at sammenligne middelværdierne i to grupper. Vi kan bedst fortolke en forskel i middelværdi hvis de to grupper har den samme varians (eller samme spredning). Hvis for eksempel spredningen udelukkende er en måleusikkerhed, og der bruges samme målemetode i de to grupper, kan dette være et argument for samme varians (tag som et eksempel afæsning af volumen i et måleglas). Hvis vi antager samme varians, kan vi formulere hypotesen om ens middelværdier som i normalfordelingsmodellen Statistisk Model 6.1.2. Det virker rimeligt at se på, om er tæt på nul, men dette kan vi ikke afgøre uden at se på spredningen i de to grupper. Vi laver derfor en standardisering ved hjælp af det fælles spredningsskøn fra (6.1.1), som beskrevet i det følgende resultat.
Resultat 6.2.1. (Test af ens middelværdier)
Til test af hypotesen i Statistisk Model 6.1.2, hvor de to grupper har samme varians, bruges -teststørrelsen
-værdien, når alternativet er er hvor er den observerede værdi af
Endvidere er et 95%-konfidensinterval for forskel i middelværdi mellem gruppe 1 og gruppe2, det vil sige for parameteren givet ved formlen
Disse resultater følger på samme måde som resultaterne i Resultat 4.4.2. Specielt benytter vi, at med er som sammen med fordelingen af i formel (6.1.1) giver, at Konfidensintervallet følger nu af
Eksempel 6.2.2. (Cell free DNA)
Vi vender tilbage til data omkring mængden af ekstraheret cell free DNA, baseret på to protokoller Qiagen og Triton, beskrevet i indledningen til kapitel 6. Lad og betegne de tilhørende stokastiske variable, og betragt Statistisk Model 6.1.2 skrevet her som
hvor kan variere frit.
Fra data udregnes de følgende størrelser (beregningerne er lavet i kodevinduet længere fremme),
hvor er det fælles variansskøn fra (6.1.1). Forfatterne ønsker at undersøge, om data peger på en forskel i de to protokoller for ekstrahering. Dette kan formuleres som hypotesen, at de to middelværdier er ens, og vi ønsker ikke på forhånd at lægge os fast på et alternativ i en bestemt retning, således at alternativet er -teststørrelsen for denne hypotese bliver
og den tilhørende -værdi fra en -fordeling er
Da denne er meget mindre end 0.05, bliver konklusionen, at data strider mod samme middelværdi, og da tyder data altså på, at der i middel ekstraheres mindre CFDNA med Qiagen-metoden sammenlignet med Triton-metoden.
Vi kan kvantificere forskellen i middelværdi mellem Qiagen og Triton ved at lave et 95%-konfidensinterval. Hertil bruges 97.5%-fraktilen i en -fordeling, og konfidensintervallet bliver
Med 95% sikkkerhed ligger middelværdien af den ekstraherede mængde CFDNA ved Qiagen-metoden mellem 15.7 og 24.4 (procentpoint) under middelværdien ved Triton-metoden.
Man taler somme tider om forskel i middelværdi divideret med spredning som standardiseret effektstørrelse, og en effektstørrelse større end 1 anses for stor. I tilfældet her er skønnet over den standardiserede effektstørrelse som derfor vil omtales som en stor effekt.

Effektstørrelse

Den teoretiske standardiserede effektstørrelse er Den beskriver, hvor adskilte de to populationer er. I kodevinduet nedenfor kan I afprøve forskellige effektstørrelser og se den tilhørende adskillelse i form af tæthedsfunktionerne i de to fordelinger.

Beregninger i python

Jeg viser i kodevinduet nedenfor hvordan testet for ens middelværdier kan laves direkte i python. I afsnit 6.5 laves testet mere simpelt under brug af mere avancerede pythonfunktioner.

Se opstartskoden (til/fra)

ForegåendeNæste