Afsnit 8.6: Analyse i python og parametrisering

Den tosidede variansanalysemodel 8.5.3 i foregående afsnit, hvor hver gruppe har sin egen middelværdi, analyseres med kaldet xG*H. Den additive model 8.5.4 analyseres med kaldet xG+H. Lad os starte med at forstå parametertabellen i output for den sidste model. Vi kan forstå output ved, for og at skrive
hvor højresiden viser de parametre, der bruges ved kaldet xG+H. Vi ser her, at modellen kan parametriseres med parametre, nemlig , og . Går vi nu tilbage til den tosidede variansanalysemodel, skriver vi i stedet
hvor den anden linje viser de parametre, der bruges ved kaldet xG*H. Det sidste led kaldes interaktionen mellem de to faktorer. I den tosidede variansanalysemodel er G[T.u] således forskel mellem niveau og niveau 1 for faktoren når faktoren ligger på niveau 1, og vice versa for H[T.v]. Det nyttige ved den additive model er, at G[T.u] nu er forskel mellem niveau og niveau 1 for faktoren uanset hvilket niveau faktoren befinder sig på, og H[T.v] er forskel mellem niveau og niveau 1 for faktoren uanset hvilket niveau faktoren befinder sig på.

Parametrisering i python

Som for den ensidede variansanalyse i afsnit 8.4 betragter vi her simulerede data med spredning således at vi direkte kan se parametrene, der bruges i python. Vi betragter den additive model 8.5.4.

Se opstartskoden (til/fra)

MATLAB-kode

  1. Hvad er middelværdien for en observation med gFak på niveau "2" og hFak på niveau "B"? Hvad er værdien af Intercept+gFak[T.2]+hFak[T.B]?
  2. Udtryk python-parametrene Intercept, hFak[T.B], hFak[T.C] og gFak[T.2] ud fra eta og zeta.
  3. Opskriv de statistiske modeller svarende til henholdsvis modelformlen 'x~gFak*hFak' og til modelformlen 'x~gFak+hFak'.

Svar: Forstå output

  1. Fra gFak kommer bidraget 3 til middelværdien og fra hFak bidraget 0, hvorfor middelværdien er som er middelværdien, vi lige har udregnet.
  2. Intercept=, gFak[T.2]=, hFak[T.B]= og hFak[T.C]=.
  3. Det 'te respons er og den 'te værdi af de to faktorer er og Model svarende til det første kald siger, at hver undergruppe givet ved de to faktorer har sin egen middelværdi, Model svarende til det andet kald siger, at middelværdien består af et bidrag fra gruppen bestemt af faktoren gFak plus et bidrag fra gruppen bestemt af faktoren hFak,

Eksempel 8.6.1. (Fremføring af medicin)
Vi betragter data omtalt i foregående afsnit omkring fremføring af kræftmedicin i kroppen. Lad være den stokastiske variabel, der angiver respons (logarimen af fluorescensmåling), og lad og være de tilhørende værdier for de to faktorer prodrug og tid, hvor prodrug har niveauerne "a" og "M", og tid har niveauerne "T1", "T2", "T3", "T4" of "T5". Lad os starte med den grundlæggende tofaktormodel 8.5.2, her skrevet som
hvor hver gruppe bestemt af prodrug*tid har sin egen middelværdi og sin egen varians, og de 10 middelværdier og varianser kan variere frit. Først undersøges hypotesen om fælles varians:
Beregningerne nedenfor i python viser, at Bartlett teststørrelsen er 15.53, og den tilhørende -værdi fra en -fordeling er 0.077. Data strider således ikke mod hypotesen om samme varians i de 10 grupper, og modellen ovenfor kan reduceres til den tosidede variansanalysemodel 8.5.3, her skrevet som
hvor de 10 middelværdier og den fælles varians kan variere frit. Vi ønsker nu at teste reduktionen til den additive model 8.5.4 skrevet som
Vi har ovenfor lavet interaktionsplots, der viser overensstemmelse med den additive model. Parametertabellen hørende til den tosidede variansanalysemodel viser, at der er fire parametre, der vedrører interaktionen mellem prodrug og tid nemlig prodrug[T.a]:tid[T.T2], prodrug[T.a]:tid[T.T5]. For alle fire parametre er -værdien langt over 0.05, hvilket også indikerer at data ikke strider mod den additive model. Da vi har fire -værdier kan vi dog ikke bruge disse som et formelt test for reduktion til den additive model. I næste afsnit indføres et -test for at teste hypotesen om additivitet, og for data her fås en -værdi på 0.75. Konklusionen er derfor, at data ikke strider mod hypotesen om additivitet.
Under den additive model kan vi lave et test, for at prodrug ingen effekt har, det vil sige hypotesen , eller ækvivalent hermed teste reduktion fra den additive model til en ensidet variansanalysemodel, hvor kun faktoren tid indgår. Vi kan også formulere hypotesen som , og et -test for denne hypotese er automatisk en del af parametertabellen under den additive model. Fra parametertabellen ser vi, at -værdien for dette test er mindre end (den præcise værdi er , som I kan finde i output i kodevinduet i næste afsnit), og data strider derfor mod reduktion af modellen. Vi kan også fra parametertabellen se, at der en kraftig forskel mellem og hørende til et af de andre tidspunkter (-værdien for test af for eksempel er mindre en 0.00005). Et test for ingen effekt af Tid, , kan laves med det generelle -test i næste afsnit og giver en -værdi på .
Konfidensinterval for forskel i middelværdi mellem de to prodrugsystemer, , er hvilket kan sammenholdes med, at skønnet over spredningen er 0.27, således at den standardiserede effektstørrelse er stor. Da dette er et konfidensinterval for logaritmen til målingen, er konfidensintervallet for forholdet mellem middelværdierne af de oprindelige målinger For prodrugsystemet acac optages altså mellem 2.6 og 4.8 gange så meget som i Meacac systemet. Gå eventuelt tilbage og se, at dette stemmer overens med figuren i foregående afsnit.

8.6.2 Bartletts test og parametertabeller

Se opstartskoden (til/fra)

MATLAB-kode

ForegåendeNæste