Afsnit 6.9: Øvelse 6: IT

Denne uges øvelse har til formål at gøre jer fortrolige med den generelle lineære normale model gennem nogle grundlæggende eksempler. Efter øvelsen skal I vide, hvad en faktor er, og I skal have en forståelse af det generelle -test for reduktion af middelværdimodellen.
Opgaverne 6.1-6.3 skal være forberedt hjemmefra og gennemgås ved tavlen til øvelserne. Efter øvelsen skal der afleveres en rapport over opgave 6.4.

Opgave 6.1: Ensidet variansanalyse

I denne opgave betragter vi igen tidsforbruget til at flytte en pointer fra et område til et område se figur i opgave 1.5. Vi betragter målinger for en enkelt person for fire forskellige konfigurationer af computermusen, der bruges til at flytte pointer. De fire konfigurationer adskiller sig ved accelerationen af pointer. For hver konfiguration er der mellem 22-28 gentagne tidsmålinger. Data er i filen PointerAcceleration.csv, som har 2 søjler med henholdsvis musekonfiguration og tidsforbrug (målt i sekunder). Gennemsnit og empirisk spredning for hver konfiguration af musen er gengivet i den følgende tabel.
  1. Indlæs data, og dan de to variable konfig og tid med indholdet af de to søjler. Lav et boxplot og et qqplot af tid opdelt efter konfig. Du kan lade dig inspirere af koden i afsnit 6.2. Overvej, hvad disse figurer viser om forholdet mellem spredningerne for de fire konfigurationer og forholdet mellem middelværdierne.
  2. Opskriv den statistiske model, hvor data er delt ind i fire grupper svarende til de fire konfigurationer, og data er normalfordelt med en middelværdi og varians, der afhænger af gruppen.
    Opskriv hypotesen, at de fire varianser er ens. Lav Bartletts test, for at de fire varianser er ens. Hvad bliver konklusionen af testet?
  3. Opskriv den statistiske model, hvor middelværdien afhænger af konfigurationen, men de fire varianser er ens. Find estimater i denne model (både for middelværdierne og for spredningen). Benyt parametertabellen til at lave et -test for hypotesen, at
    Angiv et 95%-konfidensinterval for
  4. Opskriv hypotesen, at de fire middelværdier er ens, og lav et test for denne hypotese ved et passende kald til anova.
    Hvad bliver konklusionen i denne opgave: er det rimeligt at sige, at der er samme middelværdi af tidsforbruget til at flytte pointer for de fire konfigurationer af computermusen?

Opgave 6.2: Tosidet variansanalyse

Data i denne opgave er inspireret af, men ikke helt identisk med data fra artiklen Two-way anova with interaction approach to compare content creation speed performance in knowledge management system. I artiklen laves hastighedsmålinger i et Knowledge Management System (KMS), idet der deles op i de fire moduler Documents, Video, Material og Binuspedia, og der deles op i tre områder på BINUS universitetscampus i Indonesien: Anggrek, Syahdan og Alam Sutera. Man måler tiden (i sekunder) for at uploade en 22.5 MB fil, og dette gentages 5 gange for hvert modul og hvert område. Ønsket med undersøgelsen er at se, hvordan modul og område spiller sammen. Gennemsnit og empirisk spredning er gengivet for hver kombination af modul og område i den følgende tabel.
Data findes i filen BINUS.csv, hvor hver række svarer til en måling, og søjle 1 angiver modul, søjle 2 angiver område og søjle 3 indeholder uploadtiderne.
  1. Indlæs data, og dan de tre variable modul, omraade og tid med indholdet af de tre søjler.
    Med kun 5 observationer for hver kombination af modul og område kan vi ikke lave qqplots for at vurdere, om data er normalfordelte. For at få et overblik over data kan I bruge kommandoen plot(as.numeric(modul:omraade),tid).
    Lav dernæst interaktionsplot for uploadtiderne i forhold til de to faktorer med modul og område (se omtalen af funktionen additivitetsPlot i det skjulte punkt Interaktionsplot i afsnit 6.6).
  2. Opskriv modellen, hvor uploadtiden hørende til hver gruppe bestemt af modul og område følger sin egen normalfordeling.
    Opskriv hypotesen, at varianserne i de 12 grupper er ens, og lav Bartletts test for denne hypotese. Er det rimeligt at sige, at de 12 varianser er ens?
  3. Opskriv modellen, hvor uploadtiden er normalfordelt, og hver gruppe bestemt af modul*område har sin egen middelværdi, og alle har den samme varians. Lav et qqplot af residualerne fra denne model. Opskriv inden for denne model additivitetshypotesen, hvor middelværdien består af et bidrag fra modul og et bidrag fra område.
    Lav et test, for at data kan beskrives med den additive model. Hvad bliver konklusionen af testet? Stemmer konklusionen, med hvad du kan se i interaktionsplottet?
  4. Lav et test for henholdsvis ingen effekt af modul og ingen effekt af område inden for den additive model.
  5. Betragt modellen, hvor der kun er en effekt af modul. Angiv skøn og 95%-konfidensintervaller for forskel i middelværdi mellem et modul og modulet Binuspedia.
    Giv en beskrivelse af, hvad tallene viser.

Opgave 6.3: Teste for en lineær sammenhæng

I denne opgave skal I igen se på Fitts lov omkring tidsforbruget for at flytte en pointer fra et område til et område , som vist i figuren i opgave 1.5. Man bruger ofte en model, hvor middelværdien af tidsforbruget er lineært i hvor er bredden af målområdet, er afstanden mellem og og er 2-talslogaritmen. I denne opgave skal I se på data fra en enkelt person, hvor afstanden holdes fast (), og der betragtes fire forskellige værdier af og For hver værdi af har vi 5 målinger af tidsforbruget. Data, som er stillet til rådighed af Jörg Müller, ligger i filen FittsLov4W.csv, der har to søjler, hvor første søjle er værdierne af og anden søjle er tidsforbruget.
  1. Indlæs data, og og dan variablene bredde og tid ud fra de to søjler i de indlæste data. Dan endvidere faktoren fakBredde ud fra variablen bredde og variablen logBredde med logaritmen til bredden. Lav en figur, hvor tidsforbruget afsættes mod logaritmen til bredden. Beregn gennemsnit (benyt tapply(tid,fakBredde,mean)) for hver breddegruppe og indtegn disse gennemsnit som en kurve i figuren. Indsæt endelig regressionslinjen fra en regression af tidlogBredde.
  2. Opskriv den statistiske model hvor hver breddegruppe har sin egen middelværdi af tidsforbruget, og varianserne er ens.
    Opskriv også den statistiske model hvor middelværdien af tidsforbruget afhænger lineært af logaritmen til bredden.
    Lav nu -testet for reduktion fra model til model Hvad bliver konklusionen af testet: er det rimeligt at sige, at middelværdien af tidsforbruget afhænger lineært af logaritmen til bredden?
  3. Angiv 95%-konfidensintervaller for skæring og hældning og for spredning omkring linjen i den lineære regressionsmodel. Hvor meget reduceres tidsforbruget, hvis målområdet gøres dobbelt så bredt?
  4. Find i den lineære regressionsmodel -værdien for test af hypotesen, at hældningen er nul. Når hældningen er nul, betyder dette, at alle observationerne har samme middelværdi. Prøv dernæst at køre kommandoen anova(lm(tid1),lm(tidfakBredde)), og aflæs -værdien for testet her. Er der noget, der undrer dig, når du sammenligner de to -værdier?

Opgave 6.4: Afleveringsopgave

I artiklen Effects of user age on smartphone and tablet use, measured with an eye-tracker via fixation duration, scan-path duration, and saccades proportion studeres, hvordan brugen af smartphones og tablets varierer mellem forskellige aldersgrupper. Under brugen følges en persons øjenbevægelse, og herudfra dannes et mål SPD (scan-path duration, målt i millisekunder), der afspejler en persons evne til at bruge redskabet. I artiklen siges der: "SPD measures global processing of interfaces, where longer SPD indicates less efficient scanning and browsing". Personer deles op i tre aldersgrupper: unge, midaldrende og aeldre. Desuden fordeles personerne på to eksperimenter (Ex1 og Ex2). Hvert eksperiment består af ni opgaver inden for brugen af forskellige smartphone apps, og opgaven hørende til en app er forskellig mellem de to eksperimenter. Data er i filen Smartphone.csv der har tre søjler med henholdsvis eksperiment, aldersgruppe og SPD-målingen.
  1. Lav en figur med 3 delplots med qqplots af SPD for de tre aldersgrupper for eksperiment 1. Kommenter på figuren.
    Opskriv den statistiske model, hvor hver gruppe bestemt af aldersgruppe og eksperiment har sin egen middelværdi og sin egen varians af SPD, og data er normalfordelt. Lav et test for hypotesen, at der er samme varians i de 6 grupper.
  2. Lav et interaktionsplot, og kommenter på hvad du ser i figuren. Opskriv modellen, hvor hver gruppe bestemt af aldersgruppe og eksperiment har sin egen middelværdi af SPD, og alle grupperne har den samme varians. Opskriv hypotesen om en additiv struktur af middelværdien med et bidrag fra aldersgruppe og fra eksperiment. Lav -testet for hypotesen om additivitet.
  3. Undersøg, om det kan antages, at aldersgruppe ikke har nogen effekt på SPD. Undersøg også, om eksperiment har nogen effekt på SPD. Husk at skrive modellerne op.
  4. Angiv skøn over middelværdien blandt de aeldre for eksperiment Ex1. Angiv et 95%-konfidensinterval for forskellen i middelværdi af SPD mellem gruppen af unge og gruppen af aeldre inden for den additive model.
    Angiv skøn over spredningen på SPD i den additive model.

ForegåendeNæste