Denne uges øvelse har til formål at gøre jer fortrolige med
den generelle lineære normale model gennem nogle grundlæggende eksempler.
Efter øvelsen skal I vide, hvad en faktor er, og
I skal have en forståelse af det generelle -test for
reduktion af middelværdimodellen. Opgaverne 6.1-6.3 skal være forberedt hjemmefra og gennemgås ved tavlen til
øvelserne. Efter øvelsen skal der afleveres en rapport over opgave 6.4.
I denne opgave betragter vi igen tidsforbruget til at flytte en pointer
fra et område til et område se figur i opgave 1.5.
Vi betragter målinger for en enkelt person for fire forskellige
konfigurationer af computermusen, der bruges til at flytte pointer.
De fire konfigurationer adskiller sig ved accelerationen af pointer.
For hver konfiguration er der mellem 22-28 gentagne tidsmålinger.
Data er i filen PointerAcceleration.csv,
som har 2 søjler med henholdsvis musekonfiguration og
tidsforbrug (målt i sekunder). Gennemsnit og empirisk
spredning for hver konfiguration af musen
er gengivet i den følgende tabel.
Indlæs data, og dan de to variable konfig og
tid med indholdet af de to søjler.
Lav et boxplot og et qqplot af tid opdelt efter
konfig.
Du kan lade dig inspirere af koden i
afsnit 6.2.
Overvej, hvad disse figurer viser om forholdet mellem spredningerne
for de fire konfigurationer og forholdet mellem middelværdierne.
Opskriv den statistiske model, hvor data er delt ind i fire
grupper svarende til de fire konfigurationer, og data er normalfordelt
med en middelværdi og varians, der afhænger af gruppen. Opskriv hypotesen, at de fire varianser er ens. Lav
Bartletts test, for at de fire varianser er ens.
Hvad bliver konklusionen af testet ?
Opskriv den statistiske model, hvor middelværdien
afhænger af konfigurationen, men de fire varianser er ens.
Find estimater i denne model (både for middelværdierne og for spredningen).
Benyt parametertabellen til at lave et
-test for hypotesen, at Angiv et 95%-konfidensinterval for
Opskriv hypotesen, at de fire middelværdier er ens, og lav
et test for denne hypotese ved et passende kald til anova. Hvad bliver konklusionen i denne opgave: er det rimeligt at sige,
at der er samme middelværdi af tidsforbruget
til at flytte pointer for de fire konfigurationer af computermusen ?
Data i denne opgave er inspireret af, men ikke helt identisk med data fra
artiklen
Two-way anova with interaction approach to compare content creation speed performance in knowledge management system.
I artiklen laves hastighedsmålinger i et
Knowledge Management System (KMS), idet der deles op i de fire
moduler Documents, Video, Material og Binuspedia, og
der deles op i tre områder på BINUS universitetscampus i Indonesien:
Anggrek, Syahdan og Alam Sutera.
Man måler tiden (i sekunder) for at uploade en 22.5 MB fil, og dette gentages
5 gange for hvert modul og hvert område.
Ønsket med undersøgelsen er at se,
hvordan modul og område spiller sammen.
Gennemsnit og empirisk spredning er
gengivet for hver kombination af modul og område i
den følgende tabel.
Data findes i filen BINUS.csv, hvor hver række svarer til en måling,
og søjle 1 angiver modul, søjle 2 angiver område
og søjle 3 indeholder uploadtiderne.
Indlæs data, og dan de tre variable modul, omraade
og tid
med indholdet af de tre søjler. Med kun 5 observationer for hver kombination af modul og område
kan vi ikke lave qqplots for at vurdere, om data er normalfordelte.
For at få et overblik over data kan I bruge kommandoen
plot(as.numeric(modul:omraade),tid).Lav dernæst interaktionsplot for
uploadtiderne i forhold til de to faktorer med modul og område
(se omtalen af funktionen additivitetsPlot i det skjulte punkt
Interaktionsplot i afsnit 6.6).
Opskriv modellen, hvor uploadtiden
hørende til hver gruppe bestemt af modul og område
følger sin egen normalfordeling. Opskriv hypotesen, at varianserne i de 12 grupper er ens, og lav
Bartletts test for denne hypotese.
Er det rimeligt at sige, at de 12 varianser er ens ?
Opskriv modellen, hvor uploadtiden er normalfordelt, og hver gruppe
bestemt af modul*område har sin egen middelværdi, og
alle har den samme varians.
Lav et qqplot af residualerne fra denne model.
Opskriv inden for
denne model additivitetshypotesen, hvor middelværdien består af et
bidrag fra modul og et bidrag fra område. Lav et test, for at data kan beskrives med
den additive model.
Hvad bliver konklusionen af testet ?
Stemmer konklusionen,
med hvad du kan se i interaktionsplottet ?
Lav et test for henholdsvis ingen effekt af modul
og ingen effekt af område inden for den additive model.
Betragt modellen, hvor der kun er en effekt af modul.
Angiv skøn og 95%-konfidensintervaller
for forskel i middelværdi mellem et modul og modulet Binuspedia. Giv en beskrivelse af, hvad tallene viser.
I denne opgave skal I igen se på Fitts lov omkring tidsforbruget
for at flytte en pointer fra et område til et område , som vist i
figuren i opgave 1.5.
Man bruger ofte en model, hvor middelværdien af tidsforbruget er
lineært i hvor er bredden af målområdet, er
afstanden mellem og og
er 2-talslogaritmen. I denne opgave skal I se på data
fra en enkelt person, hvor afstanden holdes fast (),
og der betragtes fire forskellige værdier af
og For hver værdi af har vi 5 målinger
af tidsforbruget.
Data, som er stillet til rådighed af
Jörg Müller,
ligger i filen FittsLov4W.csv, der har to søjler,
hvor første søjle er værdierne af og anden søjle er tidsforbruget.
Indlæs data, og og dan variablene bredde og
tid ud fra de to søjler i de indlæste data.
Dan endvidere faktoren fakBredde ud fra variablen
bredde og variablen logBredde med logaritmen til bredden.
Lav en figur, hvor tidsforbruget afsættes mod logaritmen til bredden.
Beregn gennemsnit (benyt tapply(tid,fakBredde,mean))
for hver breddegruppe og indtegn disse gennemsnit som en
kurve i figuren. Indsæt endelig regressionslinjen fra
en regression af tid på logBredde.
Opskriv den statistiske model
hvor hver breddegruppe har sin egen middelværdi af tidsforbruget,
og varianserne er ens. Opskriv også den statistiske model hvor middelværdien
af tidsforbruget afhænger lineært af logaritmen til bredden. Lav nu -testet for reduktion fra model til
model
Hvad bliver konklusionen af testet: er det rimeligt at sige, at
middelværdien af tidsforbruget
afhænger lineært af logaritmen til bredden ?
Angiv 95%-konfidensintervaller for skæring og hældning
og for spredning omkring linjen i den lineære regressionsmodel.
Hvor meget reduceres tidsforbruget, hvis målområdet gøres dobbelt
så bredt ?
Find i den lineære regressionsmodel -værdien for test af hypotesen,
at hældningen er nul. Når hældningen er nul, betyder dette, at alle
observationerne har samme middelværdi.
Prøv dernæst at køre kommandoen
anova(lm(tid1),lm(tidfakBredde)), og aflæs -værdien
for testet her. Er der noget, der undrer dig, når du
sammenligner de to -værdier ?
I artiklen
Effects of user age on smartphone and tablet use, measured with an eye-tracker via fixation duration, scan-path duration, and saccades proportion
studeres, hvordan brugen af smartphones og tablets varierer mellem
forskellige aldersgrupper. Under brugen følges en persons øjenbevægelse, og
herudfra dannes et mål SPD (scan-path duration, målt i millisekunder),
der afspejler
en persons evne til at bruge redskabet. I artiklen siges der: "SPD measures
global processing of interfaces, where longer SPD indicates less
efficient scanning and browsing". Personer deles op i tre aldersgrupper:
unge, midaldrende og aeldre.
Desuden fordeles personerne på to eksperimenter (Ex1 og Ex2).
Hvert eksperiment består af ni opgaver inden for brugen af
forskellige smartphone apps, og opgaven hørende til en app er forskellig
mellem de to eksperimenter.
Data er i filen Smartphone.csv der har tre søjler med henholdsvis
eksperiment, aldersgruppe og SPD-målingen.
Lav en figur med 3 delplots med qqplots af SPD for de tre aldersgrupper
for eksperiment 1. Kommenter på figuren. Opskriv den statistiske model, hvor hver gruppe bestemt af
aldersgruppe og eksperiment har sin egen middelværdi
og sin egen varians af SPD,
og data er normalfordelt. Lav et test for hypotesen, at
der er samme varians i de 6 grupper.
Lav et interaktionsplot, og kommenter på
hvad du ser i figuren. Opskriv modellen, hvor hver gruppe bestemt af
aldersgruppe og eksperiment har sin egen middelværdi
af SPD, og alle
grupperne har den samme varians. Opskriv hypotesen om en
additiv struktur af middelværdien med et bidrag fra
aldersgruppe og fra eksperiment.
Lav -testet for hypotesen om additivitet.
Undersøg, om det kan antages, at aldersgruppe ikke har nogen
effekt på SPD. Undersøg også, om eksperiment
har nogen effekt på SPD. Husk at skrive modellerne op.
Angiv skøn over middelværdien blandt de aeldre for eksperiment
Ex1.
Angiv et 95%-konfidensinterval for forskellen i middelværdi
af SPD mellem gruppen af unge og gruppen af aeldre
inden for den additive model. Angiv skøn over spredningen på SPD i den additive model.