I denne opgave skal du lave et R-program der kan simulere
effekten af korrelation i en multipel regressionsmodel.
I kodevinduet nedenfor er vist dele af det nødvendige program.
Strukturen af programmet er en ydre løkke over det ønskede antal
simulationer (nsim). Inde i løkken simuleres først data fra modellen
,
Korrelation mellem de to forklarende variable styres
med parameteren i koden.I den manglende kode skal du analysere data og finde de
to -værdier for test af og Hvis den største
-værdi er over 0.05, fjernes dette led, og som et resultat af
simuleringen noteres nummeret på den variabel, der er tilbage. Dette
vil så være tallet 1 eller 2, og hvis den største af de to -værdier
er under 0.05, så ingen af de to led fjernes, registreres tallet 3. Når det ønskede antal simuleringer er lavet, tælles der op, hvor mange
gange resultatet blev 1, 2 eller 3 (dette sker via kaldet af hist).
Lav en tabel med optællinger for henholdsvis og
. Beskriv, ud fra de simulerede resultater, betydningen af
korrelationen mellem de to forklarende variable.