Introducerende Statistik og Dataanalyse med
MATLAB
Jens Ledet Jensen
Denne webbog er beregnet til et 5ECTS indledende kursus i
statistik.
Deltagerne forventes at have stiftet bekendtskab med
sandsynligheder og nogle af standardfordelingerne på forhånd.
De numeriske beregninger i dette kursus foretages enten med
python
eller MATLAB (afhængig af studieretning; 2022:
nanostuderende bruger
python, de øvrige studieretninger bruger MATLAB).
Tanken er, at alle har en vis fortrolighed med programmeringssproget
inden dette kursus, men hvis dette ikke er tilfældet, kan man bruge afsnit
Py
eller afsnit
ML til at sætte sig ind i sproget.
De to afsnit kan også bruges som en generel reference til de dele af
programmeringssproget, I får brug for.
Et hovedelement i bogen er, at brugen af programmeringssproget er integreret
direkte. Undervejs i læsningen kan man afprøve kommandoer inde i et
kodevindue
uden at forlade bogen (ved at trykke på
Compute-knappen).
Man kan også ændre på koden inde i kodevinduet.
Dette kan kun udnyttes til fulde i python-versionen,
eftersom
python er open-source. Derfor er alle de direkte viste koder
lavet i
python, hvorimod de tilsvarende koder i MATLAB
er vist straks efter i skjulte vinduer. Der er ingen
Compute-knap knyttet til MATLAB-koden, og koden må kopieres
over i kommandovinduet i jeres egen MATLAB-installation.
Output fra kørsel af enten pythonkoden eller MATLABkoden
vil dog være ækvivalent. Meningen er, at I skal blive mere fortrolige med
python/MATLAB ved at lege med og forstå det meste af koden i kodevinduerne
(undtagelsen er kommandoer for at få output til at stå pænere, og
hvor definitionen på en funktion er skrevet ind i kodevinduet).
Et andet hovedelement i bogen er, at denne er delt op i mange korte websider.
Hver side har en navigationsbjælke i toppen, der tillader at
komme rundt i hele bogen. For at øge overskueligheden er
nogle elementer skjulte og foldes ud ved klik. Overskueligheden
er også forsøgt øget ved brug af farvede elementer.
Bogen starter med at indføre de fundamentale begreber
-værdi og
konfidensinterval, og derfra
går det ud på at bruge disse begreber og få en forståelse
for nogle basale simple statistiske modeller.
Specielt vil vi komme omkring de grundlæggende
normalfordelingsmodeller, og disse bliver sat ind i en
generel ramme for lineære modeller via brugen af
faktorer og
regressionsvariable. Brugen af ophobningsloven, både klassisk
og en simulationsbaseret metode, bliver gennemgået efter
indførsel af den basale normalfordelingsmodel.
Der er syv øvelsesafsnit, som kommer efter kapitlerne 2, 3, 5, 6, 7, 8, og 9.
På kursushjemmesiden ligger der en pdf-version af bogen
genereret fra web-bogen. De skjulte elementer i webbogen
er foldet ud i pdf-versionen, og skjulte elementer med svar
på spørgsmål er til sidst i hvert kapitel.
Copyright: Jens Ledet Jensen. Bogen er skrevet i latex, og systemet
til oversættelse til html er sat op af Niels Lauritzen.