Introducerende Statistik og Dataanalyse med MATLAB

Jens Ledet Jensen

Denne webbog er beregnet til et 5ECTS indledende kursus i statistik. Deltagerne forventes at have stiftet bekendtskab med sandsynligheder og nogle af standardfordelingerne på forhånd.
De numeriske beregninger i dette kursus foretages enten med python eller MATLAB (afhængig af studieretning; 2022: nanostuderende bruger python, de øvrige studieretninger bruger MATLAB). Tanken er, at alle har en vis fortrolighed med programmeringssproget inden dette kursus, men hvis dette ikke er tilfældet, kan man bruge afsnit Py eller afsnit ML til at sætte sig ind i sproget. De to afsnit kan også bruges som en generel reference til de dele af programmeringssproget, I får brug for.
Et hovedelement i bogen er, at brugen af programmeringssproget er integreret direkte. Undervejs i læsningen kan man afprøve kommandoer inde i et kodevindue uden at forlade bogen (ved at trykke på Compute-knappen). Man kan også ændre på koden inde i kodevinduet. Dette kan kun udnyttes til fulde i python-versionen, eftersom python er open-source. Derfor er alle de direkte viste koder lavet i python, hvorimod de tilsvarende koder i MATLAB er vist straks efter i skjulte vinduer. Der er ingen Compute-knap knyttet til MATLAB-koden, og koden må kopieres over i kommandovinduet i jeres egen MATLAB-installation. Output fra kørsel af enten pythonkoden eller MATLABkoden vil dog være ækvivalent. Meningen er, at I skal blive mere fortrolige med python/MATLAB ved at lege med og forstå det meste af koden i kodevinduerne (undtagelsen er kommandoer for at få output til at stå pænere, og hvor definitionen på en funktion er skrevet ind i kodevinduet).
Et andet hovedelement i bogen er, at denne er delt op i mange korte websider. Hver side har en navigationsbjælke i toppen, der tillader at komme rundt i hele bogen. For at øge overskueligheden er nogle elementer skjulte og foldes ud ved klik. Overskueligheden er også forsøgt øget ved brug af farvede elementer.
Bogen starter med at indføre de fundamentale begreber -værdi og konfidensinterval, og derfra går det ud på at bruge disse begreber og få en forståelse for nogle basale simple statistiske modeller. Specielt vil vi komme omkring de grundlæggende normalfordelingsmodeller, og disse bliver sat ind i en generel ramme for lineære modeller via brugen af faktorer og regressionsvariable. Brugen af ophobningsloven, både klassisk og en simulationsbaseret metode, bliver gennemgået efter indførsel af den basale normalfordelingsmodel.
Der er syv øvelsesafsnit, som kommer efter kapitlerne 2, 3, 5, 6, 7, 8, og 9.
På kursushjemmesiden ligger der en pdf-version af bogen genereret fra web-bogen. De skjulte elementer i webbogen er foldet ud i pdf-versionen, og skjulte elementer med svar på spørgsmål er til sidst i hvert kapitel.
Copyright: Jens Ledet Jensen. Bogen er skrevet i latex, og systemet til oversættelse til html er sat op af Niels Lauritzen.
Næste