Afsnit 3.5: Opgave med besvarelse: vindhastigheder
Data i denne opgave består af den daglige middelvind i Tirstrup gennem
hele 2019. Data er hentet hos
Iowa Environmental Mesonet,
og de daglige middelvinde er givet i kilometer per time.
Et tæthedshistogram er vist i nedenstående figur, og data er
indskrevet i kodevinduet nedenfor.
Data af denne type beskrives ofte med
weibullfordelingen,
og i opgaven her skal der laves et goodness of fit test for,
om weibullfordelingen beskriver data. Hvis den stokastiske variabel
er weibullfordelt, gælder der
hvor kaldes en formparameter og en skalaparameter.
Tæthedsfunktionen og fordelingsfunktionen for en weibullfordeling
beregnes i R med kommandoerne
dweibull(x,,) og
pweibull(x,,).
Til at lave goodness of fit testet skal der benyttes en
intervalinddeling med intervaller af længde 3 startende i nul.
Desuden skal der bruges, at maksimum likelihood skønnene baseret på
antallene i de forskellige intervaller er
og
Eksempel 3.5.1.
(Besvarelse)
Idet den største værdi i data er 54, laver vi intervalinddelingen
Antallene i de
forskellige intervaller betegnes
og findes i R med kommandoen
hist(vind,breaks=c(0:18)*3)counts,
hvor vind er en vektor med de målte værdier.
For de tilhørende
stokastiske variable bruges Statistik Model 3.1.1,
Vi ønsker at teste hypotesen
hvor er fordelingsfunktionen for en weibullfordeling.
Fra opgaveformuleringen vides, at skønnene over de ukendte parametre er
og De forventede
kan derfor beregnes som
Fra R-beregningen får vi de observerede (første række)
og forventede
(anden række):
For at få alle de forventede større end eller lig med 5 slås de
fire første kasser sammen. Dette giver det observerede antal 1 og
det forventede antal 5.02. Efter denne sammenlægning er der
15 kasser, hvorfor antallet af frihedsgrader i -fordelingen bliver
15-1-2=12, idet vi under hypotesen har to frie parametre ( og ).
-teststørrelsen for vores hypotese beregnes fra formlen
hvor
og er de observerede og forventede, efter at kasser er slået
sammen. Beregningen i R viser, at og den
tilhørende -værdi er
Da -værdien ligger langt over 0.05, strider data ikke mod
hypotesen om, at de daglige middelvinde er weibullfordelt.
I R-kørslen nedenfor har jeg også indtegnet weibulltætheden i
histogrammet. Desuden binder jeg de forskellige dele af output sammen ved
at bruge R-kommandoen list.