Afsnit 3.5: Opgave med besvarelse: vindhastigheder

Data i denne opgave består af den daglige middelvind i Tirstrup gennem hele 2019. Data er hentet hos Iowa Environmental Mesonet, og de daglige middelvinde er givet i kilometer per time. Et tæthedshistogram er vist i nedenstående figur, og data er indskrevet i kodevinduet nedenfor.
Data af denne type beskrives ofte med weibullfordelingen, og i opgaven her skal der laves et goodness of fit test for, om weibullfordelingen beskriver data. Hvis den stokastiske variabel er weibullfordelt, gælder der
hvor kaldes en formparameter og en skalaparameter. Tæthedsfunktionen og fordelingsfunktionen for en weibullfordeling beregnes i R med kommandoerne dweibull(x,,) og pweibull(x,,). Til at lave goodness of fit testet skal der benyttes en intervalinddeling med intervaller af længde 3 startende i nul. Desuden skal der bruges, at maksimum likelihood skønnene baseret på antallene i de forskellige intervaller er og
Eksempel 3.5.1. (Besvarelse)
Idet den største værdi i data er 54, laver vi intervalinddelingen Antallene i de forskellige intervaller betegnes og findes i R med kommandoen hist(vind,breaks=c(0:18)*3)counts, hvor vind er en vektor med de målte værdier. For de tilhørende stokastiske variable bruges Statistik Model 3.1.1,
Vi ønsker at teste hypotesen
hvor er fordelingsfunktionen for en weibullfordeling. Fra opgaveformuleringen vides, at skønnene over de ukendte parametre er og De forventede kan derfor beregnes som
Fra R-beregningen får vi de observerede (første række) og forventede (anden række):

  0   0   0   1   9   12   22   26   37   45   37   38   36   35   33   15  13   6
0.0 0.3 1.3 3.4 6.8 11.8 18.2 25.7 33.3 39.8 44.0 44.5 41.1 34.3 25.7 17.0 9.8 8.0

For at få alle de forventede større end eller lig med 5 slås de fire første kasser sammen. Dette giver det observerede antal 1 og det forventede antal 5.02. Efter denne sammenlægning er der 15 kasser, hvorfor antallet af frihedsgrader i -fordelingen bliver 15-1-2=12, idet vi under hypotesen har to frie parametre ( og ). -teststørrelsen for vores hypotese beregnes fra formlen hvor og er de observerede og forventede, efter at kasser er slået sammen. Beregningen i R viser, at og den tilhørende -værdi er Da -værdien ligger langt over 0.05, strider data ikke mod hypotesen om, at de daglige middelvinde er weibullfordelt.

3.5.2 Beregning i R af goodness of fit

I R-kørslen nedenfor har jeg også indtegnet weibulltætheden i histogrammet. Desuden binder jeg de forskellige dele af output sammen ved at bruge R-kommandoen list.

Se opstartskoden (til/fra)

ForegåendeNæste