Afsnit 3.5: Opgave med besvarelse: levetid af overfladebobler
I artiklen
How does the presence of stevia glycosides impact surface bubbles stability?
undersøges betydningen af af erstatte sukker med sødestoffer i
drikkevarer med hensyn til de bobler, der dannes på overfladen.
Specielt laves et eksperiment, hvor man kan måle levetiden af
en enkelt boble. Data,
vi betragter, er levetiden for 575 bobler i en opløsning
med sukker uden sødestoffer. Data er simulerede i overensstemmelse
med det "fintmaskede" histogram i figur 6 i artiklen.
I den samme figur kan I også se
forskellen til situationer, hvor sukker erstattes af sødestoffer.
Et tæthedshistogram for data med sukkeropløsning er vist i den
følgende figur, og data er indskrevet
i kodevinduet i det skjulte punkt nedenfor.
Data af denne type beskrives ofte med
weibullfordelingen,
og i opgaven her skal der laves et goodness of fit test for,
om weibullfordelingen beskriver data. Hvis den stokastiske variabel
er weibullfordelt, gælder der
hvor kaldes en formparameter og en skalaparameter.
Tæthedsfunktionen og fordelingsfunktionen for en weibullfordeling
beregnes i python med kommandoerne
weibullmin.pdf(x,,) og
weibullmin.cdf(x,,).
Til at lave goodness of fit testet skal du benytte en
intervalinddeling med intervaller af længde 2.5 startende i nul.
Desuden skal der bruges, at maksimum likelihood skønnene baseret på
antallene i de forskellige intervaller er
og
Eksempel 3.5.1.
(Besvarelse)
Idet den største værdi i data er 45.1, laver vi intervalinddelingen
Antallene i de
forskellige intervaller betegnes
og findes i python med kommandoen hist,
se kodevinduet nedenfor.
For de tilhørende
stokastiske variable bruges Statistik Model 3.1.1,
Vi ønsker at teste hypotesen
hvor er fordelingsfunktionen for en weibullfordeling.
Fra opgaveformuleringen vides, at skønnene over de ukendte parametre er
og De forventede
kan derfor beregnes som
Fra beregningen i kodevinduet får vi de observerede (første række)
og forventede
(anden række med 1 decimal):
For at få alle de forventede større end eller lig med 5 slås
kasse 15 og 16 sammen såvel som kasserne 17, 18 og 19.
Dette giver de observerede antal 4 og 5, og
de forventede antal 7.0 og 5.1. Efter denne sammenlægning er der
16 kasser, hvorfor antallet af frihedsgrader i -fordelingen bliver
16-1-2=13, idet vi under hypotesen har to frie parametre ( og ).
-teststørrelsen for vores hypotese beregnes fra formlen
hvor
og er de observerede og forventede, efter at kasser er slået
sammen. Beregningen i kodevinduet viser, at og den
tilhørende -værdi er
Da -værdien ligger lidt over 0.05, siger vi at data ikke strider mod
hypotesen om, at levetiderne af overfladeboblerne er weibullfordelt.
Koden nedenfor indeholder en del linjer, der er specifikke for det
konkrete eksempel, der betragtes. Alle steder, hvor weibullfordelingen bruges,
er naturligvis specifikke, såvel som intervalinddeling og
sammenlægning af intervaller for at opnå, at de forventede er store nok.
Disse steder er markeret i kommentarerne med "eksempel".
Udover beregningen af goodness of fit testet indtegnes også
weibulltætheden i histogrammet. Bemærk i koden brug af np.delete og
np.append.