Afsnit 1.5: Fordelingsfunktioner og fraktiler

I jeres calculuskursus er der ikke blevet indført notation for de forskellige fordelinger. Hvor I i calculus siger den stokastiske variabel $X$ følger en binomialfordeling med antalsværdi $n$ og sandsynlighedsparameter $p$ , vil jeg blot skrive dette kort som $X\sim\text{binom}(n,p)$ . På denne måde bliver notationen også tættere på de funktionskald, I skal lave i python. I kan se sammenhængen med python i afsnittet Py.6. Da I ikke kender fordelingsnotationen, som jeg vil benytte, vil I løbende her i webbogen blive introduceret til en notation for de forskellige fordelinger.

Når vi for en stokastisk variabel vil udregne sandsynligheden $P(X\leq x)$ (sandsynligheden for at ligge til venstre for $x$ ), taler vi om at udregne fordelingsfunktionen i punktet $x.$ Fordelingsfunktion hedder på engelsk cumulative distribution function, som forkortes cdf. I denne bog benytter jeg cdf som nedre fodtegn på et fordelingsnavn for at angive fordelingsfunktionen. Med denne notation betyder $\text{binom}_{\text{cdf}}(13,34,0.25)$ således sandsynligheden for en værdi mindre end eller lig med 13 i en $\text{binom}(34,0.25)$ -fordeling.

I kender også normalfordelingen fra sandsynlighedsdelen af jeres calculuskursus. Hvis $X$ er normalfordelt med middelværdi $\mu$ og varians $\sigma^2,$ skriver vi $X\sim N(\mu,\sigma^2).$ Sandsynligheden for at ligge til venstre for $x$ i denne fordeling betegnes med $N_{\text{cdf}}(x,\mu,\sigma).$ For en given sandsynlighed $p$ kan vi finde det punkt $x_p,$ således at sandsynligheden for at ligge til venstre for dette punkt er $p.$ Dette kaldes $p$ -fraktilen i fordelingen. Beregningsmæssigt skal man for at finde en fraktil bruge den inverse til fordelingsfunktionen. Notationsmæssigt angiver vi fraktiler ved at tilføje det nedre fodtegn inv til fordelingsnavnet. Således er $N_{\text{inv}}(0.95,2,1)$ 95%-fraktilen i en normalfordeling med middelværdi 2 og spredning 1.

I python får man fordelingsfunktionen ved at sætte .cdf efter navnet på fordelingen, og fraktiler fås ved at sætte .ppf efter fordelingsnavnet (ppf står for percent point function).

For en normalfordeling får man fordelingsfunktionen i python med kaldet st.norm.cdf(x, $\mu$ , $\sigma$ ) (husk import af scipy.stats). Bemærk, at der bruges spredning $\sigma$ og ikke varians $\sigma^2$ i kaldet til st.norm. For standard normalfordelingen med middelværdi 0 og spredning 1 kan man udelade middelværdi og spredning i kaldet til st.norm.

Fordelingsfunktion og fraktiler i python

Kør følgende kode og forklar sammenhængene i de sidste tre tal. Ændr derefter koden og beregn sandsynligheden for en værdi mindre end eller lig med 2 i en $\text{binom}(10,0.4)$ -fordeling, og dernæst sandsynligheden for en værdi større end eller lig med 2 i den samme binomialfordeling.

Svar: Fordelingsfunktion

Sandsynligheden for at ligge til venstre for 1.96 i en standard normalfordeling er 0.975, hvorfor norm.cdf(1.96) giver 0.975, og norm.ppf(0.975) giver 1.96.

Hvis $X\sim N(\mu,\sigma^2),$ kan $X$ skrives som $X=\mu+\sigma U,$ hvor $U\sim N(0,1).$ Dermed er $N_{\text{cdf}}(\mu+\sigma\cdot x,\mu,\sigma)= N_{\text{cdf}}(x,0,1).$

De to binomialsandsynligheder der ønskes beregnet fås som binom.cdf(2,10,0.4) og 1-binom.cdf(2-1,10,0.4).

1.5.1 Genopfriskning af sandsynlighedsteoretiske begreber

Middelværdi

Quiz

En stokastisk variabel $D$ kan antage værdierne $0,1,2,3$ med sandsynlighederne $0.2,\, 0.3,\, 0.1,\, 0.4.$ Vælg de udsagn nedenfor, du mener er korrekte for middelværdien $E(D).$

$E(D)=\frac{1}{4}(0+1+2+3)$

$E(D)=1.7$

$E(D)=0.2\cdot 0+0.3\cdot 1+0.1\cdot 2+0.4\cdot 3$

$E(3-2D)=-0.4$

Varians

Quiz

En stokastisk variabel $W$ har varians $\text{Var}(W)=9$ og spredning $\text{std}(W)=3.$ Vælg de udsagn nedenfor, du mener er korrekte.

$\text{Var}(2W)=2\cdot 9$

$\text{std}(2\cdot W)=2\cdot 3$

$\text{std}(2+W)=2^2\cdot 3$

$\text{std}(2+4W)=4\cdot 3$

Tæthed

Quiz

En stokastisk variabel $X$ har tæthed $f(x)$ givet ved

$f(x)=\begin{cases} \frac{1}{4} & 0<x\leq 1 \\ \frac{3}{4} & 1<x\leq 2 \\ 0 & \text{ellers} \end{cases}$ Vælg de udsagn nedenfor, du mener er korrekte.

$P(X\leq 1)=\frac{1}{4}$

$P(0\leq X\leq 2)=2$

$P(\frac{1}{2}\leq X\leq \frac{3}{2})=\frac{1}{2}$

$P(2\leq X\leq 3)=\frac{3}{4}$

Foregående Næste