Afsnit 1.6: Fordelingsfunktioner og fraktiler

I jeres calculuskursus er der ikke blevet indført notation for de forskellige fordelinger. Hvor I i calculus siger den stokastiske variabel XX følger en binomialfordeling med antalsværdi nn og sandsynlighedsparameter pp, vil jeg blot skrive dette kort som Xbinom(n,p)X\sim\text{binom}(n,p). På denne måde bliver notationen også tættere på de funktionskald, I skal lave i R. I kan se sammenhængen med R i afsnit R.6. Da I ikke kender fordelingsnotationen, som jeg vil benytte, vil I løbende her i webbogen blive introduceret til en notation for de forskellige fordelinger.
Når vi for en stokastisk variabel vil udregne sandsynligheden P(Xx)P(X\leq x) (sandsynligheden for at ligge til venstre for xx), taler vi om at udregne fordelingsfunktionen i punktet x.x. Fordelingsfunktion hedder på engelsk cumulative distribution function, som forkortes cdf. I denne bog benytter jeg cdf som nedre fodtegn på et fordelingsnavn for at angive fordelingsfunktionen. Med denne notation betyder binomcdf(138,580,0.25)\text{binom}_{\text{cdf}}(138,580,0.25) således sandsynligheden for en værdi mindre end eller lig med 138 i en binom(580,0.25)\text{binom}(580,0.25)-fordeling.
I kender også normalfordelingen fra sandsynlighedsdelen af jeres calculuskursus. Hvis XX er normalfordelt med middelværdi μ\mu og varians σ2,\sigma^2, skriver vi XN(μ,σ2).X\sim N(\mu,\sigma^2). Sandsynligheden for at ligge til venstre for xx i denne fordeling betegnes med Ncdf(x,μ,σ).N_{\text{cdf}}(x,\mu,\sigma). For en given sandsynlighed pp kan vi finde det punkt xp,x_p, således at sandsynligheden for at ligge til venstre for dette punkt er p.p. Dette kaldes pp-fraktilen i fordelingen. Notationsmæssigt angiver vi fraktiler ved at tilføje det nedre fodtegn inv til fordelingsnavnet. Således er Ninv(0.95,2,1)N_{\text{inv}}(0.95,2,1) 95%-fraktilen i en normalfordeling med middelværdi 2 og spredning 1.
I R får man fordelingsfunktionen ved at sætte bogstavet p foran navnet på fordelingen, og fraktiler fås ved at sætte bogstavet q foran fordelingsnavnet. For en normalfordeling får man fordelingsfunktionen i R med kaldet pnorm(x,μ\mu,σ\sigma). Bemærk at der bruges spredning σ\sigma og ikke varians σ2\sigma^2 i kaldet til norm. For standard normalfordelingen med middelværdi 0 og spredning 1 kan man udelade middelværdi og spredning i kaldet til norm.

Fordelingsfunktion og fraktiler i R

Kør følgende kode og forklar sammenhængene i de sidste tre tal. Ændr derefter koden og beregn sandsynligheden for en værdi mindre end eller lig med 2 i en binom(10,0.4)\text{binom}(10,0.4)-fordeling, og dernæst sandsynligheden for en værdi større end eller lig med 2 i den samme binomialfordeling.

Svar: Fordelingsfunktion

Sandsynligheden for at ligge til venstre for 1.96 i en standard normalfordeling er 0.975, hvorfor pnorm(1.96) giver 0.975, og qnorm(0.975) giver 1.96.
Hvis XN(μ,σ2),X\sim N(\mu,\sigma^2), kan XX skrives som X=μ+σU,X=\mu+\sigma U, hvor UN(0,1).U\sim N(0,1). Dermed er Ncdf(μ+σx,μ,σ)=Ncdf(x,0,1).N_{\text{cdf}}(\mu+\sigma\cdot x,\mu,\sigma)= N_{\text{cdf}}(x,0,1).
De to binomialsandsynligheder der ønskes beregnet fås som pbinom(2,10,0.4) og 1-pbinom(2-1,10,0.4).

1.6.1 Genopfriskning af sandsynlighedsteoretiske begreber

Middelværdi

Quiz
En stokastisk variabel DD kan antage værdierne 0,1,2,30,1,2,3 med sandsynlighederne 0.2,0.3,0.1,0.4.0.2,\, 0.3,\, 0.1,\, 0.4. Vælg de udsagn nedenfor, du mener er korrekte for middelværdien E(D).E(D).
E(D)=14(0+1+2+3)E(D)=\frac{1}{4}(0+1+2+3)
E(D)=1.7E(D)=1.7
E(D)=0.20+0.31+0.12+0.43E(D)=0.2\cdot 0+0.3\cdot 1+0.1\cdot 2+0.4\cdot 3
E(32D)=0.4E(3-2D)=-0.4

Varians

Quiz
En stokastisk variabel WW har varians Var(W)=9\text{Var}(W)=9 og spredning sd(W)=3.\text{sd}(W)=3. Vælg de udsagn nedenfor, du mener er korrekte.
Var(2W)=29\text{Var}(2W)=2\cdot 9
sd(2W)=23\text{sd}(2\cdot W)=2\cdot 3
sd(2+W)=223\text{sd}(2+W)=2^2\cdot 3
sd(2+4W)=43\text{sd}(2+4W)=4\cdot 3

Tæthed

Quiz
En stokastisk variabel XX har tæthed f(x)f(x) givet ved
f(x)={140<x1341<x20ellers f(x)=\begin{cases} \frac{1}{4} & 0<x\leq 1 \\ \frac{3}{4} & 1<x\leq 2 \\ 0 & \text{ellers} \end{cases}
Vælg de udsagn nedenfor, du mener er korrekte.
P(X1)=14P(X\leq 1)=\frac{1}{4}
P(0X2)=2P(0\leq X\leq 2)=2
P(12X32)=12P(\frac{1}{2}\leq X\leq \frac{3}{2})=\frac{1}{2}
P(2X3)=34P(2\leq X\leq 3)=\frac{3}{4}

ForegåendeNæste