Afsnit 1.6: Fordelingsfunktioner og fraktiler

I jeres calculuskursus er der ikke blevet indført notation for de forskellige fordelinger. Hvor I i calculus siger den stokastiske variabel $X$ følger en binomialfordeling med antalsværdi $n$ og sandsynlighedsparameter $p$ , vil jeg blot skrive dette kort som

X\sim\text{binom}(n,p)

. På denne måde bliver notationen også tættere på de funktionskald, I skal lave i R. I kan se sammenhængen med R i afsnit R.6. Da I ikke kender fordelingsnotationen, som jeg vil benytte, vil I løbende her i webbogen blive introduceret til en notation for de forskellige fordelinger.

Når vi for en stokastisk variabel vil udregne sandsynligheden

P(X\leq x)

(sandsynligheden for at ligge til venstre for

x

), taler vi om at udregne fordelingsfunktionen i punktet

x.

Fordelingsfunktion hedder på engelsk cumulative distribution function, som forkortes cdf. I denne bog benytter jeg cdf som nedre fodtegn på et fordelingsnavn for at angive fordelingsfunktionen. Med denne notation betyder

\text{binom}_{\text{cdf}}(138,580,0.25)

således sandsynligheden for en værdi mindre end eller lig med 138 i en

\text{binom}(580,0.25)

-fordeling.

I kender også normalfordelingen fra sandsynlighedsdelen af jeres calculuskursus. Hvis

X

er normalfordelt med middelværdi

\mu

og varians

\sigma^2,

skriver vi

X\sim N(\mu,\sigma^2).

Sandsynligheden for at ligge til venstre for

x

i denne fordeling betegnes med

N_{\text{cdf}}(x,\mu,\sigma).

For en given sandsynlighed

p

kan vi finde det punkt

x_p,

således at sandsynligheden for at ligge til venstre for dette punkt er

p.

Dette kaldes

p

-fraktilen i fordelingen. Notationsmæssigt angiver vi fraktiler ved at tilføje det nedre fodtegn inv til fordelingsnavnet. Således er

N_{\text{inv}}(0.95,2,1)

95%-fraktilen i en normalfordeling med middelværdi 2 og spredning 1.

I R får man fordelingsfunktionen ved at sætte bogstavet p foran navnet på fordelingen, og fraktiler fås ved at sætte bogstavet q foran fordelingsnavnet. For en normalfordeling får man fordelingsfunktionen i R med kaldet pnorm(x, $\mu$ , $\sigma$ ). Bemærk at der bruges spredning

\sigma

og ikke varians

\sigma^2

i kaldet til norm. For standard normalfordelingen med middelværdi 0 og spredning 1 kan man udelade middelværdi og spredning i kaldet til norm.

Fordelingsfunktion og fraktiler i R

Kør følgende kode og forklar sammenhængene i de sidste tre tal. Ændr derefter koden og beregn sandsynligheden for en værdi mindre end eller lig med 2 i en

\text{binom}(10,0.4)

-fordeling, og dernæst sandsynligheden for en værdi større end eller lig med 2 i den samme binomialfordeling.

xxxxxxxxxx
 
c(pbinom(138,580,0.25),
pnorm(1.96),pnorm(2+3*1.96,2,3),qnorm(0.975))

Svar: Fordelingsfunktion

Sandsynligheden for at ligge til venstre for 1.96 i en standard normalfordeling er 0.975, hvorfor pnorm(1.96) giver 0.975, og qnorm(0.975) giver 1.96.

Hvis

X\sim N(\mu,\sigma^2),

kan

X

skrives som

X=\mu+\sigma U,

hvor

U\sim N(0,1).

Dermed er

N_{\text{cdf}}(\mu+\sigma\cdot x,\mu,\sigma)= N_{\text{cdf}}(x,0,1).

De to binomialsandsynligheder der ønskes beregnet fås som pbinom(2,10,0.4) og 1-pbinom(2-1,10,0.4).

1.6.1 Genopfriskning af sandsynlighedsteoretiske begreber

Middelværdi

Quiz

En stokastisk variabel

D

kan antage værdierne

0,1,2,3

med sandsynlighederne

0.2,\, 0.3,\, 0.1,\, 0.4.

Vælg de udsagn nedenfor, du mener er korrekte for middelværdien

E(D).

E(D)=\frac{1}{4}(0+1+2+3)

E(D)=1.7

E(D)=0.2\cdot 0+0.3\cdot 1+0.1\cdot 2+0.4\cdot 3

E(3-2D)=-0.4

Varians

Quiz

En stokastisk variabel

W

har varians

\text{Var}(W)=9

og spredning

\text{sd}(W)=3.

Vælg de udsagn nedenfor, du mener er korrekte.

\text{Var}(2W)=2\cdot 9

\text{sd}(2\cdot W)=2\cdot 3

\text{sd}(2+W)=2^2\cdot 3

\text{sd}(2+4W)=4\cdot 3

Tæthed

Quiz

En stokastisk variabel

X

har tæthed

f(x)

givet ved

f(x)=\begin{cases} \frac{1}{4} & 0<x\leq 1 \\ \frac{3}{4} & 1<x\leq 2 \\ 0 & \text{ellers} \end{cases}

Vælg de udsagn nedenfor, du mener er korrekte.

P(X\leq 1)=\frac{1}{4}

P(0\leq X\leq 2)=2

P(\frac{1}{2}\leq X\leq \frac{3}{2})=\frac{1}{2}

P(2\leq X\leq 3)=\frac{3}{4}

Foregående Næste