I jeres calculuskursus er der ikke blevet indført
notation for de forskellige fordelinger. Hvor I i
calculus siger den stokastiske variabel X
følger en binomialfordeling med antalsværdi n og
sandsynlighedsparameter p, vil jeg blot skrive dette
kort som X∼binom(n,p). På denne måde bliver
notationen også tættere på de funktionskald, I skal lave i
R. I kan se sammenhængen med R i afsnit
R.6. Da I ikke
kender fordelingsnotationen, som jeg vil benytte,
vil I løbende her i webbogen blive introduceret
til en notation for de forskellige fordelinger.Når vi for en stokastisk variabel vil udregne sandsynligheden
P(X≤x) (sandsynligheden for at ligge til venstre for x),
taler vi om at udregne fordelingsfunktionen i punktet x.
Fordelingsfunktion hedder på engelsk
cumulative distribution function, som forkortes cdf.
I denne bog benytter jeg cdf som nedre fodtegn på et
fordelingsnavn for at angive fordelingsfunktionen. Med denne
notation betyder binomcdf(138,580,0.25) således
sandsynligheden for en værdi mindre end eller lig med 138 i en
binom(580,0.25)-fordeling.I kender også normalfordelingen fra sandsynlighedsdelen af jeres
calculuskursus. Hvis X er normalfordelt med middelværdi μ og
varians σ2, skriver vi X∼N(μ,σ2).
Sandsynligheden for at ligge til venstre for x i denne fordeling
betegnes med Ncdf(x,μ,σ). For en given
sandsynlighed p kan vi finde det punkt xp, således at
sandsynligheden for at ligge til venstre for dette punkt er
p. Dette kaldes p-fraktilen i fordelingen. Notationsmæssigt
angiver vi fraktiler ved at tilføje det nedre fodtegn inv
til fordelingsnavnet. Således er Ninv(0.95,2,1)
95%-fraktilen i en normalfordeling med middelværdi 2 og spredning 1. I R får man fordelingsfunktionen ved at sætte bogstavet p
foran navnet på fordelingen, og fraktiler fås ved at sætte
bogstavet q foran fordelingsnavnet. For en normalfordeling
får man fordelingsfunktionen i R med kaldet
pnorm(x,μ,σ). Bemærk at der bruges
spredning σ og ikke varians σ2 i kaldet til
norm. For standard normalfordelingen med middelværdi
0 og spredning 1 kan man udelade middelværdi og spredning i
kaldet til norm.
Kør følgende kode og forklar sammenhængene i de sidste tre tal.
Ændr derefter koden og beregn sandsynligheden for en værdi
mindre end eller lig med 2 i en
binom(10,0.4)-fordeling, og dernæst sandsynligheden
for en værdi større end eller lig med 2 i den samme
binomialfordeling.
Sandsynligheden for at ligge til venstre for 1.96 i en standard
normalfordeling er 0.975, hvorfor pnorm(1.96) giver 0.975, og
qnorm(0.975) giver 1.96. Hvis X∼N(μ,σ2), kan X
skrives som X=μ+σU, hvor U∼N(0,1). Dermed er
Ncdf(μ+σ⋅x,μ,σ)=Ncdf(x,0,1).De to binomialsandsynligheder der ønskes beregnet fås som
pbinom(2,10,0.4) og 1-pbinom(2-1,10,0.4).
1.6.1 Genopfriskning af sandsynlighedsteoretiske begreber
En stokastisk variabel D kan antage værdierne 0,1,2,3
med sandsynlighederne 0.2,0.3,0.1,0.4.
Vælg de udsagn nedenfor, du mener er korrekte for middelværdien
E(D).