Afsnit 4.1: Normalfordelingen

Hvis den stokastiske variabel XX er normalfordelt med middelværdi μ\mu og spredning σ,\sigma, XN(μ,σ2),X\sim N(\mu,\sigma^2), er tætheden givet ved
f(x;μ,σ)=12πσ2exp(12σ2(xμ)2),xR,(μ,σ)R×R+.(4.1.1) f(x;\mu,\sigma)=\frac{1}{\sqrt{2\pi\sigma^2}} \exp\big(-\frac{1}{2\sigma^2}(x-\mu)^2\big),\enspace x\in\mathbf{R},\enspace (\mu,\sigma)\in \mathbf{R}\times\mathbf{R}_+. \tag{4.1.1}
Sandsynligheden for at ligge i et interval (a,b](a,b] er givet ved
P(a<Xb)=abf(x;μ,σ)dx. P\big(a<X\leq b\big)=\int_a^b f(x;\mu,\sigma)\mathit{dx}.
Bemærk specielt, at dette viser P(X=x)=0P(X=x)=0 for enhver værdi xx: for en kontinuert stokastisk variabel er enhver punktsandsynlighed lig med nul. Fordelingsfunktionen, det vil sige sandsynligheden for at ligge til venstre for et punkt, betegnes med Ncdf(x;μ,σ).N_{\text{cdf}}(x;\mu,\sigma). Bemærk, at i fordelingsnotationen N(μ,σ2)N(\mu,\sigma^2) bruges variansen σ2,\sigma^2, hvorimod i tætheden og fordelingsfunktionen bruges spredning σ.\sigma. Det sidste er for at være i overensstemmelse med notationen i python. Normalfordelingen med middelværdi μ=0\mu=0 og spredning σ=1\sigma=1 kaldes standard normalfordelingen.
Der gælder følgende vigtige regneregler (disse er omtalt i jeres calculuskursus).
  1. Hvis XN(μ,σ2),X\sim N(\mu,\sigma^2), og aa og bb er givne tal, så vil a+bXN(a+bμ,b2σ2).a+bX\sim N(a+b\mu,b^2\sigma^2). Specielt kan vi skrive X=μ+σU,X=\mu+\sigma U, hvor UN(0,1).U\sim N(0,1).
  2. Hvis XX og YY er normalfordelte og uafhængige, så vil også X+YX+Y være normalfordelt.
  3. Hvis U1,,UkU_1,\ldots,U_k er uafhængige og standard normalfordelte, så har den stokastiske variabel U12++Uk2U_1^2+\cdots+U_k^2 en χ2(k)\chi^2(k)-fordeling.
Man kan få en fornemmelse for de to første regneregler ud fra den centrale grænseværdisætning (afsnit 2.4). Hvis XX er en sum af mange små bidrag, så er dette også tilfældet for a+bX.a+bX. Hvis både XX og YY er summer af mange små led, så vil dette også gælde for summen af de to.
I kodevinduet nedenfor vises tæthed og fordelingsfunktion for en normalfordeling. Desuden er 97.5%-fraktilen markeret, det vil sige punktet, hvor der ligger 97.5% sandsynlighed til venstre for og 2.5% sandsynlighed til højre for. Tætheden i en normalfordeling beregnes med funktionen st.norm.pdf i python. Fordelingsfunktionen beregnes med st.norm.cdf, og fraktiler findes med funktionen st.norm.ppf. Hvis man ikke angiver middelværdien og spredningen i kaldet til de tre funktioner, benytter python standard normalfordelingen. Prøv at køre kommandoerne, og prøv at ændre på μ\mu og σ.\sigma. Bemærk, at figuren har to andenakser, hvor aksen til venstre angiver tæthed og aksen til højre angiver sandsynlighed.
Prøv, om du kan beregne 95%-fraktilen i en standard normalfordeling. Beregn også 5%-fraktilen.

Svar: Fraktiler

Fraktilerne beregnes som st.norm.ppf(0.95) og st.norm.ppf(0.05).

ForegåendeNæste