Die Normalverteilung

Wir besprechen nun die wichtigste Wahrscheinlichkeitsdichtefunktion. Sie wird für Daten verwendet, die sich um einen einzigen Wert gruppieren.

Definition 1: Normalverteilte Zufallsvariable

Eine kontinuierliche Zufallsvariable XX wird normalverteilt genannt, wenn die Wahrscheinlichkeitsdichtefunktion von XX gegeben ist durch

fμ,σ(x)=1σ2πe12(xμσ)2f_{\mu,\sigma}(x)=\frac{1}{\sigma \sqrt{2\pi}}\cdot e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}

wobei μ\mu der Mittelwert und σ\sigma die Standardabweichung von XX sind.

Der Graph sieht aus wie eine Glocke (siehe unten), weshalb der Graph auch Glockenkurve genannt wird, wobei μ\mu die Position der Glocke und σ\sigma deren Breite angibt.

Open in GeoGebra

Diskutieren wir ein paar Eigenschaften des Graphen der Funktion fμ,σf_{\mu,\sigma}:

Theorem 1: Eigenschaften der Glockenkurve

Betrachten wir eine normalverteilte Zufallsvariable XX mit Mittelwert μ\mu und Standardabweichung σ\sigma. Wir haben die folgenden Eigenschaften von fμ,σf_{\mu,\sigma} (siehe Abbildung unten):

  • Der Peak PP liegt bei μ\mu, und seine Höhe ist

    y=fμ,σ(μ)0.4σy=f_{\mu,\sigma}(\mu)\approx \frac{0.4}{\sigma}
  • die Wendepunkte AA und BB sind ein σ\sigma vom Mittelwert entfernt und haben die Höhe

    y=fμ,σ(μ±σ)0.24σy=f_{\mu,\sigma}(\mu\pm\sigma)\approx\frac{0.24}{\sigma}
  • die Breite der Kurve, definiert als Distanz zwischen den beiden Wendepunkten, ist 2σ2\sigma

  • Die Punkte UU und VV, die 2σ2\sigma von μ\mu entfernt sind, haben die Höhe

    y=fμ,σ(μ±2σ)0.05σy=f_{\mu,\sigma}(\mu\pm 2\sigma) \approx \frac{0.05}{\sigma}
  • xfμ,σ(x)dx=μ\int_{-\infty}^{\infty} x \cdot f_{\mu,\sigma}(x)\, dx = \mu (der Mittelwert von XX ist μ\mu)

  • (xμ)2fμ,σ(x)dx=σ\sqrt{\int_{-\infty}^{\infty} (x-\mu)^2 \cdot f_{\mu,\sigma}(x)\, dx} = \sigma (die Standardabweichung von XX ist σ\sigma)

Je grösser σ\sigma ist, d.h. je breiter die Kurve ist, desto flacher muss die Kurve sein, da die Gesamtfläche unter dem Graphen immer 11 sein muss.

Proof

Um es einfach zu halten, nehmen wir μ=0,σ=1\mu=0, \sigma=1, der allgemeine Fall verläuft aber analog. Damit haben wir

f0,1(x)=12πex2/2f_{0,1}(x)=\frac{1}{\sqrt{2\pi}}\cdot e^{-x^2/2}
  1. Um das Maximum zu finden, muss xx so gesucht werden, dass

    f(x)=0f'(x)=0

    also

    f(x)=12πex2/2(x)=0f'(x)=\frac{1}{\sqrt{2\pi}}\cdot e^{-x^2/2} \cdot (-x)=0

    und dies ist nur für x=0x=0 möglich. Da f(0)<0f^{\prime\prime}(0)<0 ist, handelt es sich tatsächlich um ein Maximum. Die yy-Koordinate des Maximums ist

    y=f0,1(0)=12πe00.4y=f_{0,1}(0)=\frac{1}{\sqrt{2\pi}}\cdot e^0 \approx 0.4

    Es ist also P(00.4)P(0|0.4).

  2. Für den Wendepunkt muss xx so gefunden werden, dass

    f(x)=0f^{\prime\prime}(x)=0

    Es ist also xx zu finden mit

    f(x)=12πex2/2(x21)=0f^{\prime\prime}(x)=\frac{1}{\sqrt{2\pi}}\cdot e^{-x^2/2} \cdot (x^2 - 1)=0

    und wir sehen, dass dies für x21=0x^2-1=0 möglich ist, d.h. wenn x=1x=-1 oder x=1x=1. Mit dem Taschenrechner erhalten wir y=f(1)=f(1)=0.24...y=f(-1)=f(1)=0.24.... Wir erhalten also A(10.24...)A(-1 | 0.24...) und B(10.24...)B(1| 0.24...).

    Um sicher zu sein, dass es sich um Wendepunkte handelt, sollte auch die dritte Ableitung berechnet und geprüft werden, dass f(1)0f^{\prime\prime\prime}(1)\neq 0 und f(1)0f^{\prime\prime\prime}(-1)\neq 0. Dies wird der Leserschaft überlassen.

  3. Wir haben

    xf0,1(x)dx=x12πex2/2dx=F()F()=0\begin{array}{lll} \int_{-\infty}^{\infty} x \cdot f_{0,1}(x)\, dx &=& \int_{-\infty}^{\infty} x\cdot \frac{1}{\sqrt{2\pi}} e^{-x^2/2}\, dx\\ &=& F(\infty)-F(-\infty)\\ &=& 0 \end{array}

    wobei F(x)=12πex2/2F(x)=-\frac{1}{\sqrt{2\pi}} e^{-x^2/2} die Stammfunktion von x12πex2/2x\cdot \frac{1}{\sqrt{2\pi}} e^{-x^2/2} ist.

    Der Mittelwert ist also 00.

  4. Der Beweis hierfür ist aufwändiger und wird an dieser Stelle weggelassen.

Exercise 1: Skizze der Normalverteilung

Eine Zufallsvariable XX mit Mittelwert 22 und Standardabweichung 0.50.5 ist normalverteilt. Skizziere den Graphen der Dichtefunktion, indem du zunächst den Maximalpunkt PP, die Wendepunkte AA und BB sowie die Höhe des Graphen 2σ2\sigma entfernt von μ\mu berechnest (siehe die Formeln in Satz 1).

Zur Überprüfung der Skizze plotte die Dichtefunktion mit dem Taschenrechner (oder Geogebra).

Solution

Da μ=2\mu=2 und σ=0.5\sigma=0.5 ist, müssen wir den Graphen der Funktion f2,0.5f_{2,0.5} zeichnen.

Die Koordinaten der Punkte sind

P(20.8),A(1.50.48),B(2.50.48),U(10.1),V(30.1)P(2\vert 0.8), A(1.5\vert 0.48), B(2.5\vert 0.48), U(1\vert 0.1), V(3\vert 0.1)