Wahrscheinlichkeitsberechnungen mit der Normalverteilung

Für eine normalverteilte Zufallsvariable XX mit Mittelwert μ=2\mu=2 und Standardabweichung σ=3\sigma=3 ist die Wahrscheinlichkeit, dass XX einen Wert zwischen 00 und 0.50.5 annimmt, gegeben durch

Equation 1
p(X[0,0.5])=00.5f2,3(x)dx=00.5132πe12(x23)2dx=F(0.5)F(0)\begin{array}{lll} p(X\in [0,0.5])&=&\int_{0}^{0.5} f_{2,3}(x)\, dx\\[0.5em] &=& \int_{0}^{0.5} \frac{1}{3\sqrt{2\pi}} e^{-\frac{1}{2}\left(\frac{x-2}{3}\right)^2}\, dx\\[0.5em] &=& F(0.5)-F(0) \end{array}

wobei FF die Stammfunktion der Glockenkurve f2,3f_{2,3} ist. Leider lässt sich die Stammfunktion FF nicht durch eine beliebige Kombination von Elementarfunktionen wie xn,sin(x),ex,log(x)x^n, \sin(x), e^x, \log(x) usw. ausdrücken. Wir müssen das Integral mit Hilfe des Taschenrechners bestimmen. Als Taschenrechner noch selten waren, benutzte man grosse Tabellen, in denen die Fläche unter der Kurve für viele verschiedene Intervalle aufgelistet war. Es gibt zwei Methoden:

Beachte: Im Menü distr\texttt{distr} gibt es auch die Funktion Normalpdf\texttt{Normalpdf}, was aber nichts anderes ist als die Glockenkurve fμ,σf_{\mu,\sigma}.

Alle diese Methoden funktionieren natürlich auch für beliebig andere Werte von μ\mu und σ\sigma.

Exercise 1: Normalverteilung im Taschenrechner

Benutze den Taschenrechner, um die Wahrscheinlichkeit auf mindestens zwei Arten zu bestimmen:

p(X[0,0.5])=00.5132πe12(x23)2dxp(X\in [0,0.5]) = \int_{0}^{0.5} \frac{1}{3\sqrt{2\pi}} e^{-\frac{1}{2}\left(\frac{x-2}{3}\right)^2}\, dx
Solution

p(X[0,0.5])=p(X\in [0,0.5]) = \underline{\dots}

Es gibt einige Flächen unter der Kurve von fμ,σf_{\mu,\sigma}, die nützlich zu wissen sind, vor allem, weil sie in statistischen Anwendungen häufig vorkommen. Hier sind einige dieser Flächen:

Theorem 1: Standardintervalle der Normalverteilung

Die Fläche unter der Glockenkurve fμ,σf_{\mu,\sigma} zwischen

  1. μσ\mu-\sigma und μ+σ\mu+\sigma beträgt 0.6830.683
  2. μ2σ\mu-2\sigma und μ+2σ\mu+2\sigma beträgt 0.9540.954
  3. μ3σ\mu-3\sigma und μ+3σ\mu+3\sigma beträgt 0.9970.997

Beachte, dass diese Flächen unabhängig von den Werten von μ\mu und σ\sigma sind!

Exercise 2: Überprüfung der Standardintervalle
  1. Verwende den Taschenrechner, um die obigen Flächen für μ=1\mu=1 und σ=2\sigma=2 zu überprüfen.

  2. Betrachte eine Zufallsvariable XX mit Mittelwert μ\mu und Standardabweichung σ\sigma, die normalverteilt ist. Bestimme die folgenden Wahrscheinlichkeiten:

    1. p(X[μσ,μ+σ])p(X\in [\mu-\sigma, \mu+\sigma])
    2. p(Xμ)p(X\leq \mu)
  3. Die Zufallsvariable XX hat den Mittelwert 33 und die Standardabweichung 0.60.6. Führe das Experiment 1000010\,000 Mal durch. Wie viele Werte von XX liegen (ungefähr) zwischen 1.81.8 und 4.24.2?

Solution
  1. Nichts zu zeigen.

  2. Wir versuchen, die Flächen mit Hilfe der Intervalle aus Satz 1 auszudrücken, zusammen mit der Tatsache, dass die Gesamtfläche unter der Kurve 11 beträgt.

    1. p(X[μσ,μ+σ])=0.683p(X\in [\mu-\sigma, \mu+\sigma])=\underline{0.683}
    2. p(Xμ)=0.5p(X\leq \mu)=\underline{0.5} (die Hälfte der Gesamtfläche von 11)
  3. p(X[1.8,4.2])=p(X[μ2σ,μ+2σ])=0.954p(X\in[1.8,4.2])=p(X\in [\mu-2\sigma,\mu+2\sigma])=\underline{0.954}, also etwa 0.95410000=95400.954\cdot 10\,000 = 9540 Werte von XX.

Exercise 3: Normalverteilung von Schraubenlängen

Eine Maschine produziert Schrauben der Länge 60mm60\unit{mm}. Aber die Produktion ist nicht perfekt, und die Länge kann variieren. Um mehr darüber herauszufinden, wird die Länge von 10001000 Schrauben gemessen. Die Häufigkeitstabelle zeigt Folgendes:

Klasse (mm)Ha¨ufigkeit56.557.51857.558.57258.559.519659.560.539860.561.521761.562.58962.563.510\begin{array}{l|l} \text{Klasse (mm)}& \text{Häufigkeit} \\\hline 56.5-57.5 & 18\\ 57.5-58.5 & 72\\ 58.5-59.5 & 196\\ 59.5-60.5 & 398\\ 60.5-61.5 & 217\\ 61.5-62.5 & 89\\ 62.5-63.5 & 10\\ \end{array}

Ebenfalls wird von den 10001000 Schrauben die mittlere Länge berechnet (60.31mm60.31\unit{mm}) und die Standardabweichung (1.14mm1.14\unit{mm}).

  1. Skizziere das Histogramm der Schraubenlängen auf der Grundlage der obigen Tabelle.

  2. Prüfe, ob die Schraubenlängen annähernd normalverteilt sind, indem der Graph der Wahrscheinlichkeitsverteilungsfunktion f60.31,1.14f_{60.31,1.14} in dasselbe Koordinatensystem wie das Histogramm gezeichnet wird. Verwende die fünf Punkte, die im vorherigen Abschnitt besprochen wurden. Was denkst du, sind die Schrauben normalverteilt?

  3. Bestimme anhand des Modells f60.31,1.14f_{60.31,1.14} die Wahrscheinlichkeit, dass die Schraubenlänge um weniger als 2σ2\sigma vom Mittelwert abweicht.

Solution
  1. Siehe unten.

  2. Siehe unten.

  3. Da die Daten XX (die Schraubenlänge) annähernd normalverteilt sind (siehe Abbildung oben, in (a)), ist die Wahrscheinlichkeit, dass die Schraubenlänge zwischen μ2σ\mu-2\sigma und μ+2σ\mu+2\sigma liegt, 0.954\underline{0.954} (siehe Satz 1). Natürlich könnten wir das Integral auch mit dem Taschenrechner bestimmen und kämen wegen μ2σ=58.03\mu-2\sigma = 58.03 und μ+2σ=62.59\mu+2\sigma=62.59 auf die gleiche Zahl:

    58.0362.59f60.31,1.14(x)dx=0.954\int_{58.03}^{62.59} f_{60.31,1.14}(x)\,dx=0.954
Exercise 4: Körpertemperatur

Die Körpertemperatur eines gesunden Erwachsenen ist annähernd normalverteilt mit einem Mittelwert von 37C37^\circ\text{C} und einer Standardabweichung von 0.4C0.4^\circ\text{C}.

  1. Beschreibe das zugrunde liegende Experiment und die Zufallsvariable XX.

  2. Bestimme die Wahrscheinlichkeit, dass die Temperatur um mehr als 0.8C0.8^\circ\text{C} vom Mittelwert abweicht.

  3. Bestimme die Wahrscheinlichkeit, dass die Temperatur kleiner als 36.6C36.6^\circ\text{C} ist.

  4. Welche Mindesttemperatur haben die wärmsten 5%5\% der Menschen?

Solution
  1. Das Zufallsexperiment lautet: "Wähle zufällig einen gesunden Erwachsenen aus", und die Zufallsvariable ist X="Messe die Ko¨rpertemperatur"X = \text{"Messe die Körpertemperatur"}.

  2. Da 2σ=0.82\sigma=0.8 ist, ist die Wahrscheinlichkeit gemäss Satz 1

    p(μ2σXμ+2σ)=0.954p(\mu-2\sigma \leq X\leq \mu+2\sigma)=0.954

    und daher ist die Wahrscheinlichkeit, dass XX ausserhalb dieses Bereichs liegt:

    10.954=0.0461-0.954=\underline{0.046}
  3. p(X36.6)=p(Xμσ)=0.50.6832=0.1585p(X\leq 36.6)=p(X\leq \mu-\sigma) = 0.5-\frac{0.683}{2}=\underline{0.1585}.

  4. Die wärmsten 5%5\% der Menschen befinden sich im rechten Teil unter der Kurve (siehe Abbildung unten), was einer Mindesttemperatur von μ+1.64σ=37.656C\mu+1.64\sigma=\underline{37.656^\circ\text{C}} entspricht.

Exercise 5: Wendepunkte der Glockenkurve

Die Wahrscheinlichkeitsdichtefunktion ff einer normalverteilten Zufallsvariablen XX hat Wendepunkte bei x=7x=7 und x=11x=11. Bestimme:

  1. die Funktionsgleichung von ff

  2. die Wahrscheinlichkeit p(6.1<X<10.3)p(6.1<X<10.3)

  3. die Wahrscheinlichkeit p(X>7.5)p(X>7.5)

Solution
  1. Finde μ\mu und σ\sigma. Da μ\mu in der Mitte zwischen den xx-Koordinaten der Wendepunkte liegt, erhalten wir μ=9\mu=9, und da die Wendepunkte 1σ1\sigma von μ\mu entfernt sind, ist σ=2\sigma=2. Somit gilt:
f9,2(x)=122πe12(x92)2f_{9,2}(x)=\frac{1}{2\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-9}{2}\right)^2}
  1. p(6.1<X<10.3)=6.110.3f9,2(x)dxp(6.1<X<10.3)=\int_{6.1}^{10.3} f_{9,2}(x)\, dx und mit dem Taschenrechner erhalten wir 0.6687\underline{0.6687}.

  2. Da wir \infty nicht in den Taschenrechner eingeben können, teilen wir die Fläche wie folgt auf (siehe Abbildung unten):

    p(X>7.5)=7.5f9,2(x)dx=7.59f9,2(x)dx+0.5=0.2734+0.5=0.7734\begin{array}{lll} p(X>7.5)&=&\int_{7.5}^\infty f_{9,2}(x)\,dx \\ &=&\int_{7.5}^{9} f_{9,2}(x)\,dx+0.5\\ &=& 0.2734+0.5\\ &=&\underline{0.7734} \end{array}
Exercise 6: Analyse eines Datensatzes

Unten ist die Häufigkeitstabelle eines Datensatzes gegeben. Der Mittelwert der Daten ist m=29.6m=29.6, die Standardabweichung s=7.6s=7.6.

  1. Zeige, dass die Daten ungefähr normalverteilt sind, indem das Histogramm angefertigt wird und die Normalverteilung mit den Parametern μ=29.6\mu=29.6 und σ=7.6\sigma=7.6 ebenfalls eingezeichnet wird.
  2. Basierend auf der Normalverteilung: Bestimme die (ungefähre) Wahrscheinlichkeit, dass ein zufällig gewählter Datenpunkt zwischen 2222 und 37.237.2 liegt.
  3. Basierend auf der Normalverteilung: Bestimme ein (ungefähres) Intervall [a,b][a,b] so, dass ein zufällig gewählter Datenpunkt mit Wahrscheinlichkeit 0.950.95 in diesem Intervall liegt.
Ha¨ufigkeit02.502.55057.527.51001012.5412.51561517.5817.520112022.51722.525312527.53127.530463032.54432.535303537.52737.540234042.5642.54594547.5247.55035052.5152.55505557.5057.5600\begin{array}{rcl|l} && & \text{Häufigkeit} \\\hline 0&-&2.5 & 0\\ 2.5&-&5 & 0\\ 5&-&7.5 &2\\ 7.5&-&10 &0\\ 10&-&12.5 &4\\ 12.5&-&15 &6\\ 15&-&17.5 &8\\ 17.5&-&20 &11\\ 20&-&22.5 &17\\ 22.5&-&25 &31\\ 25&-&27.5 &31\\ 27.5&-&30 &46\\ 30&-&32.5 &44\\ 32.5&-&35 &30\\ 35&-&37.5 &27\\ 37.5&-&40 &23\\ 40&-&42.5 &6\\ 42.5&-&45 &9\\ 45&-&47.5 &2\\ 47.5&-&50 &3\\ 50&-&52.5 &1\\ 52.5&-&55 &0\\ 55&-&57.5 &0\\ 57.5&-&60 &0\\ \end{array}
Solution
  1. Um die Dichten für das Histogramm zu bekommen, müssen wir die Häufigkeiten durch nn teilen (relative Häufigkeit) und dann auch noch durch die Klassenbreite Δx\Delta x. Zählen wir die Häufigkeiten zusammen, so erhalten wir n=301n=301, und die Klassenbreite ist Δx=2.5\Delta x=2.5. Wir erhalten also die Dichten:

    Ha¨ufigkeitDichte02.5002.550057.520.002657817.510001012.540.0053156112.51560.007973421517.580.010631217.520110.01461792022.5170.022591422.525310.0411962527.5310.04119627.530460.06112963032.5440.058471832.535300.03986713537.5270.035880437.540230.03056484042.560.0079734242.54590.01196014547.520.0026578147.55030.003986715052.510.001328952.555005557.50057.56000\begin{array}{rcl|c|l} && & \text{Häufigkeit} & \text{Dichte} \\\hline 0&-&2.5 & 0 & 0\\ 2.5&-&5 & 0 & 0\\ 5&-&7.5 &2 & 0.00265781\\ 7.5&-&10 &0 & 0\\ 10&-&12.5 &4 & 0.00531561\\ 12.5&-&15 &6 & 0.00797342\\ 15&-&17.5 &8 & 0.0106312\\ 17.5&-&20 &11 & 0.0146179\\ 20&-&22.5 &17 & 0.0225914\\ 22.5&-&25 &31 & 0.041196\\ 25&-&27.5 &31 & 0.041196\\ 27.5&-&30 &46 & 0.0611296\\ 30&-&32.5 &44 & 0.0584718\\ 32.5&-&35 &30 & 0.0398671\\ 35&-&37.5 &27 & 0.0358804\\ 37.5&-&40 &23 & 0.0305648\\ 40&-&42.5 &6 & 0.00797342\\ 42.5&-&45 &9 & 0.0119601\\ 45&-&47.5 &2 & 0.00265781\\ 47.5&-&50 &3 & 0.00398671\\ 50&-&52.5 &1 & 0.0013289\\ 52.5&-&55 &0 & 0\\ 55&-&57.5 &0 & 0\\ 57.5&-&60 &0 & 0\\ \end{array}

    Das Histogramm und die Normalverteilung sind unten gezeigt. Für die Normalverteilung berechnen wir wie immer die fünf Punkte bei x=μ±2σ,x=μ±σx=\mu \pm 2\sigma, x=\mu \pm\sigma und x=μx=\mu. Wir erhalten die Punkte C(14.40.006),D(44.80.006),A(220.031),B(37.20.031),P(29.60.052)C(14.4 \mid 0.006), D(44.8 \mid 0.006 ), A(22 \mid 0.031 ), B(37.2 \mid 0.031), P(29.6 \mid 0.052 ).

  2. Es gilt 22=μσ22=\mu-\sigma und 37.2=μ+σ37.2=\mu+\sigma. Die Wahrscheinlichkeit, dass ein Datenpunkt in diesem Intervall liegt, ist die Fläche unter der Kurve zwischen μσ\mu-\sigma und μ+σ\mu+\sigma, und das ist p=0.683p=\underline{0.683} (siehe Satz 1). Natürlich könnten wir auch mit dem Taschenrechner das Integral 2237.2f29.6,7.6(x)dx\int_{22}^{37.2} f_{29.6,7.6}(x)\, dx ausrechnen.

  3. Es gilt a=μ1.96σ=29.61.967.6=14.7a=\mu-1.96\sigma=29.6-1.96\cdot 7.6=14.7 und b=μ+1.96σ=29.6+1.967.6=44.5b=\mu+1.96\sigma=29.6+1.96\cdot 7.6=\underline{44.5}.

Exercise 7: Gewicht von Melonen

Messungen des Gewichts von 1000010\,000 Melonen ergeben einen Mittelwert von m=3.24kgm=3.24\unit{kg} and eine Standardabweichung von s=0.55kgs=0.55\unit{kg}. Das Histogramm der Gewichte zeigt, dass die Gewichte ungefähr normalverteilt sind.

  1. Wie viele Melonen haben ungefähr ein Gewicht grösser als 3.79kg3.79\unit{kg}?

  2. Zwischen welchen Gewichten aa und bb liegen etwa 95%95\% der Melonen?

Solution
  1. Da die Daten normalverteilt sind mit Mittelwert μ=3.24\mu=3.24 und Standardabweichung σ=0.55\sigma=0.55, ist die Normalverteilung, welche das Histogramm approximiert, gegeben durch f3.24,0.55f_{3.24,0.55}.

    Die Wahrscheinlichkeit, dass eine Melone schwerer ist als 3.79kg3.79\unit{kg}, ist die Fläche unter der Kurve von f3.24,0.55f_{3.24,0.55} von 3.793.79 bis \infty. Wegen 3.79=μ+σ3.79=\mu+\sigma ist diese Fläche gemäss Satz 1 gerade (10.683)/2=0.1585(1-0.683)/2=0.1585. Da es 1000010\,000 Melonen sind, sind also ungefähr 0.158510000=15850.1585\cdot 10\,000=\underline{1585} Melonen schwerer als 3.79kg3.79\unit{kg}.

  2. a=μ1.96σ=2.162kg,b=μ+1.96σ=4.318kga=\mu-1.96\sigma=\underline{2.162\unit{kg}}, b=\mu+1.96\sigma = \underline{4.318\unit{kg}}