Mittelwert und Standardabweichung einer binomialverteilten Zufallsvariablen

Gegeben sei ein Binomialexperiment mit Wiederholungszahl $n$ und Erfolgswahrscheinlichkeit $p$ . Die Zufallsvariable $N$ ="Anzahl der Erfolge (nach $n$ Wiederholungen)" ist also binomial verteilt mit den Parametern $n$ und $p$ , und nimmt bei jeder Durchführung des Experiments einen der Werte $0,...,n$ an, und zwar mit der Wahrscheinlichkeit

\begin{array}{lll} p(N=k)&=&\left(\begin{array}{lll} n \\ {k}\end{array}\right)\cdot p^{k} \cdot (1-p)^{n-k}\end{array}

where $k=0,1,2,...,n$ .

Wir wollen nun die durchschnittliche Anzahl der Erfolge pro Experiment, $\mu$ , und auch die Standardabweichung $\sigma$ von diesem Durchschnitt berechnen. Wir beginnen mit dem Ergebnis und führen dann den Beweis an.

Theorem 1

Gegeben sei eine binomialverteilte Zufallsvariable $N$ mit Erfolgswahrscheinlichkeit $p$ und Wiederholungszahl $n$ . Der Mittelwert von $N$ ist

\mu = n\cdot p

und die Standardabweichung ist

\sigma = \sqrt{n p (1-p)}

Da $N$ dis Anzahl Erfolge pro Experiment zählt, heisst das nun: die beobachtete Anzahl von Erfolgen pro Experiment ist im Durchschnitt $\mu$ (gemittelt über eine riesige Anzahl von Experimenten), und die Abweichung der beobachteten Anzahl Erfolge von $\mu$ pro Experiment ist im Durchschnitt $\sigma$ (ebenfalls über eine riesige Anzahl von Experimenten gemittelt).

Hier ist ein Beispiel:

Example 1

Eine Experiment besteht darin, eine gezinkte Münze $10$ -mal zu werfen, wobei $p(K)=0.55$ . Wie viele Köpfe werden im Durchschnitt pro Experiment beobachtet? Und wie gross ist die typische Abweichung der beobachteten Anzahl Köpfe von diesem Durchschnitt?

$N$ ="Anzahl Köpfe" ist eine binomial verteilte Zufallsvariable mit den Parametern $n=10$ und $p=0.55$ . Die durchschnittliche Anzahl Köpfe pro Experiment ist also

\mu = 10\cdot 0.55=\underline{5.5}

und die typische Abweichung von $\mu=5.5$ der beobachteten Anzahl Köpfe pro Experiment

\sigma = \sqrt{10\cdot 0.55\cdot 0.45}=\underline{1.57}

Beachte, dass die Formel für den Mittelwert $\mu=np$ intuitiv Sinn ergibt: Führen wir das Münzen Experiment vom Beispiel oben oftmals durch (sagen wir ${\color{red}10000}$ -mal), so werfen wir die Münze ja insgesamt ${\color{red}10000}n=\color{green}{100000}$ -mal, und beobachten somit Kopf insgesamt $\color{green}{100000}p=55000$ -mal (per Definition der Wahrscheinlichkeit als langzeit relative Häufigkeit). Pro Experiment sehen wir also im Mittel $55000/{\color{red}10000}=5.5$ Köpfe, oder als Formel mit $n$ und $p$ ausgedrückt:

\mu = \frac{55000}{{\color{red}10000}}=\frac{\color{green}{100000}p}{{\color{red}10000}}= \frac{{\color{red}10000}np}{{\color{red}10000}}=np

Wie können wir diese Formeln allgemein beweisen? Nun, wenn man die allgemeine Methode zur Berechnung von $\mu$ und $\sigma$ von Zufallsvariablen anwendet, erhält man

\mu = p(N=0)\cdot 0 +p(N=1)\cdot 1 + ... + p(N=n)\cdot n

und

\sigma = \sqrt{p(N=0)\cdot (0-\mu)^2 +p(N=1)\cdot (1-\mu)^2 + ... + p(N=n)\cdot (n-\mu)^2}

Im Falle von binomialverteilten Zufallsvariablen haben wir nun

p(N=k)=binompdf(n,p,k)=\left(\begin{array}{lll} n \\ k\end{array}\right) p^k (1-p)^{n-k}

Setzt man die Formel für $p(N=k)$ in die obigen Ausdrücke für $\mu$ und $\sigma$ ein, so erhält man nach vielen algebraischen Umformungen und Vereinfachungen, dass $\mu=n p$ und $\sigma =\sqrt{n p (1-p)}$ . Das folgende Beispiel zeigt diese Berechnung für den Fall $n=2$ .

Example 2

Wir wollen zeigen, dass für den Fall $n=2$ gilt $\mu=2p$ und $\sigma=\sqrt{2p (1-p)}$ .

Solution

Mit

\begin{array}{lll} p(N=0) &=&\left(\begin{array}{lll} 2 \\ 0\end{array}\right)\cdot p^0\cdot (1-p)^2 = (1-p)^2\\ p(N=1) &=&\left(\begin{array}{lll} 2 \\ 1\end{array}\right)\cdot p^1\cdot (1-p)^1 = 2 p (1-p)\\ p(N=2) &=&\left(\begin{array}{lll} 2 \\ 2\end{array}\right)\cdot p^2\cdot (1-p)^0 = p^2\\ \end{array}

bekommen wir

\begin{array}{lll} \mu &=& p(N=0)\cdot 0 + p(N=1)\cdot 1 + p(N=2)\cdot 2\\ &=& 2 p (1-p) + 2 p^2\\ &=& \underline{2p} \end{array}

und für die Varianz $\sigma^2$ haben wir

\begin{array}{lll} \sigma^2 &=& p(N=0)\cdot (0-\mu)^2 + p(N=1)\cdot (1-\mu)^2 + p(N=2)\cdot (2-\mu)^2\\ &=& (1-p)^2\cdot (0-2p)^2 + 2p(1-p) \cdot (1-2p)^2 + p^2\cdot (2-2p)^2\\ &=& 2p(1-p)\\ \end{array}

Es ist also $\sigma =\underline{\sqrt{2p(1-p)}}$