Mittelwert und Standardabweichung einer binomialverteilten Zufallsvariablen

Gegeben sei ein Binomialexperiment mit Wiederholungszahl nn und Erfolgswahrscheinlichkeit pp. Die Zufallsvariable NN="Anzahl der Erfolge (nach nn Wiederholungen)" ist also binomial verteilt mit den Parametern nn und pp, und nimmt bei jeder Durchführung des Experiments einen der Werte 0,...,n0,...,n an, und zwar mit der Wahrscheinlichkeit

p(N=k)=(nk)pk(1p)nk\begin{array}{lll} p(N=k)&=&\left(\begin{array}{lll} n \\ {k}\end{array}\right)\cdot p^{k} \cdot (1-p)^{n-k}\end{array}

where k=0,1,2,...,nk=0,1,2,...,n.

Wir wollen nun die durchschnittliche Anzahl der Erfolge pro Experiment, μ\mu, und auch die Standardabweichung σ\sigma von diesem Durchschnitt berechnen. Wir beginnen mit dem Ergebnis und führen dann den Beweis an.

Theorem 1

Gegeben sei eine binomialverteilte Zufallsvariable NN mit Erfolgswahrscheinlichkeit pp und Wiederholungszahl nn. Der Mittelwert von NN ist

μ=np\mu = n\cdot p

und die Standardabweichung ist

σ=np(1p)\sigma = \sqrt{n p (1-p)}

Da NN dis Anzahl Erfolge pro Experiment zählt, heisst das nun: die beobachtete Anzahl von Erfolgen pro Experiment ist im Durchschnitt μ\mu (gemittelt über eine riesige Anzahl von Experimenten), und die Abweichung der beobachteten Anzahl Erfolge von μ\mu pro Experiment ist im Durchschnitt σ\sigma (ebenfalls über eine riesige Anzahl von Experimenten gemittelt).

Hier ist ein Beispiel:

Example 1

Eine Experiment besteht darin, eine gezinkte Münze 1010-mal zu werfen, wobei p(K)=0.55p(K)=0.55 . Wie viele Köpfe werden im Durchschnitt pro Experiment beobachtet? Und wie gross ist die typische Abweichung der beobachteten Anzahl Köpfe von diesem Durchschnitt?

NN="Anzahl Köpfe" ist eine binomial verteilte Zufallsvariable mit den Parametern n=10n=10 und p=0.55p=0.55. Die durchschnittliche Anzahl Köpfe pro Experiment ist also

μ=100.55=5.5\mu = 10\cdot 0.55=\underline{5.5}

und die typische Abweichung von μ=5.5\mu=5.5 der beobachteten Anzahl Köpfe pro Experiment

σ=100.550.45=1.57\sigma = \sqrt{10\cdot 0.55\cdot 0.45}=\underline{1.57}

Beachte, dass die Formel für den Mittelwert μ=np\mu=np intuitiv Sinn ergibt: Führen wir das Münzen Experiment vom Beispiel oben oftmals durch (sagen wir 10000{\color{red}10000}-mal), so werfen wir die Münze ja insgesamt 10000n=100000{\color{red}10000}n=\color{green}{100000}-mal, und beobachten somit Kopf insgesamt 100000p=55000\color{green}{100000}p=55000-mal (per Definition der Wahrscheinlichkeit als langzeit relative Häufigkeit). Pro Experiment sehen wir also im Mittel 55000/10000=5.555000/{\color{red}10000}=5.5 Köpfe, oder als Formel mit nn und pp ausgedrückt:

μ=5500010000=100000p10000=10000np10000=np\mu = \frac{55000}{{\color{red}10000}}=\frac{\color{green}{100000}p}{{\color{red}10000}}= \frac{{\color{red}10000}np}{{\color{red}10000}}=np

Wie können wir diese Formeln allgemein beweisen? Nun, wenn man die allgemeine Methode zur Berechnung von μ\mu und σ\sigma von Zufallsvariablen anwendet, erhält man

μ=p(N=0)0+p(N=1)1+...+p(N=n)n\mu = p(N=0)\cdot 0 +p(N=1)\cdot 1 + ... + p(N=n)\cdot n

und

σ=p(N=0)(0μ)2+p(N=1)(1μ)2+...+p(N=n)(nμ)2\sigma = \sqrt{p(N=0)\cdot (0-\mu)^2 +p(N=1)\cdot (1-\mu)^2 + ... + p(N=n)\cdot (n-\mu)^2}

Im Falle von binomialverteilten Zufallsvariablen haben wir nun

p(N=k)=binompdf(n,p,k)=(nk)pk(1p)nkp(N=k)=binompdf(n,p,k)=\left(\begin{array}{lll} n \\ k\end{array}\right) p^k (1-p)^{n-k}

Setzt man die Formel für p(N=k)p(N=k) in die obigen Ausdrücke für μ\mu und σ\sigma ein, so erhält man nach vielen algebraischen Umformungen und Vereinfachungen, dass μ=np\mu=n p und σ=np(1p)\sigma =\sqrt{n p (1-p)}. Das folgende Beispiel zeigt diese Berechnung für den Fall n=2n=2.

Example 2

Wir wollen zeigen, dass für den Fall n=2n=2 gilt μ=2p\mu=2p und σ=2p(1p)\sigma=\sqrt{2p (1-p)}.

Solution

Mit

p(N=0)=(20)p0(1p)2=(1p)2p(N=1)=(21)p1(1p)1=2p(1p)p(N=2)=(22)p2(1p)0=p2\begin{array}{lll} p(N=0) &=&\left(\begin{array}{lll} 2 \\ 0\end{array}\right)\cdot p^0\cdot (1-p)^2 = (1-p)^2\\ p(N=1) &=&\left(\begin{array}{lll} 2 \\ 1\end{array}\right)\cdot p^1\cdot (1-p)^1 = 2 p (1-p)\\ p(N=2) &=&\left(\begin{array}{lll} 2 \\ 2\end{array}\right)\cdot p^2\cdot (1-p)^0 = p^2\\ \end{array}

bekommen wir

μ=p(N=0)0+p(N=1)1+p(N=2)2=2p(1p)+2p2=2p\begin{array}{lll} \mu &=& p(N=0)\cdot 0 + p(N=1)\cdot 1 + p(N=2)\cdot 2\\ &=& 2 p (1-p) + 2 p^2\\ &=& \underline{2p} \end{array}

und für die Varianz σ2\sigma^2 haben wir

σ2=p(N=0)(0μ)2+p(N=1)(1μ)2+p(N=2)(2μ)2=(1p)2(02p)2+2p(1p)(12p)2+p2(22p)2=2p(1p)\begin{array}{lll} \sigma^2 &=& p(N=0)\cdot (0-\mu)^2 + p(N=1)\cdot (1-\mu)^2 + p(N=2)\cdot (2-\mu)^2\\ &=& (1-p)^2\cdot (0-2p)^2 + 2p(1-p) \cdot (1-2p)^2 + p^2\cdot (2-2p)^2\\ &=& 2p(1-p)\\ \end{array}

Es ist also σ=2p(1p)\sigma =\underline{\sqrt{2p(1-p)}}