Binomialverteilung

Oft gibt es bei Zufallsversuchen nur zwei mögliche Ausgänge: Mit einer Münze wirft man "Kopf" oder "Zahl", die gewürfelte Augenzahl ist eine 66 oder keine 66, die gezogene Karte ist ein Ass oder kein Ass, ...

Definition 1: Bernoulli-Versuch

Ein Zufallsversuch mit genau zwei Ausgängen, also mit dem Stichprobenraum Ω={Erfolg, Misserfolg}\Omega=\{\text{Erfolg, Misserfolg}\} oder kurz {1,0}\{1,0\}, heisst Bernoulli-Versuch.

Man nennt in diesem Zusammenhang eine Zufallsvariable binomialverteilt (binominis: lat. zweinamig).

Jakob Bernoulli (1655 - 1705) war der erste Mathematiker, der die Wahrscheinlichkeitsprobleme, die aus dieser Art von Versuchen entstehen, systematisch untersuchte. Üblicherweise wird die Wahrscheinlichkeit für einen Erfolg 11 mit pp und die für einen Misserfolg 00 mit qq bezeichnet: P(1)=pP(1) = p, P(0)=qP(0) = q, und damit p+q=1p + q = 1.

Ein Bernoulli-Versuch werde nn-mal wiederholt. Man spricht von einem nn-stufigen Bernoulli-Versuch, wenn

Bei einem nn-stufigen Bernoulli-Versuch interessiert man sich nicht so sehr für die Reihenfolge der Erfolge und Misserfolge, sondern nur für deren Anzahl und die entsprechenden Wahrscheinlichkeiten dafür. Beispielsweise hat eine Familie mit sechs Kindern vier Knaben und zwei Mädchen. Wie gross ist bei einem nn-stufigen Bernoulli-Versuch die Wahrscheinlichkeit für 00, 11, 22 oder nn Erfolge? Um diese Frage zu beantworten, führt man die Zufallsvariable SnS_n ein, die jedem möglichen Ausgang des nn-stufigen Versuchs die Anzahl Erfolge zuordnet.

Exercise 1: Erfolge

Die Wahrscheinlichkeitsverteilung von SnS_n ist wieder in einer Tabelle, deren Lücken noch zu füllen sind, dargestellt:

kk 0 1 2 3 ... kk ... n1n-1 nn
P(Sn=k)P(S_n=k) qnq^n pnp^n
Solution
xx 0 1 2 3 kk n1n-1 nn
P(Sn=x)P(S_n=x) qnq^n npqn1n \cdot pq^{n-1} (n2)p2qn2\binom{n}{2}p^2q^{n-2} (n3)p3qn3\binom{n}{3}p^3q^{n-3} (nk)pkqnk\binom{n}{k}p^kq^{n-k} npn1qn \cdot p^{n-1}q pnp^n
Exercise 2: Würfeln

Wie gross ist die Wahrscheinlichkeit bei 1010 Würfen genau 33 mal eine 66 zu werfen?

Solution

P(3 mal 6)=(103)(16)3(56)715.5%P(3\text{ mal }6) = \binom{10}{3}(\frac{1}{6})^3(\frac{5}{6})^7 \approx 15.5\%

Theorem 1

Ist bei einem Bernoulli-Versuch die Wahrscheinlichkeit für einen Erfolg pp und für einen Misserfolg q=1pq = 1 - p, so ist bei einem nn-stufigen Bernoulli-Versuch die Wahrscheinlichkeit für 0kn0\leq k\leq n Erfolge

P(Sn=k)=(nk)pkqnk.P(S_n=k) = \binom{n}{k}p^kq^{n-k}.
Proof

Die Wahrscheinlichkeit für kk Erfolge mit Einzel-Wahrscheinlichkeit pp ist pkp^k; es bleiben nkn-k Misserfolge mit Einzel-Wahrscheinlichkeit qq, also dafür qnkq^{n-k}. Der Fall von kk Erfolgen gefolgt von nkn-k Misserfolgen tritt also mit der Wahrscheinlichkeit pkqnkp^k\cdot q^{n-k} auf. Nun muss noch die Anzahl mögliche Reihenfolgen, in der diese Erfolge bzw. Misserfolge bei nn Versuchen auftreten können, ermittelt werden. Dies entspricht der Anzahl möglicher Zeichenfolgen der Länge nn mit zwei verschiedenen Ziffern (00 oder 11) pro Position, wobei eine Ziffer kk mal und die andere nkn-k auftreten muss; davon gibt es (nk)\binom{n}{k}.

Exercise 3: Binomialverteilt

Formuliere zuerst in Worten unten stehende Gleichung, und begründe anschliessend, dass tatsächlich

k=0n(nk)pkqnk=1.\sum_{k=0}^n\binom{n}{k}p^kq^{n-k} = 1.
Solution

Die Gleichung besagt, dass die Summe aller Einzelwahrscheinlichkeiten einer Binomialverteilung für k=0k=0 bis nn genau 11 ergibt (Normierung). Mathematisch ist k=0n(nk)pkqnk\sum_{k=0}^n\binom{n}{k}p^kq^{n-k} die Anwendung des binomischen Lehrsatzes auf den Term (p+q)n(p+q)^n. Da p+q=1p+q=1 gilt, folgt (1)n=1(1)^n = 1.

Exercise 4: n=8

Stelle die Binomialverteilung für n=8n=8 und

a) p=0.3p=0.3

b) p=0.5p=0.5

c) p=0.7p=0.7

durch ein Stabdiagramm graphisch dar. (kk sei variabel.)

Solution
Exercise 5: schwarz weiss

Aus einer Urne mit zwei schwarzen und vier weissen Kugeln werden sechs Kugeln mit Zurücklegen gezogen. Wie gross ist die Wahrscheinlichkeit, vier weisse und zwei schwarze Kugeln zu erhalten?

Solution

p=46=23p = \frac{4}{6} = \frac{2}{3} (weiss), q=13q = \frac{1}{3} (schwarz). P(4w und 2s)=(64)(23)4(13)232.9%P(4w\text{ und }2s) = \binom{6}{4}(\frac{2}{3})^4(\frac{1}{3})^2 \approx 32.9\%

Exercise 6: Fünf Würfel

Wie gross ist die Wahrscheinlichkeit, bei einem Wurf mit fünf Würfeln mindestens zwei Sechsen zu erzielen?

Solution

Ich gehe über die Gegenwahrscheinlichkeit. P(0)=(56)5P(0) = (\frac{5}{6})^5 und P(1)=5(56)4(16)P(1) = 5\cdot(\frac{5}{6})^4(\frac{1}{6}) und somit P(mind. 2)=1(P(0)+P(1))19.6%P(\text{mind. }2) = 1-(P(0)+P(1)) \approx 19.6\%

Theorem 2

Bei einer Binomialverteilung gilt für den Erwartungswert

E(Sn)=np.E(S_n) = np.
Proof

E(Sn)=k=0nk(nk)pkqnk=npk=0n1(n1k)pkqn1k=np(p+q)n1=np1n1=np.E(S_n) = \sum_{k=0}^nk\cdot\binom{n}{k}p^kq^{n-k} = np\cdot\sum_{k=0}^{n-1}\binom{n-1}{k}p^kq^{n-1-k} = np(p+q)^{n-1} = np\cdot1^{n-1} = np.

Theorem 3

Für die Standardabweichung einer binomialverteilten Zufallsvariablen gilt

σ=npq.\sigma = \sqrt{npq}.
Proof

Ähnliche, aber umfangreichere Rechnung als beim Erwartungswert.

Exercise 7: Werkstück

Werkstücke aus einer Fabrik sind mit der Wahrscheinlichkeit von 2% defekt. Wie gross ist die erwartete Anzahl defekte und die Standardabweichung bei einer Sendung von 1000010'000 Werkstücken?

Solution

E(X)=100000.02=200E(X) = 10'000 \cdot 0.02 = 200 und σX=100000.020.98=14\sigma_X = \sqrt{10'000 \cdot 0.02 \cdot 0.98} = 14

Exercise 8

If the probability is 60% that a marriage will end in a divorce within 20 years after its start, what is the probability that out of six couples just married, in the next 20 years

a) none,

b) all,

c) exactly two,

d) at least two

will be divorced? What is the mean and standard deviation for 1000 marriages?

Solution

p=0.6,q=0.4,n=6p=0.6, q=0.4, n=6

a) 0.460.41%0.4^6 \approx 0.41\%

b) 0.664.67%0.6^6 \approx 4.67\%

c) (62)0.620.4413.82%\binom{6}{2} \cdot 0.6^2 \cdot 0.4^4 \approx 13.82\%

d) 1(P(0)+P(1))=1(0.46+60.60.45)10.041=95.9%1 - (P(0) + P(1)) = 1 - (0.4^6 + 6 \cdot 0.6 \cdot 0.4^5) \approx 1 - 0.041 = 95.9\%

Für 1000 Ehen (n=1000,p=0.6n=1000, p=0.6): μ=np=600\mu = n \cdot p = 600, σ=10000.60.4=24015.49\sigma = \sqrt{1000 \cdot 0.6 \cdot 0.4} = \sqrt{240} \approx 15.49

Viele Taschenrechner bieten für binomialverteilte Zufallsvariablen Funktionen zum Berechnen von Wahrscheinlichkeiten gewisser Ereignisse. Seien nn die Anzahl Versuche und kk die Anzahl Erfolge mit Erfolgswahrscheinlichkeit pp. Dann berechnet

Also ist binompdf(n,p,k) =(nk)pkqnk=\binom{n}{k}p^kq^{n-k} und binomcdf(n,p,k) =j=0k(nj)pjqnj=\sum_{j=0}^k\binom{n}{j}p^jq^{n-j}.

Exercise 9: Labor

In einem Laborversuch zeigt sich ein bestimmter Effekt mit der Wahrscheinlichkeit von 20%. Der Versuch wird zehnmal durchgeführt. Wie gross ist die Wahrscheinlichkeit, dass der Effekt

a) mindestens

b) genau

c) höchstens

viermal eintritt?

Solution

a) Wir berechnen die Wahrscheinlichkeit des Gegenereignisses: weniger als 4 Mal in 10 Versuchen. Das ist

k=03(10k)0.2k0.810k=binomcdf(10,0.2,3)87.9%\sum_{k=0}^3\binom{10}{k}0.2^k\cdot0.8^{10-k}=\texttt{binomcdf(10,0.2,3)}\approx 87.9\%

Also ist P(mind. 4)187.9%=12.1%P(\text{mind. 4})\approx 1-87.9\% = 12.1\%

b)

(104)0.240.86=binompdf(10,0.2,4)8.8%\binom{10}{4}0.2^4\cdot0.8^6=\texttt{binompdf(10,0.2,4)}\approx 8.8\%

c)

k=04(10k)0.2k0.810k=binomcdf(10,0.2,4)96.7%\sum_{k=0}^4\binom{10}{k}0.2^k\cdot0.8^{10-k}=\texttt{binomcdf(10,0.2,4)}\approx 96.7\%

Auf Geogebra können wir die Verteilung mit dem Befehl Binomial(n,p), ohne Angabe der Anzahl Erfolge, plotten lassen.

Exercise 10: 10 Würfe

Wie gross ist die Wahrscheinlichkeit, bei zehnmaligem Würfeln zwischen 22 und 44 "66-en" zu würfeln.

Solution

Wir wollen die Spanne {2,3,4}\{2,3,4\} und rechnen daher

P(2X4)=k=24(10k)(16)k(56)10k=binomcdf(10,1/6,4)binomcdf(10,1/6,1)0.98450.484550.0%\begin{align*} P(2\leq X\leq4) &= \sum_{k=2}^4\binom{10}{k}(\tfrac{1}{6})^k\cdot(\tfrac{5}{6})^{10-k}=\texttt{binomcdf(10,1/6,4)}-\texttt{binomcdf(10,1/6,1)}\\ &\approx 0.9845-0.4845 \approx 50.0\% \end{align*}