Die Binomialverteilung

Bei einem Binomialexperiment interessiert uns oft die Wahrscheinlichkeit, dass eine bestimmte Anzahl von Erfolgen eintritt. Dies führt zu der Binomialverteilung.

Definition 1

Betrachte ein Binomialexperiment mit Repetitionszahl $n$ und Erfolgswahrscheinlichkeit $p$ .

Die Zufallsvariable $N$ ="Anzahl der Erfolge nach $n$ Wiederholungen" hat die möglichen Werte $0,1,...,n$ , und wird binomialverteilte Zufallsvariable mit den Parametern $n$ und $p$ genannt.

Die Wahrscheinlichkeitsverteilung von $N$ heisst Binomialverteilung mit den Parametern $n$ und $p$ . Die Wahrscheinlichkeit, dass es $k$ Erfolge gibt, wird mit $binom{\color{red} p}df(n,p,k)$ bezeichnet, es gilt also

p(N=k)=binom{\color{red} p}df(n,p,k)

wobei $k=0,1,...,n$ . Die kumulative Verteilungsfunktion von $N$ wird mit $F_N(x)=binom{\color{red} c}df(n,p,k)$ bezeichnet, es ist also

p(N\leq k)=binom{\color{red} c}df(n,p,k)

$binom{\color{red} p}df$ steht für binomial probability distribution function, und $binom{\color{red} c}df$ steht für binomial cumulative distribution function. Sowohl $binompdf$ wie auch $binomcdf$ sind auf dem Taschenrechner zu finden.

Note 1

Beachte, dass es sich eingebürgert hat, von der Binomialverteilung zu sprechen, in der Tat ist es aber die Wahrscheinlichkeitsfunktion der Zufallsvariablen $N$ .

Wir machen nun zunächst ein Beispiel und leiten dann eine Formel zur Berechnung dieser Verteilungen her.

Example 1

Eine gezinkte Münze hat die Wahrscheinlichkeit $0.2$ , dass Kopf erscheint. Die Münze wird $4$ mal geworfen. Wir definieren die Zufallsvariable $N=$ "Anzahl Köpfe".

Ist $N$ eine binomialverteilte Zufallsvariable? Falls ja, was sind deren Parameter $n$ und $p$ ?
Wie gross ist die Wahrscheinlichkeit, $2$ Mal Kopf zu erhalten? Brauche den Taschenrechner und $binompdf$ .
Wie gross ist die Wahrscheinlichkeit, nicht mehr als $2$ Mal Kopf zu erhalten? Brauche den Taschenrechner und $binomcdf$ .

Solution

Da das Experiment ein Binomialexperiment ist (Erfolg $S=$ "Kopf"), ist $N$ eine binomial verteilte Zufallsvariable ist mit den Parametern $p=0.2$ und $n=4$ .
$p(N=2)=binompdf(4,0.2,2)=\underline{0.1536}$
$p(N\leq 2)=binomcdf(4,0.2,2)=\underline{0.9728}$

Eine Formel für binompdf

Anstatt den Taschenrechner zu benutzen, wollen wir nun eine Formel zur Berechnung von $binompdf$ und $binomcdf$ herleiten. Wir werden das Beispiel von oben verwenden (also studiere es zuerst). Die Baumdarstellung von $4$ Münzwürfen und $p(K)=0.2$ ist unten gezeigt (mit H=K, und T=Z).

Wir wollen die Wahrscheinlichkeit

p(N=2)=binompdf(4,0.2,2)

berechnen, wobei $N$ ="Anzahl der Köpfe" eine binomialverteilte Zufallsvariable ist mit $n=4$ und $p=0.2$ . Wir müssen also die Pfadwahrscheinlichkeiten aller Pfade addieren, die genau $2$ Köpfe und somit $2$ Zahlen enthalten. Wir wissen bereits aus der Diskussion des Binomialkoeffizienten, dass es

\left(\begin{array}{lll} 4 \\ 2\end{array}\right)=6

solcher Pfade gibt. Woher wissen wir das? Nun, jeder dieser Pfade muss einem Wort mit 4 Buchstaben entsprechen, das aus zwei $H$ und zwei $T$ besteht (z.B. $HHTT, THTH$ , ...), und es gibt $\left(\begin{array}{lll} 4 \\ 2\end{array}\right)$ Möglichkeiten, ein solches Wort zu bilden. Aber bitte im obigen Baum nachprüfen!

Da jeder dieser Pfade genau zwei Köpfe und zwei Zahlen hat, ist die Pfadwahrscheinlichkeit eines jeden Pfades

0.2^2\cdot 0.8^2

Die Summe der Pfadwahrscheinlichkeiten ist also

\begin{array}{lll} p(N=2)&=&binompdf(4,0.2,2)\\ &=&\left(\begin{array}{lll} 4 \\ 2\end{array}\right)\cdot 0.2^2\cdot 0.8^2\\ &=&0.1536 \end{array}

Analog haben wir

\begin{array}{lll} p(N=0)&=&binompdf(4,0.2,0)\\ &=&\left(\begin{array}{lll} 4 \\ 0\end{array}\right)\cdot 0.2^0\cdot 0.8^4\\ &=&0.4096 \end{array}

und

\begin{array}{lll} p(N=1)&=&binompdf(4,0.2,1)\\ &=&\left(\begin{array}{lll} 4 \\ 1\end{array}\right)\cdot 0.2^1\cdot 0.8^3\\ &=&0.4096 \end{array}

(es ist Zufall, dass beide Wahrscheinlichkeiten gleich sind).

Das Muster sollte nun erkennbar sein:

p(N={\color{red} k})=binompdf(4,0.2,{\color{red}k})=\left(\begin{array}{lll} 4 \\ {\color{red} k}\end{array}\right)\cdot 0.2^{{\color{red}k}} \cdot 0.8^{4-{\color{red}k}}

Allgemeiner haben wir:

Theorem 1

Gegeben sei eine binomialverteilte Zufallsvariable $N$ mit den Parametern $n$ und $p$ . Es gilt:

\begin{array}{lll} p(N={\color{red} k})&=&binompdf(n,p,{\color{red} k})\\&=&\left(\begin{array}{lll} n \\ {\color{red} k}\end{array}\right)\cdot p^{\color{red} k}\cdot (1-p)^{n-{\color{red}k}}\end{array}

where ${\color{red}k} =0,1,2,...,n$ .

Die Berechnung von binomcdf

Zur Berechnung von

p(N\leq 2)=binomcdf(4,0.2,2)

ist zu beachten, dass erstens $N$ nur die Werte $0,1,2,3,4$ annehmen kann, und zweitens die Ereignisse $N=0$ , $N=1$ , $N=2$ sich paarweise gegenseitig ausschliessen. Wir haben also

\begin{array}{ll} p(N\leq 2)&=&p(N=0 \cup N=1 \cup N=2)\\ &=&p(N=0)+p(N=1)+p(N=2)\\ &=&0.1536+0.4096+0.4096\\ &=& 0.9728 \end{array}

Es gibt leider keine einfache Formel, um die kumulative Verteilungsfunktion der binomischen Zufallsvariablen direkt zu berechnen. Man kann sie aber direkt mit dem Taschenrechner berechnen:

p(N\leq 2)=binomcdf(4,0.2,2)=0.9728

$binomcdf$ ist nützlich, um die Wahrscheinlichkeit von Ereignissen wie "Anzahl der Köpfe ist gleich oder kleiner als $5$ " zu ermitteln. Sie kann aber auch für Ereignisse wie "mindestens 3 Köpfe", oder "mehr als 67 Köpfe", "Anzahl der Köpfe liegt zwischen $2$ und $10$ ", usw. verwendet werden. Dazu muss man einige Umformungen machen:

Theorem 2

Betrachte eine binomialverteilte Zufallsvariable $N$ mit den Parametern $n$ und $p$ und zwei Zahlen $a\in\{0,1,2,...,n\}$ und $b\in \{0,1,...,n\}$ mit $a\leq b$ . Das Folgende gilt:

$p(N < a)=p(N \leq a-1)=binomcdf(n,p,a-1)$
$p(N>a)=1-p(N\leq a)=1-binomcdf(n,p,a)$
$p(N\geq a)=1-p(N\leq a-1)=1-binomcdf(n,p,a-1)$
$p(a<N\leq b)=p(N\leq b)-p(N\leq a)=binomcdf(n,p,b)- binomcdf(n,p,a)$
$p(a\leq N\leq b)=p(N\leq b)-p(N\leq a-1)=binomcdf(n,p,b)- binomcdf(n,p,a-1)$
$p(a\leq N< b)=p(N\leq b-1)-p(N\leq a-1)=binomcdf(n,p,b-1)- binomcdf(n,p,a-1)$
$p(a< N< b)=p(N\leq b-1)-p(N\leq a)=binomcdf(n,p,b-1)- binomcdf(n,p,a)$

Der Beweis folgt unten als Aufgabe.

Exercise 1

Beweise die obigen Aussagen.

Solution

Siehe die folgende Abbildung. Die blauen Punkte zeigen das Ereignis an, dessen Wahrscheinlichkeit wir berechnen wollen. Ein solches Ereignis wird berechnet, indem die Wahrscheinlichkeit aller farbigen Punkte abzüglich der Wahrscheinlichkeit aller roten Punkte addiert wird.

Exercise 2

Eine Münze ( $p(H)=0.1$ ) wird $10$ mal geworfen. $N$ bezeichnet die Anzahl der Köpfe. Bestimmen Sie die folgenden Wahrscheinlichkeiten:

$N$ ist gleich $0$ (ohne Taschenrechner)
$N$ ist gleich $10$ (ohne Taschenrechner)
$N$ ist nicht grösser als $5$
$N$ ist kleiner als $5$
$N$ ist mindestens $5$
$N$ ist grösser als $5$
$N$ ist mindestens $2$ und kleiner als $7$
$N$ ist grösser als $2$ und nicht grösser als $7$
$N$ liegt zwischen $2$ und $7$ (einschliesslich Grenzen)
$N$ liegt zwischen $2$ und $7$ (ohne Grenzen)
$N$ ist grösser als $0$ (ohne Taschenrechner)

Solution

Exercise 3

F1

Aus den Krankenhausunterlagen geht hervor, dass von den Patienten, die an einer bestimmten Krankheit leiden, $75\%$ an dieser Krankheit sterben. Sie wählen nach dem Zufallsprinzip $6$ Patienten aus.

Wie gross ist die Wahrscheinlichkeit, dass $4$ wieder gesund werden?
Wie gross ist die Wahrscheinlichkeit, dass nicht mehr als $4$ genesen?

F2

Früher hatte jeder Versuch, einen Telefonanruf zu tätigen, eine Erfolgswahrscheinlichkeit von $0.8$ . (Dies hing oft von der Wichtigkeit der Person ab, die den Anruf tätigte, oder von der Neugier der Telefonistin!) Berechnen Sie die Wahrscheinlichkeit, dass bei $10$ Versuchen mindestens $7$ Erfolg haben.

F3

Ein Schütze (mit verbundenen Augen) stellt fest, dass er im Durchschnitt $4$ von $5$ Mal das Ziel trifft. Wenn er vier Schüsse abgibt, wie gross ist die Wahrscheinlichkeit, dass

mehr als $2$ Treffer?
mindestens $3$ Fehlschüsse?

F4

In Singapur beträgt die Wahrscheinlichkeit für die Geburt eines Jungen $0.5215$ , für die eines Mädchens $0.4785$ . Wie hoch ist der Anteil der Familien in Singapur mit genau $6$ Kindern, die mindestens $3$ Jungen haben?

F5

Du wirfst zweimal einen fairen Würfel und bildest die Summe. Wie gross ist die Wahrscheinlichkeit, dass die Summe $8$ in mehr als der Hälfte der Fälle zustande kommt, wenn man dies $20$ Mal wiederholt?

F6

Eine gezinkte Münze ( $p(H)=0.45$ ) wird $250$ mal geworfen. Bestimme die Wahrscheinlichkeit für die Beobachtung von

$100$ Kopf.
mindestens $100$ Kopf.
zwischen $104$ und $120$ Kopf (einschliesslich Ränder)
Die Wahrscheinlichkeit für die Beobachtung von mehr als $k$ Köpfen sollte kleiner als $20\%$ sein. Bestimmen Sie $k$ (Sie müssen dies durch Versuch und Irrtum mit Hilfe des Taschenrechners tun).

F7

Überbuchung. Ein Medizinstudiengang ist auf $120$ Studenten begrenzt. Die Erfahrung zeigt, dass $10\%$ der Studenten ihre Bewerbung zurückziehen. Wie viele Bewerbungen können berücksichtigt werden, so dass die Wahrscheinlichkeit, dass es zu viele Studenten gibt, kleiner als $5\%$ ist? Verwenden Sie auch hier Versuch und Irrtum, um die Lösung zu finden.

F8

Eine voreingenommene Münze mit $p(H)=0.4$ wird $n$ mal geworfen. Finden Sie $n$ so, dass die Wahrscheinlichkeit, mindestens einen Kopf zu sehen, mindestens $99.99\%$ beträgt.

F9

In einem Dorf haben $44\%$ für Trump und $56\%$ für Biden gestimmt. Sie führen eine Umfrage durch und wählen eine Zufallsstichprobe von Personen aus.

Wenn die Stichprobengrösse $20$ Personen beträgt, wie hoch ist die Wahrscheinlichkeit, dass mehr als $5$ Personen, aber weniger als $15$ Personen für Biden gestimmt haben?
Sie möchten die Stichprobengrösse so wählen, dass die Stichprobe mindestens einen Biden-Wähler mit einer Wahrscheinlichkeit von $0.999$ oder mehr enthält. Was ist die minimale Stichprobengrösse?
Die Stichprobengrösse soll so gross gewählt werden, dass die Stichprobe mehr als $5$ Biden-Wähler mit einer Wahrscheinlichkeit von $0.999$ oder mehr enthält. Wie gross ist der minimale Stichprobenumfang?

Solution

A1

$N$ ="Anzahl der genesenen Patienten" ist eine binomische RV mit den Parametern $n=6$ und $p=0,25$ .

$p(N=4)=binompdf(6,0.25,4)=\underline{0.032}$
$p(N\leq 4)=binomcdf(6,0.25,4)=\underline{0.995}$ .

A2

$N$ ="Anzahl der Erfolge" ist eine binomialverteilte RV mit den Parametern $n=10$ und $p=0.8$ . $p(N\geq 7)=1-binomcdf(10,0.8,6)=\underline{0.879}$ .

A3

$N$ ="Anzahl der Treffer" ist eine binomische RV mit den Parametern $n=4$ und $p=4/5$ .

$p(N > 2)= 1-binomcdf(4,4/5,2)=\underline{0.8192}$
$p(N\leq 1)=binomcdf(4,4/5,1)=\underline{0.0272}$ .

A4

$N$ ="Anzahl der Jungen" ist eine binomialverteilte RV mit den Parametern $n=6$ und $p=0,5215$ . $p(N\geq 3)=1-binomcdf(6,0.5215,2)=\underline{0.695}$ .

A5

$N$ ="Anzahl der Fälle, in denen die Summe $8$ ist" ist eine binomische RV mit den Parametern $n=20$ und $p=5/36$ (Wahrscheinlichkeit für Summe $8$ ). $p(N>10)=1-binomcdf(20,5/36,10)=\underline{1.8\cdot 10^{-5}}$ .

A6

$N$ ="Anzahl der Köpfe" ist eine binomialverteilte RV mit den Parametern $n=20$ und $p=5/36$

$binompdf(250,0.45,100)=\underline{0.014}$
$1-binomcdf(250,0.45,99)=\underline{0.951}$
$binomcdf(250,0.45,120)-binomcdf(250,0.45,103)=\underline{0.719}$
Finde $k$ mit
$p(N>k)=1-binomcdf(250,0.45,k)<0.2$
Durch Ausprobieren mit dem Taschenrechner erhalten wir $k=\underline{119}$ .

A7

Binomialexperiment mit Erfolg $S$ ="nicht abgesagt" und Erfolgswahrscheinlichkeit $p=0.9$ . $n$ ist die Anzahl der Bewerber (die Anzahl der Wiederholungen des Bernoulli-Experiments "ein zufällig ausgewählter Bewerber sagt ab oder nicht"). $N$ ="Anzahl der Fälle, in denen eine Bewerbung nicht abgesagt wird" (Anzahl der Erfolge) ist eine binomische RV mit den Parametern $n$ (unknown) und $p=0.9$ .

Finde $n$ so, dass

p(N > 120)<0.05

d.h.

1-binomcdf(n,0.9,120) <0.05

Versuch und Irrtum $\rightarrow n=\underline{127}$ .

A8

$N$ ="Anzahl der Köpfe" ist eine binomische RV mit den Parametern $n$ und $p=0.4$ . Wir müssen $n$ so finden, dass

p(N\geq 1)\geq 0.9999

Aufgrund von $p(N\geq 1)=1-p(N=0)$ müssen wir $n$ finden mit

p(N=0)\leq 0.0001

Finden wir zunächst $n$ mit

p(N=0)=0.0001

Mit

\begin{array}{lll} p(N=0)&=&\left(\begin{array}{lll} n \\ 0\end{array}\right) \cdot 0.4^0\cdot 0.6^n\\ &=& 0.6^n\end{array}

wir müssen also $n$ finden mit

0.6^n = 0.0001

Wenn wir den Logarithmus auf beiden Seiten nehmen, erhalten wir

n\cdot \ln(0.6)=\ln(0.0001)

und somit $n=\frac{\ln(0.0001)}{\ln(0.6)}=18.03$ , also $n=\underline{19}$ .

A9

Es handelt sich um ein Binomialexperiment, bei dem der Erfolg $S$ ="Ausgewählte Person hat für Biden gestimmt" ist, und die Erfolgswahrscheinlichkeit $p(S)=0,56$ beträgt. $n$ ist die Anzahl der Personen in der Stichprobe (die Anzahl der Wiederholungen des Bernoulli-Experiments, d.h. "wähle eine Person aus dem Dorf nach dem Zufallsprinzip aus, die für Biden stimmen wird oder nicht"). Sei $N$ die Anzahl der Erfolge, d.h. die Anzahl der Personen in der Stichprobe, die für Biden stimmen.

$n=20$ ,
$\begin{array}{lll} p(5<N<15)&=&p(N\leq 14)-p(N\leq 5)\\ &=&binomcdf(20,0.56,14)-binomcdf(20,0.56,5)\\ &=&\underline{0.929} \end{array}$
Finde $n$ mit
$p(N\geq 1) =0.999$
Wir können für $n$ lösen:
$\begin{array}{lll} p(N\geq 1)&=&1-p(N<1)\\ &=& 1-p(N=0)\\ &=& 1-\left(\begin{array}{cc}n\\0\end{array}\right) \cdot 0.56^0\cdot 0.44^n \\ &=& 1-0.44^n \end{array}$
Finde also $n$ mit
$\begin{array}{cll} 1-0.44^n &=&0.999\quad\vert +0.44^n, -0.999\\ 0.44^n &=&0.001 \quad\vert \log(.)\\ n\log(0.44)&=&\log(0.001)\quad\vert :\log(0.44)\\ n&=&\frac{\log(0.001)}{\log(0.44)}\\ &=& 8.414 \end{array}$
Es ist also $n=\underline{9}$ .
Finden Sie $n$ mit
$p(N>5)>0.999$
oder
$1-p(N\leq 5) > 0.999$
d.h.
$1-binomcdf(n,0.56,5) > 0.999$
Im Gegensatz zum vorherigen Problem (2) können wir $n$ nicht lösen, denn $binomcdf(n,0.56,5)$ lässt sich nicht auf eine einfache Formel reduzieren, die wir lösen können. Also müssen wir $n$ durch Versuch und Irrtum finden (geben Sie einige Zahlen für $n$ in den Taschenrechner ein). Wir erhalten $n=\underline{23}$ .