Die Binomialverteilung

Bei einem Binomialexperiment interessiert uns oft die Wahrscheinlichkeit, dass eine bestimmte Anzahl von Erfolgen eintritt. Dies führt zu der Binomialverteilung.

Definition 1

Betrachte ein Binomialexperiment mit Repetitionszahl nn und Erfolgswahrscheinlichkeit pp.

Die Zufallsvariable NN="Anzahl der Erfolge nach nn Wiederholungen" hat die möglichen Werte 0,1,...,n0,1,...,n, und wird binomialverteilte Zufallsvariable mit den Parametern nn und pp genannt.

Die Wahrscheinlichkeitsverteilung von NN heisst Binomialverteilung mit den Parametern nn und pp. Die Wahrscheinlichkeit, dass es kk Erfolge gibt, wird mit binompdf(n,p,k)binom{\color{red} p}df(n,p,k) bezeichnet, es gilt also

p(N=k)=binompdf(n,p,k)p(N=k)=binom{\color{red} p}df(n,p,k)

wobei k=0,1,...,nk=0,1,...,n. Die kumulative Verteilungsfunktion von NN wird mit FN(x)=binomcdf(n,p,k)F_N(x)=binom{\color{red} c}df(n,p,k) bezeichnet, es ist also

p(Nk)=binomcdf(n,p,k)p(N\leq k)=binom{\color{red} c}df(n,p,k)

binompdfbinom{\color{red} p}df steht für binomial probability distribution function, und binomcdfbinom{\color{red} c}df steht für binomial cumulative distribution function. Sowohl binompdfbinompdf wie auch binomcdfbinomcdf sind auf dem Taschenrechner zu finden.

Note 1

Beachte, dass es sich eingebürgert hat, von der Binomialverteilung zu sprechen, in der Tat ist es aber die Wahrscheinlichkeitsfunktion der Zufallsvariablen NN.

Wir machen nun zunächst ein Beispiel und leiten dann eine Formel zur Berechnung dieser Verteilungen her.

Example 1

Eine gezinkte Münze hat die Wahrscheinlichkeit 0.20.2, dass Kopf erscheint. Die Münze wird 44 mal geworfen. Wir definieren die Zufallsvariable N=N="Anzahl Köpfe".

  1. Ist NN eine binomialverteilte Zufallsvariable? Falls ja, was sind deren Parameter nn und pp?

  2. Wie gross ist die Wahrscheinlichkeit, 22 Mal Kopf zu erhalten? Brauche den Taschenrechner und binompdfbinompdf.

  3. Wie gross ist die Wahrscheinlichkeit, nicht mehr als 22 Mal Kopf zu erhalten? Brauche den Taschenrechner und binomcdfbinomcdf.

Solution
  1. Da das Experiment ein Binomialexperiment ist (Erfolg S=S="Kopf"), ist NN eine binomial verteilte Zufallsvariable ist mit den Parametern p=0.2p=0.2 und n=4n=4.
  2. p(N=2)=binompdf(4,0.2,2)=0.1536p(N=2)=binompdf(4,0.2,2)=\underline{0.1536}
  3. p(N2)=binomcdf(4,0.2,2)=0.9728p(N\leq 2)=binomcdf(4,0.2,2)=\underline{0.9728}

Eine Formel für binompdf

Anstatt den Taschenrechner zu benutzen, wollen wir nun eine Formel zur Berechnung von binompdfbinompdf und binomcdfbinomcdf herleiten. Wir werden das Beispiel von oben verwenden (also studiere es zuerst). Die Baumdarstellung von 44 Münzwürfen und p(K)=0.2p(K)=0.2 ist unten gezeigt (mit H=K, und T=Z).

Wir wollen die Wahrscheinlichkeit

p(N=2)=binompdf(4,0.2,2)p(N=2)=binompdf(4,0.2,2)

berechnen, wobei NN="Anzahl der Köpfe" eine binomialverteilte Zufallsvariable ist mit n=4n=4 und p=0.2p=0.2. Wir müssen also die Pfadwahrscheinlichkeiten aller Pfade addieren, die genau 22 Köpfe und somit 22 Zahlen enthalten. Wir wissen bereits aus der Diskussion des Binomialkoeffizienten, dass es

(42)=6\left(\begin{array}{lll} 4 \\ 2\end{array}\right)=6

solcher Pfade gibt. Woher wissen wir das? Nun, jeder dieser Pfade muss einem Wort mit 4 Buchstaben entsprechen, das aus zwei HH und zwei TT besteht (z.B. HHTT,THTHHHTT, THTH, ...), und es gibt (42)\left(\begin{array}{lll} 4 \\ 2\end{array}\right) Möglichkeiten, ein solches Wort zu bilden. Aber bitte im obigen Baum nachprüfen!

Da jeder dieser Pfade genau zwei Köpfe und zwei Zahlen hat, ist die Pfadwahrscheinlichkeit eines jeden Pfades

0.220.820.2^2\cdot 0.8^2

Die Summe der Pfadwahrscheinlichkeiten ist also

p(N=2)=binompdf(4,0.2,2)=(42)0.220.82=0.1536\begin{array}{lll} p(N=2)&=&binompdf(4,0.2,2)\\ &=&\left(\begin{array}{lll} 4 \\ 2\end{array}\right)\cdot 0.2^2\cdot 0.8^2\\ &=&0.1536 \end{array}

Analog haben wir

p(N=0)=binompdf(4,0.2,0)=(40)0.200.84=0.4096\begin{array}{lll} p(N=0)&=&binompdf(4,0.2,0)\\ &=&\left(\begin{array}{lll} 4 \\ 0\end{array}\right)\cdot 0.2^0\cdot 0.8^4\\ &=&0.4096 \end{array}

und

p(N=1)=binompdf(4,0.2,1)=(41)0.210.83=0.4096\begin{array}{lll} p(N=1)&=&binompdf(4,0.2,1)\\ &=&\left(\begin{array}{lll} 4 \\ 1\end{array}\right)\cdot 0.2^1\cdot 0.8^3\\ &=&0.4096 \end{array}

(es ist Zufall, dass beide Wahrscheinlichkeiten gleich sind).

Das Muster sollte nun erkennbar sein:

p(N=k)=binompdf(4,0.2,k)=(4k)0.2k0.84kp(N={\color{red} k})=binompdf(4,0.2,{\color{red}k})=\left(\begin{array}{lll} 4 \\ {\color{red} k}\end{array}\right)\cdot 0.2^{{\color{red}k}} \cdot 0.8^{4-{\color{red}k}}

Allgemeiner haben wir:

Theorem 1

Gegeben sei eine binomialverteilte Zufallsvariable NN mit den Parametern nn und pp. Es gilt:

p(N=k)=binompdf(n,p,k)=(nk)pk(1p)nk\begin{array}{lll} p(N={\color{red} k})&=&binompdf(n,p,{\color{red} k})\\&=&\left(\begin{array}{lll} n \\ {\color{red} k}\end{array}\right)\cdot p^{\color{red} k}\cdot (1-p)^{n-{\color{red}k}}\end{array}

where k=0,1,2,...,n{\color{red}k} =0,1,2,...,n.

Die Berechnung von binomcdf

Zur Berechnung von

p(N2)=binomcdf(4,0.2,2)p(N\leq 2)=binomcdf(4,0.2,2)

ist zu beachten, dass erstens NN nur die Werte 0,1,2,3,40,1,2,3,4 annehmen kann, und zweitens die Ereignisse N=0N=0, N=1N=1, N=2N=2 sich paarweise gegenseitig ausschliessen. Wir haben also

p(N2)=p(N=0N=1N=2)=p(N=0)+p(N=1)+p(N=2)=0.1536+0.4096+0.4096=0.9728\begin{array}{ll} p(N\leq 2)&=&p(N=0 \cup N=1 \cup N=2)\\ &=&p(N=0)+p(N=1)+p(N=2)\\ &=&0.1536+0.4096+0.4096\\ &=& 0.9728 \end{array}

Es gibt leider keine einfache Formel, um die kumulative Verteilungsfunktion der binomischen Zufallsvariablen direkt zu berechnen. Man kann sie aber direkt mit dem Taschenrechner berechnen:

p(N2)=binomcdf(4,0.2,2)=0.9728p(N\leq 2)=binomcdf(4,0.2,2)=0.9728

binomcdfbinomcdf ist nützlich, um die Wahrscheinlichkeit von Ereignissen wie "Anzahl der Köpfe ist gleich oder kleiner als 55" zu ermitteln. Sie kann aber auch für Ereignisse wie "mindestens 3 Köpfe", oder "mehr als 67 Köpfe", "Anzahl der Köpfe liegt zwischen 22 und 1010", usw. verwendet werden. Dazu muss man einige Umformungen machen:

Theorem 2

Betrachte eine binomialverteilte Zufallsvariable NN mit den Parametern nn und pp und zwei Zahlen a{0,1,2,...,n}a\in\{0,1,2,...,n\} und b{0,1,...,n}b\in \{0,1,...,n\} mit aba\leq b. Das Folgende gilt:

  1. p(N<a)=p(Na1)=binomcdf(n,p,a1)p(N < a)=p(N \leq a-1)=binomcdf(n,p,a-1)
  2. p(N>a)=1p(Na)=1binomcdf(n,p,a)p(N>a)=1-p(N\leq a)=1-binomcdf(n,p,a)
  3. p(Na)=1p(Na1)=1binomcdf(n,p,a1)p(N\geq a)=1-p(N\leq a-1)=1-binomcdf(n,p,a-1)
  4. p(a<Nb)=p(Nb)p(Na)=binomcdf(n,p,b)binomcdf(n,p,a)p(a<N\leq b)=p(N\leq b)-p(N\leq a)=binomcdf(n,p,b)- binomcdf(n,p,a)
  5. p(aNb)=p(Nb)p(Na1)=binomcdf(n,p,b)binomcdf(n,p,a1)p(a\leq N\leq b)=p(N\leq b)-p(N\leq a-1)=binomcdf(n,p,b)- binomcdf(n,p,a-1)
  6. p(aN<b)=p(Nb1)p(Na1)=binomcdf(n,p,b1)binomcdf(n,p,a1)p(a\leq N< b)=p(N\leq b-1)-p(N\leq a-1)=binomcdf(n,p,b-1)- binomcdf(n,p,a-1)
  7. p(a<N<b)=p(Nb1)p(Na)=binomcdf(n,p,b1)binomcdf(n,p,a)p(a< N< b)=p(N\leq b-1)-p(N\leq a)=binomcdf(n,p,b-1)- binomcdf(n,p,a)

Der Beweis folgt unten als Aufgabe.

Exercise 1

Beweise die obigen Aussagen.

Solution

Siehe die folgende Abbildung. Die blauen Punkte zeigen das Ereignis an, dessen Wahrscheinlichkeit wir berechnen wollen. Ein solches Ereignis wird berechnet, indem die Wahrscheinlichkeit aller farbigen Punkte abzüglich der Wahrscheinlichkeit aller roten Punkte addiert wird.

Exercise 2

Eine Münze (p(H)=0.1p(H)=0.1) wird 1010 mal geworfen. NN bezeichnet die Anzahl der Köpfe. Bestimmen Sie die folgenden Wahrscheinlichkeiten:

  1. NN ist gleich 00 (ohne Taschenrechner)

  2. NN ist gleich 1010 (ohne Taschenrechner)

  3. NN ist nicht grösser als 55

  4. NN ist kleiner als 55

  5. NN ist mindestens 55

  6. NN ist grösser als 55

  7. NN ist mindestens 22 und kleiner als 77

  8. NN ist grösser als 22 und nicht grösser als 77

  9. NN liegt zwischen 22 und 77 (einschliesslich Grenzen)

  10. NN liegt zwischen 22 und 77 (ohne Grenzen)

  11. NN ist grösser als 00 (ohne Taschenrechner)

Solution
Exercise 3
F1

Aus den Krankenhausunterlagen geht hervor, dass von den Patienten, die an einer bestimmten Krankheit leiden, 75%75\% an dieser Krankheit sterben. Sie wählen nach dem Zufallsprinzip 66 Patienten aus.

  1. Wie gross ist die Wahrscheinlichkeit, dass 44 wieder gesund werden?
  2. Wie gross ist die Wahrscheinlichkeit, dass nicht mehr als 44 genesen?
F2

Früher hatte jeder Versuch, einen Telefonanruf zu tätigen, eine Erfolgswahrscheinlichkeit von 0.80.8. (Dies hing oft von der Wichtigkeit der Person ab, die den Anruf tätigte, oder von der Neugier der Telefonistin!) Berechnen Sie die Wahrscheinlichkeit, dass bei 1010 Versuchen mindestens 77 Erfolg haben.

F3

Ein Schütze (mit verbundenen Augen) stellt fest, dass er im Durchschnitt 44 von 55 Mal das Ziel trifft. Wenn er vier Schüsse abgibt, wie gross ist die Wahrscheinlichkeit, dass

  1. mehr als 22 Treffer?
  2. mindestens 33 Fehlschüsse?
F4

In Singapur beträgt die Wahrscheinlichkeit für die Geburt eines Jungen 0.52150.5215, für die eines Mädchens 0.47850.4785. Wie hoch ist der Anteil der Familien in Singapur mit genau 66 Kindern, die mindestens 33 Jungen haben?

F5

Du wirfst zweimal einen fairen Würfel und bildest die Summe. Wie gross ist die Wahrscheinlichkeit, dass die Summe 88 in mehr als der Hälfte der Fälle zustande kommt, wenn man dies 2020 Mal wiederholt?

F6

Eine gezinkte Münze (p(H)=0.45p(H)=0.45) wird 250250 mal geworfen. Bestimme die Wahrscheinlichkeit für die Beobachtung von

  1. 100100 Kopf.
  2. mindestens 100100 Kopf.
  3. zwischen 104104 und 120120 Kopf (einschliesslich Ränder)
  4. Die Wahrscheinlichkeit für die Beobachtung von mehr als kk Köpfen sollte kleiner als 20%20\% sein. Bestimmen Sie kk (Sie müssen dies durch Versuch und Irrtum mit Hilfe des Taschenrechners tun).
F7

Überbuchung. Ein Medizinstudiengang ist auf 120120 Studenten begrenzt. Die Erfahrung zeigt, dass 10%10\% der Studenten ihre Bewerbung zurückziehen. Wie viele Bewerbungen können berücksichtigt werden, so dass die Wahrscheinlichkeit, dass es zu viele Studenten gibt, kleiner als 5%5\% ist? Verwenden Sie auch hier Versuch und Irrtum, um die Lösung zu finden.

F8

Eine voreingenommene Münze mit p(H)=0.4p(H)=0.4 wird nn mal geworfen. Finden Sie nn so, dass die Wahrscheinlichkeit, mindestens einen Kopf zu sehen, mindestens 99.99%99.99\% beträgt.

F9

In einem Dorf haben 44%44\% für Trump und 56%56\% für Biden gestimmt. Sie führen eine Umfrage durch und wählen eine Zufallsstichprobe von Personen aus.

  1. Wenn die Stichprobengrösse 2020 Personen beträgt, wie hoch ist die Wahrscheinlichkeit, dass mehr als 55 Personen, aber weniger als 1515 Personen für Biden gestimmt haben?

  2. Sie möchten die Stichprobengrösse so wählen, dass die Stichprobe mindestens einen Biden-Wähler mit einer Wahrscheinlichkeit von 0.9990.999 oder mehr enthält. Was ist die minimale Stichprobengrösse?

  3. Die Stichprobengrösse soll so gross gewählt werden, dass die Stichprobe mehr als 55 Biden-Wähler mit einer Wahrscheinlichkeit von 0.9990.999 oder mehr enthält. Wie gross ist der minimale Stichprobenumfang?

Solution
A1

NN="Anzahl der genesenen Patienten" ist eine binomische RV mit den Parametern n=6n=6 und p=0,25p=0,25.

  1. p(N=4)=binompdf(6,0.25,4)=0.032p(N=4)=binompdf(6,0.25,4)=\underline{0.032}
  2. p(N4)=binomcdf(6,0.25,4)=0.995p(N\leq 4)=binomcdf(6,0.25,4)=\underline{0.995}.
A2

NN="Anzahl der Erfolge" ist eine binomialverteilte RV mit den Parametern n=10n=10 und p=0.8p=0.8. p(N7)=1binomcdf(10,0.8,6)=0.879p(N\geq 7)=1-binomcdf(10,0.8,6)=\underline{0.879}.

A3

NN="Anzahl der Treffer" ist eine binomische RV mit den Parametern n=4n=4 und p=4/5p=4/5.

  1. p(N>2)=1binomcdf(4,4/5,2)=0.8192p(N > 2)= 1-binomcdf(4,4/5,2)=\underline{0.8192}
  2. p(N1)=binomcdf(4,4/5,1)=0.0272p(N\leq 1)=binomcdf(4,4/5,1)=\underline{0.0272}.
A4

NN="Anzahl der Jungen" ist eine binomialverteilte RV mit den Parametern n=6n=6 und p=0,5215p=0,5215. p(N3)=1binomcdf(6,0.5215,2)=0.695p(N\geq 3)=1-binomcdf(6,0.5215,2)=\underline{0.695}.

A5

NN="Anzahl der Fälle, in denen die Summe 88 ist" ist eine binomische RV mit den Parametern n=20n=20 und p=5/36p=5/36 (Wahrscheinlichkeit für Summe 88). p(N>10)=1binomcdf(20,5/36,10)=1.8105p(N>10)=1-binomcdf(20,5/36,10)=\underline{1.8\cdot 10^{-5}}.

A6

NN="Anzahl der Köpfe" ist eine binomialverteilte RV mit den Parametern n=20n=20 und p=5/36p=5/36

  1. binompdf(250,0.45,100)=0.014binompdf(250,0.45,100)=\underline{0.014}

  2. 1binomcdf(250,0.45,99)=0.9511-binomcdf(250,0.45,99)=\underline{0.951}

  3. binomcdf(250,0.45,120)binomcdf(250,0.45,103)=0.719binomcdf(250,0.45,120)-binomcdf(250,0.45,103)=\underline{0.719}

  4. Finde kk mit

    p(N>k)=1binomcdf(250,0.45,k)<0.2p(N>k)=1-binomcdf(250,0.45,k)<0.2

    Durch Ausprobieren mit dem Taschenrechner erhalten wir k=119k=\underline{119}.

A7

Binomialexperiment mit Erfolg SS="nicht abgesagt" und Erfolgswahrscheinlichkeit p=0.9p=0.9. nn ist die Anzahl der Bewerber (die Anzahl der Wiederholungen des Bernoulli-Experiments "ein zufällig ausgewählter Bewerber sagt ab oder nicht"). NN="Anzahl der Fälle, in denen eine Bewerbung nicht abgesagt wird" (Anzahl der Erfolge) ist eine binomische RV mit den Parametern nn (unknown) und p=0.9p=0.9.

Finde nn so, dass

p(N>120)<0.05p(N > 120)<0.05

d.h.

1binomcdf(n,0.9,120)<0.051-binomcdf(n,0.9,120) <0.05

Versuch und Irrtum n=127\rightarrow n=\underline{127}.

A8

NN="Anzahl der Köpfe" ist eine binomische RV mit den Parametern nn und p=0.4p=0.4. Wir müssen nn so finden, dass

p(N1)0.9999p(N\geq 1)\geq 0.9999

Aufgrund von p(N1)=1p(N=0)p(N\geq 1)=1-p(N=0) müssen wir nn finden mit

p(N=0)0.0001p(N=0)\leq 0.0001

Finden wir zunächst nn mit

p(N=0)=0.0001p(N=0)=0.0001

Mit

p(N=0)=(n0)0.400.6n=0.6n\begin{array}{lll} p(N=0)&=&\left(\begin{array}{lll} n \\ 0\end{array}\right) \cdot 0.4^0\cdot 0.6^n\\ &=& 0.6^n\end{array}

wir müssen also nn finden mit

0.6n=0.00010.6^n = 0.0001

Wenn wir den Logarithmus auf beiden Seiten nehmen, erhalten wir

nln(0.6)=ln(0.0001)n\cdot \ln(0.6)=\ln(0.0001)

und somit n=ln(0.0001)ln(0.6)=18.03n=\frac{\ln(0.0001)}{\ln(0.6)}=18.03, also n=19n=\underline{19}.

A9

Es handelt sich um ein Binomialexperiment, bei dem der Erfolg SS="Ausgewählte Person hat für Biden gestimmt" ist, und die Erfolgswahrscheinlichkeit p(S)=0,56p(S)=0,56 beträgt. nn ist die Anzahl der Personen in der Stichprobe (die Anzahl der Wiederholungen des Bernoulli-Experiments, d.h. "wähle eine Person aus dem Dorf nach dem Zufallsprinzip aus, die für Biden stimmen wird oder nicht"). Sei NN die Anzahl der Erfolge, d.h. die Anzahl der Personen in der Stichprobe, die für Biden stimmen.

  1. n=20n=20,

    p(5<N<15)=p(N14)p(N5)=binomcdf(20,0.56,14)binomcdf(20,0.56,5)=0.929\begin{array}{lll} p(5<N<15)&=&p(N\leq 14)-p(N\leq 5)\\ &=&binomcdf(20,0.56,14)-binomcdf(20,0.56,5)\\ &=&\underline{0.929} \end{array}
  2. Finde nn mit

    p(N1)=0.999p(N\geq 1) =0.999

    Wir können für nn lösen:

    p(N1)=1p(N<1)=1p(N=0)=1(n0)0.5600.44n=10.44n\begin{array}{lll} p(N\geq 1)&=&1-p(N<1)\\ &=& 1-p(N=0)\\ &=& 1-\left(\begin{array}{cc}n\\0\end{array}\right) \cdot 0.56^0\cdot 0.44^n \\ &=& 1-0.44^n \end{array}

    Finde also nn mit

    10.44n=0.999+0.44n,0.9990.44n=0.001log(.)nlog(0.44)=log(0.001):log(0.44)n=log(0.001)log(0.44)=8.414\begin{array}{cll} 1-0.44^n &=&0.999\quad\vert +0.44^n, -0.999\\ 0.44^n &=&0.001 \quad\vert \log(.)\\ n\log(0.44)&=&\log(0.001)\quad\vert :\log(0.44)\\ n&=&\frac{\log(0.001)}{\log(0.44)}\\ &=& 8.414 \end{array}

    Es ist also n=9n=\underline{9}.

  3. Finden Sie nn mit

    p(N>5)>0.999p(N>5)>0.999

    oder

    1p(N5)>0.9991-p(N\leq 5) > 0.999

    d.h.

    1binomcdf(n,0.56,5)>0.9991-binomcdf(n,0.56,5) > 0.999

    Im Gegensatz zum vorherigen Problem (2) können wir nn nicht lösen, denn binomcdf(n,0.56,5)binomcdf(n,0.56,5) lässt sich nicht auf eine einfache Formel reduzieren, die wir lösen können. Also müssen wir nn durch Versuch und Irrtum finden (geben Sie einige Zahlen für nn in den Taschenrechner ein). Wir erhalten n=23n=\underline{23}.