Bedingte Wahrscheinlichkeit

Motivation

Die bedingte Wahrscheinlichkeit ist ein wichtiges Konzept, das bei Umfragen, oder allgemeiner bei Experimenten mit mehreren Ereignissen, ganz natürlich auftritt.

Wir verwenden das Beispiel einer Umfrage, um das Konzept zu erklären:

Example 1

Wir wählen zufällig Personen aus, die in New York leben, und befragen sie zu ihrem Wahlverhalten. Die Menge der möglichen Ergebnisse SS enthält also alle New Yorker. Definieren wir die beiden Ereignisse

  • EE="wählt Trump" und
  • FF="ist männlich"

Wählt man einen New Yorker nzufällig aus, so bezeichnet p(E)p(E) die Wahrscheinlichkeit für die Wahl eines Trump-Wählers, und p(F)p(F) ist die Wahrscheinlichkeit für die Wahl eines Mannes. Oder ausgedrückt als Prozentsatz: p(E)p(E) ist der Prozentsatz der New Yorker, die für Trump stimmen, und p(F)p(F) ist der Prozentsatz der männlichen New Yorker. Beachte, dass dies ein Laplace Experiment ist, da wir annehmen, dass die Selektion eines New Yorkers blind geschieht, also alle New Yorker die gleiche Wahrscheinlichkeit besitzen, gezogen zu werden. Es gilt also:

p(F)=FSp(E)=ES\begin{array}{ll} p(F)&=&\frac{|F|}{|S|}\\[1em] p(E)&=&\frac{|E|}{|S|} \end{array}

Wie es bei Umfragen oft der Fall ist, wollen wir das Wahlverhalten genauer verstehen und zum Beispiel den Prozentsatz der männlichen New Yorker ermitteln, die für Trump gestimmt haben. Mit anderen Worten, wir interessieren uns für die Wahrscheinlichkeit, einen Trump-Wähler auszuwählen, wobei wir jetzt nicht aus allen New Yorker, sondern nur aus allen männlichen New Yorker zufällig auswählen. Oder in anderen Worten: Wir wollen wissen, mit welcher Wahrscheinlichkeit ein Trump-Wähler ausgewählt wird, gegeben dass die ausgewählte Person ein männlicher New Yorker ist. Diese Wahrscheinlichkeit wird geschrieben als

p(EF)p(E\vert F)

und wird mit bedingte Wahrscheinlichkeit von EE gegeben FF bezeichnet. Der senkrechte Strich steht für "gegeben". Es muss also gelten, dass

p(EF)=EFF=p(EE)p(F)p(E\vert F) =\frac{|E\cap F|}{|F|}=\frac{p(E\cap E)}{p(F)}

Die Situation ist in einem Venn-Diagramm unten dargestellt. Der Prozentsatz p(E)p(E) ist relativ zum Stichprobenraum SS, während p(EF)p(E|F) der Prozentsatz relativ zu FF ist, daher FF wird als (eingeengter) Stichprobenraum aufgefasst, aus dem nun zufällig ausgewählt wird.

Beachte, dass es einen feinen Unterschied zwischen p(EF)p(E\vert F) und p(EF)p(E\cap F) gibt. Beide beschreiben dieselben Personen (EFE\cap F="männliche Trump-Wähler in New York"), aber p(EF)p(E\cap F) drückt die Anzahl dieser Personen als Prozentsatz von SS (alle New Yorker) aus, während p(EF)p(E\vert F) die gleichen Personen als Prozentsatz von FF (männliche New Yorker) ausdrückt.

Definition 1

Gegeben seien zwei Ereignisse ESE\subset S und FSF\subset S eines Wahrscheinlichkeitsexperiments mit Ereingisraum SS. Die bedingte Wahrscheinlichkeit von E gegeben F wird mit p(EF)p(E\mid F) notiert und ist definiert durch

Equation 1
p(EF)=p(EE)p(F)p(E\vert F) =\frac{p(E\cap E)}{p(F)}

Definition der bedingten Wahrscheinlichkeit.

wobei vorausgesetzt wird, dass p(F)>0p(F)>0 (was Sinn macht, da sonst FF ein unmögliches Ereignis wäre). p(EF)p(E\vert F) beschreibt die Wahrscheinlichkeit, dass

  • EE eintritt, falls FF schon eingetreten ist, oder etwas exakter, dass
  • EFE\cap F eintritt, falls der Ergebnisraum auf FF eingeschränkt wird.
Theorem 1

Es seien ESE\subset S und FSF\subset S Ereignisse eines beliebigen Zufallsexperiments mit Ergebnisraum SS und p(E)>0p(E)>0 und p(F)>0p(F)>0. Dann gilt

Equation 2
p(EF)=p(EF)p(F)=p(FE)p(E)p(E\cap F)=p(E|F)p(F)=p(F|E)p(E)

Eigenshaften der Bedingten Wahrscheinlichkeit.

Proof

Folgt direkt aus der Definition der bedingten Wahrscheinlichkeit:

p(EF)=p(EE)p(F)p(E\vert F) =\frac{p(E\cap E)}{p(F)}

Multipliziere beide Seiten mit p(F)p(F) und wir erhalten

p(EF)p(F)=p(EF)p(E\vert F)\cdot p(F) = p(E\cap F)

Und aus der Definition

p(FE)=p(FE)p(E)p(F\vert E) =\frac{p(F\cap E)}{p(E)}

erhalten wir durch Multiplikation von p(E)p(E) auf beiden Seiten, dass

p(FE)p(E)=p(FE)=p(EF)p(F\vert E)\cdot p(E)=p(F\cap E)=p(E\cap F)

Uns somit erhalten wir das Result.

Alle grundlegenden Eigenschaften von Wahrscheinlichkeiten gelten auch für die bedingte Wahrscheinlichkeit (ohne Beweis, sollte aber intuitive klar sein, da p(EF)p(E|F) eine Wahrscheinlichkeit für EE ist, einfach mit auf FF reduziertem Ergebnisraum):

Theorem 2

Es seien ES,FSE\subset S, F\subset S und GSG\subset S Ereignisse eines Zufallsexperiments mit Ergebnisraum SS, und p(G)>0p(G)>0. Es ist dann:

Equation 3
p({}F)=0p(FF)=1p(EFG)=p(EG)+p(FG)p(EFG)p(EFG)=p(EG)+p(FG)E und F disjunktp(EG)=1p(EG)\begin{array}{lll} p(\{ \}\vert F)&=&0\\ p(F\vert F)&=&1\\ p(E\cup F\vert G)&=&p(E\vert G)+p(F\vert G)-p(E\cap F\vert G)\\ p(E\cup F\vert G)&=&p(E\vert G)+p(F\vert G) \text{$E$ und $F$ disjunkt}\\ p(\overline{E}\vert G)&=&1-p(E\vert G) \end{array}

Bedingte Wahrscheinlichkeit besitzt ebenfalls eine Wahrscheinlichkeit.

Exercise 1
F1

In einer Stadt sind 30%30\% der Bevölkerung männlich. Von diesen sind 10%10\% blond. Eine Person wird nach dem Zufallsprinzip ausgewählt. Bestimme die Wahrscheinlichkeit, dass

  1. die Person blond ist, gegeben dass die Person männlich ist.
  2. die Person blond und männlich ist.
F2

Eine Lehrerin hat ihrer Klasse zwei Tests gegeben. 42%42\% der Schüler haben mindestens den ersten Test bestanden, und 25%25\% der Schüler haben beide Tests bestanden. Du wählst zufällig einen der Schüler aus, der den Test 1 bestanden hat. Wie gross ist die Wahrscheinlichkeit, dass der Schüler auch Test 2 bestanden hat?

F3

Von 10001000 Einwohnern einer Stadt besitzen 675675 ein Haus und davon 300300 ein Auto. Wie gross ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Person sowohl ein Haus als auch ein Auto besitzt?

F4

Zeige, dass p(FE)+p(FE)=1p(F|E)+p(F^\prime|E)=1.

F5

AA und BB sind zwei Ereignisse eines Zufallsexperiments mit p(A)=0.7p(A)=0.7, p(B)=0.6p(B)=0.6, und p(AB)=0.2p(A \cap B^\prime)=0.2. Bestimme p(AB)p(A^\prime \cap B), p(AB)p(A|B) und p(BA)p(B|A).

Solution
A1

B=B="ausgewählte Person ist blond", M=M="ausgewählte Person ist männlich". Der Stichprobenraum wird durch die Personen in der Stadt gebildet.

  1. p(BM)=0.1p(B|M)=\underline{0.1}
  2. p(BM)=p(BM)p(M)=0.10.3=0.03p(B\cap M)=p(B|M)\cdot p(M) = 0.1 \cdot 0.3 = \underline{0.03}.
A2

T1=T_1="ausgewählter Schüler besteht Test 1", T2=T_2="ausgewählter Schüler besteht Test 2", und der Stichprobenraum SS wird durch die Schüler der Klasse gebildet. Es ist p(T1T2)=0.25p(T_1\cap T_2)=0.25, und p(T1)=0.42p(T_1)=0.42. Mit p(T1T2)=p(T2T1)p(T1)p(T_1 \cap T_2)=p(T_2 | T_1)\cdot p(T_1) erhalten wir p(T2T1)=p(T1T2)p(T1)=0.250.42=0.6p(T_2 | T_1)=\frac{p(T_1 \cap T_2)}{ p(T_1)}=\frac{0.25}{0.42}=\underline{0.6}.

A3

H=H="Hausbesitzer", CC="Autobesitzer", p(H)=6751000=0.675p(H)=\frac{675}{1000}=0.675, p(CH)=300675=0.4p(C\vert H)=\frac{300}{675}=0.\overline{4}. Somit ist p(CH)=p(CH)p(H)=0,40,675=0,3p(C\cap H)=p(C\vert H)\cdot p(H)=0,\overline{4}\cdot 0,675=\underline{0,3}

Oder, weil 300300 Personen im Schnittpunkt HCH\cap C sind, können wir auch direkt berechnen, dass p(CH)=3001000=0.3p(C\cap H)=\frac{300}{1000}=\underline{0.3}.

A4

Wiederhole das Experiment viele Male und konzentriere dich auf die Experimente, bei denen EE aufgetreten ist. Davon ist der Prozentsatz der Experimente, bei denen FF (ebenfalls) auftrat, p(FE)p(F|E), und der Prozentsatz der Experimente, bei denen FF nicht auftrat, ist p(FE)p(F^\prime|E). Die beiden Prozentsätze summieren sich somit zu 100%100\%.

A5

Venn-Diagramm \rightarrow p(AB)=0.5p(AB)=0.1p(A\cap B)=0.5 \rightarrow p(A^\prime\cap B)=\underline{0.1}. p(AB)=p(AB)p(B)=0.50.6=5/6p(A|B)=\frac{p(A\cap B)}{p(B)}=\frac{0.5}{0.6}=\underline{5/6}, and p(BA)=p(BA)p(A)=0.50.7=5/7p(B|A)=\frac{p(B\cap A)}{p(A)}=\frac{0.5}{0.7}=\underline{5/7}.