Bedingte Wahrscheinlichkeit

Motivation

Die bedingte Wahrscheinlichkeit ist ein wichtiges Konzept, das bei Umfragen, oder allgemeiner bei Experimenten mit mehreren Ereignissen, ganz natürlich auftritt.

Wir verwenden das Beispiel einer Umfrage, um das Konzept zu erklären:

Example 1

Wir wählen zufällig Personen aus, die in New York leben, und befragen sie zu ihrem Wahlverhalten. Die Menge der möglichen Ergebnisse $S$ enthält also alle New Yorker. Definieren wir die beiden Ereignisse

$E$ ="wählt Trump" und
$F$ ="ist männlich"

Wählt man einen New Yorker nzufällig aus, so bezeichnet $p(E)$ die Wahrscheinlichkeit für die Wahl eines Trump-Wählers, und $p(F)$ ist die Wahrscheinlichkeit für die Wahl eines Mannes. Oder ausgedrückt als Prozentsatz: $p(E)$ ist der Prozentsatz der New Yorker, die für Trump stimmen, und $p(F)$ ist der Prozentsatz der männlichen New Yorker. Beachte, dass dies ein Laplace Experiment ist, da wir annehmen, dass die Selektion eines New Yorkers blind geschieht, also alle New Yorker die gleiche Wahrscheinlichkeit besitzen, gezogen zu werden. Es gilt also:

\begin{array}{ll} p(F)&=&\frac{|F|}{|S|}\\[1em] p(E)&=&\frac{|E|}{|S|} \end{array}

Wie es bei Umfragen oft der Fall ist, wollen wir das Wahlverhalten genauer verstehen und zum Beispiel den Prozentsatz der männlichen New Yorker ermitteln, die für Trump gestimmt haben. Mit anderen Worten, wir interessieren uns für die Wahrscheinlichkeit, einen Trump-Wähler auszuwählen, wobei wir jetzt nicht aus allen New Yorker, sondern nur aus allen männlichen New Yorker zufällig auswählen. Oder in anderen Worten: Wir wollen wissen, mit welcher Wahrscheinlichkeit ein Trump-Wähler ausgewählt wird, gegeben dass die ausgewählte Person ein männlicher New Yorker ist. Diese Wahrscheinlichkeit wird geschrieben als

p(E\vert F)

und wird mit bedingte Wahrscheinlichkeit von $E$ gegeben $F$ bezeichnet. Der senkrechte Strich steht für "gegeben". Es muss also gelten, dass

p(E\vert F) =\frac{|E\cap F|}{|F|}=\frac{p(E\cap E)}{p(F)}

Die Situation ist in einem Venn-Diagramm unten dargestellt. Der Prozentsatz $p(E)$ ist relativ zum Stichprobenraum $S$ , während $p(E|F)$ der Prozentsatz relativ zu $F$ ist, daher $F$ wird als (eingeengter) Stichprobenraum aufgefasst, aus dem nun zufällig ausgewählt wird.

Beachte, dass es einen feinen Unterschied zwischen $p(E\vert F)$ und $p(E\cap F)$ gibt. Beide beschreiben dieselben Personen ( $E\cap F$ ="männliche Trump-Wähler in New York"), aber $p(E\cap F)$ drückt die Anzahl dieser Personen als Prozentsatz von $S$ (alle New Yorker) aus, während $p(E\vert F)$ die gleichen Personen als Prozentsatz von $F$ (männliche New Yorker) ausdrückt.

Definition 1

Gegeben seien zwei Ereignisse $E\subset S$ und $F\subset S$ eines Wahrscheinlichkeitsexperiments mit Ereingisraum $S$ . Die bedingte Wahrscheinlichkeit von E gegeben F wird mit $p(E\mid F)$ notiert und ist definiert durch

Equation 1

p(E\vert F) =\frac{p(E\cap E)}{p(F)}

Definition der bedingten Wahrscheinlichkeit.

wobei vorausgesetzt wird, dass $p(F)>0$ (was Sinn macht, da sonst $F$ ein unmögliches Ereignis wäre). $p(E\vert F)$ beschreibt die Wahrscheinlichkeit, dass

$E$ eintritt, falls $F$ schon eingetreten ist, oder etwas exakter, dass
$E\cap F$ eintritt, falls der Ergebnisraum auf $F$ eingeschränkt wird.

Theorem 1

Es seien $E\subset S$ und $F\subset S$ Ereignisse eines beliebigen Zufallsexperiments mit Ergebnisraum $S$ und $p(E)>0$ und $p(F)>0$ . Dann gilt

Equation 2

p(E\cap F)=p(E|F)p(F)=p(F|E)p(E)

Eigenshaften der Bedingten Wahrscheinlichkeit.

Proof

Folgt direkt aus der Definition der bedingten Wahrscheinlichkeit:

p(E\vert F) =\frac{p(E\cap E)}{p(F)}

Multipliziere beide Seiten mit $p(F)$ und wir erhalten

p(E\vert F)\cdot p(F) = p(E\cap F)

Und aus der Definition

p(F\vert E) =\frac{p(F\cap E)}{p(E)}

erhalten wir durch Multiplikation von $p(E)$ auf beiden Seiten, dass

p(F\vert E)\cdot p(E)=p(F\cap E)=p(E\cap F)

Uns somit erhalten wir das Result.

Alle grundlegenden Eigenschaften von Wahrscheinlichkeiten gelten auch für die bedingte Wahrscheinlichkeit (ohne Beweis, sollte aber intuitive klar sein, da $p(E|F)$ eine Wahrscheinlichkeit für $E$ ist, einfach mit auf $F$ reduziertem Ergebnisraum):

Theorem 2

Es seien $E\subset S, F\subset S$ und $G\subset S$ Ereignisse eines Zufallsexperiments mit Ergebnisraum $S$ , und $p(G)>0$ . Es ist dann:

Equation 3

\begin{array}{lll} p(\{ \}\vert F)&=&0\\ p(F\vert F)&=&1\\ p(E\cup F\vert G)&=&p(E\vert G)+p(F\vert G)-p(E\cap F\vert G)\\ p(E\cup F\vert G)&=&p(E\vert G)+p(F\vert G) \text{$E$ und $F$ disjunkt}\\ p(\overline{E}\vert G)&=&1-p(E\vert G) \end{array}

Bedingte Wahrscheinlichkeit besitzt ebenfalls eine Wahrscheinlichkeit.

Exercise 1

F1

In einer Stadt sind $30\%$ der Bevölkerung männlich. Von diesen sind $10\%$ blond. Eine Person wird nach dem Zufallsprinzip ausgewählt. Bestimme die Wahrscheinlichkeit, dass

die Person blond ist, gegeben dass die Person männlich ist.
die Person blond und männlich ist.

F2

Eine Lehrerin hat ihrer Klasse zwei Tests gegeben. $42\%$ der Schüler haben mindestens den ersten Test bestanden, und $25\%$ der Schüler haben beide Tests bestanden. Du wählst zufällig einen der Schüler aus, der den Test 1 bestanden hat. Wie gross ist die Wahrscheinlichkeit, dass der Schüler auch Test 2 bestanden hat?

F3

Von $1000$ Einwohnern einer Stadt besitzen $675$ ein Haus und davon $300$ ein Auto. Wie gross ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Person sowohl ein Haus als auch ein Auto besitzt?

F4

Zeige, dass $p(F|E)+p(F^\prime|E)=1$ .

F5

$A$ und $B$ sind zwei Ereignisse eines Zufallsexperiments mit $p(A)=0.7$ , $p(B)=0.6$ , und $p(A \cap B^\prime)=0.2$ . Bestimme $p(A^\prime \cap B)$ , $p(A|B)$ und $p(B|A)$ .

Solution

A1

$B=$ "ausgewählte Person ist blond", $M=$ "ausgewählte Person ist männlich". Der Stichprobenraum wird durch die Personen in der Stadt gebildet.

$p(B|M)=\underline{0.1}$
$p(B\cap M)=p(B|M)\cdot p(M) = 0.1 \cdot 0.3 = \underline{0.03}$ .

A2

$T_1=$ "ausgewählter Schüler besteht Test 1", $T_2=$ "ausgewählter Schüler besteht Test 2", und der Stichprobenraum $S$ wird durch die Schüler der Klasse gebildet. Es ist $p(T_1\cap T_2)=0.25$ , und $p(T_1)=0.42$ . Mit $p(T_1 \cap T_2)=p(T_2 | T_1)\cdot p(T_1)$ erhalten wir $p(T_2 | T_1)=\frac{p(T_1 \cap T_2)}{ p(T_1)}=\frac{0.25}{0.42}=\underline{0.6}$ .

A3

$H=$ "Hausbesitzer", $C$ ="Autobesitzer", $p(H)=\frac{675}{1000}=0.675$ , $p(C\vert H)=\frac{300}{675}=0.\overline{4}$ . Somit ist $p(C\cap H)=p(C\vert H)\cdot p(H)=0,\overline{4}\cdot 0,675=\underline{0,3}$

Oder, weil $300$ Personen im Schnittpunkt $H\cap C$ sind, können wir auch direkt berechnen, dass $p(C\cap H)=\frac{300}{1000}=\underline{0.3}$ .

A4

Wiederhole das Experiment viele Male und konzentriere dich auf die Experimente, bei denen $E$ aufgetreten ist. Davon ist der Prozentsatz der Experimente, bei denen $F$ (ebenfalls) auftrat, $p(F|E)$ , und der Prozentsatz der Experimente, bei denen $F$ nicht auftrat, ist $p(F^\prime|E)$ . Die beiden Prozentsätze summieren sich somit zu $100\%$ .

A5

Venn-Diagramm $\rightarrow$ $p(A\cap B)=0.5 \rightarrow p(A^\prime\cap B)=\underline{0.1}$ . $p(A|B)=\frac{p(A\cap B)}{p(B)}=\frac{0.5}{0.6}=\underline{5/6}$ , and $p(B|A)=\frac{p(B\cap A)}{p(A)}=\frac{0.5}{0.7}=\underline{5/7}$ .