Diskrete Zufallsvariablen

Example 1

Eine Schachtel enthält $10$ Kugeln der Farben rot, grün und blau. Ausserdem hat jede Kugel ein genaues Gewicht von $3.1\,kg$ , $3.2\,kg$ oder $4.1\,kg$ (siehe Abbildung). Wir wählen eine Kugel nach dem Zufallsprinzip aus.

Es gibt eine Reihe von Ereignissen, die uns interessieren könnten, z. B. welche Farbe wir wählen

R=\text{"Farbe ist rot"}, B=\text{"Farbe ist blau"}, G=\text{"Farbe ist gr\"un"}

oder das Gewicht

W_1=\text{"Gewicht ist 3.1"}, W_2=\text{"Gewicht ist 3.2"},W_3=\text{"Gewicht ist 4.1"},

Wir benötigen bereits eine ganze Reihe von Ereignisnamen, wie $R$ , $B$ , $W_1$ und so weiter. Mit mehr Farben oder Gewichtungen wird dieses Problem noch grösser. Zufallsvariablen ermöglichen uns eine systematische Bezeichnung von Ereignissen. Sie werden vor allem für die numerischen Aspekte von Ereignissen (in diesem Beispiel das Gewicht) verwendet.

Um präziser zu sein, eine Zufallsvariable ist einfach eine Funktion, die die Ergebnisse des Experiments (die gezogenen Kugeln) als Input hat, und eine Zahl als Output (das Gewichte). Nennen wir die Funktion $W$ (für "Weight"). Die Maschine $W$ , die diese Funktion darstellt, ist also für dieses Beispiel eine Waage.

Es ist wichtig anzumerken, dass diese Zuordnung von Kugeln zu Gewicht in keiner Weise zufällig ist und völlig ausserhalb des Kontextes der Wahrscheinlichkeitstheorie erfolgen könnte. Die Maschine nimmt einfach eine Kugel und spuckt ihr Gewicht aus. Was die Ausgabe zufällig macht, ist die Tatsache, dass die Eingabe zufällig ist. Jedes Mal, wenn wir das Experiment der zufälligen Auswahl einer Kugel durchführen und die Ausgabe der Maschine beobachten, sehen wir, dass sich diese Ausgabe zufällig ändert.

Wir führen nun eine wichtige Notation ein. Beachte, dass die Maschine verschiedene Ergebnisse auf das gleiche Gewicht abbildet (in der Abbildung oben gibt es zum Beispiel mehrere Kugeln mit dem Gewicht $3.1$ ). Wir bezeichnen die Menge aller Eingaben mit dem gleichen Ausgang $3.1$ mit

\{W=3.1\}

Dies ist also das Ereignis "Gewicht ist 3.1 kg". In ähnlicher Weise werden alle Inputs der Funktion mit dem gleichen Output $3.2$ mit

\{W=3.2\}

bezeichnet. Dies ist das Ereignis "Gewicht ist 3.2 kg", und das Ereignis "Gewicht ist 4.1 kg" ist somit

\{W=4.1\}

Die Verwendung dieser Notation hat zwei Vorteile. Erstens, wie schon erwähnt, brauchen wir nicht so viele Buchstaben für Ereignisse, und zweitens ist diese Art der Darstellung von Ereignissen sehr anschaulich - es ist sofort klar, dass das Ereignis $W=3.1$ alle Eingaben mit dem Gewicht $3.1 kg$ betrifft, was mit der Notation $W_1, W_2$ und $W_3$ nicht unbedingt klar ist.

Der Name Zufallsvariable ist etwas irreführend, denn $W$ ist einfach eine Funktion vom Stichprobenraum zu Zahlenwerten. Wir können $W$ aber auch als Variable (Platzhalter) für das Gewicht betrachten, das dann bei jeder Wiederholung des Experiments seinen Wert zufällig ändert.

Note 1

Zwei interessante Fakten zum Beispiel oben:

Die Ereignisse $\{W=3.1\}$ , $\{W=3.2\}$ , $\{W=4.1\}$ sind paarweise disjunkt (eigentlich bilden sie eine Partition von $S$ ). Dies gilt für jede Zufallsvariable und ist eine Tatsache, die wir später wieder verwenden werden.
Wir können auch das Ereignis $\{W=1.5\}$ definieren, aber da keine Kugel das Gewicht $1.5\, kg$ hat, wird dieses Ereignis leer sein.

Definition 1

Betrachten wir ein Zufallsexperiment mit Ergebnisraum $S=\{o_1, ..., o_n\}$ . Eine Funktion $X$ welche alle Ergebnisse in $S$ in eine Zahl abbildet, wird diskrete Zufallsvariable genannt. Es sei $\{x_1, ..., x_r\}$ die Menge alle dieser Zahlen. Wir führen die folgenden Notationen für gewisse Ereignisse ein:

Equation 1

\begin{array}{lll} \{X=x_k\} &=& \{\text{alle $o_i\in S$ mit $X(o_i)=x_k$}\}\\ \{X\leq x_k\} &=& \{\text{alle $o_i\in S$ mit $X(o_i)\leq x_k$}\}\\ \{X< x_k\} &=& \{\text{alle $o_i\in S$ mit $X(o_i)< x_k$}\}\\ \{X\geq x_k\} &=& \{\text{alle $o_i\in S$ mit $X(o_i)\geq x_k$}\}\\ \{X> x_k\} &=& \{\text{alle $o_i\in S$ mit $X(o_i)> x_k$}\}\\ \{X\in [a,b]\} &=& \{\text{alle $o_i\in S$ mit $X(o_i)\in [a,b]$}\}\\ \{a\leq X \leq b\} &=& \{\text{alle $o_i\in S$ mit $a\leq X(o_i)\leq b$}\}\\ \text{usw.} && \end{array}

Ereignisse definiert mit Zufallsvariablen.

In Zusammenhang mit Wahrscheinlichkeiten lassen wir die geschweifte Klammer weg:

p(X=x_k)=p(\{X=x_k\})

Theorem 1

Die Ereignisse $\{X=x_k\}$ und $\{X=x_l\}$ sind disjunkt für $k\neq l$ .
Die Ereignisse $\{X=x_1\}, \{X=x_2\}, ..., \{X=x_r\}$ bilden eine Partition von $S$ .
Das Ereignis $\{X=x\}$ ist leer, wenn $x$ nicht einer der Werte $x_1, ..., x_r$ ist.

Exercise 1

Das Zufallsexperiment ist das dreimalige Werfen einer Münze. Die Zufallsvariable ist $N$ ="Anzahl der beobachteten Köpfe".

Bestimme den Wert von $N(KKZ)=$ .
Was sind die möglichen Zahlenwerte, welche der Funktion $N$ produziert?
Gebe das Ereignis $\{N=2\}$ durch die verschiedenen Ergebnisse des Experiments wieder.
Zeige, dass die Ereignisse $\{N=1\}$ und $\{N=2\}$ disjunkt sind.
Zeige, dass die Ereignisse $\{N=0\}$ , ..., $\{N=3\}$ paarweise disjunkt sind, und eine Partition von $S$ bilden.
Drücke die Ereignisse $\{N<2.1\}, \{N>1\}, \{N\leq1\}, \{N\in [0.5,2.2]\}$ als Vereinigung der Ereignisse $\{N=0\}, \{N=1\}, \{N=2\}, \{N=3\}$ aus.

Solution

$N(KKZ)=2$ (zwei Köpfe)
$0, 1, 2,3$
$\{N=2\} = \{KKZ, KZK, ZKK\}$
Offensichtlich ist $\{N=1\} \cap \{N=2\}) =\{ \}$ , denn wenn es ein Ergebnis in der Schnittmenge gäbe, hätte dieses Ergebnis genau einen Kopf und auch genau zwei Köpfe, was keinen Sinn ergibt.
Wir müssen zeigen, dass $\{N=i\} \cap \{N=j\}) =\{ \}$ für $i\neq j$ . Das ist eindeutig so, denn ein Ergebnis in der Schnittmenge müsste genau $i$ Köpfe und auch genau $j$ Köpfe haben, was keinen Sinn ergibt.
Es ist
- $\{N<2.1\} = \{N=0\} \cup \{N=1\} \cup \{N=2\}$
- $\{N> 1\} = \{N=2 \cup \{N=3\}$
- $\{N \leq 1\} = \{N=0 \cup \{N=1\}$
- $\{N\in [0.5,2.2]\} = \{N=1\} \cup \{N=2\}$

Exercise 2

Ein Würfel wird zweimal geworfen. Betrachte die drei Zufallsvariablen:

$A$ ="Summe der beiden Zahlen"
$H$ ="die Zahl, die höher ist (wenn sie gleich sind, nimm die erste)"
$D$ ="der Betrag der Differenz der beiden Zahlen"

Der erste Wurf ergibt eine 5, der zweite eine 6. Bestimme den Wert der drei Zufallsvariablen für dieses Ergebnis.
Bestimme die möglichen Werte der Zufallsvariablen $A, H$ und $D$ .
Bestimme $p(3 \leq A \leq 5), p(H>4), p(D\leq 4)$ direkt und auch mit Hilfe der Vereinigung der Ereignisse $\{X=x_1\},...,\{X=x_r\}$ (wobei $X$ für $A$ , $H$ oder $D$ steht).

Hinweis: Der Betrag einer Zahl ist der positive Teil der Zahl. Zum Beispiel, der Betrag von $-3$ ist $3$ . Wir schreiben $\vert -3\vert =3$ .

Solution

$A(56)=11, H(56)=6, D(56)=1$
Wir haben
- Der Stichprobenraum ist
  $\begin{array}{l|ccccc} \text{+} & 1 & 2 & 3 & 4 & 5 & 6 \\\hline 1 & 2 & 3 & 4 & 5 & 6 & 7 \\ 2 & 3 & 4 & 5 & 6 & 7 & 8 \\ 3 & 4 & 5 & 6 & 7 & 8 & 9 \\ 4 & 5 & 6 & 7 & 8 & 9 & 10 \\ 5 & 6 & 7 & 8 & 9 & 10 & 11 \\ 6 & 7 & 7 & 9 & 10 & 11 & 12 \\ \end{array}$
  Mögliche Werte: $\{ 2,3,4,..., 11, 12\}$
- Der Stichprobenraum ist
  $\begin{array}{l|ccccc} \text{max} & 1 & 2 & 3 & 4 & 5 & 6 \\\hline 1 & 1 & 2 & 3 & 4 & 5 & 6 \\ 2 & 2 & 2 & 3 & 4 & 5 & 6 \\ 3 & 3 & 3 & 3 & 4 & 5 & 6 \\ 4 & 4 & 4 & 4 & 4 & 5 & 6 \\ 5 & 5 & 5 & 5 & 5 & 5 & 6 \\ 6 & 6 & 6 & 6 & 6 & 6 & 6 \\ \end{array}$
  Mögliche Werte: $\{ 1,2,3,4,5,6\}$
- Der Stichprobenraum ist
  $\begin{array}{l|ccccc} \vert \text{diff}\vert & 1 & 2 & 3 & 4 & 5 & 6 \\\hline 1 & 0 & 1 & 2 & 3 & 4 & 5 \\ 2 & 1 & 0 & 1 & 2 & 3 & 4 \\ 3 & 2 & 1 & 0 & 1 & 2 & 3 \\ 4 & 3 & 2 & 1 & 0 & 1 & 2 \\ 5 & 4 & 3 & 2 & 1 & 0 & 1 \\ 6 & 5 & 4 & 3 & 2 & 1 & 0 \\ \end{array}$
  Mögliche Werte: $\{ 0,1,2,3,4,5\}$
Direkt (durch Zählen der relevanten Ergebnisse): $p(3 \leq A \leq 5) = \frac{9}{36}=\frac{1}{4}$ , $p(H> 4) = \frac{20}{36}=\frac{5}{9}$ , $p(D\leq 4) = \frac{34}{36}=\frac{17}{18}$ . Mit Vereinigung:
$\begin{array}{lll} p(3 \leq A \leq 5) & = &p(A=3 \cup A=4 \cup A=5)\\ &=& p(A=3)+p(A=4)+p(A=5)\\ &=&\frac{2}{36}+\frac{3}{36}+\frac{4}{36}\\ &=& \frac{9}{36} = \frac{1}{4}\\ & & \\ p(H>4) & = &p(H=5 \cup H=6)\\ &=& p(H=5)+p(H=6)\\ &=&\frac{9}{36}+\frac{11}{36}\\ &=& \frac{20}{36} = \frac{5}{9}\\ & & \\ p(D\leq 4) & = &p(D=0 \cup D=2 \cup D=3 \cup D=4)\\ &=& p(D=0)+p(D=1)+p(D=2)+p(D=3)+p(D=4)\\ &=&\frac{6}{36}+\frac{10}{36}+\frac{8}{36}+\frac{6}{36}+\frac{4}{36}\\ &=& \frac{34}{36} = \frac{17}{18} \end{array}$