Diskrete Zufallsvariablen

Wir führen das Konzept der Zufallsvariablen (kurz ZV) anhand eines Beispiels ein.

Example 1

Eine Schachtel enthält 1010 Kugeln der Farben rot, grün und blau. Ausserdem hat jede Kugel ein genaues Gewicht von 3.1kg3.1\,kg, 3.2kg3.2\,kg oder 4.1kg4.1\,kg (siehe Abbildung). Wir wählen eine Kugel nach dem Zufallsprinzip aus.

Es gibt eine Reihe von Ereignissen, die uns interessieren könnten, z. B. welche Farbe wir wählen

R="Farbe ist rot",B="Farbe ist blau",G="Farbe ist gru¨n"R=\text{"Farbe ist rot"}, B=\text{"Farbe ist blau"}, G=\text{"Farbe ist gr\"un"}

oder das Gewicht

W1="Gewicht ist 3.1",W2="Gewicht ist 3.2",W3="Gewicht ist 4.1",W_1=\text{"Gewicht ist 3.1"}, W_2=\text{"Gewicht ist 3.2"},W_3=\text{"Gewicht ist 4.1"},

Wir benötigen bereits eine ganze Reihe von Ereignisnamen, wie RR, BB, W1W_1 und so weiter. Mit mehr Farben oder Gewichtungen wird dieses Problem noch grösser. Zufallsvariablen ermöglichen uns eine systematische Bezeichnung von Ereignissen. Sie werden vor allem für die numerischen Aspekte von Ereignissen (in diesem Beispiel das Gewicht) verwendet.

Um präziser zu sein, eine Zufallsvariable ist einfach eine Funktion, die die Ergebnisse des Experiments (die gezogenen Kugeln) als Input hat, und eine Zahl als Output (das Gewichte). Nennen wir die Funktion WW (für "Weight"). Die Maschine WW, die diese Funktion darstellt, ist also für dieses Beispiel eine Waage.

Es ist wichtig anzumerken, dass diese Zuordnung von Kugeln zu Gewicht in keiner Weise zufällig ist und völlig ausserhalb des Kontextes der Wahrscheinlichkeitstheorie erfolgen könnte. Die Maschine nimmt einfach eine Kugel und spuckt ihr Gewicht aus. Was die Ausgabe zufällig macht, ist die Tatsache, dass die Eingabe zufällig ist. Jedes Mal, wenn wir das Experiment der zufälligen Auswahl einer Kugel durchführen und die Ausgabe der Maschine beobachten, sehen wir, dass sich diese Ausgabe zufällig ändert.

Wir führen nun eine wichtige Notation ein. Beachte, dass die Maschine verschiedene Ergebnisse auf das gleiche Gewicht abbildet (in der Abbildung oben gibt es zum Beispiel mehrere Kugeln mit dem Gewicht 3.13.1). Wir bezeichnen die Menge aller Eingaben mit dem gleichen Ausgang 3.13.1 mit

{W=3.1}\{W=3.1\}

Dies ist also das Ereignis "Gewicht ist 3.1 kg". In ähnlicher Weise werden alle Inputs der Funktion mit dem gleichen Output 3.23.2 mit

{W=3.2}\{W=3.2\}

bezeichnet. Dies ist das Ereignis "Gewicht ist 3.2 kg", und das Ereignis "Gewicht ist 4.1 kg" ist somit

{W=4.1}\{W=4.1\}

Die Verwendung dieser Notation hat zwei Vorteile. Erstens, wie schon erwähnt, brauchen wir nicht so viele Buchstaben für Ereignisse, und zweitens ist diese Art der Darstellung von Ereignissen sehr anschaulich - es ist sofort klar, dass das Ereignis W=3.1W=3.1 alle Eingaben mit dem Gewicht 3.1kg3.1 kg betrifft, was mit der Notation W1,W2W_1, W_2 und W3W_3 nicht unbedingt klar ist.

Der Name Zufallsvariable ist etwas irreführend, denn WW ist einfach eine Funktion vom Stichprobenraum zu Zahlenwerten. Wir können WW aber auch als Variable (Platzhalter) für das Gewicht betrachten, das dann bei jeder Wiederholung des Experiments seinen Wert zufällig ändert.

Note 1

Zwei interessante Fakten zum Beispiel oben:

  • Die Ereignisse {W=3.1}\{W=3.1\}, {W=3.2}\{W=3.2\}, {W=4.1}\{W=4.1\} sind paarweise disjunkt (eigentlich bilden sie eine Partition von SS). Dies gilt für jede Zufallsvariable und ist eine Tatsache, die wir später wieder verwenden werden.
  • Wir können auch das Ereignis {W=1.5}\{W=1.5\} definieren, aber da keine Kugel das Gewicht 1.5kg1.5\, kg hat, wird dieses Ereignis leer sein.

Wir definieren nun die Zufallsvariable für ein allgemeines Zufallsexperiment:

Definition 1

Betrachten wir ein Zufallsexperiment mit Ergebnisraum S={o1,...,on}S=\{o_1, ..., o_n\}. Eine Funktion XX welche alle Ergebnisse in SS in eine Zahl abbildet, wird diskrete Zufallsvariable genannt. Es sei {x1,...,xr}\{x_1, ..., x_r\} die Menge alle dieser Zahlen. Wir führen die folgenden Notationen für gewisse Ereignisse ein:

Equation 1
{X=xk}={alle oiS mit X(oi)=xk}{Xxk}={alle oiS mit X(oi)xk}{X<xk}={alle oiS mit X(oi)<xk}{Xxk}={alle oiS mit X(oi)xk}{X>xk}={alle oiS mit X(oi)>xk}{X[a,b]}={alle oiS mit X(oi)[a,b]}{aXb}={alle oiS mit aX(oi)b}usw.\begin{array}{lll} \{X=x_k\} &=& \{\text{alle $o_i\in S$ mit $X(o_i)=x_k$}\}\\ \{X\leq x_k\} &=& \{\text{alle $o_i\in S$ mit $X(o_i)\leq x_k$}\}\\ \{X< x_k\} &=& \{\text{alle $o_i\in S$ mit $X(o_i)< x_k$}\}\\ \{X\geq x_k\} &=& \{\text{alle $o_i\in S$ mit $X(o_i)\geq x_k$}\}\\ \{X> x_k\} &=& \{\text{alle $o_i\in S$ mit $X(o_i)> x_k$}\}\\ \{X\in [a,b]\} &=& \{\text{alle $o_i\in S$ mit $X(o_i)\in [a,b]$}\}\\ \{a\leq X \leq b\} &=& \{\text{alle $o_i\in S$ mit $a\leq X(o_i)\leq b$}\}\\ \text{usw.} && \end{array}

Ereignisse definiert mit Zufallsvariablen.

In Zusammenhang mit Wahrscheinlichkeiten lassen wir die geschweifte Klammer weg:

p(X=xk)=p({X=xk})p(X=x_k)=p(\{X=x_k\})

Die folgenden Aussagen sollten klar sein:

Theorem 1
  1. Die Ereignisse {X=xk}\{X=x_k\} und {X=xl}\{X=x_l\} sind disjunkt für klk\neq l.
  2. Die Ereignisse {X=x1},{X=x2},...,{X=xr}\{X=x_1\}, \{X=x_2\}, ..., \{X=x_r\} bilden eine Partition von SS.
  3. Das Ereignis {X=x}\{X=x\} ist leer, wenn xx nicht einer der Werte x1,...,xrx_1, ..., x_r ist.
Exercise 1

Das Zufallsexperiment ist das dreimalige Werfen einer Münze. Die Zufallsvariable ist NN="Anzahl der beobachteten Köpfe".

  1. Bestimme den Wert von N(KKZ)=N(KKZ)=.

  2. Was sind die möglichen Zahlenwerte, welche der Funktion NN produziert?

  3. Gebe das Ereignis {N=2}\{N=2\} durch die verschiedenen Ergebnisse des Experiments wieder.

  4. Zeige, dass die Ereignisse {N=1}\{N=1\} und {N=2}\{N=2\} disjunkt sind.

  5. Zeige, dass die Ereignisse {N=0}\{N=0\}, ..., {N=3}\{N=3\} paarweise disjunkt sind, und eine Partition von SS bilden.

  6. Drücke die Ereignisse {N<2.1},{N>1},{N1},{N[0.5,2.2]}\{N<2.1\}, \{N>1\}, \{N\leq1\}, \{N\in [0.5,2.2]\} als Vereinigung der Ereignisse {N=0},{N=1},{N=2},{N=3}\{N=0\}, \{N=1\}, \{N=2\}, \{N=3\} aus.

Solution
  1. N(KKZ)=2N(KKZ)=2 (zwei Köpfe)

  2. 0,1,2,30, 1, 2,3

  3. {N=2}={KKZ,KZK,ZKK}\{N=2\} = \{KKZ, KZK, ZKK\}

  4. Offensichtlich ist {N=1}{N=2})={}\{N=1\} \cap \{N=2\}) =\{ \}, denn wenn es ein Ergebnis in der Schnittmenge gäbe, hätte dieses Ergebnis genau einen Kopf und auch genau zwei Köpfe, was keinen Sinn ergibt.

  5. Wir müssen zeigen, dass {N=i}{N=j})={}\{N=i\} \cap \{N=j\}) =\{ \} für iji\neq j. Das ist eindeutig so, denn ein Ergebnis in der Schnittmenge müsste genau ii Köpfe und auch genau jj Köpfe haben, was keinen Sinn ergibt.

  6. Es ist

    • {N<2.1}={N=0}{N=1}{N=2}\{N<2.1\} = \{N=0\} \cup \{N=1\} \cup \{N=2\}
    • {N>1}={N=2{N=3}\{N> 1\} = \{N=2 \cup \{N=3\}
    • {N1}={N=0{N=1}\{N \leq 1\} = \{N=0 \cup \{N=1\}
    • {N[0.5,2.2]}={N=1}{N=2}\{N\in [0.5,2.2]\} = \{N=1\} \cup \{N=2\}
Exercise 2

Ein Würfel wird zweimal geworfen. Betrachte die drei Zufallsvariablen:

  • AA="Summe der beiden Zahlen"
  • HH="die Zahl, die höher ist (wenn sie gleich sind, nimm die erste)"
  • DD="der Betrag der Differenz der beiden Zahlen"
  1. Der erste Wurf ergibt eine 5, der zweite eine 6. Bestimme den Wert der drei Zufallsvariablen für dieses Ergebnis.
  2. Bestimme die möglichen Werte der Zufallsvariablen A,HA, H und DD.
  3. Bestimme p(3A5),p(H>4),p(D4)p(3 \leq A \leq 5), p(H>4), p(D\leq 4) direkt und auch mit Hilfe der Vereinigung der Ereignisse {X=x1},...,{X=xr}\{X=x_1\},...,\{X=x_r\} (wobei XX für AA, HH oder DD steht).

Hinweis: Der Betrag einer Zahl ist der positive Teil der Zahl. Zum Beispiel, der Betrag von 3-3 ist 33. Wir schreiben 3=3\vert -3\vert =3.

Solution
  1. A(56)=11,H(56)=6,D(56)=1A(56)=11, H(56)=6, D(56)=1

  2. Wir haben

    • Der Stichprobenraum ist

      +123456123456723456783456789456789105678910116779101112\begin{array}{l|ccccc} \text{+} & 1 & 2 & 3 & 4 & 5 & 6 \\\hline 1 & 2 & 3 & 4 & 5 & 6 & 7 \\ 2 & 3 & 4 & 5 & 6 & 7 & 8 \\ 3 & 4 & 5 & 6 & 7 & 8 & 9 \\ 4 & 5 & 6 & 7 & 8 & 9 & 10 \\ 5 & 6 & 7 & 8 & 9 & 10 & 11 \\ 6 & 7 & 7 & 9 & 10 & 11 & 12 \\ \end{array}

      Mögliche Werte: {2,3,4,...,11,12}\{ 2,3,4,..., 11, 12\}

    • Der Stichprobenraum ist

      max123456112345622234563333456444445655555566666666\begin{array}{l|ccccc} \text{max} & 1 & 2 & 3 & 4 & 5 & 6 \\\hline 1 & 1 & 2 & 3 & 4 & 5 & 6 \\ 2 & 2 & 2 & 3 & 4 & 5 & 6 \\ 3 & 3 & 3 & 3 & 4 & 5 & 6 \\ 4 & 4 & 4 & 4 & 4 & 5 & 6 \\ 5 & 5 & 5 & 5 & 5 & 5 & 6 \\ 6 & 6 & 6 & 6 & 6 & 6 & 6 \\ \end{array}

      Mögliche Werte: {1,2,3,4,5,6}\{ 1,2,3,4,5,6\}

    • Der Stichprobenraum ist

      diff123456101234521012343210123432101254321016543210\begin{array}{l|ccccc} \vert \text{diff}\vert & 1 & 2 & 3 & 4 & 5 & 6 \\\hline 1 & 0 & 1 & 2 & 3 & 4 & 5 \\ 2 & 1 & 0 & 1 & 2 & 3 & 4 \\ 3 & 2 & 1 & 0 & 1 & 2 & 3 \\ 4 & 3 & 2 & 1 & 0 & 1 & 2 \\ 5 & 4 & 3 & 2 & 1 & 0 & 1 \\ 6 & 5 & 4 & 3 & 2 & 1 & 0 \\ \end{array}

      Mögliche Werte: {0,1,2,3,4,5}\{ 0,1,2,3,4,5\}

  3. Direkt (durch Zählen der relevanten Ergebnisse): p(3A5)=936=14p(3 \leq A \leq 5) = \frac{9}{36}=\frac{1}{4}, p(H>4)=2036=59p(H> 4) = \frac{20}{36}=\frac{5}{9}, p(D4)=3436=1718p(D\leq 4) = \frac{34}{36}=\frac{17}{18}. Mit Vereinigung:

    p(3A5)=p(A=3A=4A=5)=p(A=3)+p(A=4)+p(A=5)=236+336+436=936=14p(H>4)=p(H=5H=6)=p(H=5)+p(H=6)=936+1136=2036=59p(D4)=p(D=0D=2D=3D=4)=p(D=0)+p(D=1)+p(D=2)+p(D=3)+p(D=4)=636+1036+836+636+436=3436=1718\begin{array}{lll} p(3 \leq A \leq 5) & = &p(A=3 \cup A=4 \cup A=5)\\ &=& p(A=3)+p(A=4)+p(A=5)\\ &=&\frac{2}{36}+\frac{3}{36}+\frac{4}{36}\\ &=& \frac{9}{36} = \frac{1}{4}\\ & & \\ p(H>4) & = &p(H=5 \cup H=6)\\ &=& p(H=5)+p(H=6)\\ &=&\frac{9}{36}+\frac{11}{36}\\ &=& \frac{20}{36} = \frac{5}{9}\\ & & \\ p(D\leq 4) & = &p(D=0 \cup D=2 \cup D=3 \cup D=4)\\ &=& p(D=0)+p(D=1)+p(D=2)+p(D=3)+p(D=4)\\ &=&\frac{6}{36}+\frac{10}{36}+\frac{8}{36}+\frac{6}{36}+\frac{4}{36}\\ &=& \frac{34}{36} = \frac{17}{18} \end{array}