Balkendiagramme und W'keit

Um die Häufigkeitsverteilung von diskreten Daten zu finden, zähelen wir einfach, wie oft jeder Datenpunkt vorkommt. Zum Beispiel, für den Datensatz (10-mal würfeln)

2,5,4,6,6,3,1,1,2,42,5,4,6,6,3,1,1,2,4

ist die Häufigkeitsverteilung gegeben durch

xiHa¨ufrel Ha¨uf yi120.2220.2310.1420.2510.1620.2\begin{array}{l|c|c} x_i & \text{Häuf} & \text{rel Häuf } y_i \\\hline 1 & 2 & 0.2\\ 2 & 2 & 0.2\\ 3 & 1 & 0.1\\ 4 & 2 & 0.2\\ 5 & 1 & 0.1\\ 6 & 2 & 0.2\\ \end{array}

wobei xix_i für die Datenpunkte steht (x1=2,x2=5,x3=4,...x_1=2, x_2=5, x_3=4, ...) und "Häuf" für die Häufigkeit des Datenpunkts xix_i steht. Beachte, dass wir normalerweise die Häufigkeit als Prozentzahl oder relative Häufigkeit yiy_i ausdrücken (wobei 100%100\% die Anzahl aller Datenpunkte ist).

Stellen wir die relative Häufigkeiten in einem Koordinatensystem durch Punkte aus (siehe unten), so erhalten wir das sogenannte Balkendiagramm. Dabei werden die möglichen Daten im Datensatz entlang der xx-Achse aufgetragen, und die relativen Häufigkeiten entlang der yy-Achse.

Exercise 1

Aufgabe 1

Was für ein Häufigkeitsdiagramm ist zu erwarten, wenn wir einen Datensatz haben der durch 10000001\,000\,000-mal würfeln entstanden ist?

Show

Lösung

Die relativen Häufigkeiten werden dann die Wahrscheinlichkeit approximieren, eine bestimmte Augenzahl zu würfeln, welche für einen fairen Würfel 1/61/6 beträgt.

xirel Ha¨uf yi11/621/631/641/651/661/6\begin{array}{l|c|c} x_i & \text{rel Häuf } y_i\\\hline 1 & \approx 1/6\\ 2 & \approx 1/6\\ 3 & \approx 1/6\\ 4 & \approx 1/6\\ 5 & \approx 1/6\\ 6 & \approx 1/6\\ \end{array}

Die obige Aufgabe zeigt, dass die Punkte im Balkendiagramm die Wahrscheinlichkeiten p(xi)p(x_i) approximieren, daher die Wahrscheinlichkeit, dass der Punkt xix_i erscheint.

Exercise 2

Aufgabe 2

Eine Münze mit p(K)=0.25p(K)=0.25 wird 44-mal geworfen. Es sei NN="Anzahl Kopf". Der Versuch wird 10001000 mal durchgeführt. Bestimme die ungefähre Häufigkkeitsverteilung von NN, und skizziere das Balkendiagramm.

Show

Lösung

Dies ist eine Binomialverteilung, wobei n=4n=4 und die Erfolgswahrscheinlichkeit ist p(K)=0.25p(K)=0.25. Wir haben also

p(N=0)=(n0)0.2500.754=0.316p(N=1)=(n1)0.2510.753=0.422p(N=2)=(n2)0.2520.752=0.211p(N=3)=(n3)0.2530.751=0.047p(N=4)=(n4)0.2540.750=0.004\begin{array}{llll} p(N=0)= \left( \begin{array}{ll} n \\ 0 \end{array}\right) 0.25^0 0.75^4 & =0.316 \\ p(N=1)= \left( \begin{array}{ll} n \\ 1 \end{array}\right) 0.25^1 0.75^3 & = 0.422\\ p(N=2)= \left( \begin{array}{ll} n \\ 2 \end{array}\right) 0.25^2 0.75^2 &= 0.211 \\ p(N=3)= \left( \begin{array}{ll} n \\ 3 \end{array}\right) 0.25^3 0.75^1 &= 0.047 \\ p(N=4)= \left( \begin{array}{ll} n \\ 4 \end{array}\right) 0.25^4 0.75^0 &= 0.004 \\ \end{array}

Führen wir das Experiment 10001000 Mal durch, so nimmt NN zufällig die Werte 00,11,22,33, und 44 an. Die 00 wird in 31.6%31.6\% dieser Experimente angenommen (relative Häufigkeit 0.3160.316, absoluten Anzahl ist also 316316), die 11 wird in 42.2%42.2\% der Fälle angenommen (relative Häufigkeit 0.422, absolute Anzahl 422422), und so weiter. Wir haben also die folgende Häufigkeitstabelle:

xiHa¨ufrel Ha¨uf yi03160.31614220.42222110.2113470.047440.004\begin{array}{l|c|c} x_i & \text{Häuf} & \text{rel Häuf } y_i \\\hline 0 & 316 & 0.316\\ 1 & 422 & 0.422\\ 2 & 211 & 0.211\\ 3 & 47 & 0.047\\ 4 & 4 & 0.004\\ \end{array}

Dies sind nur ungefähre Werte, da die Wahrscheinlichkeiten nur dann die Prozente angeben, falls die Anzahl Experiment NN extrem hoch ist, also viel höher als 10001000.