Mittelwert und Standardabweichung und W'keit

Wir kennen bereits den Mittelwert und die Standarabweichung von einer Datenmenge.

Definition 1

Gegeben sind nn Datenpunkte x1,...,xnx_1, ..., x_n. The Mittelwert or Durchschnitt der Datenpunkte ist

m=x1+...+xnn\begin{array}{lll} m &=& \frac{x_1+...+x_n}{n} \end{array}

Die Standardabweichung der Datenpunkte (vom Mittelwert) ist

s=(x1m)2+...+(xnm)2n\begin{array}{lll} s = \sqrt{\frac{(x_1-m)^2+...+(x_n-m)^2}{n}} \end{array}

ss ist die typische Abweichung eines Datenpunkts vom Mittelwert mm. Je grösser ss, desto weiter sind die Daten gestreut.

Hier ist ein Beispiel:

Exercise 1

Aufgabe 1

Bestimme den Mittelwert und die Standardabweichung der folgenden Daten:

  1. 4,6,3.5,3,64, 6, 3.5, 3, 6
  2. 30,43,21.2,0-30, 43, 21.2, 0
Show

Lösungen

  1. m=4.5,s=1.26m=4.5, s=1.26
  2. m=8.55,s=726.5075=26.95m=8.55, s=\sqrt{726.5075}=26.95
Exercise 2

Aufgabe 2

Gegeben sind 10001000 Melonen, wobei 20%20\% das Gewicht 3.2kg3.2 kg besitzen, 50%50\% haben das Gewicht 3.5kg3.5 kg, und die verbleibenden 30%30\% haben ein Gewicht von 4.1kg4.1 kg. Bestimme das durchscnittliche Gewicht, und die typische Abweichung von diesem Durchschnitt.

Show

Lösung

200200 wiegen 3.2kg3.2 kg, 500500 wiegen 3.5kg3.5 kg, und 300300 Melonen wiegen 4.1kg4.1 kg. Wir haben also

m=2003.2+5003.5+3004.11000=2003.21000+5003.51000+3004.11000=0.23.2+0.53.5+0.34.1=3.62kgs=200(3.23.62)2+500(3.53.62)2+300(4.13.62)21000=200(3.23.62)21000+500(3.53.62)21000+300(4.13.62)21000=0.2(3.23.62)2+0.5(3.53.62)2+0.3(4.13.62)2=0.334kg\begin{array}{lll} m &=& \frac{200\cdot 3.2 + 500\cdot 3.5 + 300\cdot 4.1}{1000}\\ &=& \frac{200\cdot 3.2}{1000} + \frac{500\cdot 3.5}{1000} + \frac{300\cdot 4.1}{1000}\\ &=& 0.2\cdot 3.2 + 0.5\cdot 3.5 + 0.3\cdot 4.1\\ &=& \underline{3.62 kg}\\[1em] s &=& \sqrt{\frac{200\cdot (3.2-3.62)^2+500\cdot (3.5-3.62)^2+300\cdot (4.1-3.62)^2}{1000}}\\ &=& \sqrt{\frac{200\cdot (3.2-3.62)^2}{1000}+\frac{500\cdot (3.5-3.62)^2}{1000}+\frac{300\cdot (4.1-3.62)^2}{1000}}\\ &=& \sqrt{0.2\cdot (3.2-3.62)^2+ 0.5\cdot (3.5-3.62)^2 + 0.3\cdot (4.1-3.62)^2}\\ &=& \underline{0.334 kg} \end{array}

Beachte, dass wir die Anzahl Melonen nicht kennen müssen, um den Durchschnitt und die Standardabweichung des Gewichts zu berechnen. Prozentangaben genügen. Hier ist ein Rechnungsbeispiel.

Exercise 3

Beispiel

Nimm an, dass 35%35\% der Datenpunkte den Wert 7.17.1 besitzen, und die restlichen 65%65\% der Datenpunkte den Wert 99. Bestimme den Durchsnitt und die Standardabweichung der Punkte.

Wir im Beispiel oben haben wir

m=0.357.1+0.659=8.335m=0.35\cdot 7.1 + 0.65\cdot 9=8.335

und

s=0.35(7.18.335)2+0.65(98.335)2=0.90624s=\sqrt{0.35\cdot (7.1-8.335)^2 + 0.65\cdot (9-8.335)^2}=0.90624

Falls unklar ist, wieso das gilt, schaue die Lösung an.

Show

Erklärung

Nimm an, es gibt nn Datenpunkte (zum Beispiel n=1000n=1000). Also hat es 0.35n0.35 n Datenpunkte mit Wert 7.17.1 und 0.65n0.65 n Datenpunkte mit wert 99. Es gibt also 0.35n0.35n quadrierte Differenzen (7.1m)2(7.1-m)^2 und 0.65n0.65n quadrierte Differenzen (9m)2(9-m)^2. Also gilt

m=0.35n7.1+0.65n9n=0.35n7.1n+0.65n9n=0.357.1+0.659=8.335s=0.35n(7.18.335)2+0.65n(98.335)2n=0.35n(7.18.335)2n+0.65n(98.335)2n=0.35(7.18.335)2+0.65(98.335)2=0.906\begin{array}{lll} m &=& \frac{0.35n \cdot 7.1 + 0.65n\cdot 9}{n}\\ &=& \frac{0.35\cdot n\cdot 7.1}{n} + \frac{0.65\cdot n\cdot 9}{n}\\ &=& 0.35\cdot 7.1+0.65\cdot 9\\ &=& 8.335\\ s &=& \sqrt{\frac{0.35n \cdot (7.1-8.335)^2 + 0.65n\cdot (9-8.335)^2}{n}}\\ &=& \sqrt{\frac{0.35\cdot n\cdot (7.1-8.335)^2}{n} + \frac{0.65\cdot n\cdot (9-8.335)^2}{n}}\\ &=& \sqrt{0.35\cdot (7.1-8.335)^2 + 0.65\cdot (9-8.335)^2}\\ &=& 0.906 \end{array}

Da wahrscheinlichkeiten ebenfalls Prozente sind (von der Anzahl Repetetition des Experiments), können wir diesselbe Formel auch auf Wahrscheinlichkeiten anwenden.

Exercise 4

Beispiel

Nimm an, eine Box enthält Kugeln mit zwei verschiedenen Gewichten. Die einen wiegen 7.1kg7.1 kg, die anderen 9kg9 kg. Zur Abkürzung brauchen wir den Buchstaben WW für WW="das Gewicht der Kugel". Eine Kugel werde zufällig gezogen, wobei die Wahrscheinlichkeit, eine Kugel mit Gewicht 7.1kg7.1 kg zu ziehen gegeben ist durch p(W=7.1)=0.35p(W=7.1)=0.35, und die Wahrscheinlichkeit, dass eine Kugel mit Gewicht 9kg9 kg gezogen wird sei p(W=9)=0.65p(W=9)=0.65.

Falls das Experiment extrem of wiederholt wird, wie gross ist im Durchscnhitt das Gewicht der gezogenen Kugel? Und was ist die Standardabweichung von diesem Durchschnitt?

Show

Lösung

Falls das Experiment oftmals wiederholt wird, so erscheint die Kugel mit Gewicht 7.1kg7.1 kg in 35%35\% der Fälle, und die Kugel mit 9kg9 kg in 65%65\% der Fälle. So haben wir die Wahrscheinlichkeiten definiert. Wir haben also

m=0.357.1+0.659=8.335m = 0.35 \cdot 7.1 + 0.65\cdot 9 =\underline{8.335}

und

s=0.35(7.18.335)2+0.65(98.335)2=0.906s=\sqrt{0.35\cdot (7.1-8.335)^2 + 0.65\cdot (9-8.335)^2}=\underline{0.906}

Der Buchstabe WW wird übrigens Zufallsvariable gennant, da der Wert von WW zufällig zwischen den möglichen Werten 7.17.1 und 99 wechselt, je nach dem welche Kugel zufällig gezogen wird. Die Liste der Wahrscheinlichkeiten für die möglichen Werte von WW

p(W=7.1)=0.35,p(W=9)=0.65p(W=7.1)=0.35, p(W=9)=0.65

wird Wahrscheinlichkeitsverteilung von WW genannt. Wir können übrigens auch schreiben

m=p(W=7.1)7.1+p(W=9)9m=p(W=7.1)\cdot 7.1 + p(W=9)\cdot 9 s=p(W=7.1)(7.1m)2+p(W=9)(9m)2s=\sqrt{p(W=7.1)\cdot (7.1-m)^2 + p(W=9)\cdot (9-m)^2}