Beschreibende Statistik
Erkläre anhand der Daten die folgenden Begriffe:
-
Durchschnitt, Standardabweichung, Modus
-
Median, 1. Quartil, 3. Quartil, und Interquartilsabstand
-
Boxplot
-
Was ist eine diskrete Häufigkeitsverteilung? Was ist ein Balkendiagramm?
-
Was ist ein kontinuierlicher Datensatz? Was ist ein Hisotgramm?
Solution
-
Es ist:
- Der Durchschnitt is der mittlere oder typische Wert:
- Die Standardabweichung ist die typische Abweichung vom Durchschnitt:
- Der Modus ist der Datenpunkt, der am häufigsten vorkommt: . Beachte, dass der Modus aus mehreren Zahlen bestehen kann. Zum Beispiel für die Datenreihe is der Modus und .
-
Wir sortieren zuerst die Daten aufsteigend: .
- Der Median ist die mittlere Zahl: . Beachte, dass bei einer geraden Anzahl von Datenpunkten zwei mittlere Zahlen gibt. Man nimmt dann den Durchschnitt aus diesen beiden Zahlen. Zum Beispiel:
- der Median der Datenreihe ist der Durchschnitt der zwei Zahlen und , also .
- Oder, der Median der Datenreihe ist der Durchschnitt der zwei Zahlen und , also .
- Das 1. Quartil ist der Median der Datenreihe links vom Median . Also der Median der Zahlen , also
- Das 3. Quartil ist der Median der Datenreihe rechts vom Median . Also der Median der Zahlen , also
- Der Interquartilsabstand ist
- Der Median ist die mittlere Zahl: . Beachte, dass bei einer geraden Anzahl von Datenpunkten zwei mittlere Zahlen gibt. Man nimmt dann den Durchschnitt aus diesen beiden Zahlen. Zum Beispiel:
-
Der Boxplot ist unten eingezeichnet. Es ist eine graphische Representation des mittleren Werts der Daten (Median) und der Streuung der Daten (1. und 2. Quartil).

-
Ein diskreter Datensatz besteht aus Zählungen (etwa Anzahl Schüler und Schülerinnen in einer Klasse). Zum Beispiel, beim 10-maligen würfeln erhalten wir den diskreten Datensatz:
(hier zählen wir die Anzahl Punkte auf der Würfeloberfläche). Die diskrete Häufigkeitsverteilung ist eine Tabelle die besagt, wie oft jede dieser Zahlen von bis vorkommt:
Die grafische Darstellung der relativen Häufigkeiten mit Balkenhöhen wird Balkendiagramm genannt.
-
Ein kontinuierlicher Datensatz besteht aus (ungerundeten) Messungen (etwa wägen einer Melone). Zum Beispiel, messen wir die Körpergrössen von Schülern (in cm), erhalten wir den Datensatz
was wir mit einem kontinuierlichen Häufigkeitsverteilung zusammenfassen können. Dazu bilden wir Klassen, und zählen, wie viele Datenpunkte in jeder Klasse ist. Wichtig: wir berechnen auch die Dichte, daher die relative Häufigkeit geteilt durch die Klassenbreite:
Hier ist die Klassenbreite cm. Die grafische Darstellung der Dichten mit Balken wird Histogramm genannt. Die Höhe des Balkens ist die Dichte, die Breite ist . Somit is die Fläche eines Balkens die relative Häufigkeit.
Das Altersprofil in einer Personengruppe sieht wie folgt aus:
Bestimme den Mittelwert, Modus und Boxplot des Alters. Wie gross ist der Interquartilsabstand?
Solution
- Mittelwert:
- Modus:
- Median: Mittelwert von der 14. und 15. Zahl, also .
- Erstes Quartil: Datenreihe besteht aus den ersten 13 Zahlen (1-13), Median ist die 7. Zahl, also .
- Drittes Quartil: Datenreihe besteht aus den letzten 13 Zahlen (15-28), Median ist die 22. Zahl, also .
- Interquartilsabstand

Bestimme und skizziere das Histogramm der Daten in der Tabelle unten (Grösse von Schülern).
Solution
Die Balkenbreite ist , die Anzahl Schüler und Schülerinnen ist . Die Verteilung ist also
Das Histogramm ist unten gezeigt. Ignoriere das Rote.
