Histogramme
Bei stetigen Merkmalen (oder bei einer grossen Anzahl von möglichen Merkmalsausprägungen) ist die Berechung der absoluten und relativen Häufigkeiten einer Merkmalsausprägung kaum sinnvoll. Nehmen wir zum Beispiel die Körpergrösse eines Schülers oder einer Schülerin an der FMS als Merkmal. Mögliche Merkmalsausprägungen, also die möglichen Körpergrössen, sind alle Zahlen zwischen, sagen wir, und . Also ist dabei, wie auch , usw.
Nun werden aber nur ganz wenige Personen and der FMS genau die gleiche Körpergrösse von besitzen. Die absolute Häufigkeit ist vielleicht oder . Und viele andere Körpergrössen, wie , oder werden möglicherweise gar nie vorkommen. Bei etwa Personen an der FMS ist die relative Häufigkeit dann für alle Grössen entweder oder sehr klein ( oder ).
Es macht daher mehr Sinn, die Merkmalsausbildungen in Klassen zu gruppieren, und die absolute und relative Häufigkeiten für diese Klassen zu bestimmen. Eine mögliche Klassenbildung für das Beispiel oben könnte zum Beispiel sein:
Wir bestimmen dann die absolute und relative Häufigkeiten jeder Klasse. Wir bestimmen dann also nicht, wie viele Personen genau die Körpergrösse besitzen, sondern wie viele Personen eine Körpergrösse zwischen und besitzen, was wieder mehr Sinn ergibt.
Die Breite der Klasse, im Beispiel , wird Klassenbreite genannt. Im Prinzip müssen nicht alle Klassen die gleiche Breite haben, wird aber typischerweise so gemacht. Die Grösse der Klassenbreite spielt eine grosse Rolle. Wird sie zu klein gewählt (etwa ), sind wir wieder beim Problem von ganz oben
Warning
Beachte, dass Klassen zum Teil die gleichen Ränder haben. In welche Klasse gehört dann aber zum Beispiel der Datenpunkt ? Wir vereinbaren hier, dass wir ihn in die untere Klasse stecken, also in die Klasse
Der Datenpunkt stecken wir demnach in die Klasse
Hier ist ein konkretes Beispiel:
Die Körpergrössen von Schülern und Schülerinnen einer Klasse wurde wiefolgt gemessen (in cm):
Beginnend mit , berechne die absoluten und relativen Häufigkeiten für Klassen der Breite . Beginne die erste Klasse mit dem Datenpunkt . Stelle eine Tabelle auf.
Solution

Wir wollen nun die Häufigkeitsverteilung der verschiedenen Klassen grafisch darstellen. Dazu brauchen wir nicht ein Balkendiagramm (wo die Höhe gerade die relative Häufigkeiten representieren), sondern ein Histogramm. In einem Histogramm ist die Breite der Balken fest vorgegeben, es muss gerade die Breiten der Klasse sein. Und die relative Häufigkeit wird durch die Fläche des Balkens representiert. Ist also die Breite der Klasse , und die relative Häufigkeit für diese Klasse , so ist die Höhe des Balkens
Die Balkenhöhe wird auch Dichte genannt. Im Beispiel 1 oben haben wir die Dichten schon in der Tabelle berechnet. Das Histogramm sieht also wie folgt aus:
Skizziere das Histogramm der Häufigkeitsverteilung in Aufgabe 1.
Solution

Beachte, dass die Klassenbreite einen grossen Einfluss auf das Histogramm hat. Mache dazu die folgende Aufgabe:
Brauche nochmals die Körpergrössen von Aufgabe 1. Bestimme die Histogramme für die zwei Klassenbreiten und . Beginne die Klassen immer bei .
Welche der Histogramme (, von Aufgabe 1, ) ist "besser", und in welchem Sinne "besser"?
Solution
Die Tabellen mit der Grössenverteilungen für und sind unten gezeigt:


Und die dazugehörigen Histogramme sind hier:

Das Histogramm mit Klassenbreite ist ein guter Kompromiss zwischen zu detailierte und zu grobe Verteilungen, und in dem Sinne das "beste".