Lagemasse
Für ein quantitative Merkmal werden Lagemasse benutzt, um die gemessenen oder gesammelten Datenpunkte (also Zahlen, die Merkmalsausprägungen) zusammenzufassen. Stellt mans sich die Datenpunkte
auf der Zahlengeraden vor, so beschreibt ein Lagemasse wo etwa auf der Zahlengerade die Punkte zu finden sind (also deren Lage auf der Zahlengeraden). Wir stellen nun ein paar typische Lagemasse vor:
Arithmetisches Mittel
Das arithmetische Mittel (auch Mittelwert oder Durchschnitt) beschreibt das Zentrum des Datensatzes, und ist definiert als
Beachte, dass das arithmetische Mittel mit dem Symbol abgekürzt wird.
Median
Der Median (oder Zentralwert) ist der Datenpunkt in der Mitte der Liste, wenn diese zuerst der Grösse nach geordnet wurde. Ein mittlerer Datenpunkt existiert nur, wenn die Anzahl der Datenpunkte ungerade ist. Bei einer geraden Anzahl von Datenpunkten wird das arithmetische Mittel der beiden benachbarten Werte in der mitte der geordneten Liste genonmmen. Zum Beispiel, der Median der Datenpunkte ist , der Median der Datenpunkte ist .
Das Symbol für den Median ist .
Modus
Der Modus (oder Modalwert) ist der Datenwert, der am häufigsten Vorkommt (also der Datenwert mit der grössten absoluten Häufigkeit, oder der Datenwert mit dem höchsten Balken im Balkendiagramm). Es können auch mehrere Modi vorkommen.
Minimum und Maximum
Das Minimum der Datenpunkte ist die kleinste Zahl , und das Maximum der Datenpunkte is die grösste Zahl .
Hier ist ein Beispiel, welche die Anwendung dieser Lagemasse verdeutlicht.
Eine Person hat die folgenden Prüfungsnoten:
Bestimme die Werte aller Lagemasse.
Solution
Wir sortieren die Daten für den Median:
Wir haben dann die folgenden Lagemasse:
Oft sind die Datenpunkte auch durch die absoluten oder relativen Häufigkeiten gegeben. Auch dann können wir die Lagemasse bestimmen. Hier sind zwei Beispiele dazu, die verdeutlichen sollen, wie das geht.
Geben sind eine Box voller Hanteln, mit den folgenden Häufigkeiten
Bestimme die Lagemasse.
Solution
Insgesamt sind es also Datenpunkte. Sortieren wir wieder:
Wir berechnen nun das arithmetische Mittel möglichst effizient. Es sei hier bemerkt, dass wir dafür die 20kg 11-mal addieren müssen, die 65-mal, und die 24-mal, und dann die Summe durch $100 teilen müssen, also
Für den Median sehen wir, dass die benachbarten Punkte in der Mitte (Punkt 49 und 51) beides Hanteln sind, und wir haben deshalb
Der Modus ist (mit Häufigkeit ), , 75kg$.
Wir kommen nun zum Fall, wo die Datenpunkte durch die relativen Häufigkeiten gegeben sind. Die grösste Schwierigkeit stellt sich beim Berechnen des aritmetischen Mittels, da wir nicht die absoluten Häufigkeiten besitzen, und nicht einfach die Summe bilden können. Wenn wir zurück zum Beispiel mit den absoluten Häufigkeiten gehen, sehen wir aber, dass es auch mit den relativen Häufigkeiten geht.
Wir hatten ja das arithmetische Mittel wiefolgt berechnet:
Nun sehen wir aber, dass wir das Resultat auch so berechnen können:
wobei die Werte und gerade die relative Häufigkeiten der Hanteln sind. Somit können wir also das nächste Beispiel ebenfalls lösen.
Geben sind eine Box voller Hanteln, mit den folgenden Prozentualen Anteilen (oder relative Häufigkeiten)
Bestimme die Lagemasse.
Solution
Die relativen Häufigkeiten erhalten wir, wenn wir die Prozente durch Hundert teilen, also
Somit gilt
Beachte, dass der Median sein muss, da die ersten die -Hanteln sind, und die nächsten sind die -Hanteln, also der mittlere Wert der sortierten List, bei muss sein.