Lagemasse

Für ein quantitative Merkmal werden Lagemasse benutzt, um die gemessenen oder gesammelten Datenpunkte (also Zahlen, die Merkmalsausprägungen) zusammenzufassen. Stellt mans sich die Datenpunkte

x1,x2,x3,...,xnx_1, x_2, x_3, ..., x_n

auf der Zahlengeraden vor, so beschreibt ein Lagemasse wo etwa auf der Zahlengerade die Punkte zu finden sind (also deren Lage auf der Zahlengeraden). Wir stellen nun ein paar typische Lagemasse vor:

Arithmetisches Mittel

Das arithmetische Mittel (auch Mittelwert oder Durchschnitt) x\overline{x} beschreibt das Zentrum des Datensatzes, und ist definiert als

x=x1+x2+...+xnn\overline{x}=\frac{x_1+x_2+...+x_n}{n}

Beachte, dass das arithmetische Mittel mit dem Symbol x\overline{x} abgekürzt wird.

Median

Der Median (oder Zentralwert) ist der Datenpunkt in der Mitte der Liste, wenn diese zuerst der Grösse nach geordnet wurde. Ein mittlerer Datenpunkt existiert nur, wenn die Anzahl der Datenpunkte nn ungerade ist. Bei einer geraden Anzahl nn von Datenpunkten wird das arithmetische Mittel der beiden benachbarten Werte in der mitte der geordneten Liste genonmmen. Zum Beispiel, der Median der Datenpunkte 3,2,53,2,5 ist 33, der Median der Datenpunkte 3,2,5,43,2,5,4 ist 3.53.5.

Das Symbol für den Median ist x~\tilde{x}.

Modus

Der Modus (oder Modalwert) ist der Datenwert, der am häufigsten Vorkommt (also der Datenwert mit der grössten absoluten Häufigkeit, oder der Datenwert mit dem höchsten Balken im Balkendiagramm). Es können auch mehrere Modi vorkommen.

Minimum und Maximum

Das Minimum der Datenpunkte ist die kleinste Zahl xminx_{min}, und das Maximum der Datenpunkte is die grösste Zahl xmaxx_{max}.

Hier ist ein Beispiel, welche die Anwendung dieser Lagemasse verdeutlicht.

Example 1

Eine Person hat die folgenden Prüfungsnoten:

5,5.5,4.5,4.75,6,6,4.5,25,5.5,4.5,4.75, 6, 6,4.5,2

Bestimme die Werte aller Lagemasse.

Solution

Wir sortieren die Daten für den Median:

2,4.5,4.5,4.75,5,5.5,6,62,4.5,4.5,4.75,5,5.5,6,6

Wir haben dann die folgenden Lagemasse:

n=8x=4.78x~=4.75+52=4.875xmin=2xmax=6Modi=4.5und6mit Ha¨ufigkeit 2\begin{array}{rcl} n&=&8\\ \overline{x}&=&4.78\\ \tilde{x}&=&\frac{4.75+5}{2} = 4.875\\ x_{min}&=&2\\ x_{max}&=&6\\ \text{Modi}&=&4.5 \,\text{und}\, 6\quad \text{mit Häufigkeit 2} \end{array}

Oft sind die Datenpunkte auch durch die absoluten oder relativen Häufigkeiten gegeben. Auch dann können wir die Lagemasse bestimmen. Hier sind zwei Beispiele dazu, die verdeutlichen sollen, wie das geht.

Example 2: Daten durch absolute Häufigkeiten gegeben.

Geben sind eine Box voller Hanteln, mit den folgenden Häufigkeiten

20kg40kg75kg116524\begin{array}{c|c|c} 20kg & 40kg & 75kg\\\hline 11 & 65 & 24\\ \end{array}

Bestimme die Lagemasse.

Solution

Insgesamt sind es also n=12+65+24=100n=12+65+24=100 Datenpunkte. Sortieren wir wieder:

20kg,...,20kg11mal,40kg,...,40kg65mal,75kg,...,75kg24mal\underbrace{20kg, ..., 20kg}_{11 \text{mal}},\underbrace{40kg, ..., 40kg}_{65 \text{mal}},\underbrace{75kg, ..., 75kg}_{24 \text{mal}}

Wir berechnen nun das arithmetische Mittel möglichst effizient. Es sei hier bemerkt, dass wir dafür die 20kg 11-mal addieren müssen, die 40kg40kg 65-mal, und die 75kg75kg 24-mal, und dann die Summe durch $100 teilen müssen, also

x=1120kg+6540kg+2475kg100=46.2kg\overline{x}=\frac{11\cdot 20kg + 65\cdot 40kg + 24\cdot 75kg}{100}=46.2kg

Für den Median sehen wir, dass die benachbarten Punkte in der Mitte (Punkt 49 und 51) beides 40kg40kg Hanteln sind, und wir haben deshalb

x~=40kg+40kg2=40kg\tilde{x}=\frac{40kg+40kg}{2}=40kg

Der Modus ist 40k40k (mit Häufigkeit 6565), xmin=20kgx_{min}=20kg, xmax=x_{max}=75kg$.

Wir kommen nun zum Fall, wo die Datenpunkte durch die relativen Häufigkeiten gegeben sind. Die grösste Schwierigkeit stellt sich beim Berechnen des aritmetischen Mittels, da wir nicht die absoluten Häufigkeiten besitzen, und nicht einfach die Summe bilden können. Wenn wir zurück zum Beispiel mit den absoluten Häufigkeiten gehen, sehen wir aber, dass es auch mit den relativen Häufigkeiten geht.

Wir hatten ja das arithmetische Mittel wiefolgt berechnet:

x=1120kg+6540kg+2475kg100=46.2kg\overline{x}=\frac{11\cdot 20kg + 65\cdot 40kg + 24\cdot 75kg}{100}=46.2kg

Nun sehen wir aber, dass wir das Resultat auch so berechnen können:

x=1120kg+6540kg+2475kg100=1110020kg+6510040kg+2410075kg=0.1120kg+0.6540kg+0.2475kg=46.2kg\begin{array}{lcl} \overline{x}&=&\frac{11\cdot 20kg + 65\cdot 40kg + 24\cdot 75kg}{100}\\ &=&\frac{11}{100} \cdot 20kg +\frac{65}{100}\cdot 40kg +\frac{24}{100}\cdot 75kg\\ &=& 0.11 \cdot 20kg +0.65\cdot 40kg +0.24\cdot 75kg\\ &=& 46.2kg \end{array}

wobei die Werte 0.11,0.650.11, 0.65 und 0.240.24 gerade die relative Häufigkeiten der Hanteln sind. Somit können wir also das nächste Beispiel ebenfalls lösen.

Example 3: Daten durch relative Häufigkeiten gegeben.

Geben sind eine Box voller Hanteln, mit den folgenden Prozentualen Anteilen (oder relative Häufigkeiten)

20kg40kg75kg100kg30%42%16%12%\begin{array}{c|c|c|c} 20kg & 40kg & 75kg & 100kg\\\hline 30\% & 42\% & 16\% & 12\%\\ \end{array}

Bestimme die Lagemasse.

Solution

Die relativen Häufigkeiten erhalten wir, wenn wir die Prozente durch Hundert teilen, also

0.3,0.42,0.16,0.120.3, 0.42, 0.16, 0.12

Somit gilt

n=unknownx=0.320kg+0.4240kg+0.1675kg+0.12100kg=46.8kgx~=40kgxmin=20kgxmax=100kgModus=40kg\begin{array}{rcl} n&=& \text{unknown}\\ \overline{x}&=& 0.3\cdot 20kg + 0.42\cdot 40kg+0.16\cdot 75kg +0.12\cdot 100kg = 46.8kg\\ \tilde{x}&=&40kg\\ x_{min}&=&20kg\\ x_{max}&=&100kg\\ \text{Modus}&=&40kg \end{array}

Beachte, dass der Median 40kg40kg sein muss, da die ersten 30%30\% die 20kg20kg-Hanteln sind, und die nächsten 42%42\% sind die 40kg40kg-Hanteln, also der mittlere Wert der sortierten List, bei 50%50\% muss 40kg40kg sein.