Beschreibende Statistik
Die beschreibende Statistik setzt sich zum Ziel, Datensätze grafisch darzustellen, und durch Kennzahlen (zum Beispiel Lagemasse und Streumasse) zu beschreiben. Es folgen ein paar Begriffe:
- Die Datenreihe: gesammelte Daten, oft mit bezeichnet, wobei für den ersten Datenpunkt (oder Messung) steht, für den zweiten, und so weiter. bezeichnet den letzten Datenpunkt, und ist gerade auch die Anzahl der Datenpunkte.
- Die Grundgesamtheit: die Menge aller Datenpunkte, über die etwas ausgesagt werden soll. Zum Beispiel die Grösse von allen Personen in Europa. Oder das Gewicht von allen Kühen auf der ganzen Welt. Oder auch die Augenfarbe der Schüler:innen in der Klasse 26z.
- Die Stichprobe einer Grundgesamtheit: Eine Teil der Grundgesamtheit. Wir arbeiten oft mit Stichproben, da es typischerweise schwierig ist, an alle Datenpunkte heranzukommen. Zum Beispiel ist es kaum möglich, die Grösse von allen Personen in Europa zu messen, wir können aber eine Stichprobe von hundert Personen in Europa auswählen, und die Grösse messen. Für die Augenfarbe der Schüler:innen in der Klasse 26z hingegen brauchen wir keine Stichprobe, da es relativ einfach ist, die Grundgesamtheit zu bestimmen. Die Anzahl Datenpunkte in einer Stichprobe wird Stichprobengrösse genannt.
- Merkmale und Merkmalsausprägung: Die Grösse oder das Gewicht einer Person sind Merkmale dieser Person, und die gemessenen Daten werden Merkmalsausprägungen genannt.
- Merkmalstypen: Merkmal können quantitativ sein, daher lassen sich mit Zahlen beschreiben oder messen, oder qualitativ, daher lassen sich nicht messen, sondern nur mit Worten beschreiben. Ein Merkmal kann aber auch beides sein. Zum Beispiel, wenn ich die Körpergrösse beschreibe als "winzig, klein, gross, riesig" so ist dies nun ein qualitatives Merkmal. Messe ich hingegen die Körpergrösse und drücke sie mit einer Zahl aus, , , ... so ist dies nun ein quantitatives Merkmal.
- Quantitative Merkmale können diskret oder stetig sein. Sind die Merkmale diskret, so können nur bestimmte Zahlen vorkommen. Sind die Merkmale stetig, so können alle möglichen Zahlen in einem gewissen Interval vorkommen.
- Qualititative Merkmale können nominal oder ordinal sein. Bei nominalen Merkmalen gibt es kein "natürliches" System, wie sie geordnet werden können. Bei ordinalen Merkmalen gibt solch ein System. Zum Beispiel, für das Merkmal "Augenfarbe" (grün, braun, ...) ist es nicht klar, ob ich beim Aufzählen zuerst grün, und dann braun sagen soll, oder umgekehrt. Augenfarbe ist also nominal. Für die Körpergrössen "winzig, klein, mittel, gross, riesig" hingegen ergibt sich automatisch eine Ordnung (von klein nach gross, oder von gross nach klein). Körpergrösse ist also ordinal.
Hier ist ein Beispiel:
Note 1
Müssen wir etwas zählen, so führt dies normalerweise zu diskreten Daten, müssen wir etwas messen, so ergibt dies typischerweise stetige Daten.
Exercise 1
Sind die Datensätze diskret oder stetig?
-
Länge der Blätter am Baum.
-
Anzahl SchülerInnen in einer Klasse am Gymnasium.
-
Das Gewicht von Hunden.
-
Wie viel Wasser es genau in einer 1l Flasche hat.
-
Das Geburtsdatum von allen Bewohnern in der Schweiz.
Solution
- stetig
- diskret
- stetig
- stetig
- Je nach dem, wie genau das Datum festgehlaten wird: Bei Tag/Monat/Jahr ist der Datensatz diskret, aber bei einem genauen Datum (bis zu Sekunden, Zehntelsekunden und so) ist es eher stetig.