Der Zentrale Grenzwertsatz

Werden Messungen gemacht oder Daten erhoben aus Umfragen, so sind die resultierenden Danten oft normalverteilt (daher, das Histogramm der Daten folgt einer Glockenkurve $f_{\mu,\sigma}$ ).

Beispiel:

Mehrmaliges Messen einer Grösse (Messfehler).
Die Grössen von Frauen, oder von Männern.
Summe der Zahlen von 10 geworfenen Würfeln.
usw.

Exercise 1

Aufgabe

Sammle Daten, und schaue, ob sie normalverteilt sind, indem das Histogram und die Normalverteilung skizziert werden.

Körpergrösse
Messfehler (mehrere male die Körpergrösse einer Person messen).

Der zentrale Grenzwertsatz gibt eine Erklärung für die Verbreitung von normalverteilten Daten. Er besagt das folgende (vereinfacht ausgedrückt):

Theorem 1

Entstehen die Daten aus einer Abfolge von vielen kleinen unabhängigen Zufallsausgängen, so sind sie normalverteilt.

Zum Beispiel:

ein Messvorgang wie die Messung der Tischhöhe besteht aus vielen kleinen zufälligen Einflüssen: wie konzentriert ich bin, wie ruhig gerade meine Hand ist, usw.
die Körpergrösse kann gedacht werden also die Summe von vielen Kochengrössen (Bein, Oberschenkel, ...), welche zum einem gewissen Grad eine zufallsbedingte Grösse besitzen.

Wir versuchen nun mit einem einfachen Beispiel zu verstehen, wieso eine Normalverteilung resultiert.

Exercise 2

Beispiel

Nehmen wir $10$ Münzen und bilden die Summe. Die Münzen haben eine $1$ (Kopf) auf einer Seite und eine $0$ (Zahl) auf der anderen. Nach den $10$ Würfen der Münze bilden wir die Summe $S$ der Zahlen.

Die Summe, die wir erhalten, kann als Resultat von vielen kleinen Zufallsereignissen gedacht werden (ob eine Münze eine $1$ oder eine $0$ zeigt).

Führe das Experiment mehrere Male aus und erstelle eine Häufigkeitstabelle der Resultate.
Fertige ein Histogramm an und finde die dazugehörige Normalverteilung (skizziere sie ebenfalls). Bemerkung: Obwohl die Daten eigentlich diskret sind, behandeln wir sie ausnahmsweise als kontinuierlich . Brauche die Klassen $]0,2],]2,4],]4,6], ...$ .
Überlege, wieso sehr kleine und sehr grosse Summen fast nie vorkommen, und Summen in der Mitte (so um $5$ ) am meisten. Tipp: Pascalsches Dreieck.