Der Zentrale Grenzwertsatz

Werden Messungen gemacht oder Daten erhoben aus Umfragen, so sind die resultierenden Danten oft normalverteilt (daher, das Histogramm der Daten folgt einer Glockenkurve fμ,σf_{\mu,\sigma}).

Beispiel:

Exercise 1

Aufgabe

Sammle Daten, und schaue, ob sie normalverteilt sind, indem das Histogram und die Normalverteilung skizziert werden.

  1. Körpergrösse
  2. Messfehler (mehrere male die Körpergrösse einer Person messen).

Der zentrale Grenzwertsatz gibt eine Erklärung für die Verbreitung von normalverteilten Daten. Er besagt das folgende (vereinfacht ausgedrückt):

Theorem 1

Entstehen die Daten aus einer Abfolge von vielen kleinen unabhängigen Zufallsausgängen, so sind sie normalverteilt.

Zum Beispiel:

Wir versuchen nun mit einem einfachen Beispiel zu verstehen, wieso eine Normalverteilung resultiert.

Exercise 2

Beispiel

Nehmen wir 1010 Münzen und bilden die Summe. Die Münzen haben eine 11 (Kopf) auf einer Seite und eine 00 (Zahl) auf der anderen. Nach den 1010 Würfen der Münze bilden wir die Summe SS der Zahlen.

Die Summe, die wir erhalten, kann als Resultat von vielen kleinen Zufallsereignissen gedacht werden (ob eine Münze eine 11 oder eine 00 zeigt).

  1. Führe das Experiment mehrere Male aus und erstelle eine Häufigkeitstabelle der Resultate.
  2. Fertige ein Histogramm an und finde die dazugehörige Normalverteilung (skizziere sie ebenfalls). Bemerkung: Obwohl die Daten eigentlich diskret sind, behandeln wir sie ausnahmsweise als kontinuierlich . Brauche die Klassen ]0,2],]2,4],]4,6],...]0,2],]2,4],]4,6], ....
  3. Überlege, wieso sehr kleine und sehr grosse Summen fast nie vorkommen, und Summen in der Mitte (so um 55) am meisten. Tipp: Pascalsches Dreieck.