Der zentrale Grenzwertsatz (ZGS)
Wir diskutieren nun ein wichtiges Theorem in der Statistik. Es erklärt, wieso die Normalverteilung so oft auftritt.
Beginnen wir damit, Zufallsvariablen zu addieren.Gegeben sei ein Zufallsexperiment, und Zufallsvariablen , wobei eine natürliche Zahl ist (also ). Bilde wir die Summe der Zufallsvariablen, so erhalten wir eine neue Zufallsvariable, die wir nennen. Es ist also
Genauer:
für alle möglichen Ausgänge des Experiments. Ebenfalls definieren wir die Zufallsvariable
wird oft Stichprobenmittelwert genannt wird. Wir werden bald sehen, wieso dieser Name passt. Beachte, dass eigentlich ebenfalls von abhängt, wir schreiben aber nicht .
Ein fairer Würfel mit vier Seiten und den Zahlen wird geworfen. ist die Zahl im ersten Wurf, die Zahl im zweiten Wurf, und ist die Zahl im dritten Wurf.
-
Bestimme und falls nach der Durchführung des Experiments die Zahlen erschienen sind. Was ist die Interpretation von ?
-
Bestimme die Wahrscheinlichkeitsverteilungen von und und skizziere sie. Skizziere ebenfalls die Wahrscheinlichkeitsverteilungen von und .
-
Bestimme die Mittelwerte von und .
Solution
-
Wegen , und ist
und
Beachte, dass nach jeder Durchführung des Experiments (3-mal würfeln) der Wert von wie auch des Stichprobenmittelwerts zufällig ändert. berechnet jedes mal den Mittelwert der drei geworfenen Zahlen.
-
Wir müssen alle möglichen Werte von und bestimmen, und die Wahrscheinlichkeiten, dass diese Werte angenommen werden. We can do this with a tree (see below):
und da , haben wir und so weiter:
Die Verteilungen von und sind ebenfalls unten gezeigt. Beachte, dass und die gleichen Verteilungen haben.
-
Die Mittelwerte sind:


Beobachte, dass im obigen Beispiel die Zufallsvariablen ="geworfene Zahl im Versuch " eine konstante Verteilung ist, daher
Die Wahrscheinlichkeitsverteilung der Summe und des Stichprobenmittelwerts hingegen ähneln Normalverteilungen (siehe Lösung im Beispiel oben). Dies ist kein Zufall. Die Verteilung einer Zufallsvariablen, welche durch die Summe von anderen Zufallsvariablen entsteht, ist meistens normalverteilt. Dies ist gerade der Zentrale Grenzwertsatz, den wir nun im Detail formulieren:
Gegeben seien kontinuierliche Zufallsvariablen eines Experiments, welche die gleiche Wahrscheinlichkeitsdichtefunktion besitzen (und unabhängig voneinander sind). Alle haben somit den gleichen Mittelwert und die gleiche Standardabweichung . Beachte, dass es keine Rolle spielt, ob die alle diskret oder alle kontinuierlich sind. Es gilt dann:
-
ist ungefähr normalverteilt mit Mittelwert und Standardverteilung , daher
-
ist ungefähr normalverteilt mit Mittelwert und Standardverteilung , daher
Je grösser , desto besser ist die Approximation. Für ist die Approximation normalerweise schon recht gut. Beachte auch, dass wir den Grenzwertsatz für kontinuierliche Zufallsvariablen formuliert haben. Er gilt aber auch für diskrete Zufallsvariablen (siehe Würfelbeispiel oben).
Der Beweis ist sehr technisch und übersteigt die Grenzen dieses Kurses bei weitem. Unten ist ein Beispiel von Zufallsvariablen , die alle die gleiche Wahrscheinlichkeitsdichteverteilung haben (dargestellt oben links im Diagramm). Die rote horizontale Linie zeigt den Mittelwert dieser Verteilungen an. Jedes weitere Bild zeigt die Wahrscheinlichkeitsdichteverteilung von für grösser werdendes . Beobachte, wie das Stichprobenmittel schon bei recht gut normalverteilt ist.