Die Dichtefunktion einer kontinuierlichen ZV

Da die Häufigkkeitsverteilung von Datenpunkten einer kontinuierlichen Zufallsvariable $X$ mit Hilfe eines Histogramms veranschaulicht wird, sollte analog die Wahrscheinlichtkeitsfunktion $f_X$ einer kontinuierlichen Zufallsvariablen $X$ die Balkenhöhe des Histogramms approximieren. In der Tat, die Wahrscheinlichkeitsfunktion soll ja die Verteilung der Wahrscheinlichkeit über die möglichen Werte von $X$ , oder angenähert, die Datenpunktverteilung im Datensatz, als Funktion darstellen. Aber für welches Histogramm? Je nach Klassenbreite kann das Histogramm ja ganz verschieden aussehen. Um dieses Problem zu umgehen, konstruieren wir unser $f_X$ wie folgt:

Definition 1

Gegeben sei ein Experiment mit einer kontinuierliche Zufallsvariable $X$ , dessen möglichen Werte im Intervall $[a,b]$ liegen, wobei $b=-\infty$ und $a=\infty$ ebenfalls möglich ist.

Wir führen das Experiment $m$ mal durch, wobei wir $m$ extrem gross wählen, so dass wir extrem viele durch $X$ erzeugte Datenpunkte erhalten.
Wir formen das Histogramm der erhaltenen Datenpunkte. Da wir extrem viele Datenpunkte haben, können wir die Klassengrössen $\Delta x$ extrem klein wählen. Je mehr Datenpunkte wir wählen, und je kleiner wir die Klassenbreiten machen, desto glatter wir das Histogramm. Dies ist in der Animation unten illustriert. Die glatte Kurve ist die Wahrscheinlichkeitsfunktion $f_X$ von $X$ , welche im Grenzübergang für unendlich viele Datenpunkte und unendlich kleine Balkenbreiten erhalten wird.

Open in GeoGebra

Beachte, dass $f_X$ eine Dichte ist, da die Höhe des Histogramms eine Dichte ist (relative Häufigkeit durch Klassenbreite $\Delta x$ ). Wir nennen $f_X$ deshalb die Wahrscheinlichkeitsdichtefunktion (oder kurz Dichtefunktion) von $X$ .

Note 1

Es ist zu beachten, dass wir mit Hilfe dieser Konstruktion nur bewiesen haben, dass es so ein Funktion $f_X$ gibt, und wie deren Graph aussieht. Das heisst aber nicht, dass wir vom Histogramm auf die algebraische Form (die Formel) von $f_X$ schliessen können. Manchmal ist es einfach, die algebraische Form vom Graphen abzulesen, meistens ist es aber nicht trivial, wie wir ja schon von den verschieden diskutierten Funktion wissen.

Hier sind die wichtigsten Eigenschaften von $f_X$ .

Theorem 1

Gegeben sei eine kontinuierliche Zufallsvariable $X$ , deren Werte im Intervall $I=[a,b]$ liegen ( $a$ und $b$ können auch $\infty$ sein), und $f_X$ sei die dazugehörende Dichtefunktion. Es gilt:

$f_X(x)\geq 0$ für alle $x \in [a,b]$

Der Graph von $f_X$ liegt nie unterhalb der $x$ -Achse.
$\int_c^d f_X(x)\, dx = p(X\in [c,d])\quad$ für jedes Intervall $[c,d]\subset [a,b]$

Die Fläche unter der Kurve von $c$ bis $d$ ist die Wahrscheinlichkeit, dass $X$ einen Wert im Intervall $[c,d]$ annimmt.
$\int_a^b f_X(x)\, dx=1$

Die Fläche unter der Kurve von $a$ nach $b$ ist $1$ .

Proof

Wir geben nur intuitive Beweisskizzen. Für formale Beweise brauchen wir eine grössen mathematischen Apparatus, den wir hier nicht entwickeln.

Die Höhe der Balken im Histogramm (Dichten, also relative Häufigkeit über Balkenbreite) ist nie negative. Da $f_X(x)$ ebenfalls Balkenhöhen sind (für super schmale Balken), muss ebenfalls gelten $f_X(x)\geq 0$ .
Wir wissen schon von der Integralrechnung her, dass das Integral durch die Summe von $n$ Balkenflächen approximiert werden kann
$\int_c^d f_X(x)\, dx \approx f(x_1)\Delta x + ... + f(x_n)\Delta x$
Und je grösser $n$ (mehr Balken), desto besser diese Approximation. Wie immer sind die Punkte $x_1, ..., x_n$ der Ort der Balken auf der $x$ -achse ziwschen $c$ und $d$ (rechte Seite des Balken). Beachte nun, dass die Balkenfläche $f(x_k)\Delta x$ ungefähr die relative Häufigkeit $y_k$ der Datenpunkten im Intervall $[x_k-\Delta x, x_k]$ ist, (da ja $f_X(x_k) die Dichte approximiert). Wir haben also
$\begin{array}{ccc} y_1 &\approx& f(x_1)\Delta x\\ y_2 &\approx& f(x_2)\Delta x\\ ... & & \\ y_n &\approx& f(x_n)\Delta x \end{array}$
Die Summe dieser relativen Häufigkeiten ist also die relative Häufigkeit $y$ der Daten im Intervall $[c,d]$ . Und je mehr Datenpunkte wir haben, und je mehr Balken wir brauchen, um das Integral zu approximieren, desto mehr nähert sich diese relative Häufigkeit der Wahrscheinlichkeit $p(X \in [c,d])$ an.
$\begin{array}{ccl} \int_c^d f_X(x)\, dx &\approx& f(x_1)\Delta x + ... + f(x_n)\Delta x\\ & \approx &\underbrace{y_1+...+y_n}_{\text{= rel. Häufigkeit in [c,d]}}\\[0.4em] & \approx& p(X\in[c,d]) \end{array}$
Wir sehen also, dass $\int_c^d f_X(x)\, dx = p(X\in[c,d])$ sein muss.
Wegen $p(X\in[a,b])=1$ (keine anderen Werte möglich für $X$ ) und $\int_a^b f_X(x)\, dx = p(X\in[a,b])$ (siehe Punkt (2) oben) folgt $\int_a^b f_X(x)\, dx=1$ .

Note 2

Oft werden Punkte (1) und (2) im Satz oben verwendet, um formal die Dichtefunktion $f_X$ einer kontinuierlichen Zufallsvariable $X$ zu definieren, daher wir könnten definieren, dass eine Funktion $f_X$ eine Dichtefunktion von $X$ ist, falls gilt, dass

$f_X(x)\geq 0$ für alle $x \in [a,b]$
$\int_c^d f_X(x)\, dx = p(X\in [c,d])\quad$ für jedes Intervall $[c,d]\subset [a,b]$

Der dritte Punkt, dass $\int_a^b F_x(X)\, dx=1$ , folgt dann, wie schon oben, aus Punkt (2). Unser Vorgehen ist etwas intuitiver.

Im Prinzip kann jede Funktion (zumindest diejenige, die wir kennen) die Dichtefunktion einer Zufallsvariablen $X$ sein. Oft kennen wir weder $X$ , noch das Experiment näher, und postulieren einfach ein $X$ mit einer bestimmten Dichtefunktion $f_X$ , wobei $f_X$ irgendeine Funktion sein kann. Wir müssen einfach darauf achten, dass $f_X(x)\geq 0$ und die Fläche unter der Kurve $1$ ist: $\int f_x(x)\, dx=1$ . Unten ist ein Beispiel.

Exercise 1

Man betrachte ein Zufallsexperiment mit einer kontinuierlichen Zufallsvariablen $X$ , welche mögliche Werte in $[-1,1]$ besitzt, und deren Dichtefunktion gegeben ist durch

f_X(x)=\frac{3}{4}-\frac{3}{4}x^2, \quad x\in[-1,1]

Skizziere den Graphen der Dichtefunktion $f_X$ .
Überprüfe, dass $\int_{-1}^1 f_X(x)\, dx=1$
Bestimme die Wahrscheinlichkeit, dass der beobachtete Wert von $X$ zwischen $0.4$ und $0.7$ liegt.
Bestimme $p(X=0.5)$

Solution

Die Stammfunktion von $f_X$ is

\begin{array}{lll} F(x)&=&\frac{3}{4}x-\frac{3}{4}\frac{1}{3}x^3\\[0.4em] &=&\frac{3}{4}x-\frac{1}{4}x^3 \end{array}

Der Graph von $f_X$ ist
Es ist
$\begin{array}{lll} p(X\in [-1,1])&=&\int_{-1}^{1} f_X(x)\, dx\\ &=&F(1)-F(-1)\\ &=&\frac{3}{4}\cdot 1-\frac{1}{4}\cdot 1^3-(\frac{3}{4}\cdot (-1)-\frac{1}{4}\cdot (-1)^3)\\ &=& \underline{1} \end{array}$
Es ist
$\begin{array}{lll} p(X\in [0.4,0.7])&=&\int_{0.4}^{0.7} f_X(x)\, dx\\ &=&F(0.7)-F(0.4)\\ &=&\frac{3}{4}\cdot 0.7-\frac{1}{4}\cdot 0.7^3-(\frac{3}{4}\cdot 0.4-\frac{1}{4}\cdot 0.4^3)\\ &=& \underline{0.155} \end{array}$
$p(X=0.5)=p(X\in[0.5,0.5])=\int_{0.5}^{0.5} f_X(x)\, dx = 0$ . Gilt auch für alle anderen Werte, nicht nur für $0.5$ .