Die Dichtefunktion einer kontinuierlichen ZV

Da die Häufigkkeitsverteilung von Datenpunkten einer kontinuierlichen Zufallsvariable XX mit Hilfe eines Histogramms veranschaulicht wird, sollte analog die Wahrscheinlichtkeitsfunktion fXf_X einer kontinuierlichen Zufallsvariablen XX die Balkenhöhe des Histogramms approximieren. In der Tat, die Wahrscheinlichkeitsfunktion soll ja die Verteilung der Wahrscheinlichkeit über die möglichen Werte von XX, oder angenähert, die Datenpunktverteilung im Datensatz, als Funktion darstellen. Aber für welches Histogramm? Je nach Klassenbreite kann das Histogramm ja ganz verschieden aussehen. Um dieses Problem zu umgehen, konstruieren wir unser fXf_X wie folgt:

Definition 1

Gegeben sei ein Experiment mit einer kontinuierliche Zufallsvariable XX, dessen möglichen Werte im Intervall [a,b][a,b] liegen, wobei b=b=-\infty und a=a=\infty ebenfalls möglich ist.

  1. Wir führen das Experiment mm mal durch, wobei wir mm extrem gross wählen, so dass wir extrem viele durch XX erzeugte Datenpunkte erhalten.
  2. Wir formen das Histogramm der erhaltenen Datenpunkte. Da wir extrem viele Datenpunkte haben, können wir die Klassengrössen Δx\Delta x extrem klein wählen. Je mehr Datenpunkte wir wählen, und je kleiner wir die Klassenbreiten machen, desto glatter wir das Histogramm. Dies ist in der Animation unten illustriert. Die glatte Kurve ist die Wahrscheinlichkeitsfunktion fXf_X von XX, welche im Grenzübergang für unendlich viele Datenpunkte und unendlich kleine Balkenbreiten erhalten wird.
Open in GeoGebra

Beachte, dass fXf_X eine Dichte ist, da die Höhe des Histogramms eine Dichte ist (relative Häufigkeit durch Klassenbreite Δx\Delta x). Wir nennen fXf_X deshalb die Wahrscheinlichkeitsdichtefunktion (oder kurz Dichtefunktion) von XX.

Note 1

Es ist zu beachten, dass wir mit Hilfe dieser Konstruktion nur bewiesen haben, dass es so ein Funktion fXf_X gibt, und wie deren Graph aussieht. Das heisst aber nicht, dass wir vom Histogramm auf die algebraische Form (die Formel) von fXf_X schliessen können. Manchmal ist es einfach, die algebraische Form vom Graphen abzulesen, meistens ist es aber nicht trivial, wie wir ja schon von den verschieden diskutierten Funktion wissen.

Hier sind die wichtigsten Eigenschaften von fXf_X.

Theorem 1

Gegeben sei eine kontinuierliche Zufallsvariable XX, deren Werte im Intervall I=[a,b]I=[a,b] liegen (aa und bb können auch \infty sein), und fXf_X sei die dazugehörende Dichtefunktion. Es gilt:

  1. fX(x)0f_X(x)\geq 0 für alle x[a,b]x \in [a,b]

    Der Graph von fXf_X liegt nie unterhalb der xx-Achse.

  2. cdfX(x)dx=p(X[c,d])\int_c^d f_X(x)\, dx = p(X\in [c,d])\quad für jedes Intervall [c,d][a,b][c,d]\subset [a,b]

    Die Fläche unter der Kurve von cc bis dd ist die Wahrscheinlichkeit, dass XX einen Wert im Intervall [c,d][c,d] annimmt.

  3. abfX(x)dx=1\int_a^b f_X(x)\, dx=1

    Die Fläche unter der Kurve von aa nach bb ist 11.

Proof

Wir geben nur intuitive Beweisskizzen. Für formale Beweise brauchen wir eine grössen mathematischen Apparatus, den wir hier nicht entwickeln.

  1. Die Höhe der Balken im Histogramm (Dichten, also relative Häufigkeit über Balkenbreite) ist nie negative. Da fX(x)f_X(x) ebenfalls Balkenhöhen sind (für super schmale Balken), muss ebenfalls gelten fX(x)0f_X(x)\geq 0.

  2. Wir wissen schon von der Integralrechnung her, dass das Integral durch die Summe von nn Balkenflächen approximiert werden kann

    cdfX(x)dxf(x1)Δx+...+f(xn)Δx\int_c^d f_X(x)\, dx \approx f(x_1)\Delta x + ... + f(x_n)\Delta x

    Und je grösser nn (mehr Balken), desto besser diese Approximation. Wie immer sind die Punkte x1,...,xnx_1, ..., x_n der Ort der Balken auf der xx-achse ziwschen cc und dd (rechte Seite des Balken). Beachte nun, dass die Balkenfläche f(xk)Δxf(x_k)\Delta x ungefähr die relative Häufigkeit yky_k der Datenpunkten im Intervall [xkΔx,xk][x_k-\Delta x, x_k] ist, (da ja $f_X(x_k) die Dichte approximiert). Wir haben also

    y1f(x1)Δxy2f(x2)Δx...ynf(xn)Δx\begin{array}{ccc} y_1 &\approx& f(x_1)\Delta x\\ y_2 &\approx& f(x_2)\Delta x\\ ... & & \\ y_n &\approx& f(x_n)\Delta x \end{array}

    Die Summe dieser relativen Häufigkeiten ist also die relative Häufigkeit yy der Daten im Intervall [c,d][c,d]. Und je mehr Datenpunkte wir haben, und je mehr Balken wir brauchen, um das Integral zu approximieren, desto mehr nähert sich diese relative Häufigkeit der Wahrscheinlichkeit p(X[c,d])p(X \in [c,d]) an.

    cdfX(x)dxf(x1)Δx+...+f(xn)Δxy1+...+yn= rel. Ha¨ufigkeit in [c,d]p(X[c,d])\begin{array}{ccl} \int_c^d f_X(x)\, dx &\approx& f(x_1)\Delta x + ... + f(x_n)\Delta x\\ & \approx &\underbrace{y_1+...+y_n}_{\text{= rel. Häufigkeit in [c,d]}}\\[0.4em] & \approx& p(X\in[c,d]) \end{array}

    Wir sehen also, dass cdfX(x)dx=p(X[c,d])\int_c^d f_X(x)\, dx = p(X\in[c,d]) sein muss.

  3. Wegen p(X[a,b])=1p(X\in[a,b])=1 (keine anderen Werte möglich für XX) und abfX(x)dx=p(X[a,b])\int_a^b f_X(x)\, dx = p(X\in[a,b]) (siehe Punkt (2) oben) folgt abfX(x)dx=1\int_a^b f_X(x)\, dx=1.

Note 2

Oft werden Punkte (1) und (2) im Satz oben verwendet, um formal die Dichtefunktion fXf_X einer kontinuierlichen Zufallsvariable XX zu definieren, daher wir könnten definieren, dass eine Funktion fXf_X eine Dichtefunktion von XX ist, falls gilt, dass

  1. fX(x)0f_X(x)\geq 0 für alle x[a,b]x \in [a,b]
  2. cdfX(x)dx=p(X[c,d])\int_c^d f_X(x)\, dx = p(X\in [c,d])\quad für jedes Intervall [c,d][a,b][c,d]\subset [a,b]

Der dritte Punkt, dass abFx(X)dx=1\int_a^b F_x(X)\, dx=1, folgt dann, wie schon oben, aus Punkt (2). Unser Vorgehen ist etwas intuitiver.

Im Prinzip kann jede Funktion (zumindest diejenige, die wir kennen) die Dichtefunktion einer Zufallsvariablen XX sein. Oft kennen wir weder XX, noch das Experiment näher, und postulieren einfach ein XX mit einer bestimmten Dichtefunktion fXf_X, wobei fXf_X irgendeine Funktion sein kann. Wir müssen einfach darauf achten, dass fX(x)0f_X(x)\geq 0 und die Fläche unter der Kurve 11 ist: fx(x)dx=1\int f_x(x)\, dx=1. Unten ist ein Beispiel.

Exercise 1

Man betrachte ein Zufallsexperiment mit einer kontinuierlichen Zufallsvariablen XX, welche mögliche Werte in [1,1][-1,1] besitzt, und deren Dichtefunktion gegeben ist durch

fX(x)=3434x2,x[1,1]f_X(x)=\frac{3}{4}-\frac{3}{4}x^2, \quad x\in[-1,1]
  1. Skizziere den Graphen der Dichtefunktion fXf_X.

  2. Überprüfe, dass 11fX(x)dx=1\int_{-1}^1 f_X(x)\, dx=1

  3. Bestimme die Wahrscheinlichkeit, dass der beobachtete Wert von XX zwischen 0.40.4 und 0.70.7 liegt.

  4. Bestimme p(X=0.5)p(X=0.5)

Solution

Die Stammfunktion von fXf_X is

F(x)=34x3413x3=34x14x3\begin{array}{lll} F(x)&=&\frac{3}{4}x-\frac{3}{4}\frac{1}{3}x^3\\[0.4em] &=&\frac{3}{4}x-\frac{1}{4}x^3 \end{array}
  1. Der Graph von fXf_X ist

  2. Es ist

    p(X[1,1])=11fX(x)dx=F(1)F(1)=3411413(34(1)14(1)3)=1\begin{array}{lll} p(X\in [-1,1])&=&\int_{-1}^{1} f_X(x)\, dx\\ &=&F(1)-F(-1)\\ &=&\frac{3}{4}\cdot 1-\frac{1}{4}\cdot 1^3-(\frac{3}{4}\cdot (-1)-\frac{1}{4}\cdot (-1)^3)\\ &=& \underline{1} \end{array}
  3. Es ist

    p(X[0.4,0.7])=0.40.7fX(x)dx=F(0.7)F(0.4)=340.7140.73(340.4140.43)=0.155\begin{array}{lll} p(X\in [0.4,0.7])&=&\int_{0.4}^{0.7} f_X(x)\, dx\\ &=&F(0.7)-F(0.4)\\ &=&\frac{3}{4}\cdot 0.7-\frac{1}{4}\cdot 0.7^3-(\frac{3}{4}\cdot 0.4-\frac{1}{4}\cdot 0.4^3)\\ &=& \underline{0.155} \end{array}
  4. p(X=0.5)=p(X[0.5,0.5])=0.50.5fX(x)dx=0p(X=0.5)=p(X\in[0.5,0.5])=\int_{0.5}^{0.5} f_X(x)\, dx = 0. Gilt auch für alle anderen Werte, nicht nur für 0.50.5.