Scatterplots

In Experimenten kommt es oft vor, dass zwei Grössen gemessen werden um herauszufinden, wie diese zusammenhängen. Zum Beispiel haben wir den Verdacht, dass ein Zusammenhang zwischen viel Schlaf und höheren Schulnoten besteht. Um diesen Verdacht zu prüfen, könnten wir nun über eine gewisse Zeit Schüler und Schülerinnen nach ihren Noten befragen (xx), und auch, wie viel sie in der Nacht vor der Prüfung geschlafen haben (yy).

Diese Daten können dann als Punkte in einem Koordinatensystem eingetragen werden (sogenannte Scatterplots oder Korrelationsdiagramme). Oft wird dann eine Funktion gesucht, welche möglichst gut diese Punkteschar beschreibt. Wir wollen also eine Funktion zu den Daten extrapolieren.

Dies soll nun "von Hand" gemacht werden. Es gibt aber natürlich auch Computerprogramme, welche dies automatisch erledigen ... .

Exercise 1

Im folgenden sollen Funktionsgleichungen gefunden werden, welche möglichst gut durch die unten stehenden Punkte geht.

Der Link zu den Punkten ist hier. Achtung, mehrmals auf den gleichen Knopf drücken verändert die Punkteschar ein wenig, nicht aber die zu findende Funktion.

Vorgehen:

  • überlege den Funktionstyp (Potenzfunktion, lineare Funktion, exponentielle Funktion)
  • überlege Anhand der Punkte, was die möglichen Parameter sein könnten (etwa hat es einen Scheitelpunkt, wo? Wie gross ist AA, usw.).

Um zu überprüfen wie gut die Funktionsgleichung passt, kann sie im Eingabefeld unter dem Scatterplot eingegeben werden. Schreibe dazu etwa

f(x)=2*(x+1)^2-5

Um weitere Funktionsgleichung auszuprobieren, einfach das ff neu eingeben. Das ff kann auch gelöscht werden mit dem Befehl

delete(f)

Im Folgenden diskutieren wir, wie die Potenz pp beim Fitten einer Potenzfunktion aus den Datenpunkten bestimmt werden kann. Bis jetzt mussten wir immer hoffen, dass die Potenz von der Form p=n,p=np=n, p=-n, oder p=1/np=1/n ist. Was aber, wenn eine andere Potenz besser zu den Daten passen würde, wie zum Beispiel p=2.324p=2.324? Wir diskutieren dies Anhand eines konkreten Beispiels:

Example 1

In einem Experiment wird ein Gummiball aus einer Höhe von 1.8m fallen gelassen. Die Geschwindigkeit des Balls wird in Abhängigkeit der Distanz gemessen, welche der Ball beim Fallen schon zurückgelegt hat. Die Daten sind in einer Tabelle zusammengefasst:

x=Distanz (m)y=Geschwindigkeit (m/s)0.000.000.040.820.161.710.352.450.593.050.893.741.264.45\begin{array}{c|c} \text{$x$=Distanz (m)} & \text{$y$=Geschwindigkeit (m/s)} \\ \hline 0.00 & 0.00\\ 0.04 & 0.82\\ 0.16 & 1.71\\ 0.35 & 2.45\\ 0.59 & 3.05\\ 0.89 & 3.74\\ 1.26 & 4.45\\ \end{array}

Stelle diese Daten in einem Scatterplot dar, und fitte eine Potenzfunktion zu den Daten. Mach dann eine Voraussage, mit welcher Geschwindigkeit der Ball am Boden auftreffen wird.

Klicke rechts, um die Berechnung zu sehen.

Solution

Der Scatterplot ist unten gezeigt.

SS ist beim Nullpunkt, also muss gelten

f(x)=Axpf(x)=Ax^{p}

Um AA und pp herauszufinden, setzten wir zwei Punkte ein. Den Nullpunkt haben wir schon gebraucht, also brauchen wir noch zwei andere Punkte, etwa A(0.161.71A(0.16\vert 1.71 und B(0.593.74)B(0.59\vert 3.74). Wir haben dann

f(0.16)=1.71A0.16p=1.71f(0.16)=1.71 \rightarrow A\cdot 0.16^p = 1.71f(0.59)=3.74A0.59p=3.05f(0.59)=3.74 \rightarrow A\cdot 0.59^p = 3.05

Wir haben also zwei Gleichungen (und zwei Unbekannte). Aus der ersten Gleichung folgt

A=1.710.16pA=\frac{1.71}{0.16^p}

Setzen wir den Ausdruck für AA die zweite Gleichung ein, so erhalten wir

1.710.16p0.59p=3.05\frac{1.71}{0.16^p} \cdot 0.59^p = 3.051.710.59p0.16p=3.051.71 \cdot \frac{0.59^p}{0.16^p} =3.051.71(0.590.16)p=3.051.71 \cdot \left(\frac{0.59}{0.16}\right)^p =3.05(0.590.16)p=3.051.71=1.78\left(\frac{0.59}{0.16}\right)^p =\frac{3.05}{1.71}=1.78

Wir nehmen nun den Logarithmus zur Basis 1010 auf beiden Seiten, und erhalten

log10((0.590.16)p)=log10(1.78)\log_{10}\left( \left(\frac{0.59}{0.16}\right)^p\right) = \log_{10}(1.78)plog10(0.590.16)0.567=log10(1.78)0.25p\cdot \underbrace{\log_{10}\left( \frac{0.59}{0.16}\right)}_{0.567} = \underbrace{\log_{10}(1.78)}_{0.25}

Zur Repetition, im letzten Schritt haben wir die Logarithmus Regel

log10(ap)=plog10(a)\log_{10}(a^p)=p\cdot \log_{10}(a)

benutzt.

p=0.250.567=0.44p=\frac{0.25}{0.567}=0.44

Um AA zu finden, setzen wir pp in einer der beiden Gleichungen ein. Wir nehmen die erste, also

A0.16p=1.71A\cdot 0.16^p = 1.71A0.160.440.45=1.71A\cdot \underbrace{0.16^{0.44}}_{0.45} = 1.71A=1.710.45=3.83 A=\frac{1.71}{0.45}=3.83

Wir haben also die Funktion

f(x)=3.83x0.44f(x)=\underline{3.83\cdot x^{0.44}}

gefunden.

Wie die längere Rechnung zeigt, ist die extrapolierte Funktion gegeben durch

f(x)=3.83x0.44f(x)=\underline{3.83\cdot x^{0.44}}

In der Tat, der Fit ist nicht schlecht, wie das Diagramm unten aufzeigt. Wir können nun auch eine Vorhersage über die Aufprallgeschwindigkeit machen:

yAufprall=f(1.8)=3.831.80.44=4.96m/sy_{Aufprall} = f(1.8)=3.83\cdot 1.8^{0.44} = \underline{4.96 m/s}

Dies ist der rote Punkt im Scatterplot. Es sei hier bemerkt, dass für die Berechnung von ff nur zwei Datenpunkte benutzt wurden, und je nach Wahl dieser Punkte aus der Tabelle oben werden sich leicht unterschiedliche Funktion ff ergeben. Idealerweise würde man alle Datenpunkte verwenden. Solche Methoden existieren in der Tat, und werden routinemässig benutzt (etwa Regression).

Exercise 2

Eine abgespeckte Aufgabe wie oben. Der Graph einer Referenzfunktion xpx^p werde um 22 nach rechts verschoben, und geht dann durch die Punkte A(33.2)A(3\vert 3.2) and B(5.921.51)B(5.9\vert 21.51). Bestimme die Funktionsgleichung der verschobenen Funktion ff.

Solution

Es ist

f(x)=A(x2)pf(x)=A(x-2)^p

und

f(3)=3.2A1p=3.2f(3)=3.2 \rightarrow A\cdot 1^p=3.2f(5.9)=21.51A3.9p=21.51f(5.9)=21.51 \rightarrow A\cdot 3.9^p=21.51

Aus der ersten Gleichung folgt sofort wegen 1p=11^p=1, dass

A=3.2A=3.2

Dies in die zweite Gleichung eingesetzt, folgt

3.23.9p=21.513.2\cdot 3.9^p=21.513.9p=21.513.2=6.7223.9^p=\frac{21.51}{3.2}=6.722

Wenden wir den Zehnerlogarithmus auf beiden Seiten an, so erhalten wir

log10(3.9p)=log10(6.722)\log_{10}(3.9^p)=\log_{10}(6.722)

und nehmen nun die Potenz pp vor den Logarithmus, so gilt

plog10(3.9)=log10(6.722)p\cdot \log_{10}(3.9)=\log_{10}(6.722)

und somit

p=log10(6.722)log10(3.9)=1.4p=\frac{\log_{10}(6.722)}{\log_{10}(3.9)}=1.4

Wir erhalten also die Funktion

f(x)=3.2(x2)1.4f(x)=\underline{3.2\cdot (x-2)^{1.4}}