Scatterplots

In Experimenten kommt es oft vor, dass zwei Grössen gemessen werden um herauszufinden, wie diese zusammenhängen. Zum Beispiel haben wir den Verdacht, dass ein Zusammenhang zwischen viel Schlaf und höheren Schulnoten besteht. Um diesen Verdacht zu prüfen, könnten wir nun über eine gewisse Zeit Schüler und Schülerinnen nach ihren Noten befragen ( $x$ ), und auch, wie viel sie in der Nacht vor der Prüfung geschlafen haben ( $y$ ).

Diese Daten können dann als Punkte in einem Koordinatensystem eingetragen werden (sogenannte Scatterplots oder Korrelationsdiagramme). Oft wird dann eine Funktion gesucht, welche möglichst gut diese Punkteschar beschreibt. Wir wollen also eine Funktion zu den Daten extrapolieren.

Dies soll nun "von Hand" gemacht werden. Es gibt aber natürlich auch Computerprogramme, welche dies automatisch erledigen ... .

Exercise 1

Im folgenden sollen Funktionsgleichungen gefunden werden, welche möglichst gut durch die unten stehenden Punkte geht.

Der Link zu den Punkten ist hier. Achtung, mehrmals auf den gleichen Knopf drücken verändert die Punkteschar ein wenig, nicht aber die zu findende Funktion.

Vorgehen:

überlege den Funktionstyp (Potenzfunktion, lineare Funktion, exponentielle Funktion)
überlege Anhand der Punkte, was die möglichen Parameter sein könnten (etwa hat es einen Scheitelpunkt, wo? Wie gross ist $A$ , usw.).

Um zu überprüfen wie gut die Funktionsgleichung passt, kann sie im Eingabefeld unter dem Scatterplot eingegeben werden. Schreibe dazu etwa

f(x)=2*(x+1)^2-5

Um weitere Funktionsgleichung auszuprobieren, einfach das $f$ neu eingeben. Das $f$ kann auch gelöscht werden mit dem Befehl

delete(f)

Im Folgenden diskutieren wir, wie die Potenz $p$ beim Fitten einer Potenzfunktion aus den Datenpunkten bestimmt werden kann. Bis jetzt mussten wir immer hoffen, dass die Potenz von der Form $p=n, p=-n$ , oder $p=1/n$ ist. Was aber, wenn eine andere Potenz besser zu den Daten passen würde, wie zum Beispiel $p=2.324$ ? Wir diskutieren dies Anhand eines konkreten Beispiels:

Example 1

In einem Experiment wird ein Gummiball aus einer Höhe von 1.8m fallen gelassen. Die Geschwindigkeit des Balls wird in Abhängigkeit der Distanz gemessen, welche der Ball beim Fallen schon zurückgelegt hat. Die Daten sind in einer Tabelle zusammengefasst:

\begin{array}{c|c} \text{$x$=Distanz (m)} & \text{$y$=Geschwindigkeit (m/s)} \\ \hline 0.00 & 0.00\\ 0.04 & 0.82\\ 0.16 & 1.71\\ 0.35 & 2.45\\ 0.59 & 3.05\\ 0.89 & 3.74\\ 1.26 & 4.45\\ \end{array}

Stelle diese Daten in einem Scatterplot dar, und fitte eine Potenzfunktion zu den Daten. Mach dann eine Voraussage, mit welcher Geschwindigkeit der Ball am Boden auftreffen wird.

Klicke rechts, um die Berechnung zu sehen.

Solution

Der Scatterplot ist unten gezeigt.

$S$ ist beim Nullpunkt, also muss gelten

f(x)=Ax^{p}

Um $A$ und $p$ herauszufinden, setzten wir zwei Punkte ein. Den Nullpunkt haben wir schon gebraucht, also brauchen wir noch zwei andere Punkte, etwa $A(0.16\vert 1.71$ und $B(0.59\vert 3.74)$ . Wir haben dann

f(0.16)=1.71 \rightarrow A\cdot 0.16^p = 1.71

f(0.59)=3.74 \rightarrow A\cdot 0.59^p = 3.05

Wir haben also zwei Gleichungen (und zwei Unbekannte). Aus der ersten Gleichung folgt

A=\frac{1.71}{0.16^p}

Setzen wir den Ausdruck für $A$ die zweite Gleichung ein, so erhalten wir

\frac{1.71}{0.16^p} \cdot 0.59^p = 3.05

1.71 \cdot \frac{0.59^p}{0.16^p} =3.05

1.71 \cdot \left(\frac{0.59}{0.16}\right)^p =3.05

\left(\frac{0.59}{0.16}\right)^p =\frac{3.05}{1.71}=1.78

Wir nehmen nun den Logarithmus zur Basis $10$ auf beiden Seiten, und erhalten

\log_{10}\left( \left(\frac{0.59}{0.16}\right)^p\right) = \log_{10}(1.78)

p\cdot \underbrace{\log_{10}\left( \frac{0.59}{0.16}\right)}_{0.567} = \underbrace{\log_{10}(1.78)}_{0.25}

Zur Repetition, im letzten Schritt haben wir die Logarithmus Regel

\log_{10}(a^p)=p\cdot \log_{10}(a)

benutzt.

p=\frac{0.25}{0.567}=0.44

Um $A$ zu finden, setzen wir $p$ in einer der beiden Gleichungen ein. Wir nehmen die erste, also

A\cdot 0.16^p = 1.71

A\cdot \underbrace{0.16^{0.44}}_{0.45} = 1.71

A=\frac{1.71}{0.45}=3.83

Wir haben also die Funktion

f(x)=\underline{3.83\cdot x^{0.44}}

gefunden.

Wie die längere Rechnung zeigt, ist die extrapolierte Funktion gegeben durch

f(x)=\underline{3.83\cdot x^{0.44}}

In der Tat, der Fit ist nicht schlecht, wie das Diagramm unten aufzeigt. Wir können nun auch eine Vorhersage über die Aufprallgeschwindigkeit machen:

y_{Aufprall} = f(1.8)=3.83\cdot 1.8^{0.44} = \underline{4.96 m/s}

Dies ist der rote Punkt im Scatterplot. Es sei hier bemerkt, dass für die Berechnung von $f$ nur zwei Datenpunkte benutzt wurden, und je nach Wahl dieser Punkte aus der Tabelle oben werden sich leicht unterschiedliche Funktion $f$ ergeben. Idealerweise würde man alle Datenpunkte verwenden. Solche Methoden existieren in der Tat, und werden routinemässig benutzt (etwa Regression).

Exercise 2

Eine abgespeckte Aufgabe wie oben. Der Graph einer Referenzfunktion $x^p$ werde um $2$ nach rechts verschoben, und geht dann durch die Punkte $A(3\vert 3.2)$ and $B(5.9\vert 21.51)$ . Bestimme die Funktionsgleichung der verschobenen Funktion $f$ .

Solution

Es ist

f(x)=A(x-2)^p

und

f(3)=3.2 \rightarrow A\cdot 1^p=3.2

f(5.9)=21.51 \rightarrow A\cdot 3.9^p=21.51

Aus der ersten Gleichung folgt sofort wegen $1^p=1$ , dass

A=3.2

Dies in die zweite Gleichung eingesetzt, folgt

3.2\cdot 3.9^p=21.51

3.9^p=\frac{21.51}{3.2}=6.722

Wenden wir den Zehnerlogarithmus auf beiden Seiten an, so erhalten wir

\log_{10}(3.9^p)=\log_{10}(6.722)

und nehmen nun die Potenz $p$ vor den Logarithmus, so gilt

p\cdot \log_{10}(3.9)=\log_{10}(6.722)

und somit

p=\frac{\log_{10}(6.722)}{\log_{10}(3.9)}=1.4

Wir erhalten also die Funktion

f(x)=\underline{3.2\cdot (x-2)^{1.4}}