Basiswechsel und Diagonalisierung

Basiswechsel

Die Wahl der Basis, in der gerechnet werden soll, ist eigentlich willkürlich. Bis jetzt haben wir uns darüber keine grossen Gedanken gemacht und uns ein orthonormiertes Basissystem zugrunde gelegt. Als Basis eines Raumes (im Moment 2D) genügen neben einem Bezugspunkt (Ursprung) zwei linear unabhängige Vektoren. Irgendein Vektor des $\mathbb{R}^2$ kann durch jede Basis des $\mathbb{R}^2$ ausgedrückt werden.

Exercise 1: Basiswechsel am Beispiel

Drücke den Vektor $\vec{a}=\begin{pmatrix}4\\1\end{pmatrix}$ (in kartesischer Basis) durch die neuen Basisvektoren $\vec{f}_1=\begin{pmatrix}1\\-1\end{pmatrix}$ und $\vec{f}_2=\begin{pmatrix}1\\3\end{pmatrix}$ aus.

Solution

Der Ansatz $x' \cdot \vec{f}_1 + y' \cdot \vec{f}_2 = \vec{a}$ führt zum Gleichungssystem:

\begin{align*} x' + y' &= 4 \\ -x' + 3y' &= 1 \end{align*}

Daraus folgt $4y' = 5 \implies y' = 1.25$ und $x' = 2.75$ . Der Vektor lautet in der neuen Basis also $\begin{pmatrix} 2.75 \\ 1.25 \end{pmatrix}$ .

Der Basiswechsel von der alten, kartesischen Basis in die neue Basis wird durch die Matrix $T$ wiedergegeben:

T = \begin{pmatrix} 0.75 & -0.25 \\ 0.25 & 0.25 \end{pmatrix}.

Der Basiswechsel in die umgekehrte Richtung ("Neu nach Alt") ist durch die inverse Matrix bestimmt. In den Spalten dieses Basiswechsels stehen gerade die Komponenten der neuen Basis $\vec{f}_1$ und $\vec{f}_2$ :

X = T^{-1} = \begin{pmatrix} 1 & 1 \\ -1 & 3 \end{pmatrix}.

Konjugierte Matrizen

Traditionellerweise wird die Matrix des Basiswechsels „neu-alt“ mit $X$ bezeichnet, die Inverse davon (Übergangsmatrix „alt-neu“) mit $X^{-1}$ .

Definition 1: Konjugierte Matrizen

Zwei Matrizen $A$ und $B$ heissen konjugiert, falls sie aus einem Basiswechsel auseinander hervorgehen, also wenn es eine bijektive Matrix $X$ gibt, für die gilt:

A = X \cdot B \cdot X^{-1}

Die Matrix $X$ wird Transformationsmatrix genannt.

Theorem 1: Satz über konjugierte Matrizen

Zwei Matrizen sind genau dann konjugiert, wenn ihre Eigenwerte übereinstimmen. Eigenwerte sind also Invarianten bezüglich eines Basiswechsels.

Proof

$\Rightarrow$ : Sei $A = X B X^{-1}$ . Das charakteristische Polynom ist:

\det(A - \lambda E) = \det(X B X^{-1} - \lambda X E X^{-1}) = \det(X(B-\lambda E)X^{-1})

= \det(X)\det(B-\lambda E)\det(X^{-1}) = \det(B-\lambda E).

Da $\det(X^{-1}) = 1/\det(X)$ , kürzt sich dies weg. Gleiches Polynom $\implies$ Gleiche Eigenwerte.

$\Leftarrow$ : Haben $A$ und $B$ dieselben, voneinander verschiedenen Eigenwerte, sind beide diagonalisierbar und zur selben Diagonalmatrix $D$ ähnlich ( $A \sim D$ und $B \sim D$ ). Daraus folgt $A \sim B$ .

Exercise 2: Konjugation prüfen

Zeige, dass die Matrizen $A=\begin{pmatrix}1&1\\2&0\end{pmatrix}$ und $B=\begin{pmatrix}4&-1\\10&-3\end{pmatrix}$ konjugiert sind, die Matrix $C=\begin{pmatrix}4&-1\\1&-3\end{pmatrix}$ hingegen nicht.

Solution

Wir berechnen die Eigenwerte über $\det(M-\lambda E)=0$ :

Für $A$ : $(1-\lambda)(-\lambda)-2 = \lambda^2-\lambda-2 = (\lambda-2)(\lambda+1)=0 \implies \lambda_1=2, \lambda_2=-1$ .
Für $B$ : $(4-\lambda)(-3-\lambda)-(-10) = \lambda^2-\lambda-2=0 \implies \lambda_1=2, \lambda_2=-1$ .
Für $C$ : $(4-\lambda)(-3-\lambda)-(-1) = \lambda^2-\lambda-11=0$ . Die Diskriminante ist $45$ , keine ganzzahligen Lösungen wie bei A/B.

Da $A$ und $B$ dieselben Eigenwerte haben, sind sie konjugiert. $C$ hat andere Eigenwerte und ist nicht konjugiert.

Klassifikation und Diagonalisierung

Die Tatsache, dass Eigenwerte und Eigenvektoren invariant bleiben, führt zu einer Klassifikation. Wir betrachten hier den Fall mit zwei verschiedenen Eigenwerten.

Definition 2: Diagonalmatrix

Eine Diagonalmatrix ist eine quadratische Matrix, in der nur in der Hauptdiagonalen Werte stehen, die verschieden von Null sind. An allen anderen Stellen stehen lauter Nullen.

Besitzt die Matrix $A$ einer Ursprungsaffinität $\alpha$ die verschiedenen Eigenwerte $\lambda_1 \neq \lambda_2$ und damit auch zwei linear unabhängige Eigenvektoren $\vec{v}_1$ und $\vec{v}_2$ , so werden alle Punkte auf der Fixgeraden $g_1$ bzw. $g_2$ mit dem entsprechenden Faktor $\lambda_1$ bzw. $\lambda_2$ zentrisch vom Ursprung aus gestreckt. Eine solche affine Abbildung wird Euler-Affinität genannt.

Wäre $\{\vec{v}_1,\vec{v}_2\}$ die Basis unseres Koordinatensystems, so hätte die Matrix $A$ die Diagonalgestalt:

D = \begin{pmatrix}\lambda_1 & 0 \\ 0 & \lambda_2\end{pmatrix}

Für eine Matrix wie oben definiert kann mit Hilfe eines Basiswechsels diese interpretationsfreundliche Situation geschaffen werden. Die Matrix $A$ kann durch Überführen der Eigenvektoren in die Standardbasis (Matrix $X^{-1}$ ), Anwenden der Diagonalmatrix $D$ und Rücktransformation (Matrix $X$ ) ausgedrückt werden:

A = X \cdot D \cdot X^{-1}.

Die Spaltenvektoren des Basiswechsels $X$ entsprechen dabei gerade den Eigenvektoren $\vec{v}_1, \vec{v}_2$ .

Theorem 2: Diagonalisierungs-Kriterium

Besitzt die Matrix $A$ zwei verschiedene Eigenwerte mit den Eigenvektoren $\vec{v}_1, \vec{v}_2$ , so lässt sie sich durch die Matrix $X=(\vec{v}_1, \vec{v}_2)$ diagonalisieren:

D = X^{-1} \cdot A \cdot X.

Proof

Angenommen, $A$ sei eine $2 \times 2$ -Matrix mit zwei verschiedenen Eigenwerten $\lambda_1 \neq \lambda_2$ . Die zugehörigen Eigenvektoren $\vec{v}_1, \vec{v}_2$ sind linear unabhängig und bilden daher eine Basis.

Sei $X := (\vec{v}_1 \ \vec{v}_2)$ . $A$ wirkt auf $X$ spaltenweise:

A X = (A \vec{v}_1 \ A \vec{v}_2) = (\lambda_1 \vec{v}_1 \ \lambda_2 \vec{v}_2) = X \cdot D, \quad \text{wobei } D = \begin{pmatrix} \lambda_1 & 0 \\ 0 & \lambda_2 \end{pmatrix}.

Multipliziert man von links mit $X^{-1}$ , folgt $X^{-1} A X = D$ .

Exercise 3: Lineare Unabhängigkeit von Eigenvektoren

Zeige: Besitzt eine lineare Abbildung zwei verschiedene Eigenwerte, so sind die zugehörigen Eigenvektoren linear unabhängig.

Solution

Wären $\vec{v}_1, \vec{v}_2$ linear abhängig, also $\vec{v}_1 = c \vec{v}_2$ , dann würde gelten: $A\vec{v}_1 = \lambda_1 \vec{v}_1 = \lambda_1 c \vec{v}_2$ . Gleichzeitig gilt wegen der Linearität: $A(c\vec{v}_2) = c A\vec{v}_2 = c \lambda_2 \vec{v}_2$ . Daraus folgt $c(\lambda_1 - \lambda_2)\vec{v}_2 = \vec{0}$ . Da $c \neq 0$ und $\vec{v}_2 \neq \vec{0}$ , müsste $\lambda_1 = \lambda_2$ sein; Widerspruch.

Exercise 4: Diagonalisiere

Diagonalisiere die Matrix

A=\begin{pmatrix}1.5 & 1.5 \\ 1 & 1\end{pmatrix}

und bestimme die Transformationsmatrix $X$ .

Solution

Eigenwerte bestimmen: $\det(A-\lambda E) = (1.5-\lambda)(1-\lambda) - 1.5 = \lambda^2 - 2.5\lambda = \lambda(\lambda - 2.5) = 0$ . Eigenwerte: $\lambda_1 = 0$ , $\lambda_2 = 2.5$ .
Eigenvektoren bestimmen:
- Zu $\lambda_1=0$ : $1.5x + 1.5y = 0 \implies x=-y \implies \vec{v}_1 = \begin{pmatrix} 1 \\ -1 \end{pmatrix}$ .
- Zu $\lambda_2=2.5$ : $(1.5-2.5)x + 1.5y = -x + 1.5y = 0 \implies x=1.5y \implies \vec{v}_2 = \begin{pmatrix} 3 \\ 2 \end{pmatrix}$ .
Matrizen aufstellen: $X = \begin{pmatrix} 1 & 3 \\ -1 & 2 \end{pmatrix}, \quad D = \begin{pmatrix} 0 & 0 \\ 0 & 2.5 \end{pmatrix}.$

Anwendungen: Potenzieren und Folgen

Potenzieren von Matrizen

Müssen Matrizen potenziert werden, ist dies oft mühsam. Ein Lösungsansatz liefert die Diagonalisierung. Ist $A$ diagonalisierbar ( $A = X D X^{-1}$ ), so gilt:

A^n = (X D X^{-1})^n = X D^n X^{-1} = X \begin{pmatrix} \lambda_1^n & 0 \\ 0 & \lambda_2^n \end{pmatrix} X^{-1}

Exercise 5: Verkehrszählung

Das Verhalten von Pendlern (Auto vs. ÖV) wird durch die Matrix $A = \begin{pmatrix}0.6 & 0.2 \\ 0.4 & 0.8\end{pmatrix}$ beschrieben. Berechne die Verteilung nach 10 Jahren ( $A^{10}$ ).

Solution

Eigenwerte: $\lambda^2 - 1.4\lambda + 0.4 = 0 \implies (\lambda-1)(\lambda-0.4)=0$ . $\lambda_1 = 1$ (stationärer Zustand), $\lambda_2 = 0.4$ . $D = \begin{pmatrix} 1 & 0 \\ 0 & 0.4 \end{pmatrix}$ . $A^{10} = X \begin{pmatrix} 1^{10} & 0 \\ 0 & 0.4^{10} \end{pmatrix} X^{-1} \approx X \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix} X^{-1}$ .

Exercise 6: Matrix hoch 20

Berechne die 20. Potenz der Matrix

A = \begin{pmatrix}2&2\\ -1&-2\end{pmatrix}.

Solution

Spur ist 0, Determinante ist -2. $\lambda^2 - 2 = 0 \implies \lambda = \pm\sqrt{2}$ . Das Quadrieren der Matrix ergibt:

A^2 = \begin{pmatrix}2 & 2\\ -1 & -2\end{pmatrix} \cdot \begin{pmatrix}2 & 2\\ -1 & -2\end{pmatrix} = \begin{pmatrix}2 & 0\\ 0 & 2\end{pmatrix} = 2 \cdot E.

Daraus folgt einfach:

A^{20} = (A^2)^{10} = (2 \cdot E)^{10} = 2^{10} \cdot E = \begin{pmatrix}1024 & 0\\0 & 1024\end{pmatrix}.

Explizite Bildungsgesetze für Folgen

Das Finden von expliziten Bildungsgesetzen bei rekursiv definierten Folgen kann elegant über Matrizen hergeleitet werden.

Exercise 7: Fibonacci-Folge

Die Fibonacci-Zahlen sind definiert durch $F_k = F_{k-1} + F_{k-2}$ mit $F_0=0, F_1=1$ . Wie lautet das explizite Gesetz?

Solution

Rekursionsmatrix $M = \begin{pmatrix}1 & 1\\ 1 & 0\end{pmatrix}$ . Eigenwerte sind $\Phi = \frac{1+\sqrt{5}}{2}$ und $\psi = \frac{1-\sqrt{5}}{2}$ . Durch Diagonalisierung erhält man die Formel von Binet:

F_k = \frac{1}{\sqrt{5}} \left( \Phi^k - \psi^k \right).

Exercise 8: Lucas-Folge

Zeige, dass die rekursiv definierte Folge $a_k = 3a_{k-1} - 2a_{k-2}$ mit $a_1 = 0$ und $a_2 = 1$ das explizite Bildungsgesetz $a_k = 2^{k-1} - 1$ hat.

Solution

Rekursionsmatrix $M = \begin{pmatrix}3 & -2\\1 & 0\end{pmatrix}$ . Eigenwerte: $\lambda^2 - 3\lambda + 2 = 0 \implies (\lambda-1)(\lambda-2)=0$ . $\lambda_1 = 2, \lambda_2 = 1$ . Allgemeiner Ansatz: $a_k = c_1 \cdot 2^k + c_2 \cdot 1^k$ . Einsetzen der Startwerte liefert $c_1 = 0.5$ und $c_2 = -1$ . $a_k = 0.5 \cdot 2^k - 1 = 2^{k-1} - 1$ .

Exercise 9: 🧩

Versuche eine allgemeine, explizite Formel für Folgen der Art $a_k = p \cdot a_{k-1} + q \cdot a_{k-2}$ herzuleiten.

Solution

Die Matrix $A = \begin{pmatrix} p & q \\ 1 & 0 \end{pmatrix}$ hat die Eigenwerte $\lambda_{1,2} = \frac{p \pm \sqrt{p^2 + 4q}}{2}$ . Falls $\lambda_1 \neq \lambda_2$ , lässt sich die Folge schreiben als $a_k = \alpha \lambda_1^k + \beta \lambda_2^k$ . Die Konstanten $\alpha, \beta$ werden durch das Gleichungssystem der Startwerte bestimmt.

Weitere Eigenschaften von Matrizen

Exercise 10: Inversenregel

Zeige für invertierbare Matrizen $A, B$ : $(A \cdot B)^{-1} = B^{-1} \cdot A^{-1}$ .

Solution

Wir prüfen, ob das Produkt mit der vermuteten Inversen die Einheitsmatrix ergibt:

(AB)(B^{-1}A^{-1}) = A(B B^{-1})A^{-1} = A E A^{-1} = A A^{-1} = E.

Da das Inverse eindeutig ist, gilt die Behauptung.

Definition 3: Symmetrische Matrix

Eine Matrix $A$ heißt symmetrisch, wenn $a_{12} = a_{21}$ (bzw. $A = A^T$ ).

Exercise 11: Symmetrie und Orthogonalität

a) Zeige für die symmetrische Matrix $A=\begin{pmatrix}1 & 2 \\ 2 & -2\end{pmatrix}$ , dass ihre Eigenvektoren senkrecht aufeinander stehen.

b) Beweise die Behauptung allgemein.

c) Zeige die Umkehrung.

Solution

a) Eigenwerte: $\lambda_1=2, \lambda_2=-3$ . Eigenvektoren $\vec{v}_1 = \begin{pmatrix}2\\1\end{pmatrix}$ und $\vec{v}_2 = \begin{pmatrix}1\\-2\end{pmatrix}$ . Skalarprodukt: $2(1) + 1(-2) = 0$ . $\checkmark$

b) Seien $A=A^T$ und $\lambda \neq \mu$ Eigenwerte mit Eigenvektoren $v, w$ .

\lambda (v \cdot w) = (\lambda v)^T w = (Av)^T w = v^T A^T w = v^T A w = v^T (Aw) = v^T (\mu w) = \mu (v \cdot w).

Also $(\lambda - \mu)(v \cdot w) = 0 \implies v \cdot w = 0$ .

c) Wenn $X = (\vec{v}_1, \vec{v}_2)$ orthogonale Spalten hat, ist $X$ eine Orthogonalmatrix, also $X^{-1} = X^T$ . Aus $A = X D X^{-1} = X D X^T$ folgt $A^T = (X D X^T)^T = X D^T X^T = X D X^T = A$ .