Basiswechsel und Diagonalisierung

Basiswechsel

Die Wahl der Basis, in der gerechnet werden soll, ist eigentlich willkürlich. Bis jetzt haben wir uns darüber keine grossen Gedanken gemacht und uns ein orthonormiertes Basissystem zugrunde gelegt. Als Basis eines Raumes (im Moment 2D) genügen neben einem Bezugspunkt (Ursprung) zwei linear unabhängige Vektoren. Irgendein Vektor des R2\mathbb{R}^2 kann durch jede Basis des R2\mathbb{R}^2 ausgedrückt werden.

Exercise 1: Basiswechsel am Beispiel

Drücke den Vektor a=(41)\vec{a}=\begin{pmatrix}4\\1\end{pmatrix} (in kartesischer Basis) durch die neuen Basisvektoren f1=(11)\vec{f}_1=\begin{pmatrix}1\\-1\end{pmatrix} und f2=(13)\vec{f}_2=\begin{pmatrix}1\\3\end{pmatrix} aus.

Solution

Der Ansatz xf1+yf2=ax' \cdot \vec{f}_1 + y' \cdot \vec{f}_2 = \vec{a} führt zum Gleichungssystem:

x+y=4x+3y=1\begin{align*} x' + y' &= 4 \\ -x' + 3y' &= 1 \end{align*}

Daraus folgt 4y=5    y=1.254y' = 5 \implies y' = 1.25 und x=2.75x' = 2.75. Der Vektor lautet in der neuen Basis also (2.751.25)\begin{pmatrix} 2.75 \\ 1.25 \end{pmatrix}.

Der Basiswechsel von der alten, kartesischen Basis in die neue Basis wird durch die Matrix TT wiedergegeben:

T=(0.750.250.250.25).T = \begin{pmatrix} 0.75 & -0.25 \\ 0.25 & 0.25 \end{pmatrix}.

Der Basiswechsel in die umgekehrte Richtung ("Neu nach Alt") ist durch die inverse Matrix bestimmt. In den Spalten dieses Basiswechsels stehen gerade die Komponenten der neuen Basis f1\vec{f}_1 und f2\vec{f}_2:

X=T1=(1113).X = T^{-1} = \begin{pmatrix} 1 & 1 \\ -1 & 3 \end{pmatrix}.

Konjugierte Matrizen

Traditionellerweise wird die Matrix des Basiswechsels „neu-alt“ mit XX bezeichnet, die Inverse davon (Übergangsmatrix „alt-neu“) mit X1X^{-1}.

Definition 1: Konjugierte Matrizen

Zwei Matrizen AA und BB heissen konjugiert, falls sie aus einem Basiswechsel auseinander hervorgehen, also wenn es eine bijektive Matrix XX gibt, für die gilt:

A=XBX1A = X \cdot B \cdot X^{-1}

Die Matrix XX wird Transformationsmatrix genannt.

Theorem 1: Satz über konjugierte Matrizen

Zwei Matrizen sind genau dann konjugiert, wenn ihre Eigenwerte übereinstimmen. Eigenwerte sind also Invarianten bezüglich eines Basiswechsels.

Proof

\Rightarrow : Sei A=XBX1A = X B X^{-1}. Das charakteristische Polynom ist:

det(AλE)=det(XBX1λXEX1)=det(X(BλE)X1)\det(A - \lambda E) = \det(X B X^{-1} - \lambda X E X^{-1}) = \det(X(B-\lambda E)X^{-1})=det(X)det(BλE)det(X1)=det(BλE).= \det(X)\det(B-\lambda E)\det(X^{-1}) = \det(B-\lambda E).

Da det(X1)=1/det(X)\det(X^{-1}) = 1/\det(X), kürzt sich dies weg. Gleiches Polynom     \implies Gleiche Eigenwerte.

\Leftarrow : Haben AA und BB dieselben, voneinander verschiedenen Eigenwerte, sind beide diagonalisierbar und zur selben Diagonalmatrix DD ähnlich (ADA \sim D und BDB \sim D). Daraus folgt ABA \sim B.

Exercise 2: Konjugation prüfen

Zeige, dass die Matrizen A=(1120)A=\begin{pmatrix}1&1\\2&0\end{pmatrix} und B=(41103)B=\begin{pmatrix}4&-1\\10&-3\end{pmatrix} konjugiert sind, die Matrix C=(4113)C=\begin{pmatrix}4&-1\\1&-3\end{pmatrix} hingegen nicht.

Solution

Wir berechnen die Eigenwerte über det(MλE)=0\det(M-\lambda E)=0:

  • Für AA: (1λ)(λ)2=λ2λ2=(λ2)(λ+1)=0    λ1=2,λ2=1(1-\lambda)(-\lambda)-2 = \lambda^2-\lambda-2 = (\lambda-2)(\lambda+1)=0 \implies \lambda_1=2, \lambda_2=-1.
  • Für BB: (4λ)(3λ)(10)=λ2λ2=0    λ1=2,λ2=1(4-\lambda)(-3-\lambda)-(-10) = \lambda^2-\lambda-2=0 \implies \lambda_1=2, \lambda_2=-1.
  • Für CC: (4λ)(3λ)(1)=λ2λ11=0(4-\lambda)(-3-\lambda)-(-1) = \lambda^2-\lambda-11=0. Die Diskriminante ist 4545, keine ganzzahligen Lösungen wie bei A/B.

Da AA und BB dieselben Eigenwerte haben, sind sie konjugiert. CC hat andere Eigenwerte und ist nicht konjugiert.

Klassifikation und Diagonalisierung

Die Tatsache, dass Eigenwerte und Eigenvektoren invariant bleiben, führt zu einer Klassifikation. Wir betrachten hier den Fall mit zwei verschiedenen Eigenwerten.

Definition 2: Diagonalmatrix

Eine Diagonalmatrix ist eine quadratische Matrix, in der nur in der Hauptdiagonalen Werte stehen, die verschieden von Null sind. An allen anderen Stellen stehen lauter Nullen.

Besitzt die Matrix AA einer Ursprungsaffinität α\alpha die verschiedenen Eigenwerte λ1λ2\lambda_1 \neq \lambda_2 und damit auch zwei linear unabhängige Eigenvektoren v1\vec{v}_1 und v2\vec{v}_2, so werden alle Punkte auf der Fixgeraden g1g_1 bzw. g2g_2 mit dem entsprechenden Faktor λ1\lambda_1 bzw. λ2\lambda_2 zentrisch vom Ursprung aus gestreckt. Eine solche affine Abbildung wird Euler-Affinität genannt.

Wäre {v1,v2}\{\vec{v}_1,\vec{v}_2\} die Basis unseres Koordinatensystems, so hätte die Matrix AA die Diagonalgestalt:

D=(λ100λ2)D = \begin{pmatrix}\lambda_1 & 0 \\ 0 & \lambda_2\end{pmatrix}

Für eine Matrix wie oben definiert kann mit Hilfe eines Basiswechsels diese interpretationsfreundliche Situation geschaffen werden. Die Matrix AA kann durch Überführen der Eigenvektoren in die Standardbasis (Matrix X1X^{-1}), Anwenden der Diagonalmatrix DD und Rücktransformation (Matrix XX) ausgedrückt werden:

A=XDX1.A = X \cdot D \cdot X^{-1}.

Die Spaltenvektoren des Basiswechsels XX entsprechen dabei gerade den Eigenvektoren v1,v2\vec{v}_1, \vec{v}_2.

Theorem 2: Diagonalisierungs-Kriterium

Besitzt die Matrix AA zwei verschiedene Eigenwerte mit den Eigenvektoren v1,v2\vec{v}_1, \vec{v}_2, so lässt sie sich durch die Matrix X=(v1,v2)X=(\vec{v}_1, \vec{v}_2) diagonalisieren:

D=X1AX.D = X^{-1} \cdot A \cdot X.
Proof

Angenommen, AA sei eine 2×22 \times 2-Matrix mit zwei verschiedenen Eigenwerten λ1λ2\lambda_1 \neq \lambda_2. Die zugehörigen Eigenvektoren v1,v2\vec{v}_1, \vec{v}_2 sind linear unabhängig und bilden daher eine Basis.

Sei X:=(v1 v2)X := (\vec{v}_1 \ \vec{v}_2). AA wirkt auf XX spaltenweise:

AX=(Av1 Av2)=(λ1v1 λ2v2)=XD,wobei D=(λ100λ2).A X = (A \vec{v}_1 \ A \vec{v}_2) = (\lambda_1 \vec{v}_1 \ \lambda_2 \vec{v}_2) = X \cdot D, \quad \text{wobei } D = \begin{pmatrix} \lambda_1 & 0 \\ 0 & \lambda_2 \end{pmatrix}.

Multipliziert man von links mit X1X^{-1}, folgt X1AX=DX^{-1} A X = D.

Exercise 3: Lineare Unabhängigkeit von Eigenvektoren

Zeige: Besitzt eine lineare Abbildung zwei verschiedene Eigenwerte, so sind die zugehörigen Eigenvektoren linear unabhängig.

Solution

Wären v1,v2\vec{v}_1, \vec{v}_2 linear abhängig, also v1=cv2\vec{v}_1 = c \vec{v}_2, dann würde gelten: Av1=λ1v1=λ1cv2A\vec{v}_1 = \lambda_1 \vec{v}_1 = \lambda_1 c \vec{v}_2. Gleichzeitig gilt wegen der Linearität: A(cv2)=cAv2=cλ2v2A(c\vec{v}_2) = c A\vec{v}_2 = c \lambda_2 \vec{v}_2. Daraus folgt c(λ1λ2)v2=0c(\lambda_1 - \lambda_2)\vec{v}_2 = \vec{0}. Da c0c \neq 0 und v20\vec{v}_2 \neq \vec{0}, müsste λ1=λ2\lambda_1 = \lambda_2 sein; Widerspruch.

Exercise 4: Diagonalisiere

Diagonalisiere die Matrix

A=(1.51.511)A=\begin{pmatrix}1.5 & 1.5 \\ 1 & 1\end{pmatrix}

und bestimme die Transformationsmatrix XX.

Solution
  1. Eigenwerte bestimmen: det(AλE)=(1.5λ)(1λ)1.5=λ22.5λ=λ(λ2.5)=0\det(A-\lambda E) = (1.5-\lambda)(1-\lambda) - 1.5 = \lambda^2 - 2.5\lambda = \lambda(\lambda - 2.5) = 0. Eigenwerte: λ1=0\lambda_1 = 0, λ2=2.5\lambda_2 = 2.5.
  2. Eigenvektoren bestimmen:
    • Zu λ1=0\lambda_1=0: 1.5x+1.5y=0    x=y    v1=(11)1.5x + 1.5y = 0 \implies x=-y \implies \vec{v}_1 = \begin{pmatrix} 1 \\ -1 \end{pmatrix}.
    • Zu λ2=2.5\lambda_2=2.5: (1.52.5)x+1.5y=x+1.5y=0    x=1.5y    v2=(32)(1.5-2.5)x + 1.5y = -x + 1.5y = 0 \implies x=1.5y \implies \vec{v}_2 = \begin{pmatrix} 3 \\ 2 \end{pmatrix}.
  3. Matrizen aufstellen: X=(1312),D=(0002.5).X = \begin{pmatrix} 1 & 3 \\ -1 & 2 \end{pmatrix}, \quad D = \begin{pmatrix} 0 & 0 \\ 0 & 2.5 \end{pmatrix}.

Anwendungen: Potenzieren und Folgen

Potenzieren von Matrizen

Müssen Matrizen potenziert werden, ist dies oft mühsam. Ein Lösungsansatz liefert die Diagonalisierung. Ist AA diagonalisierbar (A=XDX1A = X D X^{-1}), so gilt:

An=(XDX1)n=XDnX1=X(λ1n00λ2n)X1A^n = (X D X^{-1})^n = X D^n X^{-1} = X \begin{pmatrix} \lambda_1^n & 0 \\ 0 & \lambda_2^n \end{pmatrix} X^{-1}
Exercise 5: Verkehrszählung

Das Verhalten von Pendlern (Auto vs. ÖV) wird durch die Matrix A=(0.60.20.40.8)A = \begin{pmatrix}0.6 & 0.2 \\ 0.4 & 0.8\end{pmatrix} beschrieben. Berechne die Verteilung nach 10 Jahren (A10A^{10}).

Solution

Eigenwerte: λ21.4λ+0.4=0    (λ1)(λ0.4)=0\lambda^2 - 1.4\lambda + 0.4 = 0 \implies (\lambda-1)(\lambda-0.4)=0. λ1=1\lambda_1 = 1 (stationärer Zustand), λ2=0.4\lambda_2 = 0.4. D=(1000.4)D = \begin{pmatrix} 1 & 0 \\ 0 & 0.4 \end{pmatrix}. A10=X(110000.410)X1X(1000)X1A^{10} = X \begin{pmatrix} 1^{10} & 0 \\ 0 & 0.4^{10} \end{pmatrix} X^{-1} \approx X \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix} X^{-1}.

Exercise 6: Matrix hoch 20

Berechne die 20. Potenz der Matrix

A=(2212).A = \begin{pmatrix}2&2\\ -1&-2\end{pmatrix}.
Solution

Spur ist 0, Determinante ist -2. λ22=0    λ=±2\lambda^2 - 2 = 0 \implies \lambda = \pm\sqrt{2}. Das Quadrieren der Matrix ergibt:

A2=(2212)(2212)=(2002)=2E.A^2 = \begin{pmatrix}2 & 2\\ -1 & -2\end{pmatrix} \cdot \begin{pmatrix}2 & 2\\ -1 & -2\end{pmatrix} = \begin{pmatrix}2 & 0\\ 0 & 2\end{pmatrix} = 2 \cdot E.

Daraus folgt einfach:

A20=(A2)10=(2E)10=210E=(1024001024).A^{20} = (A^2)^{10} = (2 \cdot E)^{10} = 2^{10} \cdot E = \begin{pmatrix}1024 & 0\\0 & 1024\end{pmatrix}.

Explizite Bildungsgesetze für Folgen

Das Finden von expliziten Bildungsgesetzen bei rekursiv definierten Folgen kann elegant über Matrizen hergeleitet werden.

Exercise 7: Fibonacci-Folge

Die Fibonacci-Zahlen sind definiert durch Fk=Fk1+Fk2F_k = F_{k-1} + F_{k-2} mit F0=0,F1=1F_0=0, F_1=1. Wie lautet das explizite Gesetz?

Solution

Rekursionsmatrix M=(1110)M = \begin{pmatrix}1 & 1\\ 1 & 0\end{pmatrix}. Eigenwerte sind Φ=1+52\Phi = \frac{1+\sqrt{5}}{2} und ψ=152\psi = \frac{1-\sqrt{5}}{2}. Durch Diagonalisierung erhält man die Formel von Binet:

Fk=15(Φkψk).F_k = \frac{1}{\sqrt{5}} \left( \Phi^k - \psi^k \right).
Exercise 8: Lucas-Folge

Zeige, dass die rekursiv definierte Folge ak=3ak12ak2a_k = 3a_{k-1} - 2a_{k-2} mit a1=0a_1 = 0 und a2=1a_2 = 1 das explizite Bildungsgesetz ak=2k11a_k = 2^{k-1} - 1 hat.

Solution

Rekursionsmatrix M=(3210)M = \begin{pmatrix}3 & -2\\1 & 0\end{pmatrix}. Eigenwerte: λ23λ+2=0    (λ1)(λ2)=0\lambda^2 - 3\lambda + 2 = 0 \implies (\lambda-1)(\lambda-2)=0. λ1=2,λ2=1\lambda_1 = 2, \lambda_2 = 1. Allgemeiner Ansatz: ak=c12k+c21ka_k = c_1 \cdot 2^k + c_2 \cdot 1^k. Einsetzen der Startwerte liefert c1=0.5c_1 = 0.5 und c2=1c_2 = -1. ak=0.52k1=2k11a_k = 0.5 \cdot 2^k - 1 = 2^{k-1} - 1.

Exercise 9: 🧩

Versuche eine allgemeine, explizite Formel für Folgen der Art ak=pak1+qak2a_k = p \cdot a_{k-1} + q \cdot a_{k-2} herzuleiten.

Solution

Die Matrix A=(pq10)A = \begin{pmatrix} p & q \\ 1 & 0 \end{pmatrix} hat die Eigenwerte λ1,2=p±p2+4q2\lambda_{1,2} = \frac{p \pm \sqrt{p^2 + 4q}}{2}. Falls λ1λ2\lambda_1 \neq \lambda_2, lässt sich die Folge schreiben als ak=αλ1k+βλ2ka_k = \alpha \lambda_1^k + \beta \lambda_2^k. Die Konstanten α,β\alpha, \beta werden durch das Gleichungssystem der Startwerte bestimmt.

Weitere Eigenschaften von Matrizen

Exercise 10: Inversenregel

Zeige für invertierbare Matrizen A,BA, B: (AB)1=B1A1(A \cdot B)^{-1} = B^{-1} \cdot A^{-1}.

Solution

Wir prüfen, ob das Produkt mit der vermuteten Inversen die Einheitsmatrix ergibt:

(AB)(B1A1)=A(BB1)A1=AEA1=AA1=E.(AB)(B^{-1}A^{-1}) = A(B B^{-1})A^{-1} = A E A^{-1} = A A^{-1} = E.

Da das Inverse eindeutig ist, gilt die Behauptung.

Definition 3: Symmetrische Matrix

Eine Matrix AA heißt symmetrisch, wenn a12=a21a_{12} = a_{21} (bzw. A=ATA = A^T).

Exercise 11: Symmetrie und Orthogonalität

a) Zeige für die symmetrische Matrix A=(1222)A=\begin{pmatrix}1 & 2 \\ 2 & -2\end{pmatrix}, dass ihre Eigenvektoren senkrecht aufeinander stehen.

b) Beweise die Behauptung allgemein.

c) Zeige die Umkehrung.

Solution

a) Eigenwerte: λ1=2,λ2=3\lambda_1=2, \lambda_2=-3. Eigenvektoren v1=(21)\vec{v}_1 = \begin{pmatrix}2\\1\end{pmatrix} und v2=(12)\vec{v}_2 = \begin{pmatrix}1\\-2\end{pmatrix}. Skalarprodukt: 2(1)+1(2)=02(1) + 1(-2) = 0. \checkmark

b) Seien A=ATA=A^T und λμ\lambda \neq \mu Eigenwerte mit Eigenvektoren v,wv, w.

λ(vw)=(λv)Tw=(Av)Tw=vTATw=vTAw=vT(Aw)=vT(μw)=μ(vw).\lambda (v \cdot w) = (\lambda v)^T w = (Av)^T w = v^T A^T w = v^T A w = v^T (Aw) = v^T (\mu w) = \mu (v \cdot w).

Also (λμ)(vw)=0    vw=0(\lambda - \mu)(v \cdot w) = 0 \implies v \cdot w = 0.

c) Wenn X=(v1,v2)X = (\vec{v}_1, \vec{v}_2) orthogonale Spalten hat, ist XX eine Orthogonalmatrix, also X1=XTX^{-1} = X^T. Aus A=XDX1=XDXTA = X D X^{-1} = X D X^T folgt AT=(XDXT)T=XDTXT=XDXT=AA^T = (X D X^T)^T = X D^T X^T = X D X^T = A.