Eigenwertproblem

In dieser Scherung der Mona Lisa wurde das Bild so verformt, dass der rote Pfeil (Vektor) seine Richtung (entlang der vertikalen Achse) nicht geändert hat, der blaue Pfeil jedoch schon. Der rote Vektor ist ein Eigenvektor der Scherabbildung, während der blaue Vektor dies aufgrund seiner Richtungsänderung nicht ist. Da der rote Vektor nicht skaliert wird, ist sein zugehöriger Eigenwert 1.

Ein Eigenvektor einer Abbildung ist in der linearen Algebra ein vom Nullvektor verschiedener Vektor, dessen Richtung durch die Abbildung nicht verändert wird. Ein Eigenvektor wird also nur skaliert und man bezeichnet den Skalierungsfaktor als Eigenwert der Abbildung.

Eigenwerte charakterisieren wesentliche Eigenschaften linearer Abbildungen, etwa ob ein entsprechendes lineares Gleichungssystem eindeutig lösbar ist oder nicht. In vielen Anwendungen beschreiben Eigenwerte auch physikalische Eigenschaften eines mathematischen Modells. Die Verwendung der Vorsilbe „Eigen-“ für charakteristische Größen in diesem Sinne lässt sich auf eine Veröffentlichung von David Hilbert aus dem Jahre 1904 zurückführen und wird als Germanismus auch in einigen weiteren Sprachen, darunter dem Englischen, verwendet.

Die im Folgenden beschriebene mathematische Problemstellung heißt spezielles Eigenwertproblem und bezieht sich nur auf lineare Abbildungen eines endlichdimensionalen Vektorraums in sich (Endomorphismen), wie sie durch quadratische Matrizen dargestellt werden.

Hierbei stellt sich die Frage, unter welchen Bedingungen eine Matrix ähnlich zu einer Diagonalmatrix ist.

Definition

Ist V ein Vektorraum über einem Körper K (in Anwendungen meist der Körper \mathbb {R} der reellen Zahlen oder der Körper {\displaystyle \mathbb {C} } der komplexen Zahlen) und f\colon V\to V eine lineare Abbildung von V in sich selbst (Endomorphismus), so bezeichnet man als Eigenvektor einen Vektor v\neq 0, der durch f auf ein Vielfaches \lambda \,v von sich selbst mit \lambda \in K abgebildet wird:

f(v)=\lambda \,v

Den Faktor \lambda nennt man dann den zugehörigen Eigenwert.

Anders formuliert: Hat für ein \lambda \in K die Gleichung

f(v)=\lambda \,v

eine Lösung v\neq 0 (der Nullvektor ist natürlich immer eine Lösung), so heißt \lambda Eigenwert von f. Jede Lösung v\neq 0 heißt Eigenvektor von \lambda .

Hat der Vektorraum eine endliche Dimension \operatorname {dim} (V)=n\in \mathbb {N} , so kann jeder Endomorphismus f durch eine quadratische {\displaystyle \left(n\times n\right)}-Matrix A beschrieben werden. Die obige Gleichung lässt sich dann als Matrizengleichung

A\cdot x=\lambda \,x

schreiben, wobei x hier einen Spaltenvektor bezeichnet. Man nennt in diesem Fall eine Lösung x\neq 0 Eigenvektor und \lambda Eigenwert der Matrix A.

Diese Gleichung kann man auch in der Form

A\cdot x=\lambda \,E\cdot x

schreiben, wobei E die Einheitsmatrix bezeichnet, und äquivalent zu

(A-\lambda E)\cdot x=0

oder

(\lambda E-A)\cdot x=0

umformen.

Berechnung der Eigenwerte

Bei kleinen Matrizen können die Eigenwerte symbolisch (exakt) berechnet werden. Bei großen Matrizen ist dies oft nicht möglich, sodass hier Verfahren der numerischen Mathematik zum Einsatz kommen.

Symbolische Berechnung

Die Gleichung

(A-\lambda E)\cdot x=0

definiert die Eigenwerte und stellt ein homogenes lineares Gleichungssystem dar.
Da x\neq 0 vorausgesetzt wird, ist dieses genau dann lösbar, wenn

{\displaystyle \det(A-\lambda E)=0}

gilt. Diese Determinante heißt „charakteristisches Polynom“. Es handelt sich um ein normiertes Polynom n-ten Grades in \lambda . Seine Nullstellen, also die Lösungen der Gleichung

\lambda ^{n}+\alpha _{n-1}\cdot \lambda ^{n-1}+\dotsb +\alpha _{1}\cdot \lambda +\alpha _{0}=0

über K, sind die Eigenwerte. Da ein Polynom vom Grad n höchstens n Nullstellen hat, gibt es auch höchstens n Eigenwerte. Zerfällt das Polynom vollständig in Linearfaktoren, so gibt es genau n Nullstellen, wobei mehrfache Nullstellen mit ihrer Vielfachheit gezählt werden. Ist der Grad n eine ungerade Zahl und gilt K=\mathbb {R} , dann ist mindestens einer der Eigenwerte reell.

Eigenraum zum Eigenwert

Ist \lambda ein Eigenwert der linearen Abbildung f\colon V\to V, dann nennt man die Menge aller Eigenvektoren zu diesem Eigenwert vereinigt mit dem Nullvektor den Eigenraum zum Eigenwert \lambda . Der Eigenraum ist durch

{\displaystyle \mathrm {Eig} (f,\lambda ):=\{v\in V\,\mid \,f(v)=\lambda \cdot v\}}

definiert. Falls die Dimension des Eigenraums größer als 1 ist, wenn es also mehr als einen linear unabhängigen Eigenvektor zum Eigenwert \lambda gibt, so nennt man den zum Eigenraum zugehörigen Eigenwert entartet. Die Dimension des Eigenraums \mathrm {Eig} \left(f,\lambda \right) wird als geometrische Vielfachheit von \lambda bezeichnet.

Eine Verallgemeinerung des Eigenraums ist der Hauptraum.

Spektrum und Vielfachheiten

Für den Rest dieses Abschnittes sei {\displaystyle K=\mathbb {C} .} Dann besitzt jede \left(n\times n\right){\text{-Matrix }}A genau n Eigenwerte, wenn man diese mit ihren Vielfachheiten zählt. Mehrfaches Vorkommen eines bestimmten Eigenwertes fasst man zusammen und erhält so nach Umbenennung die Aufzählung {\displaystyle \lambda _{1},\dotsc ,\lambda _{k}} der verschiedenen Eigenwerte mit ihren Vielfachheiten {\displaystyle \mu _{1},\dotsc ,\mu _{k}.} Dabei ist 1\leq k\leq n und \textstyle \sum _{i=1}^{k}\mu _{i}=n.

Die eben dargestellte Vielfachheit eines Eigenwertes als Nullstelle des charakteristischen Polynoms bezeichnet man als algebraische Vielfachheit. Eigenwerte der algebraischen Vielfachheit 1 werden als einfacher Eigenwert bezeichnet.

Die Menge der Eigenwerte wird Spektrum genannt und \sigma \left(A\right) geschrieben, sodass also

\sigma (A)=\{\lambda \in \mathbb {C} \,|\,\exists x\neq 0\colon Ax=\lambda x\}

gilt. Als Spektralradius bezeichnet man den größten Betrag aller Eigenwerte.

Gilt für einen Eigenwert, dass seine algebraische Vielfachheit gleich seiner geometrischen Vielfachheit ist, so spricht man von einem halbeinfachen Eigenwert (aus dem englischen ‚semisimple‘). Dies entspricht genau der Diagonalisierbarkeit der Blockmatrix zum gegebenen Eigenwert.

Kennt man die Eigenwerte sowie ihre algebraischen und geometrischen Vielfachheiten (siehe unten), kann man die Jordansche Normalform der Matrix erstellen.

Beispiel

Es sei die quadratische Matrix

A={\begin{pmatrix}0&2&-1\\2&-1&1\\2&-1&3\end{pmatrix}}

gegeben. Subtraktion der mit \lambda multiplizierten Einheitsmatrix von A ergibt:

A-\lambda E={\begin{pmatrix}0-\lambda &2&-1\\2&-1-\lambda &1\\2&-1&3-\lambda \end{pmatrix}}

Ausrechnen der Determinante dieser Matrix (mit Hilfe der Regel von Sarrus) liefert:

{\displaystyle {\begin{matrix}\det(A-\lambda E)&=&(0-\lambda )(-1-\lambda )(3-\lambda )+4+2-(2\lambda +2+\lambda +12-4\lambda )\\&=&-\lambda ^{3}+2\lambda ^{2}+4\lambda -8\\&=&-(\lambda -2)(\lambda -2)(\lambda +2)\end{matrix}}}

Die Eigenwerte sind die Nullstellen dieses Polynoms, man erhält:

\lambda _{1,2}=2,\ \lambda _{3}=-2

Der Eigenwert 2 hat algebraische Vielfachheit 2, weil er doppelte Nullstelle des charakteristischen Polynoms ist.

Numerische Berechnung

Während die exakte Berechnung der Nullstellen des charakteristischen Polynoms schon für dreireihige Matrizen nicht so einfach ist, wird sie für große Matrizen meist unmöglich, sodass man sich dann auf das Bestimmen von Näherungswerten beschränkt. Hierzu werden Verfahren bevorzugt, die sich durch numerische Stabilität und geringen Rechenaufwand auszeichnen. Dazu gehören Methoden für dichtbesetzte kleine bis mittlere Matrizen, wie

sowie spezielle Methoden für symmetrische Matrizen als auch Methoden für dünnbesetzte große Matrizen wie

Des Weiteren gibt es noch Methoden zur Abschätzung, z.B. mithilfe

die immer eine grobe Abschätzung (unter gewissen Bedingungen sogar genaue Bestimmung) zulassen.

Berechnung der Eigenvektoren

Algorithmus

Für einen Eigenwert \lambda lassen sich die Eigenvektoren aus der Gleichung

(A-\lambda E)\cdot x=0

bestimmen. Die Eigenvektoren spannen den Eigenraum auf, dessen Dimension als geometrische Vielfachheit des Eigenwertes bezeichnet wird. Für einen Eigenwert \lambda der geometrischen Vielfachheit \mu lassen sich also \mu linear unabhängige Eigenvektoren {\displaystyle x_{1},\dotsc ,x_{\mu }} finden, sodass die Menge aller Eigenvektoren zu \lambda > gleich der Menge der Linearkombinationen von {\displaystyle x_{1},\dotsc ,x_{\mu }} ist. Die Menge {\displaystyle \left\{x_{1},\dotsc ,x_{\mu }\right\}} heißt dann eine Basis aus Eigenvektoren des zum Eigenwert \lambda gehörenden Eigenraumes.

Die geometrische Vielfachheit eines Eigenwertes kann man also auch als die maximale Anzahl linear unabhängiger Eigenvektoren zu diesem Eigenwert definieren.

Die geometrische Vielfachheit ist höchstens gleich der algebraischen Vielfachheit.

Beispiel

Gegeben ist wie in obigem Beispiel die quadratische Matrix

A={\begin{pmatrix}0&2&-1\\2&-1&1\\2&-1&3\end{pmatrix}}.

Die Eigenwerte {\displaystyle \lambda _{1,2}=2,\,\lambda _{3}=-2} wurden oben schon berechnet. Zunächst werden hier die Eigenvektoren (und der durch die Eigenvektoren aufgespannte Eigenraum) zum Eigenwert \lambda =2 berechnet:

A-2\cdot E={\begin{pmatrix}-2&2&-1\\2&-3&1\\2&-1&1\end{pmatrix}}

Man muss also das folgende lineare Gleichungssystem lösen:

{\begin{pmatrix}-2&2&-1\\2&-3&1\\2&-1&1\end{pmatrix}}\cdot x={\begin{pmatrix}0\\0\\0\end{pmatrix}}

Bringt man die Matrix auf obere Dreiecksform, so erhält man:

{\displaystyle {\begin{pmatrix}1&0&{\frac {1}{2}}\\0&1&0\\0&0&0\end{pmatrix}}\cdot x={\begin{pmatrix}0\\0\\0\end{pmatrix}}}

Die gesuchten Eigenvektoren sind alle Vielfachen des Vektors x={\begin{pmatrix}{\frac {1}{2}},&0,&-1\end{pmatrix}}^{\top } (jedoch nicht das Nullfache des Vektors, da der Nullvektor niemals ein Eigenvektor ist).

Obwohl der Eigenwert \lambda =2 eine algebraische Vielfachheit von 2 hat, existiert nur ein linear unabhängiger Eigenvektor (der Eigenraum zu dem Eigenwert ist eindimensional); also hat dieser Eigenwert eine geometrische Vielfachheit von 1. Das hat eine wichtige Konsequenz: Die Matrix ist nicht diagonalisierbar. Man kann nun versuchen, die Matrix stattdessen in die Jordansche Normalform überzuführen. Dazu muss ein weiterer Eigenvektor zu diesem Eigenwert „erzwungen“ werden. Solche Eigenvektoren nennt man generalisierte Eigenvektoren oder Hauptvektoren.

Für den Eigenwert \lambda =-2 geht man genauso vor:

{\begin{pmatrix}2&2&-1\\2&1&1\\2&-1&5\end{pmatrix}}\cdot x={\begin{pmatrix}0\\0\\0\end{pmatrix}}

Wieder bringt man die Matrix auf Dreiecksform:

{\begin{pmatrix}1&0&{\frac {3}{2}}\\0&1&-2\\0&0&0\end{pmatrix}}\cdot x={\begin{pmatrix}0\\0\\0\end{pmatrix}}

Hier ist die Lösung der Vektor {\begin{pmatrix}{\frac {3}{2}},&-2,&-1\end{pmatrix}}^{\top }, wieder mit allen seinen vom Nullvektor verschiedenen Vielfachen.

Eigenschaften

{\displaystyle \sum _{i=1}^{n}\lambda _{i}=\operatorname {Spur} A\quad {\text{und}}\quad \prod _{i=1}^{n}\lambda _{i}=\operatorname {det} \;A\,,}
wobei bei mehrfachen Eigenwerten die Vielfachheit zu beachten ist. Hier bezeichnet {\displaystyle \operatorname {Spur} A} die Spur der Matrix A.
\sigma \left(A\right)=\sigma \left(A^{\top }\right).
Analog gilt
\sigma \left(A^{*}\right)=\sigma \left({\overline {A}}\right)={\overline {\sigma \left(A\right)}}.

Speziell für reelle symmetrische oder komplexe hermitesche Matrizen gilt:

{\displaystyle |v_{ij}|^{2}\prod _{k=1;k\neq i}^{n}{\big (}\lambda _{i}-\lambda _{k}{\big )}=\prod _{k=1}^{n-1}{\big (}\lambda _{i}-\mu _{jk}{\big )}}

Eigenvektoren kommutierender Matrizen

Für kommutierende diagonalisierbare (insbesondere symmetrische) Matrizen ist es möglich, ein System gemeinsamer Eigenvektoren zu finden:

Kommutieren zwei Matrizen A und B (gilt also AB=BA) und ist \lambda ein nichtentarteter Eigenwert (d.h., der zugehörige Eigenraum ist eindimensional) von A mit Eigenvektor v, so gilt

ABv=BAv=\lambda Bv.

Auch Bv ist also ein Eigenvektor von A zum Eigenwert \lambda . Da dieser Eigenwert nicht entartet ist, muss Bv ein Vielfaches von v sein. Das bedeutet, dass v auch ein Eigenvektor der Matrix B ist.

Aus diesem einfachen Beweis geht hervor, dass die Eigenvektoren zu nichtentarteten Eigenwerten mehrerer paarweise kommutierender Matrizen Eigenvektoren aller dieser Matrizen sind.

Allgemein können auch für kommutierende diagonalisierbare Matrizen mit entarteten Eigenwerten gemeinsame Eigenvektoren gefunden werden. Aus diesem Grund können mehrere paarweise kommutierende diagonalisierbare Matrizen auch simultan (d.h. mit einer Basistransformation für alle Matrizen) diagonalisiert werden.

Linkseigenvektoren und verallgemeinertes Eigenwertproblem

Manchmal bezeichnet man einen so definierten Eigenvektor auch als Rechtseigenvektor und definiert dann entsprechend den Begriff des Linkseigenvektors durch die Gleichung

x^{\top }\cdot A=\lambda \,x^{\top }.

Linkseigenvektoren finden sich z.B. in der Stochastik bei der Berechnung von stationären Verteilungen von Markow-Ketten mittels einer Übergangsmatrix.

Wegen x^{\top }\cdot A=(A^{\top }\cdot x)^{\top } sind die Linkseigenvektoren von A gerade die Rechtseigenvektoren der transponierten Matrix A^{\top }. Bei normalen Matrizen fallen Links- und Rechtseigenvektoren zusammen.

Allgemeiner kann man auch quadratische Matrizen A und B und die Gleichung

A\cdot x=\lambda \,B\cdot x

untersuchen. Dieses verallgemeinerte Eigenwertproblem wird hier jedoch nicht weiter betrachtet.

Spektraltheorie in der Funktionalanalysis

Hauptartikel: Spektraltheorie

Eigenwerte und Eigenfunktionen

In der Funktionalanalysis betrachtet man lineare Abbildungen zwischen linearen Funktionenräumen (also lineare Abbildungen zwischen unendlichdimensionalen Vektorräumen). Meistens spricht man von linearen Operatoren anstatt von linearen Abbildungen. Sei V ein Vektorraum über einem Körper K mit \dim(V)=\infty und A ein linearer Operator. In der Funktionalanalysis ordnet man A ein Spektrum zu. Dieses besteht aus allen \lambda \in K, für die der Operator A-\lambda \operatorname {Id} nicht invertierbar ist. Dieses Spektrum muss jedoch nicht – wie bei Abbildungen zwischen endlichdimensionalen Vektorräumen – diskret sein. Denn im Gegensatz zu den linearen Abbildungen zwischen endlichdimensionalen Vektorräumen, die nur n\in \mathbb {N} verschiedene Eigenwerte haben, haben lineare Operatoren im Allgemeinen unendlich viele Elemente im Spektrum. Daher ist es zum Beispiel möglich, dass das Spektrum von linearen Operatoren Häufungspunkte besitzt. Um die Untersuchung des Operators und des Spektrums zu vereinfachen, unterteilt man das Spektrum in unterschiedliche Teilspektren. Elemente, die die Gleichung Ax-\lambda \operatorname {Id} x=0 für ein x\neq 0 lösen, nennt man wie in der linearen Algebra Eigenwerte. Die Gesamtheit der Eigenwerte nennt man das Punktspektrum von A. Wie in der linearen Algebra wird jedem Eigenwert ein Raum von Eigenvektoren zugeordnet. Da die Eigenvektoren meist als Funktionen aufgefasst werden, spricht man auch von Eigenfunktionen.

Beispiel

Sei \Omega \subset \mathbb {R} offen. Dann besitzt der Ableitungsoperator {\displaystyle {\tfrac {\mathrm {d} }{\mathrm {d} x}}\colon C^{\infty }(\Omega ,\mathbb {C} )\to C^{\infty }(\Omega ,\mathbb {C} )} ein nichtleeres Punktspektrum. Betrachtet man nämlich für alle x\in \Omega die Gleichung

{\displaystyle {\frac {\mathrm {d} f}{\mathrm {d} x}}(x)=\lambda f(x)}

und wählt f(x)=e^{\lambda x}, dann sieht man, dass die Gleichung {\displaystyle {\tfrac {\mathrm {d} }{\mathrm {d} x}}e^{\lambda x}=\lambda e^{\lambda x}} für alle {\displaystyle \lambda \in \mathbb {C} } erfüllt ist. Also ist jedes {\displaystyle \lambda \in \mathbb {C} } ein Eigenwert mit zugehöriger Eigenfunktion e^{\lambda x}.

Praktische Beispiele

Durch Lösung eines Eigenwertproblems berechnet man

Eigenwerte spielen in der Quantenmechanik eine besondere Rolle. Physikalische Größen wie z.B. der Drehimpuls werden hier durch Operatoren repräsentiert. Messbar sind nur die Eigenwerte der Operatoren. Hat z.B. der Hamiltonoperator, der die Energie eines quantenmechanischen Systems repräsentiert, ein diskretes Spektrum, so kann die Energie nur diskrete Werte annehmen, was z.B. für die Energieniveaus in einem Atom typisch ist. So stellen bei den Lösungen der bekannten Schrödingergleichung (im Jahr 1926 durch den Physiker Erwin Schrödinger aufgestellt) die Eigenwerte die erlaubten Energiewerte der Elektronen und die Eigenfunktionen die zugehörigen Wellenfunktionen der Elektronen dar.

Auch die Unmöglichkeit der gleichzeitigen präzisen Messung gewisser Größen (z.B. von Ort und Impuls), wie von der Heisenbergschen Unschärferelation ausgedrückt, ist letztlich darauf zurückzuführen, dass für die jeweiligen Operatoren kein gemeinsames System von Eigenvektoren existiert.

Literatur

Trenner
Basierend auf einem Artikel in: Wikipedia.de
Seitenende
Seite zurück
©  biancahoegel.de
Datum der letzten Änderung: Jena, den: 21.12. 2023