Lanczos-Verfahren
Das Lanczos-Verfahren (nach Cornelius Lanczos) ist sowohl ein iterativer Algorithmus zur Bestimmung einiger Eigenwerte und eventuell der zugehörigen Eigenvektoren einer Matrix als auch ein iterativer Algorithmus zur approximativen Lösung eines linearen Gleichungssystems. Der Algorithmus für Eigenwerte konvergiert am schnellsten gegen die gut von den anderen Eigenwerten separierten, meist gegen die betragsgrößten Eigenwerte. Der Algorithmus für lineare Gleichungssysteme ist im allgemeinen Fall dem BiCG-Verfahren und für spezielle Matrizen dem CG-Verfahren mathematisch äquivalent.
Allgemeines
Das Verfahren der minimierten Iterierten, wie Lanczos es in seinen
Originalarbeiten aus den Jahren 1950 (Eigenwerte) und 1952 (lineare
Gleichungssysteme) nannte, basiert auf Projektionen
auf Krylow-Unterräume.
Je nach den Eigenschaften der Matrix, deren Eigenwerte berechnet werden sollen,
werden ein oder zwei Krylow-Unterräume aufgespannt. Das generelle Verfahren
basiert auf zwei Krylow-Unterräumen
und
,
wobei die zwei Startvektoren
und
biorthogonal
zueinander gewählt werden, also
.
Die Basen der Krylow-Räume werden gegeneinander mittels einer zweiseitigen
Variante des Verfahrens
von Gram-Schmidt biorthogonalisiert.
Eigenwertnäherung
Zur Eigenwertnäherung werden die beiden obengenannten Basen und die schiefe Projektion der gegebenen Matrix, meist auf eine Tridiagonalmatrix, herangezogen. Das resultierende unsymmetrische Lanczos-Verfahren ist nicht immer mittels einer Kurztermrekursion durchführbar. Einen Ausweg stellen die aufgrund der Verbindung zu den formal orthogonalen Polynomen (FOPs) konstruierten Look-ahead-Varianten dar.
Wenn die Matrix
hermitesch
oder gar reell symmetrisch
ist, erzwingt die Wahl von normalisiertem
eine Übereinstimmung der beiden Krylow-Räume und verhindert einen Zusammenbruch
der Biorthogonalisierung, welche jetzt eine Orthogonalisierung darstellt. In
diesem speziellen Fall ist das resultierende symmetrische
Lanczos-Verfahren dem Verfahren
von Arnoldi mathematisch äquivalent, die (einzige) Basis ist eine
Orthogonalbasis und die resultierende orthogonale
Projektion der Matrix ist (in aller Regel) eine hermitesche
Tridiagonalmatrix. Gravierende Unterschiede zwischen dem Arnoldi-Verfahren und
dem symmetrischen Lanczos-Verfahren werden erst bei der Ausführung in endlicher
Genauigkeit, also unter Einfluss von Rundungsfehlern
deutlich.
Varianten
Es existieren auch andere Varianten des Lanczos-Verfahrens, unter anderem eine Variante für das Eigenwertproblem für symplektische Matrizen, welches diese auf sogenannte Butterfly-Form abbildet und eine Variante für komplexe symmetrische Matrizen.
Approximative Lösung von Gleichungssystemen
Lanczos' Verfahren zur approximativen Lösung von Gleichungssystemen wird selten in der ursprünglichen Form verwendet, stattdessen wird es als BiCG-Verfahren oder als CG-Verfahren eingesetzt.
Verwandtschaften und geschichtlicher Kontext
Die beiden von Lanczos veröffentlichten Verfahren sind Krylow-Unterraum-Verfahren. Dieser Sachverhalt, besser, diese Verwandtschaft, wurde bereits vor der ersten Veröffentlichung von Alexander Markowitsch Ostrowski Lanczos kundgetan, wovon eine Fußnote auf der ersten Seite der ersten Veröffentlichung von Lanczos zeugt. Dort steht im Originalartikel:
„The literature available to the author showed no evidence that the methods
and results of the present investigation have been found before. However, A.
M. Ostrowski of the University of Basle and the Institute for Numerical
Analysis informed the author that his method parallels the earlier work of
some Russian scientists: the references given by Ostrowski are: A. Krylov,
Izv. Akad. Nauk SSSR 7, 491 to 539 (1931); N. Luzin, Izv. Akad. Nauk. SSSR 7,
903 to 958 (1931). On the basis of the reviews of these papers in the
Zentralblatt, the author believes that the two methods coincide only in the
point of departure. The author has not, however, read these Russian papers.“
„In der dem Autor zugänglichen Literatur fand sich kein Hinweis darauf, dass die Methoden und Resultate dieser Untersuchung bereits zuvor entdeckt worden waren. Allerdings unterrichtete A. M. Ostrowski von der Universität Basel vom Institut für Numerische Analysis den Autor darüber, dass seine Methode den früheren Arbeiten einiger russischer Wissenschaftler entspricht. Die von Ostrowski gegebenen Referenzen sind: A. Krylov, Izv. Akad. Nauk SSSR 7, 491 bis 539 (1931); N. Luzin, Izv. Akad. Nauk. SSSR 7, 903 bis 958 (1931). Aufgrund der Besprechungen dieser Artikel im Zentralblatt glaubt der Autor, dass die beiden Methoden nur im Ausgangspunkt übereinstimmen. Der Autor hat diese russischen Veröffentlichungen selbst allerdings nie gelesen.“
Eine Darstellung von dem von Krylow entwickelten Verfahren findet sich im Buch von Faddejew und Faddejewa Numerische Methoden der linearen Algebra.
Wenn die Matrix selbstadjungiert (symmetrisch reell oder hermitesch) ist, ist die berechnete Basis orthogonal. Aufbauend auf Lanczos' Arbeit brachte das Walter Edwin Arnoldi auf die Idee, immer eine orthogonale Basis zu erzwingen, was zur Folge hat, dass die projizierte Matrix keine Tridiagonalmatrix mehr, sondern nur noch eine obere Hessenbergmatrix ist. Der resultierende Algorithmus ist das 1951 veröffentlichte Arnoldi-Verfahren.
Das Verfahren ist im allgemeinen Fall dem BiCG-Verfahren und im Falle einer symmetrischen reellen (nicht notwendig positiv definiten) oder hermiteschen (ebenfalls nicht notwendig positiv definiten) Matrix dem kurz darauf veröffentlichten CG-Verfahren von Magnus Rudolph Hestenes und Eduard Stiefel äquivalent. Die Verwandtschaft mit dem CG-Verfahren war auch den beiden Autoren bereits bekannt. Auf Seite 410 (der zweiten Seite) ihrer Veröffentlichung schreiben sie:
„Recently, C. Lanczos developed a closely related routine based on his
earlier paper on eigenvalue problem.“
„Kürzlich entwickelte C. Lanczos ein eng [mit dem CG-Verfahren] verwandtes, auf seiner früheren Veröffentlichung über das Eigenwertproblem basierendes Verfahren.“
Ablauf des Lanczos-Verfahrens bei hermiteschen Matrizen
Obwohl das Lanczos-Verfahren das geringfügig ältere Verfahren ist, lohnt sich
im interessantesten, dem hermiteschen Fall der Vergleich als Spezialfall des Arnoldi-Verfahrens.
Das Arnoldi-Verfahren berechnet bei einer Matrix
nach
Schritten eine Orthonormalbasis
eines Krylow-Unterraums,
für welche gilt
Dabei ist
eine Hessenbergmatrix.
Im hermiteschen Fall mit
ist dann aber auch
hermitesch, also sogar eine hermitesche Tridiagonalmatrix
Betrachtet man nun mit dieser Information die -te
Spalte
von
,
erhält man die einfache Beziehung
Wegen
kann man diese nach den einzigen Unbekannten
auflösen, wobei
wegen
die Norm von
ist. Damit vereinfacht sich der Algorithmus aus dem Artikel Arnoldi-Verfahren mit
einem nichttrivialen Startvektor
zum hermiteschen (symmetrischen) Lanczos-Verfahren
- for
and
do
- end for
Im Vergleich zum allgemeinen Arnoldi-Verfahren,
welches bis zum Schritt
einen quadratisch wachsenden Aufwand von
Operationen alleine für die Orthogonalisierung benötigt, braucht dieser
Algorithmus zusätzlich zu den
Matrix-Vektor-Multiplikationen nur
Operationen, ist also erheblich effizienter. Auch die Berechnung aller
Eigenwerte von
als Approximation an die von
kostet wegen der schnellen Konvergenz des QR-Algorithmus
nur wenig Aufwand.
Allerdings gelten die Aussagen nur bei exakter Rechnung, der Algorithmus ist
anfällig gegen Rundungsfehler. Denn obwohl eine Orthogonalisierung von
im Lanczos-Verfahren nur gegen den vorherigen Basivektor
erfolgt, sind in der Theorie dennoch alle Basisvektoren paarweise orthogonal.
Bei Rechnung mit endlicher Genauigkeit geht diese Orthogonalität allerdings oft
verloren, da sich sozusagen große Eigenwerte von
,
die schon in einer Matrix
repräsentiert sind, über Rundungsfehler nochmal einschleichen und in Matrizen
dann für falsche Geister-Eigenwerte sorgen. Diesen Problemen begegnet man mit
Re-Orthogonalisierungen. Um den Aufwand dabei in Grenzen zu halten, verwendet
man eine selektive Re-Orthogonalisierung gegen einige, schon berechnete,
Näherungs-Eigenvektoren.
Literatur
- Martin Hanke-Bourgeois: Grundlagen der Numerischen Mathematik und des Wissenschaftlichen Rechnens. 3. Auflage, Vieweg+Teubner, Wiesbaden 2009.
- Gene H. Golub, Charles F. Van Loan: Matrix Computations. 3. Auflage. The Johns Hopkins University Press, 1996, ISBN 0-8018-5414-8.



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 24.01. 2024