Frobenius-Normalform

Die Frobenius-Normalform (nach Ferdinand Georg Frobenius) oder rationale Normalform einer quadratischen Matrix A mit Einträgen in einem beliebigen Körper K ist eine transformierte Matrix T^{{-1}}AT (mit invertierbarer Matrix T), die eine spezielle übersichtliche Form hat. „Übersichtlich“ deswegen, weil sich jede Matrix in genau eine Matrix dieser Form transformieren lässt und sich zwei Matrizen daher genau dann ineinander transformieren lassen, wenn sie dieselbe Frobenius-Normalform haben. Wenn das der Fall ist, sagt man auch, die zwei Matrizen seien sich ähnlich, weil sie dieselbe lineare Abbildung bezüglich unterschiedlicher Basen darstellen. Zu jeder linearen Abbildung eines endlichdimensionalen Vektorraums in sich gibt es daher eine Basis, bezüglich deren sie in Frobenius-Normalform dargestellt wird. Es kann mehrere solche Basen geben, die Transformationsmatrix T ist also nicht eindeutig bestimmt.

Die Frobenius-Normalform lässt sich einerseits als Alternative zur jordanschen Normalform auffassen (die ihrerseits eine Verallgemeinerung der Diagonalform ist), wobei nicht mehr vorausgesetzt werden muss, dass das charakteristische Polynom in Linearfaktoren zerfällt. Andererseits charakterisiert das Lemma von Frobenius zueinander ähnliche Matrizen durch die Elementarteiler ihrer charakteristischen Matrizen und liefert die Frobenius-Normalform als Normalform des Vektorraums unter der Operation eines Polynomrings.

Verallgemeinerung der Diagonalisierung

Wenn eine Matrix A\in K^{n\times n} diagonalisierbar ist, zerfällt ihr charakteristisches Polynom f(x)={{\rm {det}}}(xE-A) in lauter Linearfaktoren (x-x_{1})\cdot \ldots \cdot (x-x_{n}) mit Eigenwerten x_{i}\in K. Die zugehörigen Eigenvektoren v_{i} mit (A-x_{i}E)v_{i}=0 bilden eine Basis des Vektorraums K^{n}, in der jeder Basisvektor durch A auf ein Vielfaches von sich abgebildet wird.

Bei einer nicht diagonalisierbaren Matrix A sind nicht genügend Eigenvektoren für eine Basis vorhanden, oder das charakteristische Polynom f=p_{1}\cdot \ldots \cdot p_{l} zerfällt in irreduzible Faktoren p_{i}, die nicht alle Grad 1 haben. Zur Ermittlung der Frobenius-Normalform von A wird dann analog zum letzten Absatz eine Basis aus Vektoren gesucht, die von bestimmten Produkten der irreduziblen Faktoren f_{i}(A)=p_{{j_{1}}}(A)\cdots p_{{j_{k}}}(A) etc. zu null gemacht werden. Es zeigt sich, dass dies möglich ist und man schließlich eine Darstellung f=f_{1}\cdot \ldots \cdot f_{m} erhält, in der f_{1} Teiler von f_{2} ist, f_{2} Teiler von f_{3} usw. Zum Faktor f_{i}=x^{d}+a_{{d-1}}x^{{d-1}}+\cdots +a_{0} gehören dabei die Basisvektoren (v_{i},Av_{i},\ldots ,A^{{d-1}}v_{i}), deren Teilraum wegen f_{i}(A)v_{i}=0=(A^{d}+a_{{d-1}}A^{{d-1}}+\cdots +a_{0}E)v_{i} von A in sich abgebildet wird und auf dem A bezüglich dieser Basisvektoren durch die Matrix

B_{{f_{i}}}={\begin{pmatrix}&&&-a_{0}\\1&&&-a_{1}\\&\ddots &&\vdots \\&&1&-a_{{d-1}}\end{pmatrix}}

dargestellt wird (die nicht angegebenen Einträge in dieser sog. Begleitmatrix zum Polynom f_{i} sind 0). Der gesamte Vektorraum K^{n} zerfällt in solche A-invarianten Teilräume, und A lässt sich insgesamt durch die Blockdiagonalmatrix

{\begin{pmatrix}B_{{f_{1}}}&&\\&\ddots &\\&&B_{{f_{m}}}\end{pmatrix}}

darstellen. Sie ist die Frobenius-Normalform von A.

Ein Nachteil dabei ist, dass die Frobenius-Normalform einer Diagonalmatrix mit Eigenwerten 1 und 2 nicht Diagonalform hat, sondern

B_{{x^{2}-3x+2}}={\begin{pmatrix}0&-2\\1&3\end{pmatrix}}

ist. Abhilfe schafft hier die Weierstraß-Normalform, in der die Begleitmatrix B_{{f_{i}}} in der Blockdiagonalmatrix ersetzt wird durch die Begleitmatrizen der Potenzen verschiedener irreduzibler Faktoren von f_{i}, also etwa durch

{\begin{pmatrix}B_{{p_{1}^{2}}}&\\&B_{{p_{2}}}\end{pmatrix}},

falls f_{i}=p_{1}^{2}p_{2} mit p_{1}\neq p_{2}. Eine Matrix ist genau dann diagonalisierbar, wenn alle diese Faktoren linear sind und keiner in zweiter oder höherer Potenz vorkommt; also ist dann auch ihre Weierstraß-Normalform eine Diagonalmatrix.

Lemma von Frobenius

Die Menge aller Polynome, das sind Ausdrücke der Form h(x)=a_{0}+a_{1}x+\cdots +a_{d}x^{d}, mit Koeffizienten a_{i}\in K, bildet einen Ring, den sog. Polynomring K[x]. Wenn eine Matrix A\in K^{n\times n} vorgegeben ist, kann man ein Produkt aus Polynom h\in K[x] und Vektor u\in K^n definieren durch h(x)\cdot u=h(A)\cdot u, für das die erwarteten Assoziativ- und Distributivgesetze gelten. Man spricht von einer Operation des Polynomrings auf dem Vektorraum, durch die der Vektorraum K^{n} zu einem K[x]-Modul \mathcal A wird.

Nach Wahl einer Basis (u_{1},\ldots ,u_{n}) von K^{n} kann man einen K[x]-Modul-Isomorphismus \beta \colon K[x]^{n}/M\to {\mathcal  A} angeben. Sein Definitionsbereich ist der Faktormodul von K[x]^{n} modulo M=\langle xE-A\rangle , wobei der Ausdruck in spitzen Klammern (in einer ad hoc gewählten Notation) das Erzeugnis der Spalten der charakteristischen Matrix xE-A bezeichnet. Dieser Isomorphismus überträgt die Operation des Polynomrings, d.h., \beta (hg+M)=h\beta (g+M) für h\in K[x], g\in K[x]^{n}, und er ist definiert durch

\beta ({\begin{pmatrix}g_{1}\\\vdots \\g_{n}\end{pmatrix}}+M)=\sum _{{i=1}}^{n}g_{i}(A)u_{i}.

Die charakteristische Matrix xE-A\in K[x]^{{n\times n}} mit Einträgen im Polynomring kann durch den Elementarteileralgorithmus in eine Matrix

P(xE-A)Q={\begin{pmatrix}1&&&&&\\&\ddots &&&&\\&&1&&&\\&&&f_{1}&&\\&&&&\ddots &\\&&&&&f_{m}\end{pmatrix}}

mit invertierbaren P,Q\in K[x]^{{n\times n}} überführt werden, wobei f_{1} Teiler von f_{2} ist, f_{2} Teiler von f_{3} usw., und die Polynome f_{i} führenden Koeffizienten 1 haben. Diese Polynome heißen die Invariantenteiler der charakteristischen Matrix, die Potenzen der irreduziblen Faktoren der f_{i} heißen Elementarteiler, und f=f_{1}\cdot \ldots \cdot f_{m} ist das charakteristische Polynom von A, denn f=\det(xE-A)=\det(P(xE-A)Q) (die Determinante der charakteristischen Matrix ändert sich nicht bei Multiplikation mit den invertierbaren P und Q). f_{m} ist das Minimalpolynom von A.

Wegen der Invertierbarkeit von P und Q ist der K[x]-Modul \mathcal A nun nicht nur isomorph (nämlich durch \beta ) zu K[x]^{n}/\langle xE-A\rangle , sondern auch isomorph zu K[x]^{n}/\langle P(xE-A)Q\rangle . Dieser Faktormodul zerfällt als direkte Summe K[x]/(f_{1})\oplus \cdots \oplus K[x]/(f_{m}); siehe auch den Satz über invariante Faktoren in endlich erzeugten Moduln über einem Hauptidealring. Die Operation des Polynoms x auf dem direkten Summanden K[x]/(f_{i}) wird durch die Begleitmatrix B_{{f_{i}}} dargestellt, wenn eine Basis (v_{i},x\cdot v_{i},\ldots )=(v_{i},Av_{i},\ldots ) wie im vorigen Abschnitt gewählt wird, und für die Operation von x bzw. A auf dem ganzen Modul \mathcal A ergibt sich eine Darstellung durch die Frobenius-Normalform.

Ist eine weitere Matrix A'\in K^{{n\times n}} gegeben, so macht diese K^{n} zu einem weiteren K[x]-Modul \mathcal A'. Ein Isomorphismus \gamma \colon {\mathcal  A}\to {\mathcal  A}' muss die Operation von K[x] übertragen, also \gamma \circ A=A'\circ \gamma , was bedeutet, dass A' durch die Matrix von \gamma bzgl. der gewählten Basis (u_{1},\ldots ,u_{n}) in A transformiert wird. Ähnlichkeit von Matrizen A und A' ist demnach gleichbedeutend mit Isomorphie der zugehörigen K[x]-Moduln \mathcal A und \mathcal A'; und deren oben besprochene Zerlegung in invariante Faktoren hat gezeigt, dass diese Isomorphie genau dann vorliegt, wenn die charakteristischen Matrizen xE-A und xE-A' dieselben Elementarteiler haben. Diese Aussage ist als Lemma von Frobenius bekannt.

Als weitere Folgerung aus dem Gezeigten ergibt sich der Satz von Cayley-Hamilton: Die Operation des charakteristischen Polynoms f macht alle direkten Summanden K[x]/(f_{i}) zu null, weil alle f_{i} Teiler von f sind. Deswegen ist f(A)=0, also ergibt eine Matrix, in ihr charakteristisches Polynom eingesetzt, die Nullabbildung.

Trenner
Basierend auf einem Artikel in: Wikipedia.de
Seitenende
Seite zurück
©  biancahoegel.de
Datum der letzten Änderung:  Jena, den: 12.10. 2017