Kopplungsfunktion
In der Statistik und dort
insbesondere in verallgemeinerten
linearen Modellen ist eine Kopplungsfunktion,
auch Linkfunktion, Verknüpfungsfunktion,
oder Verbindungsfunktion genannt, eine Funktion ,
die die durch den linearen
Prädiktor
beschriebene systematische Komponente und die durch den Erwartungswert der Antwortvariablen
beschriebene stochastische Komponente der Verteilung von
in der Art koppelt, dass:
.
Es gibt viele häufig verwendete Kopplungsfunktionen, und ihre Auswahl hängt von
mehreren Überlegungen ab. Jede Exponentialfamilie
besitzt eine eindeutige kanonische
(natürliche) Kopplungsfunktion, die gegeben ist durch
.
Die Kopplungsfunktion ist oft nichtlinear.
Definition
Diese Funktion koppelt die stochastische mit der systematischen Komponente
durch eine Transformation des Erwartungswertes .
Die Funktion
wird Kopplungsfunktion genannt. Sie wird als monoton und differenzierbar
vorausgesetzt. Es gilt
.
Aus dieser Darstellung erkennt man, dass der Erwartungswert
der
-ten
Beobachtung von festen, aber unbekannten Regressionsparametern
abhängt. Eine Kopplungsfunktion wird kanonisch genannt, falls für alle
der lineare Prädiktor mit dem Verteilungsparameter zusammenfällt
.
Mit anderen Worten wird bei der kanonischen Kopplungsfunktion die
Kopplungsfunktion über
definiert, indem der natürliche Parameter
in Bezug auf
ausgedrückt wird.
Beispiel
Wählt man für die Kopplungsfunktion den natürlichen
Logarithmus ,
dann ergeben sich stets positive Erwartungswerte:
.
Beispiele für unterschiedliche Kopplungsfunktionen
Wählt man als Kopplungsfunktion die Logit-Transformation
für den Erwartungswert
der Antwortvariablen, so erhält man das logistische
Regressionsmodell
.
Bei Wahl der Umkehrfunktion der Verteilungsfunktion
der Normalverteilung
als Kopplungsfunktion erhält man das Probit-Modell
.
Kanonische (natürliche) Kopplungsfunktion
Eine besondere Rolle unter den Kopplungsfunktionen spielt die kanonische
Kopplungsfunktion. Sie transformiert den Erwartungswert von
auf den reellwertigen (unbekannten) Verteilungsparameter
der Dichte, den sogenannten kanonischen (natürlichen) Parameter. Jede Exponentialfamilie
besitzt eine eindeutige kanonische (natürliche) Kopplungsfunktion.
Die kanonische Kopplungsfunktion ist bis auf die Forderung, dass sie
invertierbar sein sollte grundsätzlich beliebig wählbar. Sie ist definiert
durch:
,
wobei
eine (bekannte) zweifach differenzierbare Funktion darstellt (siehe Exponentialfamilie).
Aus der Tatsache, dass
und
gilt, folgt, dass
.
Somit fallen bei der Verwendung der kanonischen Kopplungsfunktion der lineare
Prädiktor
und der Verteilungsparameter
zusammen. Im Allgemeinen vereinfachen sich die Schätzer
bei Verwendung der kanonischen Kopplungsfunktion stark. Ein wichtige Eigenschaft
der durch
definierten kanonischen Kopplungsfunktion ist, dass sie mit einem Faktor
skaliert werden kann, ohne dass sie die Eigenschaft verliert mit dem linearen
Prädiktor zusammenzufallen:
,
wobei
einen unbekannten skalierten Parametervektor
und
die zur i-ten Beobachtung gehörige Zeile der Versuchsplanmatrix
darstellt.
Verbindung zum klassischen linearen Modell
Wählt man als Kopplungsfunktion die Identitätsfunktion
,
so erhält man die Gleichung des klassischen
linearen Modells
.
Antwortfunktion
Insbesondere in verallgemeinerten linearen Modellen wird die Inverse der Kopplungsfunktion
mit
Antwortfunktion, oder auch Responsefunktion (englisch response
function) genannt.
Die Antwortfunktion überführt die Linearkombination der erklärenden
Variablen in den (bedingten)
Erwartungswert .
Geeignete Antwortfunktionen sind alle Verteilungsfunktionen stetiger Zufallsvariablen, z. B. die der Standardnormalverteilung oder die der logistischen Verteilung.
Anwendung
Mit einer Kopplungsfunktion werden die Wahrscheinlichkeiten der Stufen einer kategorialen Antwortfunktion in eine unbegrenzte stetige Skala transformiert. Sobald die Transformation abgeschlossen ist, kann die Beziehung zwischen den Prädiktoren und der Antwortfunktion mit der nichtlinearen Regression modelliert werden. Eine binäre Antwortfunktion kann beispielsweise zwei eindeutige Werte aufweisen. Werden diese Werte in Wahrscheinlichkeiten konvertiert, reicht die Antwortvariable von 0 bis 1. Aus einem linearen Zusammenhang wird durch die Log-Kopplungsfunktion ein exponentieller und durch die Logit-Kopplungsfunktion ein sigmoidaler.



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 05.04. 2022