Regression mit stochastischen Regressoren

Bei der Regression mit stochastischen Regressoren handelt es sich um spezielle statistische Analyseverfahren zur Aufdeckung möglicher Abhängigkeiten einer statistischen Größe von anderen Größen, den sogenannten Regressoren. In klassischen Regressionsmodellen (z.B. einfache lineare Regression, multiple lineare Regression) wird in der Regel angenommen, dass die Regressoren nichtzufällige, häufig sogar einstellbare Größen sind. In vielen praktischen Fällen, insbesondere bei ökonometrischen Modellen, kann diese Annahme nicht beibehalten werden. Man muss von zufälligen, also stochastischen Regressoren ausgehen. Dabei ist insbesondere von Interesse, wie sich stochastische Regressoren auf die Eigenschaften der Schätzungen (z.B. Kleinste-Quadrate-Schätzer) und Signifikanztests auswirken. Kurz gesagt ist es so, dass die für klassische Regressionsmodelle bekannten Eigenschaften (zumindest näherungsweise) erhalten bleiben, solange die stochastischen Regressoren unkorreliert mit den Störtermen sind (es liegt sogenannte Exogenität vor). Sind sie allerdings korreliert (es liegt sogenannte Endogenität vor), dann muss man prinzipiell andere Wege gehen.

Beispiele

Autoregressiver Prozess erster Ordnung (AR(1))

Der autoregressive Prozess erster Ordnung ist ein einfaches Modell der Zeitreihenanalyse und hat die Form

{\displaystyle Y_{t}=\beta _{0}+\beta _{1}Y_{t-1}+\varepsilon _{t}\quad ,t=1,\dots ,n},

wobei {\displaystyle \varepsilon _{t}} weißes Rauschen darstellt. Der Regressor zum Zeitpunkt t ist der zufällige Regressand vom Zeitpunkt t-1.

Fehler-in-den-Variablen-Modell

Gegeben sei im einfachsten Fall ein einfaches lineares Regressionsmodell

{\displaystyle Y_{i}=\beta _{0}+\beta _{1}x_{i}+\varepsilon _{i};\ i=1,\dots ,n},

jedoch kann x_{i} nur mit zufälligem Fehler u_{i} beobachtet werden, d.h. man hat dann den stochastischen Regressor {\displaystyle z_{i}=x_{i}+u_{i}}. Solche Modelle nennt man Fehler-in-den-Variablen-Modelle.

Simultane Gleichungen

Als Beispiel betrachte man die keynesianische Konsumfunktion mit zwei simultanen Gleichungen:

{\displaystyle Y_{i}=\beta _{0}+\beta _{1}X_{i}+\varepsilon _{i};\ X_{i}=Y_{i}+I_{i};\ i=1.\dots ,n}

Dabei ist Y_i der Konsum, X_{i} das Einkommen und I_{i} die Investition. Setzt man die erste Gleichung in die zweite ein, ergibt sich:

{\displaystyle X_{i}={\frac {1}{1-\beta _{1}}}(\beta _{0}+I_{i}+\varepsilon _{i})},

d.h. X_{i} ist zufällig, weil es von \varepsilon_i abhängt.

Allgemeiner Fall

Wir betrachten ein multiples lineares Regressionsmodell in Vektor-Matrix-Form

{\displaystyle Y=X\beta +\varepsilon }.

Dabei ist Y der n-dimensionale zufällige Vektor der Regressanden, X die {\displaystyle (n\times r)}-Matrix der Regressoren, \beta der r-dimensionale zu schätzende Parametervektor und \varepsilon der n-dimensionale zufällige Vektor der Störgrößen mit {\displaystyle \operatorname {E} \varepsilon =0} und {\displaystyle \operatorname {Cov} \varepsilon =\sigma ^{2}I_{n}}. Hierbei wird angenommen, dass die Datenmatrix X mit Wahrscheinlichkeit 1 vollen Rang hat, d.h. {\displaystyle \operatorname {P} \left[\,\operatorname {Rang} (X)=r\,\right]=1}. Der Kleinste-Quadrate-Schätzer für \beta hat die Gestalt

{\displaystyle b=(X^{T}X)^{-1}X^{T}Y=\beta +(X^{T}X)^{-1}X^{T}\varepsilon }.

Da man schreiben kann {\displaystyle b=\beta +A\varepsilon }, mit {\displaystyle A=(X^{T}X)^{-1}X^{T}}, ist b eine lineare Funktion der Störgrößen, was b zu einem linearen Schätzer macht.

Nichtzufällige Regressoren

In diesem Standardfall gilt bekanntermaßen

Exogenität der Regressoren

Darunter versteht man, dass die Regressoren X zwar stochastisch, aber unkorreliert mit dem Störterm \varepsilon sind. Im obigen Fehler-in-den-Variablen-Beispiel hat man die Exogenität, wenn u_{i} und \varepsilon_i unkorreliert sind. Dann gilt:

Allgemeine stochastische Regressoren

X und \varepsilon sind korreliert, wie z.B. bei der keynesianischen Konsumfunktion. Dann ist b verzerrt und nicht mehr konsistent für \beta . Die klassischen Teststatistiken können nicht benutzt werden. Es müssen prinzipiell andere Methoden gewählt werden.

Für Modelle der Zeitreihenanalyse, wenn allgemeiner als im obigen AR(1)-Beispiel ein ARMA-Modell vorliegt, gibt es spezielle, zum Teil rekursive Kleinste-Quadrate-Verfahren, die im Allgemeinen auf nichtlineare Kleinste-Quadrate-Schätzer führen.

Trenner
Basierend auf einem Artikel in: Wikipedia.de
Seitenende
Seite zurück
© biancahoegel.de
Datum der letzten Änderung: Jena, den: 09.04. 2022