Stochastisch unabhängige Zufallsvariablen

Die stochastische Unabhängigkeit von Zufallsvariablen ist ein zentrales Konzept der Wahrscheinlichkeitstheorie und der Statistik, das die stochastische Unabhängigkeit von Ereignissen und die Unabhängigkeit von Mengensystemen verallgemeinert. Die stochastische Unabhängigkeit von Zufallsvariablen wird beispielsweise bei der Formulierung des Zentralen Grenzwertsatzes benötigt.

Definition für zwei Zufallsvariablen

Gegeben sei ein Wahrscheinlichkeitsraum (\Omega ,{\mathcal  A},P) sowie zwei Messräume (E_{1},\Sigma _{1}) und (E_{2},\Sigma _{2}) und zwei Zufallsvariablen

X_{1}:(\Omega ,{\mathcal  A},P)\to (E_{1},\Sigma _{1})

und

X_{2}:(\Omega ,{\mathcal  A},P)\to (E_{2},\Sigma _{2}).

Die beiden Zufallsvariablen heißen stochastisch unabhängig oder einfacher unabhängig, wenn für jedes B_{1}\in \Sigma _{1} und jedes B_{2}\in \Sigma _{2} gilt, dass

P(\{\omega \in \Omega \colon X_{1}(\omega )\in B_{1}\,{\text{und}}\,X_{2}(\omega )\in B_{2}\})=P(\{\omega \in \Omega \colon X_{1}(\omega )\in B_{1}\})\cdot P(\{\omega \in \Omega \colon X_{2}(\omega )\in B_{2}\}).

Meist werden die Mengen kompakter notiert, indem man anstelle von \{\omega \in \Omega \colon X_{2}(\omega )\in B_{2}\} einfach \{X_{2}\in B_{2}\} schreibt. Dann lautet die Definition

P(\{X_{1}\in B_{1},\,X_{2}\in B_{2}\})=P(\{X_{1}\in B_{1}\})\cdot P(\{X_{2}\in B_{2}\})

für alle B_{1}\in \Sigma _{1},\,B_{2}\in \Sigma _{2}.

Eine alternative Definition wird durch die stochastische Unabhängigkeit von Ereignissen ermöglicht. Man definiert dann

A_{{B_{1}}}^{1}=\{\omega \in \Omega \colon X_{1}(\omega )\in B_{1}\}
A_{{B_{2}}}^{2}=\{\omega \in \Omega \colon X_{2}(\omega )\in B_{2}\}.

Die Zufallsvariablen X_{1},X_{2} heißen dann stochastisch unabhängig, wenn für alle B_{1}\in \Sigma _{1},B_{2}\in \Sigma _{2} gilt, dass die A_{{B_{1}}}^{1} und A_{{B_{2}}}^{2} stochastisch unabhängige Ereignisse sind, also

{\displaystyle P(A_{B_{1}}^{1}\cap A_{B_{2}}^{2})=P(A_{B_{1}}^{1})P(A_{B_{2}}^{2})}

gilt.

Beispiel

Wir betrachten den Wahrscheinlichkeitsraum (\Omega ,{\mathcal  A},P) mit Grundmenge \Omega =\{1,2,3,4\}, σ-Algebra {\mathcal  A}={\mathcal  P}(\Omega ) und als Wahrscheinlichkeitsmaß die Gleichverteilung auf der Grundmenge. Sei E_{1}=E_{2}=\{0,1\} und \Sigma _{1}=\Sigma _{2}={\mathcal  P}(\{0,1\}). Die Zufallsvariablen sind definiert als

X_{1}(\omega )={\begin{cases}1&{\text{ falls }}\omega \in \{1,2\}\\0&{\text{ falls }}\omega \in \{3,4\}\end{cases}}
X_{2}(\omega )={\begin{cases}1&{\text{ falls }}\omega \in \{2,3\}\\0&{\text{ falls }}\omega \in \{1,4\}\end{cases}}

Jede der σ-Algebren hat 4 Elemente: \emptyset ,\{0\},\{1\},\{0,1\}. Demnach wären 16 Kombinationen zu überprüfen. Die Fälle, in denen eine der beteiligten Mengen die Obermenge oder die leere Menge ist, können jedoch ausgeschlossen werden, da jede Menge von diesen beiden unabhängig ist. Demnach bleiben nur 4 Fälle übrig: B_{1}=\{0\} oder B_{1}=\{1\} kombiniert mit B_{2}=\{0\} oder B_{2}=\{1\}

  1. Sei B_{1}=B_{2}=\{0\}. Dann ist A_{{B_{1}}}^{1}=\{3,4\} und A_{{B_{2}}}^{2}=\{1,4\} sowie A_{{B_{1}}}^{1}\cap A_{{B_{2}}}^{2}=\{4\}. Diese Ereignisse sind unabhängig, denn es ist P(\{4\})={\tfrac  {1}{4}}=P(\{3,4\})P(\{1,4\}).
  2. Sei B_{1}=B_{2}=\{1\}. Dann ist A_{{B_{1}}}^{1}=\{1,2\} und A_{{B_{2}}}^{2}=\{2,3\} sowie A_{{B_{1}}}^{1}\cap A_{{B_{2}}}^{2}=\{2\}. Diese Ereignisse sind unabhängig, denn es ist P(\{2\})={\tfrac  {1}{4}}=P(\{1,2\})P(\{2,3\}).
  3. Sei B_{1}=\{1\} und B_{2}=\{0\}. Dann ist A_{{B_{1}}}^{1}=\{1,2\} und A_{{B_{2}}}^{2}=\{1,4\} sowie A_{{B_{1}}}^{1}\cap A_{{B_{2}}}^{2}=\{1\}. Diese Ereignisse sind unabhängig, denn es ist P(\{1\})={\tfrac  {1}{4}}=P(\{1,2\})P(\{1,4\}).
  4. Sei B_{1}=\{0\} und B_{2}=\{1\}. Dann ist A_{{B_{1}}}^{1}=\{3,4\} und A_{{B_{2}}}^{2}=\{2,3\} sowie A_{{B_{1}}}^{1}\cap A_{{B_{2}}}^{2}=\{3\}. Diese Ereignisse sind unabhängig, denn es ist P(\{3\})={\tfrac  {1}{4}}=P(\{3,4\})P(\{2,3\}).

Somit sind alle Ereignisse unabhängig und demnach auch die Zufallsvariablen.

Allgemeine Definition

Die Familie von Zufallsvariablen X_{i}\colon (\Omega ,{\mathcal  A},P)\rightarrow (E_{i},\Sigma _{i}), i\in I für eine beliebige Indexmenge I heißt stochastisch unabhängig, falls für jede endliche Teilmenge  J von I gilt, dass

P\left(\bigcap _{{j\in J}}\{X_{j}\in B_{j}\}\right)=\prod _{{j\in J}}P(X_{j}\in B_{j})

für alle B_{j}\in \Sigma _{j} gilt.

Mit der Unabhängigkeit für Mengensysteme wird die stochastische Unabhängigkeit von Zufallsvariablen auch wie folgt definiert: Eine Familie von Zufallsvariablen sind genau dann stochastisch unabhängig, wenn ihre Initial-σ-Algebren voneinander unabhängig sind.

Diese Definition kann äquivalent auf Zufallsvektoren, also auf \mathbb {R} ^{n}-wertige Zufallsvariablen, angewandt werden. An die Unabhängigkeit der Komponentenabbildungen sind dabei keine weiteren Forderungen gestellt

Kriterien für Unabhängigkeit

Erzeugendensysteme

Die Anzahl der auf Unabhängigkeit zu überprüfenden Mengen lässt sich reduzieren, wenn ein Erzeuger bekannt ist. Existiert zu jeder σ-Algebra \Sigma _{i} ein durchschnittsstabiler Erzeuger {\mathcal  E}_{i}, gilt also \sigma ({\mathcal  E}_{i})=\Sigma _{i}, so genügt es, die Unabhängigkeit auf den Erzeugern zu überprüfen. Das Kriterium reduziert sich dann zu

P\left(\bigcap _{{j\in J}}\{X_{j}\in B_{j}\}\right)=\prod _{{j\in J}}P(X_{j}\in B_{j})

für alle B_{j}\in {\mathcal  E}_{j} und alle endlichen Teilmengen  J von I. Für diskrete Wahrscheinlichkeitsräume wählt man als Erzeuger meist die Punktmengen\{x_{k}\}, für reelle Zufallsvariablen die halboffenen Intervalle als Erzeuger der Borelsche σ-Algebra.

Endliche Familien

Ist die Familie von Zufallsvariablen und damit auch die Indexmenge endlich, zum Beispiel mit Indexmenge I=\{1,\dots ,n\}, so genügt es

P\left(\bigcap _{{i\in I}}\{X_{i}\in B_{i}\}\right)=\prod _{{i\in I}}P(X_{i}\in B_{i})

für alle B_{i}\in \Sigma _{i} zu überprüfen. Auf die Überprüfung der Teilmengen J\subset I kann verzichtet werden. Dies folgt daraus, dass \{X_{i}\in E_{i}\}=\Omega ist. Der Fall mit J\subsetneqq I folgt dann automatisch aus dem obigen Fall, man setzt für i\in I\setminus J dann B_{i}=E_{i} und erhält daraus die Aussage für die kleinere Indexmenge.

Für endliche Familien diskreter Zufallsvariablen

Beide oben genannten Kriterien lassen sich für eine endliche Familie von Zufallsvariablen, die Werte in einem diskreten Messraum annehmen zusammenfassen. Sei I=\{1,\dots ,n\} und seien die X_{i} Zufallsvariablen von (\Omega ,{\mathcal  A},P) nach (E_{i},\Sigma _{i}) und sei E_{i} diskret, also endlich oder abzählbar unendlich. Dann sind die Zufallsvariablen genau dann unabhängig, wenn

P(X_{1}=x_{1},\dots ,X_{n}=x_{n})=\prod _{{i=1}}^{n}P(X_{i}=x_{i})

für alle x_{i}\in E_{i} gilt.

Für endliche Familien reeller Zufallsvariablen

Für endliche Familien reellwertiger Zufallsvariablen ergibt sich folgendes Kriterium: Die Zufallsvariablen (X_{i})_{{i\in I}} sind genau dann stochastisch unabhängig, wenn

P(X_{1}\leq x_{1},\dots ,X_{n}\leq x_{n})=\prod _{{i=1}}^{n}P(X_{i}\leq x_{i})

für alle x_{1},\dots ,x_{n}\in \mathbb{R} gilt. Sind also F_{{X_{i}}}(x)=P(X_{i}\leq x) die Verteilungsfunktionen der X_{i} sowie F_{{I}}(x_{1},\dots ,x_{n}):=P(X_{1}\leq x_{1},\dots ,X_{n}\leq x_{n}) die gemeinsame Verteilungsfunktion, dann sind die X_{i} genau dann stochastisch unabhängig, wenn

F_{I}(x_{1},\dots ,x_{n})=\prod _{{i=1}}^{n}F_{{X_{i}}}(x_{i})

gilt. Falls die X_{i} eine gemeinsame Dichtefunktion f_{{I}} besitzen, so sind sie genau dann stochastisch unabhängig, wenn

f_{{I}}(x_{1},\dots ,x_{n})=\prod _{{i=1}}^{n}f_{{X_{i}}}(x_{i})

gilt. Dabei bezeichnet f_{{X_{i}}} die Randdichte von X_{i}.

Existenz unabhängiger Zufallsvariablen

Für abzählbar unendliche Familien von Zufallsvariablen stellt sich die Frage, ob überhaupt ein „genügend großer“ Wahrscheinlichkeitsraum existiert, so dass die gesamte Familie auf diesem Wahrscheinlichkeitsraum unabhängig ist. Es ist nicht offensichtlich, dass dies möglich ist, alternativ könnte die Unabhängigkeit eine zu starke Forderung sein, da die Initial-σ-Algebren bei vielen Zufallsvariablen immer zwangsläufig abhängig sind.

Tatsächlich lässt sich die Frage aber mittels des Produktmaßes positiv beantworten. Betrachtet man das unendliche Produktmodell

\left(\prod _{{i=1}}^{{\infty }}\Omega _{i},\bigotimes _{{i=1}}^{{\infty }}{\mathcal  A}_{i},\bigotimes _{{i=1}}^{{\infty }}P_{i}\right)

und definiert als Familie von Zufallsvariablen genau die Projektionen auf die i-ten Komponenten (X_{i})_{{i\in \mathbb{N} }}=(\pi _{i})_{{i\in \mathbb{N} }}, so ist diese Familie per Definition des Produktmodells und des Produktmaßes unabhängig und die Projektionen \pi _{i} haben genau die Verteilung P_{i} auf dem Ereignisraum (\Omega _{i},{\mathcal  A}_{i}). Das Produktmodell ist also groß genug, um eine unabhängige Familie von Zufallsvariablen zu enthalten. Andererseits wird dadurch das Problem der Existenz von unendlich vielen unabhängigen Zufallsvariablen auf die Existenz eines unendlichen Produktmaßes zurückgeführt, was nicht selbstverständlich ist. Diese Existenzfrage wird Beispielsweise durch den Satz von Andersen-Jessen für beliebige Indexmengen positiv beantwortet, kann aber auch für abzählbare Indexmengen über den Satz von Ionescu-Tulcea oder für Borel'sche Räume über den Erweiterungssatz von Kolmogorov erfolgen.

Unkorreliertheit und Unabhängigkeit

Zwei Zufallsvariablen X,Y heißen unkorreliert, wenn ihre Kovarianz \operatorname {Cov}(X,Y) gleich null ist.

Aus Unabhängigkeit der Zufallsvariablen X,Y folgt immer ihre Unkorreliertheit. Sind nämlich die Zufallsvariablen unabhängig, so gilt für den Erwartungswert \operatorname E(XY)=\operatorname E(X)\operatorname E(Y) und demnach

\operatorname {Cov}(X,Y)=\operatorname {E}(XY)-\operatorname {E}(X)\operatorname {E}(Y)=\operatorname {E}(X)\operatorname {E}(Y)-\operatorname {E}(X)\operatorname {E}(Y)=0.

Dabei folgt die erste Gleichheit aus dem Verschiebungssatz für die Kovarianz und die zweite aus der Unabhängigkeit der Zufallsvariablen und der obigen Folgerung für den Erwartungswert.

Umgekehrt folgt aus Unkorreliertheit nicht stochastische Unabhängigkeit. Ein Beispiel dafür sind die Zufallsvariable X, die gleichverteilt auf [-1,1] ist und Y=X^{2}. Es gilt dann

\operatorname {Cov}(X,Y)=\operatorname {E}(X^{3})-\operatorname {E}(X)\operatorname {E}(X^{2})=0-0\cdot \operatorname {E}(X^{2})=0,

die Zufallsvariablen sind also unkorreliert. Sie sind aber nicht unabhängig, denn es ist zum Beispiel

P(\{X\in [0,{\tfrac  {1}{2}}],\,Y\in [0,{\tfrac  {1}{9}}]\})=P([0,{\tfrac  {1}{2}}]\cap [-{\tfrac  {1}{3}},{\tfrac  {1}{3}}])={\frac  {1}{6}}

und

P(\{X\in [0,{\tfrac  {1}{2}}]\})=P([0,{\tfrac  {1}{2}}])={\frac  {1}{4}}{\text{ und }}P(\{Y\in [0,{\tfrac  {1}{9}}]\})=P([-{\tfrac  {1}{3}},{\tfrac  {1}{3}}])={\frac  {1}{3}}.

Die Abhängigkeit folgt dann aus {\tfrac  {1}{4}}\cdot {\tfrac  {1}{3}}\neq {\tfrac  {1}{6}}.

Bemerkungen

Für die Analyse auf Abhängigkeit zweier Zufallsvariablen kann man auch testen, ob der Korrelationskoeffizient Null ist. Wenn die Hypothese abgelehnt wird, geht man davon aus, dass diese Variablen stochastisch abhängig sind. Der Umkehrschluss ist allerdings nicht zulässig, denn es können Abhängigkeitsstrukturen vorliegen, die der Korrelationskoeffizient nicht erfassen kann. Jedoch sind beispielsweise unkorrelierte, gemeinsam normalverteilte Zufallsvariablen auch stochastisch unabhängig.

Unabhängigkeit von Zufallsvariablen und Mengensystemen

Im Rahmen des bedingten Erwartungswertes wird teilweise auch von der Unabhängigkeit einer Zufallsvariable X und eines Mengensystems {\mathcal  E} gesprochen. Die Zufallsvariable und das Mengensystem heißen unabhängig, wenn das Mengensystem {\mathcal  E} und die Initial-σ-Algebra \sigma (X) der Zufallsvariable unabhängige Mengensysteme sind.

Verallgemeinerungen

Mittels des bedingten Erwartungswertes lässt sich sowohl die Unabhängigkeit von Mengensystemen als auch die Unabhängigkeit von Zufallsvariablen zur bedingten Unabhängigkeit erweitern.

Trenner
Basierend auf einem Artikel in: Wikipedia.de
Seitenende
Seite zurück
©  biancahoegel.de
Datum der letzten Änderung:  Jena, den: 24.01. 2021