Konvergenz in Wahrscheinlichkeit

Die Konvergenz in Wahrscheinlichkeit, auch stochastische Konvergenz genannt, ist ein Begriff aus der Wahrscheinlichkeitstheorie, einem Teilgebiet der Mathematik. Die Konvergenz in Wahrscheinlichkeit ist das wahrscheinlichkeitstheoretische Pendant zur Konvergenz nach Maß in der Maßtheorie und neben der Konvergenz im p-ten Mittel, der Konvergenz in Verteilung und der fast sicheren Konvergenz einer der Konvergenzbegriffe in der Stochastik. Es finden sich auch Quellen, welche die Konvergenz in Wahrscheinlichkeit analog zur Konvergenz lokal nach Maß der Maßtheorie definieren. Die Konvergenz in Wahrscheinlichkeit findet beispielsweise Anwendung bei der Formulierung des schwachen Gesetzes der großen Zahlen.

Definition

Für reellwertige Zufallsvariablen

Eine Folge (X_{n})_{{n\in \mathbb{N} }} von reellen Zufallsvariablen konvergiert in Wahrscheinlichkeit oder stochastisch gegen die Zufallsvariable X, wenn für jedes \epsilon >0 gilt, dass

\lim _{{n\to \infty }}P(|X_{n}-X|\geq \epsilon )=0

ist. Man schreibt dann X_{n}{\stackrel  {p}{\rightarrow }}X oder X_{n}{\stackrel  {P}{\rightarrow }}X oder auch {\displaystyle \operatorname {plim} (X_{n})=X}.

Allgemeiner Fall

Seien (M,d) ein separabler metrischer Raum und {\mathcal  B}(M) die zugehörige Borelsche σ-Algebra. Eine Folge (X_{n})_{{n\in \mathbb{N} }} von Zufallsvariablen auf einem Wahrscheinlichkeitsraum (\Omega ,{\mathcal  A},P) mit Werten in (M,{\mathcal  B}(M)) heißt konvergent in Wahrscheinlichkeit oder stochastisch konvergent gegen X, wenn für alle \epsilon >0 gilt, dass

\lim _{{n\to \infty }}P(d(X_{n},X)\geq \epsilon )=0

ist. Dabei wird die vorausgesetzte Separabilität benötigt, um die in der Definition verwendete Messbarkeit der Abbildung {\displaystyle \Omega \rightarrow \mathbb {R} ,\,\omega \mapsto d(X_{n}(\omega ),X(\omega ))}, sicherzustellen.

Beispiel

Seien Y_{n} unabhängige Rademacher-verteilte Zufallsvariablen, also P(Y_{n}=-1)=P(Y_{n}=1)={\tfrac  {1}{2}}. Dann ist \operatorname {E}(Y_{n})=0 und \operatorname {Var}(Y_{n})=1. Definiert man nun die Folge von Zufallsvariablen (X_{n})_{{n\in \mathbb{N} }} als

X_{n}:={\frac  {1}{n}}\sum _{{i=1}}^{n}Y_{i},

so ist aufgrund der Unabhängigkeit

\operatorname {E}(X_{n})={\frac  {1}{n}}\cdot n\operatorname {E}(Y_{n})=0

und

\operatorname {Var}(X_{n})={\frac  {1}{n^{2}}}\operatorname {Var}\left(\sum _{{i=1}}^{n}Y_{i}\right)={\frac  {1}{n}}.

Mit der Tschebyscheff-Ungleichung

P\left[|X_{n}-\operatorname {E}[X_{n}]|\geq \epsilon \right]\leq {\frac  {\operatorname {Var}[X_{n}]}{\epsilon ^{2}}}

erhält man dann die Abschätzung

{\displaystyle P\left[|X_{n}|\geq \epsilon \right]\leq {\frac {1}{n\epsilon ^{2}}}{\stackrel {n\to \infty }{\longrightarrow }}0}.

Also konvergieren die X_{n} in Wahrscheinlichkeit gegen 0. Neben der Tschebyscheff-Ungleichung ist die allgemeinere Markow-Ungleichung ein hilfreiches Mittel, um Konvergenz in Wahrscheinlichkeit zu zeigen.

Eigenschaften

{\displaystyle \lim _{n\to \infty }\operatorname {E} ([\mathrm {min} (1,|X_{n}-X|)]=0,}
das heißt die stochastische Konvergenz entspricht der Konvergenz bezüglich der Metrik {\displaystyle d(X,Y):=\operatorname {E} ([\min(1,|X-Y|)]}. Der Raum aller Zufallsvariablen versehen mit dieser Metrik bildet einen topologischen Vektorraum, der im Allgemeinen nicht lokalkonvex ist.

Beziehung zu anderen Konvergenzarten der Stochastik

Allgemein gelten für die Konvergenzbegriffe der Wahrscheinlichkeitstheorie die Implikationen

{\begin{matrix}{\text{Fast sichere}}\\{\text{Konvergenz}}\end{matrix}}\implies {\begin{matrix}{\text{Konvergenz in}}\\{\text{Wahrscheinlichkeit}}\end{matrix}}\implies {\begin{matrix}{\text{Konvergenz in}}\\{\text{Verteilung}}\end{matrix}}

und

{\begin{matrix}{\text{Konvergenz im}}\\{\text{p-ten Mittel}}\end{matrix}}\implies {\begin{matrix}{\text{Konvergenz in}}\\{\text{Wahrscheinlichkeit}}\end{matrix}}\implies {\begin{matrix}{\text{Konvergenz in}}\\{\text{Verteilung}}\end{matrix}}.

Die Konvergenz in Wahrscheinlichkeit ist also ein mäßig starker Konvergenzbegriff. In den unten stehenden Abschnitten sind die Beziehungen zu den andere Konvergenzarten genauer ausgeführt.

Konvergenz im p-ten Mittel

Aus der Konvergenz im p-ten Mittel folgt für p\geq 1 unmittelbar die Konvergenz in Wahrscheinlichkeit. Dazu wendet man die Markow-Ungleichung auf die Funktion h=Y^{p} an, die für {\displaystyle p>0} monoton wachsend ist, und die Zufallsvariable Y=|X_{n}-X| an. Dann folgt

P(|X_{n}-X|\geq \epsilon )\leq {\frac  {1}{\epsilon ^{p}}}\operatorname {E}(|X_{n}-X|^{p}),

was im Grenzwert gegen Null geht. Die Umkehrung gilt im Allgemeinen nicht. Ein Beispiel hierfür ist: sind die Zufallsvariablen definiert durch

P(X_{n}=e^{{n\alpha }})=e^{{-n}}=1-P(X_{n}=0)

mit  \alpha > 0 . Dann ist

\operatorname {E}(|X_{n}|^{1})=e^{{n(\alpha -1)}}{\xrightarrow[ {}]{n\to \infty }}0,

wenn \alpha <1. Also konvergiert die Folge für \alpha \in (0,1) im Mittel gegen 0. Für beliebiges \epsilon \in (0,1) ist aber

P(|X_{n}|\geq \epsilon )=P(X_{n}=e^{{n\alpha }})=e^{{-n}}{\xrightarrow[ {}]{n\to \infty }}0. Also konvergiert die Folge für alle \alpha in Wahrscheinlichkeit gegen 0.

Ein Kriterium, unter dem die Konvergenz im p-ten Mittel aus der Konvergenz in Wahrscheinlichkeit gilt ist, dass eine Majorante Y mit {\displaystyle \operatorname {E} (|Y|^{p})<\infty } existiert, so dass P(|X_{n}|\leq Y)=1 für alle n gilt. Konvergieren dann die X_{n} in Wahrscheinlichkeit gegen X, so konvergieren sie auch im p-ten Mittel gegen X. Allgemeiner lässt sich eine Verbindung zwischen der Konvergenz im p-ten Mittel und der Konvergenz in Wahrscheinlichkeit mittels des Konvergenzsatzes von Vitali und der gleichgradigen Integrierbarkeit im p-ten Mittel ziehen: Eine Folge konvergiert genau dann im p-ten Mittel, wenn sie gleichgradig integrierbar im p-ten Mittel ist und sie in Wahrscheinlichkeit konvergiert.

Fast sichere Konvergenz

Aus der fast sicheren Konvergenz folgt die Konvergenz in Wahrscheinlichkeit. Um dies zu sehen, definiert man die Mengen

B_{N}:=\{\omega \in \Omega \colon \vert X_{n}-X\vert <\epsilon \quad \forall n\geq N\}{\text{ und }}B:=\bigcup _{{i=1}}^{\infty }B_{i}.

Die B_{N} bilden eine monoton wachsende Mengenfolge, und die Menge B enthält die Menge

A:=\{\omega \in \Omega \colon \lim _{{n\to \infty }}X_{n}=X\}

der Elemente, auf denen die Folge punktweise konvergiert. Nach Voraussetzung ist P(A)=1 und damit auch P(B)=1 und demnach \lim _{{N\to \infty }}P(B_{N})=1. Durch Komplementbildung folgt dann die Aussage.

Die Umkehrung gilt aber im Allgemeinen nicht. Ein Beispiel hierfür ist die Folge von Bernoulli-Verteilten Zufallsvariablen zum Parameter {\displaystyle {\tfrac {1}{n}}}, also {\displaystyle X_{n}\sim \operatorname {Ber} _{\frac {1}{n}}}. Dann ist

{\displaystyle \lim _{n\to \infty }P(|X_{n}|\geq \epsilon )=0}

für alle \epsilon >0 und somit konvergiert die Folge in Wahrscheinlichkeit gegen 0. Die Folge konvergiert aber nicht fast sicher, man zeigt dies mit dem hinreichenden Kriterium für fast sichere Konvergenz und dem Borel-Cantelli-Lemma.

Bedingungen, unter denen aus der Konvergenz in Wahrscheinlichkeit die fast sichere Konvergenz folgt sind:

\sum _{{i=1}}^{\infty }P(\vert X_{i}-X\vert \geq \epsilon )<\infty .

Allgemeiner besitzt jede in Wahrscheinlichkeit konvergierende Folge eine Teilfolge, die fast sicher konvergiert.

Konvergenz in Verteilung

Aus Konvergenz in Wahrscheinlichkeit folgt nach dem Satz von Slutzky die Konvergenz in Verteilung, der Umkehrschluss gilt im Allgemeinen nicht. Ist beispielsweise die Zufallsvariable X Bernoulli-verteilt mit Parameter p=q={\tfrac  {1}{2}}, also

P(X=1)=P(X=0)={\frac  {1}{2}},

und setzt man X_{n}=1-X für alle  n \in \N , so konvergiert X_{n} in Verteilung gegen X, da sie dieselbe Verteilung haben. Es gilt aber immer |X_{n}-X|=1, die Zufallsvariablen können also nicht in Wahrscheinlichkeit konvergieren. Es existieren jedoch Kriterien, unter denen aus der Konvergenz in Verteilung die Konvergenz in Wahrscheinlichkeit folgt. Sind beispielsweise alle Zufallsvariablen X_{n} auf demselben Wahrscheinlichkeitsraum definiert und konvergieren in Verteilung gegen die Zufallsvariable X, die fast sicher konstant ist, so konvergieren die X_{n} auch in Wahrscheinlichkeit gegen X.

Trenner
Basierend auf einem Artikel in: Wikipedia.de
Seitenende
Seite zurück
©  biancahoegel.de
Datum der letzten Änderung:  Jena, den: 20.01. 2018