Übergangskern

Als Übergangskern bezeichnet man spezielle Abbildungen zwischen Messräumen in der Wahrscheinlichkeitstheorie, die im ersten Argument messbar sind und im zweiten Argument ein Maß liefern. Spezialfälle von Übergangskernen sind die sogenannten stochastischen Kerne, die auch Markow-Kerne oder Wahrscheinlichkeitskerne genannt werden. Bei ihnen ist das Maß immer ein Wahrscheinlichkeitsmaß. Ist das Maß immer ein Sub-Wahrscheinlichkeitsmaß, so spricht man auch von Sub-Markow-Kernen oder substochastischen Kernen.

Insbesondere die Markow-Kerne spielen eine wichtige Rolle in der Wahrscheinlichkeitstheorie wie beispielsweise bei der Formulierung der regulären bedingten Verteilung oder der Theorie der stochastischen Prozesse. Hier bilden sie im Speziellen die Basis für die Formulierung der Übergangswahrscheinlichkeiten von Markow-Ketten oder Existenzaussagen wie den Satz von Ionescu-Tulcea.

Definition

Gegeben seien zwei Messräume  (\Omega_0, \mathcal A_0) und  (\Omega_1, \mathcal A_1) . Eine Abbildung  K \colon \Omega_0 \times \mathcal A_1 \to [0,\infty) heißt ein Übergangskern von  (\Omega_0, \mathcal A_0) nach  (\Omega_1, \mathcal A_1) , wenn gilt:

Ist das Maß für alle  x \in \Omega_0 ein σ-endliches Maß, so spricht man von einem σ-endlichen Übergangskern, ist es stets endlich, so spricht man von einem endlichen Übergangskern. Ist das Maß für alle  x \in \Omega_0 ein Wahrscheinlichkeitsmaß, so nennt man K einen stochastischen Kern oder Markow-Kern. Ist das Maß für alle  x \in \Omega_0 ein Sub-Wahrscheinlichkeitsmaß, so heißt K ein substochastischer Kern oder sub-Markow'scher-Kern.

Bemerkung: Bei manchen Definitionen werden die Argumente von K in umgekehrter Reihenfolge geschrieben, K(A',x) oder auch K(A'|x), in Anlehnung an bedingte Wahrscheinlichkeiten.

Elementare Beispiele

 A= \begin{pmatrix} 0 & \tfrac{1}{2} & \tfrac{1}{2} \\ \tfrac{1}{2} & \tfrac{1}{2} & 0 \\ \tfrac{1}{2} & 0 &\tfrac{1}{2}\end{pmatrix}
kann als ein Markow-Kern von  (\{1,2,3\}, \mathcal P (\{1,2,3\})) nach  (\{1,2,3\}, \mathcal P (\{1,2,3\})) aufgefasst werden. Denn für jedes i ist die i-te Zeile ein Wahrscheinlichkeitsvektor und damit ein Wahrscheinlichkeitsmaß auf  \{1,2,3\} . Außerdem ist sie eine Abbildung zwischen endlichen Mengen versehen mit der Potenzmenge und damit messbar.

Eigenschaften

Maße durch Kerne

Jedem Maß \mu auf (\Omega ,{\mathcal  A}) ordnet K durch

\nu (A')=\int _{\Omega }K(x,A')\mu (dx)

ein Maß \nu auf (\Omega ',{\mathcal  A}') zu. Dieses Maß wird üblicherweise mit \mu K bezeichnet. Ist \mu ein Wahrscheinlichkeitsmaß, gilt also \mu (\Omega )=1, dann ist auch \mu K(\Omega ')=1, das heißt \mu K ist ebenfalls ein Wahrscheinlichkeitsmaß.

Im Fall (\Omega ,{\mathcal  {A}})=(\Omega ',{\mathcal  {A}}') wird ein Maß \mu , für das \mu =\mu K gilt, stationäres Maß genannt. Ein stationäres Wahrscheinlichkeitsmaß heißt auch stationäre Verteilung.

Messbare Funktionen durch Kerne

Jeder nichtnegativen messbaren Funktion g\colon \Omega '\to \mathbb{R} > ordnet K durch

f(x)=\int _{{\Omega '}}g(y)K(x,dy)

eine nichtnegative messbare Funktion f\colon \Omega \to \mathbb{R} zu. Diese Funktion wird üblicherweise mit Kg bezeichnet. Mit der Kurzschreibweise \mu f=\int _{{\Omega }}f(x)\,\mu (dx) gilt für alle Maße \mu auf (\Omega ,{\mathcal  A}) und alle nichtnegativen messbaren Funktionen g\colon \Omega '\to \mathbb{R} die Gleichung (\mu K)g=\mu (Kg).

Diskreter Fall

Im diskreten Fall, wo \Omega und \Omega ' endliche oder abzählbare Mengen sind, genügt es die Wahrscheinlichkeiten p_{{i,j}} anzugeben, mit denen man vom Zustand i in den Zustand j gelangt. Mit den Bezeichnungen des allgemeinen Falls gilt dann p_{{i,j}}=K(i,\{j\}). Diese Wahrscheinlichkeiten bilden eine Übergangsmatrix M=(p_{{i,j}})_{{i\in \Omega ,j\in \Omega '}}, die die Eigenschaft hat, dass alle Elemente zwischen {\displaystyle 0} und 1 liegen und dass die Zeilensummen \sum _{{j\in \Omega '}}p_{{i,j}} den Wert 1 haben. Eine solche Matrix wird als stochastische Matrix bezeichnet. Sie ordnet jeder Wahrscheinlichkeitsverteilung auf \Omega mit einer Zähldichte \rho =(\rho _{i})_{{i\in \Omega }} die Zähldichte

\rho M={\Bigl (}\sum _{{i\in \Omega }}\rho _{i}p_{{i,j}}{\Bigr )}_{{j\in \Omega '}}

einer Wahrscheinlichkeitsverteilung auf \Omega ' zu, das heißt \rho M wird mit der üblichen Matrixmultiplikation berechnet, wobei Zähldichten als Zeilenvektoren aufgefasst werden.

Ist g\colon \Omega '\to \mathbb{R} eine nichtnegative Funktion, aufgefasst als Spaltenvektor (g_{j})_{{j\in \Omega '}} mit nichtnegativen Einträgen, dann gilt

Kg={\Bigl (}\sum _{{j\in \Omega '}}p_{{i,j}}g_{j}{\Bigr )}_{{i\in \Omega }}.

Das heißt, im diskreten Fall wird auch Kg, aufgefasst als Spaltenvektor mit Indizes in \Omega , mit der üblichen Matrixmultiplikation berechnet.

Bemerkung: Bei manchen Definitionen werden Zeilen und Spalten der Matrix umgekehrt verwendet.

Operationen von Übergangskernen

Verkettung

Sind drei Messräume  (\Omega_0, \mathcal A_0), \; (\Omega_1, \mathcal A_1), \, (\Omega_2, \mathcal A_2) gegeben sowie zwei substochastische Kerne K_{1} von   (\Omega_0, \mathcal A_0) nach (\Omega_1, \mathcal A_1) und K_{2} von   (\Omega_1, \mathcal A_1) nach (\Omega_2, \mathcal A_2) , so ist die Verkettung der Kerne K_{1} und K_{2} eine Abbildung

 K_1 \cdot K_2 \colon \Omega_0 \times \mathcal A_2 \to [0,\infty)

definiert durch

 (K_1 \cdot K_2) (x_0,A_2)=\int_{\Omega_1}K_1(x_0, \mathrm d x_1)K_2(x_1,A_2) .

Die Verkettung ist dann ein substochastischer Kern von  (\Omega_0, \mathcal A_0 ) nach  (\Omega_2, \mathcal A_2 ) . Sind K_{1} und K_{2} stochastisch, dann ist auch {\displaystyle K_{1}\cdot K_{2}} stochastisch.

Produkte

Gegeben seien die Maßräume {\displaystyle (\Omega _{1},{\mathcal {A}}_{1}),(\Omega _{2},{\mathcal {A}}_{2})} und {\displaystyle (\Omega _{3},{\mathcal {A}}_{3})} und zwei endliche Übergangskerne K_{1} von  (\Omega_1, \mathcal A_1) nach  (\Omega_2, \mathcal A_2) und K_{2} von {\displaystyle (\Omega _{1}\times \Omega _{2},{\mathcal {A}}_{1}\otimes {\mathcal {A}}_{2})} nach {\displaystyle (\Omega _{3},{\mathcal {A}}_{3})} . Dann definiert man das Produkt der Kerne K_{1} und K_{2}

{\displaystyle K_{1}\otimes K_{2}\colon \Omega _{1}\times ({\mathcal {A}}_{2}\otimes {\mathcal {A}}_{3})\to [0,\infty )}

als

{\displaystyle (\omega _{1},A)\mapsto \int _{\Omega _{2}}K_{1}(\omega _{1},\mathrm {d} \omega _{2})\int _{\Omega _{3}}K_{2}((\omega _{1},\omega _{2}),\mathrm {d} \omega _{3})\chi _{A}((\omega _{2},\omega _{3}))}.

Das Produkt {\displaystyle K_{1}\otimes K_{2}} ist dann ein σ-endlicher Übergangskern von  (\Omega_1, \mathcal A_1) nach {\displaystyle (\Omega _{2}\times \Omega _{3},{\mathcal {A}}_{2}\otimes {\mathcal {A}}_{3})}. Sind beide Kerne stochastisch (bzw. substochastisch), so ist auch das Produkt der Kerne stochastisch (bzw. substochastisch).

Ist K_{2} nur ein Kern von {\displaystyle (\Omega _{2},{\mathcal {A}}_{2})} nach {\displaystyle (\Omega _{3},{\mathcal {A}}_{3})}, so fasst man den Kern als Kern von {\displaystyle (\Omega _{1}\times \Omega _{2},{\mathcal {A}}_{1}\otimes {\mathcal {A}}_{2})} auf, der unabhängig von der ersten Komponente ist.

Weitere Beispiele

K(x,A')=\int _{{A'}}k(x,y)\,\nu (dy)
eine Übergangswahrscheinlichkeit definiert. Hier ist also K(x,\;\cdot \;) das Wahrscheinlichkeitsmaß auf (\Omega ',{\mathcal {A}}') mit der \nu -Wahrscheinlichkeitsdichte k(x,\;\cdot \;).
K(p,A')=B_{{n,p}}(A')
eine Übergangswahrscheinlichkeit von (\Omega ,{\mathcal  {A}})=([0,1],{\mathcal  {B}}([0,1])) nach (\Omega ',{\mathcal  {P}}(\Omega ')) definiert. Ist beispielsweise \beta _{{a,b}} eine Betaverteilung auf (\Omega ,{\mathcal {A}}), dann ist \beta _{{a,b}}K die zugehörige Beta-Binomialverteilung auf \Omega '.

Darstellung als Daniell-stetige Abbildungen und Komposition

Jedem Markow-Kern K von (\Omega ,{\mathcal  A}) nach (\Omega ,{\mathcal  A}) ist auf dem Raum E^* der numerischen, nichtnegativen Funktionen f\colon \Omega \to [0,\infty ] über

(Tf)(\omega ):=\int f(\omega ')K(\omega ,d\omega ')

eine Abbildung T\colon E^{*}\to E^{*} mit folgenden Eigenschaften zugeordnet:

  1. f\geq 0\Rightarrow Tf\geq 0 für jedes f\in E^{*} (Positivität),
  2. f_{n}\uparrow f\Rightarrow Tf_{n}\uparrow Tf für jede monoton wachsende Folge (f_{n}) in E^* (Daniell-Stetigkeit, nach Percy John Daniell),
  3. T(f+g)=Tf+Tg (Additivität).

Zu jeder Abbildung T mit diesen Eigenschaften gibt es wiederum genau einen Kern, für den T die so gebildete Abbildung darstellt.

Aus der Komposition dieser Abbildungen T_{1}\circ T_{2} kann eine Definition für die Komposition der zugehörigen Kerne hergeleitet werden: Durch

K_{1}K_{2}(\omega ,A)=\int K_{1}(\omega ,{\mathrm  {d}}\omega ')K_{2}(\omega ',A)

ist ein stochastischer Kern von (\Omega ,{\mathcal  A}) nach (\Omega ,{\mathcal  A}) definiert, der als Komposition von K_{1} und K_{2} bezeichnet wird. Im diskreten Fall entspricht K_{1}K_{2} der Multiplikation der beiden Übergangsmatrizen.

Spezielle Anwendungen

Markow-Kerne finden breite Anwendung bei der Modellbildung etwa unter Zuhilfenahme von Markow- und Hidden-Markow-Modellen. In der Quantenphysik werden oft Übergangswahrscheinlichkeiten zwischen quantenmechanischen Zuständen untersucht. Außerdem werden Markow-Kerne in der mathematischen Statistik verwendet, um im Rahmen eines allgemeinen statistischen Entscheidungsproblems eine Entscheidungsfunktion zu definieren, die jedem Ausgang eines Experiments eine Entscheidung zuordnet. Dabei kann die Entscheidung sowohl eine Parameterschätzung als auch die Wahl eines Konfidenzintervalls oder die Entscheidung für oder gegen eine Hypothese sein.

Trenner
Basierend auf einem Artikel in: Wikipedia.de
Seitenende
Seite zurück
©  biancahoegel.de
Datum der letzten Änderung:  Jena, den: 19.04. 2019