Übergangskern

Als Übergangskern bezeichnet man spezielle Abbildungen zwischen Messräumen in der Wahrscheinlichkeitstheorie, die im ersten Argument messbar sind und im zweiten Argument ein Maß liefern. Spezialfälle von Übergangskernen sind die sogenannten stochastischen Kerne, die auch Markow-Kerne oder Wahrscheinlichkeitskerne genannt werden. Bei ihnen ist das Maß immer ein Wahrscheinlichkeitsmaß. Ist das Maß immer ein Sub-Wahrscheinlichkeitsmaß, so spricht man auch von Sub-Markow-Kernen oder substochastischen Kernen.

Insbesondere die Markow-Kerne spielen eine wichtige Rolle in der Wahrscheinlichkeitstheorie wie beispielsweise bei der Formulierung der regulären bedingten Verteilung oder der Theorie der stochastischen Prozesse. Hier bilden sie im Speziellen die Basis für die Formulierung der Übergangswahrscheinlichkeiten von Markow-Ketten oder Existenzaussagen wie den Satz von Ionescu-Tulcea.

Definition

Gegeben seien zwei Messräume $(\Omega_0, \mathcal A_0)$ und $(\Omega_1, \mathcal A_1)$ . Eine Abbildung $K \colon \Omega_0 \times \mathcal A_1 \to [0,\infty)$ heißt ein Übergangskern von $(\Omega_0, \mathcal A_0)$ nach $(\Omega_1, \mathcal A_1)$ , wenn gilt:

Für jedes $x \in \Omega_0$ ist $K(x,\;\cdot \;)$ ein Maß auf $(\Omega_1, \mathcal A_1)$ .
Für jedes $A_1 \in \mathcal A_1$ ist $K(\;\cdot\;, A_1)$ eine $\mathcal A_0$ -messbare Funktion.

Ist das Maß für alle $x \in \Omega_0$ ein σ-endliches Maß, so spricht man von einem σ-endlichen Übergangskern, ist es stets endlich, so spricht man von einem endlichen Übergangskern. Ist das Maß für alle $x \in \Omega_0$ ein Wahrscheinlichkeitsmaß, so nennt man einen stochastischen Kern oder Markow-Kern. Ist das Maß für alle $x \in \Omega_0$ ein Sub-Wahrscheinlichkeitsmaß, so heißt ein substochastischer Kern oder sub-Markow'scher-Kern.

Bemerkung: Bei manchen Definitionen werden die Argumente von in umgekehrter Reihenfolge geschrieben, K(A',x) oder auch K(A'|x) , in Anlehnung an bedingte Wahrscheinlichkeiten.

Elementare Beispiele

Die Poisson-Verteilung $\operatorname{Poi}_x(A) := K(x,A)$ ist ein Markow-Kern von $(\R_+, \mathcal B (\R_+))$ nach $(\N, \mathcal P(\N))$ . Denn die Funktion $f_A(x)=\operatorname{Poi}_x(A)$ mit Parameter $A \in \mathcal P(\N)$ stetig in $x \in \R_+$ und daher messbar. Des Weiteren ist für jedes $x \in \R_+$ die Poisson-Verteilung mit Parameter eine Wahrscheinlichkeitsverteilung. Also handelt es sich um einen Übergangskern.
Die stochastische Matrix

$A= \begin{pmatrix} 0 & \tfrac{1}{2} & \tfrac{1}{2} \\ \tfrac{1}{2} & \tfrac{1}{2} & 0 \\ \tfrac{1}{2} & 0 &\tfrac{1}{2}\end{pmatrix}$

kann als ein Markow-Kern von $(\{1,2,3\}, \mathcal P (\{1,2,3\}))$ nach $(\{1,2,3\}, \mathcal P (\{1,2,3\}))$ aufgefasst werden. Denn für jedes

ist die

-te Zeile ein Wahrscheinlichkeitsvektor und damit ein Wahrscheinlichkeitsmaß auf $\{1,2,3\}$ . Außerdem ist sie eine Abbildung zwischen endlichen Mengen versehen mit der Potenzmenge und damit messbar.

Eigenschaften

Maße durch Kerne

Jedem Maß $\mu$ auf $(\Omega ,{\mathcal A})$ ordnet durch

$\nu (A')=\int _{\Omega }K(x,A')\mu (dx)$

ein Maß $\nu$ auf $(\Omega ',{\mathcal A}')$ zu. Dieses Maß wird üblicherweise mit $\mu K$ bezeichnet. Ist $\mu$ ein Wahrscheinlichkeitsmaß, gilt also $\mu (\Omega )=1$ , dann ist auch $\mu K(\Omega ')=1$ , das heißt $\mu K$ ist ebenfalls ein Wahrscheinlichkeitsmaß.

Im Fall $(\Omega ,{\mathcal {A}})=(\Omega ',{\mathcal {A}}')$ wird ein Maß $\mu$ , für das $\mu =\mu K$ gilt, stationäres Maß genannt. Ein stationäres Wahrscheinlichkeitsmaß heißt auch stationäre Verteilung.

Messbare Funktionen durch Kerne

Jeder nichtnegativen messbaren Funktion $g\colon \Omega '\to \mathbb{R}$ > ordnet durch

$f(x)=\int _{{\Omega '}}g(y)K(x,dy)$

eine nichtnegative messbare Funktion $f\colon \Omega \to \mathbb{R}$ zu. Diese Funktion wird üblicherweise mit bezeichnet. Mit der Kurzschreibweise $\mu f=\int _{{\Omega }}f(x)\,\mu (dx)$ gilt für alle Maße $\mu$ auf $(\Omega ,{\mathcal A})$ und alle nichtnegativen messbaren Funktionen $g\colon \Omega '\to \mathbb{R}$ die Gleichung $(\mu K)g=\mu (Kg)$ .

Diskreter Fall

Im diskreten Fall, wo $\Omega$ und $\Omega '$ endliche oder abzählbare Mengen sind, genügt es die Wahrscheinlichkeiten $p_{{i,j}}$ anzugeben, mit denen man vom Zustand in den Zustand gelangt. Mit den Bezeichnungen des allgemeinen Falls gilt dann $p_{{i,j}}=K(i,\{j\})$ . Diese Wahrscheinlichkeiten bilden eine Übergangsmatrix $M=(p_{{i,j}})_{{i\in \Omega ,j\in \Omega '}}$ , die die Eigenschaft hat, dass alle Elemente zwischen $0$ und liegen und dass die Zeilensummen $\sum _{{j\in \Omega '}}p_{{i,j}}$ den Wert haben. Eine solche Matrix wird als stochastische Matrix bezeichnet. Sie ordnet jeder Wahrscheinlichkeitsverteilung auf $\Omega$ mit einer Zähldichte $\rho =(\rho _{i})_{{i\in \Omega }}$ die Zähldichte

$\rho M={\Bigl (}\sum _{{i\in \Omega }}\rho _{i}p_{{i,j}}{\Bigr )}_{{j\in \Omega '}}$

einer Wahrscheinlichkeitsverteilung auf $\Omega '$ zu, das heißt $\rho M$ wird mit der üblichen Matrixmultiplikation berechnet, wobei Zähldichten als Zeilenvektoren aufgefasst werden.

Ist $g\colon \Omega '\to \mathbb{R}$ eine nichtnegative Funktion, aufgefasst als Spaltenvektor $(g_{j})_{{j\in \Omega '}}$ mit nichtnegativen Einträgen, dann gilt

$Kg={\Bigl (}\sum _{{j\in \Omega '}}p_{{i,j}}g_{j}{\Bigr )}_{{i\in \Omega }}$ .

Das heißt, im diskreten Fall wird auch , aufgefasst als Spaltenvektor mit Indizes in $\Omega$ , mit der üblichen Matrixmultiplikation berechnet.

Bemerkung: Bei manchen Definitionen werden Zeilen und Spalten der Matrix umgekehrt verwendet.

Operationen von Übergangskernen

Verkettung

Sind drei Messräume $(\Omega_0, \mathcal A_0), \; (\Omega_1, \mathcal A_1), \, (\Omega_2, \mathcal A_2)$ gegeben sowie zwei substochastische Kerne $K_{1}$ von $(\Omega_0, \mathcal A_0)$ nach $(\Omega_1, \mathcal A_1)$ und $K_{2}$ von $(\Omega_1, \mathcal A_1)$ nach $(\Omega_2, \mathcal A_2)$ , so ist die Verkettung der Kerne $K_{1}$ und $K_{2}$ eine Abbildung

$K_1 \cdot K_2 \colon \Omega_0 \times \mathcal A_2 \to [0,\infty)$

definiert durch

$(K_1 \cdot K_2) (x_0,A_2)=\int_{\Omega_1}K_1(x_0, \mathrm d x_1)K_2(x_1,A_2)$ .

Die Verkettung ist dann ein substochastischer Kern von $(\Omega_0, \mathcal A_0 )$ nach $(\Omega_2, \mathcal A_2 )$ . Sind $K_{1}$ und $K_{2}$ stochastisch, dann ist auch $K_{1}\cdot K_{2}$ stochastisch.

Produkte

Gegeben seien die Maßräume $(\Omega _{1},{\mathcal {A}}_{1}),(\Omega _{2},{\mathcal {A}}_{2})$ und $(\Omega _{3},{\mathcal {A}}_{3})$ und zwei endliche Übergangskerne $K_{1}$ von $(\Omega_1, \mathcal A_1)$ nach $(\Omega_2, \mathcal A_2)$ und $K_{2}$ von $(\Omega _{1}\times \Omega _{2},{\mathcal {A}}_{1}\otimes {\mathcal {A}}_{2})$ nach $(\Omega _{3},{\mathcal {A}}_{3})$ . Dann definiert man das Produkt der Kerne $K_{1}$ und $K_{2}$

$K_{1}\otimes K_{2}\colon \Omega _{1}\times ({\mathcal {A}}_{2}\otimes {\mathcal {A}}_{3})\to [0,\infty )$

als

$(\omega _{1},A)\mapsto \int _{\Omega _{2}}K_{1}(\omega _{1},\mathrm {d} \omega _{2})\int _{\Omega _{3}}K_{2}((\omega _{1},\omega _{2}),\mathrm {d} \omega _{3})\chi _{A}((\omega _{2},\omega _{3}))$ .

Das Produkt $K_{1}\otimes K_{2}$ ist dann ein σ-endlicher Übergangskern von $(\Omega_1, \mathcal A_1)$ nach $(\Omega _{2}\times \Omega _{3},{\mathcal {A}}_{2}\otimes {\mathcal {A}}_{3})$ . Sind beide Kerne stochastisch (bzw. substochastisch), so ist auch das Produkt der Kerne stochastisch (bzw. substochastisch).

Ist $K_{2}$ nur ein Kern von $(\Omega _{2},{\mathcal {A}}_{2})$ nach $(\Omega _{3},{\mathcal {A}}_{3})$ , so fasst man den Kern als Kern von $(\Omega _{1}\times \Omega _{2},{\mathcal {A}}_{1}\otimes {\mathcal {A}}_{2})$ auf, der unabhängig von der ersten Komponente ist.

Weitere Beispiele

Ist $\nu \colon {\mathcal {A}}'\to [0,1]$ ein Wahrscheinlichkeitsmaß auf $(\Omega ',{\mathcal {A}}')$ , dann ist $K(x,A')=\nu (A')$ eine (von $x\in \Omega$ unabhängige) Übergangswahrscheinlichkeit.
Für $(\Omega ,{\mathcal {A}})=(\Omega ',{\mathcal {A}}')$ und dem Diracmaß $\delta _{x}$ im Punkt $x\in \Omega$ wird durch $I(x,A)=\delta _{x}(A)$ eine Übergangswahrscheinlichkeit von $(\Omega ,{\mathcal {A}})$ nach $(\Omega ,{\mathcal {A}})$ definiert, die auch Einheitskern genannt wird. Es gilt $\mu I=\mu$ für alle Maße $\mu$ auf $(\Omega ,{\mathcal {A}})$ und für alle nichtnegativen messbaren Funktionen $f\colon \Omega \to \mathbb {R}$ .
Sind $k\colon \Omega \times \Omega '\to \mathbb{R}$ eine nichtnegative und bezüglich der Produkt-σ-Algebra ${\mathcal {A}}\otimes {\mathcal {A}}'$ messbare Funktion und $\nu$ ein Maß auf $(\Omega ',{\mathcal {A}}')$ mit $\int _{{\Omega '}}k(x,y)\,\nu (dy)=1$ für alle $x\in \Omega$ , dann wird durch

$K(x,A')=\int _{{A'}}k(x,y)\,\nu (dy)$

eine Übergangswahrscheinlichkeit definiert. Hier ist also $K(x,\;\cdot \;)$ das Wahrscheinlichkeitsmaß auf $(\Omega ',{\mathcal {A}}')$ mit der $\nu$ -Wahrscheinlichkeitsdichte $k(x,\;\cdot \;)$ .

Sei $n\in \mathbb {N}$ fest und $B_{{n,p}}$ die Binomialverteilung mit Parametern und , aufgefasst als Wahrscheinlichkeitsmaß auf $\Omega '=\{0,1,\dotsc ,n\}$ . Dann wird durch

$K(p,A')=B_{{n,p}}(A')$

eine Übergangswahrscheinlichkeit von $(\Omega ,{\mathcal {A}})=([0,1],{\mathcal {B}}([0,1]))$ nach $(\Omega ',{\mathcal {P}}(\Omega '))$ definiert. Ist beispielsweise $\beta _{{a,b}}$ eine Betaverteilung auf $(\Omega ,{\mathcal {A}})$ , dann ist $\beta _{{a,b}}K$ die zugehörige Beta-Binomialverteilung auf $\Omega '$ .

Darstellung als Daniell-stetige Abbildungen und Komposition

Jedem Markow-Kern von $(\Omega ,{\mathcal A})$ nach $(\Omega ,{\mathcal A})$ ist auf dem Raum E^* der numerischen, nichtnegativen Funktionen $f\colon \Omega \to [0,\infty ]$ über

$(Tf)(\omega ):=\int f(\omega ')K(\omega ,d\omega ')$

eine Abbildung $T\colon E^{*}\to E^{*}$ mit folgenden Eigenschaften zugeordnet:

$f\geq 0\Rightarrow Tf\geq 0$ für jedes $f\in E^{*}$ (Positivität),
$f_{n}\uparrow f\Rightarrow Tf_{n}\uparrow Tf$ für jede monoton wachsende Folge $(f_{n})$ in (Daniell-Stetigkeit, nach Percy John Daniell),
(Additivität).

Zu jeder Abbildung mit diesen Eigenschaften gibt es wiederum genau einen Kern, für den die so gebildete Abbildung darstellt.

Aus der Komposition dieser Abbildungen $T_{1}\circ T_{2}$ kann eine Definition für die Komposition der zugehörigen Kerne hergeleitet werden: Durch

$K_{1}K_{2}(\omega ,A)=\int K_{1}(\omega ,{\mathrm {d}}\omega ')K_{2}(\omega ',A)$

ist ein stochastischer Kern von $(\Omega ,{\mathcal A})$ nach $(\Omega ,{\mathcal A})$ definiert, der als Komposition von $K_{1}$ und $K_{2}$ bezeichnet wird. Im diskreten Fall entspricht $K_{1}K_{2}$ der Multiplikation der beiden Übergangsmatrizen.

Spezielle Anwendungen

Markow-Kerne finden breite Anwendung bei der Modellbildung etwa unter Zuhilfenahme von Markow- und Hidden-Markow-Modellen. In der Quantenphysik werden oft Übergangswahrscheinlichkeiten zwischen quantenmechanischen Zuständen untersucht. Außerdem werden Markow-Kerne in der mathematischen Statistik verwendet, um im Rahmen eines allgemeinen statistischen Entscheidungsproblems eine Entscheidungsfunktion zu definieren, die jedem Ausgang eines Experiments eine Entscheidung zuordnet. Dabei kann die Entscheidung sowohl eine Parameterschätzung als auch die Wahl eines Konfidenzintervalls oder die Entscheidung für oder gegen eine Hypothese sein.

Basierend auf einem Artikel in:

Wikipedia.de