Indikatorfunktion

Die Indikatorfunktion (auch charakteristische Funktion genannt) ist eine Funktion in der Mathematik, die sich dadurch auszeichnet, dass sie nur einen oder zwei Funktionswerte annimmt. Sie ermöglicht es, komplizierte Mengen mathematisch präzise zu fassen und auf ihnen Funktionen wie zum Beispiel die Dirichlet-Funktion zu definieren.

Definition

zweidimensionale Indikatorfunktion einer Untermenge eines Quadrates

In der Literatur finden sich mehrere Schreibweisen für die charakteristische Funktion. Neben der hier verwendeten mittels $\chi _{T}$ sind ebenfalls die Schreibweisen $\xi _{T}$ und $\mathbf {1} _{T}$ gebräuchlich.^[1]

Reellwertige charakteristische Funktion

Gegeben sei eine Grundmenge und eine Teilmenge $T\subseteq X$ . Die Funktion $\chi _{T}\colon X\to \{0,1\}$ definiert durch

$\chi _{T}(x)={\begin{cases}1,&{\text{falls }}x\in T,\\0,&{\text{falls }}x\notin T\end{cases}}$

heißt dann die charakteristische Funktion oder Indikatorfunktion der Menge . Die Zuordnung ${\mathcal {P}}(X)\to 2^{X},\,T\mapsto \mathrm {\chi } _{T},$ liefert eine Bijektion zwischen der Potenzmenge ${\mathcal {P}}(X)$ und der Menge aller Funktionen von in die Menge $\{0,1\}.$

Erweiterte charakteristische Funktion

In der Optimierung wird die charakteristische Funktion teils als erweiterte Funktion definiert. Hier heißt dann die Funktion $\chi _{T}\colon X\to \{0,+\infty \}$ definiert durch

$\chi _{T}(x)={\begin{cases}0,&{\text{falls }}x\in T,\\+\infty ,&{\text{falls }}x\notin T\end{cases}}$

die charakteristische Funktion oder Indikatorfunktion der Menge . Sie ist eine echte Funktion, wenn nicht leer ist.

Partielle charakteristische Funktion

Bei der Bildung der partiellen charakteristischen Funktion wird die Definitionsmenge auf eingeschränkt; im Sinne von partiellen Funktionen kann man sie also wie folgt beschreiben:

$\chi _{T}'\colon X\rightsquigarrow \{0,1\},\;x\mapsto {\begin{cases}1,&{\text{falls }}x\in T,\\{\text{undefiniert}}&{\text{sonst}}.\end{cases}}$

Verwendung der unterschiedlichen Definitionen

Die reellwertige charakteristische Funktion wird häufig in der Integrationstheorie und in der Stochastik verwendet, da sie es ermöglicht, Integrale der Funktion über die Menge durch Integrale von $f\cdot \chi _{T}$ über die Grundmenge zu ersetzen:

$\int _{T}f\left(x\right)\mathrm {d} x=\int _{X}f\left(x\right)\cdot \chi _{T}\left(x\right)\mathrm {d} x$ .

Dadurch lassen sich zum Beispiel oft Fallunterscheidungen vermeiden.

Die erweiterte charakteristische Funktion wird in der Optimierung verwendet, um Funktion auf Teilbereiche einzuschränken, auf denen sie gewisse gewünschte Eigenschaften wie z. B. Konvexität besitzen, oder um Restriktionsmengen zu modellieren.

Die partielle charakteristische Funktion findet Verwendung in der Berechenbarkeitstheorie.

Eigenschaften und Rechenregeln der reellwertigen charakteristischen Funktion

Die Menge $T\subset X$ ist durch ihre charakteristische Funktion eindeutig bestimmt. Es gilt

$T=\chi _{T}^{-1}(\{1\})=\{x\in X\,|\,\chi _{T}(x)=1\}$ .

Für $S,T\subset X$ folgt also aus der Gleichheit $\chi _{S}=\chi _{T}$ die Gleichheit $S=T$ der Mengen.

Die charakteristische Funktion $\chi _{\varnothing }$ der leeren Menge ist die Nullfunktion. Die charakteristische Funktion $\chi _{X}$ der Grundmenge ist die konstante Funktion mit dem Wert 1.
Es seien Mengen $S,T\subset X$ gegeben. Dann gilt für die Schnittmenge

$\chi _{S\cap T}=\min(\chi _{S},\chi _{T})=\chi _{S}\chi _{T}$

und für die Vereinigungsmenge

$\chi _{S\cup T}=\max(\chi _{S},\chi _{T})=\chi _{S}+\chi _{T}-\chi _{S}\chi _{T}$ .

Für die Differenzmenge ist

$\chi _{S\setminus T}=\chi _{S}-\chi _{S}\chi _{T}$ .

Insbesondere gilt für das Komplement $T^{\mathsf {C}}=X\setminus T$

> $\chi _{T^{\mathsf {C}}}=1-\chi _{T}$ .

Verwendung zur Berechnung von Erwartungswert, Varianz und Kovarianz

Für einen gegebenen Wahrscheinlichkeitsraum $(\Omega ,{\mathcal {F}},\mathrm {P} )$ und ein Ereignis $A\in {\mathcal {F}}$ ist die Indikatorfunktion $\chi _{A}\colon \Omega \rightarrow \mathbb {R}$ eine bernoulliverteilte Zufallsvariable. Insbesondere gilt für den Erwartungswert

$\operatorname {E} (\chi _{A})=\operatorname {P} (A)$

und für die Varianz

$\operatorname {Var} (\chi _{A})=\operatorname {P} (A)(1-\operatorname {P} (A))$ .

Die Varianz von $\chi _{A}$ nimmt also ihren maximalen Wert ${\tfrac {1}{4}}$ im Fall $\operatorname {P} (A)={\tfrac {1}{2}}$ an.

Ist zusätzlich $B\in {\mathcal {F}}$ , dann gilt für die Kovarianz

$\operatorname {Cov} (\chi _{A},\chi _{B})=\operatorname {P} (A\cap B)-\operatorname {P} (A)\operatorname {P} (B)$ .

Zwei Indikatorvariablen sind also genau dann unkorreliert, wenn die zugehörigen Ereignisse stochastisch unabhängig sind.

Sind $A_{1},A_{2},\dotsc ,A_{n}\in {\mathcal {F}}$ beliebige Ereignisse, dann gibt die Zufallsvariable

$N=\sum _{i=1}^{n}\chi _{A_{i}}$

die Anzahl derjenigen Ereignisse an, die eingetreten sind. Wegen der Linearität des Erwartungswerts gilt dann

$\operatorname {E} (N)=\sum _{i=1}^{n}\operatorname {P} (A_{i})$ .

Diese Formel gilt auch dann, wenn die Ereignisse abhängig sind. Sind sie zusätzlich paarweise unabhängig, dann gilt nach der Gleichung von Bienaymé für die Varianz

$\operatorname {Var} (N)=\sum _{i=1}^{n}\operatorname {Var} (\chi _{A_{i}})=\sum _{i=1}^{n}\operatorname {P} (A_{i})(1-\operatorname {P} (A_{i}))$ .

Im allgemeinen Fall kann die Varianz über die Formel

$\operatorname {Var} (N)=\sum _{i,j=1}^{n}\operatorname {Cov} (\chi _{A_{i}},\chi _{A_{j}})=\sum _{i,j=1}^{n}\operatorname {P} (A_{i}\cap A_{j})-\sum _{i,j=1}^{n}\operatorname {P} (A_{i})\operatorname {P} (A_{j})$

bestimmt werden.

Siehe auch

Diracmaß

Anmerkungen

↑ Die Bezeichnung $\mathrm {1} _{T}$ wird aber auch für die Identitätsrelation bzw. -abbildung verwendet und kann daher leicht zu Verwechselungen führen.

Basierend auf einem Artikel in:

Wikipedia.de