Median (Stochastik)
Der Median, auch Zentralwert genannt, ist in der Stochastik ein Lagemaß für Wahrscheinlichkeitsverteilungen und Verteilungen von Zufallsvariablen. Somit ist er wie auch der Erwartungswert und der Modus eine Kennzahl dafür, wo sich die "Mitte" einer Wahrscheinlichkeitsverteilung befindet. Anschaulich ist der Median die Zahl, bei der
- die Wahrscheinlichkeit, einen Wert kleiner oder gleich dem Median zu erhalten und
- die Wahrscheinlichkeit, einen Wert größer oder gleich dem Median zu erhalten
gleich ist. Es existieren mehrere Formalisierungen dieser intuitiven Vorstellung, die sich bezüglich der Existenz und Eindeutigkeit des Medians unterscheiden.
In der deskriptiven Statistik wird der Median für Stichproben definiert. Die beiden Begriffe unterscheiden sich insofern, als der eine Kennzahl einer Stichprobe ist (ähnlich dem arithmetischen Mittel), der andere eine Kennzahl einer Wahrscheinlichkeitsverteilung ist (ähnlich dem Erwartungswert). Die beiden sind per se verschieden, lassen aber über die empirische Verteilung verknüpfen.
Erste Definition
Für Wahrscheinlichkeitsverteilungen
Gegeben sei eine Wahrscheinlichkeitsverteilung
auf
,
also den reellen Zahlen, versehen
mit der Borelschen
σ-Algebra.
Dann heißt eine reelle Zahl
ein Median (von
),
wenn gilt:
und
.
Für Zufallsvariablen
Gegeben sei eine reelle Zufallsvariable
.
Dann heißt eine reelle Zahl
ein Median (von
),
wenn gilt:
und
.
Damit ist der Median der Zufallsvariable
genau der Median ihrer
Verteilung
.
Definition über Verteilungsfunktionen
Ebenso lässt sich der Median auch über Verteilungsfunktionen
definieren. Ist
die Verteilungsfunktion von
oder von
,
so heißt
ein Median (von
oder von
),
wenn
und
.
Hierbei bezeichnet
den linksseitigen
Grenzwert.
Bestimmung und Beispiele
Bei stetiger Verteilungsfunktion
Ist die Verteilungsfunktion
stetig, so ist der Median
eine Lösung der Gleichung
Dies beruht auf der Tatsache, dass der linksseitige Grenzwert dann mit dem Funktionswert übereinstimmt.
- Beispiele

Betrachtet man als Beispiel die Exponentialverteilung, so besitzt diese die Verteilungsfunktion
für einen Parameter .
Gleichsetzen mit
führt auf die Gleichung
,
welche die Lösung
besitzt. In diesem Fall ist der Median eindeutig.

Aber auch bei stetiger Verteilungsfunktion kann der Median mehrdeutig sein.
Betrachtet man beispielsweise die Cantor-Verteilung,
deren Verteilungsfunktion rechts abgebildet ist, so nimmt diese aufgrund ihrer
Konstruktion auf dem gesamten Intervall
der Wert
an. Jeder Punkt in diesem Intervall ist somit ein Median. Eindeutig ist der
Median bei stetiger Verteilungsfunktion beispielsweise dann, wenn die
Verteilungsfunktion streng monoton wachsend ist. Spezieller gilt die
Eindeutigkeit bereits dann, wenn die Verteilungsfunktion in der einer Umgebung,
in der sie den Wert
annimmt, streng monoton wachsend ist.
Bei Wahrscheinlichkeitsdichten
Besitzt die Zufallsvariable beziehungsweise die Wahrscheinlichkeitsverteilung
eine Wahrscheinlichkeitsdichtefunktion
,
(sie ist demnach eine Absolutstetige
Verteilung), so ist der Median
Lösung der Gleichung
.
Dies folgt direkt aus der Tatsache, dass absolutstetige Verteilungen immer eine stetige Verteilungsfunktion besitzen, diese sich über das Integral bestimmen lässt und der Aussage im obigen Abschnitt.
Mehrere Mediane treten hier beispielsweise auf, wenn die Wahrscheinlichkeitsdichtefunktion auf einem Interval konstant null ist.
- Beispiel
Betrachtet man die Wahrscheinlichkeitsfunktion
,
so ist diese im Interval
konstant Null. Über die elementaren Integrationsregeln folgt dann, dass jeder
Wert in
ein Median ist. Das Lösen der Integralgleichung entspricht meist der Bestimmung
der entsprechenden Verteilungsfunktion und kann damit als Spezialfall des
Vorgehens im oberen Abschnitt angesehen werden.
Eindeutige Definition
Gegeben sei eine Wahrscheinlichkeitsverteilung
oder eine reelle Zufallsvariable
.
Sei
die Verteilungsfunktion von
bzw.
.
Dann heißt
der Median von
bzw.
.
Dies entspricht der folgenden Definition: Ist
die Quantilfunktion
zu
,
so ist der Median definiert als
.
Wegen der Rechtsstetigkeit der Verteilungsfunktion kann bei der oberen der beiden Definitionen das Infumum auch durch ein Minimum ersetzt werden.
Eigenschaften
Bei dem Median handelt es sich um ein Quantil, genauer um das 50%-Quantil.
Ist die Verteilung
symmetrisch, gilt also ,
so ist Null ein Median. Allgemeiner ist bei jeder symmetrischen Verteilung die
Symmetrieachse ein Median.
Jeder Median
minimiert die absolute Abweichung, sprich ist
eine Zufallsvariable mit
,
so gilt stets
für alle
und Gleichheit gilt genau dann, wenn auch
ein Median ist.
Beziehung zum Median der deskriptiven Statistik
Der Median in der deskriptiven
Statistik (als Kennzahl einer Stichprobe) lässt sich über die
empirische
Verteilung mit dem Median einer Wahrscheinlichkeitsverteilung in Beziehung
setzen: Ist eine Stichprobe
gegeben, und ist
die empirische Verteilung auf
so ist ein Median (im Sinne der Wahrscheinlichkeitstheorie) von
ein Median (im Sinne der deskriptiven Statistik) von
.
Aufgrund der verschiedenen Definitionen kann es jedoch auch zu leichten
Abweichungen kommen.
Weitere Definitionen
Am direktesten wird der Median als derjenige Wert, für den
gilt oder als
definiert. In beiden Definitionen ist die Existenz des Medians aber nicht
garantiert. So ist für
immer ,
da die Verteilungsfunktion nie den Wert
annimmt. Ebenso existiert kein
,
so dass die obige Gleichungskette erfüllt ist: für alle
ist
,
ebenso wie für alle
immer
gilt.
Außerdem ist zu beachten, dass die Verteilungsfunktionen im älterer
russischsprachiger Literatur als linksstetig und nicht wie im deutschen
Sprachraum als rechtsstetig definiert werden. So ist dann zum Beispiel im Falle
des fairen Münzwurfes einmal
anstelle von
.



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 04.07. 2020