Empirische Verteilung (Wahrscheinlichkeitsverteilung)
Die empirische Verteilung ist eine spezielle Wahrscheinlichkeitsverteilung in der Stochastik, einem Teilgebiet der Mathematik. Sie gehört zu den diskreten Wahrscheinlichkeitsverteilungen und stellt eine Beziehung zwischen der deskriptiven Statistik und der Wahrscheinlichkeitstheorie her. So ist der Erwartungswert der empirischen Verteilung das arithmetische Mittel der zugrundeliegenden Stichprobe, ebenso wie die Verteilungsfunktion der empirischen Verteilung die empirische Verteilungsfunktion ist.
Definition
Gegeben sei ein Vektor .
Es bezeichne
das Dirac-Maß
auf
,
das gegeben ist durch
.
Dann heißt die Wahrscheinlichkeitsverteilung auf den reellen Zahlen, gegeben durch
die empirische Verteilung von
auf den reellen Zahlen.
Es ist also
Dabei bezeichnet
die Mächtigkeit
der Menge, also die Anzahl ihrer Elemente und
enthält die Indizes der Elemente des Vektors
,
die in
enthalten sind. Anschaulich wird somit zuerst gezählt, wie viele Komponenten des
Vektors
in der Menge
enthalten sind. Diese Zahl, geteilt durch die Gesamtzahl der Komponenten, ist
dann die Wahrscheinlichkeit der Menge
.
Die empirische Verteilung kann auch auf allgemeineren Grundräumen
definiert werden, dann ist
.
Dieser Artikel behandelt aber weiterhin den Fall
.
Wahrscheinlichkeitsfunktion
Sind alle Komponenten von
verschieden, ist also
für
,
so entspricht die Wahrscheinlichkeitsfunktion
der empirischen Verteilung der einer diskreten
Gleichverteilung auf
und ist gegeben durch
Tritt eine Komponente -mal
auf, so ist der Wert der Wahrscheinlichkeitsfunktion dort entsprechend
.
Verteilungsfunktion
Die Verteilungsfunktion der empirischen Verteilung ist die empirische Verteilungsfunktion und damit gegeben durch
.
Hierbei ist
die Indikatorfunktion
der Menge
.
Eigenschaften
Gegeben sei eine Zufallsvariable ,
welche gemäß der empirischen Verteilung (mit
)
verteilt ist. Dann sind die wahrscheinlichkeitstheoretischen Kennzahlen von
wie Erwartungswert
und Quantile
genau die korrespondierenden Kennzahlen der deskriptiven
Statistik der Stichprobe
wie das arithmetisches
Mittel und die empirischen
Quantile.
Erwartungswert
Der Erwartungswert
der empirischen Verteilung ist das arithmetische Mittel von
(siehe Gewichtetes
arithmetisches Mittel als Erwartungswert), also
Varianz
Die Varianz der empirischen Verteilung ist die (unkorrigierte) empirische Varianz, also
.
Hierbei bezeichnet
das arithmetische Mittel bzw. den Erwartungswert.
Median und Quantile
Der Median
(im Sinne der Wahrscheinlichkeitstheorie) der empirischen Verteilung
entspricht dem Median der Stichprobe ,
ebenso entsprechen die Quantile
der empirischen Verteilung den empirischen
Quantilen.
Modus
Der Modus
(im Sinne der Wahrscheinlichkeitstheorie) der empirischen Verteilung
entspricht dem Modus
der Stichprobe .
Weitere Streumaße
Des Weiteren gilt:
- Die Standardabweichung der empirischen Verteilung entspricht der empirischen Standardabweichung.
- Der Variationskoeffizient der empirischen Verteilung entspricht dem empirischen Variationskoeffizienten.



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 04.07. 2020