Randverteilung
Als Randverteilungen oder Marginalverteilung werden in der Stochastik die Wahrscheinlichkeitsverteilungen
von Teilfamilien einer gegebenen Familie
von Zufallsvariablen
bezeichnet. Die Verteilung der gesamten Familie wird zur Verdeutlichung auch gemeinsame
Verteilung der Zufallsvariablen genannt. Sind beispielsweise
und
Zufallsvariablen (auf demselben Wahrscheinlichkeitsraum),
dann heißen die Verteilungen der einzelnen Variablen
und
die Randverteilungen des Zufallsvektors
.
Randverteilungen kann man sowohl für diskrete als auch für stetige Merkmale berechnen. Wie bei Verteilungen allgemein unterscheidet man dementsprechend:
Außerdem kann man die Randverteilung sowohl für absolute Häufigkeiten als auch für relative Häufigkeiten bilden. Die einzelnen Werte der Randverteilung nennt man dann Randhäufigkeiten (auch Marginalhäufigkeiten oder marginale Häufigkeiten). Die Randhäufigkeiten für kategorial unterteilte (distinkte) Merkmale lassen sich am Rand einer Kontingenztafel ablesen. Sie sind hier die Summen der Häufigkeiten über das vernachlässigte Merkmal hinweg.
Beispiel anhand von Kontingenztafeln
Randverteilungen diskreter Merkmale lassen sich in Kontingenztafeln darstellen. Am Rand dieser Tafel lassen sich die Randhäufigkeiten, die zusammen die Randverteilung bilden, als Summen über das vernachlässigte Merkmal ablesen.
Beispielsweise ist hier eine Kontingenztafel mit absoluten Häufigkeiten zu sehen. Dasselbe wäre auch mit relativen Häufigkeiten denkbar.
-
-
Mann Frau Randhäufigkeiten Klasse 10 10 10 20 Klasse 11 4 16 20 Randhäufigkeiten 14 26 40
-
Die Randhäufigkeit in der Klasse 10 zu sein unter der Vernachlässigung dessen, ob man männlich oder weiblich ist, beträgt 20. Die entsprechende Randhäufigkeit für Klasse 11 ist ebenso 20. Die Randverteilung ist also gleichverteilt, weil es gleich viele Schüler in beiden Klassen gibt. Das Merkmal Klasse ist distinkt, das heißt in klar abgegrenzte Kategorien unterteilt.
Es gibt allerdings auch Merkmale, die nicht in Kategorien unterteilt sind, wie zum Beispiel Körpergröße. Diese Merkmale sind stetig, weil es fließende Übergänge zwischen allen möglichen Ausprägungen des Merkmals gibt. Solche Merkmale lassen sich nicht in Tabellen darstellen. Um die Darstellung in einer Kontingenztafel dennoch zu ermöglichen ist es möglich, das Merkmal in Klassen (gemeint sind hier Kategorien) einzuteilen, indem man sogenannte Klassengrenzen festlegt. Das stetige Merkmal Körpergröße könnten man einteilen, indem man als Klassengrenze 142 cm festlegt und die Personen in Leute größer als 142 cm und nicht größer als 142 cm einteilt. Für diese in Klassen eingeteilte Gruppen lassen sich nun wieder Klassenhäufigkeiten messen, die man in einer Kontingenztafel einträgt. Da eine Person, die in einer Klasse (> 142) ist, nicht gleichzeitig auch in einer anderen Klasse (≤ 142) sein kann, spricht man auch von einer Einteilung in disjunkte Mengen.
Definition
Gegeben sei eine höherdimensionale Zufallsvariable
mit einer multivariaten
Verteilung
als Wahrscheinlichkeitsmaß.
Dann heißt die Verteilung
die i-te Randverteilung oder die i-te Marginalverteilung von
.
Alternativ wird sie auch definiert als
.
Im Zweidimensionalen mit
wäre also die erste Randverteilung
.
Allgemeiner lassen sich Randverteilungen auch für jede Teilmenge
definieren. Ist
,
so heißen sie m-dimensionale Randverteilungen. Sie sind dann definiert durch
für
.
Elementare Eigenschaften
- Es existieren genau
m-dimensionale Randverteilungen.
- Aus Sicht der Maßtheorie handelt es sich bei Randverteilungen um die Bildmaße unter den Projektionen auf eine oder mehrere Koordinaten.
- Sind die
stochastisch unabhängige Zufallsvariablen, so ist die gemeinsame Verteilung der
genau das Produkt der eindimensionalen Randverteilungen.
Abgeleitete Begriffe
Rand-Verteilungsfunktion
Besitzt
die Verteilungsfunktion
,
so lässt sich auch eine Rand-Verteilungsfunktion als Verteilungsfunktion
der Randverteilungen angeben. Für die eindimensionalen Randverteilungen ist sie
definiert als
.
Alle Komponenten bis auf die i-te werden also auf unendlich gesetzt. Analog
geht man bei den m-dimensionalen Rand-Verteilungsfunktionen vor. Alle
Komponenten in
bleiben erhalten, alle anderen werden auf unendlich gesetzt. Für den
zweidimensionalen Fall mit
ergibt sich dann als die erste Randverteilungsfunktion
.
Randdichte
Ebenso lassen sich für Randverteilungen auch Wahrscheinlichkeitsdichten
angeben, die Randdichten genannt werden. Das sind diejenigen Funktionen
,
für die
gilt. Besitzt
eine gemeinsame Dichte
,
so lässt sich die Rand-Dichte auch als
definieren. Für m-dimensionale Rand-Dichten geht man analog vor, man
integriert dann über alle Komponenten, die nicht in
enthalten sind. Im Zweidimensionalen mit
erhält man dann mittels Integration über die jeweils andere Komponente als
Rand-Dichten
Rand-Wahrscheinlichkeitsfunktion
Ebenso wie Rand-Dichten lassen sich auch
Rand-Wahrscheinlichkeitsfunktionen angeben. Im Wesentlichen wird dabei
nur die Integration durch die Summation ersetzt. Hat
eine gemeinsame Wahrscheinlichkeitsfunktion
,
so ist die i-te Rand-Wahrscheinlichkeitsfunktion gegeben als
.
Ebenso erhält man die m-dimensionalen Randverteilungen durch Summation, wenn
man die Komponenten von Interesse nicht mitsummiert. Im zweidimensionalen mit
ergibt sich dann
.
Beispiel Multinomialverteilung
In zwei Dimensionen
Sei als Beispiel
zweidimensional multinomialverteilt, also
.
Demnach hat
die Wahrscheinlichkeitsfunktion
.
Hierbei ist
der Multinomialkoeffizient.
Setzt man
,
so ergibt sich direkt
.
Die Wahrscheinlichkeitsfunktion lässt sich also unabhängig von
darstellen. Demnach ist die Randdichte von
,
die durch Aufsummieren über alle
entsteht, wieder genau die Wahrscheinlichkeitsfunktion von
,
bloß ohne
als Variable. Es ist also
,
die Randverteilung der Multionomialverteilung ist also eine Binomialverteilung
mit den Parametern
und
.
In mehreren Dimensionen
Sei
und
-dimensional
multinomialverteilt, also
mit
.
Die Wahrscheinlichkeitsfunktion ist dann
.
Zur Berechnung der ersten Randverteilung summiert man nun über alle .
Zur Vereinfachung der Rechnung gruppiert man
und
.
Mithilfe desMultinomialtheorems
folgt dann, dass die Randverteilung wieder binomialverteilt ist mit den
Parametern
und
.
Verwandte Konzepte
Oftmals sollen einerseits Randverteilungen mit einer speziellen Verteilung generiert werden. Anderseits soll die gemeinsame Verteilung von Zufallsvariablen mit ihren Abhängigkeiten richtig dargestellt werden. Solche multivariaten Verteilungen sind nicht nur durch die Randverteilungen und die Korrelation beschrieben, vielmehr muss die Abhängigkeit oftmals genauer beschrieben und modelliert werden. Z.B. erwartet man bei der Modellierung von Bondreturns möglicherweise, dass auch der Spread zwischen den beiden Returns in einem plausiblen Korridor verbleibt. Daher ist es bei der Modellierung von multivariaten Verteilungen oftmals notwendig oder nützlich, die Randverteilungen und ihre Abhängigkeit voneinander separat zu modellieren. Dies erfolgt über die Kalibrierung einer Copula.
Mittels der Randverteilungen lässt sich aus einer multivariaten Verteilung die bedingte Verteilung bestimmen. Sie modelliert, dass bereits Wissen über den Wert einer Zufallsvariable vorhanden ist.



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 22.02. 2024