Verallgemeinerte hypergeometrische Verteilung

Die multivariate hypergeometrische Verteilung, auch verallgemeinerte hypergeometrische Verteilung, allgemeine hypergeometrische Verteilung oder polyhypergeometrische Verteilung genannt, ist eine multivariate Wahrscheinlichkeitsverteilung und zählt zu den diskreten Wahrscheinlichkeitsverteilungen. Sie ist eine multivariate Verallgemeinerung der hypergeometrischen Verteilung und kann aus dem Urnenmodell abgeleitet werden.

Definition

Eine Zufallsvariable X mit Werten in \{(b_{1},\ldots ,b_{k})\in {\mathbb  {N}}_{0}^{k}\,|\,b_{1}+\ldots +b_{k}=n\} heißt multivariat hypergeometrisch verteilt zu den Parametern B=(B_{1},\ldots ,B_{k})\in {\mathbb  {N}}_{0}^{k} mit B_{1}+\ldots +B_{k}=N und n\leq N, wenn sie die Wahrscheinlichkeitsfunktion

f_{{B,n}}(b_{1},\dots ,b_{k})={\frac  {{\binom  {B_{1}}{b_{1}}}\cdot {\binom  {B_{2}}{b_{2}}}\cdot \ldots \cdot {\binom  {B_{k}}{b_{k}}}}{{\binom  {N}{n}}}}

besitzt. Man schreibt dann X\sim {\mathcal  {H}}_{{B,n}} oder X\sim Hyp_{{B,n}} wie bei der hypergeometrischen Verteilung.

Herleitung aus dem Urnenmodell

Die multivariate hypergeometrische Verteilung lässt sich anschaulich aus dem Urnenmodell herleiten. Gegeben sei eine Urne mit insgesamt  N Kugeln, von denen jede in einer von k unterschiedlichen Farben eingefärbt ist. Von der Farbe  i gibt es B_{i} Kugeln. Die Wahrscheinlichkeit, beim n-maligen Ziehen ohne Zurücklegen genau b_{i} Kugeln der Farbe  i zu ziehen, ist multivariat hypergeometrisch verteilt.

Eigenschaften

Erwartungswert

Ist X_{i} die Anzahl der Kugeln der Farbe i, so ist der Erwartungswert

\operatorname E(X_{i})={\frac  {nB_{i}}{N}}

Varianz

Die Varianz ist

\operatorname {Var}(X_{i})={\frac  {B_{i}}{N}}\left(1-{\frac  {B_{i}}{N}}\right)n{\frac  {N-n}{N-1}}

Kovarianz

Für die Kovarianz zwischen der Anzahl der Kugeln gilt

\operatorname {Cov}(X_{i},X_{j})=-{\frac  {nB_{i}B_{j}}{N^{2}}}{\frac  {N-n}{N-1}}

wenn i\neq j.

Beispiel

Es ist eine Urne mit 5 schwarzen, 10 weißen und 15 roten Kugeln gegeben. Die Wahrscheinlichkeit, bei sechsmaligem Ziehen genau zwei Kugeln von jeder Farbe zu ziehen, ist

P(2{\text{ schwarz}},2{\text{ weiss}},2{\text{ rot}})={{{5 \choose 2}{10 \choose 2}{15 \choose 2}} \over {30 \choose 6}}\approx 0.0795,

also knapp acht Prozent. Es ist n=6,N=30,B_{1}=5,B_{2}=10,B_{3}=15. Damit folgt zum Beispiel für den Erwartungswert der schwarzen Kugeln \operatorname {E}({\text{schwarz}})=1.

Beziehung zu anderen Verteilungen

Beziehung zur hypergeometrischen Verteilung

Die hypergeometrische Verteilung ist ein Spezialfall der multivariaten hypergeometrischen Verteilung mit B_{1}=M und B_{2}=N-M. Man beachte hier die unterschiedlichen Parametrisierungen.

Beziehung zur Multinomialverteilung

Die multivariate hypergeometrische Verteilung und die Multinomialverteilung sind verwandt, da sie aus demselben Urnenmodell entstehen, mit dem Unterschied, dass im Multinomialmodell zurückgelegt wird. Insbesondere lässt sich zeigen, dass wenn N\rightarrow \infty und B_{i}\rightarrow \infty gilt, sodass {\tfrac  {B_{i}}{N}}\rightarrow p_{i} ist, und die p_{i} eine Wahrscheinlichkeitsfunktion auf \{1,\dots ,k\} definieren, dann {\mathcal  {H}}_{{B,n}} punktweise gegen die Multinomialverteilung {\mathcal  {M}}_{{p,n}} mit den Parametern p_{i} und n konvergiert. Die multivariate hypergeometrische Verteilung kann somit durch die Multinomialverteilung approximiert werden.

Literatur

Trenner
Basierend auf einem Artikel in: Wikipedia.de
Seitenende
Seite zurück
© biancahoegel.de
Datum der letzten Änderung: Jena, den: 30.06. 2021