Urnenmodell

Mit Urnenmodellen wird die Wahrscheinlichkeit für das Auftreten bestimmter Farbkombinationen untersucht, wenn aus einer Urne mit verschiedenfarbigen Kugeln zufällig ausgewählte Kugeln gezogen werden.

Ein Urnenmodell ist ein Gedankenexperiment, das in der Wahrscheinlichkeitstheorie und in der Statistik verwendet wird, um verschiedene Zufallsexperimente auf einheitliche und anschauliche Weise zu modellieren. Dazu wird ein fiktives Gefäß, Urne genannt, mit einer bestimmten Anzahl an Kugeln gefüllt, die anschließend zufällig gezogen werden. Damit ist gemeint, dass bei jedem Zug alle in der Urne befindlichen Kugeln die gleiche Wahrscheinlichkeit haben, ausgewählt zu werden. Dadurch kann die Bestimmung interessierender Wahrscheinlichkeiten auf die Lösung kombinatorischer Abzählprobleme zurückgeführt werden.

Man unterscheidet Ziehungen mit Zurücklegen, bei denen jede Kugel nach ihrer Registrierung wieder in die Urne zurückgelegt wird, von Ziehungen ohne Zurücklegen, bei denen eine einmal gezogene Kugel nicht wieder zurückgelegt wird. Viele wichtige Wahrscheinlichkeitsverteilungen, wie beispielsweise die diskrete Gleichverteilung, die Binomialverteilung, die Multinomialverteilung, die hypergeometrische Verteilung die geometrische Verteilung oder die negative Binomialverteilung, können mit Hilfe von Urnenmodellen hergeleitet und veranschaulicht werden.

Geschichte

Titelblatt der Ars Conjectandi von Jakob Bernoulli aus dem Jahr 1713

Auch wenn sich das Konzept des Urnenmodells bis in das Alte Testament und das antike Griechenland zurückverfolgen lässt, geht seine erste explizite Erwähnung in einem mathematischen Kontext auf den Schweizer Mathematiker Jakob Bernoulli zurück. Zu Beginn des dritten Teils seines berühmten Werks Ars Conjectandi aus dem Jahr 1713 beschreibt Bernoulli folgendes Problem:

„Jemand setzt, nachdem er zwei Steine, einen schwarzen und einen weissen, in eine Urne gelegt hat, für drei Spieler A, B, C einen Preis aus unter der Bedingung, dass ihn derjenige erhalten soll, welcher zuerst den weissen Stein zieht; wenn aber keiner der drei Spieler den weissen Stein zieht, so erhält auch keiner den Preis. Zuerst zieht A und legt den gezogenen Stein wieder in die Urne, dann thut B als Zweiter das Gleiche, und schliesslich folgt C als Dritter. Welche Hoffnungen haben die drei Spieler?“

– Jakob Bernoulli: Ars conjectandi, pars tertia, problema I; deutsche Übersetzung von Robert Haussner

Hierbei ist mit „Hoffnung“ die Gewinnerwartung eines Spielers gemeint. Bernoulli verwendete in seinem in lateinischer Sprache geschriebenen Werk die Begriffe urna für eine Wahlurne und calculi für Zählsteine. Solche mit Loskugeln gefüllte Wahlurnen kamen unter anderem in der Republik Venedig bei der Wahl des Dogen zum Einsatz. Die grundlegende Idee hinter einem solchen Urnenmodell war für Bernoulli das Konzept der gleichen Wahrscheinlichkeit, mit der ein beliebiger Stein aus der Urne gezogen wird. Darauf basierend lassen sich nun die Gewinnerwartungen der drei Spieler ermitteln: Spieler A gewinnt in 50 % der Fälle, Spieler B in 25 % der Fälle, Spieler C in 12,5 % der Fälle und keiner der drei Spieler ebenfalls in 12,5 % der Fälle.

Ähnliche Urnenprobleme wurden im 18. Jahrhundert auch von Daniel Bernoulli und Pierre Rémond de Montmort betrachtet. Abraham de Moivre und Thomas Bayes setzten sich in dieser Zeit im Kontext der Inferenzstatistik speziell mit der Frage auseinander, ob sich aus der Beobachtung der gezogenen Kugeln auf die Anteile der Kugeln in der Urne schließen lässt. Knapp einhundert Jahre nach Bernoulli griff Pierre-Simon Laplace die Idee in seiner Théorie Analytique des Probabilités wieder auf und stellte dabei die Wahrscheinlichkeitstheorie auf eine solide mathematische Grundlage.

Heute sind Urnenmodelle ein zentraler Bestandteil der Grundausbildung in Wahrscheinlichkeitstheorie und Statistik.

Modellvarianten

Die Berechnung von Gewinnwahrscheinlichkeiten bei der Ziehung der Lottozahlen ist eine klassische Anwendung von Urnenmodellen

In einer Urne befinden sich mehrere Kugeln, die verschiedene Eigenschaften aufweisen können, zum Beispiel unterschiedlich gefärbt oder beschriftet sind, aber ansonsten gleich sind. Aus dieser Urne wird nun eine Kugel herausgenommen und registriert. Hierbei wird angenommen, dass bei einer solchen Ziehung eine Kugel zufällig ausgewählt wird, das heißt es soll nicht vorhersehbar sein, welche der Kugeln gezogen wird. Weiter wird angenommen, dass jede Kugel mit der gleichen Wahrscheinlichkeit gezogen wird, da die Kugeln gut durchmischt und von ihrer Beschaffenheit her nicht unterscheidbar seien. Dieser Vorgang des Ziehens wird nun mehrmals wiederholt, wobei die folgenden beiden Fälle unterschieden werden:

Ziehen mit Zurücklegen
Jede Kugel wird nach ihrer Registrierung wieder in die Urne zurückgelegt; die Zahl der Kugeln in der Urne verändert sich damit bei mehreren Ziehungen nicht.
Ziehen ohne Zurücklegen
Eine einmal gezogene Kugel wird nicht wieder zurückgelegt; die Zahl der Kugeln in der Urne verringert sich damit nach jeder Ziehung um eins.

Urnenmodelle stehen stellvertretend für eine große Klasse von Zufallsexperimenten, wobei Urne und Kugeln durch andere Objekte entsprechend ersetzt werden. Beispiele sind:

Im Folgenden wird der besonders anschauliche Fall einer Urne, die mit verschiedenfarbigen Kugeln gefüllt ist, betrachtet.

Ergebnismengen

Einmaliges Ziehen

Gleichfarbige Kugeln sind äußerlich nicht unterscheidbar und werden daher verschieden beschriftet

In der Wahrscheinlichkeitstheorie werden Ergebnisse, etwa dass eine bestimmte Kugel gezogen wird, durch Mengen dargestellt. Falls manche Kugeln in der Urne die gleiche Farbe haben, erweist es sich hierbei als vorteilhaft, die Kugeln voneinander zu unterscheiden. Befinden sich in der Urne insgesamt N Kugeln, dann definiert man als Ergebnismenge für das Ziehen einer Kugel

\Omega = \{ B_1, B_2, \dotsc, B_N \},

wobei die Elemente der Ergebnismenge B_1, B_2, \dotsc, B_N die einzelnen Kugeln identifizieren. Befinden sich beispielsweise drei rote, eine grüne und zwei blaue Kugeln in der Urne, so lässt sich die Ergebnismenge durch

{\displaystyle \Omega =\{{\text{rot}}_{1},{\text{rot}}_{2},{\text{rot}}_{3},{\text{gr}}\mathrm {\ddot {u}} {\text{n}},{\text{blau}}_{1},{\text{blau}}_{2}\}}

beschreiben. Jedem Ergebnis B_i, i = 1, \dotsc, N, wird nun eine Wahrscheinlichkeit P(\{B_i\}) zugeordnet. Nachdem jede Kugel mit der gleichen Wahrscheinlichkeit gezogen wird, handelt es sich hierbei um ein Laplace-Experiment, bei dem für die Wahrscheinlichkeit jedes Elements der Ergebnismenge

P(\{B_i\}) = \frac{1}{|\Omega|} = \frac{1}{N}

gilt. In obigem Beispiel mit sechs Kugeln erhält man also für jede Kugel die gleiche Wahrscheinlichkeit

P(\{ \text{rot}_1 \}) = P(\{ \text{rot}_2 \}) = \dotsb = P(\{ \text{blau}_2 \}) = \frac{1}{6}.

Ziehen mit Zurücklegen

Bei einem Urnenmodell mit Zurücklegen wird eine Kugel nach der Notierung ihrer Farbe wieder zurück in die Urne gelegt

Beim Ziehen mehrerer Kugeln werden die Ergebnisse durch Tupel dargestellt, wobei die Länge des Tupels der Anzahl der Ziehungen entspricht. Werden von den N Kugeln in der Urne n Kugeln mit Zurücklegen gezogen, dann hat die Ergebnismenge die Form

\Omega = \{ (B_{i_1}, \dotsc, B_{i_n}) \mid i_1, \dotsc, i_n \in \{ 1, \dotsc, N \} \}.

Die Ergebnismenge ist damit das n-fache kartesische Produkt der Ergebnismenge einer einfachen Ziehung. Man spricht hier auch von einer Variation mit Wiederholung. Nachdem es für jedes der n Tupelelemente N Möglichkeiten gibt, erhält man für die Anzahl der Elemente der Ergebnismenge

|\Omega| = N^n.

Werden aus der Beispielurne mit sechs Kugeln drei Kugeln mit Zurücklegen gezogen, dann hat jede Kugelkombination die gleiche Wahrscheinlichkeit

P( \{ (\text{rot}_1, \text{rot}_1, \text{rot}_1) \} ) = \dotsb = P( \{ (\text{blau}_2, \text{blau}_2, \text{blau}_2) \} ) = \frac{1}{6^3} = \frac{1}{216}.

Diese Wahrscheinlichkeit ist gerade das dreifache Produkt \tfrac{1}{6} \cdot \tfrac{1}{6} \cdot \tfrac{1}{6} der Wahrscheinlichkeiten beim einmaligen Ziehen.

Ziehen ohne Zurücklegen

Bei einem Urnenmodell ohne Zurücklegen wird eine einmal gezogene Kugel nicht wieder zurückgelegt

Auch beim Ziehen ohne Zurücklegen werden die Ergebnisse durch Tupel dargestellt. Werden von den N Kugeln in der Urne n\leq N Kugeln ohne Zurücklegen gezogen, dann hat die Ergebnismenge die Form

\Omega = \{ (B_{i_1}, \dotsc, B_{i_n}) \mid i_1, \dotsc, i_n \in \{ 1, \dotsc, N \} ~\text{mit}~ i_l \neq i_m ~\text{für}~ l \neq m \}.

Die Ergebnismenge besteht damit aus allen n-Tupeln, bei denen kein Element des Tupels mehr als einmal vorkommt. Man spricht hier auch von einer Variation ohne Wiederholung. Nachdem es für das erste Tupelelement N Möglichkeiten gibt, für das zweite N-1 Möglichkeiten und so weiter, erhält man für die Anzahl der Elemente der Ergebnismenge

|\Omega| = N (N-1) \dotsm (N-n+1) = \frac{N!}{(N-n)!} = N^{\underline{n}}.

Der Ausdruck N^{\underline{n}} wird fallende Faktorielle ab N mit n Faktoren genannt. Werden aus der Beispielurne mit sechs Kugeln drei Kugeln ohne Zurücklegen gezogen, dann hat jede zulässige Kugelkombination die Wahrscheinlichkeit

{\displaystyle P(\{({\text{rot}}_{1},{\text{rot}}_{2},{\text{rot}}_{3})\})=\dotsb =P(\{({\text{blau}}_{2},{\text{blau}}_{1},{\text{gr}}\mathrm {\ddot {u}} {\text{n}})\})={\frac {1}{6\cdot 5\cdot 4}}={\frac {1}{120}}}.

Diese Wahrscheinlichkeit ist gerade das Produkt \tfrac{1}{6} \cdot \tfrac{1}{5} \cdot \tfrac{1}{4} der Wahrscheinlichkeiten beim jeweils einmaligen Ziehen aus einer Urne mit sechs, fünf und vier Kugeln.

Ereignismengen

Einmaliges Ziehen

Wahrscheinlichkeit der Ziehung einer roten oder grünen Kugel

Ereignisse, etwa dass Kugeln bestimmter Farben gezogen werden, werden in der Wahrscheinlichkeitstheorie ebenfalls durch Mengen dargestellt. Ein Ereignis A ist hier einfach eine Teilmenge der Ergebnismenge, also A \subseteq \Omega. Beispielsweise wird das Ereignis, dass beim einmaligen Ziehen aus der Beispielurne eine rote oder grüne Kugel gezogen wird, durch

{\displaystyle A=\{{\text{rot}}_{1},{\text{rot}}_{2},{\text{rot}}_{3},{\text{gr}}\mathrm {\ddot {u}} {\text{n}}\}\subseteq \{{\text{rot}}_{1},{\text{rot}}_{2},{\text{rot}}_{3},{\text{gr}}\mathrm {\ddot {u}} {\text{n}},{\text{blau}}_{1},{\text{blau}}_{2}\}}

beschrieben. Nach der Laplace-Formel gilt nun für die Wahrscheinlichkeit P(A), dass ein Ereignis A eintritt:

P(A) = \frac{|A|}{|\Omega|}.

Somit lässt sich die Ermittlung der Wahrscheinlichkeit eines Ereignisses auf das Aufzählen von Ergebnissen zurückführen. Beispielsweise ergibt sich als Wahrscheinlichkeit, dass beim einmaligen Ziehen aus der Beispielurne eine rote oder grüne Kugel gezogen wird

{\displaystyle P(\{{\text{rot}}_{1},{\text{rot}}_{2},{\text{rot}}_{3},{\text{gr}}\mathrm {\ddot {u}} {\text{n}}\})={\frac {|\{{\text{rot}}_{1},{\text{rot}}_{2},{\text{rot}}_{3},{\text{gr}}\mathrm {\ddot {u}} {\text{n}}\}|}{|\{{\text{rot}}_{1},{\text{rot}}_{2},{\text{rot}}_{3},{\text{gr}}\mathrm {\ddot {u}} {\text{n}},{\text{blau}}_{1},{\text{blau}}_{2}\}|}}={\frac {4}{6}}={\frac {2}{3}}}.

Bei mehreren Ziehungen kann allerdings das einzelne Aufzählen von Ergebnissen, etwa mit Hilfe von Baumdiagrammen, sehr aufwändig werden. Stattdessen werden hierfür häufig Hilfsmittel aus der abzählenden Kombinatorik genutzt.

Ziehen gleichfarbiger Kugeln

Wahrscheinlichkeiten bei der Ziehung dreier roter Kugeln mit (obere Reihe) und ohne (untere Reihe) Zurücklegen

Zunächst betrachtet man das Ereignis, dass bei n Ziehungen immer eine Kugel der gleichen Farbe gezogen wird. Ist M \leq N die Anzahl der Kugeln dieser Farbe, dann gilt bei einer Ziehung mit Zurücklegen für die Wahrscheinlichkeit dieses Ereignisses

P(A) = \frac{M^n}{N^n} = \left( \frac{M}{N} \right)^n = p^n   mit   p=\frac{M}{N}.

Die Wahrscheinlichkeit ist also die n-te Potenz der Wahrscheinlichkeit der einmaligen Ziehung einer Kugel dieser Farbe. Bei einer Ziehung ohne Zurücklegen erhält man stattdessen

P(A) = \frac{M^{\underline{n}}}{N^{\underline{n}}} = \frac{M}{N} \cdot \frac{M-1}{N-1} \dotsm \frac{M-n+1}{N-n+1}.

Für n > M wird diese Wahrscheinlichkeit null, da nicht mehr Kugeln einer Farbe gezogen werden können, als in der Urne vorhanden sind. Beispielsweise beträgt die Wahrscheinlichkeit, dass aus der Beispielurne drei rote Kugeln gezogen werden, bei einer Ziehung mit Zurücklegen

P(\{ (\text{rot}_1, \text{rot}_1, \text{rot}_1), \ldots, (\text{rot}_3, \text{rot}_3, \text{rot}_3) \}) = \frac{3}{6} \cdot \frac{3}{6} \cdot \frac{3}{6} = \frac{27}{216} = \frac{1}{8}

und bei einer Ziehung ohne Zurücklegen

P(\{ (\text{rot}_1, \text{rot}_2, \text{rot}_3), \ldots, (\text{rot}_3, \text{rot}_2, \text{rot}_1) \}) = \frac{3}{6} \cdot \frac{2}{5} \cdot \frac{1}{4} = \frac{6}{120} = \frac{1}{20}.

Ziehen mit Beachtung der Reihenfolge

Wahrscheinlichkeiten bei der Ziehung einer roten, einer grünen und einer blauen Kugel in dieser Reihenfolge mit (obere Reihe) und ohne (untere Reihe) Zurücklegen

Werden verschiedenfarbige Kugeln gezogen, so ist bei der Betrachtung der Ereignisse zu unterscheiden, ob die Reihenfolge, in der die Kugeln gezogen wurden, eine Rolle spielen soll oder nicht. Im ersten Fall spricht man auch von einer geordneten Ziehung, im anderen von einer ungeordneten Ziehung.

Im Folgenden wird der Fall betrachtet, dass pro Farbe genau eine Kugel gezogen wird. Befinden sich in der Urne N_{1} Kugeln der ersten Farbe, N_{2} Kugeln der zweiten Farbe und so fort, so beträgt die Wahrscheinlichkeit, dass als erstes eine Kugel der ersten Farbe, als zweites eine Kugel der zweiten Farbe und so weiter bis als letztes eine Kugel der n-ten Farbe gezogen wird, bei einer Ziehung mit Zurücklegen

P(A) = \frac{N_1 \cdot N_2 \dotsm N_n}{N^n} = p_1 \cdot p_2 \dotsm p_n   mit   p_j=\frac{N_j}{N}

und bei einer Ziehung ohne Zurücklegen

P(A) = \frac{N_1 \cdot N_2 \dotsm N_n}{N^{\underline{n}}} = \frac{N_1}{N} \cdot \frac{N_2}{N-1} \dotsm \frac{N_n}{N-n+1}.

Beispielsweise beträgt die Wahrscheinlichkeit, dass aus der Beispielurne eine rote, eine grüne und eine blaue Kugel in dieser Reihenfolge gezogen werden, bei einer Ziehung mit Zurücklegen

{\displaystyle P(\{({\text{rot}}_{1},{\text{gr}}\mathrm {\ddot {u}} {\text{n}},{\text{blau}}_{1}),\ldots ,({\text{rot}}_{3},{\text{gr}}\mathrm {\ddot {u}} {\text{n}},{\text{blau}}_{2})\})={\frac {3}{6}}\cdot {\frac {1}{6}}\cdot {\frac {2}{6}}={\frac {6}{216}}={\frac {1}{36}}}

und bei einer Ziehung ohne Zurücklegen

{\displaystyle P(\{({\text{rot}}_{1},{\text{gr}}\mathrm {\ddot {u}} {\text{n}},{\text{blau}}_{1}),\dotsc ,({\text{rot}}_{3},{\text{gr}}\mathrm {\ddot {u}} {\text{n}},{\text{blau}}_{2})\})={\frac {3}{6}}\cdot {\frac {1}{5}}\cdot {\frac {2}{4}}={\frac {6}{120}}={\frac {1}{20}}}.

Genau die gleichen Wahrscheinlichkeiten ergeben sich, wenn eine beliebige andere Reihenfolge der Kugeln (etwa grün, blau, rot) gewählt wird.

Ziehen ohne Beachtung der Reihenfolge

Spielt die Reihenfolge der gezogenen Kugeln keine Rolle, müssen alle Permutationen der Kugeln berücksichtigt werden

Soll nun die genaue Reihenfolge, in der die Kugeln gezogen werden, außer Acht gelassen werden, müssen zusätzlich alle n! Permutationen der gezogenen Kugeln berücksichtigt werden. Dadurch ergibt sich als Wahrscheinlichkeit, dass je eine Kugel unterschiedlicher Farbe gezogen wird, bei einer Ziehung mit Zurücklegen

P(A) = \frac{n! \cdot N_1 \cdot N_2 \dotsm N_n}{N^n} = n! \cdot p_1 \cdot p_2 \dotsm p_n   mit   p_j=\frac{N_j}{N}

und bei einer Ziehung ohne Zurücklegen

P(A) = \frac{n! \cdot N_1 \cdot N_2 \dotsm N_n}{N^{\underline{n}}} = n! \cdot \frac{N_1}{N} \cdot \frac{N_2}{N-1} \dotsm \frac{N_n}{N-n+1}.

Beispielsweise beträgt die Wahrscheinlichkeit, dass aus der Beispielurne drei verschiedenfarbige Kugeln gezogen werden, bei einer Ziehung mit Zurücklegen

{\displaystyle P(\{({\text{rot}}_{1},{\text{gr}}\mathrm {\ddot {u}} {\text{n}},{\text{blau}}_{1}),\dotsc ,({\text{blau}}_{2},{\text{gr}}\mathrm {\ddot {u}} {\text{n}},{\text{rot}}_{3})\})=3!\cdot {\frac {3}{6}}\cdot {\frac {1}{6}}\cdot {\frac {2}{6}}={\frac {36}{216}}={\frac {1}{6}}}

und bei einer Ziehung ohne Zurücklegen

{\displaystyle P(\{({\text{rot}}_{1},{\text{gr}}\mathrm {\ddot {u}} {\text{n}},{\text{blau}}_{1}),\dotsc ,({\text{blau}}_{2},{\text{gr}}\mathrm {\ddot {u}} {\text{n}},{\text{rot}}_{3})\})=3!\cdot {\frac {3}{6}}\cdot {\frac {1}{5}}\cdot {\frac {2}{4}}={\frac {36}{120}}={\frac {3}{10}}}.

Im allgemeineren Fall, dass mehrere Kugeln jeder Farbe gezogen werden, müssen Permutationen mit Wiederholung betrachtet werden. Die Anzahl solcher Permutationen wird durch Multinomialkoeffizienten angegeben, siehe den Abschnitt Anzahl der Kugeln einer Farbkombination.

Bei einer Ziehung ohne Zurücklegen ist auch eine Uminterpretation der Wahrscheinlichkeit in einem reduzierten Wahrscheinlichkeitsraum mit |\Omega| = \tfrac{N^{\underline{n}}}{n!} = \tbinom{N}{n} Elementen möglich. In diesem Wahrscheinlichkeitsraum werden Ergebnisse als äquivalent angesehen, wenn sie durch Permutation der Kugeln auseinander hervorgehen. Man spricht hier auch von einer Kombination ohne Wiederholung. Auch in dem reduzierten Wahrscheinlichkeitsraum sind alle Ergebnisse gleich wahrscheinlich.

Eine solche Uminterpretation ist ebenso bei einer Ziehung mit Zurücklegen möglich und man erhält dann einen reduzierten Wahrscheinlichkeitsraum mit |\Omega| = \tbinom{N+n-1}{n} Elementen. Entsprechend spricht man hier von einer Kombination mit Wiederholung. Allerdings ist dieser Wahrscheinlichkeitsraum kein Laplace-Raum mehr, denn die Wahrscheinlichkeit, dass zwei verschiedene Kugeln gezogen werden, ist hier doppelt so hoch wie diejenige für zwei gleiche Kugeln.

Zusammenfassung von Ereignissen

Komplexere Ereignisse können häufig in einfachere, sich wechselseitig ausschließende Ereignisse zerlegt werden. Ist eine Ereignismenge die Vereinigung paarweise disjunkter Ereignisse A_1, A_2, \dotsc, A_k, dann ist die Wahrscheinlichkeit des Gesamtereignisses die Summe der Wahrscheinlichkeiten der einzelnen Ereignisse:

P(A_1 \cup A_2 \cup \dotsb \cup A_k) = P(A_1) + P(A_2) + \dotsb + P(A_k).

Beispielsweise beträgt die Wahrscheinlichkeit, dass aus der Beispielurne zweimal eine Kugel der gleichen Farbe gezogen wird, bei einer Ziehung ohne Zurücklegen

P(\{ ( \text{rot}_1, \text{rot}_2 ), \ldots , ( \text{rot}_3, \text{rot}_2 ), \emptyset, ( \text{blau}_1, \text{blau}_2 ), ( \text{blau}_2, \text{blau}_1 ) \}) = \frac{6}{30} + \frac{0}{30} + \frac{2}{30} = \frac{8}{30} = \frac{4}{15}.

Gelegentlich ist es auch effizienter, die nicht eingetretenen Ergebnisse aufzuzählen, wobei man die Formel für die Gegenwahrscheinlichkeit nutzt:

P(A) = 1 - P(\Omega \setminus A)

Beispielsweise beträgt die Wahrscheinlichkeit, dass aus der Beispielurne bei zweimal Ziehen ohne Zurücklegen keine grüne Kugel gezogen wird

{\displaystyle 1-P(\{({\text{gr}}\mathrm {\ddot {u}} {\text{n}},{\text{rot}}_{1}),\dotsc ,({\text{gr}}\mathrm {\ddot {u}} {\text{n}},{\text{blau}}_{2}),({\text{rot}}_{1},{\text{gr}}\mathrm {\ddot {u}} {\text{n}}),\dotsc ,({\text{blau}}_{2},{\text{gr}}\mathrm {\ddot {u}} {\text{n}})\})=1-{\frac {10}{30}}={\frac {2}{3}}}.

Abgeleitete Verteilungen

Ereignissen zugeordnete Größen, wie die Anzahl gezogener Kugeln einer bestimmten Farbe oder die Anzahl der Ziehungen, bis das erste Mal eine Kugel einer bestimmten Farbe gezogen wird, können als diskrete Zufallsvariablen interpretiert werden. Typischerweise ist die Wahrscheinlichkeitsverteilung solcher Zufallsvariablen nicht mehr gleichverteilt, das heißt die Werte, die die Zufallsvariable X annehmen kann, haben nicht mehr die gleiche Wahrscheinlichkeit. Einige solcher durch Urnenmodelle induzierter Wahrscheinlichkeitsverteilungen besitzen in der Statistik eine große Bedeutung und haben eigene Namen.

Anzahl der Kugeln einer Farbe

Die Binomialverteilung gibt an, mit welcher Wahrscheinlichkeit nach n Ziehungen genau k Kugeln einer bestimmten Farbe gezogen wurden

In der Urne befinden sich M Kugeln einer Farbe und N-M Kugeln anderer Farben. Die Wahrscheinlichkeit, dass nach n Ziehungen genau k Kugeln der ersten Farbe gezogen wurden, ist bei einer Ziehung mit Zurücklegen

P(X = k) = \frac{\binom{n}{k} M^k(N-M)^{n-k}}{N^n} = \binom{n}{k} p^k(1-p)^{n-k}   mit   p=\frac{M}{N}.

Die entsprechende Wahrscheinlichkeitsverteilung heißt Binomialverteilung, bei einer einmaligen Ziehung auch Bernoulli-Verteilung. Bei einer Ziehung ohne Zurücklegen ergibt sich analog

P(X = k) = \frac{ \binom{n}{k} M^{\underline{k}} (N-M)^{\underline{n-k}}}{N^{\underline{n}}} = \frac{ \binom{M}{k} \binom{N-M}{n-k}}{\binom{N}{n}} = \frac{ \binom{n}{k}\binom{N-n}{M-k}}{\binom{N}{M} }

und die entsprechende Verteilung wird hypergeometrische Verteilung genannt.

Wartezeit für eine Anzahl von Kugeln einer Farbe

Die negative Binomialverteilung gibt an, mit welcher Wahrscheinlichkeit nach n Ziehungen eine Kugel einer bestimmten Farbe das k-te Mal gezogen wurde

In der Urne befinden sich wieder M Kugeln einer Farbe und N-M Kugeln anderer Farben. Die Wahrscheinlichkeit, dass nach n Ziehungen im letzten Zug eine Kugel der ersten Farbe das k-te Mal gezogen wurde, ist bei einer Ziehung mit Zurücklegen

P(X = n) = \frac{\binom{n-1}{k-1} M^k (N-M)^{n-k}}{N^n} = \binom{n-1}{k-1} p^k (1-p)^{n-k}   mit   p=\frac{M}{N}.

Die entsprechende Wahrscheinlichkeitsverteilung heißt negative Binomialverteilung und im Spezialfall k=1 geometrische Verteilung. Bei einer Ziehung ohne Zurücklegen ergibt sich analog

P(X = n) = \frac{\binom{n-1}{k-1} M^{\underline{k}} (N-M)^{\underline{n-k}}}{N^{\underline{n}}} = \frac{k \binom{M}{k} \binom{N-M}{n-k}}{n \binom{N}{n}} = \frac{\binom{n-1}{k-1} \binom{N-n}{M-k}}{\binom{N}{M}}

und die entsprechende Verteilung wird negative hypergeometrische Verteilung genannt.

Anzahl der Kugeln einer Farbkombination

In der Urne befinden sich nun N_j Kugeln der Farbe j, N_1 + \dotsb + N_s = N. Die Wahrscheinlichkeit, dass nach n Ziehungen genau k_j Kugeln der Farbe j für j=1, \dotsc, s gezogen wurden, ist bei einer Ziehung mit Zurücklegen:

P(X_1 = k_1, \dotsc, X_s = k_s) = \frac{\binom{n}{k_1, \dotsc, k_s} N_1^{k_1} \dotsm N_s^{k_s}}{N^n} = \binom{n}{k_1, \dotsc, k_s} p_1^{k_1} \dotsm p_s^{k_s}   mit   p_j=\frac{N_j}{N}.

Die entsprechende Wahrscheinlichkeitsverteilung heißt Multinomialverteilung. Bei einer Ziehung ohne Zurücklegen ergibt sich analog

P(X_1 = k_1, \dotsc, X_s = k_s) = \frac{ \binom{n}{k_1, \dotsc, k_s} N_1^{\underline{k_1}} \dotsm N_s^{\underline{k_s}}}{N^{\underline{n}}} = \frac{ \binom{N_1}{k_1} \binom{N_2}{k_2} \dotsm \binom{N_s}{k_s}}{\binom{N}{n}}

und die entsprechende Verteilung wird multivariate hypergeometrische Verteilung genannt.

Weitere Varianten

Bei einer Pólya-Urne wird neben der gezogenen Kugel zusätzlich eine Kopie der Kugel in die Urne zurückgelegt

Bei einem Pólya-Urnenmodell, benannt nach dem ungarischen Mathematiker George Pólya, wird nach dem Ziehen einer Kugel neben der Kugel selbst zusätzlich eine exakte Kopie der Kugel in die Urne gelegt. Die Anzahl der Kugeln in der Urne wächst dadurch mit jeder Ziehung um eins an. Auf gewisse Weise kann ein Pólya-Urnenmodell als das Gegenteil einer Ziehung ohne Zurücklegen angesehen werden. Nachdem Kugeln in einer häufig vorkommenden Farbe im Laufe der Ziehungen noch häufiger werden, können durch Pólya-Urnenmodelle selbstverstärkende Effekte modelliert werden. Eine wichtige, durch das Pólya-Urnenmodell ableitbare Wahrscheinlichkeitsverteilung ist die Beta-Binomialverteilung.

Für Pólya-Urnenmodelle gibt es eine Reihe von Verallgemeinerungen, beispielsweise indem nicht nur eine, sondern mehrere Kopien der gezogenen Kugel in die Urne gelegt werden. In weiteren Varianten wird statt der gezogenen Kugel eine Kopie einer andersfarbigen Kugel in die Urne zurückgelegt oder zusätzlich zurückgelegt.

Eine weitere Verallgemeinerung besteht in der Verwendung mehrerer Urnen, die alle mit Kugeln gefüllt sind. Eine Ziehung erfolgt dann in zwei Schritten: im ersten Schritt wird zufällig eine der Urnen ausgewählt und im zweiten Schritt dann aus der ausgewählten Urne eine Kugel gezogen. Auf gewisse Weise dual dazu sind Fragestellungen bezüglich der Belegung der Urnen, wenn Kugeln nicht gezogen, sondern zufällig auf die verfügbaren Urnen verteilt werden, siehe Abzählende Kombinatorik#Bälle und Fächer.

Anwendungen

Urnenmodelle helfen unter anderem beim Verständnis folgender Phänomene und Probleme:

Geburtstagsparadoxon
In einer Klasse mit 23 Schülern haben mit einer Wahrscheinlichkeit von über 50 % zwei am gleichen Tag Geburtstag.
Ellsberg-Paradoxon
Bei menschlichen Entscheidungen wird ein Risiko eher in Kauf genommen als Ungewissheit.
Sankt-Petersburg-Paradoxon
Bei einem Glücksspiel mit unendlich großer erwarteter Auszahlung kann die subjektive Gewinnerwartung dennoch gering sein.
Sammelbilderproblem
Wie viele zufällig gezogene Sammelbilder sind im Durchschnitt nötig, um eine vollständige Sammlung zu erhalten?

Anwendungen von Urnenmodellen sind beispielsweise:

Trenner
Basierend auf einem Artikel in: Extern Wikipedia.de
Seitenende
Seite zurück
©  biancahoegel.de
Datum der letzten Änderung:  Jena, den: 11.04. 2023