Urnenmodell
Ein Urnenmodell ist ein Gedankenexperiment, das in der Wahrscheinlichkeitstheorie und in der Statistik verwendet wird, um verschiedene Zufallsexperimente auf einheitliche und anschauliche Weise zu modellieren. Dazu wird ein fiktives Gefäß, Urne genannt, mit einer bestimmten Anzahl an Kugeln gefüllt, die anschließend zufällig gezogen werden. Damit ist gemeint, dass bei jedem Zug alle in der Urne befindlichen Kugeln die gleiche Wahrscheinlichkeit haben, ausgewählt zu werden. Dadurch kann die Bestimmung interessierender Wahrscheinlichkeiten auf die Lösung kombinatorischer Abzählprobleme zurückgeführt werden.
Man unterscheidet Ziehungen mit Zurücklegen, bei denen jede Kugel nach ihrer Registrierung wieder in die Urne zurückgelegt wird, von Ziehungen ohne Zurücklegen, bei denen eine einmal gezogene Kugel nicht wieder zurückgelegt wird. Viele wichtige Wahrscheinlichkeitsverteilungen, wie beispielsweise die diskrete Gleichverteilung, die Binomialverteilung, die Multinomialverteilung, die hypergeometrische Verteilung die geometrische Verteilung oder die negative Binomialverteilung, können mit Hilfe von Urnenmodellen hergeleitet und veranschaulicht werden.
Geschichte
Auch wenn sich das Konzept des Urnenmodells bis in das Alte Testament und das antike Griechenland zurückverfolgen lässt, geht seine erste explizite Erwähnung in einem mathematischen Kontext auf den Schweizer Mathematiker Jakob Bernoulli zurück. Zu Beginn des dritten Teils seines berühmten Werks Ars Conjectandi aus dem Jahr 1713 beschreibt Bernoulli folgendes Problem:
„Jemand setzt, nachdem er zwei Steine, einen schwarzen und einen weissen, in eine Urne gelegt hat, für drei Spieler A, B, C einen Preis aus unter der Bedingung, dass ihn derjenige erhalten soll, welcher zuerst den weissen Stein zieht; wenn aber keiner der drei Spieler den weissen Stein zieht, so erhält auch keiner den Preis. Zuerst zieht A und legt den gezogenen Stein wieder in die Urne, dann thut B als Zweiter das Gleiche, und schliesslich folgt C als Dritter. Welche Hoffnungen haben die drei Spieler?“
Hierbei ist mit „Hoffnung“ die Gewinnerwartung eines Spielers gemeint. Bernoulli verwendete in seinem in lateinischer Sprache geschriebenen Werk die Begriffe urna für eine Wahlurne und calculi für Zählsteine. Solche mit Loskugeln gefüllte Wahlurnen kamen unter anderem in der Republik Venedig bei der Wahl des Dogen zum Einsatz. Die grundlegende Idee hinter einem solchen Urnenmodell war für Bernoulli das Konzept der gleichen Wahrscheinlichkeit, mit der ein beliebiger Stein aus der Urne gezogen wird. Darauf basierend lassen sich nun die Gewinnerwartungen der drei Spieler ermitteln: Spieler A gewinnt in 50 % der Fälle, Spieler B in 25 % der Fälle, Spieler C in 12,5 % der Fälle und keiner der drei Spieler ebenfalls in 12,5 % der Fälle.
Ähnliche Urnenprobleme wurden im 18. Jahrhundert auch von Daniel Bernoulli und Pierre Rémond de Montmort betrachtet. Abraham de Moivre und Thomas Bayes setzten sich in dieser Zeit im Kontext der Inferenzstatistik speziell mit der Frage auseinander, ob sich aus der Beobachtung der gezogenen Kugeln auf die Anteile der Kugeln in der Urne schließen lässt. Knapp einhundert Jahre nach Bernoulli griff Pierre-Simon Laplace die Idee in seiner Théorie Analytique des Probabilités wieder auf und stellte dabei die Wahrscheinlichkeitstheorie auf eine solide mathematische Grundlage.
Heute sind Urnenmodelle ein zentraler Bestandteil der Grundausbildung in Wahrscheinlichkeitstheorie und Statistik.
Modellvarianten
In einer Urne befinden sich mehrere Kugeln, die verschiedene Eigenschaften aufweisen können, zum Beispiel unterschiedlich gefärbt oder beschriftet sind, aber ansonsten gleich sind. Aus dieser Urne wird nun eine Kugel herausgenommen und registriert. Hierbei wird angenommen, dass bei einer solchen Ziehung eine Kugel zufällig ausgewählt wird, das heißt es soll nicht vorhersehbar sein, welche der Kugeln gezogen wird. Weiter wird angenommen, dass jede Kugel mit der gleichen Wahrscheinlichkeit gezogen wird, da die Kugeln gut durchmischt und von ihrer Beschaffenheit her nicht unterscheidbar seien. Dieser Vorgang des Ziehens wird nun mehrmals wiederholt, wobei die folgenden beiden Fälle unterschieden werden:
- Ziehen mit Zurücklegen
- Jede Kugel wird nach ihrer Registrierung wieder in die Urne zurückgelegt; die Zahl der Kugeln in der Urne verändert sich damit bei mehreren Ziehungen nicht.
- Ziehen ohne Zurücklegen
- Eine einmal gezogene Kugel wird nicht wieder zurückgelegt; die Zahl der Kugeln in der Urne verringert sich damit nach jeder Ziehung um eins.
Urnenmodelle stehen stellvertretend für eine große Klasse von Zufallsexperimenten, wobei Urne und Kugeln durch andere Objekte entsprechend ersetzt werden. Beispiele sind:
- das Werfen einer Münze oder eines Würfels
- das Geben der Spielkarten eines Kartenspiels
- die Ziehung der Lottozahlen oder andere Lotterien
- die Durchführung von Glücksspielen, beispielsweise Roulette
Im Folgenden wird der besonders anschauliche Fall einer Urne, die mit verschiedenfarbigen Kugeln gefüllt ist, betrachtet.
Ergebnismengen
Einmaliges Ziehen
In der Wahrscheinlichkeitstheorie werden Ergebnisse, etwa dass eine bestimmte Kugel gezogen wird, durch Mengen dargestellt. Falls manche Kugeln in der Urne die gleiche Farbe haben, erweist es sich hierbei als vorteilhaft, die Kugeln voneinander zu unterscheiden. Befinden sich in der Urne insgesamt Kugeln, dann definiert man als Ergebnismenge für das Ziehen einer Kugel
- ,
wobei die Elemente der Ergebnismenge die einzelnen Kugeln identifizieren. Befinden sich beispielsweise drei rote, eine grüne und zwei blaue Kugeln in der Urne, so lässt sich die Ergebnismenge durch
beschreiben. Jedem Ergebnis , , wird nun eine Wahrscheinlichkeit zugeordnet. Nachdem jede Kugel mit der gleichen Wahrscheinlichkeit gezogen wird, handelt es sich hierbei um ein Laplace-Experiment, bei dem für die Wahrscheinlichkeit jedes Elements der Ergebnismenge
gilt. In obigem Beispiel mit sechs Kugeln erhält man also für jede Kugel die gleiche Wahrscheinlichkeit
- .
Ziehen mit Zurücklegen
Beim Ziehen mehrerer Kugeln werden die Ergebnisse durch Tupel dargestellt, wobei die Länge des Tupels der Anzahl der Ziehungen entspricht. Werden von den Kugeln in der Urne Kugeln mit Zurücklegen gezogen, dann hat die Ergebnismenge die Form
- .
Die Ergebnismenge ist damit das -fache kartesische Produkt der Ergebnismenge einer einfachen Ziehung. Man spricht hier auch von einer Variation mit Wiederholung. Nachdem es für jedes der Tupelelemente Möglichkeiten gibt, erhält man für die Anzahl der Elemente der Ergebnismenge
- .
Werden aus der Beispielurne mit sechs Kugeln drei Kugeln mit Zurücklegen gezogen, dann hat jede Kugelkombination die gleiche Wahrscheinlichkeit
- .
Diese Wahrscheinlichkeit ist gerade das dreifache Produkt der Wahrscheinlichkeiten beim einmaligen Ziehen.
Ziehen ohne Zurücklegen
Auch beim Ziehen ohne Zurücklegen werden die Ergebnisse durch Tupel dargestellt. Werden von den Kugeln in der Urne Kugeln ohne Zurücklegen gezogen, dann hat die Ergebnismenge die Form
- .
Die Ergebnismenge besteht damit aus allen -Tupeln, bei denen kein Element des Tupels mehr als einmal vorkommt. Man spricht hier auch von einer Variation ohne Wiederholung. Nachdem es für das erste Tupelelement Möglichkeiten gibt, für das zweite Möglichkeiten und so weiter, erhält man für die Anzahl der Elemente der Ergebnismenge
- .
Der Ausdruck wird fallende Faktorielle ab mit Faktoren genannt. Werden aus der Beispielurne mit sechs Kugeln drei Kugeln ohne Zurücklegen gezogen, dann hat jede zulässige Kugelkombination die Wahrscheinlichkeit
- .
Diese Wahrscheinlichkeit ist gerade das Produkt der Wahrscheinlichkeiten beim jeweils einmaligen Ziehen aus einer Urne mit sechs, fünf und vier Kugeln.
Ereignismengen
Einmaliges Ziehen
Ereignisse, etwa dass Kugeln bestimmter Farben gezogen werden, werden in der Wahrscheinlichkeitstheorie ebenfalls durch Mengen dargestellt. Ein Ereignis ist hier einfach eine Teilmenge der Ergebnismenge, also . Beispielsweise wird das Ereignis, dass beim einmaligen Ziehen aus der Beispielurne eine rote oder grüne Kugel gezogen wird, durch
beschrieben. Nach der Laplace-Formel gilt nun für die Wahrscheinlichkeit , dass ein Ereignis eintritt:
- .
Somit lässt sich die Ermittlung der Wahrscheinlichkeit eines Ereignisses auf das Aufzählen von Ergebnissen zurückführen. Beispielsweise ergibt sich als Wahrscheinlichkeit, dass beim einmaligen Ziehen aus der Beispielurne eine rote oder grüne Kugel gezogen wird
- .
Bei mehreren Ziehungen kann allerdings das einzelne Aufzählen von Ergebnissen, etwa mit Hilfe von Baumdiagrammen, sehr aufwändig werden. Stattdessen werden hierfür häufig Hilfsmittel aus der abzählenden Kombinatorik genutzt.
Ziehen gleichfarbiger Kugeln
Zunächst betrachtet man das Ereignis, dass bei Ziehungen immer eine Kugel der gleichen Farbe gezogen wird. Ist die Anzahl der Kugeln dieser Farbe, dann gilt bei einer Ziehung mit Zurücklegen für die Wahrscheinlichkeit dieses Ereignisses
- mit .
Die Wahrscheinlichkeit ist also die -te Potenz der Wahrscheinlichkeit der einmaligen Ziehung einer Kugel dieser Farbe. Bei einer Ziehung ohne Zurücklegen erhält man stattdessen
- .
Für wird diese Wahrscheinlichkeit null, da nicht mehr Kugeln einer Farbe gezogen werden können, als in der Urne vorhanden sind. Beispielsweise beträgt die Wahrscheinlichkeit, dass aus der Beispielurne drei rote Kugeln gezogen werden, bei einer Ziehung mit Zurücklegen
und bei einer Ziehung ohne Zurücklegen
- .
Ziehen mit Beachtung der Reihenfolge
Werden verschiedenfarbige Kugeln gezogen, so ist bei der Betrachtung der Ereignisse zu unterscheiden, ob die Reihenfolge, in der die Kugeln gezogen wurden, eine Rolle spielen soll oder nicht. Im ersten Fall spricht man auch von einer geordneten Ziehung, im anderen von einer ungeordneten Ziehung.
Im Folgenden wird der Fall betrachtet, dass pro Farbe genau eine Kugel gezogen wird. Befinden sich in der Urne Kugeln der ersten Farbe, Kugeln der zweiten Farbe und so fort, so beträgt die Wahrscheinlichkeit, dass als erstes eine Kugel der ersten Farbe, als zweites eine Kugel der zweiten Farbe und so weiter bis als letztes eine Kugel der -ten Farbe gezogen wird, bei einer Ziehung mit Zurücklegen
- mit
und bei einer Ziehung ohne Zurücklegen
- .
Beispielsweise beträgt die Wahrscheinlichkeit, dass aus der Beispielurne eine rote, eine grüne und eine blaue Kugel in dieser Reihenfolge gezogen werden, bei einer Ziehung mit Zurücklegen
und bei einer Ziehung ohne Zurücklegen
- .
Genau die gleichen Wahrscheinlichkeiten ergeben sich, wenn eine beliebige andere Reihenfolge der Kugeln (etwa grün, blau, rot) gewählt wird.
Ziehen ohne Beachtung der Reihenfolge
Soll nun die genaue Reihenfolge, in der die Kugeln gezogen werden, außer Acht gelassen werden, müssen zusätzlich alle Permutationen der gezogenen Kugeln berücksichtigt werden. Dadurch ergibt sich als Wahrscheinlichkeit, dass je eine Kugel unterschiedlicher Farbe gezogen wird, bei einer Ziehung mit Zurücklegen
- mit
und bei einer Ziehung ohne Zurücklegen
- .
Beispielsweise beträgt die Wahrscheinlichkeit, dass aus der Beispielurne drei verschiedenfarbige Kugeln gezogen werden, bei einer Ziehung mit Zurücklegen
und bei einer Ziehung ohne Zurücklegen
- .
Im allgemeineren Fall, dass mehrere Kugeln jeder Farbe gezogen werden, müssen Permutationen mit Wiederholung betrachtet werden. Die Anzahl solcher Permutationen wird durch Multinomialkoeffizienten angegeben, siehe den Abschnitt Anzahl der Kugeln einer Farbkombination.
Bei einer Ziehung ohne Zurücklegen ist auch eine Uminterpretation der Wahrscheinlichkeit in einem reduzierten Wahrscheinlichkeitsraum mit Elementen möglich. In diesem Wahrscheinlichkeitsraum werden Ergebnisse als äquivalent angesehen, wenn sie durch Permutation der Kugeln auseinander hervorgehen. Man spricht hier auch von einer Kombination ohne Wiederholung. Auch in dem reduzierten Wahrscheinlichkeitsraum sind alle Ergebnisse gleich wahrscheinlich.
Eine solche Uminterpretation ist ebenso bei einer Ziehung mit Zurücklegen möglich und man erhält dann einen reduzierten Wahrscheinlichkeitsraum mit Elementen. Entsprechend spricht man hier von einer Kombination mit Wiederholung. Allerdings ist dieser Wahrscheinlichkeitsraum kein Laplace-Raum mehr, denn die Wahrscheinlichkeit, dass zwei verschiedene Kugeln gezogen werden, ist hier doppelt so hoch wie diejenige für zwei gleiche Kugeln.
Zusammenfassung von Ereignissen
Komplexere Ereignisse können häufig in einfachere, sich wechselseitig ausschließende Ereignisse zerlegt werden. Ist eine Ereignismenge die Vereinigung paarweise disjunkter Ereignisse , dann ist die Wahrscheinlichkeit des Gesamtereignisses die Summe der Wahrscheinlichkeiten der einzelnen Ereignisse:
- .
Beispielsweise beträgt die Wahrscheinlichkeit, dass aus der Beispielurne zweimal eine Kugel der gleichen Farbe gezogen wird, bei einer Ziehung ohne Zurücklegen
- .
Gelegentlich ist es auch effizienter, die nicht eingetretenen Ergebnisse aufzuzählen, wobei man die Formel für die Gegenwahrscheinlichkeit nutzt:
Beispielsweise beträgt die Wahrscheinlichkeit, dass aus der Beispielurne bei zweimal Ziehen ohne Zurücklegen keine grüne Kugel gezogen wird
- .
Abgeleitete Verteilungen
Ereignissen zugeordnete Größen, wie die Anzahl gezogener Kugeln einer bestimmten Farbe oder die Anzahl der Ziehungen, bis das erste Mal eine Kugel einer bestimmten Farbe gezogen wird, können als diskrete Zufallsvariablen interpretiert werden. Typischerweise ist die Wahrscheinlichkeitsverteilung solcher Zufallsvariablen nicht mehr gleichverteilt, das heißt die Werte, die die Zufallsvariable annehmen kann, haben nicht mehr die gleiche Wahrscheinlichkeit. Einige solcher durch Urnenmodelle induzierter Wahrscheinlichkeitsverteilungen besitzen in der Statistik eine große Bedeutung und haben eigene Namen.
Anzahl der Kugeln einer Farbe
In der Urne befinden sich Kugeln einer Farbe und Kugeln anderer Farben. Die Wahrscheinlichkeit, dass nach Ziehungen genau Kugeln der ersten Farbe gezogen wurden, ist bei einer Ziehung mit Zurücklegen
- mit .
Die entsprechende Wahrscheinlichkeitsverteilung heißt Binomialverteilung, bei einer einmaligen Ziehung auch Bernoulli-Verteilung. Bei einer Ziehung ohne Zurücklegen ergibt sich analog
und die entsprechende Verteilung wird hypergeometrische Verteilung genannt.
Wartezeit für eine Anzahl von Kugeln einer Farbe
In der Urne befinden sich wieder Kugeln einer Farbe und Kugeln anderer Farben. Die Wahrscheinlichkeit, dass nach Ziehungen im letzten Zug eine Kugel der ersten Farbe das -te Mal gezogen wurde, ist bei einer Ziehung mit Zurücklegen
- mit .
Die entsprechende Wahrscheinlichkeitsverteilung heißt negative Binomialverteilung und im Spezialfall geometrische Verteilung. Bei einer Ziehung ohne Zurücklegen ergibt sich analog
und die entsprechende Verteilung wird negative hypergeometrische Verteilung genannt.
Anzahl der Kugeln einer Farbkombination
In der Urne befinden sich nun Kugeln der Farbe , . Die Wahrscheinlichkeit, dass nach Ziehungen genau Kugeln der Farbe für gezogen wurden, ist bei einer Ziehung mit Zurücklegen:
- mit .
Die entsprechende Wahrscheinlichkeitsverteilung heißt Multinomialverteilung. Bei einer Ziehung ohne Zurücklegen ergibt sich analog
und die entsprechende Verteilung wird multivariate hypergeometrische Verteilung genannt.
Weitere Varianten
Bei einem Pólya-Urnenmodell, benannt nach dem ungarischen Mathematiker George Pólya, wird nach dem Ziehen einer Kugel neben der Kugel selbst zusätzlich eine exakte Kopie der Kugel in die Urne gelegt. Die Anzahl der Kugeln in der Urne wächst dadurch mit jeder Ziehung um eins an. Auf gewisse Weise kann ein Pólya-Urnenmodell als das Gegenteil einer Ziehung ohne Zurücklegen angesehen werden. Nachdem Kugeln in einer häufig vorkommenden Farbe im Laufe der Ziehungen noch häufiger werden, können durch Pólya-Urnenmodelle selbstverstärkende Effekte modelliert werden. Eine wichtige, durch das Pólya-Urnenmodell ableitbare Wahrscheinlichkeitsverteilung ist die Beta-Binomialverteilung.
Für Pólya-Urnenmodelle gibt es eine Reihe von Verallgemeinerungen, beispielsweise indem nicht nur eine, sondern mehrere Kopien der gezogenen Kugel in die Urne gelegt werden. In weiteren Varianten wird statt der gezogenen Kugel eine Kopie einer andersfarbigen Kugel in die Urne zurückgelegt oder zusätzlich zurückgelegt.
Eine weitere Verallgemeinerung besteht in der Verwendung mehrerer Urnen, die alle mit Kugeln gefüllt sind. Eine Ziehung erfolgt dann in zwei Schritten: im ersten Schritt wird zufällig eine der Urnen ausgewählt und im zweiten Schritt dann aus der ausgewählten Urne eine Kugel gezogen. Auf gewisse Weise dual dazu sind Fragestellungen bezüglich der Belegung der Urnen, wenn Kugeln nicht gezogen, sondern zufällig auf die verfügbaren Urnen verteilt werden, siehe Abzählende Kombinatorik#Bälle und Fächer.
Anwendungen
Urnenmodelle helfen unter anderem beim Verständnis folgender Phänomene und Probleme:
- Geburtstagsparadoxon
- In einer Klasse mit 23 Schülern haben mit einer Wahrscheinlichkeit von über 50 % zwei am gleichen Tag Geburtstag.
- Ellsberg-Paradoxon
- Bei menschlichen Entscheidungen wird ein Risiko eher in Kauf genommen als Ungewissheit.
- Sankt-Petersburg-Paradoxon
- Bei einem Glücksspiel mit unendlich großer erwarteter Auszahlung kann die subjektive Gewinnerwartung dennoch gering sein.
- Sammelbilderproblem
- Wie viele zufällig gezogene Sammelbilder sind im Durchschnitt nötig, um eine vollständige Sammlung zu erhalten?
Anwendungen von Urnenmodellen sind beispielsweise:
- die Durchführung zufälliger Stichproben in der Qualitätskontrolle
- die Bestimmung der Ausfallwahrscheinlichkeit technischer Systeme mit mehreren Komponenten
- die Modellierung von Diffusionsvorgängen mit dem Ehrenfest-Modell
© biancahoegel.de
Datum der letzten Änderung: Jena, den: 11.04. 2023