Min-Max-Theorem

Das Min-Max-Theorem ist ein grundlegendes Lösungskonzept in der Spieltheorie und wird mitunter als Hauptsatz für 2-Personen-Nullsummenspiele bezeichnet. Die Minimierung der gegnerischen Maximal-Auszahlung beider Spieler steht im Vordergrund und ist Ursache für die Entstehung der Bezeichnung Min-Max-Theorem. Alternativ wird das Min-Max-Theorem in der einschlägigen Literatur als Maximinlösung bezeichnet. Die Grundlage für die duale Begriffsfindung bildet die Tatsache, dass in Nullsummenspielen die Minimierung der gegnerischen Maximal-Auszahlung (Minimax) sowohl der Minimierung des eigenen Maximal-Verlustes als auch der Maximierung der eigenen Minimum-Auszahlung (Maximin) entsprechen.

Spieltheoretische Formulierung

Der Hauptsatz für 2-Personen-Nullsummenspiele beinhaltet:

In der gemischten Erweiterung $(X,Y,G^{\prime })$ eines jeden 2-Personen-Nullsummenspiels mit endlichen (reinen) Strategieräumen A und B existiert eine Konstante V und für jeden Spieler mindestens eine (gemischte) Gleichgewichtsstrategie $x^{*}$ bzw. $y^{*}$ , mit der er eine erwartete Auszahlung von mindestens V garantieren kann.

Für Spieler A existiert ein $x^{*}=\lbrace x_{1}^{*},...x_{\text{i}}^{*},...x_{\text{m}}^{*}\rbrace$ mit $x_{\text{i}}^{*}\geq 0$ und $\sum _{i=1}^{m}x_{\text{i}}^{*}=1\quad$ , so dass $\quad \max \limits _{x}$ $\min \limits _{y}$ $G^{\prime }{\bigl (}x,y{\bigr )}\ =\min \limits _{y}$ $G^{\prime }{\bigl (}x^{*},y{\bigr )}=V$ .

Für Spieler B existiert ein $y^{*}=\lbrace y_{1}^{*},...y_{\text{j}}^{*},...y_{\text{n}}^{*}\rbrace$ mit $y_{\text{j}}^{*}\geq 0$ und $\sum _{j=1}^{n}y_{\text{j}}^{*}=1\quad$ , so dass $\quad \min \limits _{y}$ $\max \limits _{x}$ $G^{\prime }{\bigl (}x,y{\bigr )}\ =\max \limits _{x}$ $G^{\prime }{\bigl (}x,y^{*}{\bigr )}=V$ .

Einordnung

Im Folgenden sei angenommen, beide Spieler folgen dem Minimax-Kriterium, das heißt, sie wählen die gemischte Strategie, die für sie selbst die minimale erwartete Auszahlung maximiert (und folglich den maximalen erwarteten Verlust minimiert). Der Satz garantiert beiden Spielern in endlichen Zwei-Personen-Nullsummenspielen einen erwarteten Gewinn V, insofern sie diejenige gemischte Strategie wählen, die nach dem Minimax-Kriterium optimal ist. Dieses Paar von Maximin- und Minimax-Strategien führt dazu, dass keiner der Spieler durch einseitige Veränderung seiner Strategie die eigene Position verbessern kann. Der Minimax-Algorithmus, der ebenfalls auf der Minimax-Strategie beruht, findet im Gegensatz zum Min-Max-Theorem im Bereich der sequenziellen Spiele Anwendung.

Der Satz wurde erstmals von John von Neumann 1928 in seiner Publikation „Zur Theorie der Gesellschaftsspiele“ bewiesen.

Die entstandene Strategienkombination beider Spieler bildet einen Sattelpunkt, der einen Spezialfall des Nash-Gleichgewichts für Zweipersonen-Nullsummenspiele darstellt. Für die Ermittlung dieser Gleichgewichtsstrategie in sehr komplexen Nullsummenspielen wird die Lineare Optimierung genutzt.

Folglich darf Spieler A, wenn er rational spielt, abhängig von der Strategiewahl von Spieler B, mindestens den Betrag V erwarten und Spieler B kann erreichen, wenn er rational spielt, dass Spieler A im Mittel auch nicht mehr als diesen Betrag gewinnt.

Allgemeine Vorgehensweise

Ein 2-Personen-Nullsummenspiel in Matrixform kann folgendermaßen dargestellt werden (Bimatrix):

		Spieler B:
		s¹ $_{B}$	s² $_{B}$	⋯	s^n-1 $_{B}$	sⁿ $_{B}$
Spieler A:
	s¹ $_{A}$	u^1,1	u^1,2	⋯	u^1,n-1	u^1,n
	s² $_{A}$	u^2,1	u^2,2	⋯	u^2,n-1	u^2,n
	⋮	⋮	⋮		⋮	⋮
	s^m-1 $_{A}$	u^m-1,1	u^m-1,2	⋯	u^m-1,n-1	u^m-1,n
	s^m $_{A}$	u^m,1	u^m,2	⋯	u^m,n-1	u^m,n

Spieler A ist der Zeilenspieler und Spieler B der Spaltenspieler. Das Spiel wird aus Sicht des Spielers A betrachtet, wobei im Strategienvektor $s=(s_{A},s_{B})$ die Zeile durch $s_{A}$ und die Spalte $s_{B}=s_{A}$ bezeichnet wird. In den Matrixzellen steht die Auszahlung $u_{A}(s)=-u_{B}(s)$ , so dass die Auszahlung des Spielers A gleich dem Verlust des Spielers B entspricht.

Spieler A wählt zuerst eine Strategie $s_{A}$ (Zeile), wobei ihm bewusst ist, dass der Gegner immer das Minimum der Auszahlungen in der Zeile wählen wird, die Spieler A vorgegeben hat. Dementsprechend gibt Spieler A diejenige Strategie $s_{A}$ (Zeile) vor, in der das Zeilenminimum maximal (Maximin-Strategie) ist, so dass die Optimierungsregel für Spieler A lautet:

${\underset {s_{A}}{\max }}[{\underset {s_{B}}{\min }}\;u_{A}(s_{A},s_{B})]$

Diese garantiert ihm ein Auszahlungsminimum, gleichgültig was Spieler B unternimmt. Spieler B versucht seine Verluste zu minimieren und wählt eine Strategie $s_{B}$ (Spalte), die genau die umgekehrte Bedingung erfüllt (Minimax-Regel, Minimax-Strategie), so dass die Optimierungsvorschrift für Spieler B lautet:

${\underset {s_{B}}{\min }}[{\underset {s_{A}}{\max }}\;u_{A}(s_{A},s_{B})]$

Folglich kann er durch seine Minimax-Strategie die Auszahlung des Spielers A auf höchstens gleich diesem Betrag begrenzen, gleichgültig was Spieler A unternimmt. Es gilt dementsprechend:

${\underset {s_{A}}{\max }}[{\underset {s_{B}}{\min }}\;u_{A}(s_{A},s_{B})]$ $\leq$ ${\underset {s_{B}}{\min }}[{\underset {s_{A}}{\max }}\;u_{A}(s_{A},s_{B})]$

Der Hauptsatz für 2-Personen-Nullsummenspiele beinhaltet, dass diese beiden optimalen Strategien einen gemeinsamen Wert v besitzen, so dass notwendige und hinreichende Bedingung für den Wert (Gleichgewicht, Sattelpunkt) lautet:

${\underset {s_{A}}{\max }}[{\underset {s_{B}}{\min }}\;u_{A}(s_{A},s_{B})]\;=\;{\underset {s_{B}}{\min }}[{\underset {s_{A}}{\max }}\;u_{A}(s_{A},s_{B})]$

Spieler A darf folglich, wenn er intelligent spielt, eine Minimalauszahlung erwarten und Spieler B kann bewirken, wenn er intelligent spielt, dass Spieler A nicht mehr als die Minimalauszahlung gewinnt.^[11]

Beispiel

In einem Tennisspiel soll im Folgenden das Min-Max-Theorem verdeutlicht werden. In der Bimatrix wurden die Auszahlungen durch die entsprechenden Erfolgsquoten der beiden Spieler für jede ihrer reinen Strategien ersetzt. Spieler A schlägt zuerst auf.

		Spielerin B:
		Vorhand	Rückhand
Spieler A:	Vorhand	50	80
Spieler A:	Rückhand	90	20

Da die Interessen der beiden Spieler genau entgegengesetzt sind, wird Spielerin B versuchen, den Ball erfolgreich zu retournieren und die maximale Erfolgsquote ihres Gegners zu minimieren (Minimax-Strategie). Mit diesem Vorwissen wird Spieler A versuchen, seine eigene Minimum-Erfolgsquote zu maximieren (Maximin-Strategie).
In diesem Beispiel beträgt die Minimum-Erfolgsquote von Spieler A für jede seiner reinen Strategien in der Zeile Vorhand 50 und Rückhand 20. Das Maximum dieser Minima (Maximin) beträgt folglich 50 und garantiert ihm den größtmöglichen Erfolg, wenn er zu 100 % auf die Vorhand spielt, insofern Spielerin B in ihren eigenen Interessen so gut wie möglich retourniert. Spieler A würde die Strategie Vorhand wählen.
Die Maximum-Erfolgsquote von Spielerin B für jede ihrer Strategien beträgt in Spalte Vorhand 90 und Rückhand 80. Das Minimum dieser Maxima (Minimax) beträgt 80 und garantiert ihr den größtmöglichen Erfolg, insofern Spieler A in seinen eigenen Interessen so gut wie möglich retourniert. Spielerin B würde die Rückhand wählen.

		Spielerin B:
		Vorhand	Rückhand	Zeilenminimun
Spieler A:	Vorhand	50	80	50 (Maximin)
	Rückhand	90	20	20
	Spaltenmaximun	90	80 (Minimax)

Die Minmax- und Maxmin-Werte der beiden Tennisspieler sind unterschiedlich: Maximin Spieler A (50 %) < Minimax Spielerin B (80 %).

Dementsprechend besitzt dieses Spiel kein Gleichgewicht (Sattelpunkt) in reinen Strategien, denn jeder der beiden Spieler kann seine Position durch Mischen der reinen Strategien Vorhand und Rückhand verbessern und die Erfolgsquote des Gegners schwächen, da die richtige Position nicht mehr vorhersagbar ist.

Die Strategiensets, die sich für die beiden Spieler aus dem Mix ihrer reinen Strategien ergeben, werden zunächst aus der Perspektive von Spieler A betrachtet. Er spielt Vorhand mit der Wahrscheinlichkeit und Rückhand folglich mit der Wahrscheinlichkeit $(1-p)$ . Der -Mix gibt, für jede der reinen Strategien von Spielerin B, den zu erwartenden Erfolg des Spielers A für seine gemischte Strategie an.

		Spielerin B:
		Vorhand	Rückhand	Zeilenminimun
Spieler A:	Vorhand	50	80	50
	Rückhand	90	20	20
	p-Mix	50p + 90 (1 - p)	80p + 20 (1 - p)	min = ?

Wenn Spielerin B Vorhand spielt, entspricht die Erfolgsquote des Spielers A $50p+90(1-p)$ und bei Rückhand $80p+20(1-p)$ . Die Wahrscheinlichkeit berechnet sich wie folgt.

$50p+90(1-p)=80p+20(1-p)$

$70(1-p)=30p$

$70=100p$

$p=0,7$ → erwartete Erfolgsquote: $50*0,7+90(1-0,7)=62$

Nun werden die Strategiensets aus der Perspektive von Spielerin B betrachtet. Sie spielt Vorhand mit der Wahrscheinlichkeit und Rückhand folglich mit der Wahrscheinlichkeit $(1-q)$ . Der -Mix gibt, für jede der reinen Strategien von Spieler A, den zu erwartenden Erfolg der Spielerin B für ihre gemischte Strategie an.

		Spielerin B:
		Vorhand	Rückhand	q-Mix
Spieler A:	Vorhand	50	80	50q + 80 (1 - q)
	Rückhand	90	20	90q + 20 (1 - q)
	Spaltenmaximum	90	80	min = ?

Wenn Spieler A Vorhand spielt, entspricht die Erfolgsquote der Spielerin B $50q+80(1-q)$ und bei Rückhand $90q+20(1-q)$ . Die Wahrscheinlichkeit beträgt:

$50q+80(1-q)=90q+20(1-q)$

$60(1-q)=40q$

$60=100q$

$q=0,6$ → erwartete Erfolgsquote: $50*0,6+80(1-0,6)=62$ >

Spieler A konnte folglich durch das Mischen von reinen Strategien seine Maximin von 50 % auf 62 % anheben. Spielerin B konnte durch das Nutzen ihrer gemischten Strategie ihr Minimax von 80 % auf 62 % senken. Wenn beide Spieler ihre optimale gemischte Strategie gegeneinander spielen, so entspricht der Maximin des Spielers A, dem Minimax der Spielerin B und keiner kann sich gegenüber dem anderen besser stellen.

Kritik

Einigen Autoren zufolge wird dem Min-Max-Theorem in der Spieltheorie eine eher geringe Bedeutung beigemessen, da sich dieses Lösungskonzept ausschließlich für Zweipersonen-Nullsummenspielen eignet. Insbesondere wird die im Min-Max-Theorem getroffene Annahme beider Spieler, der Gegner wähle immer nur die für sich beste Strategie aus, als wenig überzeugend eingeschätzt. Das Lösungskonzept gilt nur als zweckmäßig unter der Annahme, dass der gegnerische Spieler die Maximierung seiner Auszahlung anstrebt und keinen Fehler begeht, das heißt optimal und rational handelt.

Literatur

Christian Rieck: Spieltheorie: Eine Einführung, Christian Rieck Verlag, Eschborn, 2006, ISBN 3-924043-91-4.
Hans Bühlmann, Hans Loeffel, Erwin Nievergelt: Entscheidungs- und Spieltheorie, Springer Verlag, Berlin, 1975, ISBN 3-540-07462-7.
Frederick S. Hillier, Gerald J. Liebermann: Operations Research, Verlag Oldenbourg, München [u.a.], 1996, ISBN 978-3-486-23987-4.

Basierend auf einem Artikel in:

Wikipedia.de