game theory

THOMAS ANTON GOBOLD
Wien, November 2002 (und Oktober 2009)

home page:
http://www.geocities.com/lightvolcano

URL dieser web site:
http://www.geocities.com/lightvolcano/study/gametheory.html

Spieltheorie
einf�hrende Beispiele
In der Spieltheorie werden strategische Entscheidungssituationen von zumeist mehreren Entscheidungstr�gern behandelt. Im Rahmen dieses Textes wird das nachstehend gezeigt anhand zweier Beispiele, Gefangenendillema (Prisoner's dilemma) und Kampf der Geschlechter (battle of the sexes). Dar�ber hinaus wird, auch der Aktuallit�t wegen, das Nash-Gleichgewicht behandelt.

Gefangenendilemma

Situation: Two burglars, Stan and Ollie, are captured near the scene of a burglary and are given the "third degree" separately by the police. Each has to choose whether or not to confess and implicate the other. If neither man confesses, then both will serve one year on a charge of carrying a concealed weapon. If each confesses and implicates the other, both will go to prison for 10 years. However, if one burglar confesses and implicates the other, and the other burglar does not confess, the one who has collaborated with the police will go free, while the other burglar will go to prison for 20 years on the maximum charge (http://william-king.www.drexel.edu/top/eco/game/dilemma.html)

Zwischen den beiden Gefangenen ist keine Kommunikation m�glich. Die Spielsituation ist daher nicht-kooperativ (es existieren keine bindenden Vertr�ge). In den folgenden �berlegungen gehen wir davon aus, dass jeder der beiden Gefangenen rational denkt und nach der geringsten Bestrafung trachtet. Nun dr�ngen sich folgende Fragen auf:

Was ist die geeignete formale Darstellung des Spiels? Wie lautet die L�sung?

Zwei Spieler und jeweils 2 Strategien ergeben vier m�gliche Ereignisse, welche in einer Ereignis-Matrix (Auszahlungstabelle, pay-off table) zusammengefa�t werden.

		Ollie (Spieler 2)	Ollie (Spieler 2)
		Nicht gestehen	Gestehen
Stan (Spieler 1)	Nicht gestehen	(-1, -1)	(-20, 0)
Stan (Spieler 1)	Gestehen	(0, -20)	(-10, -10)

Ein Spiel G(N,S,u) ist beschrieben durch die Anzahl der Spieler (N), die Menge S der Strategiekombinationen der Spieler, der Auszahlungsfunktion (Nutzen) u und den Spielregeln. Eine m�gliche Auszahlungsfunktion (mit positiven Werten) f�r das Gefangenendilemma w�rde etwa so aussehen:

(5, 5)	(0, 10)
(10, 0)	(3, 3)

Wenn wir individuell rationales Verhalten voraussetzen, so ist "Gestehen" f�r beide Gefangenen die bessere (rationale) Strategie. Das mag auf den ersten Blick vielleicht paradox wirken, aber:

Angenommen, Ollie verfolgt die Strategie "Nicht gestehen". Dann stellt sich Stan besser, wenn er ein Gest�ndnis macht (Stan w�rde eine Strafe von einem Jahr erhalten, wenn er nun ebenfalls kein Gest�ndnis ablegt. Gesteht er jedoch, w�rde er gar keine Strafe erhalten. Wenn Ollie nicht gesteht, ist Stan mit einem Gest�ndnis besser dran.).

Jedoch: Falls Ollie gesteht, so ist f�r Stan auch wiederum ein Gest�ndnis die bessere Strategie (Stan w�rde eine Strafe von 20 Jahren erhalten, wenn er nicht gesteht. Gesteht er jedoch wie Ollie, so w�rde er wie Ollie die geringere Strafe, 10 Jahre, erhalten. Wenn Ollie gesteht, ist Stan mit einem Gest�ndnis besser dran.).

Mithin ist Stan in beiden F�llen besser dran, wenn er gesteht. Dazu muss er gar nicht wissen, ob Ollie ein Gest�ndnis ablegt oder nicht. Wegen der Symmetrie gilt das selbe f�r Ollie. Wenn beide rational denken, sollten beide gestehen.

Beim Gefangenendilemma ist "Gestehen", die individuell rationale Strategie, auch eine dominante Strategie. Es existiert keine strategische Unsicherheit, der Spieler braucht �ber die Strategie des anderen nicht nachdenken.

Die dem Gefangenendilemma innewohnenden Ideen k�nnen auch in der Wirtschaft f�r Kartellabsprachen oder in der Politik f�r die Abr�stungsproblematik angewandt werden.

Bemerkung: In mancher Literatur werden auch Meta-Strategien (Meta-Spiele) beschrieben, welche auch Kooperation erm�glichen.

Nash-Gleichgewicht

Betrachten wir nun ein Spiel ohne dominante Strategien. Jeder Spieler hat 3 Strategien zur Auswahl. Es ergibt sich folgende Auszahlungsmatrix (wof�r auch immer eine solche Matrix Anwendung finden kann):

	S-21	S-22	S-23
S-11	(8,-8)	(1,1)	(-8,8)
S-12	((1,1)	(2,2)	(1,1)
S-13	(-8,8)	(1,1)	(8,-8)

Nehmen wir nun weiters an, dass ein Spieler die Strategie des Gegners kennt und aufgrund dieser Strategie die beste Antwort w�hlen m�chte. W�rde Spieler 1 die Strategie S-11 w�hlen, so w�re f�r Spieler 2 die S-23 die beste Antwort. W��te nun Spieler 1, dass sich Spieler 2 f�r S-23 entscheiden hat, w�rde Spieler 1 seinerseits wieder die S-11 w�hlen. Dann aber w�rde Spieler 2......

W�rde Spieler 1 sich f�r S-12 entscheiden, so w�re f�r Spieler 2 S-22 die beste Antwort. Wenn jetzt Spieler 1 wei�, dass Spieler 2 sich f�r S-22 entscheidet, so w�re f�r ihn weiterhin S-12 die richtige Antwort. Somit liegt bei der Kombination (S-12,S-22) f�r keinen Spieler ein Grund vor, seine Strategie zu wechseln. Wir haben ein Gleichgewicht, ein Nash-Gleichgewicht. Bei allen anderen L�sungen h�tte mindestens ein Spieler einen Anreiz sich f�r eine bessere Strategie zu entscheiden.

Definition des Nash-Gleichgewicht: Ein Nash-Gleichgewicht ist eine Strategie-Kombination s*, bei der jeder Spieler ein optimale Strategie s-ij* w�hlt - bei gegebener optimaler Strategie des anderen Spielers.

Im Nash-Gleichgewicht m�ssen die Erwartungen des Spielers �ber die Strategie-Wahl der Mitspieler �bereinstimmen.

Galm und Tinchen: Galm und Tinchen lernen einander nach einer Vorlesung kennen. Sie empfinden sofort Interesse f�reinander und wollen gemeinsam den Abend verbringen. Tinchen m�chte am Abend unbedingt ins Kino gehen und den 5-st�ndigen Stummfilm "Die Nibelungen" anschauen. Galm kann mit so etwas �berhaupt nichts anfangen und m�chte Tinchen dazu �berreden, statt dessen mit ihm zu einem Boxkampf zu gehen. Mitten im Gespr�ch bemerken die beiden, dass sie rasch zu wichtigen und unterschiedlichen Vorlesungen laufen m�ssen. �berrascht verabschiedet sich Galm liebevoll. Beide freuen sich auf den Abend. ......zu sp�t bemerken beide, dass sie sich den Treffpunkt gar nicht ausgemacht haben (Boxkampf oder Drachenkampf ?).

Schon der Biologie wegen m�ge man nun davon ausgehen, dass vorrangig keiner der beiden den Abend allein verbringen m�chte. Da w�rde Galm schon eher Tinchen mit den Nibelungen in Kauf nehmen, w�hrend Tinchen unbedingt zu Galm m�chte und daher auch den Boxkampf �ber sich ergehen lassen w�rde. Soll nun Tinchen zum Boxkampf gehen, in der Hoffnung auf Galm zu treffen? Aber, was ist, wenn Galm ins Kino geht und dort nach Tinchen sucht?

Unter diesen Voraussetzungen k�nnte eine Auszahlungsmatrix folgende Werte annehmen:

		Tinchen	Tinchen
		geht zum Boxkampf	geht ins Kino
Galm	geht zum Boxkampf	(3,1)	(0,0)
Galm	geht ins Kino	(0,0)	(1,3)

Bei diesem Beispiel haben wir sogar 2 Nash-Gleichgewichte ("Beide gehen ins Kino" oder "Beide gehen zum Boxkampf". Beide Kombinationen stellen jeweils wechselseitig die besten Antworten dar.

Bemerkung: Auch beim Gefangenen-Dilemma existiert ein Nash-Gleichgewicht (beide gestehen; wenn nun genau einer der beiden diese Strategie �ndern m�chte, kann er es sich nur verschlechtern)!

Bemerkung: Die gew�hlten Eintragungen in der Matrix dr�cken aus, dass, wenn die beiden einander vers�umen, deren Nutzen bzw. Auszahlung tats�chlich Null betr�gt. Das gilt auch dann, wenn Tinchen im Kino ist und Galm dem Boxkampf beiwohnt. So m�ge dieses Beispiel auch interpretiert werden! Die zugrunde liegende Geschichte k�nnte m�glicherweise andere Werte nahelegen [beispielsweise (5,3) wenn beide zum Boxkampf gehen, (1,1) wenn Galm zum Boxkampf und Tinchen ins Kino geht, (0,0) wenn Galm ins Kino und Tinchen zum Boxkampf geht, (3,5) wenn beide ins Kino gehen], dann w�re jedoch eine Betrachtung des Verhaltens der beiden im Sinne eines Nash-Gleichgewichts schwieriger!

Kampf der Geschlechter

Evolution�re Vorbemerkungen:Mit der Fortpflanzung brachte das Entstehen von gro�en Gameten evolutionsbedingt einen Vorteil. Gro�e Gameten hatten, eben wegen ihrer Gr��e, einen besseren Start, als kleine Gameten. Noch im isogamen Zustand (der also keine Trennung zwischen den Geschlechtern kennt) hatten kleine Gameten aus ihrer Sicht einen Vorteil, wenn sie sich mit extra gro�en Gameten vereinigten. Im Rahmen der Evolution entwickelten sich also zwei divergierende Strategien, welche sich auch durchgesetzt haben!!

Als Folge davon haben wir heute einerseits gro�e, unbewegliche, in der Herstellung aufwendige und daher seltene Eizellen. Andererseits haben wir noch arglistige, bewegliche, billig produzierbare und daher in gro�er St�ckzahl vorhandene Samenzellen. Individuen, welche Eizellen produzieren bezeichnet man �blicherweise als Weibchen, die anderen hei�t man M�nnchen. Ei- und Samenzellen besitzen die vollst�ndige Erbinformation ihres Produzenten. Nach Richard Dawkins ist der Unterschied auch der Grund f�r die Ausbeute des weiblichen Geschlechts. Um die eigenen Gene erfolgreich weiter zu geben, hat, bis unmittelbar nach der Kopulation, das M�nnchen wesentlich weniger zu investieren gehabt, als das Weibchen.

Jetzt setzen wir mit der Spieltheorie an: Wir gehen davon aus, dass Weibchen und M�nnchen nur m�glichst erfolgreich und umfangreich ihre Gene weiter vererben wollen! F�r ein M�nnchen w�re es daher von Vorteil, "flatterhaft" zu sein und sich nach der Befruchtung aus dem Staube zu machen, um ein neues Weibchen zu suchen. Als Gegenstrategie kann das Weibchen nun "spr�de" sein, die Kopulation zun�chst verweigern und auf eine lange Verlobungszeit bestehen. Unter spr�den Weibchen ist es f�r M�nnchen nicht mehr so g�nstig, sich nach der Kopulation zur�ckzuziehen, da es beim n�chsten Weibchen wieder eine lange Verlobungszeit auf sich nehmen mu�. Da ist es schon besser, in den eigenen Nachwuchs weiter zu investieren, also "treu" zu sein!.

Unter solchen Annahmen enthalte eine Population nun vorwiegend spr�de Weibchen und treue M�nnchen! Ein Weibchen, das sofort zur Kopulation bereit ist, also "willig" ist, hat es unter den M�nnchen nun wesentlich leichter. Es verzichtet auf die Verlobungszeit und paart sich nun mit dem n�chsten M�nnchen. Somit werden die willigen Weibchen mehr Nachkommen haben, deren Gene breiten sich aus.

Nach einigen Generationen kommen nun auch, bei vielen willigen Weibchen, die flatterhaften M�nnchen besser zum Zuge. Deren Gene verbreiten sich nun auch st�rker.

Die willigen Weibchen, welche von den flatterhaften M�nnchen im Stich gelassen werden, m�ssen ihre Brut nun wohl oder �bel allein aufziehen. Zumindest m�ssen sie mehr aufwenden, als spr�de Weibchen, welche ja die treuen M�nnchen zur Seite haben. Eine m�gliche Beschreibung der n�chsten Folgerung k�nnte etwa so aussehen: Die willigen Weibchen stehen nun den flatterhaften M�nnchen einige Zeit nicht zur Verf�gung, weil sie ja mehr investieren m�ssen, um den Nachwuchs zu versorgen (vorstellbar w�re auch, dass sie mehr Erholzeiten ben�tigen oder wegen der anstrengenden Alleinerziehung einer k�rzeren Lebenserwartung unterliegen.... in allen F�llen stehen den M�nnchen weniger willige Weibchen zur Verf�gung). Die spr�den Weibchen haben es mit ihren treuen M�nnchen nun leichter, da sie die Brut gemeinsam betreuen, womit sich deren Gene wieder vermehren. Unsere �berlegung ist nun am Ausgangspunkt angelangt....

F�r das nachstehend angef�hrte Gedankenspiel haben M�nnchen und Weibchen jeweils zwei Strategien:

treue M�nnchen	sind zu einer langen Verlobunszeit bereit und betreuen den Nachwuchs
flatterhafte M�nnchen	wollen nur rasche Kopulation und verschwinden anschlie�end
willige Weibchen	sind zur raschen Kopulation bereit
spr�de Weibchen	bestehen auf eine lange Verlobungszeit vor der Kopulation

Ein Zahlenbeispiel: Jedes erfolgreich gezeugte (und letztlich auch aufgezogene) Kind bedeutet f�r die Eltern +30 Punkte an Spa� (also +15 f�r jeden), eine vorangegangene lange Verlobungszeit kostet den Eltern -6, die Brutpflege kostet -20.

Wenn nun ein treues M�nnchen auf ein spr�des Weibchen st��t, so haben wir Kosten f�r eine Lange Verlobungszeit, Ertrag f�r die gegl�ckte Kopulation und Kosten f�r das Nachbetreuen der Brut. Kosten und Ertrag werden geteilt und betragen f�r jeden
( 1 / 2 ) * ( - 6 + 30 - 20 ) = + 2
Wenn ein treues M�nnchen auf ein williges Weibchen trifft, f�llt die lange Verlobungszeit weg. Die Auszahlung betr�gt nun f�r beide +5.

Wenn ein flatterhaftes M�nnchen auf ein spr�des Weibchen st��t, passiert nichts. Die beiden verlieren miteinander auch keine Zeit, die Auszahlung betr�gt jeweils Null.

Wenn ein williges Weibchen ein flatterhaftes M�nnchen findet, so erh�lt das M�nnchen, nach unverz�glicher Befruchtung, +15 an Auszahlung und macht sich davon. Das Weibchen erh�lt auch +15 an Auszahlung, mu� aber die Brutpflege mit Kosten von -20 zur G�nze �bernehmen, und bezahlt daher netto -5.

Die entsprechenden Auszahlungstabellen sehen daher so aus:

	Weibchen, willig	Weibchen, spr�de
M�nnchen, treu	5	2
M�nnchen, flatterhaft	15	0

	M�nnchen, treu	M�nnchen, flatterhaft
Weibchen, willig	5	- 5
Weibchen, spr�de	2	0

Es sei nun x₁ der Anteil jener M�nnchen, welche die Strategie "treu" spielen, x₂ spielen dann "flatterhaft"! y₁ der Weibchen sind sodann willige Weibchen, y₂ sind spr�de. Nat�rlich gilt x₁ + x₂ = 1 sowie y₁ + y₂ = 1. Die Auszahlung f�r ein treues M�nnchen h�ngt von den Weibchen ab und betr�gt:
P ( treu ) = 5 * y₁ + 2 * y₂
Die anderen erhalten:
P ( flatterhaft ) = 15 * y₁
P ( willig ) = 5 * x₁ - 5 * x₂
P ( spr�de ) = 2 * x₁
Eine h�here Auszahlung (innerhalb eines Geschlechts) ist nun mit einer Beg�nstigung der Gene f�r den zugeh�rigen Spieler zu deuten. Daher haben wir ein Gleichgewicht, wenn bei den M�nnchen P ( treu ) = P ( flatterhaft ) und bei den Weibchen P ( willig ) = P (spr�de ) gilt. Das ist der Fall, wenn in der Population 5/8 der M�nnchen treu und 1/6 der Weibchen willig sind.

Es l��t sich zeigen, dass mindestens ein solches Gleichgewichtspaar existiert. Hier ist es p ( 5/8 , 3/8 ) und q ( 5/6 , 1/6 ). Das l��t sich hier als L�sung auffassen, keiner der Spieler hat einen Grund von seiner Strategie abzuweichen. Weiters ist es nebens�chlich, ob die Strategie eines Individuums fixiert ist. M�glich w�re f�r unser Modell genauso, dass die M�nnchen 5/8 ihrer Zeit damit verbringen, treu zu sein und 3/8 ihrer Zeit damit zu verbringen, flatterhaft zu sein (Strategiewechsel ist nur vor einem neuen Kontakt m�glich).

Der Weg zu einer Differentialgleichung f�r asymmetrische Konflikte: Die Auszahlung im Spiel der Evolution ist als eine wertm��ige Aussage f�r die erfolgreiche Fortpflanzung von Nachkommen zu deuten, wenn wir annehmen, dass die Nachkommen die Strategie der Eltern erben (bei alternativen Betrachtungen sind die Strategien die genotypisch bedingten m�glichen Verhaltensformen).

Die Auszahlungstabelle f�r die M�nnchen sei nun die 2x2-Matrix A, jene f�r die Weibchen sei B. Die mittlere Auszahlung ist mit P(treu), P(flatterhaft)...P(i) festgelegt. P(i) kann auch geschrieben werden als
P(i) = (Ay)_i i=1 (treu) oder i=2 (flatterhaft)
P(j) = (Bx)_j j=1 (willig) oder j=2 (spr�de)
Dabei wirkt die i-te Zeile der 2x2-Matrix A auf den Vektor y, wobei y=(y₁,y₂). Dieser Ausdruck ist �quivalent mit den oben formulierten Termen f�r P(treu) etc.

Die mittlere (erwartete) Auszahlung f�r die Bev�lkerung X, der M�nnchen, h�ngt nat�rlich auch von den augenblicklichen Strategien aller ab und betr�gt x.Ay. In diesen Ausdruck geht die Zusammensetzung der M�nnchen und der Weibchen, hinsichtlich ihrer momentanen Strategien ein.

Sodann ist die Zuwachsrate (�nderungsrate) beim Anwenden einer Strategie i (bei den M�nnchen) in Abh�ngigkeit von der Zeit festgelegt mit der Differenz zwischen der erwarteten Auszahlung (Ay)_i beim Anwenden einer Strategie und der durchschnittlichen Auszahlung x.Ay.
x_i*(dx/dt) = (Ay)_i - x.Ay
Eine Strategie setzt sich umso besser durch, je gr��er die Differenz zwischen ihrer Auszahlung und der mittleren Auszahlung ist; das ist die Aussage des obigen Ausdrucks. Damit erhalten wir 2 Differentialgleichungen, eine f�r M�nnchen und eine f�r Weibchen.
(dx_i/dt) = x_i*[(Ay)_i - x.Ay] (dy_j/dt) = y_j*[(Bx)_j - y.Bx]

L�sen der Differentialgleichung: Das L�sen der beiden Differentialgleichungen sowie das Verhalten der L�sungskurven in der N�he des Fixpunktes sei nachstehend kurz skizziert: Die Matrizen A und B werden durch geeignete Additionen von Konstanten in jeweils einer Spalte derart vereinfacht, dass die Eintragungen in den Hauptdiagonalen anschl. jeweils Null betragen. Diese Transformation �ndert nichts am (dx/dt). Durch die Divsion der beiden DG erhalten wir eine zeitfreie DG in den beiden Variablen x_i und y_j. Mit der Methode "Trennung der Variablen" kann diese DG gel�st werden. Da x₁ + x₂ = 1 gen�gt es, x₁ zu betrachten, das setzen wir von nun an x, analog erhalten wir y.

[[5,2],[15,0]] ® [[0,2],[10,0]] [[5,-5],[2,0]] ® [[0,-3],[10,0]]

dx/dt = x * ( 1 - x ) * ( 2 - 12*y ) dy/dt = y * ( 1 - y ) * ( -5 + 8*x )

0 = - [ -5 / x + 3 / (1-x) ] dx + [ 2 / y - 10 / (1-y) ]dy

V(x(t),y(t)) = 5*lnx + 3*ln(1-x) + 2*lny + 10*ln(1-y)

Der Fixpunkt: Es existiert genau ein Fixpunkt im Inneren, (5/8,1/6) . Damit dr�ngt sich die Frage auf, ob dieser Fixpunkt evolutionsstabil ist (?), also eine Frage nach dem Verhalten der L�sungskurven in der N�he des Fixpunkts. Der Fixpunkt k�nnte u.a. etwa eine Quelle, eine Senke oder ein Zentrum sein. Der Der naheliegende Satz von Hartmann & Grobmann liefert f�r dieses Beispiel keine Aussage. Da, wie obige Rechnung zeigt, das vollst�ndige Differential, dV, gleich Null ist, so ist V(x(t),y(t)) in der Zeitdom�ne constant. Eine solche L�sungskurve ist also als H�henschichtlinie aufzufassen. Eine weitere Untersuchung zeigt, dass V als V(x,y) am Fixpunkt (5/8,1/6) ein globales Maximum annimmt, also nach allen Richtungen hin abnimmt. Also sind die H�henlinien geschlossene Kurven und mithin periodisch. Der Fixpunkt kann in einem gro�z�gigeren Sinne daher als stabil bezeichnet werden (f�r alle Bahnen in einer Umgebung, U, um den Fixpunkt existiert eine weitere Umgebung, V, welche sie nicht verlassen k�nnen). R�uber-Beute-Modelle liefern das n�mliche Ergebnis.

Ausblick: Das gew�hlte Modell, Kampf der Geschlechter, stellt m�gliche reale Verh�ltnisse nat�rlich grob vereinfacht dar. Sido D. Mylius ver�ffentlichte 1999 etwas realistischere Modelle (what pair formation can do to the battle of the sexes: Towards more realistic game dynamics). Er l��t bereits mehrere Arten von Alleinerziehern zu: Neben den willigen Weibchen, die auf ein flatterhaftes M�nnchen hereinfielen, treten auch Witwer und Witwen auf. Er ber�cksichtigt in seinem Modell ferner die Zeitverz�gerung, welche sich durch die Aufzucht ergibt. Auch geht er darauf ein, dass eine Alleinerziehung nicht so erfolgreich ist, wie eine Aufzucht durchgef�hrt von 2 Elternteilen....

Danksagungen: Josef Hofbauer und Peter Raith

Literatur:
Josef Hofbauer und Karl Sigmund (1984): Evolutionstheorie und dynamische Systeme (Verlag Paul Parey, Berlin und Hamburg, es existieren mehrere Neuauflagen bzw. �berarbeitete Werke)
Richard Dawkins (1976): The selfish gene (Oxford university press, deutsche Version: Das egoistische Gen, 1978, Springer)
Manfred Holler, Gerhard Illing (1991): Einf�hrung in die Spieltheorie (Springer, 1991)
Sido D. Mylius (1999): What pair formation can do to the battle of the sexes: Towards more realistic game dynamics [J.theor. biol. (1999) 197, 469-485]

Editorische Notiz: Diskussion im Rahmen der Lehrveranstaltung Seminar f�r LAK (Angewandte Mathematik)

[email protected]
E mail me anything you like to. I would appreciate any questions or sugggestions you might have.

Back to the main page