Seminararbeit Hochwarter

Transcrição

Seminararbeit Hochwarter
SPIELTHEORIE IN DER
ÖKONOMIE
Teil 2
Kevin Hochwarter 1025595
Seminararbeit aus Finanz und Versicherungsmathematik
31. Jänner 2013
Inhaltsverzeichnis:
1. Einleitung
2. Dynamische Spiele
2.1 Extensive Spielform
2.2 Lösungsmethode
2.3 Teilspielperfekte Nashlösung
2.4 Ökonomische Anwendungen
3. Wiederholte Spiele
3.1 Endlich oft wiederholte Spiele
3.1.1 Multiple Nash Gleichgewichte
3.1.2 One Shot Game
3.2 Unendlich oft wiederholte Spiele
3.2.1 Folk Theorem
3.3 Ökonomische Anwendung
4. Gefangenendilemma
5. Literaturverzeichnis
1.
Einleitung
Für den Begriff Spieltheorie gibt es sehr viele verschiedene und kurze Definitionen, wie zum
Beispiel „Theorie zur mathematischen Analyse von Konflikten“. Oder „Entscheidungstheorie,
die Situationen untersucht, in denen das Ergebnis nicht von einem Entscheider allein
bestimmt werden kann, sondern nur von mehreren Entscheidern gemeinsam“. Der
Anwendungsbereich ist, vor allem in der Ökonomie, sehr weit gestreut. Den hohen
Stellenwert erkennt man auch daran, dass in den vergangenen Jahrzehnten viele Nobelpreise
an Wissenschaftler vergeben wurden, die sich mit diesem Thema beschäftigten.
Meine Seminararbeit behandelt den zweiten Teil der Spieltheorie in der Ökonomie, und ist die
Fortsetzung von der Seminararbeit der Spieltheorie in der Ökonomie von Herrn Kevin Klein.
Die Grundlagen, die in der Seminararbeit von Herrn Klein erarbeitet wurden, werden hier als
vorausgesetzt angesehen. Einer der wichtigsten Punkte ist dabei das Nash Gleichgewicht.
Die zwei grundlegenden Themengebiete meiner Arbeit behandeln die dynamischen und die
wiederholten Spiele. Beides wird zuerst theoretisch erläutert und anschließend anhand von
praktischen Beispielen aus der Ökonomie dargestellt.
2.
Dynamische Spiele
Bei den dynamischen Spielen, kann im Gegensatz zu den statischen Spielen, bei denen die
Spielzüge simultan getätigt werden, der Spielzug des Gegenspielers beobachtet werden, um
seinen eigenen Spielzug eventuell daran anpassen zu können. Diese Art von Entscheidung
nennt man sequenzielle Entscheidung. Somit hat mindestens eine Entscheidung eine
Vorgeschichte. Die im nächsten Kapitel behandelten wiederholten Spiele, stellen eine
Spezialform der dynamischen Spiele dar. Im Allgemeinen beschreibt das dynamische Spiel die
Strategie der bedingten Entscheidungen, also wie sich Spieler in Abhängigkeit von möglichen
Vorgeschichten entscheiden. Eine Strategie beschreibt somit einen Verhaltensplan für das
gesamte Spiel. Dieser beinhaltet Strategien, für getätigte Entscheidungen, aber auch für
solche, die nie realisiert werden. Das führt zu folgenden Definitionen:
Definition: Das Gesamtspiel G beschreibt alle denkbaren (dynamischen) Verhaltenspläne für
alle Spieler, sowie die jeweils daraus resultierenden Auszahlungen.
Definition: Ein Teilspiel ist derjenige Teil (Ausschnitt) des Gesamtspiels, der für sich
genommen ein vollständiges Spiel darstellt.
Ein Teilspiel ist so zu verstehen, dass in solchen Spielen gewisse Entscheidungen oder
Spielzüge als gegeben anzusehen sind und nicht revidierbar sind. Somit ist das Spiel nicht von
Beginn an zu spielen, sonder nur mehr ein Teilspiel, was mit den üblichen Methoden zu lösen
ist.
Die Begriffe des Gesamtspiels und des Teilspiels sind am einfachsten anhand der extensiven
Spielform zu erläutern.
2.1 Extensive Spielform:
Die extensive Spielform ist am leichtesten mit einem Spielbaum darstellbar. Wie man an dem
Spielbaum sehen kann, gibt es 4 wesentliche Punkte, die für das Spiel wichtig sind. Die
Knoten stellen die Entscheidungssituation eines Spielers dar. Der von jedem Knoten
weggehende Ast, steht für einen einzigen Spielzug eines Spielers also die Entscheidung an
dem jeweiligen Knoten. Am Ende des Spielbaumes befinden sich die Auszahlungsvektoren,
an denen man, nach der letzten Entscheidung des Spieles, die „payoffs“ ablesen kann. Der
letzte Punkt ist der Informationsbezirk, oben zu sehen an dem langgezogenen Rechteck, das
mehrere Knoten verbindet. Dieser fasst die Knoten zusammen, deren Vorgeschichte von dem
betreffenden Spieler nicht beobachten werden konnte.
Zu beachten ist, dass jeder Knoten, bis auf den Anfangsknoten, nur von einem einzigen Ast
erreicht werden kann und es keine rekursiven Verknüpfungen geben darf. Außerdem ist noch
zu sagen, dass an jeder Entscheidungssituation, also an Knoten die nicht durch
Informationsbezirke verbunden sind, ein Teilspiel beginnt.
Um einen Eindruck dafür zu bekommen, welchen Einfluss ein Informationsbezirk auf die
Strategiemenge eines Spieles hat, werde ich die Lösungsmengen anhand des obigen
Spielbaumes mit und ohne Informationsbezirk angeben.
*Spieler A:
Strategiemenge SA = {(a1,x1),(a1,x2),(a2,y1)(a2,y2)}
*Spieler B:
Strategiemenge SB = {b1,b2}, da die erste Entscheidung von A nicht beobachtet werden
kann.
Die oben verwendeten Elemente a1, a2, b1, b2, x1, x2, y1, y2 sind keine Strategien sondern
Spielzüge.
Lässt man jetzt den Informationsbezirk weg, ändert sich dieser wie folgt:
Wie man sofort sieht, ändert sich nicht nur die Strategiemenge, sondern auch die Anzahl der
Teilspiele erhöht sich durch wegfallen des Informationsbezirkes. Die Strategiemengen sind
jetzt folgende:
*Spieler A: Strategiemenge bleibt unverändert
Strategiemenge SA = {(a1,x1),(a1,x2),(a2,y1)(a2,y2)}
*Spieler B:
Strategiemenge SB = {(b1,c1),(b1,c2),(b2,c1)(b2,c2)}
Der Spielbaum ist nicht die einzige Darstellung der extensiven Spielform. Eine weitere
Darstellmöglichkeit bietet die Matrixdarstellung, bei der die Strategiemengen in eine Zeile
bzw. eine Spalte geschrieben werden. In den übrigen Feldern sind die entsprechenden
payoffs einzutragen.
2.2 Lösungsmethode
Die Lösung eines Spiels in extensiver Spielform erfolgt durch Rückwärtsinduktion. Diese
beginnt immer beim letzten Entscheidungsknoten eines Spiels. Der entsprechende Spieler A
wird dabei eine rationale Entscheidung treffen, also wird an jedem Knoten den Weg mit dem
höchsten payoff wählen. Diese Entscheidung kann aber von dem Spieler B, der vorher am
Zug ist antizipiert werden. Dieser trifft wieder eine rationale Entscheidung, die auf der
gleichgewichtigen Erwartung der Entscheidung bezüglich A beruht. Diese rationale
Entscheidung kann wiederum vom Spieler B, der vorher am Zug ist antizipiert werden. Dieser
Zyklus, der der Entscheidung und der Antizipation, wird so lange durchgeführt, bis man zum
Anfangsknoten gelangt.
Zur Veranschaulichung wird wieder ein kurzes Beispiel angeführt:
Bei der Lösung gehen wir Schritt für Schritt wie folgt vor; Zuerst betrachten wir die
Entscheidungssituation von Spieler A. Dieser hat die Wahl zwischen x1 und x2, und die Wahl
zwischen y1 und y2. Die erste Entscheidung wird auf x1 fallen, da 5 > 3 ist, und die zweite auf
y2, da 0 > -1 ist. Sind diese Entscheidungen getroffen worden, gehen wir zum nächsten
Knoten, wo diesmal Spieler B eine Auswahl treffen muss. Dieser kann die Entscheidung von A
antizipieren, und entscheidet sich bei b1, b2 für b1 weil, 4 > 0 und bei c1, c2 für c2, da 5 > 0.
Zum Schluss hat noch einmal Spieler B eine Auswahlmöglichkeit zwischen a1 und a2. Er wird
sich für a1 entscheiden, weil 5>3.
Haben beide Spieler alle ihre rationalen Entscheidungen getroffen, kommt man zur perfekten
Lösung des ganzen Spieles: ((a1,x1),(b1,c2)).
Das oben gespielte Spiel wird in Matrixform analysiert:
Wie man an den fett gedruckten Lösungen, die Nash Gleichgewichte darstellen, sehen kann,
gibt es mehrere mögliche Lösungen, und nicht nur ((a1,x1),(b1,c2)). Auch diese
Strategiekombinationen sind gleichgewichtig im Sinne der Nash-Lösung, wurden aber durch
die Rückwärtsinduktion nicht als Gleichgewichte identifiziert. Diese Besonderheit bringt uns
zum nächsten Kapitel.
2.3 Teilspielperfekte Nashlösung
Definition: Eine Strategiekombination (si, s-i) ist eine teilspielperfekte Nash-Lösung (oder
kurz: teilspielperfekt), wenn sie im Gesamtspiel und in allen Teilspielen ein NashGleichgewicht darstellt.
Diese Definition liefert ein strengeres Kriterium als das Nash-Gleichgewicht, da es im
Gegensatz zum Nash-Gleichgewicht die Gleichgewichtseigenschaft nicht nur im Gesamtspiel,
sondern auch in jedem Teilspiel fordert. Das Konzept, das von Reinhard Selten (1965)
entwickelt wurde, dient dazu, dass verhindert wird, dass Lösungen von unglaubwürdigen
Entscheidungen in einigen Teilspielen abhängen. Jedes teilspielperfekte Gleichgewicht stellt
gleichzeitig das Strategieprofil für ein sequentielles Gleichgewicht dar.
Satz: Durch Rückwärtsinduktion ermittelte Nash-Gleichgewichte sind stets teilspielperfekt.
Das ist einfach nachzuvollziehen, da bei Rückwärtsinduktion an jedem Knoten immer nur die
Beste Auswahl getroffen wird, und somit immer nur gleichgewichtige Entscheidungen für alle
Teilspiele betrachtet werden.
2.4 Ökonomische Anwendungen
Stackelberg-Duopol
In Märkten kann es dazu kommen, dass sich ein Unternehmen einseitig an die Strategiewahl
eines anderen Unternehmens anpasst. Dabei nehmen die Unternehmen zwei verschiedene
Positionen ein, nämlich die Leader, beziehungsweise die Follower Position. Dies lässt sich als
dynamisches Spiel interpretieren. Das Spiel läuft so ab, dass der Leader zuerst seine
Strategievariable wählt und danach der Follower. Als Strategievariable könnten dabei
beispielsweise der Preis oder die Menge gewählt werden.
Ein solcher Spielbaum kann u.a. folgende Darstellung haben:
Cournot-Stackelberg-Szenario:
Es werden hier, die schon in der Seminararbeit von Herrn Klein dargestellten Formeln für das
Cournot-Oligol verwendet werden (als Oligopol wird in der Mikroökonomik eine Marktform
bezeichnet, bei der viele Nachfrager wenigen Anbietern gegenüberstehen).
Es handelt sich um zwei Anbieter i=1,2, die mit homogenen Gütern handeln und die Menge
wird mit
definiert. Der Follower wird die beste Antwort auf die Mengensetzung
Leaders geben, welcher wiederum die Antwort des Followers antizipiert.
Es gelten dieselben Annahmen wie beim Cournot Spiel. Angenommen, Unternehmen 2 ist
der Follower. Die beste Antwort des Followers ist gegeben durch:
Durch Maximierung der Zielfunktion, unter Erwartung der besten Antwort des Followers,
kann der Leader die Antwort von Unternehmen 2 antizipieren.
Maximierung ergibt:
Die beste Antwort des Followers ist dann:
Somit erhalten wir dann, als Cournot-Stackelberg Lösung, folgenden Vektor:
Setzt man diese Werte in die Gewinnfunktion ein, ergibt das:
Der Gewinn der Cournot Lösung ergibt (a – c)^2/9, sodass gilt:
Wie man sieht, gewinnt der Leader gegenüber der Cournot Lösung, aber der Follower
verliert gegenüber dieser.
3.
Wiederholte Spiele
3.1 Endlich oft wiederholte Spiele
Widmen wir uns jetzt einem Spezialfall der dynamischen Spiele, den wiederholten Spiele.
Zunächst beschäftigen wir uns mit den endlich oft wiederholten Spielen.
Dabei geht es darum, dass ein Spiel in Normalform G genau T mal in Folge gespielt wird. Das
Spiel G kann auch Basispiel oder Stufenspiel genannt werden, und G(T) wird das Gesamtspiel
genannt. Auf jeder Spielstufe beginnen neue Teilspiele, also hat ein Basispiel zum Beispiel 9
Spielausgänge, so würden auf Spielstufe t=2 neun Teilspiele beginnen und auf Spielstufe t=3
81 usw.
Bei einem Basispiel G = {S1,…,Sn,u1,…,un} ist si ∈ Si die Strategie des Spielers und u1,…,un
definiert die Auszahlungen. Für das Gesamtspiel G(T) ergeben sich die Auszahlungen durch
aufsummieren der Auszahlungen der einzelnen Spielstufen. Dadurch, dass es sich um
endliche Aufsummierungen der Auszahlungen handelt, kann man dabei auf eine
Diskontierung verzichten.
Beispiel:
Oben sehen wir ein Basisspiel mit 4 möglichen Auszahlungen bzw Spielausgängen. Als
Beispiel betrachten wir dieses Basisspiel mit einfacher Wiederholung, also haben wir ein
Gesamtspiel G(2). Da wir im Gesamtspiel 4 Spielausgänge haben, hat unser G(2) 16 mögliche
Spielausgänge, deren Auszahlungen sich durch Aufsummierung der Auszahlungen auf Stufe 1
und 2 ergeben. Die Auszahlungsstruktur ist in jedem Teilspiel dieselbe, wie im Basisspiel, und
somit für jeden Spieler gleich. Daraus folgt, dass in allen Teilspielen der letzten Spielstufe
eine Nash-Lösung des Basisspiels gespielt werden muss.
Wie wir sehen können, ist (a1,b1) im Basisspiel und auch in jedem Teilspiel eine Nashlösung,
wie vorhin schon erwähnt.
3.1.1 multiple Nash Gleichgewichte
Ein weiterer Spezialfall ergibt sich durch multiple Nash Gleichgewichte:
Dazu betrachten wir die obige Matrix, die die Auszahlungen des Basisspiels darstellt. Im
Gesamtspiel G(2) ist jeder Lösungsvektor ein 1X4 Vektor (z.B LLLL, LLMM, MMRR…).
Dazu schauen wir uns einen vollständigen Verhaltensplan an. Dieser lautet: „Spiele auf der
ersten Stufe M. Falls auf der ersten Stufe MM realisiert wurde, spiele anschließend R,
ansonsten L “.
In jedem Teilspiel muss natürlich ein Nash Gleichgewicht gespielt werden. Das ist entweder
RR oder LL, welche wiederum Nash Gleichgewichte im Basisspiels sind. Um zu klären ob
diese auch teilspielperfekt sind, könnten wir das Spiel in Form eines Spielbaums darstellen
und anschließend durch Rückwärtsinduktion lösen. Da das aber sehr aufwendig ist, werden
wir uns eine andere Strategie zu Hilfe nehmen. Das so genannte One Shot Game.
3.1.2 One Shot Game
Bei einem One Shot Game werden die Auszahlungen der ersten und zweiten Stufe nach
Vorgangsweise des Verhaltensplanes addiert. Also werden im Teilspiel mit Vorgeschichte
MM, RR gespielt, also RR mit (3,3) wird MM mit (4,4) hinzugerechnet. In jedem anderen Fall
wird in der zweiten Stufe LL gespielt, somit wird zu allen übrigen Möglichkeiten (1,1)
hinzugerechnet. Daraus ergibt sich folgende Auszahlungsmatrix:
Ein sehr wichtiger Punkt hierbei ist, dass wir nicht mehr dieselbe Auszahlungsstruktur wie im
Basisspiel haben. Wir können aber sehen, dass im One Shot Game auch MM ein Nash
Gleichgewicht darstellt, auch wenn es keines im Basisspiel ist. Somit haben wir eine
teilspielperfekte Strategiekombinationen erhalten. Das führt uns zu folgendem:
Satz: Wenn es in einem Basisspiel multiple Nash Gleichgewichte gibt, dann existieren
teilspielperfekte Lösungen für G(T), bei denen auf Spielstufen t < T Spielzüge gewählt
werden, die im Basisspiel kein Nash Gleichgewicht darstellen.
3.2 Unendlich oft wiederholte Spiele
Im Gegensatz zu den endlich oft wiederholten Spielen ist das Diskontieren der Auszahlungen
bei den unendlich oft wiederholten Spielen wesentlich. Mit u t werden die Auszahlungen der
Stufe t bezeichnet. Für einen bestimmten Spielverlauf wird die Auszahlung wie folgt definiert:
Das Delta beschreibt den Diskontfaktor und V den Barwert. Ein unendlich oft wiederholtes
Spiel hat die Darstellung G(∞, δ)
Allgemein ist noch zu sagen, dass es immer unendlich viele Strategien für jedes Spiel gibt und
deshalb die Strategien immer sehr allgemein definiert werden müssen. Außerdem gibt es
unendliche viele Teilspiele, die untereinander und mit dem Gesamtspiel identisch sind.
Eine wesentliche Strategie, stellt die Triggerstrategie dar. Diese Strategie kündigt immer ein
bestimmtes Verhalten an, solange sich auch der Gegenspieler an seine Ankündigungen hält.
Verstößt einer der beiden gegen seine Vorgabe, zieht dies eine Bestrafung nach sich. Auf
diese Weise können auch kooperative Lösungen erzieht werden, die in einem endlich oft
wiederholten Spiel keine Nash Gleichgewichte darstellen.
Eines der berühmtesten Beispiele, das im Anschluss auch noch genau behandelt wird, ist das
so genannte Gefangenendilemma.
3.2.1 Folk Theorem
Sei G ein Basispiel mit vollständiger Information und (u1,…,un) der Vektor der Auszahlungen
für die Spieler 1,..,n als Nash Gleichgewicht. Falls ein Auszahlungsvektor (a1,…,an) existiert,
für den gilt ai > ui für alle i (d.h. alle Nash Lösungen sind pareto-inferior) und falls der
Diskontfaktor δ hinreichend nahe bei 1 liegt, dann existiert eine teilspielperfekte Lösung für
G(∞, δ), die (a1,…,an) als durchschnittliche Auszahlung hervorbringen.
In einem unendlich oft wiederholten Spiel mit n Akteuren und einer endlichen Menge an
Aktionen kann jede Kombination von individuell rationalen, erreichbaren Auszahlungen als
teilspielperfektes Nash-Gleichgewicht gestützt werden. Das Folk Theorem gilt auch in dem
Fall, dass die Nash Lösung des Basisspiels eindeutig ist.
3.3 Ökonomische Anwendung
Ein sehr eindrucksvolles Spiel ist bei näherer Betrachtung das Markteintrittspiel. Dabei haben
wir zwei Spieler, den Monopolisten und den Konkurrenten. Die Strategiemenge beider
Spieler sieht so aus, dass der Monopolist KÄMPFEN oder TEILEN spielen kann und der
Konkurrent EINTRITT oder NICHT EINTRITT als Strategie zur Verfügung hat. Der zugehörige
Spielbaum und die zugehörige Matrix schauen wie folgt aus:
Betrachten wir zuerst den Spielbaum. Durch Rückwärtsinduktion kann man schnell erkennen,
das sich der Monopolist nicht auf einen Kampf einlassen wird, da dieser für ihn zu teuer
werden kann und sich daher mit dem geringeren Gewinn zufrieden geben wird. Also
kommen wir dabei auf eine Lösung, bei der der Konkurrent eintritt und der Monopolist teilen
spielt.
Betrachten wir jetzt hingegen die Matrix, bekommen wir zwei Nash Gleichgewichte als
Lösung, und zwar Eintritt-Teilen und Nicht Eintritt-Kämpfen. Da die zweite Lösung aber auf
einer nicht rationalen Entscheidung beruht, ist diese nicht teilspielperfekt.
Bei nur einem Konkurrenten ist das ganze Spiel sehr einfach und auch nicht wirklich
erwähnenswert. Stellt man sich aber eine Handelskette mit mehreren Konkurrenten, und an
vielen verschiedenen Orten vor, ändert sich der Spielverlauf beträchtlich. Denn der der
Spielzug KÄMPFE könnte für den Monopolisten durchaus wichtig werden, wenn er es
schaffen könnte zumindest einen Teil der Konkurrenten vom Eintritt abzuhalten.
Sei yn die Wahrscheinlichkeit, dass der Monopolist am Ort n kämpft (1,..,n Anzahl der Orte
an denen ein Konkurrent eintreten kann), dann wird der Konkurrent am Ort n nur dann
eintreten, wenn nach seiner Wahrscheinlichkeitsabschätzung yn(-1) + (1-yn)b >= 0. Deshalb
ist der Monopolist immer daran interessiert, dass yn möglichst hoch eingeschätzt wird und
versucht eine Reputation von Kämpfern aufzubauen, was bedeutet das er sich einen Ruf
verschaffen will der ihm nachsagt KÄMPFEN zu spielen.
Reinhard Selten stellte 1978 fest, dass diese Strategie bei einem endlichen Spiel keinen Erfolg
hat. Da sich ein Reputationsaufbau im letzten Spielzug nicht mehr lohnt und der Monopolist
beim letzten Konkurrenten immer TEILEN spielen wird. Diese Entscheidung wird vom
Konkurrenten antizipiert und tritt in den Markt ein. Löst man dieses Spiel durch
Rückwärtsinduktion, wird klar, dass aufgrund der Antizipation des anderen, an jedem Punkt
TEILEN und EINTRITT gespielt werden wird. Da dies in Wirklichkeit aber nie vorkommen wird,
nennt man dieses Phänomen Handelskettenparadoxon.
Eine glaubwürde Abschreckung kann nur bei einem unendlich oft wiederholten Spiel
implementiert werden. Auch bei unvollständiger Information, also wenn der Konkurrent
nicht weiß, ob sich der Monopolist einen Preiskampf leisten kann, kann ein Konkurrent vom
Eintritt abgehalten werden.
4. Gefangenendilemma
Präzise ausgedrückt kann man das Gefangenendilemma so definieren:
„Das Gefangenendilemma kennzeichnet eine Situation, in der individuell rationales
Verhalten der einzelnen Gruppenmitglieder zu einem für die Gruppe nicht Paretooptimalem Ergebnis führt. Obwohl demnach ein Gleichgewicht vorhanden ist, ist
dieses nicht gesellschaftlich optimal.“ (Wirtschaftslexikon Gabler)
Wir finden folgende Spielsituation vor:
Zwei Gefangene werden einer Straftat beschuldigt. Durch kooperieren oder verraten des
anderen ergeben sich somit 4 Verschiedene Szenarien wie viele Jahre sie jeweils ins
Gefängnis kommen:
B kooperiert
A kooperiert A: R
A verrät
R: reward
A: T
B verrät
B: R
A: S
B: T
B: S
A: P
B: P
Beide Häftlinge werden dafür belohnt, dass sie kooperieren und sich gegenseitig nicht
verraten und müssen dafür nur 2 Jahre in Haft.
T: temptation
Ein Häftling wird zum Verrat verführt, der andere war aber zur Kooperation bereit. Dadurch
wird der Verräter belohnt und erhält die geringste Strafe von einem Jahr.
S: sucker‘s payoff
Der Häftling der zur Kooperation bereit war, aber vom anderen Verraten wird, bekommt die
Höchststrafe von 6 Jahren.
P: punishment
Beide werden für den gegenseitigen Verrat bestraft und bekommen 4 Jahre Haft.
In der folgenden Erläuterung beschränke ich mich nur auf das mehrmalig gespielte
Gefangenendilemma und dessen Strategien.
Bei der mehrmaligen Wiederholung des Spieles, hat jeder Spieler die Möglichkeit auf die
Entscheidung des Gegners im vorherigen Zug zu reagieren. Also würde man sich
beispielsweise bei Verrat des Gegenspielers in der nächsten Runde für diese Tat rächen.
Kooperiert der Gegner kann er ihn dafür belohnen und ebenfalls kooperieren.
Wichtig ist, dass die Anzahl der gespielten Runden keinem Teilnehmer mitgeteilt wird, um
ihre „letzte“ Entscheidung nicht zu beeinflussen. Bei genauerer Betrachtung scheint die
einzig rationale Entscheidung der ständige Verrat zu sein, was in der Praxis aber nicht immer
der Fall ist. Bei mehrmaligem Spiel wird die Auszahlungsmatrix in der Regel so gestaltet, dass
zusätzlich zur allgemein gültigen Ungleichung T > R > P > S außerdem 2R > T + S) gilt. Dies ist
notwendig, da sonst Spieler, die immer Kooperieren, einen klaren Nachteil haben.
Um die Ergebnisse vergleichen zu können, werden alle Auszahlungen bei einem endlich oft
wiederholten Spiel addiert. Unterscheiden muss man auch, ob ein Spieler gewinnen oder
siegen will. Möchte ein Spieler den anderen besiegen, handelt es sich eigentlich um ein
anderes Spiel. Wenn man gewinnen will, ist das Ziel einen möglichst großen Gewinn zu
erzielen, daher lohnt es sich auch zu kooperieren.
STRATEGIE:
Für das endlich oft gespielte Gefangenendilemma gibt es eine Vielzahl an verschiedenen
Strategien, für die sich im Laufe der Zeit auch Namen eingebürgert haben. Es werden an
dieser Stelle einige Strategien mit ihrer durchschnittlichen Auszahlung unter der
Voraussetzung, dass die Anzahl der Runden unbekannt sind und es nach jedem Zug mit einer
Wahrscheinlichkeit von δ є ]0,1[ einen weiteren Zug gibt, vorgestellt:
* Tit-for-Tat:
- TFT Spieler erhält gegen ewigen K: R/(1- δ)
-TFT Spieler erhält gegen ewigen TFT: R/1-δ)
-TFT Spieler erhält gegen ewigen V: (P/1-δ) + S –P
* always defect:
- V gegen ewigen K: T/(1-δ)
- V gegen ewigen V: P/(1-δ)
* always cooperate:
-K gegen ewigen K: R/(1-δ)
-K gegen ewigen V: S/(1-δ)
Die optimale Strategie ist, wenn sie konsequent gewählt wird, die Tit-for-Tate Strategie.
Allerdings ist diese Strategie fehleranfällig. Kommt es nämlich zu einem Missverständnis
zwischen zwei Spielern, kann dies Einfluss auf den kompletten Spielverlauf haben. Die
ständige Rache, aufgrund des Missverständnisses, wird auch als Vendetta bezeichnet.
Das Gefangenendilemma ist auch auf viele Sachverhalte in der Praxis übertragen, wie zum
Beispiel in der Politik, Wirtschaft und der Kriminalistik.
Wird etwa zwischen zwei Ländern eine Rüstungskontrolle vereinbart, so ist es für das Land
selbst wahrscheinlich immer besser, heimlich doch sein Waffenarsenal aufzurüsten. Beide
Länder sind schlechter gestellt, wenn sie beide gegen das Abkommen verstoßen. Grund dafür
ist die Gefahr, erwischt zu werden und die Produktionskosten. Hingegen wäre man klar im
Nachteil, wenn der Gegner aufrüstet und man sich selbst an das Abkommen hält.
Literaturverzeichnis:

http://www.spieltheorie.de/Spieltheorie_Grundlagen/was-ist-spieltheorie.htm

http://de.wikipedia.org/wiki/Gefangenendilemma

Spieltheorie von PD Dr. M. Pasche