Seminararbeit Hochwarter
Transcrição
Seminararbeit Hochwarter
SPIELTHEORIE IN DER ÖKONOMIE Teil 2 Kevin Hochwarter 1025595 Seminararbeit aus Finanz und Versicherungsmathematik 31. Jänner 2013 Inhaltsverzeichnis: 1. Einleitung 2. Dynamische Spiele 2.1 Extensive Spielform 2.2 Lösungsmethode 2.3 Teilspielperfekte Nashlösung 2.4 Ökonomische Anwendungen 3. Wiederholte Spiele 3.1 Endlich oft wiederholte Spiele 3.1.1 Multiple Nash Gleichgewichte 3.1.2 One Shot Game 3.2 Unendlich oft wiederholte Spiele 3.2.1 Folk Theorem 3.3 Ökonomische Anwendung 4. Gefangenendilemma 5. Literaturverzeichnis 1. Einleitung Für den Begriff Spieltheorie gibt es sehr viele verschiedene und kurze Definitionen, wie zum Beispiel „Theorie zur mathematischen Analyse von Konflikten“. Oder „Entscheidungstheorie, die Situationen untersucht, in denen das Ergebnis nicht von einem Entscheider allein bestimmt werden kann, sondern nur von mehreren Entscheidern gemeinsam“. Der Anwendungsbereich ist, vor allem in der Ökonomie, sehr weit gestreut. Den hohen Stellenwert erkennt man auch daran, dass in den vergangenen Jahrzehnten viele Nobelpreise an Wissenschaftler vergeben wurden, die sich mit diesem Thema beschäftigten. Meine Seminararbeit behandelt den zweiten Teil der Spieltheorie in der Ökonomie, und ist die Fortsetzung von der Seminararbeit der Spieltheorie in der Ökonomie von Herrn Kevin Klein. Die Grundlagen, die in der Seminararbeit von Herrn Klein erarbeitet wurden, werden hier als vorausgesetzt angesehen. Einer der wichtigsten Punkte ist dabei das Nash Gleichgewicht. Die zwei grundlegenden Themengebiete meiner Arbeit behandeln die dynamischen und die wiederholten Spiele. Beides wird zuerst theoretisch erläutert und anschließend anhand von praktischen Beispielen aus der Ökonomie dargestellt. 2. Dynamische Spiele Bei den dynamischen Spielen, kann im Gegensatz zu den statischen Spielen, bei denen die Spielzüge simultan getätigt werden, der Spielzug des Gegenspielers beobachtet werden, um seinen eigenen Spielzug eventuell daran anpassen zu können. Diese Art von Entscheidung nennt man sequenzielle Entscheidung. Somit hat mindestens eine Entscheidung eine Vorgeschichte. Die im nächsten Kapitel behandelten wiederholten Spiele, stellen eine Spezialform der dynamischen Spiele dar. Im Allgemeinen beschreibt das dynamische Spiel die Strategie der bedingten Entscheidungen, also wie sich Spieler in Abhängigkeit von möglichen Vorgeschichten entscheiden. Eine Strategie beschreibt somit einen Verhaltensplan für das gesamte Spiel. Dieser beinhaltet Strategien, für getätigte Entscheidungen, aber auch für solche, die nie realisiert werden. Das führt zu folgenden Definitionen: Definition: Das Gesamtspiel G beschreibt alle denkbaren (dynamischen) Verhaltenspläne für alle Spieler, sowie die jeweils daraus resultierenden Auszahlungen. Definition: Ein Teilspiel ist derjenige Teil (Ausschnitt) des Gesamtspiels, der für sich genommen ein vollständiges Spiel darstellt. Ein Teilspiel ist so zu verstehen, dass in solchen Spielen gewisse Entscheidungen oder Spielzüge als gegeben anzusehen sind und nicht revidierbar sind. Somit ist das Spiel nicht von Beginn an zu spielen, sonder nur mehr ein Teilspiel, was mit den üblichen Methoden zu lösen ist. Die Begriffe des Gesamtspiels und des Teilspiels sind am einfachsten anhand der extensiven Spielform zu erläutern. 2.1 Extensive Spielform: Die extensive Spielform ist am leichtesten mit einem Spielbaum darstellbar. Wie man an dem Spielbaum sehen kann, gibt es 4 wesentliche Punkte, die für das Spiel wichtig sind. Die Knoten stellen die Entscheidungssituation eines Spielers dar. Der von jedem Knoten weggehende Ast, steht für einen einzigen Spielzug eines Spielers also die Entscheidung an dem jeweiligen Knoten. Am Ende des Spielbaumes befinden sich die Auszahlungsvektoren, an denen man, nach der letzten Entscheidung des Spieles, die „payoffs“ ablesen kann. Der letzte Punkt ist der Informationsbezirk, oben zu sehen an dem langgezogenen Rechteck, das mehrere Knoten verbindet. Dieser fasst die Knoten zusammen, deren Vorgeschichte von dem betreffenden Spieler nicht beobachten werden konnte. Zu beachten ist, dass jeder Knoten, bis auf den Anfangsknoten, nur von einem einzigen Ast erreicht werden kann und es keine rekursiven Verknüpfungen geben darf. Außerdem ist noch zu sagen, dass an jeder Entscheidungssituation, also an Knoten die nicht durch Informationsbezirke verbunden sind, ein Teilspiel beginnt. Um einen Eindruck dafür zu bekommen, welchen Einfluss ein Informationsbezirk auf die Strategiemenge eines Spieles hat, werde ich die Lösungsmengen anhand des obigen Spielbaumes mit und ohne Informationsbezirk angeben. *Spieler A: Strategiemenge SA = {(a1,x1),(a1,x2),(a2,y1)(a2,y2)} *Spieler B: Strategiemenge SB = {b1,b2}, da die erste Entscheidung von A nicht beobachtet werden kann. Die oben verwendeten Elemente a1, a2, b1, b2, x1, x2, y1, y2 sind keine Strategien sondern Spielzüge. Lässt man jetzt den Informationsbezirk weg, ändert sich dieser wie folgt: Wie man sofort sieht, ändert sich nicht nur die Strategiemenge, sondern auch die Anzahl der Teilspiele erhöht sich durch wegfallen des Informationsbezirkes. Die Strategiemengen sind jetzt folgende: *Spieler A: Strategiemenge bleibt unverändert Strategiemenge SA = {(a1,x1),(a1,x2),(a2,y1)(a2,y2)} *Spieler B: Strategiemenge SB = {(b1,c1),(b1,c2),(b2,c1)(b2,c2)} Der Spielbaum ist nicht die einzige Darstellung der extensiven Spielform. Eine weitere Darstellmöglichkeit bietet die Matrixdarstellung, bei der die Strategiemengen in eine Zeile bzw. eine Spalte geschrieben werden. In den übrigen Feldern sind die entsprechenden payoffs einzutragen. 2.2 Lösungsmethode Die Lösung eines Spiels in extensiver Spielform erfolgt durch Rückwärtsinduktion. Diese beginnt immer beim letzten Entscheidungsknoten eines Spiels. Der entsprechende Spieler A wird dabei eine rationale Entscheidung treffen, also wird an jedem Knoten den Weg mit dem höchsten payoff wählen. Diese Entscheidung kann aber von dem Spieler B, der vorher am Zug ist antizipiert werden. Dieser trifft wieder eine rationale Entscheidung, die auf der gleichgewichtigen Erwartung der Entscheidung bezüglich A beruht. Diese rationale Entscheidung kann wiederum vom Spieler B, der vorher am Zug ist antizipiert werden. Dieser Zyklus, der der Entscheidung und der Antizipation, wird so lange durchgeführt, bis man zum Anfangsknoten gelangt. Zur Veranschaulichung wird wieder ein kurzes Beispiel angeführt: Bei der Lösung gehen wir Schritt für Schritt wie folgt vor; Zuerst betrachten wir die Entscheidungssituation von Spieler A. Dieser hat die Wahl zwischen x1 und x2, und die Wahl zwischen y1 und y2. Die erste Entscheidung wird auf x1 fallen, da 5 > 3 ist, und die zweite auf y2, da 0 > -1 ist. Sind diese Entscheidungen getroffen worden, gehen wir zum nächsten Knoten, wo diesmal Spieler B eine Auswahl treffen muss. Dieser kann die Entscheidung von A antizipieren, und entscheidet sich bei b1, b2 für b1 weil, 4 > 0 und bei c1, c2 für c2, da 5 > 0. Zum Schluss hat noch einmal Spieler B eine Auswahlmöglichkeit zwischen a1 und a2. Er wird sich für a1 entscheiden, weil 5>3. Haben beide Spieler alle ihre rationalen Entscheidungen getroffen, kommt man zur perfekten Lösung des ganzen Spieles: ((a1,x1),(b1,c2)). Das oben gespielte Spiel wird in Matrixform analysiert: Wie man an den fett gedruckten Lösungen, die Nash Gleichgewichte darstellen, sehen kann, gibt es mehrere mögliche Lösungen, und nicht nur ((a1,x1),(b1,c2)). Auch diese Strategiekombinationen sind gleichgewichtig im Sinne der Nash-Lösung, wurden aber durch die Rückwärtsinduktion nicht als Gleichgewichte identifiziert. Diese Besonderheit bringt uns zum nächsten Kapitel. 2.3 Teilspielperfekte Nashlösung Definition: Eine Strategiekombination (si, s-i) ist eine teilspielperfekte Nash-Lösung (oder kurz: teilspielperfekt), wenn sie im Gesamtspiel und in allen Teilspielen ein NashGleichgewicht darstellt. Diese Definition liefert ein strengeres Kriterium als das Nash-Gleichgewicht, da es im Gegensatz zum Nash-Gleichgewicht die Gleichgewichtseigenschaft nicht nur im Gesamtspiel, sondern auch in jedem Teilspiel fordert. Das Konzept, das von Reinhard Selten (1965) entwickelt wurde, dient dazu, dass verhindert wird, dass Lösungen von unglaubwürdigen Entscheidungen in einigen Teilspielen abhängen. Jedes teilspielperfekte Gleichgewicht stellt gleichzeitig das Strategieprofil für ein sequentielles Gleichgewicht dar. Satz: Durch Rückwärtsinduktion ermittelte Nash-Gleichgewichte sind stets teilspielperfekt. Das ist einfach nachzuvollziehen, da bei Rückwärtsinduktion an jedem Knoten immer nur die Beste Auswahl getroffen wird, und somit immer nur gleichgewichtige Entscheidungen für alle Teilspiele betrachtet werden. 2.4 Ökonomische Anwendungen Stackelberg-Duopol In Märkten kann es dazu kommen, dass sich ein Unternehmen einseitig an die Strategiewahl eines anderen Unternehmens anpasst. Dabei nehmen die Unternehmen zwei verschiedene Positionen ein, nämlich die Leader, beziehungsweise die Follower Position. Dies lässt sich als dynamisches Spiel interpretieren. Das Spiel läuft so ab, dass der Leader zuerst seine Strategievariable wählt und danach der Follower. Als Strategievariable könnten dabei beispielsweise der Preis oder die Menge gewählt werden. Ein solcher Spielbaum kann u.a. folgende Darstellung haben: Cournot-Stackelberg-Szenario: Es werden hier, die schon in der Seminararbeit von Herrn Klein dargestellten Formeln für das Cournot-Oligol verwendet werden (als Oligopol wird in der Mikroökonomik eine Marktform bezeichnet, bei der viele Nachfrager wenigen Anbietern gegenüberstehen). Es handelt sich um zwei Anbieter i=1,2, die mit homogenen Gütern handeln und die Menge wird mit definiert. Der Follower wird die beste Antwort auf die Mengensetzung Leaders geben, welcher wiederum die Antwort des Followers antizipiert. Es gelten dieselben Annahmen wie beim Cournot Spiel. Angenommen, Unternehmen 2 ist der Follower. Die beste Antwort des Followers ist gegeben durch: Durch Maximierung der Zielfunktion, unter Erwartung der besten Antwort des Followers, kann der Leader die Antwort von Unternehmen 2 antizipieren. Maximierung ergibt: Die beste Antwort des Followers ist dann: Somit erhalten wir dann, als Cournot-Stackelberg Lösung, folgenden Vektor: Setzt man diese Werte in die Gewinnfunktion ein, ergibt das: Der Gewinn der Cournot Lösung ergibt (a – c)^2/9, sodass gilt: Wie man sieht, gewinnt der Leader gegenüber der Cournot Lösung, aber der Follower verliert gegenüber dieser. 3. Wiederholte Spiele 3.1 Endlich oft wiederholte Spiele Widmen wir uns jetzt einem Spezialfall der dynamischen Spiele, den wiederholten Spiele. Zunächst beschäftigen wir uns mit den endlich oft wiederholten Spielen. Dabei geht es darum, dass ein Spiel in Normalform G genau T mal in Folge gespielt wird. Das Spiel G kann auch Basispiel oder Stufenspiel genannt werden, und G(T) wird das Gesamtspiel genannt. Auf jeder Spielstufe beginnen neue Teilspiele, also hat ein Basispiel zum Beispiel 9 Spielausgänge, so würden auf Spielstufe t=2 neun Teilspiele beginnen und auf Spielstufe t=3 81 usw. Bei einem Basispiel G = {S1,…,Sn,u1,…,un} ist si ∈ Si die Strategie des Spielers und u1,…,un definiert die Auszahlungen. Für das Gesamtspiel G(T) ergeben sich die Auszahlungen durch aufsummieren der Auszahlungen der einzelnen Spielstufen. Dadurch, dass es sich um endliche Aufsummierungen der Auszahlungen handelt, kann man dabei auf eine Diskontierung verzichten. Beispiel: Oben sehen wir ein Basisspiel mit 4 möglichen Auszahlungen bzw Spielausgängen. Als Beispiel betrachten wir dieses Basisspiel mit einfacher Wiederholung, also haben wir ein Gesamtspiel G(2). Da wir im Gesamtspiel 4 Spielausgänge haben, hat unser G(2) 16 mögliche Spielausgänge, deren Auszahlungen sich durch Aufsummierung der Auszahlungen auf Stufe 1 und 2 ergeben. Die Auszahlungsstruktur ist in jedem Teilspiel dieselbe, wie im Basisspiel, und somit für jeden Spieler gleich. Daraus folgt, dass in allen Teilspielen der letzten Spielstufe eine Nash-Lösung des Basisspiels gespielt werden muss. Wie wir sehen können, ist (a1,b1) im Basisspiel und auch in jedem Teilspiel eine Nashlösung, wie vorhin schon erwähnt. 3.1.1 multiple Nash Gleichgewichte Ein weiterer Spezialfall ergibt sich durch multiple Nash Gleichgewichte: Dazu betrachten wir die obige Matrix, die die Auszahlungen des Basisspiels darstellt. Im Gesamtspiel G(2) ist jeder Lösungsvektor ein 1X4 Vektor (z.B LLLL, LLMM, MMRR…). Dazu schauen wir uns einen vollständigen Verhaltensplan an. Dieser lautet: „Spiele auf der ersten Stufe M. Falls auf der ersten Stufe MM realisiert wurde, spiele anschließend R, ansonsten L “. In jedem Teilspiel muss natürlich ein Nash Gleichgewicht gespielt werden. Das ist entweder RR oder LL, welche wiederum Nash Gleichgewichte im Basisspiels sind. Um zu klären ob diese auch teilspielperfekt sind, könnten wir das Spiel in Form eines Spielbaums darstellen und anschließend durch Rückwärtsinduktion lösen. Da das aber sehr aufwendig ist, werden wir uns eine andere Strategie zu Hilfe nehmen. Das so genannte One Shot Game. 3.1.2 One Shot Game Bei einem One Shot Game werden die Auszahlungen der ersten und zweiten Stufe nach Vorgangsweise des Verhaltensplanes addiert. Also werden im Teilspiel mit Vorgeschichte MM, RR gespielt, also RR mit (3,3) wird MM mit (4,4) hinzugerechnet. In jedem anderen Fall wird in der zweiten Stufe LL gespielt, somit wird zu allen übrigen Möglichkeiten (1,1) hinzugerechnet. Daraus ergibt sich folgende Auszahlungsmatrix: Ein sehr wichtiger Punkt hierbei ist, dass wir nicht mehr dieselbe Auszahlungsstruktur wie im Basisspiel haben. Wir können aber sehen, dass im One Shot Game auch MM ein Nash Gleichgewicht darstellt, auch wenn es keines im Basisspiel ist. Somit haben wir eine teilspielperfekte Strategiekombinationen erhalten. Das führt uns zu folgendem: Satz: Wenn es in einem Basisspiel multiple Nash Gleichgewichte gibt, dann existieren teilspielperfekte Lösungen für G(T), bei denen auf Spielstufen t < T Spielzüge gewählt werden, die im Basisspiel kein Nash Gleichgewicht darstellen. 3.2 Unendlich oft wiederholte Spiele Im Gegensatz zu den endlich oft wiederholten Spielen ist das Diskontieren der Auszahlungen bei den unendlich oft wiederholten Spielen wesentlich. Mit u t werden die Auszahlungen der Stufe t bezeichnet. Für einen bestimmten Spielverlauf wird die Auszahlung wie folgt definiert: Das Delta beschreibt den Diskontfaktor und V den Barwert. Ein unendlich oft wiederholtes Spiel hat die Darstellung G(∞, δ) Allgemein ist noch zu sagen, dass es immer unendlich viele Strategien für jedes Spiel gibt und deshalb die Strategien immer sehr allgemein definiert werden müssen. Außerdem gibt es unendliche viele Teilspiele, die untereinander und mit dem Gesamtspiel identisch sind. Eine wesentliche Strategie, stellt die Triggerstrategie dar. Diese Strategie kündigt immer ein bestimmtes Verhalten an, solange sich auch der Gegenspieler an seine Ankündigungen hält. Verstößt einer der beiden gegen seine Vorgabe, zieht dies eine Bestrafung nach sich. Auf diese Weise können auch kooperative Lösungen erzieht werden, die in einem endlich oft wiederholten Spiel keine Nash Gleichgewichte darstellen. Eines der berühmtesten Beispiele, das im Anschluss auch noch genau behandelt wird, ist das so genannte Gefangenendilemma. 3.2.1 Folk Theorem Sei G ein Basispiel mit vollständiger Information und (u1,…,un) der Vektor der Auszahlungen für die Spieler 1,..,n als Nash Gleichgewicht. Falls ein Auszahlungsvektor (a1,…,an) existiert, für den gilt ai > ui für alle i (d.h. alle Nash Lösungen sind pareto-inferior) und falls der Diskontfaktor δ hinreichend nahe bei 1 liegt, dann existiert eine teilspielperfekte Lösung für G(∞, δ), die (a1,…,an) als durchschnittliche Auszahlung hervorbringen. In einem unendlich oft wiederholten Spiel mit n Akteuren und einer endlichen Menge an Aktionen kann jede Kombination von individuell rationalen, erreichbaren Auszahlungen als teilspielperfektes Nash-Gleichgewicht gestützt werden. Das Folk Theorem gilt auch in dem Fall, dass die Nash Lösung des Basisspiels eindeutig ist. 3.3 Ökonomische Anwendung Ein sehr eindrucksvolles Spiel ist bei näherer Betrachtung das Markteintrittspiel. Dabei haben wir zwei Spieler, den Monopolisten und den Konkurrenten. Die Strategiemenge beider Spieler sieht so aus, dass der Monopolist KÄMPFEN oder TEILEN spielen kann und der Konkurrent EINTRITT oder NICHT EINTRITT als Strategie zur Verfügung hat. Der zugehörige Spielbaum und die zugehörige Matrix schauen wie folgt aus: Betrachten wir zuerst den Spielbaum. Durch Rückwärtsinduktion kann man schnell erkennen, das sich der Monopolist nicht auf einen Kampf einlassen wird, da dieser für ihn zu teuer werden kann und sich daher mit dem geringeren Gewinn zufrieden geben wird. Also kommen wir dabei auf eine Lösung, bei der der Konkurrent eintritt und der Monopolist teilen spielt. Betrachten wir jetzt hingegen die Matrix, bekommen wir zwei Nash Gleichgewichte als Lösung, und zwar Eintritt-Teilen und Nicht Eintritt-Kämpfen. Da die zweite Lösung aber auf einer nicht rationalen Entscheidung beruht, ist diese nicht teilspielperfekt. Bei nur einem Konkurrenten ist das ganze Spiel sehr einfach und auch nicht wirklich erwähnenswert. Stellt man sich aber eine Handelskette mit mehreren Konkurrenten, und an vielen verschiedenen Orten vor, ändert sich der Spielverlauf beträchtlich. Denn der der Spielzug KÄMPFE könnte für den Monopolisten durchaus wichtig werden, wenn er es schaffen könnte zumindest einen Teil der Konkurrenten vom Eintritt abzuhalten. Sei yn die Wahrscheinlichkeit, dass der Monopolist am Ort n kämpft (1,..,n Anzahl der Orte an denen ein Konkurrent eintreten kann), dann wird der Konkurrent am Ort n nur dann eintreten, wenn nach seiner Wahrscheinlichkeitsabschätzung yn(-1) + (1-yn)b >= 0. Deshalb ist der Monopolist immer daran interessiert, dass yn möglichst hoch eingeschätzt wird und versucht eine Reputation von Kämpfern aufzubauen, was bedeutet das er sich einen Ruf verschaffen will der ihm nachsagt KÄMPFEN zu spielen. Reinhard Selten stellte 1978 fest, dass diese Strategie bei einem endlichen Spiel keinen Erfolg hat. Da sich ein Reputationsaufbau im letzten Spielzug nicht mehr lohnt und der Monopolist beim letzten Konkurrenten immer TEILEN spielen wird. Diese Entscheidung wird vom Konkurrenten antizipiert und tritt in den Markt ein. Löst man dieses Spiel durch Rückwärtsinduktion, wird klar, dass aufgrund der Antizipation des anderen, an jedem Punkt TEILEN und EINTRITT gespielt werden wird. Da dies in Wirklichkeit aber nie vorkommen wird, nennt man dieses Phänomen Handelskettenparadoxon. Eine glaubwürde Abschreckung kann nur bei einem unendlich oft wiederholten Spiel implementiert werden. Auch bei unvollständiger Information, also wenn der Konkurrent nicht weiß, ob sich der Monopolist einen Preiskampf leisten kann, kann ein Konkurrent vom Eintritt abgehalten werden. 4. Gefangenendilemma Präzise ausgedrückt kann man das Gefangenendilemma so definieren: „Das Gefangenendilemma kennzeichnet eine Situation, in der individuell rationales Verhalten der einzelnen Gruppenmitglieder zu einem für die Gruppe nicht Paretooptimalem Ergebnis führt. Obwohl demnach ein Gleichgewicht vorhanden ist, ist dieses nicht gesellschaftlich optimal.“ (Wirtschaftslexikon Gabler) Wir finden folgende Spielsituation vor: Zwei Gefangene werden einer Straftat beschuldigt. Durch kooperieren oder verraten des anderen ergeben sich somit 4 Verschiedene Szenarien wie viele Jahre sie jeweils ins Gefängnis kommen: B kooperiert A kooperiert A: R A verrät R: reward A: T B verrät B: R A: S B: T B: S A: P B: P Beide Häftlinge werden dafür belohnt, dass sie kooperieren und sich gegenseitig nicht verraten und müssen dafür nur 2 Jahre in Haft. T: temptation Ein Häftling wird zum Verrat verführt, der andere war aber zur Kooperation bereit. Dadurch wird der Verräter belohnt und erhält die geringste Strafe von einem Jahr. S: sucker‘s payoff Der Häftling der zur Kooperation bereit war, aber vom anderen Verraten wird, bekommt die Höchststrafe von 6 Jahren. P: punishment Beide werden für den gegenseitigen Verrat bestraft und bekommen 4 Jahre Haft. In der folgenden Erläuterung beschränke ich mich nur auf das mehrmalig gespielte Gefangenendilemma und dessen Strategien. Bei der mehrmaligen Wiederholung des Spieles, hat jeder Spieler die Möglichkeit auf die Entscheidung des Gegners im vorherigen Zug zu reagieren. Also würde man sich beispielsweise bei Verrat des Gegenspielers in der nächsten Runde für diese Tat rächen. Kooperiert der Gegner kann er ihn dafür belohnen und ebenfalls kooperieren. Wichtig ist, dass die Anzahl der gespielten Runden keinem Teilnehmer mitgeteilt wird, um ihre „letzte“ Entscheidung nicht zu beeinflussen. Bei genauerer Betrachtung scheint die einzig rationale Entscheidung der ständige Verrat zu sein, was in der Praxis aber nicht immer der Fall ist. Bei mehrmaligem Spiel wird die Auszahlungsmatrix in der Regel so gestaltet, dass zusätzlich zur allgemein gültigen Ungleichung T > R > P > S außerdem 2R > T + S) gilt. Dies ist notwendig, da sonst Spieler, die immer Kooperieren, einen klaren Nachteil haben. Um die Ergebnisse vergleichen zu können, werden alle Auszahlungen bei einem endlich oft wiederholten Spiel addiert. Unterscheiden muss man auch, ob ein Spieler gewinnen oder siegen will. Möchte ein Spieler den anderen besiegen, handelt es sich eigentlich um ein anderes Spiel. Wenn man gewinnen will, ist das Ziel einen möglichst großen Gewinn zu erzielen, daher lohnt es sich auch zu kooperieren. STRATEGIE: Für das endlich oft gespielte Gefangenendilemma gibt es eine Vielzahl an verschiedenen Strategien, für die sich im Laufe der Zeit auch Namen eingebürgert haben. Es werden an dieser Stelle einige Strategien mit ihrer durchschnittlichen Auszahlung unter der Voraussetzung, dass die Anzahl der Runden unbekannt sind und es nach jedem Zug mit einer Wahrscheinlichkeit von δ є ]0,1[ einen weiteren Zug gibt, vorgestellt: * Tit-for-Tat: - TFT Spieler erhält gegen ewigen K: R/(1- δ) -TFT Spieler erhält gegen ewigen TFT: R/1-δ) -TFT Spieler erhält gegen ewigen V: (P/1-δ) + S –P * always defect: - V gegen ewigen K: T/(1-δ) - V gegen ewigen V: P/(1-δ) * always cooperate: -K gegen ewigen K: R/(1-δ) -K gegen ewigen V: S/(1-δ) Die optimale Strategie ist, wenn sie konsequent gewählt wird, die Tit-for-Tate Strategie. Allerdings ist diese Strategie fehleranfällig. Kommt es nämlich zu einem Missverständnis zwischen zwei Spielern, kann dies Einfluss auf den kompletten Spielverlauf haben. Die ständige Rache, aufgrund des Missverständnisses, wird auch als Vendetta bezeichnet. Das Gefangenendilemma ist auch auf viele Sachverhalte in der Praxis übertragen, wie zum Beispiel in der Politik, Wirtschaft und der Kriminalistik. Wird etwa zwischen zwei Ländern eine Rüstungskontrolle vereinbart, so ist es für das Land selbst wahrscheinlich immer besser, heimlich doch sein Waffenarsenal aufzurüsten. Beide Länder sind schlechter gestellt, wenn sie beide gegen das Abkommen verstoßen. Grund dafür ist die Gefahr, erwischt zu werden und die Produktionskosten. Hingegen wäre man klar im Nachteil, wenn der Gegner aufrüstet und man sich selbst an das Abkommen hält. Literaturverzeichnis: http://www.spieltheorie.de/Spieltheorie_Grundlagen/was-ist-spieltheorie.htm http://de.wikipedia.org/wiki/Gefangenendilemma Spieltheorie von PD Dr. M. Pasche