Arrows Unmöglichkeitssatz

Transcrição

Arrows Unmöglichkeitssatz
Arrows Unmöglichkeitssatz
Olga Heismann
Linus Mattauch
CdE-PfingstAkademie 2012
1
Einführung
Die Essenz der Arrowschen Unmöglichkeit ist das Condorcet-Paradoxon (1785):
Wenn drei Wähler ihre Präferenzen über drei Wahlmöglichkeiten angeben,
kann es vorkommen, dass eine Mehrheitswahl, bei der paarweise über Alternativen abgestimmt wird, ein zyklisches Ergebnis liefert, also keinen Sieger.
1.1
Hinführung: Die normative Grundlage der Sozialwahltheorie
• Definition: Sozialwahltheorie untersucht auf formale Weise die Möglichkeiten, individuelle Präferenzen oder Urteile zu gesellschaftlichen
Bewertungen oder Entscheidungen zu aggregieren. (Social choice theory wird bisweilen auch als „Theorie bzw. Logik kollektiver Entscheidungen“ übersetzt.)
• Sozialwahltheorie ist eine normative Theorie, baut daher auf Prinzipien
der Moralphilosophie auf.
• Sozialwahltheorie ist konsequentialistisch: Bewertet werden Zustände
der Welt, gesucht wird das beste Ergebnis. Unter den drei großen Strömungen gegenwärtiger Moralphilosophie steht Konsequentialismus im
Gegensatz zu Deontologie und Kontraktualismus.
1.2
Historischer Hintergrund
• Frühe Gedanken über demokratische Gruppenentscheidungen: JeanCharles de Borda (1733–1799) und Marie Jean Caritat Marquis de
Condorcet (1743-1794).
• Frühe Wohlfahrtstheorie: Utilitarismus nach Jeremy Bentham (1748–
1832)
• Wohlfahrtstheorie im 19. Jahrhundert: Ist Nutzen kardinal? Ist der
Nutzen verschiedener Menschen vergleichbar?
1
• Wohlfahrtstheorie in der ersten Hälfte des 20. Jahrhunderts (nach Abrahm Bergson und Paul Samuelson): Welche Entscheidungen Individuen treffen, offenbart ihre Präferenzen. Gesellschaftliche Wohlfahrt
kann allein durch die Aggregation von individuellen Präferenzordnungen bestimmt werden. Der Nutzen, den verschiedene Individuen von
einem Zustand haben, ist nicht vergleichbar.
• Sozialwahltheorie: Begründet durch Kenneth Arrow (*1921), der den
nach ihm benannten Unmöglichkeitssatz im Rahmen seiner Dissertation (Arrow, 1950, 1951) bewies.
2
Arrows Unmöglichkeitssatz
2.1
Heuristische Darstellung
Eine soziale Wohlfahrtsfunktion (SWF) bewertet Zustände der Welt nach
ihrem Nutzen bzw. nach den Präferenzen der Individuen.
Arrows Idee: Betrachte verschiedene normative Anforderungen an eine
ordinale SWF: eine SWF, die Präferenzen von Individuen so ordnet, dass eine
soziale Präferenzordnung entsteht. Ergebnis: Unter milden Anforderungen ist
eine Aggregation unmöglich.
Arrows Anforderungen an eine Wohfahrtsfunktion:
• (P) Pareto Prinzip: Wenn jedes Individuum Option A lieber als Option
B mag, dann ist A besser als B (nach Vilfredo Pareto).
• (U) Unabhängigkeit irrelevanter Alternativen: Ob A sozial besser ist
als B, soll nur von der individuellen Bewertung von A und B, und von
nichts anderem abhängen.
• (UB) Unbeschränkter Definitionsbereich: Jegliche individuelle Präferenzen müssen zulässig sein.
• (CR) Das Ergebnis der Bewertung durch die SWF muss „rational“ sein:
alle Optionen müssen vergleichbar sein und in eine Reihenfolge gebracht werden können.
• (D) Keine Diktatur: Die soziale Präferenzordnung darf nicht nur von
den Präferenzen eines einzigen Individuums abhängen.
Arrows Unmöglichkeitssatz: Es gibt keine ordinale SWF, die (P),
(U), (UB), (CR) und (D) erfüllt.
2
2.2
Interpretation
„Der einzige universal anwendbare Mechanismus, individuelle Präferenzen
über Zustände zu einer gesamtgesellschaftlichen Präferenz zu aggregieren,
ist, ein Individuum zum Diktator zu machen.“ (Hausman and McPherson,
2006, S. 220)
Was wird aggregiert und wozu? Welche Art von Aggregationsmechanismus angemessen scheint, hängt vom Input und vom Zweck der Aggregation ab!
Bewertung
Entscheidung
Präferenzen
präferenzbasierte
präferenzbegründete
Bewertung (1.)
Entscheidung (2.)
Urteile
urteilsbasierte
urteilsbegründete
Bewertung (3.)
Entscheidung (4.)
(Hausman and McPherson, 2006, Kap. 12)
1. Z. B.: Präferenzutilitarismus der Volkswirtschaftslehre
2. Unfaire Entscheidungsmethode
3. Unüberzeugende Urteilsfindung
4. Z. B.: Demokratische Entscheidungsfindung
Umgang mit der Unmöglichkeit
• Die Unmöglichkeit zeigt überhaupt erst auf, welche Möglichkeiten von
Präferenzaggregation denkbar sind. Ohne Unmöglichkeitsresultat gibt
es keinen Maßstab dafür, wie erfolgreich ein Aggregationsverfahren sein
kann. Daher: Zweck der Sozialwahltheorie ist es, die Möglichkeiten von
Aggregationen und ihre nötige Informationsgrundlage besser zu verstehen (Sen, 1999, Nobel Lecture).
• top-down und bottom-up Begründungen für die Wahl von Axiomen.
• Unterschiedliche Wege, die Unmöglichkeit zu umgehen, werden unterschiedlich überzeugend sein für präferenzbasierte Bewertung (Anwendung: Wohlfahrtsmessung) und urteilsbasierte Entscheidungsfindung
(Anwendung: Wahlverfahren).
3
2.3
Formalisierung
Definition 2.1 (Präferenzordnung). Sei X eine Menge von gesellschaftlichen Allokationen und die Präferenzrelation R ⊆ X × X eine Menge von
geordneten Paaren von gesellschaftlichen Allokationen aus X.
Wir schreiben für (x1 , x2 ) ∈ R auch x1 %R x2 und x2 -R x1 . Weiterhin
schreiben wir x1 ∼R x2 , falls (x1 , x2 ), (x2 , x1 ) ∈ R, sowie x1 R x2 und
x2 ≺R x1 , falls x1 %R x2 , aber nicht x1 %R x2 .
%R heißt eine rationale Präferenzrelation oder Präferenzordnung auf X,
falls gilt:
1. %R ist vollständig, d. h., für alle x1 , x2 ∈ X ist x1 %R x2 oder x2 %R x1 .
2. %R ist transitiv, d. h., für alle x1 , x2 , x3 ∈ X folgt aus x1 %R x2 und
x2 %R x3 , dass x2 %R x3 .
Definition 2.2 (Soziale Wohlfahrtsfunktion). Sei X eine Menge von gesellschaftlichen Allokationen, R die Menge aller Präferenzordnungen auf X und
{1, . . . , n} eine Menge von Individuen.
• Eine Bergson-Samuelson-Wohlfahrtsfunktion ist eine Abbildung
W : RN → R, W : (u1 (x), ..., un (x)) 7→ W (u1 (x), . . . , un (x)).
• Beispiel (Soziale Wohlfahrtsfunktion
des klassischen Utilitarismus):
Pn
W (u1 (x), . . . , un (x)) = i=1 ui (x)
• Eine Arrow-Wohlfahrtsfunktion ist eine Abbildung
W : Rn → R, (%1 , . . . %N ) 7→%W .
• Eine soziale Wohlfahrtsfunktion heißt kardinal, wenn ihr Ergebnis von
den Werten der Nutzenfunktionen abhängt, sonst heißt sie ordinal. Eine
Arrow-Wohlfahrtsfunktion ist immer ordinal.
• Im Folgenden meinen wir mit einer sozialen Wohlfahrtsfunktion immer
eine Arrow-Wohlfahrtsfunktion.
Definition 2.3 (Eigenschaften einer sozialen Wohlfahrtsfunktion). Die soziale Wohlfahrtsfunktion W
• ist unabhängig von irrelevanten Alternativen (U), falls für alle x1 , x2 ∈
X und
(%1 , . . . %n ), (%01 , . . . %0n ) ∈ Rn
mit
x1 i x2 ⇔ x1 0i x2 , x1 ∼i x2 ⇔ x1 ∼0i x2 ∀i ∈ {1, . . . n}
gilt, dass
(x1 , x2 ) ∈ W (%1 , . . . %n ) ⇔ (x1 , x2 ) ∈ W (%01 , . . . %0n ),
4
d. h. die Bewertung von zwei gesellschaftlichen Allokationen durch W
hängt nur von der Bewertung dieser Allokationen durch die Individuen
ab.
• erfüllt das schwache Pareto-Prinzip (P), falls x1 i x2 für alle i ∈
{1, . . . , N } auch x1 W x2 impliziert. Das bedeutet: W bewertet x1
strikt besser als x2 , falls dies jedes Individuum tut.
• ist eine Diktatur (D), falls ein Individuum i ∈ {1, . . . n} existiert, sodass für alle x1 , x2 ∈ X mit x1 i x2 gilt: x1 W x2 , d. h., es gibt ein
Individuum, sodass, wenn es eine gesellschaftliche Allokation gegenüber einer anderen präferiert, dies auch die soziale Wohlfahrtsfunktion
tut.
Bemerkung 2.4. Das starke Pareto-Prinzip besagt, dass x1 W x2 für x1 , x2 ∈
X, falls für mindestens ein Individuum i x1 i x2 und für kein Individuum
j x2 j x1 . Das bedeutet: W bewertet x1 strikt besser als x2 , falls dies
mindestens ein Individuum tut und alle anderen x1 mindestens genau so gut
finden wie x2 .
Theorem 2.5 (Arrows Unmöglichkeitssatz (Arrow, 1950)). Sei X = {x1 , . . . xm }
eine Menge von m ≥ 3 gesellschaftlichen Allokationen, R die Menge aller
Präferenzordnungen auf X und {1, . . . , n} eine Menge von Individuen. Jede
soziale Wohlfahrtsfunktion W : Rn → R, (%1 , . . . %N ) 7→%W , die unabhängig von irrelevanten Alternativen ist und das schwache Pareto-Prinzip
erfüllt, ist eine Diktatur.
Beweisidee. Der Satz wird dadurch gezeigt, dass jede zulässige soziale Wohlfahrtsfunktion als Diktatur identifiziert wird. Wir betrachten ein spezifisches Präferenzprofil, das ein Analogon zur Präferenzstruktur im CondorcetParadoxon (siehe oben) darstellt. Der Beweis erfolgt in vier Schritten: Zuerst
wird dieses Präferenzprofil eingeführt und darauf das Ergebnis der Wohlfahrtsfunktion bestimmt. Zweitens wird gezeigt, dass es ein Individuum gibt,
dessen Präferenzen dann auf diesem Profil die Wohlfahrtsfunktion bestimmen (lokaler Diktator ). Durch ein induktives Argument, die schrittweise
Überführung jeglicher Präferenzen in das spezifische Condorcet-Präferenzprofil,
können wir drittens zeigen, dass der lokale Diktator auch ein globaler Diktator ist. Dafür muss viertens gezeigt werden, dass der lokale Diktator auch
noch für um ein Element veränderte Präferenzen das Gesamtergebnis bestimmt.
Beweis (Geanakoplos, 2005). Sei W eine soziale Wohlfahrtsfunktion, die (U)
und (P) erfüllt. Wir zeigen im Folgenden, dass sie eine Diktatur sein muss.
Schritt 1: Für jedes j ∈ {1, . . . m} nennen wir die Präferenzordnung
C
%j ∈ R mit
C
C
C
C
xj C
j · · · j xm j x1 j · · · j xj−1
5
eine Condorcet-Präferenzordnung.
Falls es ein j ∈ {1, . . . m} gibt, sodass %i =%C
j für alle i ∈ {1, . . . , N }, so
C
muss nach (P) %W =%j sein.
Es gibt damit also n-Tupel von Condorcet-Präferenzordnungen der In0
0
dividuen, für die %W =%C
1 . Sei unter diesen n-Tupeln (%1 , . . . , %n ) eines,
C
das die Anzahl der Individuen mit Präferenzordnung %1 minimiert (Minimalitätsanforderung, benötigen wir weiter unten wieder). Es muss ein Individuum i∗ geben, sodass %0i∗ =%C
1 . Ansonsten erhalten wir einen Widerspruch
zu (P), weil jedes Individuum xm gegenüber x1 präferiert, die soziale Wohlfahrtsfunktion aber nicht.
Schritt 2: Wir definieren nun
W (%i∗ ) := W (%01 , . . . , %0i∗ −1 , %i∗ , %0i∗ +1 , . . . , %0n )
und zeigen, dass i∗ ein lokaler Diktator für (%01 , . . . , %0n ) ist. Das bedeutet:
Falls für zwei gesellschaftliche Allokationen xj , xk xj i∗ xk ist, dann gilt
auch xj W (%i∗ ) xk . Wenn also alle anderen Individuen bei ihren Präferenzordnungen bleiben und i∗ xj strikt gegenüber xk präferiert, so übernimmt
dies auch die Präferenzordnung, auf welche die soziale Wohlfahrtsfunktion
abbildet.
−C
x1
· · · −C
Sei nun %i∗ =%−C
1
1 , wobei dies für das Präferenzprofil xm 1
stehe. Um die lokale-Diktator-Eigenschaft zu zeigen, reicht es nach (U), dass
−C
gilt. Denn: Dies ist eine Präferenzordnung mit der man für
W (%−C
1 ) =%1
je zwei gesellschaftliche Allokationen genau die gegenteilige Bewertung zu
∗
%C
1 erhält, und mit (U) kann i für jedes Paar unabhängig bestimmen, wie
die soziale Wohlfahrtsfunktion darüber entscheidet.
Seien xj , xj+1 ∈ X. Da nach (U)
x1 W (%C
j+1 )
. . . W (%C
j+1 )
xj
und
xj+1 W (%C
j+1 )
. . . W (%C
j+1 )
xm
und die Änderung der Präferenzordnung von i∗ nach obiger Minimalitätsanforderung der Auswahl der Profile etwas ändern muss, ist xj+1 %W (%C ) xj .
j+1
%−C
und %C
j+1 bewerten beide xj+1 höher als xj und xm höher als x1 .
1
Folglich gilt, da xj+1 %W (%C ) xj , xj+1 %W (%−C ) xj . Da dies für beliebiges
j+1
1
j gilt, erhalten wir
xm %W (%−C ) · · · %W (%−C ) x1 .
1
1
Wäre xj+1 ∼W (%C ) xj , so folgt aus der Transitivität und |X| ≥ 3 x1 W (%C )
j+1
j+1
xm . Dies widerspricht aber xm %W (%−C ) x1 . Damit ist i∗ ist ein lokaler Dik1
tator für (%01 , . . . , %0n ).
6
Schritt 3: Wir zeigen nun Folgendes: Angenommen, i∗ ist lokaler Diktator
für (%1 , . . . , %n ), wobei es für jede der Präferenzordnungen %i maximal ein
Paar von gesellschaftlichen Allokationen x1 , x2 ∈ X gibt, sodass x1 ∼ x2 .
Sei %k00 eine Präferenzordnung und seien xh , xj ∈ X, sodass %k und %k00
für alle Paare von gesellschaftlichen Allokationen, die nicht (xh , xj ) sind,
übereinstimmen, und für dieses Paar sich nur dann unterscheiden dürfen,
wenn xh ∼k xj oder xh ∼k00 xj . Dann ist i∗ auch lokaler Diktator für
(%1 , . . . , %k−1 , %k00 , %k+1 , . . . , %n ).
Das hieße, dass i∗ für jedes n-Tupel von Präferenzordnungen ein lokaler Diktator ist, denn wir erhalten jedes beliebige n-Tupel aus (%01 , . . . , %0n ), indem
wir nacheinander jede der Präferenzordnungen verändern und diese Veränderungen mit Hilfe von Änderungen von strikten Präferenzen auf Indifferenz
und dann ggf. weiter auf strikte Präferenz in die Gegenrichtung durchführen.
Damit wäre W eine Diktatur.
Schritt 4: O. b. d. A. nehmen wir an, dass i∗ xh gegenüber xj präferiert.
Da sich %k und %k00 höchstens für (xh , xj ) unterscheiden, können sich nach
(U) W (%1 , . . . , %n ) und W (%1 , . . . , %k−1 , %k00 , %k+1 , . . . , %n ) auch höchstens für dieses Paar unterscheiden. Gilt xh i∗ xl i∗ xj für irgendein
xl ∈ X, so gilt dies, da i∗ lokaler Diktator ist, auch für W (%1 , . . . , %n ).
Nach (U) muss dies dann auch für W (%1 , . . . , %k−1 , %k00 , %k+1 , . . . , %n ) gelten. Wegen Transitivität kann i∗ also auch erzwingen, dass die soziale Wohlfahrtsfunktion für
(%1 , . . . , %k−1 , %k00 , %k+1 , . . . , %n )
xh gegenüber xj präferiert, und die Aussage ist damit bewiesen.
3
3.1
Weitere Resultate der Sozialwahltheorie
Eingipflige Präferenzen
(Mas-Colell et al., 1995, Kap.21)
3.2
Gibbard-Satterthwaite-Theorem
(Svensson, 1999)
3.3
Das Paradoxon des Pareto-Liberalen
(Sen, 1970a,b)
3.4
Arrows Originalbeweis
(Mas-Colell et al., 1995, Kap. 21)
7
4
Sozialwahltheorie und Wahlverfahren
4.1
Einige Wahlverfahren
Wahlverfahren, die eine vollständige Ordnung angeben:
• Borda-Wahl (verletzt (U))
• Rangfolgewahl, engl. „Instant Runoff Voting“ (verletzt (U))
Wahlverfahren, mit denen lediglich ein einzelner Sieger bestimmt wird:
• Mehrheitswahl
• Mehrheitswahl mit instant runoff zwischen den ersten beiden
• Condorcet-Sieger (gibt es nicht immer)
• Wahl durch Zustimmung, engl. „Approval Voting“ (nur bestimmte Präferenzordnungen erlaubt)
4.2
Schulze-Methode
• Entwickelt von Markus Schulze im Jahre 1997 (Schulze, 2003, das war
die erste Publikation).
• Es wird ein einzelner Sieger bestimmt.
• Idee: Bestimme paarweise den stärksten Weg im gerichteten Graphen
paarweiser Präferenzen.
• Die Schulze-Methode verletzt (U).
• x1 wird gegenüber x2 präferiert, wenn der stärkste Weg von x1 nach
x2 stärker ist als der von x2 nach x1 , diese Relation ist transitiv.
• Die Schulze-Methode wird derzeit nicht in öffentlichen Wahlen angewandt, jedoch in zahlreichen Organisationen (Wikimedia, Piratenparteien unterschiedlicher Länder, FSFE, Debian, KDE, . . . ).
8
5
Sozialwahltheorie und Wohlfahrtsmessung
Was ist soziale Wohlfahrt? Die nachfolgende Aufstellung folgt (Fleurbaey, 2009).
Sozialphilosophische Position
Wohlfahrtskonzept
Hedonistischer Welfarismus:
Alle negativen und positiven Affekte
(„Glücksgefühle“) der Bevölkerung
Die Lebenszufriedenheit der Bevölkerung (die im Leben erreichten „Erfolge“)
Die „Verwirklichungschancen“: Die
Menge aller Möglichkeiten, die ein
Individuum hat, Tätigkeiten auszuüben oder Umstände zu verändern,
und die Zustände in seinem Umfeld.
(„Capability Approach“ nach Amartya
Sen)
Die zur Verfügung stehenden Ressourcen (ein „buchhalterisch korrigiertes
BIP“, z. B. John Rawls)
„Kognitiver“ Welfarismus:
Liberalismus – Fähigkeitsansatz:
Liberalismus – Ressourcismus:
Diese Ansätze umgehen die Arrowsche Unmöglichkeit dadurch, dass sie
entweder die Ordinalität verletzen und eine kardinale Wohlfahrtsfunktion
annehmen (Welfarismus, Liberalismus) oder die Unabhängigkeit irrelevanter
Alternativen verletzen (Liberalismus).
Ein kleines konzeptuelles Modell menschlicher Wohlfahrt
Ausblick
Literatur
Arrow, K. J. (1950). A difficulty in the concept of social welfare. Journal of
Political Economy 58, 328–346.
Arrow, K. J. (1951). Social choice and individual values. New York: Wiley.
Fleurbaey, M. (2009). Beyond GDP: The quest for a measure of social welfare. Journal of Economic Literature 47(4), 1029–1075.
Geanakoplos, J. (2005). Three brief proofs of arrow’s impossibility theorem.
Economic Theory 26(1), 211–215.
9
Hausman, D. M. and M. S. McPherson (2006). Economic Analysis, Moral
Philosophy and Public Policy (2nd ed.). Cambridge: Cambridge University
Press.
Mas-Colell, A., M. D. Whinston, and J. R. Green (1995). Microeconomic
Theory. New York: Oxford University Press.
Schulze, M. (2003). A new monotonic and clone-independent single-winner
election method. Voting Matters (17), 9–19.
Sen, A. (1970a). Collective Choice and Social Welfare. Amsterdam: Elsevier.
Sen, A. (1970b). The impossibility of a paretian liberal. The Journal of
Political Economy 78(1), 152–157.
Sen, A. (1999). The possibility of social choice. American Economic Review 89(3), 349–378.
Svensson, L.-G. (1999). The proof of the gibbard-sattherthwaite theorem
revisited. Working Paper No. 1999:1, Department of Economics, Lund
University.
10