ZA-Information 56 Mai 2005

Transcrição

ZA-Information 56 Mai 2005
ZA-Information 56
Mai 2005
Herausgeber:
Zentralarchiv für Empirische Sozialforschung
Universität zu Köln
Direktor: Prof. Dr. Wolfgang Jagodzinski
Geschäftsführer: Dr. h.c. Ekkehard Mochmann
Postanschrift:
Postfach 410 960
50869 Köln
Hausanschrift:
Bachemer Straße 40
50931 Köln
Telefon:
Zentrale 0221 / 4 76 94 - 0
Telefax
- 44
Redaktion
- 50
Redaktion:
Franz Bauske
E-Mail: [email protected]
Internet: http://www.gesis.org/za
ISSN: 0723-5607
© Zentralarchiv
Die ZA-Information erscheint jeweils im Mai und November eines Jahres.
Sie wird kostenlos an Interessenten und Benutzer des Zentralarchivs abgegeben.
Die Zeitschrift ist auch im Internet abrufbar unter:
www.gesis.org/Publikationen/Zeitschriften/ZA_Information
Das Zentralarchiv ist Mitglied der
Gesellschaft Sozialwissenschaftlicher Infrastruktureinrichtungen (GESIS)
Die GESIS ist eine Einrichtung der Leibniz Gemeinschaft
ZA-Information 56
Mai 2005
Inhaltsverzeichnis
Mitteilungen der Redaktion ....................................................................................... 5
Forschungsnotizen
Messen wird immer einfacher!
von Jürgen Rost......................................................................................................... 6
Warum auch Mehrfachindikatoren manchmal nicht helfen:
Überlegungen zu einem multiplen Indikatorenmodell für interpersonales
Vertrauen im Anschluss an die Anmerkungen von Jürgen Rost
von Wolfgang Jagodzinski und Kazufumi Manabe ................................................. 8
Determinanten und Konsequenzen von Nonresponse in egozentrierten Netzwerkstudien
von Volker Stocké.................................................................................................... 18
Persönliche Codes bei Längsschnittstudien: Ein Erfahrungsbericht
von Andreas Pöge.................................................................................................... 50
Abbrüche bei Online-Befragungen: Ergebnisse einer Befragung von Medizinern
von Yasemin El-Menouar und Jörg Blasius .......................................................... 70
MTB: Ein Record-Linkage-Programm für die empirische Sozialforschung
von Rainer Schnell, Tobias Bachteler und Jörg Reiher ....................................... 93
Berichte aus dem Archiv
Berlin-Datenbank von Prof. H. Hurwitz: Präsentation im Dezember in Berlin
von Ekkehard Mochmann..................................................................................... 104
Wie es dazu kam: Meine Sammlung von Primärdaten und Dokumenten
zur Politik in Berlin nach dem zweiten Weltkrieg
von Harold Hurwitz............................................................................................... 105
The Mannheim Eurobarometer Trend File 1970 - 2002
Aktualisierung und Erweiterung der ZA-Studien-Nr. 3521
von Meinhard Moschner....................................................................................... 127
Consolidation of Democracy in Central and Eastern Europe 1990 - 2001:
Cumulation of PCP Wave I and Wave II
by Brigitte Hausstein............................................................................................. 129
Mai 2005
ZA-Information 56
Lebenssituation, Sicherheit und Gesundheit von Frauen in Deutschland:
Eine Kurzbeschreibung der Studie
von Monika Schröttle ............................................................................................ 131
Japan zu Gast im Zentralarchiv
von Wolfgang Jagodzinski .................................................................................... 138
Structural Equation (SEM) and Mixture Modelling (MM):
35th Spring Seminar at the Zentralarchiv 6-24 March, 2006.................................. 140
Forschungsmethoden, Datenbankmanagement und Statistik in der Historischen
Sozialforschung: Basis und Aufbaumodelle des ZHSF-Methodenseminars ......... 142
Erweiterungen im Datenangebot des Zentralarchivs ............................................. 144
Berichte aus anderen Instituten
Die Nutzung der ALLBUS-Daten in Publikationen der Jahre 1980 - 2004 ........... 162
Die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder
von Sylvia Zühlke, Markus Zwick, Sebastian Scharnhorst und
Thomas Wende ...................................................................................................... 168
Ankündigungen und Mitteilungen
European Mothers in Science – EMIS
by Ingvill C. Mochmann ....................................................................................... 183
Internationales Forschungsprojekt über die Diskriminierung und Chancengleichheit
von Kriegskindern
von Stein Ugelvik Larsen und Ingvill C. Mochmann .......................................... 186
Buchhinweise
Baur, Nina; Fromm, Sabine (Hrsg.):
Datenanalyse mit SPSS für Fortgeschrittene: Ein Arbeitsbuch ............................. 188
Stascheit, Ulrich; Winkler, Ute:
Leitfaden für Arbeitslose: Der Rechtsratgeber zum SGB III ................................. 190
ADM Arbeitskreis Deutscher Markt- und Sozialforschungsinstitute e.V. (Hrsg.):
Nonresponse und Stichprobenqualität:
Ausschöpfung in Umfragen der Markt- und Sozialforschung .............................. 192
Bei Beiträgen, die nicht von Mitarbeitern des Zentralarchivs verfasst wurden, ist die Anschrift der Autoren beim
jeweiligen Artikel angegeben. Die Inhalte der Beiträge entsprechen der Meinung der Autoren und geben nicht
unbedingt die Ansicht der Redaktion wieder.
Alle inhaltlichen Beiträge sind Gegenstand einer Beurteilung durch externe Gutachter.
ZA-Information 56
5
Mitteilungen der Redaktion
International vergleichende Forschung wird durch eine Reihe von Datensätzen aus
dem Zentralarchiv unterstützt, so z.B. ISSP oder EVS. Meinhard Moschner weist
auf einen solchen, jetzt erweiterten, Datensatz, den Eurobarometer-Trendfile, hin.
Das schwierige Tagesgeschäft international harmonisierter Umfragen liegt darin,
alle Teilnehmerländer für eine Fragenbatterie zu einer Einstellungsdimension zu
gewinnen. In diesem Verhandlungsprozess reduziert sich der gemeinsame Nenner
manchmal auf ein einzelnes Item. Wolfgang Jagodzinski und Kazufumi Manabe
hatten in der letzten Ausgabe ein solches Item in zwei Studien verglichen. Jürgen
Rost nimmt das zum Anlass daran zu erinnern, dass doch wenigstens zwei Indikatoren vonnöten wären. Wir drucken auch die Antwort der beiden Autoren dazu ab.
Die besondere Situation Berlins in der Nachkriegszeit war das Forschungsfeld von
Harold Hurwitz. Er hat die politischen Geschehnisse forschend begleitet und dabei
nicht vergessen, eine umfangreiche Sammlung von Daten und Fakten anzulegen. In
einem persönlichen Bericht beschreibt er, wie sein Weg als Forscher und Politikberater in Berlin verlaufen ist und wie es zu dieser Datensammlung gekommen ist, die
jetzt auch im Zentralarchiv zur Verfügung steht.
Aus welchen Gründen brechen Befragte bei Online-Befragungen ab? Yasemin
El-Menouar und Jörg Blasius überprüfen, ob der Grund bei fragebogenspezifischen
oder bei personenspezifischen Faktoren liegt, wenn Befragte im Verlauf einer Befragung aussteigen.
Zwei Datensätze zu integrieren ist einfach, wenn es einen eindeutigen Link gibt,
z.B. in Form von Befragtennummern. Schwierig wird es, wenn es keine eindeutige
Verbindung gibt, man z.B. Daten aus externen Unterlagen zu einer befragten Person
hinzuspielen möchte. Rainer Schnell, Tobias Bachteler und Jörg Reiher haben ein
Programm entwickelt, das das Zusammenfügen solcher Dateien wesentlich erleichtert. Einen Einblick in die Praxis der Datenverknüpfung gibt auch Andreas Pöge. Er
schildert die Problematik bei der Zuordnung mehrerer Erhebungswellen, wenn der
Datenschutz es erforderlich macht, dass mit persönlichen Codes gearbeitet werden
muss. Die Fehleranfälligkeit des Verfahrens hat zu starken Verzerrungen geführt.
Nachfolgeuntersuchungen sind auch das Thema von Volker Stocké. Er versucht bei
egozentrierten Netzwerken die Alteri zu befragen und stellt dabei fest, dass die Ausfallwahrscheinlichkeit mit Merkmalen der Ego wie auch der Alteri verbunden ist.
Franz Bauske
6
ZA-Information 56
Messen wird immer einfacher!
von Jürgen Rost 1
Vorbei die Zeiten der großen alten Männer der sozialwissenschaftlichen Messtheorie. Vorbei Paul Lazarsfeld, der uns lehrte, latente Strukturen, latente Profile
und latente Klassen anhand von manifesten Indikatoren zu erfassen. Vorbei Luis
Guttman, der uns lehrte, dass manifeste Indikatoren ein Kontinuum aufspannen, in
das Personen eingeordnet werden können. Vorbei R. Likert, der uns die Korrespondenz von Ratingskala und Einstellungsdimension als Kriterium für Messung
bescherte. Vorbei L. Thurstone, der uns lehrte, dass Antworttendenzen nicht immer
monoton mit der latenten Variable zusammenhängen müssen. Vorbei H. Gulliksen,
der uns zeigte, dass eine beobachtete Variable immer eine Summe von zwei Variablen
darstellt. Vorbei Georg Rasch, der uns lehrte, dass auch Personenmesswerte unabhängig vom Messinstrument sein müssen. Die Reihe ließe sich beliebig fortsetzen.
Die sozialwissenschaftliche Messtheorie ist eine Profession. Wer wollte das bestreiten?
Wenn man die professionelle Umfrageforschung anschaut, so bekommt man das
Gefühl, dass der Korrelationskoeffizient die einzige Messtheorie ist, die sie kennt.
Oh ja, der Korrelationskoeffizient ist eine Messtheorie und stammt sogar auch von
großen alten Männern. Karl Pearson gab ihm seinen Namen und Charles Spearman
lehrte uns vor nunmehr 101 Jahren, wie man mit Hilfe des Messfehlers aus einer
Korrelation von 0,3 eine von 0,99 macht.
Also woher die Aufregung über den vermeintlichen Ausverkauf der Professionalität
sozialwissenschaftlicher Messung? Was haben all die genannten Messtheorien gemeinsam? Dass sie in der Praxis der Umfrageforschung zu umständlich anzuwenden
sind? Oder dass sie zu alt sind? Oder dass sie in den einschlägigen Studiengängen
nicht mehr gelehrt werden? Oder dass sie der Rezipient von Umfrageergebnissen
nicht versteht? Nein, weit gefehlt. Sie haben nur eines gemeinsam. Im Unterschied
zu naturwissenschaftlichen Messungen, bei denen der auf einem Messinstrument abgelesene Wert selbst der Messwert ist, gibt es in den Sozialwissenschaften die prinzipielle Trennung von gemessener Variable und beobachtbaren Indikatoren. Menschen
1 Dr. Jürgen Rost ist Professor am IPN - Leibniz-Institut für die Pädagogik der Naturwissen-
schaften an der Universität Kiel Olshausenstraße 62, 24098 Kiel, [email protected]
ZA-Information 56
7
produzieren zwar einen Messwert, wenn man sie nach ihrer Schuhgröße oder ihrem
Alter fragt, aber nur deshalb weil sie den Messwert kennen. Wenn man sie fragt, ob
sie zufrieden sind oder ob ihnen die Familie wichtig ist, erhält man keinen Messwert, sondern einen Indikator. Wie man von Indikatoren zu Messwerten kommt, ja
genau das ist der Gegenstand von Messtheorien.
Meines Erachtens haben alle sozialwissenschaftlichen Messtheorien gemeinsam,
dass man mindestens zwei Indikatoren braucht, um eine Variable zu messen. Zwei
ist die absolute Untergrenze der Itemanzahl eines Tests, nicht Eins. Umso erstaunter
war ich, als ich gleich in beiden GESIS-Zeitschriften, der ZA-Information und den
ZUMA-Nachrichten, ein Loblied der Single Item Messung fand (Jagodzinski und
Manabe, ZA-Information 55, S. 85-98 und Rammsted, Koch, Borg und Reitz,
ZUMA-Nachrichten 55, S. 5-28). Beide Beiträge sind von sachkundiger Hand geschrieben. Daher möchte ich mich auch nicht mit kleinkarierten methodischen Kriteleien aufhalten, sondern die Frage stellen, um die es mir wirklich geht. Sollten wir
nicht das höchstmögliche Niveau an methodischer Expertise zeigen, wenn es um die
Messung sozialwissenschaftlicher Variablen geht, seien sie soziologischer, psychologischer oder pädagogischer Provenienz? Sollten wir diese Expertise nicht gerade
bei routinemäßigen Unternehmungen wie dem ALLBUS zeigen, auch wenn dort der
Praxisdruck (sprich: Geld, Zeit, Verständlichkeit etc.) am größten ist?
Wir sollten uns nicht davon leiten lassen, wo die gerade noch tolerierbare unterste
Grenze an psychometrischer Expertise liegt (die bei mir, pardon, immer noch bei
zwei Items und nicht bei einem Item liegt), sondern wo das höchste, noch durchsetzbare Niveau wissenschaftlicher Professionalität liegt. Im deutschen PISAKonsortium haben wir uns dieser vom internationalen PISA-Konsortium vertretenen Philosophie angeschlossen, um mit den neuesten und besten Methoden das
Kompetenzniveau in einer Testsituation zu messen, in der jeder Schüler und jede
Schülerin nur einen Bruchteil der gesamten Itemmenge bearbeitet hat. Wir sind sehr
zufrieden mit diesem Weg, denn Fragen danach, wie unser kompliziertes methodisches Vorgehen aussieht, sind einfacher zu beantworten als die Frage, wo wir den
Glauben hernehmen, überhaupt etwas gemessen zu haben.
8
ZA-Information 56
Warum auch Mehrfachindikatoren manchmal nicht helfen:
Überlegungen zu einem multiplen Indikatorenmodell für
interpersonales Vertrauen im Anschluss an die
Anmerkung von Jürgen Rost1
von Wolfgang Jagodzinski und Kazufumi Manabe2
Rost wiederholt in seiner Kritik im Grunde das, was wir (Jagodzinski und Manabe
2004) im Schlusswort unseres Aufsatzes sagen. Dort beklagen wir nochmals das
Missverhältnis zwischen der Häufigkeit der Verwendung des Vertrauenskonzepts in
der Literatur und der rudimentär entwickelten Theorie und Messtheorie. Ein Loblied
auf die Verwendung von Einzelindikatoren singen wir ganz gewiss nicht. Im vorletzten Satz heißt es ganz explizit: „A measurement model … cannot be based on a
single item” (Jagodzinski und Manabe 2004: 96). Unsere Botschaft ist vielmehr:
Sowohl die Theorie des interpersonalen Vertrauens als auch die Messtheorie sind
bislang kaum ausgearbeitet. Eigentlich braucht man zur Messung mehrere Indikatoren, aber wenn man schon Einzelindikatoren verwendet, dann ist der neue besser als
der alte.
Wir hatten uns in unserem Beitrag auf Einzelindikatoren konzentriert, weil diese in
international vergleichenden Umfragen nach wie vor eine bedeutsame Rolle spielen.
Als pragmatischen Grund hatten wir angeführt, dass es manchmal schwierig sei, in
einer Mehrthemenbefragung mit einer sehr begrenzten Anzahl von Fragen und einer
großen Zahl von Forschern multiple Indikatoren durchzusetzen. Der Kommentar
von Rost gibt uns jedoch Gelegenheit, anhand einer neueren Studie zum interpersonalen Vertrauen einige Zusatzprobleme bei der Verwendung multipler Indikatoren
anzusprechen. Studien dieser Art sehen sich mit drei zentralen Herausforderungen
konfrontiert: Erstens müssen sie zuverlässige Indikatoren entwickeln. Zweitens
1 Karoline Harzenetter hat uns beim Erstellen der Grafiken und Tabellen geholfen. Steffen Kühnel
und Markus Quandt haben eine frühere Fassung kommentiert und eine Reihe von Anregungen
gegeben. Wir danken ihnen allen für ihre Unterstützung.
2 Prof. Kazufumi Manabe, School of Sociology, Kwansei Gakuin University, 1-1-155 Uegahara,
Nishinomiya, Hyogo 662, Japan, [email protected]
ZA-Information 56
9
müssen diese Indikatoren den Erfordernissen einer äquivalenten Messung in allen
Ländern genügen. Und drittens müssen die Indikatoren tatsächlich das messen, was
sie nach Auffassung ihrer Urheber messen sollen, in unserem Falle also interpersonales Vertrauen.
1
Zuverlässige Messung und Modellanpassung
Saris und Gallhofer (www.europeansocialsurvey.org) demonstrieren in einem
methodisch ausgefeilten MTMM Experiment, dass bei Face-to-Face-Interviews die
folgende 11-Punkte-Skala einer 7-Punkte-Skala überlegen ist:
[Trust] Generally speaking, would you say that most people can be trusted, or that
you can’t be too careful in dealing with people? Please tick the box that is closest to
your opinion, where 0 means you can’t be too careful and 10 means that most people can be trusted.
You can’t be too careful
0
1
2
Most people can be trusted
3
4
5
6
7
8
9
10
Das scheint zunächst dafür zu sprechen, die von uns favorisierte Skala durch eine
11-Punkte-Skala, bei der nur die beiden Pole inhaltlich bestimmt werden (endpointlabels), zu ersetzen. Solche Skalen stellen jedoch vergleichsweise hohe kognitive
Ansprüche an Interviewer und Respondenten. Das ISSP hat sich hauptsächlich aus
der Erwägung heraus, dass in einer Reihe von Mitgliedsländern schriftliche Umfragen3 durchgeführt werden und die kulturelle Vielfalt relativ groß ist, für die Beibehaltung seiner 4-Punkte-Skala ausgesprochen. Da der European Social Survey (ESS)
mit dem einen Problem gar nicht und mit dem anderen in geringerem Maße konfroniert ist, hat man sich dort für die Verwendung der 11-Punkte-Skala entschieden.
Saris und Gallhofer verfeinern aber nicht nur diese Skala, sie machen sich auch die
Forderung zueigen, das Konzept des interpersonalen Vertrauens durch multiple Indikatoren zu erfassen. Sie beziehen daher zwei weitere Indikatoren in die Analyse ein:
[Fair] Do you think that most people would try to take advantage of you if they got
the chance, or would they try to be fair? Please tick one box.
Most people would try to take advantage of me
0
1
2
3
4
5
Most people would try to be fair
6
7
3 Häufig als Drop-Off von allgemeinen Bevölkerungsumfragen.
8
9
10
10
ZA-Information 56
[Help] Would you say that most of the time people try to be helpful or that they are
mostly looking out for themselves? Please tick one box.
People mostly look out for themselves
0
1
2
3
4
People mostly try to be helpful
5
6
7
8
9
10
Alle drei Items sind im ersten Modul des ESS enthalten und können daher als multiple Indikatoren für eine – vorläufig als interpersonales Vertrauen bezeichnete –
gemeinsame latente Variable verwendet werden. Wir wollen nicht nur untersuchen,
wie hoch die drei Indikatoren in jedem Land auf dieser gemeinsamen Variablen laden, sondern zugleich die Korrelation zwischen dem interpersonalen und dem institutionellen Vertrauen in einer konfirmatorischen Faktorenanalyse mit LISREL
schätzen. Zu diesem Zweck wird für alle Länder das in Abbildung 1 dargestellte
Model spezifiziert. Wie man sieht, können wir im ESS auch das institutionelle Vertrauen durch zwei Indikatoren erfassen, da neben dem Vertrauen in verschiedene
Institutionen auch das Vertrauen in Politiker mit einer 11-Punkte-Skala erfragt wurde.
Da diese letztgenannte Variable mit dem Vertrauen in das Parlament relativ hoch
korreliert, scheint die Annahme plausibel, dass beide Variablen zusammen das Vertrauen in die Kerninstitution der repräsentativen Demokratie erfassen. Wenn wir
nachfolgend abkürzend von institutionellem Vertrauen sprechen, so ist immer
dieses spezielle Vertrauen gemeint.
Die in Tabelle 1a) berichteten Modelle für die einzelnen Länder4 haben alle die im
Pfaddiagramm dargestellte Struktur. Sie unterscheiden sich allerdings in den Parameterschätzungen und in der Modellanpassung, wobei Grundlage der Schätzung
jeweils die für das Land berechnete Varianz-Kovarianz-Matrix ist. Zum Zwecke der
Parameteridentifikation haben wir die erste Ladung auf jedem Faktor mit 1 fest vorgegeben. Die geschätzten unstandardisierten Faktorladungen werden in der Anhangstabelle wiedergegeben. In Tabelle 1a) sind die Faktorenladungen und -korrelationen der vollstandardisierten Lösung aufgeführt, da diese im gegenwärtigen
Kontext aussagekräftiger sind. Um die Zuordnung der Koeffizienten in Tabelle 1a)
zu den Beziehungen zwischen den Variablen zu erleichtern, sind in Abbildung 1 die
Schätzwerte aus der ersten Zeile von Tabelle 1a), also die Schätzungen für Belgien,
eingetragen.
4 Im Falle von Deutschland und England sind zusätzlich Modelle für einzelne Landesteile ge-
schätzt worden, weil diese Landesteile in vielen internationalen Untersuchungen als separate
Einheiten behandelt werden. Das Modell für Nordirland hat allerdings wegen seiner kleinen
Fallzahl nur begrenzte Aussagekraft.
ZA-Information 56
Abbildung 1
11
Konfirmatorische Faktorenanalyse von interpersonalem und
institutionellem Vertrauen
Anmerkungen:
Die rechteckigen Kästchen repräsentieren die Indikatoren, die ovalen die beiden Faktoren oder
latenten Variablen. In der Grafik sind die Parameterschätzungen für Polen wiedergegeben (Tabelle
1, erste Zeile).
Confparl:
Vertrauen in das Parlament (11-Punkte-Skala; Indikator)
Confpol:
Vertrauen in Politiker (11-Punkte-Skala; Indikator)
(Zur Bedeutung der übrigen Indikatoren vgl. den Text)
IP-TRUST:
Interpersonales Vertrauen (Faktor)
INST_CON: Institutionelles Vertrauen (Faktor)
Das erste von uns aufgeworfene Problem löst das von Saris und Gallhofer vorgeschlagene Messmodell mit Bravour: Nicht nur für Belgien sondern auch für alle
anderen Länder schätzt LISREL erfreulich hohe Ladungen der Indikatoren auf den
Faktoren. Alle standardisierten Ladungen überschreiten die Schwelle von 0,5, in
den meisten Fällen sogar die von 0,7. Bei den Indikatoren des institutionellen Vertrauens unterschreitet keine einzige Ladung den Wert von 0,7. Es gibt in der nichtexperimentellen international vergleichenden Forschung nur wenig Messmodelle
von dieser Qualität.
12
Tabelle
ZA-Information 56
1a) Konfirmatorische Faktorenanalyse von interpersonalem und
institutionellem Vertrauen.
Standardisierte Ladungen auf den beiden latenten Variablen (LV)
Land
Trust
Belgien
Dänemark
Deutschland
- Ost
- West
Finnland
Griechenland
Irland
Israel
Italien
Luxemburg
Niederlande
Norwegen
Österreich
Polen
Portugal
Schweden
Schweiz
Slowenien
Spanien
Tschechien
Ungarn
UK (England)
0,71
0,77
0,63
0,63
0,63
0,73
0,73
0,69
0,70
0,68
0,71
0,75
0,70
0,72
0,65
0,79
0,72
0,69
0,69
0,79
0,80
0,76
0,71
LV: IP_TRUST
Fair
Help
0,67
0,75
0,69
0,72
0,67
0,71
0,76
0,79
0,80
0,80
0,66
0,75
0,71
0,81
0,69
0,69
0,72
0,70
0,76
0,74
0,78
0,70
0,75
0,59
0,52
0,61
0,62
0,60
0,59
0,68
0,61
0,52
0,64
0,45
0,56
0,46
0,71
0,52
0,56
0,53
0,56
0,63
0,63
0,63
0,70
0,63
LV: INST_CON
Parl
Pol
0,79
0,79
0,79
0,83
0,77
0,82
0,75
0,81
0,74
0,78
0,76
0,75
0,82
0,81
0,74
0,70
0,80
0,73
0,84
0,75
0,83
0,77
0,84
0,87
0,89
0,84
0,82
0,85
0,87
0,88
0,83
0,86
0,81
0,87
0,92
0,81
0,79
0,80
0,86
0,88
0,87
0,76
0,80
0,83
0,82
0,87
r(IP_Trust,
INST_CON)
0,54
0,39
0,45
0,41
0,48
0,55
0,31
0,35
0,27
0,41
0,49
0,54
0,45
0,33
0,40
0,40
0,53
0,48
0,46
0,39
0,47
0,46
0,46
Abkürzungen:
LV:
Latente Variable
IP_Trust:
Interpersonales Vertrauen
INST_CON: Institutionelles Vertrauen (s. Text)
r(IP_Trust, INST_CON): Korrelation zwischen interpersonalem und institutionellem Vertrauen
Was die Korrelation zwischen sozialem und institutionellem Vertrauen anbelangt,
so kommt die Messfehlerkorrektur (correction for attenuation) in vollem Umfang
zum Tragen. Die in der letzten Spalte von Tabelle 1a) wiedergegebenen Korrelationen liegen immer weit über den Werten, die Jagodzinski und Manabe (2004) berechnet haben. Die niedrigste Korrelation schätzen wir mit 0,27 für Israel, die
höchste mit 0,55 für Finnland. Im Durchschnitt erreichen die Korrelationen den beachtlichen Wert von 0,44.
ZA-Information 56
Tabelle
13
1b) Konfirmatorische Faktorenanalyse von interpersonalem und
institutionellem Vertrauen.
Modellanpassung und Gruppenvergleich
Land
Belgien
Dänemark
Deutschland
Ost
West
Finnland
Griechenland
Irland
Israel
Italien
Luxemburg
Niederlande
Norwegen
Österreich
Polen
Portugal
Schweden
Schweiz
Slowenien
Spanien
Tschechien
Ungarn
UK (England)
Global χ2
Df
Nichtrestringiert
χ2
P
19,00
2,62
(36,93)
3,84
37,26
18,86
9,21
7,17
13,03
5,39
5,91
36,67
15,57
16,48
4,40
15,85
24,86
24,10
7,21
12,63
0,66
10,07
17,99
308,78
88
0,001
0,620
0,000
0,430
0,000
0,001
0,056
0,130
0,011
0,250
0,210
0,000
0,004
0,002
0,350
0,003
0,000
0,000
0,120
0,013
0,960
0,039
0,001
Restringiert
χ2
28,41
9,57
0
7,13
39,58
23,87
13,43
9,85
46,06
19,69
15,35
60,41
28,60
39,69
8,91
32,67
28,80
31,43
22,95
14,72
4,66
23,62
20,77
530,16
151
N
1742
1467
2841
1066
1775
1972
2430
1921
2344
1147
1235
2291
2022
2127
1951
1373
1931
1924
1425
1539
1254
1577
2007
Vergleicht man die Korrelationen zwischen den latenten Variablen mit jenen, die
wir im letzten Aufsatz berichtet haben, so registriert man ein deutliches Gefälle.
Dies verdeutlicht Abbildung 2, in der wir die Länder alphabetisch angeordnet haben.
Die drei im Diagramm links von oben nach unten verlaufenden Linien geben die
Korrelationen von Einzelindikatoren wieder: am niedrigsten fallen sie durchweg im
European Values Survey (EVS, gestrichelte dünne Linie) aus. An zweiter Stelle
folgen die Korrelationen im ISSP (durchgezogene Linie), die nur in einem einzigen
Fall über den ESS-Indikatoren liegen (Österreich). Auch wenn man Vertrauen jeweils mit nur einem Indikator misst, schneiden die 11-Punkt-Skalen des ESS (dünne
strichpunktierte Linie) am besten ab. Noch deutlicher wird der Unterschied, wenn
man im multiplen Indikatorenmodell eine Messfehlerkorrektur durchführt (rechte
strichpunktierte fette Linie). Der Abstand zwischen der rechten und den übrigen
Linien ist mit Abstand am größten.
14
ZA-Information 56
Abbildung 2
Korrelationen zwischen interpersonalem und institutionellem
Vertrauen in international vergleichenden Umfragen
AU
CZ
DE-E
DE-W
DN
ES
GB
HU
IR
IT
NIRE
EVS
NL
ISSP
PL
Land
PO
ESS
SL
SV
0.0
ESS_LSRL
.1
.2
.3
.4
.5
.6
Was die Anpassung der überidentifizierten Modelle an die Daten anbelangt, so
hängt viel davon ab, für welches Fitmaß man sich entscheidet. Wählt man den vergleichsweise harten χ2-Test (Tabelle 1b), Spalte 1), so passen die Modelle einiger
Länder zwar sehr gut zu den Daten (neben Polen z.B. auch Dänemark; Ostdeutschland; Tschechische Republik), die von anderen Ländern wie den Niederlanden, der
Schweiz oder Westdeutschland aber nur mäßig.
2
Bedeutungsäquivalenz
Wenn die Indikatoren wirklich die gleiche latente Eigenschaft messen, dann sollten
zumindest die unstandardisierten Ladungen der Indikatoren gleich sein. Diese Restriktion wurde den Modellen in Tabelle 1a) bzw. Tabelle 1b), Spalte 1 nicht auferlegt. Das wird aber in einem Gruppenvergleich möglich, wenn man die unstandardisierte Faktorenladungsmatrix in allen Ländern als invariant fixiert. Dabei müssen
wir uns entscheiden, ob wir in der Bundesrepublik Deutschland ein Modell oder
zwei getrennte Modelle für West- und Ostdeutschland zu Grunde legen. Der mäßige
Fit des Gesamtmodells in Tabelle 1b) spricht für die zweite Alternative.
ZA-Information 56
15
Führt man diese Restriktion ein, so ergeben sich die in der dritten Spalte von Tab. 1b)
berichteten χ2-Werte für die einzelnen Länder. Sie addieren sich zu einem χ2Wert von 530,16. Die Gesamtzahl der Freiheitsgrade beträgt mit den Gleichheitsrestriktionen 151. Diese Information kann man nun verwenden, um die Hypothese der
Bedeutungsgleichheit bzw. gleicher Faktorladungen zu testen. Addiert man die
χ2-Werte in der ersten Spalte auf (unter Ausschluss des Modells für die Bundesrepublik Deutschland), so ergibt sich ein Gesamtwert von 308,78. Dieser Wert entspricht dem globalen χ2 eines Gruppenvergleichs, bei dem die Modelle für die
einzelnen Länder unabhängig voneinander – d.h. ohne Gleichheitsrestriktionen –
geschätzt werden. Die Gesamtzahl der Freiheitsgrade beträgt in diesem Fall 88.
Durch einen Likelihood-Ratio-Test lässt sich nun überprüfen, ob durch Wegfall der
Invarianzrestriktion eine signifikante Verbesserung eintritt. Nach einer bekannten
Faustregel ist das bei mehr als sechs Freiheitsgraden mindestens auf dem 5%Signifikanzniveau der Fall, wenn der χ2-Wert mindestens doppelt so stark sinkt wie
die Zahl der Freiheitsgrade. Die Differenz der beiden globalen χ2-Werte beträgt
221,38 (=530,16 - 308,78), die Differenz der Freiheitsgrade beträgt 63 (=151 - 88).
Der Quotient beider Zahlen liegt bei ungefähr 3,51, mithin weit über zwei. Selbst
wenn man das Signifikanzniveau bei 1% oder noch niedriger ansetzen würde, müssten
wir die Hypothese invarianter Faktorenladungen verwerfen. Die Annahme der
Bedeutungsgleichheit ist also mit den Daten nicht verträglich.
Man muss allerdings hinzufügen, dass in der international vergleichenden Forschung kaum ein Modell dieses harte Kriterium der Bedeutungsgleichheit erfüllt.
Daher geben sich Praktiker meist mit der sehr viel schwächeren Forderung zufrieden, dass die latenten Variablen „ungefähr“ das gleiche messen. Als Nachweis
dienen oft explorative Faktorenanalysen, die ähnlich hohe Ladungen in allen untersuchten Ländern zeigen. Wenn man dieses schwächere Kriterium akzeptiert, dann
schneidet das Messmodell von Saris und Gallhofer im relativen Vergleich sicher
immer noch hervorragend ab.
3
Gültigkeit der Messung
Bleibt zuletzt die Frage, ob die drei Indikatoren, wie wir tentativ angenommen hatten, tatsächlich interpersonales Vertrauen messen. Saris und Gallhofer sprechen
zwar von sozialem Vertrauen, sie messen jedoch interpersonale Beziehungen, nämlich die Wahrnehmung von Eigenschaften generalisierter anderer Personen. Wer der
Kohlbergschen Stadientheorie anhängt, mag argumentieren, dass interpersonales
Vertrauen auf einer früheren Stufe der Entwicklung entsteht als ein Konzept der
Fairness, das im zweiten Item angesprochen wird. Wer andere für fair hält, vertraut
16
ZA-Information 56
ihnen vielleicht auch, doch wer anderen vertraut, muss sie nicht unbedingt auch für
fair halten. Und Hilfsbereitschaft wird zwar mit Vertrauenswürdigkeit korrelieren,
dürfte aber doch eine völlig andere Eigenschaft sein. Über die drei Indikatoren wird
also eher erfasst, ob man seine Mitmenschen positiv oder negativ sieht. Vertrauenswürdigkeit erscheint so nur als eine Komponente eines insgesamt optimistischen
oder pessimistischen Menschenbildes. In der Tat waren die drei Items ursprünglich
Bestandteil eines aus fünf Items bestehenden Index’, den Rosenberg (1956) als
Misanthropieskala eingeführt hat – Misanthropie deshalb, weil hohe Indexwerte
eine negative Wahrnehmung der Mitmenschen indizieren. Diese fünf Items5 sind in
den amerikanischen GSS aufgenommen worden und einige haben von dort aus Eingang in viele nationale und internationale Surveys gefunden. Mit dem breiteren
Konzept der Philanthropie/ Misanthropie wird aber das, was die Items tatsächlich
messen, weit besser benannt als durch den Begriff des sozialen oder interpersonalen
Vertrauens. So kann man argumentieren, dass Saris und Gallhofer vielleicht die
Messung von Misanthropie im Rosenbergschen Sinne verbessert haben, nicht aber
unbedingt die des interpersonalen oder sozialen Vertrauens.
Zwingend ist diese Bewertung allerdings nicht. Um definitiv entscheiden zu können, müsste man klären, ob sich Philanthropie und interpersonales Vertrauen in
ihren Ursachen oder Wirkungen voneinander unterscheiden oder nicht. Bestehen
keine Unterschiede, dann sind die Konzepte gegeneinander austauschbar. Wenn es
– was plausibler erscheint – Differenzen gibt, dann könnte man im Prinzip empirisch klären, ob das Modell von Saris und Gallhofer eher das eine erfasst oder das
andere. Aber wo könnten diese Differenzen liegen? Entscheidet man auf Grund des
Sprachgefühls, so ist Philanthropie eine noch generellere Eigenschaft als interpersonales Vertrauen. Auch in den generalisierteren Formen sind Vertrauen und Misstrauen
immer noch an Verhaltenserwartungen geknüpft. Wer anderen Personen vertraut, der
erwartet, dass sich diese vereinbarungs- bzw. normgemäß verhalten. Umgekehrt ist
das Misstrauen umso größer, je weniger man an das normgemäße Verhalten der anderen glaubt. Bei der Misanthropie ist dieser Verhaltensbezug weniger stark ausgeprägt. Dementsprechend könnte ein Testfall sein, wie Personen auf Mitmenschen
reagieren, die das in sie gesetzte Vertrauen wiederholt enttäuschen. Sind unsere
Überlegungen zutreffend, so sollte das interpersonale Vertrauen davon tangiert
werden, die Philanthropie dagegen nicht. Um dies aber zu überprüfen, ist eine weitere empirische Untersuchung erforderlich. Und so führt uns die Verwendung der
multiplen Indikatoren manchmal nicht zu besseren Antworten, sondern zu neuen
Problemen. Wir entnehmen den Ausführungen von Jürgen Rost, dass vergleichbare
Probleme bei den relevanten Variablen der PISA-Studien offensichtlich schon
5 Sie hatten in der ursprünglichen Fassung jeweils nur zwei Ausprägungen.
ZA-Information 56
17
gelöst worden sind. Wir warten deshalb sehr gespannt auf die Publikation der einschlägigen Methodenstudien.
Literatur:
Jagodzinski, Wolfgang und Kazufumi Manabe, 2004: How to Measure Interpersonal Trust? A Comparison
of two Different Measures. In: ZA-Information 55: S. 85-98.
Rosenberg, Morris, 1956: Misanthropy and Political Ideology. American Sociological Review, 21/1-6:
S. 690-695.
Rost, Jürgen, Messen wird immer einfacher! In diesem Heft, S. 6-7.
Saris, Willem E. und Irmtraud Gallhofer (o. J.): Report on the MTMM Experiments in the Pilot Studies and
Proposals for Round 1 of the ESS (www.europeansocialsurvey.org ESS DOCS - Methodology - Quality
measurement of the questionnaire).
4
Anhang: Die unstandardisierten Faktorladungen
LV: IP_TRUST
Land
Belgien
Dänemark
Deutschland
- Ost
- West
Finnland
Griechenland
Irland
Israel
Italien
Luxemburg
Niederlande
Norwegen
Österreich
Polen
Portugal
Schweden
Schweiz
Slowenien
Spanien
Tschechien
Ungarn
UK (England)
Global
LV: INST_CON
Trust
1,00
1,00
Fair
0,88
0,87
Help
0,81
0,70
Parl
1,00
1,00
Pol
1,11
1,05
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,07
0,97
0,93
1,01
1,04
1,11
1,22
1,04
0,88
0,95
1,10
1,10
0,80
0,92
0,96
1,12
0,93
0,95
0,95
1,02
0,98
0,88
0,85
0,84
0,86
0,81
0,68
0,91
0,68
0,69
0,67
0,95
0,80
0,65
0,72
0,75
0,90
0,79
0,75
0,90
0,84
0,80
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
0,94
0,99
1,04
1,10
0,95
1,02
1,01
1,16
1,18
0,89
0,94
0,97
1,07
1,04
1,19
0,84
1,05
0,93
0,95
0,97
1,03
Anmerkungen:
Zur Schätzung des Models wurden die unstandardisierten Ladungen von Trust auf dem ersten Faktor und von Parl (confidence in Parliament) mit eins fest vorgegeben (kursive Werte in der Tabelle).
Aus insgesamt 15 Varianzen und Kovarianzen pro Land müssen dann drei Faktorenladungen, die
Varianz- Kovarianzmatrix der beiden Faktoren (drei Parameter) und fünf Fehlervarianzen geschätzt
werden. Das Modell für das einzelne Land hat daher 15-11=4 Freiheitsgrade. Für alle Länder zusammen ergeben sich ohne Gleichheitsrestriktionen 22*4=88 Freiheitsgrade. Mit der Invarianzrestriktion gewinnt man zusätzliche 21*3=63 Freiheitsgrade, weil für alle Länder gleiche Faktorenladungen geschätzt werden. Diese Schätzwerte sind in der letzten Zeile (Global) wiedergegeben.
18
ZA-Information 56
Determinanten und Konsequenzen von Nonresponse in
egozentrierten Netzwerkstudien1
von Volker Stocké 2
Zusammenfassung
Ein Hauptziel egozentrierter Netzwerkstudien besteht in der Erfassung der Einbettung von Akteuren in bestimmte Bezugsgruppen und der Analyse der hiervon ausgehenden Einflüsse. Die Realisierung dieses Ziels macht eine möglichst vollständige
Erfassung der für diese Einflüsse bedeutsamen Merkmale der Bezugspersonen
(Alteri) im sozialen Kontext der Zielpersonen (Ego) notwendig. Die Grundlage
hierfür sind entweder die (Proxy-)Angaben von Ego über die Alteri oder die Angaben der Bezugspersonen selbst. Inwieweit die Charakteristiken der Bezugsgruppe
vollständig erfasst werden können, hängt bei der ersten Vorgehensweise von der
Fähigkeit und Bereitschaft der Zielpersonen zur Beantwortung der Proxy-Fragen
ab. Dagegen setzt die Verwendung der von den Bezugspersonen selbstberichteten
Merkmale sowohl die Bereitschaft von Ego zur Herausgabe von Kontaktinformationen wie auch die Befragungsbereitschaft der Alteri voraus. Der vorliegende Beitrag
untersucht mit einer Stichprobe von Grundschuleltern jene Bestimmungsfaktoren,
die sich auf den Erfolg beider Operationalisierungen von Bezugsgruppeneinflüssen
auswirken. Die analysierten Faktoren sind die soziodemografischen Merkmale der
Zielpersonen sowie die der Bezugspersonen, die Stärke der Beziehung zwischen
beiden Personengruppen und Indikatoren für die generelle Antwortbereitschaft.
Nach den Ergebnissen unserer Untersuchung sind weder die Ausfälle der ProxyAngaben von Ego noch die der Selbstberichte der Alteri das Ergebnis eines Zufallsprozesses. Vielmehr variiert die Ausfallwahrscheinlichkeit signifikant nach
1 Ich danke ganz herzlich Hartmut Esser, Stephan Ganter und Angela Jäger sowie den Gutach-
tern dieser Zeitschrift für hilfreiche Kommentare und Anregungen. Christian Hunkler und
Diana Schirowski waren eine große Unterstützung bei der Erstellung des Manuskriptes. Der
Beitrag wurde durch finanzielle Förderung der Deutschen Forschungsgemeinschaft an den Sonderforschungsbereich 504 der Universität Mannheim ermöglicht.
2 Dr. Volker Stocké ist Hochschulassistent am Sonderforschungsbereich 504 „Rationalitätskon-
zepte, Entscheidungsverhalten und ökonomische Modellierung“ der Universität Mannheim,
L13, 15; D-68131 Mannheim. E-Mail: [email protected].
ZA-Information 56
19
Merkmalen von Ego wie auch der der Alteri und unterscheidet sich nach der Beziehungsstärke genauso wie nach der allgemeinen Disposition der Befragten zu Nonresponse. Die Konsequenz ist erstens, dass sich die Größe der für die Analyse von
Bezugsgruppeneffekten effektiv verfügbaren Netzwerke systematisch nach den Charakteristiken der Zielpersonen unterscheidet. Es hat sich zweitens gezeigt, dass die
Zusammensetzung der verfügbaren Netzpersonenstichprobe einer im Vergleich zur
Grundgesamtheit systematischen Selektivität unterliegt.
Abstract
It is the main aim of egocentric network studies to include the embedding of actors
into certain reference groups and to analyse the resulting effects. The realisation of
this aim makes it necessary to cover as completely as possible the characteristics of
the relevant reference persons (alters) within the social context of the target persons (ego), which are important for these influences. The basis for this are either
proxy responses given by ego about the alters’ characteristics or self-reports obtained from the reference persons themselves. To what extent one can measure the
complete reference group’s characteristics depends in the first approach on the
ability and willingness of the ego to answer proxy questions about the alters. In
contrast, the use of the reference persons’ self-reported characteristics require the
ego’s willingness to provide contact information as well as the alters’ willingness to
take part in the interview. The present article examines, by means of a sample of
elementary school parents, the factors which determine the success of both types of
operationalisations of reference group influences. Analysed factors are the egos’
and alters’ socio-demographic characteristics, the strength of the relationship between both groups as well as indicators for the general willingness to answer questions. According to our results, neither the failure to obtain proxy information from
the ego nor the impossibility to acquire self reports of the alters are the result of a
random process. In fact, the dropout probability varies significantly according to
the target and reference persons’ characteristics, and differs according to the
strength of their ties as well as to the respondents’ overall disposition toward nonresponse. The first consequence is that the available size for the analysis of reference group effects of the social networks differs according to the characteristics of
the ego. Secondly, the composition of the available sample of network persons has
been found to be subject to a systematic selectivity in comparison to the population
of alters.
20
1
ZA-Information 56
Einleitung
Bei Verwendung netzwerkanalytischer Untersuchungsdesigns können systematisch
die vom sozialen Kontext der Akteure ausgehenden Bezugsgruppeneinflüsse bei
soziologischen Erklärungen berücksichtigt werden. Entsprechend werden in jüngster Zeit auch zunehmend empirische Studien mit einem entsprechenden Forschungsdesign durchgeführt (vgl. Ganter 2003; Huckfeldt et al. 2004; Lubbers
2003; Schenk 1995; Völker und Flap 2001). Die Merkmale des sozialen Kontextes
der Akteure kann hierbei durch zwei unterschiedliche Vorgehensweisen erfasst
werden. So können erstens für eine Stichprobe von Befragten deren Merkmale, die
zwischen allen diesen Befragten bestehenden Beziehungen und damit das komplette
Netzwerk erfasst werden (van Duijn et al. 2003). Die Erfassung von egozentrierten
Netzwerken ist die zweite und wegen des geringeren Aufwandes verbreitetere Untersuchungsform (Diaz-Bone 1997; van der Poel 1993). Hierbei werden zuerst für
jede Zielperson (Ego) einer Stichprobe die relevanten Bezugspersonen (Alteri) mittels eines Netzwerkgenerators ausgewählt. Im zweiten Schritt werden dann die für
die jeweilige Fragestellung relevanten Merkmale dieser Alteri erfasst. Da bei diesem Untersuchungsdesign die Egonetze als unabhängige Untersuchungseinheiten in
die Analyse einbezogen werden, können egozentrierte Netzwerkstudien mit Zufallsstichproben und im Rahmen normaler Bevölkerungsumfragen durchgeführt werden.
Bei der Operationalisierung von Bezugsgruppeneffekten können im Rahmen egozentrierter Netzwerkstudien zwei unterschiedliche Datenerhebungsmethoden herangezogen werden. So wurde einerseits argumentiert, dass sich die Bezugsgruppe
alleine durch die von Ego bei dieser Gruppe subjektiv wahrgenommenen Merkmale
auf die Einstellung und das Handeln auswirken (Jansen 1999: 79f.). In diesem Fall
müssen diese Wahrnehmungen mithilfe von Proxy-Fragen bei Ego erfasst werden.
Es kann andererseits aber auch angenommen werden, dass Bezugsgruppeneinflüsse
auch durch Fehlwahrnehmungen des sozialen Kontextes vermittelt sind und somit
den tatsächlichen Eigenschaften der Bezugspersonen eine eigenständige Bedeutung
zukommt (Koßmann 1996). Daher und weil andere Fragestellungen, etwa die nach
dem Ausmaß und der Wirkung von Unterstützungsbeziehungen in sozialen Netzwerken, die Kenntnis der „objektiven“ Charakteristiken der Bezugsumwelt voraussetzen, wird in egozentrierten Netzwerkstudien oft auch eine Nachbefragung der
Netzpersonen angestrebt.
Der Erfolg bei der Erfassung von Proxy-Angaben, also von Angaben von Ego über
die Merkmale der Alteri, hängt in kritischer Weise davon ab, dass die Zielpersonen
zur Beantwortung dieser Fragen über ihre Bezugspersonen motiviert und in der Lage
sind. Da es sich bei Proxy-Fragen allerdings um schwierige und teilweise auch
ZA-Information 56
21
heikle Fragen handelt, muss mit einem überdurchschnittlich hohen Ausmaß an
Item-Nonresponse gerechnet werden (für diese Unterscheidung der Ursachen von
Nonresponse vgl. Shoemaker et al. 2002). Die wenigen in der Literatur verfügbaren
Angaben zeigen, dass bis zu 37,0 Prozent der Befragten keine Angaben über ihre
Netzpersonen machen konnten oder wollten (Pappi und Wolf 1984). Dabei ist für
die Aussagekraft der mit Proxy-Daten erzielten Ergebnisse von großer Bedeutung,
ob fehlende Werte zufällig verteilt oder mit bestimmten Merkmalen von Ego korreliert sind. Item-Nonresponse führt in jedem Fall zu einer Reduktion der für die Analyse von Bezugsgruppeneinflüssen verfügbaren Größe der Egonetzwerke. Unterscheidet sich aber das Ausmaß der fehlenden Werte nach soziodemografischen Charakteristiken der Befragten, so muss mit einer nach diesen Merkmalen systematischen Verzerrung der Netzgrößen gerechnet werden. Ob dies der Fall ist und mit
welcher Selektivität hierbei gerechnet werden muss, wurde bisher empirisch nicht
überprüft.
Mit welcher Wahrscheinlichkeit in egozentrierten Netzwerkstudien erfolgreich Nachbefragungen der Bezugspersonen durchgeführt werden können, ergibt sich als Ergebnis eines zweistufigen Prozesses. So müssen in einem ersten Schritt die für eine
Befragung der Alteri notwendigen Kontaktinformationen bei Ego erhoben werden.
Da es sich hierbei um persönliche Daten der Netzpersonen handelt, besteht die
Gefahr, dass Ego solche Angaben als Eingriff in die Privatsphäre der Bezugspersonen ansieht. Aus diesem Grund muss hierbei, wie bei anderen sensiblen Fragen,
mit einem substantiellen Anteil an Antwortverweigerungen gerechnet werden. In
den wenigen deutschen Studien, in denen eine Nachbefragung von Netzpersonen
durchgeführt wurde, konnten für 23,0 bis 54,2 Prozent der anfänglich von den Befragten genannten Alteri keine Kontaktinformationen erfasst werden (Jäger 2004: 57;
Pappi und Wolf 1984). Auch hier besteht die Gefahr, dass sich das Ausmaß der dadurch bewirkten Ausfälle systematisch nach Merkmalen von Ego und denen der
Alteri unterscheidet. Diese Vermutung wurde in der vom Zentrum für Umfragen,
Methoden und Analysen (ZUMA) durchgeführten egozentrierten Netzwerkstudie
für die Bildung, die Wohnortgröße und den Familienstand von Ego bestätigt
(Schenk et al. 1992). Dagegen liegen keine Ergebnisse darüber vor, ob sich die
Neigung der Befragten zur Weitergabe der Kontaktinformation ihrer Netzpersonen
auch nach deren Eigenschaften unterscheidet.
Die Bereitschaft der kontaktierbaren Alteri zur Interviewteilnahme ist die zweite
Vorbedingung für eine erfolgreiche Nachbefragung von Netzpersonen. Da die Interviewer als Grund der Befragung die Nennung der Zielperson durch Ego angeben
können und damit quasi mit einer Empfehlung durch eine persönlich bekannte Person ausgestattet sind, kann von einer überdurchschnittlich hohen Teilnahmebereit-
22
ZA-Information 56
schaft der Alteri ausgegangen werden. Erfahrungen bei Nachbefragungen in anderen egozentrierten Netzwerkstudien haben gezeigt, dass mit einem Anteil zwischen
56,0 und 62,0 Prozent der Netzpersonen mit Kontaktinformationen Interviews realisiert werden konnten (Jäger 2004: 61; Schenk et al. 1992). Trotz der relativ hohen
Ausschöpfungsquoten besteht jedoch auch hier das Risiko, dass sich a) die Teilnahmebereitschaft der Alteri nach Merkmalen von Ego unterscheidet, und dass
b) Netzpersonen mit bestimmten Attributen überproportional aus der Stichprobe
ausscheiden. Darüber, ob und durch welche Charakteristiken vermittelt sich die
mangelnde Teilnahmebereitschaft von Netzpersonen in einer Stichprobenverzerrung
niederschlägt, sind derzeit keine Untersuchungsergebnisse verfügbar.
Wegen des geschilderten zweistufigen Ausfallprozesses muss bei der Nachbefragung von Netzpersonen insgesamt mit einer relativ geringen Ausschöpfung gerechnet werden. So hat sich im Rahmen des am Mannheimer Zentrum für Europäische
Sozialforschung (MZES) durchgeführten Forschungsprojektes „Ethnische Grenzziehung und ethnische Konflikte“ gezeigt, dass nur 25,6 Prozent der im Interview
mit Ego identifizierten Bezugspersonen letztendlich erfolgreich befragt werden
konnten (Jäger 2004). Im „Cross-National Election Study Project“ (CNEP) lag dieser Anteil in Ostdeutschland bei 14,7 und in Westdeutschland sogar nur bei 8,2 Prozent der Ausgangsstichprobe (Schmitt-Beck und Koßmann 1994). Auch hier stellt
sich die Frage nach der insgesamt resultierenden Selektivität der Netzpersonenstichprobe und der damit verbundenen Generalisierbarkeit der mit den Daten gefundenen Untersuchungsergebnisse. Abgesehen von der Studie von Laumann (1969)
sind uns hierzu keine Untersuchungen bekannt.
2
Theoretischer Rahmen
Befragte beantworten Fragen mit „weiß nicht“, wenn diese einen bestimmten
Schwierigkeitsgrad überschreiten und verweigern die Antwort, wenn sie eine Frage
als zu sensibel erachten (Shoemaker et al. 2002). Dabei ist die Schwierigkeit von
Fragen eine Funktion des kognitiven Aufwandes der für ihr Verständnis, den Gedächtnisabruf antwortrelevanter Informationen, die Formulierung einer Antwort und
die Passung dieser Antwort in die Antwortvorgaben notwendig ist (Tourangeau
und Rasinski 1988). Proxy-Fragen sind, im Vergleich zu Fragen über die eigene
Person, überdurchschnittlich schwierig, weil sie auf Merkmale anderer Personen
zielen, die der befragten Person möglicherweise unzureichend oder im Extremfall
nicht bekannt sind. Es kann davon ausgegangen werden, dass die Schwierigkeit von
Proxy-Fragen mit abnehmender „Sichtbarkeit“ der abgefragten Merkmale zunimmt.
Außerdem kann angenommen werden, dass Fragen über Bezugspersonen, zu denen
ZA-Information 56
23
Ego eine weniger starke Beziehungen unterhält, durch einen höheren Schwierigkeitsgrad gekennzeichnet sind: „Weak ties“ sind durch eine geringere Interaktionshäufigkeit und damit durch weniger Gelegenheit zur Informationsaufnahme gekennzeichnet (Marsden 1990). Demnach wäre bei Proxy-Fragen über weniger
„sichtbare“ innere Zustände von Netzpersonen, wie etwa Einstellungen oder Überzeugungen, und bei solchen über Personen, zu denen eine weniger intensive Beziehung besteht, mit mehr „weiß nicht“-Angaben zu rechnen, verglichen mit Fragen
über äußere Charakteristiken und nahe stehende Alteri.
Fragen sind sensibel, wenn deren Beantwortung unabhängig vom Inhalt der Antwort durch eine befragte Person als unangenehm erlebt wird. Proxy-Fragen sind
daher sensibel, weil Angaben über persönliche Merkmale der Bezugspersonen
durch die befragte Person als unerlaubter Eingriff in deren Privatsphäre angesehen
werden können (Schenk et al. 1992). Dabei kann angenommen werden, dass dies
umso stärker der Fall ist, wenn das Merkmal weniger „sichtbar“ ist und die Information somit mehr der Privatsphäre zugehörig angesehen wird. Wegen der hohen
Sensibilisierung der Öffentlichkeit für Belange des Datenschutzes ist die Frage nach
den Kontaktinformationen der Netzperson besonders sensibel. Hinzu kommt, dass
hierbei das erklärte Ziel einer späteren Kontaktierung und Befragung der betreffenden Personen besteht. Demnach muss Ego davon ausgehen, dass die Bezugspersonen mit Sicherheit Kenntnis über die Verletzung ihrer Privatheitsrechte erlangen
werden. Die hiermit verbundene Möglichkeit einer Störung der Beziehung zu den
Bezugspersonen verringert die Bereitschaft einer Herausgabe von Kontaktinformationen. Ein weiteres Argument kann die Annahme von Ego sein, dass eine Interviewteilnahme für bestimmte Alteri eine besondere Belastung darstellen würde, die
es zu vermeiden gilt. Dies ist beispielsweise umso wahrscheinlicher, wenn Ego bei
Alter von einer besonderen Zeitknappheit oder einem mangelnden Interesse am Befragungsthema ausgeht. Dagegen kann argumentiert werden, dass die Bereitschaft
zur Weitergabe von Kontaktinformation mit steigender Beziehungsstärke zunimmt:
Bei nahe stehenden Personen kann Ego eher darauf vertrauen, dass eine Preisgabe
der Kontaktinformationen keine negative Reaktion der Bezugsperson nach sich
zieht (Schenk et al. 1992).
Die Beantwortung schwerer und sensibler Fragen ist eine hohe Belastung von Umfrageteilnehmern und stellt hohe Anforderungen an deren Kooperationsbereitschaft.
Es kann angenommen werden, dass sich diese Kooperationsbereitschaft und die
Wahrscheinlichkeit einer damit verbundenen Einnahme einer kooperativen Befragtenrolle zwischen den Befragten unterscheidet. Demnach wäre zu erwarten, dass
Umfrageteilnehmer in unterschiedlichem und situational invariantem Ausmaß zur
Unterstützung von Umfragen durch möglichst vollständige Antworten motiviert
24
ZA-Information 56
sind (Stocké 2005). Demnach könnte vermutet werden, dass die generelle Neigung
der Befragten zu „weiß nicht“-Angaben und Antwortverweigerungen das Ausmaß
von Nonresponse bei Proxy-Fragen sowie die Verweigerung einer Bereitstellung
von Kontaktinformationen erklärt.
Eine wichtige Determinante für die Bereitschaft zur Teilnahme an Umfragen ist die
Erwartung, dadurch einen positiven Beitrag zur Realisierung wertgeschätzter Ziele
leisten zu können (Esser 1986). Solche Ziele können beispielsweise darin bestehen,
eine Umfrage durch eine anerkannte Sponsorenorganisation zu unterstützen, ein als
legitim angesehenes Umfrageziel zu fördern, oder einfach dem Interviewer gegenüber hilfsbereit zu sein. Ein weiterer Teilnahmegrund ist das Interesse am Befragungsthema und die persönliche Bedeutsamkeit dieses Themas für die befragte Person
(Schnell 1997: 181ff.). Entsprechend hat es sich als für die Befragungsbereitschaft
förderlich herausgestellt, wenn die Befragten einen Bezug zwischen dem Thema
einer Umfrage und ihrer eigenen Lebenssituation wahrnehmen (Loosveldt et al.
1998). Auch die bei einer Interviewteilnahme erwarteten Belastungen sind für die
Teilnahmebereitschaft bedeutsam. So führt etwa die mit einer steigenden Interviewlänge verbundene Zunahme der Zeitkosten zu einer Reduktion der Befragungsbereitschaft (Groves et al. 1999). Die Opportunitätskosten einer Umfrageteilnahme
steigen auch dann an, wenn die einer Person verfügbare Zeit durch zusätzliche
Pflichten, etwa bei Erwerbstätigkeit, eingeschränkt ist.
3
Forschungsstand
3.1
Ausmaß und Determinanten des Nonresponse bei Proxy-Fragen
Über das Ausmaß und insbesondere die Determinanten des Item-Nonresponse bei
Proxy-Fragen ist wenig bekannt. In einer Untersuchung von Laumann (1969) mit
den Daten der „Detroit Area Study“3 wurde eine Zufallsstichprobe der Bewohner
des Ballungsraums von Detroit über verschiedene Merkmale ihrer Freunde befragt.
Diese Merkmale waren das Alter, der Beruf und die Bildung der Alteri sowie deren
Parteipräferenz und welcher ethnischen Gruppe sich die Alteri zugehörig fühlen. Es
hat sich gezeigt, dass bei der Frage über das Alter der Bezugspersonen niemand,
aber bei der über deren gefühlte Zugehörigkeit zu einer ethnischen Gruppe 15,2
Prozent der Hauptbefragten angegeben haben, die Antwort nicht zu wissen. In der
ZUMA-Netzwerkstudie haben sich ebenfalls sehr unterschiedlich hohe Nonresponse-
3 Die Daten dieser Studie sind im Zentralarchiv unter der ZA-Studien-Nr. 0533 archiviert.
ZA-Information 56
25
Raten gezeigt. Hier wurden in einer lokalen Zufallsstichprobe die Bezugspersonen
von Ego mit dem Namensgenerator von Burt (1984) sowie dem von Fischer (1982)
ausgewählt. Bei der Befragung der Zielpersonen über verschiedene Merkmale der
Alteri lag der Anteil der unbeantworteten Fragen zwischen 1,6 Prozent beim Geschlecht der Bezugspersonen und 30,1 Prozent bei deren Parteipräferenz
(Pfenning et al. 1991).
Weitere Ergebnisse liegen aus Studien vor, die untersucht haben, ob die ProxyAngaben von Befragten über die Merkmale nahe stehender Personen als Substitut
für deren Selbstberichte herangezogen werden können. So wurde in einer britischen
Studie eine Haushaltsstichprobe mit zwei durch Partnerschaft oder Verwandtschaft
verbundenen Haushaltsmitgliedern herangezogen. Eine der beiden Personen wurde
über insgesamt 47 Merkmale des jeweils anderen Haushaltsmitgliedes befragt
(Martin und Butcher 1982). Es hat sich herausgestellt, dass bei den Fragen über
den Erwerbsstatus der nahe stehenden Person, über die Art des von ihr für die Fahrt
zur Arbeit verwendeten Verkehrsmittels und die Zufriedenheit mit der gemeinsamen Wohnung keiner der Proxy-Befragten mit „weiß nicht“ geantwortet hat. Das
höchste Ausmaß an Nonresponse wurde bei den Fragen über das Einkommen der
anderen Person (43 Prozent), die Anzahl der von ihm oder ihr in der vergangenen
Woche gearbeiteten Stunden (9 Prozent) und die Zufriedenheit der anderen Person
mit öffentlichen Verkehrsmitteln (8 Prozent) beobachtet. Ähnliche Ergebnisse finden
sich in einer Studie mit Befragten des „British Labor Force Survey“, die über verschiedene Merkmale von Mitgliedern des gleichen Haushaltes befragt wurden
(Dawe und Knight 1997). Auch hier hat sich das Ausmaß des Nonresponse stark
nach dem Inhalt der Fragen unterschieden. So hat bei den Fragen über das Lebensalter, den Familien- und den Erwerbsstatus keine der befragten Personen die Antwort offen gelassen. Als schwieriger oder sensibler haben sich die Proxy-Fragen
über das Alter, mit dem die Ausbildung abgeschlossen wurde (6 Prozent), und vor
allem die über das Einkommen der anderen Person (29 Prozent) erwiesen.
Uns sind keine Studien über die Bestimmungsfaktoren des Item-Nonresponse speziell bei Proxy-Fragen bekannt. Untersucht wurden allerdings die soziodemografischen Korrelate des Nonresponse bei Fragen über Merkmale der befragten Person
selbst. So wurde in einer frühen Studie aus diesem Forschungsbereich festgestellt,
dass Frauen sowie ältere und weniger gebildete Befragte, jeweils verglichen mit der
Komplementärgruppe, mit größerer Wahrscheinlichkeit Fragen unbeantwortet lassen
(Ferber 1966). Diese Ergebnisse mit einem Nonresponse-Index aus Antwortverweigerungen und „weiß nicht“-Angaben konnten mit Daten des “Survey of Consumer
Attitudes“ bestätigt werden (Singer et al. 2000). Bei Fragen über den Ethnozentrismus belgischer Befragungsteilnehmer hat sich speziell für „weiß nicht“-
26
ZA-Information 56
Angaben gezeigt, dass diese Form von Nonresponse ebenfalls bei Frauen, älteren
sowie weniger gebildeten und bei weniger wohlhabenden Befragten wahrscheinlicher ist (Pickery und Loosveldt 1998). Eine andere Untersuchung mit Daten der
Umfrage „Cultural Shifts in Flanderns: Survey 2000” hat die Korrelate unterschiedlicher Formen von Nonresponse detailliert untersucht (Pickery und Loosveldt 2004).
Es hat sich gezeigt, dass die Wahrscheinlichkeit die Einkommensfrage unbeantwortet zu lassen, mit zunehmendem Alter sowie mit steigender Bildung zurückgeht und
für Männer niedriger liegt als für Frauen. Das gleiche Ergebnis lässt sich auch für
die Wahrscheinlichkeit von „weiß nicht“-Antworten feststellen. Diese Form von
Item-Nonresponse nimmt allerdings mit dem Alter zu.
Es liegen empirische Hinweise dafür vor, dass das Ausmaß von Nonresponse mit
dem Schwierigkeitsgrad der Fragen ansteigt. So nimmt die Wahrscheinlichkeit, mit
der eine Frage unbeantwortet bleibt, dann zu, wenn eine Antwort mehr Nachdenken
erfordert und die Frage daher von den Befragten als schwierig eingeschätzt wurde
(Dickinson und Kirzner 1985). Auch der mit der Verwendung von elf- statt fünfstufigen Antwortskalen verbundene Anstieg der kognitiven Anforderungen bei der
Beantwortung einer Frage hat sich als Nonresponse verstärkend ausgewirkt (Leigh
und Martin jr. 1987). Weitere und direktere Evidenz hat sich in einer Untersuchung
gezeigt, in der Experten die Schwierigkeit unterschiedlicher Fragen eingeschätzt
und diese Urteile mit dem Prozentsatz der beobachteten „weiß nicht“-Angaben in
Beziehung gesetzt hat. Der Zusammenhang war positiv und statistisch signifikant.
Das gleiche Ergebnis hat sich bei der eingeschätzten Sensibilität der Fragen und der
Wahrscheinlichkeit von Antwortverweigerungen gezeigt (Shoemaker et al. 2002).
Empirische Ergebnisse belegen auch eine positive Korrelation zwischen unterschiedlichen Formen des Nonresponse. So wurde mit Daten der longitudinalen
„Belgian General Election Study“ festgestellt, dass die Wahrscheinlichkeit, mit der
Befragte die Einkommensfrage und andere Fragen in der ersten Panelwelle nicht
beantwortet hatten, signifikant die Wahrscheinlichkeit einer Teilnahme an der zweiten Befragungswelle vorhersagt (Loosveldt et al. 2002). In der „Cultural Shifts in Flanders“-Umfrage wurde gezeigt, dass der Anteil der „weiß nicht“-Angaben signifikant
mit dem Prozentsatz der Antwortverweigerungen ansteigt (Pickery und Loosveldt
2004). Diese Ergebnisse können als Beleg für die Existenz einer generellen Disposition von Befragten zu unterschiedlichen Formen von Nonresponse angesehen werden.
ZA-Information 56
3.2
27
Ausmaß und Determinanten der Bereitstellung von Kontaktinformationen über Bezugspersonen
Der Anteil der Alteri, für den erfolgreich Kontaktinformationen zur Durchführung
einer Nachbefragung erhoben werden konnte, hat sich als sehr unterschiedlich
erwiesen. So hatten die Befragten in der „Detroit Area Study“ drei ihrer Freunde
genannt, deren Merkmale mit Proxy-Fragen erfasst wurden. Am Ende der Telefoninterviews wurden die Hauptbefragten gebeten, die Kontaktinformationen für eine
zufällig ausgewählte Bezugsperson bereitzustellen. Die Begründung war, dass beabsichtigt sei, mit dieser Person ein 6-7-minütiges Interview durchzuführen. Es hat
sich gezeigt, dass nur 3,5 Prozent der Befragten nicht zur Weitergabe der Telefonnummer der betreffenden Netzperson bereit waren (Laumann 1969). In der ZUMANetzwerkstudie lag die Verweigerungsrate dagegen deutlich höher. In dieser Studie
konnten die Befragten bis zu zehn Alteri nennen, für die sie am Ende der Befragung
um die Adressen gebeten wurden. Hier haben 54 Prozent der Befragten nicht einmal
für eine ihrer Bezugspersonen die Adresse angegeben (Schenk et al. 1992). In der
MZES-Netzwerkstudie wurden die egozentrierten Netzwerke von Befragten mehrerer lokaler Zufallsstichproben erfasst und die Befragten gebeten, für bis zu fünf der
genannten Alteri die Telefonnummern für eine Nachbefragung zu nennen. In dieser
Studie haben die Befragten diese Bitte bei 54,2 Prozent aller Netzpersonen abgeschlagen (Jäger 2004: 57). Der von den Hauptbefragten mit 30,5 Prozent am
häufigsten genannte Verweigerungsgrund war, dass den Bezugspersonen eine Weitergabe ihrer Kontaktinformation nicht recht sein könnte. Mit 16,8 Prozent am
zweithäufigsten wurden Bedenken hinsichtlich des Datenschutzes genannt.
Mit den Daten der ZUMA-Netzwerkstudie wurde untersucht, welche Merkmale der
Hauptbefragten mit deren Bereitschaft zur Weitergabe von Kontaktinformationen
für ihre Bezugspersonen assoziiert sind. Bivariate Analysen haben gezeigt, dass dies
für die Bildung, den Familienstand und die Wohnortgröße der Zielpersonen der Fall
ist: Besser gebildete und verheiratete Personen sowie solche, die in einem kleineren
Ort leben, waren eher zur Weitergabe der Kontaktinformationen bereit (Schenk et
al. 1992). Da für Befragte mit diesen Merkmalen, vorbehaltlich der Teilnahmebereitschaft der Alteri, mehr Netzpersonen befragt werden können, führt schon die
selektive Bereitschaft von Ego zur Nennung von Kontaktinformationen zu einer
Verzerrung der für die Analyse von Bezugsgruppeneinflüssen verfügbaren Netzgrößen. In welchem Umfang dies der Fall war und welchen zusätzlichen Effekt eine
möglicherweise selektive Teilnahmeentscheidung der Alteri hatte, wurde in dieser
Untersuchung nicht analysiert.
28
3.3
ZA-Information 56
Ausmaß und Determinanten der Teilnahmebereitschaft von
Netzpersonen
In einer U.S.-amerikanischen Studie wurden die Proxy-Angaben von Befragten einer lokalen Quotenstichprobe der Bewohner von Toledo (Ohio) über die Merkmale
von bis zu drei ihrer Netzpersonen erfasst (Crandall 1976). Für die ausgewählten
Bezugspersonen konnten in 93 Prozent der Fälle Kontaktinformationen erfasst und
mit 84 Prozent dieser Teilstichprobe erfolgreich Befragungen durchgeführt werden.
Die kumulative Ausschöpfungsrate lag entsprechend bei einem sehr hohen Wert
von 78,1 Prozent. In der „Detroit Area Study“ konnte mit 59,0 Prozent der Bezugspersonen, für die Kontaktinformationen verfügbar waren, eine Nachbefragung
durchgeführt werden. Unter Einbezug der Fälle, bei denen die Befragten einer Weitergabe der Kontaktinformationen nicht zugestimmt hatten, war es somit möglich,
mit insgesamt 56,9 Prozent der anfänglich für ein Interview ausgewählten Netzpersonen ein Follow-up-Interview durchzuführen (Laumann 1969). Die von Ego bei
den Proxy-Fragen berichteten Merkmale der erfolgreich befragten Alteri und die der
Netzpersonen, mit denen aus verschiedenen Gründen kein Interview durchgeführt
werden konnte, haben sich signifikant unterschieden. Demnach haben Netzpersonen, die nicht befragt werden konnten, einen geringeren beruflichen Status sowie
weniger Bildung und waren mit höherer Wahrscheinlichkeit protestantisch und
Arbeiter. Als Konsequenz sind Mitglieder der Bezugsgruppe von Ego mit diesen
Merkmalen in der Stichprobe der befragten Alteri unterrepräsentiert.
Im Vergleich zu den frühen amerikanischen Untersuchungen hat sich die Nachbefragung von Bezugspersonen in deutschen Netzwerkstudien als schwieriger erwiesen. So waren in der erst jüngst durchgeführten MZES-Netzwerkstudie 56,0 Prozent
der Alteri, für die Kontaktinformation vorlagen, zu einer telefonischen Nachbefragung bereit (Jäger 2004: 61). Von den anfänglich für eine Befragung ausgewählten
Bezugspersonen konnten letztendlich 25,6 Prozent erfolgreich befragt werden.
4
Empirische Untersuchung
4.1
Stichprobe der Hauptbefragten
Die bei der folgenden Untersuchung verwendeten Daten stammen aus einer im
Rahmen des Forschungsprojektes „Bildungsaspirationen, Bezugsgruppen und Bildungsentscheidungen“ der Universität Mannheim durchgeführten Befragung von
Grundschuleltern. Grundgesamtheit der lokal definierten Stichprobe waren alle
Familien, die im Schuljahr 2002/2003 Kinder in der 2. Klassenstufe einer Grund-
ZA-Information 56
29
schule hatten und ihren Wohnsitz in den kreisfreien Städten Ludwigshafen, Frankenthal und Speyer oder im Landkreis Rhein-Pfalz hatten. Nicht in die Stichprobe
einbezogen wurden Kinder, deren Elternteile beide nicht in Deutschland geboren
waren. In der ersten Stufe der Stichprobenziehung wurden nach dem Zufallsprinzip
52 Grundschulen aus allen im Untersuchungsgebiet existierenden Schulen ausgewählt. Von diesen haben 48 Schulen und damit 92,3 Prozent an der Studie teilgenommen. In diesen waren insgesamt 2.186 Kinder der Grundgesamtheit eingeschult. Es konnte mit 994 und damit 45,5 Prozent der in den teilnehmenden Schulen
repräsentierten Grundschuleltern eine verwertbare Befragung durchgeführt werden.
Die kumulative Ausschöpfungsrate, bezogen auf die in den insgesamt 52 Schulen
der Ausgangsstichprobe repräsentierten 2.402 Familien, betrug somit 41,4 Prozent.
In den Familien wurde die Person befragt, die sich am meisten um die schulischen
Angelegenheiten des betreffenden Grundschülers kümmert. Dies war in 92,5 Prozent der Familien die Mutter, in 7,0 Prozent der Vater und in 0,5 Prozent der Fälle
eine Person, die in einer anderen Beziehung zu dem Grundschüler stand. Die Zusammensetzung der Stichprobe der Hauptbefragten hinsichtlich ihrer soziodemografischen Merkmale ist in Tabelle 9 im Anhang dokumentiert.
4.2
Vorgehensweise
Die Interviews mit den Hauptbefragten wurden computeradministriert bei den Befragten zu Hause durchgeführt und dauerten durchschnittlich 71,7 Minuten. In der
ersten Interviewhälfte haben die Eltern Fragen über verschiedene Aspekte des aktuellen und zukünftigen Bildungsweges ihrer Kinder beantwortet. Außerdem wurden
die soziodemografischen Merkmale der befragten Person sowie Proxy-Angaben
über die der Partnerin bzw. des Partners erhoben. Im zweiten Teil des Interviews
wurden dann mithilfe des Namensgenerators von Burt (1984) sowie der Teilgeneratoren „Geselligkeit“ und „Versorgung der Wohnung“ von Fischer (1982) die Bezugspersonen der Eltern erfasst. Bei jedem der drei Generatoren konnten bis zu fünf
und damit insgesamt fünfzehn Personen genannt werden. Mehrfachnennungen waren möglich. Von den insgesamt 994 teilnehmenden Eltern haben 985 und damit
99,1 Prozent bei den Namensgeneratoren mindestens eine Bezugsperson genannt.
Im nächsten Interviewteil haben die Eltern Proxy-Fragen über verschiedene Merkmale ihrer Bezugspersonen beantwortet. Um die Belastung der Befragten in Grenzen zu halten, wurden diese Fragen auf maximal fünf Netzpersonen beschränkt.
Hatten die Befragten mehr Alteri genannt, so wurden mit einer quotierten Zufallsregel genau fünf Bezugspersonen für die nachfolgenden Proxy-Fragen ausgewählt.
Bei dieser Auswahl war das Ziel, drei Viertel Alteri mit starken und ein Viertel mit
30
ZA-Information 56
schwächeren Beziehungen zu Ego in die Befragung einzubeziehen. In anderen Untersuchungen hat sich gezeigt, dass mit dem Namensgenerator von Burt vornehmlich Netzpersonen mit einer starken Beziehung zu Ego gelistet werden, wohingegen
das Fischer-Instrument durchschnittlich eher schwächere Beziehungstypen erfasst
(Schenk 1995: 34ff.). Als Kriterium für deren Auswahl wurde daher herangezogen,
bei welchem der Namensgeneratoren die Netzperson genannt worden war. Von den
4.292 letztendlich für eine Befragung ausgewählten Netzpersonen hatte Ego 73,5
Prozent beim Namensgenerator von Burt und die restlichen 26,5 Prozent ausschließlich bei einem der Fischer-Generatoren genannt. Die durchschnittliche
Größe der Egonetzwerke lag in dieser Ausgangsstichprobe bei 4,4 Netzpersonen.
Die Eltern sollten im Anschluss für jede Netzperson Proxy-Fragen über deren Lebensalter, die Schulbildung, den Erwerbs- sowie Berufsstatus und deren Kinderanzahl beantworten. Die Eltern sollten auch angeben, welchen Schulabschluss sich
jede der Netzpersonen für das Kind der Grundschuleltern wünscht.4 Außerdem
wurde mit zwei Items die Wahrnehmung der Eltern darüber abgefragt, welche Einstellung zu Bildung die Bezugspersonen haben.5 Jede Information wurde blockweise für alle Netzpersonen abgefragt. Am Ende des Interviews wurden die Eltern für
jede der ausgewählten Netzpersonen um die Telefonnummer gebeten. Wurde diese
Bitte abgeschlagen, so wurde den Befragten vorgeschlagen, das Einverständnis hierfür bei der jeweiligen Netzperson einzuholen. Sind die Hauptbefragten auf diesen
Vorschlag eingegangen, so haben die Interviewer eine Woche nach dem Interview
das Ergebnis dieser Nachfrage telefonisch erfragt und gegebenenfalls die ausstehenden Telefonnummern aufgezeichnet.
4.3
Netzpersoneninterviews
Im Durchschnitt 10,6 Wochen nach der Befragung der Eltern wurden die Netzpersonen, für die Telefonnummern akquiriert werden konnten, telefonisch kontaktiert
und um ein Interview gebeten. Als Grund für die Befragung wurde genannt, dass
4 Fragetext: „Was meinen Sie, zu welchem Schulabschluss würde Ihnen [Name von Alter] für
[Name von Kind] raten, wenn es alleine nach seiner/ihrer Idealvorstellung eines Abschlusses
ginge?“ Antwortoptionen: (1) Hauptschulabschluss, (2) Realschulabschluss, (3) Fachabitur, (4)
Abitur, (5) Anderer Abschluss.
5 Fragetext: „Wenn Sie sich einmal in [Name von Alter] hineinversetzen. Was glauben Sie, wie
stark würde er/sie den folgenden Aussagen über die Bedeutung von Bildung zustimmen? (1)
Was hält er/sie von der Ansicht, dass Kinder später nur arrogant werden, wenn sie zu lange zur
Schule gehen? (2) Und wie stark wäre seine/ihre Zustimmung zu der Meinung, dass eine gute
Schulbildung ein Wert an sich ist?“ Antwortskala von 1 (stimmt überhaupt nicht zu) bis 7
(stimmt voll und ganz zu).
ZA-Information 56
31
Ego die Zielperson in einem Interview mit der Universität Mannheim als eine für
sie „wichtige Person“ genannt hatte. Es wurde außerdem angegeben, dass das Interview über das Thema „Schule“ und „Bildung“ gehen solle.6 Auf Nachfrage haben
die Interviewer eine Befragungsdauer von rund 25 Minuten angegeben.
4.4
Ergebnisse
4.4.1 Ausmaß und Determinanten des Nonresponse bei den Proxy-Fragen
Insgesamt haben die Hauptbefragten in der vorliegenden Studie wenige ProxyFragen unbeantwortet gelassen. So haben die Eltern im Durchschnitt 2,7 Prozent
der vier Fragen über die soziodemografischen Merkmale ihrer Bezugspersonen
nicht beantwortet (vgl. Tabelle 1).7 Dieser Anteil liegt bei den drei Proxy-Fragen
über die Einstellungen der Bezugspersonen mit durchschnittlich 4,0 Prozent signifikant höher (t=3,8, p ≤ .05). Eine differenziertere Betrachtung hat gezeigt, dass sich
das Gesamtausmaß des Nonresponse bei den Faktenfragen aus 2,6 Prozent „weiß
nicht“-Angaben und 0,1 Prozent Antwortverweigerungen zusammengesetzt hat. Bei
den Einstellungsfragen lagen beide Arten von Nonresponse mit Durchschnittswerten
von 3,8 und 0,2 Prozent höher. Der Unterschied zwischen den Fragetypen ist für die
„weiß nicht“-Angaben (t=3,7, p ≤ .05), nicht aber für den Anteil der Antwortverweigerungen (t=1,4, p > .05) statistisch signifikant. Demnach haben die Befragten
die Fragen über die weniger „sichtbaren“ Einstellungen der Alteri, im Vergleich zur
denen über deren soziodemografische Charakteristiken, zwar als schwerer, nicht
aber als sensibler betrachtet. Es kann außerdem festgestellt werden, dass die insgesamt fehlenden Angaben bei den Einstellungsfragen (t=11,6, p ≤ .05) und bei den
Faktenfragen (t=14,7, p ≤ .05) gleichermaßen signifikant stärker auf „weiß nicht“Angaben und weniger auf Antwortverweigerungen zurückgehen. Dieses Ergebnis
legt nahe, dass das Problem fehlender Werte bei den Proxy-Fragen mehr auf unzureichendes Wissen über die Alteri und weniger auf eine mangelnde Antwortbereitschaft der Befragten zurückgeht.
6 Der folgende Einleitungstext wurde von den Interviewern beim Erstkontakt vorgelesen: „Guten
Tag. Ich rufe im Auftrag der Universität Mannheim an. Ich würde gerne mit [Name von Alter]
sprechen. Frau/Herr [Name von Ego] hat Sie bei einem Interview über die schulischen Angelegenheiten von [Name von Kind] als wichtige Person genannt. Wir würden gerne auch mit Ihnen
ein kurzes Interviewgespräch über das Thema ‚Schule‘ und ‚Bildung‘ führen.“
7 In die Berechnung ging das Antwortverhalten bei den Fragen über das Alter, die Schulbildung,
den Erwerbsstatus sowie die Kinderzahl der Netzpersonen ein. Da die Frage nach dem beruflichen Status nicht bei Alteri gestellt wurde, die noch nie in ihrem Leben erwerbstätig waren,
wurde diese nicht in den Nonresponse-Indikator aufgenommen.
32
Tabelle 1
ZA-Information 56
Durchschnittlicher Prozentsatz der von Ego bei unterschiedlichen
Fragentypen für jede Netzperson nicht beantworteten Proxy-Fragen
„Weiß nicht“Angaben
% (STD)
Antwortverweigerungen
% (STD)
Nonresponse
gesamt
% (STD)
Fragentyp
- Demografische Fragen (N=4)
- Einstellungsfragen (N=3)
2.64 ( 8.6)
3.77 (13.0)
0.11 (3.1)
0.19 (3.9)
2.75 ( 9.1)
3.96 (13.6)
Gesamt
3.13 ( 8.1)
0.14 (3.3)
3.27 ( 8.8)
Im nächsten Schritt unserer Analyse wurde geprüft, ob sich die Neigung der Hauptbefragten zu Nonresponse nach deren Zugehörigkeit zu soziodemografischen Gruppen unterscheidet. Wegen der geringen Anzahl von Befragten, die bei mindestens
einer Netzperson die Antwort bei einer der sieben Proxy-Fragen verweigert hatten
(N=7), war eine separate Analyse der Determinanten dieser Art von Nonresponse
nicht möglich. Um eine eindeutige Interpretierbarkeit der Ergebnisse zu gewährleisten, beschränkt sich die folgende Analyse auf die „weiß nicht“-Antworten.8 Die Kriteriumsvariable der Analyse ist dyadisch organisiert und beinhaltet den Prozentsatz
der insgesamt sieben Proxy-Fragen, den Ego bei jeder Netzperson mit „weiß nicht“
beantwortet hat.9
Die Ergebnisse von negativ binomialen Regressionsanalysen haben in einem ersten
Schritt gezeigt, dass sich das Ausmaß der von den Befragten mit „weiß nicht“ beantworteten Fragen signifikant nach zwei der insgesamt fünf untersuchten Merkmalsdimensionen unterscheidet (vgl. Tabelle 2, Regressionsmodell 1).10 So hat sich der
Erwerbsstatus (Wald-χ2=8,7, df=2, p ≤ .05) und das Alter (Wald-χ2=8,4, df=1, p ≤ .05)
8 Alle berichteten Analysen über die Bestimmungsfaktoren des Item-Nonresponse wurden auch
mit einer Kriteriumsvariablen durchgeführt, bei der neben den „weiß-nicht“-Angaben auch die
Antwortverweigerungen einbezogen wurden. Die hierbei erzielten Ergebnisse unterscheiden
sich in keinem Fall substantiell von den hier dargestellten.
9 Die abhängige Variable dieser und der folgenden Analysen besteht aus dem bei bis zu fünf Alte-
ri des gleichen Hauptbefragten beobachteten Antwortverhalten. Die Beobachtungen können daher nicht als unabhängig angesehen werden. Dies bewirkt eine Unterschätzung der Standardfehler der Regressionskoeffizienten und damit eine Überschätzung ihrer Zuverlässigkeit. Dieses
Problem wird durch Verwendung des „Huber-White Sandwich“-Schätzers für robuste Standardfehler mit den befragten Eltern als Cluster korrigiert (STATA Corporation 1999: 165).
10 Da es sich bei der als Prozentsatz ausgedrückten Anzahl an “weiß nicht”-Antworten um eine
Häufigkeitsverteilung handelt, ist eine Poisson-Regression eigentlich das angemessene Analyseverfahren. Allerdings zeigt die Antwortverteilung ein hohes Ausmaß an Überdispersion
(α=20,7, p ≤ .05). Eine Unterschätzung der Standardfehler der Koeffizienten wurde daher durch
die Verwendung negativ-binomialer Regressionsanalysen vermieden (Long und Freese 2003:
266).
ZA-Information 56
33
der befragten Personen signifikant auf deren Neigung zu „weiß nicht“-Antworten
auswirkt. Entsprechend haben Befragte, die noch nie erwerbstätig waren, im Vergleich zu solchen, die früher oder am Befragungszeitpunkt einer Erwerbsarbeit
nachgegangen waren, signifikant häufiger Proxy-Fragen unbeantwortet gelassen.
Der Alterseffekt besagt dagegen, dass der Anteil der mit „weiß nicht“ beantworteten
Proxy-Fragen mit dem Alter der Befragten ansteigt. Die Stellung im Beruf, das Geschlecht und die Schulbildung der Hauptbefragten haben sich nicht als signifikant
mit dem Ausmaß des Nonresponse assoziiert erwiesen.
In einem zweiten Schritt wurde untersucht, ob sich die mit der Nennung einer Netzperson beim Namensgenerator von Burt verbundene höhere Beziehungsstärke auf
den Anteil der von Ego mit „weiß nicht“ beantworteten Fragen ausgewirkt hat (vgl.
Tabelle 2, Regressionsmodell 2). Das Ergebnis ist, dass diese Art des Nonresponse
bei höherer Beziehungsstärke signifikant geringer ist (Wald-χ2=99,5, df=1, p ≤ .05).
Demnach kann festgestellt werden, dass die bei stärkeren Beziehungen durchschnittlich längere Bekanntheitsdauer und höhere Interaktionsrate die Verfügbarkeit
der mit den Proxy-Fragen erfassten Informationen verbessert.
In einem dritten Schritt wurde geprüft, ob das Ausmaß der von Ego unbeantworteten Proxy-Fragen auch das Resultat einer generellen Neigung der Befragten zu Nonresponse ist. Es wurde daher erstens überprüft, ob die Bereitschaft zur Herausgabe
der Kontaktinformationen für Alter erklärt, in welchem Umfang Ego die ProxyFragen mit „weiß nicht“ beantwortet hat. Es wurde zweitens geprüft, ob der Prozentsatz der bei den insgesamt 75 Fragen über Merkmale der befragten Person
selbst beobachteten „weiß nicht“-Antworten und Antwortverweigerungen die Neigung zu Nonresponse bei den Proxy-Fragen erklärt.11 Diese drei Indikatoren für die
generelle Tendenz der Eltern Fragen unbeantwortet zu lassen, wurden gleichzeitig
in die Analyse einbezogen (vgl. Tabelle 2, Regressionsmodell 3). Die Ergebnisse
zeigen, dass der Prozentsatz der mit „weiß nicht“ beantworteten Fragen signifikant
höher liegt, wenn sich die befragte Person im Anschluss geweigert hat, die Telefonnummer der betreffenden Netzperson zu nennen (Wald-χ2=28,2, df=1, p ≤ .05).
Dieser Prozentsatz steigt außerdem signifikant an, wenn Ego bei Fragen über die
eigene Person häufiger mit „weiß nicht“ geantwortet hat (Wald-χ2=26,2, df=1, p ≤ .05)
und öfter die Antwort verweigert hat (Wald-χ2=9,3, df=1, p ≤ .05).
11 Bei der Berechnung der beiden Nonresponse-Indikatoren wurden alle Fragen über Merkmale
von Ego herangezogen. Proxy-Fragen über den Partner/die Partnerin von Ego wurden nicht einbezogen. Ebenfalls nicht berücksichtigt wurden Fragen, die in einem Filter lagen. Im Durchschnitt hatten die Befragten 0.12 Prozent (Range: 0.00-8.00; Std.: .50) der 75 Fragen mit „weiß
nicht“ beantwortet und bei 0.09 Prozent (Range: 0.0-10.67; Std.: .50) eine Antwort verweigert.
34
Tabelle 2
ZA-Information 56
Determinanten der „weiß nicht“-Angaben von Ego bei Proxy-Fragen
über die Alteri (Ergebnisse negativ-binomialer Regressionsanalysen)
Merkmale von Ego
(1) Erwerbsstatus a)
- Voll-/Teilzeit erwerbstätig
- Noch nie erwerbstätig
(2) Lebensalter (Jahre)
(3) Kontaktinformation
bereitgestellt? (nein) b)
(4) Verweigerte Eigenangaben (%)
(5) „Weiß nicht“ bei Eigenangaben (%)
(6) Beziehungsstärke (stark) c)
Konstante
Log-Likelihood
McFaddens Pseudo-R2
Anzahl Beobachtungen
Modell 1
B (STD)
Modell 2
B (STD)
.04 (.11)
1.13 (.38)**
.03 (.01)**
--
.10 (.11)
1.36 (.41)**
.03 (.01)**
--
Modell 3
B (STD)
.13
1.26
.02
.53
(.12)
(.38)**
(.01)
(.10)**
---
---
.59 (.19)**
.77 (.15)**
--
-.83 (.08)**
-.77 (.09)**
-.24 (.47)
.33 (.46)
.23 (.48)
-5152.6
.001
4292
-5138.1
.004
4292
-5123.0
.007
4292
Referenzkategorie: a) früher erwerbstätig; b) ja; c) schwach.
Signifikanz: * p ≤ .05; ** p ≤ .01.
Ein weiteres Ergebnis ist, dass der zuvor signifikante Effekt des Lebensalters seine
Erklärungskraft für die Wahrscheinlichkeit von „weiß nicht“-Antworten verliert,
wenn die verschiedenen Indikatoren für die generelle Neigung der Befragten zu
Nonresponse statistisch kontrolliert werden (Wald-χ2=3,8, df=1, p > .05). Weitere
Analysen haben gezeigt, dass das Alter der Befragten signifikant mit deren Neigung
zu „weiß nicht“-Angaben (r=.11, p ≤ .05) und Antwortverweigerungen (r=.10, p ≤ .05)
bei Fragen über die eigenen Merkmale assoziiert ist. Demnach geht der anfänglich
beobachtete Alterseffekt auf das Ausmaß der „weiß nicht“-Angaben auf eine generell höhere Neigung älterer Befragter zu Nonresponse zurück.
4.4.2 Konsequenzen des Nonresponse bei den Proxy-Fragen
Nach unseren Ergebnissen haben die Hauptbefragten unserer Studie einen nur geringen Teil der Proxy-Fragen mit „weiß nicht“ beantwortet. Geht man von einem
für die sieben erfragten Merkmale listenweisen Ausschluss der fehlenden Werte
aus, so reduziert dies die Ausgangsstichprobe der 4.292 Netzpersonen dennoch auf
3.577 und damit um 16,7 Prozent, für die vollständige Proxy-Angaben zur Verfügung stehen. Es stellt sich nun die Frage, in welcher Weise sich dies und insbesondere die nach dem Erwerbsstatus von Ego unterschiedliche Ausfallwahrscheinlichkeit
ZA-Information 56
Tabelle 3
35
Einfluss des Item-Nonresponse bei den Proxy-Fragen auf die
durchschnittliche Größe der Egonetze
Gesamtstichprobe
der Alteri (G)
∅ (STD)
Alteri mit vollständigen
Proxy-Angaben (V)
∅ (STD)
Differenz
(G-V)
∅
Erwerbsstatus von Ego
- Voll-/Teilzeit erwerbstätig (N=535)
- Früher erwerbstätig (N=434)
- Noch nie erwerbstätig (N=16)
4.4 (1.0)
4.3 (1.0)
4.0 (1.2)
3.7 (1.4)
3.6 (1.4)
2.8 (1.5)
0.7
0.7
1.2
Durchschnittliche Netzgröße
4.3 (1.0)
3.6 (1.4)
0.7
Einbezogene Alteri (%)
100.0
83.3
auf die für die Analyse von Bezugsgruppeneinflüssen verfügbare Größe der Egonetzwerke auswirkt. In Tabelle 3 wird die durch Nonresponse bei den Proxy-Fragen
bewirkte Verkleinerung der durchschnittlich pro Ego verfügbaren Netzpersonen,
differenziert nach dem Erwerbsstatus der Hauptbefragten, dargestellt.
Die Ergebnisse zeigen, dass sich das mit vollständigen Proxy-Angaben verfügbare
Netzwerk für am Befragungszeitpunkt erwerbstätige Befragte ausgehend von 4,4
Alteri auf 3,7 und damit um 0,7 Alteri verkleinert. Dieser Effekt des Item-Nonresponse
entspricht genau dem, der bei früher erwerbstätigen Befragten beobachtet wird: Die
anfängliche Netzwerkgröße schrumpft von 4,3 auf 3,6 Alteri. Dagegen fällt die
Reduktion der Netzgröße bei der im besonderen Ausmaß zu „weiß nicht“-Angaben
neigenden Gruppe der noch nie Erwerbstätigen deutlich stärker aus. In dieser Gruppe geht die Netzgröße von 4,0 Alteri um 1,2 Bezugspersonen und damit auf einen
Wert von nur noch 2,8 zurück.
4.4.3 Determinanten der mangelnden Bereitschaft zur Nennung von Kontaktinformationen
In unserer Studie konnten für 2.550 und damit für 59,4 Prozent der ursprünglich
4.292 für eine Befragung vorgesehenen Alteri Telefonnummern akquiriert werden.
Es wurde mit einer Reihe logistischer Regressionsanalysen getestet, welche Faktoren sich auf die fehlende Bereitschaft zur Nennung der Telefonnummern ausgewirkt
haben. Zuerst wurde geprüft, ob dies für die soziodemografischen Merkmale von
Ego zutrifft. Nach den Ergebnissen war dies nicht der Fall: Das Geschlecht, der
Erwerbsstatus, die berufliche Stellung und das Alter von Ego haben weder unter
Kontrolle der jeweils anderen Faktoren, noch bivariat einen Einfluss auf die Weitergabe der Telefonnummern ausgeübt (Ergebnisse nicht berichtet).
36
ZA-Information 56
Im zweiten Schritt wurde der Einfluss der von Ego über die Netzpersonen berichteten soziodemografischen Merkmale auf die Verweigerung einer Weitergabe der
Kontaktinformationen getestet. Die Ergebnisse zeigen, dass sich das Geschlecht
(Wald-χ2=23,7, df=1, p ≤ .05) und der Erwerbsstatus (Wald-χ2=6,4, df=2, p ≤ .05)
der Alteri signifikant auf die Wahrscheinlichkeit einer fehlenden Bereitschaft der
Hauptbefragten zur Bereitstellung von Kontaktinformationen ausgewirkt haben:
Diese Wahrscheinlichkeit liegt für männliche im Vergleich zu weiblichen und für
aktuell im Vergleich zu früher erwerbstätigen Netzpersonen höher (vgl. Tabelle 4,
Regressionsmodell 4). Diese Effekte können so interpretiert werden, dass Ego bei
männlichen Bezugspersonen von einem nur geringen Interesse an einem Interview
über die schulischen Angelegenheiten von Grundschülern ausgeht. Trifft dies zu, so
ist die bei männlichen Netzpersonen besonders geringe Bereitschaft zur Weitergabe
der Kontaktinformationen das Ergebnis des Bestrebens von Ego, eine Belastung
dieser Netzpersonen durch die Teilnahme an einer unangenehmen Befragung zu
verhindern. Die gleiche Motivation kann auch als Grundlage der Unterschiede nach
dem Erwerbsstatus der Alteri angenommen werden. Demnach liegt der geringeren
Bereitschaft zur Weitergabe der Kontaktinformation von berufstätigen Netzpersonen die Annahme zugrunde, dass für diese eine Befragungsteilnahme eine besondere zeitliche Belastung darstellt.
Drittens wurde geprüft, ob sich die Beziehungsstärke zwischen Ego und Alter auf
die Weitergabe der Kontaktinformationen ausgewirkt hat (vgl. Tabelle 4, Regressionsmodell 5). Nach den vorliegenden Ergebnissen hat Ego bei Alteri, die er oder sie
beim Namensgenerator von Burt genannt hat und zu denen somit eine starke soziale
Beziehung besteht, signifikant weniger häufig die Herausgabe der Telefonnummer
verweigert (Wald-χ2=41,6, df=1, p ≤ .05). Demnach kann die Hypothese bestätigt
werden, dass Ego beim Vorliegen einer vertrauensvolleren Beziehung zu den Netzpersonen eher einen Eingriff in deren Privatsphäre riskiert.
In vierten Schritt unserer Analyse wurde geprüft, ob sich die Neigung von Ego zu
„weiß nicht“-Angaben bei den Proxy-Fragen sowie das Ausmaß von „weiß nicht“Angaben und Antwortverweigerungen bei Fragen über die eigene Person auf die
Bereitschaft zur Weitergabe von Kontaktinformationen ausgewirkt hat. Wie nach
dem Ergebnis über die Bestimmungsfaktoren des Nonresponse bei den ProxyFragen zu erwarten war, steigt die Wahrscheinlichkeit der Antwortverweigerung bei
der Frage nach der Kontaktinformation signifikant mit dem Anteil der mit „weiß
nicht“ beantworteten Proxy-Fragen an (Wald-χ2=32,5, df=1, p ≤ .05; vgl. Tabelle 4,
Regressionsmodell 6). Diese Wahrscheinlichkeit steigt auch mit dem Ausmaß der
Antwortverweigerungen (Wald-χ2=24,2, df=1, p ≤ .05), nicht aber mit dem der
„weiß nicht“-Angaben (Wald-χ2=2,7, df=1, p > .05) bei den Selbstbeschreibungsfragen
ZA-Information 56
Tabelle 4
37
Determinanten der fehlenden Bereitschaft zur Nennung von
Kontaktinformationen der Alteri
(Ergebnisse logistischer Regressionsanalysen)12
Merkmale der Alteri
Geschlecht (weiblich) a)
(1) Erwerbsstatus b)
- Voll-/Teilzeit erwerbstätig
- Noch nie erwerbstätig
Modell 4
B (STD)
Modell 5
B (STD)
Modell 6
B (STD)
-.36 (.07)**
-.34 (.08)**
-.33 (.08)**
.16 (.07)*
.28 (.18)
.15 (.07)*
.27 (.18)
.17 (.07)**
.29 (.18)
Merkmale von Ego
(2) „Weiß nicht“ bei Proxy-Angaben (%)
(3) Verweigerte Eigenangaben (%)
(4) „Weiß nicht“ bei Eigenangaben (%)
----
----
.03 (.01)**
1.19 (.24)**
-.33 (.20)
(5) Beziehungsstärke (stark) c)
--
-.51 (.08)**
-.43 (.08)**
.13 (.11)
-.07 (.11)
-2847.9
.02
4292
-2785.0
.04
4292
Konstante
Log-Likelihood
McFaddens Pseudo-R2
Anzahl Beobachtungen
-.22 (.09)*
-2873.7
.01
4292
Referenzkategorie: a) männlich; b) früher erwerbstätig; c) schwach.
Signifikanz: * p ≤ .05; ** p ≤ .01.
an. Demnach hängt der Erfolg bei der Akquirierung der Kontaktinformationen zumindest teilweise von der generellen Antwortbereitschaft der Befragten ab.
4.4.4 Determinanten der Realisierungswahrscheinlichkeit der
Netzpersoneninterviews
Ausgehend von der Bruttostichprobe der 2.550 Alteri, für die Telefonnummern verfügbar waren, wurde bei 2.354 versucht ein Telefoninterview durchzuführen.13 In
1.768 Fällen oder 75,1 Prozent der bearbeiteten Bruttostichprobe konnte dies realisiert
12 Alteri mit fehlenden Werten beim Erwerbsstatus wurden durch eine Dummy-Variable in der
Regressionsgleichung repräsentiert, der Parameter aus Übersichtlichkeitsgründen jedoch nicht
berichtet. Dies trifft bei den folgenden Regressionsanalysen auch für deren berufliche Stellung
und Bildung sowie für die berufliche Stellung von Ego zu. Die Erklärungskraft dieser MissingDummies gehen bei den für diese Faktoren berichteten χ2-Tests nicht ein.
13 Nach den ersten zwei Dritteln der Feldzeit hat sich gezeigt, dass wegen finanzieller Beschrän-
kungen nicht mit allen mit Telefonnummern ausgestatteten Netzpersonen Befragungen durchgeführt werden können. Es wurden daher 196 Telefonnummern ohne jegliche Kontaktversuche
aus der Stichprobe genommen. Diese Teilstichprobe geht nicht in die Berechnung der hier angegebenen Ausschöpfungsquote und die Analyse der Ausfallswahrscheinlichkeit ein.
38
Tabelle 5
ZA-Information 56
Determinanten des Misserfolges bei der Realisierung von
Netzpersoneninterviews (Ergebnisse logistischer Regressionsanalysen)
Merkmale der Alteri
(1) Geschlecht (weiblich) a)
(2) Erwerbsstatus b)
- Voll-/Teilzeit erwerbstätig
- Noch nie erwerbstätig
(3) Berufliche Stellung c)
- Angestellter
- Beamter
- Selbstständiger
Merkmale von Ego
(4) Bildung d)
- Realschulabschluss
- Fachhochschulreife
- Abitur
(5) Erwerbsstatus b)
- Voll-/Teilzeit erwerbstätig
- Noch nie erwerbstätig
(6) Berufliche Stellung c)
- Angestellter
- Beamter
- Selbstständiger
(7) „Weiß nicht“ bei Proxy-Angaben (%)
(8) Verweigerte Eigenangaben (%)
(9) „Weiß nicht“ bei Eigenangaben (%)
(10) Beziehungsstärke (stark) e)
Konstante
Log-Likelihood
McFaddens Pseudo-R2
Anzahl Beobachtungen
Modell 7
B (STD)
Modell 8
B (STD)
Modell 9
B (STD)
-.42 (.12)**
-.42 (.12)**
-.42 (.12)**
.07 (.10)
1.40 (.36)**
.07 (.10)
1.39 (.36)**
.07 (.10)
1.37 (.36)**
-.29 (.16)
-.48 (.24)*
-.09 (.22)
-.29 (.16)
-.49 (.24)*
-.08 (.22)
-.29 (.16)
-.49 (.24)*
-.08 (.22)
-.46 (.15)**
-.66 (.23)**
-.69 (.16)**
-.46 (.15)**
-.66 (.23)**
-.68 (.16)**
-.47 (.15)**
-.67 (.23)**
-.69 (.16)**
.27 (.11)*
1.13 (.74)
.27 (.11)*
1.15 (.73)
.27 (.11)*
1.13 (.74)
-.52 (.20)*
-.46 (.30)
-.54 (.26)*
----
-.51 (.20)*
-.46 (.30)
-.53 (.26)*
----
-.51 (.20)*
-.45 (.30)
-.53 (.26)*
-.01 (.01)
.16 (.24)
-.08 (.20)
-.10 (.12)
-.11 (.12)
.25 (.22)
.27 (.23)
-1270.7
.04
2354
-1270.2
.04
2354
-.19 (.21)
-1271.1
.04
2354
Referenzkategorie: a) männlich; b) früher erwerbstätig; c) Arbeiter; d) Hauptschulabschluss;
e)
schwach. Signifikanz: * p ≤ .05; ** p ≤ .01.
werden.14 In einem ersten Schritt wurde analysiert, welche Merkmale der Alteri und
welche Charakteristiken von Ego mit der Ausfallwahrscheinlichkeit eines Netzpersoneninterviews assoziiert sind (vgl. Tabelle 5, Regressionsmodell 7).
14 Die Gründe für den Misserfolg bei der Befragung der Netzpersonen setzt sich wie folgt zusam-
men: 12,6%: Teilnahmeverweigerung, 5,2%: kein Kontakt mit Zielperson möglich, 4,9%: falsche Telefonnummer, 2,2%: Interview abgebrochen.
ZA-Information 56
39
Nach den Ergebnissen hat sich das Geschlecht der Alteri (Wald-χ2=12,8, df=1, p ≤ .05),
deren Erwerbsstatus (Wald-χ2=14,9, df=2, p ≤ .05) sowie die Stellung im Beruf
(Wald-χ2=21,3, df=4, p ≤ .05) signifikant auf die Ausfallwahrscheinlichkeit eines
Interviews ausgewirkt. Demnach war die Ausfallwahrscheinlichkeit erstens für
weibliche Netzpersonen geringer als für männliche. In diesem Unterschied drückt
sich möglicherweise das geringere Interesse von Männern am Befragungsthema
„schulische Angelegenheiten von Grundschülern“ aus. Zweitens haben noch nie
erwerbstätige Bezugspersonen signifikant weniger an einer Befragung teilgenommen, verglichen mit den früher und aktuell Erwerbstätigen. Es konnte drittens mit
Arbeitern, im Vergleich zu allen anderen Statusgruppen, weniger wahrscheinlich
ein Interview realisiert werden. Dieser Unterschied hat sich allerdings nur für den
Vergleich mit der Gruppe der Beamten als statistisch signifikant erwiesen.
Die Ergebnisse haben zweitens gezeigt, dass die Bildung (Wald-χ2=19,5, df=3, p ≤ .05),
der Erwerbsstatus (Wald-χ2=8,3, df=2, p ≤ .05) sowie die Stellung im Beruf (Waldχ2=9,6, df=4, p ≤ .05) von Ego einen zusätzlichen Effekt auf die Wahrscheinlichkeit
eines Misserfolgs bei der Befragung der Netzpersonen ausgeübt haben. So liegt die
Ausfallwahrscheinlichkeit von Alteri, die von einem Hauptbefragten mit Hauptschulabschluss genannt wurden, verglichen mit Bezugspersonen von Abiturienten
signifikant höher. Außerdem haben Netzpersonen von Hauptbefragten, die am Befragungszeitpunkt oder noch nie zuvor erwerbstätig waren, im Vergleich zu solchen, die früher erwerbstätig waren, häufiger kein Interview absolviert. Dabei ist
der Unterschied zwischen den Gruppen der aktuell und früher Erwerbstätigen statistisch signifikant. Auch haben Bezugspersonen von Arbeitern, im Vergleich zu allen
anderen, seltener ein Interview absolviert.
Es wurde auch geprüft, ob sich die mit der Nennung einer Bezugsperson beim
Namensgenerator von Burt verbundene höhere Beziehungsstärke auf die Befragungsteilnahme der Alteri ausgewirkt hat (vgl. Tabelle 5, Regressionsmodell 8). Die Ergebnisse haben gezeigt, dass dies nicht der Fall ist (Wald-χ2=0,7, df=1, p > .05).
Ebenfalls nicht relevant war, wie häufig Ego bei Fragen über die eigenen Merkmale
Antworten verweigert (Wald-χ2=0,4, df=1, p > .05) und mit „weiß nicht“ geantwortet hat (Wald-χ2=0,2, df=1, p > .05) oder in welchem Umfang „weiß nicht“Antworten bei den Proxy-Fragen gegeben wurden (Wald-χ2=0,6, df=1, p > .05).
4.4.5 Determinanten der kumulativen Wahrscheinlichkeit einer Realisierung
von Netzpersoneninterviews
Von den 4.096 anfänglich von Ego genannten Netzpersonen, bei denen versucht
worden war eine Befragung durchzuführen, konnte in 43,2 Prozent der Fälle letzt-
40
ZA-Information 56
endlich ein Interview realisiert werden. Es stellt sich die Frage, nach welchen
Merkmalen der Ziel- und Netzpersonen sich die kumulative Ausfallwahrscheinlichkeit eines Netzpersoneninterviews unterscheidet. Die Analysen haben erstens
gezeigt, dass sich die Bildungsabschlüsse (Wald-χ2=16,2, df=3, p ≤ .05) und der
Erwerbsstatus (Wald-χ2=13,7, df=2, p ≤ .05) von Ego, sowie das Geschlecht (Waldχ2=43,3, df=1, p ≤ .05), die Bildungsabschlüsse (Wald-χ2=11,7, df=3, p ≤ .05) und
der Erwerbsstatus (Wald-χ2=16,3, df=2, p ≤ .05) der Alteri signifikant auf die Ausfallwahrscheinlichkeit einer Befragung der Bezugspersonen ausgewirkt hat (vgl.
Tabelle 6, Regressionsmodell 10). Auch die Stärke der Beziehung zwischen Ego
und Alter hat sich zusätzlich als statistisch signifikanter Erklärungsfaktor erwiesen
(Wald-χ2=28,0, df=1, p ≤ .05; vgl. Tabelle 6, Regressionsmodell 11). Die vorherigen Analysen haben gezeigt, dass dieser Effekt auf die nach dieser Dimension
selektive Bereitstellung von Kontaktinformationen durch Ego zurückzuführen ist.
Auch das Ausmaß der „weiß nicht“-Angaben bei den Proxy-Fragen (Wald-χ2=7,6,
df=1, p ≤ .05) und die Neigung zu Antwortverweigerungen bei Fragen über die
eigene Person (Wald-χ2=22,6, df=1, p ≤ .05) haben einen signifikanten Effekt auf
die Wahrscheinlichkeit, dass kein Interview mit einer Bezugsperson realisiert werden konnte (vgl. Tabelle 6, Regressionsmodell 12).
Mit zwei Ausnahmen handelt es sich bei den hier festgestellten Determinanten um
die „Vereinigungsmenge“ der für die Nennung der Kontaktinformation und die
Realisierung der Netzpersonenbefragungen festgestellten Erklärungsfaktoren. Bei
diesen Ausnahmen handelt es sich erstens um den beruflichen Status von Ego sowie
um den der Alteri, die sich zwar bei der konditionalen Teilnahmeentscheidung der
Netzpersonen als relevant erwiesen hatten, das Signifikanzkriterium bei der Vorhersage der Gesamtrealisierungswahrscheinlichkeit aber verfehlt haben. Die Bildungsabschlüsse der Alteri haben zwar bei beiden Selektionsstufen knapp die Signifikanzmarke verfehlt, erweisen sich aber bei der Erklärung der kumulierten Ausfallwahrscheinlichkeit als eindeutig relevanter Erklärungsfaktor. Dieser „neue“ Effekt
besagt, dass Hauptschulabsolventen, verglichen mit allen anderen Bildungsgruppen,
ein höheres Risiko dafür haben, dass ihre selbstberichteten Merkmale bei der Analyse von Bezugsgruppeneffekten nicht einbezogen werden können. Diese Wahrscheinlichkeitsunterschiede sind, mit Ausnahme der Befragten mit Abitur, für alle
Bildungsgruppen statistisch signifikant. Die inhaltlichen Aussagen der anderen
Effekte sind substantiell die gleichen, wie die in den Detailanalysen dargestellten.
ZA-Information 56
Tabelle 6
41
Determinanten der kumulativen Ausfallwahrscheinlichkeit einer
Netzpersonenbefragung (Ergebnisse logistischer Regressionsanalysen)
Merkmale der Alteri
(1) Geschlecht (weiblich) a)
(2) Bildung b)
- Realschulabschluss
- Fachhochschulreife
- Abitur
(3) Erwerbsstatus c)
- Voll-/Teilzeit erwerbstätig
- Noch nie erwerbstätig
Merkmale von Ego
(4) Bildung b)
- Realschulabschluss
- Fachhochschulreife
- Abitur
(5) Erwerbsstatus c)
- Voll-/Teilzeit erwerbstätig
- Noch nie erwerbstätig
(6) „Weiß nicht“ bei Proxy-Angaben (%)
(7) Verweigerte Eigenangaben (%)
(8) „Weiß nicht“ bei Eigenangaben (%)
(9) Beziehungsstärke (stark) d)
Konstante
Log-Likelihood
McFaddens Pseudo-R2
Anzahl Beobachtungen
Modell 10
B (STD)
Modell 11
B (STD)
Modell 12
B (STD)
-.52 (.08)**
-.50 (.08)**
-.49 (.08)**
-.18 (.09)*
-.50 (.16)**
-.08 (.10)
-.18 (.09)
-.51 (.16)**
-.07 (.10)
-.20 (.09)*
-.58 (.17)**
-.07 (.10)
.19 (.07)**
.67 (.19)**
.18 (.07)**
.67 (.20)**
.20 (.07)**
.66 (.20)**
-.23 (.12)
-.17 (.19)
-.49 (.13)**
-.22 (.12)
-.16 (.19)
-.49 (.13)**
-.26 (.12)*
-.19 (.20)
-.56 (.13)**
.30 (.09)**
.51 (.25)*
----
.31 (.09)**
.52 (.24)*
----
.28 (.09)**
.53 (.25)*
.02 (.01)**
1.12 (.24)**
-.27 (.17)
--
-.43 (.08)**
-.39 (.08)**
.71 (.14)**
1.01 (.15)**
.98 (.15)**
-2722.8
.03
4096
-2706.4
.03
4096
-2675.7
.04
4096
Referenzkategorie: a) männlich; b) Hauptschulabschluss; c) früher erwerbstätig; d) schwach.
Signifikanz: * p ≤ .05; ** p ≤ .01.
4.4.6 Konsequenzen der zweistufig kumulativen Ausfälle von
Netzpersoneninterviews
Welchen kumulativen Effekt hatten nun die systematischen Unterschiede in den
Ausfallwahrscheinlichkeiten auf die Größe der egozentrierten Netzwerke, für die
selbstberichtete Merkmale der Alteri verfügbar sind und auf die Zusammensetzung
dieser Teilstichprobe der Netzpersonen? In einem ersten Schritt hat sich gezeigt,
dass die durchschnittliche Größe der Egonetzwerke ausgehend von 4,2 Alteri in der
Bruttostichprobe auf 1,8 und damit auf 42,8 Prozent geschrumpft ist. Ein Vergleich
dieser Reduktion der Netzgrößen nach jenen Merkmalen von Ego, die signifikant
mit der Ausfallwahrscheinlichkeit von Netzpersoneninterviews assoziiert waren, hat
42
ZA-Information 56
folgende Resultate erbracht: Für Befragte, die am Interviewzeitpunkt oder noch nie
erwerbstätig waren, lässt sich eine starke Reduktion der für eine Analyse verfügbaren
Netzgrößen um durchschnittlich 2,5 Alteri feststellen. Dieser Wert liegt für früher
erwerbstätige Befragte um 0,3 Netzpersonen und damit um immerhin 12 Prozent
niedriger (vgl. Tabelle 7). Die Bildung der Befragten hat sich dergestalt ausgewirkt,
dass die Verkleinerung der Egonetze mit zunehmender Bildung geringer ausgefallen
ist. Während sich bei Befragten mit Hauptschulabschluss eine durchschnittliche
Reduktion der Netzgröße um 2,5 Alteri feststellen lässt, liegt dieser Wert bei solchen mit Abitur nur bei 2,2 Netzpersonen. Auch diese Extremgruppen unterscheiden sich um 12 Prozent in der Verkleinerung ihrer Egonetzwerke.
Tabelle 7
Einfluss der unterschiedlichen Ausfallursachen auf die Größe der
Netzwerke, für die Eigenangaben der Alteri verfügbar sind
(Unterschiede nach den Merkmalen von Ego)
Gesamtstichprobe der
Alteri (G)
∅ (STD)
Alteri mit Interview (I)
∅ (STD)
Differenz
(G-I)
∅
Erwerbsstatus
- Voll-/Teilzeit erwerbstätig
- Früher erwerbstätig
- Noch nie erwerbstätig
4.2 (1.1)
4.1 (1.1)
3.9 (1.1)
1.7 (1.4)
1.9 (1.4)
1.4 (1.0)
2.5
2.2
2.5
Bildung
- Hauptschulabschluss
- Realschulabschluss
- Fachhochschulreife
- Abitur
4.0
4.1
4.1
4.3
1.5
1.7
1.8
2.1
(1.3)
(1.4)
(1.5)
(1.4)
2.5
2.4
2.3
2.2
Durchschnittliche Netzgröße
4.2 (1.1)
1.8 (1.4)
2.4
Einbezogene Alteri
100.0 %
43.2 %
(1.2)
(1.1)
(1.1)
(1.0)
Wie stark und in welcher Weise haben sich die systematischen Ausfallgründe in
einer Verzerrung der sozialen Zusammensetzung der Netto- im Vergleich zur Bruttostichprobe der Alteri niedergeschlagen? Diese Frage lässt sich durch einen Vergleich der in Tabelle 8 dargestellten Merkmale der Alteri vor und nach dem doppelten
Ausfallprozess beantworten. Es hat sich erstens gezeigt, dass durch die systematischen Ausfälle die ohnehin schon starke Dominanz weiblicher Netzpersonen weiter
zugenommen hat: Der Anteil männlicher Bezugspersonen ist um 4,8 Prozentpunkte
zugunsten der weiblichen Alteri zurückgegangen. Dies ist die Konsequenz der
geringen Bereitschaft der Egos zur Weitergabe der Telefonnummern männlicher
Netzpersonen. Zweitens hat der Ausfallprozess zu einer um 3,6 Prozentpunkte
verringerten Repräsentation von früher erwerbstätigen Alteri in der Stichprobe
geführt. Hiervon haben alle anderen Erwerbsstatusgruppen, am stärksten aber die
ZA-Information 56
43
am Befragungszeitpunkt erwerbstätigen Alteri profitiert (+2,1 Prozentpunkte). Diese
Stichprobenverzerrung geht sowohl auf die selektive Kooperationsbereitschaft von
Ego bei der Herausgabe der Kontaktinformationen wie auch auf die unterschiedliche Teilnahmebereitschaft der Netzpersonen zurück. Hinsichtlich der Zusammensetzung der Alteri nach ihren Bildungsabschlüssen führt der kumulative Ausfallprozess zu einer Unterrepräsentation von Personen mit einem Hauptschulabschluss
(-1,7 Prozentpunkte) und einer starken Reduktion von Alteri, deren Bildungsabschluss die Hauptbefragten nicht nennen wollten oder konnten (-2,5 Prozentpunkte).
Tabelle 8
Einfluss der unterschiedlichen Ausfallursachen auf die soziale Zusammensetzung der Alteri-Stichprobe
Gesamtstichprobe der
Alteri (G)
% (N)
Alteri mit Interview (I)
Differenz
(G-I)
% (N)
Geschlecht
- weiblich
- männlich
Gesamt
77.9 (3189)
22.1 ( 907)
100.0 (4096)
82.7 (1463)
17.3 ( 305)
100.0 (1768)
-4.8
+4.8
Erwerbsstatus
- Voll-/Teilzeit erwerbstätig
- Früher erwerbstätig
- Noch nie erwerbstätig
- Missing
Gesamt
56.5 (2315)
38.8 (1589)
3.3 ( 135)
1.4 ( 57)
100.0 (4096)
54.4 ( 961)
42.4 ( 750)
2.4 ( 42)
0.8 ( 15)
100.0 (1768)
+2.1
-3.6
+0.9
+0.6
Schulbildung
- Hauptschulabschluss
- Realschulabschluss
- Fachhochschulreife
- Abitur
- Missing
Gesamt
29.4 (1205)
29.0 (1186)
5.6 ( 228)
26.9 (1103)
9.1 ( 374)
100.0 (4096)
27.7 ( 490)
31.4 ( 555)
6.6 ( 117)
27.7 ( 489)
6.6 ( 117)
100.0 (1768)
+1.7
-2.4
-1.0
-0.8
+2.5
Beziehungsstärke
- stark
- schwach
Gesamt
73.4 (3006)
26.6 (1090)
100.0 (4096)
78.7 (1391)
21.3 ( 377)
100.0 (1768)
-5.3
+5.3
Einbezogene Alteri
100.0 %
43.2 %
An Gewicht gewinnt dadurch primär die Gruppe der Befragten mit Realschulabschluss (+2,4 Prozentpunkte), die der Fachabiturienten (+1,0 Prozentpunkte) und
der Abiturienten (+0,8 Prozentpunkte). Diese Selektivität nach der Bildung der
Alteri resultiert aus der selektiven Bereitschaft der Hauptbefragten zur Nennung der
Kontaktinformationen und der unterschiedlichen Teilnahmebereitschaft der Alteri.
Obwohl dieser Effekt ausschließlich auf die ungleiche Wahrscheinlichkeit einer
Herausgabe der Telefonnummer der Alteri beruht, lässt sich die stärkste Stichproben-
44
ZA-Information 56
verzerrung nach der Beziehungsstärke zwischen Ego und Alter feststellen. So ist der
Anteil der Bezugspersonen, die Ego beim Namensgenerator von Burt genannt hat
und die somit in einer engen Beziehung zum Hauptbefragten stehen, in der Nettoim Vergleich zur Bruttostichprobe um 5,3 Prozentpunkte angestiegen. Demnach
führt die Stichprobenselektivität zu einer Überrepräsentation von „strong ties“ und
damit zu einer zunehmenden Beschränkung der verfügbaren Daten auf das Primärnetzwerk von Ego.
5
Zusammenfassung und Diskussion
In unserer egozentrierten Netzwerkstudie hat sich ein insgesamt sehr geringes Ausmaß an Item-Nonresponse der Hauptbefragten bei den Proxy-Fragen über die
Merkmale ihrer Bezugspersonen gezeigt. Demnach haben die Befragten durchschnittlich nur 3,3 Prozent der sieben analysierten Fragen unbeantwortet gelassen.
Dieser Anteil variiert allerdings stark nach dem Inhalt der Fragen: Während nur 0,4
Prozent der Befragten keine Angaben über die Kinderzahl der Netzpersonen gemacht haben, beträgt dieser Prozentsatz bei der Frage über die von den Alteri am
idealsten eingeschätzten Schulabschlüsse 8,8 Prozent. Es hat sich auch herausgestellt, dass Fragen über die Einstellungen der Alteri signifikant stärker durch Nonresponse betroffen waren, verglichen mit solchen, die sich auf die stärker sichtbaren
demografischen Merkmale bezogen haben. Auch die Nachbefragung der Netzpersonen konnte mit relativ gutem Erfolg durchgeführt werden. Hierzu mussten zuerst
die Kontaktinformationen erfolgreich bei Ego erfragt und die Alteri dann zu einer
Teilnahme an der Befragung bewegt werden. Obwohl somit eine erfolgreiche Realisierung der Netzpersoneninterviews die gleichzeitige Kooperation von Ego und der
Bezugsperson notwendig gemacht hat, konnte für immerhin 42,8 Prozent aller Bezugspersonen eine Nachbefragung realisiert werden.
Ungeachtet des zufrieden stellenden Erfolges bei beiden Teilen der Netzwerkstudie
hat unsere Analyse gezeigt, dass die dennoch aufgetretenen Ausfälle bei keinem der
Auswahlschritte als zufällig verteilt angesehen werden können. Demnach hat sich
die Bildung von Ego auf die Wahrscheinlichkeit, dass eine Nachbefragung mit den
Bezugspersonen realisiert werden konnte und dessen Erwerbstatus auf diese und die
Vollständigkeit der Proxy-Angaben über die Netzpersonen ausgewirkt. Das Geschlecht, die Bildung und der Erwerbsstatus der Bezugspersonen war dagegen von
Bedeutung dafür, ob mit diesen Personen erfolgreich ein Interview durchgeführt
werden konnte. Nach den Ergebnissen weiterer Analysen haben diese Effekte substantielle Konsequenzen in der Form, dass a) die Größenstruktur der letztendlich
verfügbaren Netzwerke systematisch nach den Ausfallgründen verzerrt sind, und
ZA-Information 56
45
dass b) die soziale Zusammensetzung der für Analysen verfügbaren Nettostichprobe
der Alteri deutlich von der der Bruttostichprobe abweicht.
Es hat sich herausgestellt, dass die Stärke der Beziehung zwischen Ego und Alter
eine besonders wichtige Determinante der Vollständigkeit der Proxy-Angaben und
auch der Möglichkeit einer erfolgreichen Nachbefragung der Netzpersonen ist. In
beiden Fällen können Informationen über die Merkmale der Bezugspersonen mit
höherer Wahrscheinlichkeit erfasst werden, wenn diese in einer engeren Beziehung
zu Ego stehen. Der positive Effekt auf das Ausmaß des Item-Nonresponse bei Proxy-Fragen über die Merkmale der Alteri kann als das Resultat einer in intensiveren
Beziehungen besseren Verfügbarkeit der abgefragten Informationen interpretiert
werden. Die besseren Chancen einer erfolgreichen Nachbefragungen von Netzpersonen mit einer stärken Beziehung zu Ego war dagegen das Ergebnis einer höheren
Bereitschaft der Befragten zur Herausgabe der Kontaktinformationen für diese
Bezugspersonen. Obwohl dies hätte erwartet werden können, haben die Netzpersonen selbst nicht mit höherer Wahrscheinlichkeit an einer Befragung teilgenommen,
wenn sie nach den Angaben von Ego in einer engeren Beziehung zueinander standen. Demnach bewirkt eine engere Beziehung zu Ego entweder tatsächlich keine
stärkere Verpflichtung zu einer Befragungsteilnahme oder die von Ego eingeschätzte Beziehungsqualität entspricht nicht der der Alteri (Schenk et al. 1992). Jedenfalls
bewirkt der Effekt der Beziehungsstärke insgesamt, dass die Stichprobe der Netzpersonen mit vollständigen Proxy-Informationen und die für die Interviewdaten
verfügbar sind, in Richtung auf eine Überrepräsentation von „strong ties“ verzerrt
sind. Vor dem Hintergrund der vorliegenden Ergebnisse kann dann mit einer erfolgreicheren Durchführung egozentrierter Netzwerkstudien gerechnet werden, wenn
das Ziel die Erfassung der Merkmale des Primärnetzwerkes von Ego ist.
Ein weiteres Ergebnis unserer Untersuchung war, dass Befragte, die bei Fragen über
ihre eigene Person häufiger mit „weiß nicht“ geantwortet und öfter eine Antwort auf
diese Fragen verweigert haben, auch stärker zu „weiß nicht“-Antworten bei den
Proxy-Fragen über die Merkmale ihre Bezugspersonen neigten. Diese Neigung war
außerdem signifikant mit der Wahrscheinlichkeit assoziiert, keine Kontaktinformation für die betreffende Netzperson herausgeben zu wollen. Dieses Resultat bestätigt
die Ergebnisse anderer Studien, wonach unterschiedliche Formen von Nonresponse
in substantiellem Ausmaß korreliert sind (Loosveldt et al. 2002; Pickery und Loosveldt 2004). Es kann vermutet werden, dass diese Unterschiede in der generellen
Befragungsbereitschaft durch die Haltung der Befragten zu Umfragen bewirkt werden. Diese Interpretation wird durch Ergebnisse gestützt, wonach die generalisierte
Einstellung zu Umfragen gleichermaßen unterschiedliche Formen des Nonresponse
erklärt: So haben Befragte mit einer positiven und kognitiv stark ausgeprägten
46
ZA-Information 56
Umfrageeinstellung sowohl weniger häufig Fragen mit „weiß nicht“ beantwortet,
wie auch in geringerem Umfang die Beantwortung von Fragen verweigert (Stocké
2005). Eine solche generelle Disposition zu Nonresponse bewirkt in egozentrierten
Netzwerkstudien, dass sich das Problem fehlender Proxy-Angaben und nicht verfügbare Interviewdaten mit den Bezugspersonen in gewissem Umfang auf bestimmte
Hauptbefragte konzentriert.
Proxy-Fragen über die Merkmale von Netzpersonen sind sensible Fragen, weil deren
Beantwortung leicht als Verletzung der Privatsphäre der betreffenden Person aufgefasst werden kann. Entsprechend hatten wir bei diesen Fragen mit einem substantiellen Anteil an Antwortverweigerungen gerechnet. Dieser Anteil, so das Argument, sollte bei weniger „sichtbaren“ Merkmalen wegen der größeren Privatheit
dieser Informationen höher liegen. Diese Befürchtungen wurden in unserer Studie
nicht bestätigt. Im Durchschnitt haben die Befragten bei einem nur sehr geringen
Anteil von 0,1 Prozent der Proxy-Fragen die Antwort verweigert. Auch lag die
Wahrscheinlichkeit von Antwortverweigerungen bei Proxy-Fragen über weniger
„sichtbare“ Einstellungen nicht höher als bei solchen über die weniger privaten
soziodemografischen Merkmale der Netzpersonen. Das geringe und wenig differenzierte Ausmaß an Antwortverweigerungen ist möglicherweise die Konsequenz dessen, dass den Befragten bei der Beantwortung der Proxy-Fragen die Gelegenheit
gegeben wurde, die Netzpersonen nur mit Vornamen oder Pseudonymen zu benennen. Befragte, die die Fragen über Merkmale ihrer Bezugspersonen als Verletzung
deren Privatsphäre angesehen haben, konnten in dieser Weise die Anonymität der
Alteri wahren und so eine Reduktion der von ihnen selbst gefühlten Sensibilität der
Fragen erreichen.
Unsere Ergebnisse über die soziodemografischen Korrelate des Item-Nonresponse
bei Proxy-Fragen und einer erfolgreichen Nachbefragung von Bezugspersonen sind
ein Beitrag zur realistischen Einschätzung der Repräsentativität von Daten egozentrierter Netzwerkstudien. Eine Erklärung der Ursachen der festgestellten Unterschiede im Nonresponse sind sie aber nicht. Es bleibt also die Frage offen, durch welche
theoretisch begründbaren und mit den verschiedenen Sozialgruppen korrelierten
Erklärungsfaktoren die selektiven Ausfallwahrscheinlichkeiten verstehbar rekonstruiert und kausal erklärt werden können.
Eine weitere Frage betrifft die Validität der in unserer Studie zur Bestimmung der
Stichprobenselektivität verwendeten Proxy-Angaben der Hauptbefragten über die
Merkmale der Netzpersonen. Einige Studien haben gezeigt, dass Proxy-Angaben
durch ein beträchtliches Ausmaß an Invalidität betroffen sein können (Dawe und
Knight 1997; White und Watkins 2000). So konnte etwa belegt werden, dass Egos
ZA-Information 56
47
Proxy-Angaben oft systematisch in Richtung auf eine zu hohe Übereinstimmung
der Alteri-Merkmale mit den eigenen verzerrt sind. Allerdings hat sich auch gezeigt,
dass Proxy-Angaben über faktische Merkmale, wie die in unserer Untersuchung
verwendeten, ein relativ hohes Ausmaß an Übereinstimmung mit den realen Merkmalen der Netzpersonen aufweisen (Pappi und Wolf 1984).
Weitere Untersuchungen müssen klären, in welchem Umfang sich unsere Ergebnisse auf die Verhältnisse einer egozentrierten Netzwerkstudie mit einer allgemeinen
Bevölkerungsstichprobe generalisieren lassen. Eine solche Generalisierung ist daher
nicht ohne Weiteres möglich, da unsere Ergebnisse auf Daten mit einer zwar zufällig ausgewählten, aber dennoch regional beschränkten Stichprobe von Grundschuleltern beruhen. In dieser Hinsicht ist möglicherweise auch von Bedeutung, dass das
Thema der Studie „Schule und Bildung“ in unserer Stichprobe auf ein Ausmaß an
Interesse gestoßen ist, das über dem eines durchschnittlichen Befragungsgegenstandes in einer allgemeinen Bevölkerungsstichprobe liegt. Es könnte demnach vermutet werden, dass die vorliegenden Ergebnisse über die Antwortbereitschaft der
Hauptbefragten ein, verglichen mit anderen Stichproben und Befragungsthemen, zu
optimistisches Bild zeichnen.
Literatur
Burt, Ronald S. 1984: Network Items and the General Social Survey. In: Social Networks 6: 293-339.
Crandall, Rick 1976: Validation of Self-Report Measures Using Ratings by Others. In: Sociological Methods
& Research 4: 380-400.
Dawe, Fiona; Knight, Ian 1997: A Study of Proxy Response on the Labor Force Survey. In: Survey Methodology Bulletin 40: 30-36.
Diaz-Bone, Rainer 1997: Ego-zentrierte Netzwerkanalyse und familiale Beziehungssysteme. Wiesbaden:
Deutscher Universitäts-Verlag.
Dickinson, John R.; Kirzner, Eric 1985: Questionnaire Item Omission as a Function of Within-Group
Question Position. In: Journal of Business Research 13: 71-75.
Esser, Hartmut 1986: Über die Teilnahme an Befragungen. In: ZUMA-Nachrichten 18: 38-47.
Ferber, Robert 1966: Item Nonresponse in a Consumer Survey. In: Public Opinion Quarterly 30: 399-415.
Fischer, Claude S. 1982: To Dwell among Friends. Personal Networks in Town and City. Chicago: The
University of Chicago.
Ganter, Stephan 2003: Soziale Netzwerke und interethnische Distanz: Theoretische und empirische Analysen zum Verhältnis von Deutschen und Ausländern. Wiesbaden: Westdeutscher Verlag.
Groves, Robert M.; Singer, Eleanor; Corning, Amy D.; Bowers, Ashley 1999: A Laboratory Approach to
Measuring the Effects on Survey Participation of Interview Length, Incentives, Differential Incentives, and
Refusal Conversion. In: Journal of Official Statistics 15: 251-268.
Huckfeldt, Robert; Morehouse Mendez, Jeannette; Osborn, Tracy 2004: Disagreement, Ambivalence, and
Engagement: The Political Consequences of Heterogeneous Networks. In: Political Psychology 25: 65-95.
48
ZA-Information 56
Jäger, Angela 2004: Forschungsprojekt Ethnische Grenzziehung und soziale Kontexte (II). Methodenbericht:
Mannheimer Zentrum für Europäische Sozialforschung.
Jansen, Dorothea 1999: Einführung in die Netzwerkanalyse: Grundlagen, Methoden, Anwendungen. Opladen: Leske + Budrich.
Koßmann, Ingo 1996: Meinungsbildungsprozesse in egozentrierten Netzwerken. Frankfurt a.M.: Lang.
Laumann, Edward O. 1969: Friends of Urban Men: An Assessment of Accuracy in Reporting Their Socioeconomic Attributes, Mutual Choice, and Attitude Agreement. In: Sociometry 32: 54-69.
Leigh, James H.; Martin jr., Claude R. 1987: “Don’t Know” Item Nonresponse in a Telephone Survey:
Effects of Question Form and Respondent Characteristics. In: Journal of Marketing Research 24: 418-424.
Long, Scott; Freese, Jeremy 2003: Regression Models for Categorical Dependent Variables Using Stata.
College Station: Stata Press.
Loosveldt, Geert; Carton, Ann; Pickery, Jan 1998: The Effect of Interviewer and Respondent Characteristics on Refusals in a Panel Survey. In: Koch, Achim; Porst, Rolf (eds.), Nonresponse in Survey Research.
Mannheim: Zentrum für Umfragen, Methoden und Analysen (ZUMA).
Loosveldt, Geert; Pickery, Jan; Billiet, Jaak 2002: Item Nonresponse as a Predictor of Unit Nonresponse in
a Panel Survey. In: Journal of Official Statistics 18: 545-557.
Lubbers, Miranda J. 2003: Group Composition and Network Structure in School Classes: A Multilevel
Application of the p* Model. In: Social Networks 25: 309-332.
Marsden, Peter V. 1990: Network Data and Measurement. In: Annual Review of Sociology 16: 435-463.
Martin, Jean; Butcher, Bob 1982: The Quality of Proxy Information – Some Results from a Large-scaleStudy. In: The Statistician 31: 293-319.
Pappi, Franz U.; Wolf, Gunter 1984: Wahrnehmung und Realität sozialer Netzwerke. In: Meulemann,
Heiner; Reuband, Karl-Heinz (Hrsg.), Soziale Realität im Interview. Frankfurt: Campus.
Pfenning, Astrid; Pfenning, Uwe; Mohler, Peter Ph. 1991: Zur Reliabilität von egozentrierten Netzwerken
in Massenumfragen. In: ZUMA-Nachrichten 28: 92-108.
Pickery, Jan; Loosveldt, Geert 1998: The Impact of Respondent and Interviewer Characteristics on the
Number of "No Opinion" Answers: A Multilevel Model for Count Data. In: Quality & Quantity 32: 31-45.
Pickery, Jan; Loosveldt, Geert 2004: A Simultaneous Analysis of Interviewer Effects on Various Data Quality
Indicators with Identification of Exceptional Interviewers. In: Journal of Official Statistics 20: 77-89.
Schenk, Michael (Hrsg.) 1995: Soziale Netzwerke und Massenmedien. Tübingen: J.C.B.Mohr.
Schenk, Michael; Mohler, Peter Ph.; Pfenning, Uwe; Ell, Renate 1992: Egozentrierte Netzwerke in der
Forschungspraxis: Ausschöpfungsquoten und Validität soziodemographischer Variablen. In: ZUMANachrichten 31: 87-120.
Schmitt-Beck, Rüdiger; Koßmann, Ingo 1994: Cross-National Election Project (CNEP): West German and
East German Surveys - Study Design, Data Description, Field Report. Mannheim: Mannheimer Zentrum für
Europäische Sozialforschung.
Schnell, Rainer 1997: Nonresponse in Bevölkerungsumfragen: Ausmaß, Entwicklung und Ursachen. Opladen: Leske + Budrich.
Shoemaker, Pamela J.; Eichholz, Martin; Skewes, Elizabeth A. 2002: Item Nonresponse: Distinguishing
between Don’t Know and Refuse. In: International Journal of Public Opinion Research 14: 193-201.
Singer, Eleanor; van Hoewyk, John; Maher, Mary P. 2000: Experiments with Incentives for Survey
Participation in Telephone Surveys. In: Public Opinion Quarterly 64: 171-188.
ZA-Information 56
49
STATA Corporation 1999: STATA. Reference Manual. Release 6. (Vol. 3). College Station: Stata Press.
Stocké, Volker 2005: Attitudes toward Surveys, Attitude Accessibility and the Effect on Respondents’ Susceptibility to Nonresponse. Quality & Quantity (im Druck).
Tourangeau, Roger; Rasinski, Kenneth A. 1988: Cognitive Processes Underlying Context Effects in Attitude Measurement. In: Psychological Bulletin 103: 299-314.
van der Poel, Mart 1993: Personal Networks: A Rational-Choice Explanation of Their Size and Composition. Lisse: Swets & Zeitlinger.
van Duijn, Marijtje A.J.; Zeggelink, Evelien P.H.; Huisman, Mark; Stokman, Frans N.; Wasseur, Frans W.
2003: Evolution of Sociology Freshmen into a Friendship Network . In: Journal of Mathematical Sociology
27: 153-191.
Völker, Beate; Flap, Henk 2001: Weak Ties as a Liability: The Case of East Germany. In: Rationality and
Society 13: 397-428.
White, Kevin; Watkins, Susan C. 2000: Accuracy, Stability and Reciprocity in Informal Conversational
Networks in Rural Kenya. In: Social Networks 22: 337-355.
Anhang
Tabelle 9
Soziodemografische Merkmale der Elternstichprobe
% (N)
Geschlecht
- weiblich
- männlich
Gesamt
92.9 (915)
7.1 ( 70)
100.0 (985)
Bildung
- Hauptschulabschluss
- Realschulabschluss
- Fachhochschulreife
- Abitur
Gesamt
19.8 (195)
41.7 (411)
7.7 ( 76)
30.8 (303)
100.0 (985)
Erwerbsstatus
- Voll-/Teilzeit erwerbstätig
- Früher erwerbstätig
- Noch nie erwerbstätig
Gesamt
54.3 (535)
44.1 (434)
1.6 ( 16)
100.0 (985)
Beruflicher Status
- Arbeiter
- Angestellte
- Beamte
- Selbstständige
- Andere
Gesamt
6.7 ( 66)
75.8 (747)
5.6 ( 55)
9.5 ( 94)
2.3 ( 23)
100.0 (985)
Lebensalter (Jahre)
∅ (STD)
39.0 (5.01)
50
ZA-Information 56
Persönliche Codes bei Längsschnittstudien:
Ein Erfahrungsbericht
von Andreas Pöge 1
Zusammenfassung
Anhand der Münsteraner Längsschnittdaten des DFG-Projektes „Jugendkriminalität
in der modernen Stadt“ wird die Fragebogenzuordnung zwischen den Erhebungswellen mit Hilfe eines Verfahrens über persönliche Codes dargestellt und dessen
Auswirkungen geschildert. Solch ein Verfahren ist im Hinblick auf Fehleranfälligkeit und Uneindeutigkeit der Codes und einer Verzerrung der daraus resultierenden
Paneldaten nicht unproblematisch. Trotz dieser Probleme ist bei der gewählten
Erhebungsmethode, Schülerinterviews im Klassenverband, und der besonderen
Berücksichtigung datenschutzrelevanter Belange das genannte Verfahren alternativlos.
Abstract
On the basis of longitudinal data taken from the DFG project “Juvenile delinquency
in modern town” the assignment of questionnaires between the survey waves by
means of personal codes is described and the effects are analysed. Such a method is
problematic because the codes tend to be ambiguous, prone to errors and the resulting panel data is biased. Despite these problems there is no alternative to the
chosen method of assignment with regard to the survey method (interviews with
pupils in their classrooms) and in consideration of data protection.
1 Andreas Pöge, M.A., Universität Trier, ist Wissenschaftlicher Mitarbeiter des DFG-Projektes
„Jugendkriminalität in der modernen Stadt“. Universität Trier, FB IV – Soziologie, Universitätsring 15, 54286 Trier und Westfälische Wilhelms-Universität Münster, Institut für Kriminalwissenschaften, Abteilung IV – Kriminologie, Bispinghof 24/25, 48143 Münster.
E-Mail: [email protected].
ZA-Information 56
1
51
Einleitung
Längsschnitt- bzw. Paneluntersuchungen in der Umfrageforschung bringen zwangsläufig das Problem der Verbindung von Daten aus mehreren Erhebungswellen mit
sich. Oftmals werden hierbei die Umfrageinformationen mit schon bekannten oder
gleichzeitig erhobenen Adressdaten oder anderen datenschutzrechtlich sensiblen
Informationen zusammengespielt, um über diese persönlichen Daten die gewünschten
Zuordnungen über die Zeit gewährleisten zu können. Anonymität kann bei einem
solchen Verfahren meist - mit oftmals negativen Auswirkungen auf die Rücklaufquoten - nicht gewährleistet werden. Im Zuge der nachfolgend näher vorgestellten
DFG-geförderten Panelstudie „Jugendkriminalität in der modernen Stadt“2 wurden
Jugendliche im Alter von 13 bis 17 Jahren zu Opferwerdung, selbstberichteter
Delinquenz sowie verschiedensten Bereichen des täglichen Lebens befragt. Die Befragungen fanden als schriftliche Fragebogeninterviews im Klassenverband in
einjährigem Rhythmus in den Städten Münster und Duisburg statt. Angesichts des
geringen Alters der Probanden sollten datenschutzrelevante Belange besonders
sorgfältig beachtet werden. Möglicherweise wären nicht alle Personen in der Lage,
ihre eigenen Interessen zu erkennen und zu vertreten. Außerdem wollte man besondere datenschutz-psychologische Vorsicht walten lassen, um die Stichprobenrückläufe (auch im Hinblick auf die nötige Zustimmung der Erziehungsberechtigten)
nicht zu gefährden. Mit der Landesbeauftragten für Datenschutz und Informationsfreiheit Nordrhein-Westfalen wurde deshalb ein Verfahren vereinbart, mit welchem
unter Zuhilfenahme von persönlichen Codes ein Zusammenspielen der Daten aus
den einzelnen Erhebungswellen, bei Anonymität der Probanden, ermöglicht werden
sollte. Dieser Bericht stellt das geplante Zuordnungsverfahren vor und dokumentiert
dabei aufgetretene Probleme und deren Lösungsstrategien.
2
Das Projekt „Jugendkriminalität in der modernen Stadt“
Die Ziele des DFG-Projektes „Jugendkriminalität in der modernen Stadt“ liegen
unter anderem in der Untersuchung der Entstehung und Entwicklung delinquenter
bzw. devianter Handlungsstile bei Jugendlichen und deren sozialer Kontrolle (und
zwar formeller Art durch Polizei und Justiz und informeller Art durch Schule und
Familie).3
2 Projektleitung: Prof. Dr. Klaus Boers, Institut für Kriminalwissenschaften, WWU Münster und
Prof. Dr. Jost Reinecke, Fakultät für Soziologie, Universität Bielefeld, DFG-Förderzeichen: Bo
1234/6-1, 6-2 und Re 832/4-1, 4-2.
3
Zu ersten Ergebnissen siehe Boers, Reinecke, Wittenberg und Motzke (2002).
52
ZA-Information 56
Abbildung 1
Erhebungsdesign 2000-2004
Jahrgang
11
Münster
Duisburg
10
9
Münster
Münster
Duisburg
Duisburg
8
7
Duisburg
Münster
Münster
Duisburg
Münster
2000
2001
2002
2003
2004
Jahr
Untersucht werden unter anderem die dynamischen Zusammenhänge zwischen
Sozialstruktur und Delinquenz, sowie die Art der Moderierung von Selektionsprozessen formeller Kontrollinstanzen über die Jugendphase hinweg. Insbesondere
wird hierbei den Fragen nachgegangen, ob und inwieweit Delinquenz episodaler
Teil der Dynamik jugendlicher Milieus4 ist oder ob und inwieweit sich Delinquenz
in der institutionellen Eigendynamik selektiver Kontrollprozesse zu kriminellen
Karrieren verdichtet.
Der methodische Zugang zu diesen Problemkomplexen erforderte ein für diesen
theoretischen und inhaltlichen Kontext in Deutschland zum ersten Mal geplantes
kohortenspezifisches Längsschnittdesign, das in zwei westdeutschen Städten unterschiedlicher Größe und Sozialstruktur, Münster und Duisburg, umgesetzt wurde.
Die durch wiederholte Schülerbefragungen erhobenen Längsschnittinformationen
(Paneldaten) sollen sowohl die Analyse von Ursache-Wirkungsbeziehungen zwischen den zentralen Untersuchungsvariablen (einschließlich möglicher Rückkopplungsprozesse) als auch die Analyse von Stabilität und Veränderung der individuellen
Kriminalitätsraten ermöglichen.
4
Zu ersten Ergebnisse siehe Boers und Pöge (2003).
ZA-Information 56
53
Seit dem Jahr 2000 wurden in einjährigen Abständen an Münsteraner5, seit dem
Jahr 2002 auch an Duisburger Schulen Fragebogeninterviews durchgeführt. Entsprechend der methodischen Konzeption des Forschungsprojektes als Panelstudie,
wurden dabei dieselben Personen wiederholt befragt. Der genaue Erhebungsplan
kann Abbildung 1 entnommen werden.6
2.1 Durchführung der Befragungen
Aus Gründen des Umfangs und der bisher zur Verfügung stehenden Daten (erste
Erhebung Münster im Jahr 2000, erste Erhebung Duisburg im Jahr 2002) wird im
Folgenden nur auf die Münsteraner Daten eingegangen.
In der ersten Münsteraner Schülerbefragung im Jahr 2000 wurde eine Vollerhebung
der Schülerinnen und Schüler der Jahrgangsstufe 7 angestrebt. Ergänzt wurde die
Studie durch Stichproben aus den Klassen des 9. und 11. Jahrgangs sowie den Eingangsklassen an den Münsteraner Berufskollegs.7 Die zweite Schülerbefragung im
Jahr 2001 strebte eine Wiederbefragung der Schülerinnen und Schüler aus der
ersten Studie an. Alle Schülerinnen und Schüler der Jahrgangsstufe 8, die Schulen
besuchten, die an der ersten Erhebung teilgenommen hatten, sollten erneut wiederbefragt werden.8 Der geschilderten Erhebungssystematik folgend sollten in der
dritten und vierten Schülerbefragung im Jahr 20029 und 200310 alle Schülerinnen
und Schüler der Jahrgangsstufe 9 bzw. 10, die eine Schule besuchten, die an den
ersten beiden Erhebungen teilgenommen hatte, wiederbefragt werden. Der eingesetzte Fragebogen zu Opferwerdung, selbstberichteter Delinquenz, Ethnizität11,
Erziehungsstilen12, Konfliktverhalten, Kriminalitätseinstellungen13 sowie zu Lebens-, Freizeit- und Konsumstilen war für eine schriftliche, anonyme Befragung der
Schülerinnen und Schüler konzipiert. So weit wie möglich wurden Fragen verwendet, die bereits in anderen Jugendstudien eingesetzt wurden. Die Fragebögen der
5 Zu ersten Ergebnissen siehe Boers und Kurz (2000).
6 Zur Dokumentation der Münsteraner Panel-Studie 2000-2003 vgl. Pöge (2005b).
7 Zur Dokumentation der Münsteraner Studie aus dem Jahr 2000 vgl. Motzke und Wittenberg
(2004).
8 Zur Dokumentation der Münsteraner Studie aus dem Jahr 2001 vgl. Wittenberg (2004a).
9 Zur Dokumentation der Studie aus dem Jahr 2002 vgl. Wittenberg (2004b).
10 Zur Dokumentation der Studie aus dem Jahr 2003 vgl. Wittenberg (2004c).
11 Zu ersten Ergebnissen siehe Pöge (2005a).
12 Zu ersten Ergebnissen siehe Raithel (2002).
13 Zu ersten Ergebnissen siehe Pöge (2002).
54
ZA-Information 56
einzelnen Jahre sind aufgrund des Panelansatzes der Studie weitgehend identisch.14
Vor den jeweiligen Haupterhebungen wurden die Eltern und Schüler über die Untersuchungsziele informiert und auf die Freiwilligkeit der Teilnahme hingewiesen.
Die schriftlichen Befragungen fanden im Klassenverband statt, der zeitliche Rahmen erstreckte sich über eine Schuldoppelstunde. In wenigen Einzelfällen kam es
jedoch vor, dass die Beantwortung der Fragen mehr Zeit in Anspruch nahm, insbesondere wenn sprachliche Schwierigkeiten die Beantwortung beeinträchtigten.
2.2 Datengrundlage der Querschnitte
Einige grundlegende Informationen der Münsteraner Querschnitts-Datengrundlage
können Tabelle 1 entnommen werden. Die Stichprobengröße der einzelnen Querschnitte liegt zwischen 1.819 und 1.949 Personen. Grundlage hierfür sind Schülerinnen und Schüler, die Schulen besuchten, welche den Befragungen in jedem Zeitpunkt zugestimmt hatten. Unberücksichtigt blieben Fälle, deren Fragebögen Plausibilitätskontrollen nicht standhielten. Um den Rücklauf bestimmen zu können, wurde
die Schulstatistik herangezogen, wiederum Bezug nehmend auf die Schulen, die in
jedem Befragungszeitpunkt an der Umfrage teilnahmen. Die sich hieraus ergebenden Quoten liegen, wie in Tabelle 1 ersichtlich, zwischen 86 und 88 Prozent, sind
also als sehr gut zu bezeichnen.
Tabelle 1
Zusammenfassung der Befragungen in Münster 2000-2003
Münster Münster Münster Münster
2000 (t1) 2001 (t2) 2002 (t3) 2003 (t4)
Jahrgang
7
8
9
10
Schulstatistik (N)
2.105
2.181
2.251
2.077
Stichprobe (N)
1.850
1.915
1.947
1.819
Rücklaufquote (%)
88
88
86
88
Geschlecht (Stichprobe)
Anteil Mädchen (%)
49
50
51
50
Anteil Jungen (%)
51
50
49
50
Alter (Stichprobe)
Durchschnittsalter in Jahren
13
14
15
16
14 Muster der verwendeten Fragebögen können über den Autor bezogen werden.
ZA-Information 56
3
55
Geplante Fragebogenzuordung mit persönlichen Codes
Um eine Zuordnung der Fragebögen aus den verschiedenen Erhebungswellen zu
ermöglichen, wurden über Codeblätter abgefragte Codes verwendet. In jeder Erhebungswelle wurden solche Codeblätter den Schülerinnen und Schülern zum Ausfüllen vorgelegt, so dass bei einem stabilen Antwortverhalten der Schüler, die Codeblätter, die von ein und derselben Person in den verschiedenen Wellen ausgefüllt
wurden, denselben Code aufweisen mussten (siehe Abbildung 2). Im Einzelnen
waren die geplanten Schritte wie folgt: Während der Befragung im Klassenverband
füllen die Schülerinnen und Schüler zunächst die Codeblätter und die Fragebögen
sorgfältig aus. Auf einem Codeblatt und einem Fragebogen, die dieselbe Person
ausfüllt, befindet sich dieselbe Nummer. Die Codeblätter und Fragebögen werden
getrennt voneinander in Briefumschläge gesteckt, verschlossen und abgegeben. Codeblätter und Fragebögen gehen getrennt voneinander in die Datenerfassung, das
einzige Verbindeglied stellt die Nummer auf Codeblatt und Fragebogen dar. Daraufhin werden Codeblätter und die Original-Fragebögen vernichtet. Die persönlichen Codes können dann mit den Fragebogendaten anhand der Codeblatt- bzw.
Fragebogennummer zusammengespielt werden. Dieses Procedere sollte in jeder
Erhebungswelle wiederholt werden, wodurch die Fragebogendaten über den Code
einander zugeordnet werden könnten, ohne dass jemals ursprüngliche Informationen
aus den Codeblatt-Fragen mit Informationen aus den Fragebögen zusammengeführt
werden müssten. Dieses Verfahren sollte somit die völlige Anonymität der befragten Personen gewährleisten. Die persönlichen Fragen, die auf den Codeblättern gestellt wurden, betrafen die Privatsphäre der Befragten und deren Familien und
mussten mit dem Datenschutz abgestimmt werden.
Während der ersten Befragung im Jahr 2000 sollte auf den Codeblättern15 hierbei
Folgendes handschriftlich notiert werden:
1.
Der letzte Buchstabe der natürlichen Haarfarbe des Vaters
2.
Der erste Buchstabe des Vornamens der Oma mütterlicherseits
3.
Der letzte Buchstabe der eigenen natürlichen Haarfarbe
4.
Die beiden Tagesziffern des eigenen Geburtstages
5.
Der letzte Buchstabe der eigenen Augenfarbe
15 Muster der verwendeten Codeblätter können über den Autor bezogen werden.
56
Abbildung 2
ZA-Information 56
Geplantes Zuordnungsverfahren in Münster 2000/2001
Im Jahr 2001 wurde das Codeblatt um die Fragen nach Klassenwechsel und Schulwechsel ergänzt, hierbei konnte eine Antwortvorgabe angekreuzt werden. Für die
Befragung in 2002 wurde das Codeblatt um die Frage nach einer Befragungsteilnahme im vorigen Jahr erweitert. In 2003 wurde das Layout grundlegend geändert,
so dass kein handschriftliches Ausfüllen mehr erfolgen musste, sondern alle Antwortvorgaben zum Ankreuzen aufgeführt wurden. Außerdem wurde eine weitere
Frage aufgenommen, nämlich die nach dem ersten Buchstaben des eigenen Vornamens.16 Darüber hinaus wurde die Frage nach einem Klassenwechsel zum besseren
Verständnis umformuliert.
Das geschilderte Verfahren mit diesen Fragen konnte nur unter zwei Grundvoraussetzungen funktionieren. Als erste Grundvoraussetzung mussten die Befragungsteilnehmerinnen und -teilnehmer in den unterschiedlichen Wellen exakt denselben
Code aufweisen, da die Zuordnung über den gesamten Code erfolgen sollte. Dies
bedeutete insbesondere, dass die Codefragen auf den Codeblättern der Befragungsjahre von den Probanden exakt gleich beantwortet werden mussten. Ergäben sich
16 Diese Frage blieb jedoch ohne Bedeutung, da in Münster auf eine weitere Befragungswelle verzichtet wurde.
ZA-Information 56
57
Differenzen im Antwortmuster ein und derselben Person bei den Codefragen der
unterschiedlichen Jahre, könnte eine Zuordnung in der geplanten Art und Weise
(über den kompletten Code) nicht mehr stattfinden! Als zweite Grundvoraussetzung
musste gewährleistet sein, dass jede Person einen eindeutigen Code aufwies. Hätten
mehrere Personen denselben Code, könnte eine Zuordnung in der geplanten Art und
Weise (ohne Hinzunahme weiterer Informationen) nicht mehr stattfinden!
3.1 Durchführung des Verfahrens
Bei der technischen Durchführung der Zuordnungen der Fragebögen aus den einzelnen Wellen traten Probleme auf, die die Grundvoraussetzungen des Verfahrens
verletzten und Änderungen notwendig machten. Eine Analyse der Daten, die über
die ausgefüllten Codeblätter zur Verfügung stehen, lässt in Bezug auf die gebildeten
Codes erkennen, dass in jeder Welle nicht jede Schülerin und jeder Schüler einen
eindeutigen (d. h. nur einmal vorkommenden) Code aufweist. Wie in Tabelle 2 ersichtlich, treten in jeder der vier Erhebungswellen jeweils nur bei ungefähr drei
Vierteln der Probanden eindeutige Codes auf (z. B. gibt es in 2000 nur 1.497 einmal
vorkommende Codes). Bei einem Viertel der Befragten weisen unterschiedliche
Personen einen gleichen Code auf (in 2001 trat sogar ein Code sechs Mal auf). Diese Personen sind über den Code ohne Hinzunahme weiterer Informationen nicht
eindeutig zu identifizieren. Im Folgenden soll dieses Problem als Problem der Identifizierung bezeichnet werden. Wählt man aus jeder Welle nur die eindeutigen Codes aus und ordnet zwischen den Wellen diese Codes einander zu, so finden sich
zwischen jeweils zwei Erhebungszeitpunkten lediglich rund 600 Zuordnungen mit
exakt gleichem Code (für t3/t4 siehe Tabelle 5). Man kann also davon ausgehen, dass
gleiche Personen in unterschiedlichen Wellen nicht denselben Code aufweisen. Die
Hauptursache hierfür liegt darin, dass die Schülerinnen und Schüler den Code nicht
exakt in jeder Welle reproduzieren konnten. Dieses Problem soll im Folgenden als
Problem der Reproduktion bezeichnet werden. Die Grundprobleme des Verfahrens
sind also:
ƒ
Mehrfaches Auftreten gleicher Codes innerhalb der Wellen (Identifizierung)
ƒ
Zu geringes Auftreten gleicher Codes zwischen den Wellen (Reproduktion)
Die oben aufgeführten zwei Grundvoraussetzungen des geplanten Verfahrens sind
offensichtlich (und schwerwiegend) verletzt. Nachfolgend werden die Ursachen für
die aufgetretenen Probleme analysiert und die schließlich angewendete Problemlösestrategie erläutert.
58
ZA-Information 56
Tabelle 2
Häufigkeiten der Codes
2000 (t1)
2001 (t2)
2002 (t3)
Häufigkeit
Anz.
Codes
1
1.497
1.497
1.538
1.538
1.533
2
208
416
161
322
3
28
84
21
4
3
12
5
1
6
Summea
Gesamt
Gesamt
2003 (t4)
Anz.
Codes
Gesamt
1.533
1.449
1.449
176
352
151
302
63
24
72
21
63
1
4
6
24
4
16
5
-
-
1
5
1
5
-
-
1
6
-
-
-
-
1.737
2.014
1.722
1.933
1.740
1.986
1.626
1.835
Anz.
Codes
Anz.
Codes
Gesamt
a Die Anzahlen für die Codeblätter können von den Stichprobengrößen abweichen. Zum einen wurden die Codeblätter von Schulen, die nicht an allen Befragungszeitpunkten teilnahmen, zum anderen Codeblätter deren Fragebögen durch die Plausibilitätskontrollen fielen,
verwendet.
3.2 Probleme der Zuordnungsmethode
Die Ursachen für die aufgetretenen Zuordnungsprobleme der Identifizierung und
Reproduktion sind unterschiedlicher Art und überlappen sich teilweise. Zusammenfassend lassen sich folgende Hauptursachen ausmachen:
ƒ
Datenschutzbedingte Vorgaben, die das Ausfüllen der Codeblätter durch komplizierte Fragestellungen erschwerten
ƒ
Zu hohe Schwierigkeit der Codefragen, die eine Reproduzierbarkeit erschwerte
ƒ
Ungünstige Auswahl der Fragen bzw. Antwort-Buchstaben, die eine eindeutige Identifizierung der Codes verhinderte
ƒ
Mangelnde Reproduktion der Codes durch die Schüler aufgrund von Flüchtigkeitsfehlern oder beabsichtigten Falschangaben beim Ausfüllen der Codeblätter
ƒ
Layoutmängel und dadurch unleserliches Ausfüllen der Codeblätter
ZA-Information 56
59
Datenschutzvorgaben
Durch die nötige Abstimmung mit dem Datenschutz musste bei der Fragengestaltung Rücksicht genommen werden. Dies resultierte in einem Kompromiss dergestalt, dass nicht bei den Antworten auf jede Frage (wie ursprünglich geplant) die
ersten Buchstaben notiert werden konnten, sondern zum Teil die jeweils letzten. Die
Begründung hierfür lag in der Befürchtung, dass, falls die im Klassenverband ausgefüllten Codeblätter in die Hände von Personen mit genügend Information über die
Schülerinnen und Schüler fielen, diese zu identifizieren wären. Dann hätten die datenschutzrelevanten Informationen aus den Fragebögen im ungünstigsten Fall von
unbefugten Personen den einzelnen Schülerinnen und Schülern zugeordnet werden
können und diesen hieraus Nachteile entstehen können. Der Wechsel von „erster
Buchstabe…“ und „letzter Buchstabe…“ scheint jedoch möglicherweise für die ausfüllenden Personen zu unübersichtlich gewesen zu sein.
Zu hohe Schwierigkeit der Codefragen
Da ein erheblicher Teil der Schülerinnen und Schüler nicht in der Lage war, das
Codeblatt in beiden Jahren richtig oder zumindest gleich auszufüllen, muss die Frage gestellt werden, ob die Codefragen zu schwierig waren. Möglicherweise waren
nicht alle Schülerinnen und Schüler der vier befragten Jahrgangsstufen in der Lage,
die oben genannten Fragen richtig zu beantworten oder sich bei der Beantwortung
genügend zu konzentrieren. Zwar waren einige Fragen schwieriger zu beantworten,
z. B. Haarfarbe des Vaters oder Vorname der Oma mütterlicherseits, falls persönliche
Gründe die Beantwortung schwierig oder unmöglich machten (z. B. beim Fehlen
einer solchen Bezugsperson). Jedoch waren die Interviewerinnen und Interviewer
diesbezüglichen angewiesen worden, die problematischen Fälle vor dem Ausfüllen
anzusprechen bzw. in diesen Fällen Antwortvorgaben zu nennen.
Ungünstige Auswahl und Anzahl an Fragen für die Identifizierung
Neben der Tatsache, dass Codes, die in beiden Jahren gleich sein müssten, unterschiedlich sind, ist das Auftreten von Mehrfachcodes das gewichtigste Problem.
Offensichtlich eignet sich der Code, so wie er konzipiert ist, nicht dazu, die ca.
2.000 Umfrageteilnehmerinnen und -teilnehmer eindeutig zu bestimmen. Dieser
Code setzt sich, wie oben erläutert, aus Buchstaben bzw. Zahlen zusammen, die aus
den Antworten der fünf Codefragen hervorgehen. Die Anzahl der Kombinationsmöglichkeiten, die sich aus diesen Zahlen und Buchstaben ergeben, ist nicht zahlreich genug, als dass mit genügender Wahrscheinlichkeit jede Schülerin und jeder
60
ZA-Information 56
Schüler einen einzigartigen Code erhält.17 Um eine Identifizierung der Codeblätter
bzw. Fragebögen schon in einer Welle zu ermöglichen, müssen zusätzliche Informationen hinzugezogen werden. Eine Lösung für dieses Problem kann nur in der
Modifizierung der Fragen bestehen, so dass eine höhere Anzahl von Antwortbuchstaben bzw. -zahlen erreicht wird, oder in der Erhöhung der Anzahl der Codevariablen bzw. -fragen selbst. Eine Änderung der Fragen hätte den großen Nachteil, dass
der Code über die Zeit dann nicht mehr derselbe sein kann, also Bögen aus späteren
Wellen nicht mehr über den Code zugeordnet werden könnten. Eine Erhöhung der
Anzahl der Codevariablen hat den Nachteil, dass dadurch natürlich auch die Fehleranfälligkeit des Codes weiter steigen und somit das Problem der Reproduktion eher
verschärft würde.
Beabsichtigte Falschangaben und Flüchtigkeitsfehler
Bei der Beantwortung der einzelnen Fragen auf dem Codeblatt können selbstverständlich sowohl beabsichtigte wie unbeabsichtigte Fehler auftreten, so dass der
Code ein und desselben Schülers oder derselben Schülerin aus zwei Jahren unterschiedlich sein kann, obwohl er gleich sein müsste. Grundsätzlich kann dieses Problem
bei jeder Frage auftreten, absichtliche Falschangaben können nicht vermieden werden,
jedoch sollten leicht und eindeutig zu beantwortende Fragen unbeabsichtigte Fehler
vermeiden helfen.
Layoutmängel und dadurch unleserliches Ausfüllen der Codeblätter
Ein nicht vom Forschungsteam direkt beeinflussbares Problem, welches in diesem
Ausmaß nicht zu erwarten war, ist das zum Teil unleserliche Ausfüllen der Codeblätter. Dies führte dazu, dass in einer Reihe von Fällen die Codes nicht eindeutig
zu entziffern waren, somit nicht oder nur eingeschränkt für die EDV zur Verfügung
standen und deshalb zu fehlerhaften bzw. keinen Zuordnungen führten. Eine Lösung
dieses Problems ist für die Datensätze 2000, 2001 und 2002 nicht möglich, jedoch
17 Allgemein kann hierzu folgendes Problem formuliert werden: Bei einem Zufallsexperiment mit
„Zurücklegen“ wird aus einer Menge der Größe N von unterschiedlichen Codes eine bestimmte
Anzahl m von Codes gezogen. Die Frage ist nun, wie groß die Codemenge sein muss, damit die
Wahrscheinlichkeit P(N,m), dass kein Code mehrfach gezogen wird, mindestens einen bestimmten Wert, z. B. 0,95, übersteigt. Eine allgemeine, näherungsweise Lösung lautet:
N (m) ≈ 9,74 x 2 − 9,4 x + 1,1 .
(1)
In unserem Fall, bei ca. 2.000 zu identifizierenden Personen lautet die Lösung näherungsweise
39 Millionen. Die Codemenge N ergibt sich aus der Multiplikation der Merkmalsausprägungen
der einzelnen Codestellen. Im vorliegenden Fall reicht die Anzahl der Ausprägungen nicht aus,
um die erforderliche Größe der Codemenge N zu erreichen (Zur Herleitung vgl. Pöge 2005b, S.
63.)
ZA-Information 56
61
wurde das Codeblattlayout dergestalt geändert, dass in der Erhebungswelle 2003
kein handschriftliches Ausfüllen mehr nötig war, sondern nur noch Antwortvorgaben angekreuzt werden mussten. Ein solches Layout mit vorgegebenen Antwortkästchen, die nur angekreuzt werden müssen, erwies sich als sehr viel vorteilhafter.
Zwar verschlechterte sich dadurch die Übersichtlichkeit des Codeblattes leicht, jedoch wiegt der Vorteil der besseren Lesbarkeit dieses Problem wieder auf.
4
Zuordnungsverfahren mit manuellem Handschriftenvergleich
Wie oben aufgezeigt, hätte das ursprünglich geplante Verfahren nur zu einer Zuordnung von rund 600 Personen geführt (für t3/t4 siehe Tabelle 5). Beide Grundvoraussetzungen des Verfahrens sind nicht ausreichend gewährleistet, um eine Zuordnung
eines befriedigend großen Teils der Probanden zu ermöglichen. Um weitere Zuordnungen realisieren zu können, musste das ursprüngliche Zuordnungsverfahren
abgeändert werden. Das Problem der Identifizierung erforderte die Hinzunahme
weiterer Informationen zum Code, das Problem der Reproduktion erforderte das
Zuordnen von Personen über „fehlerhafte“ Codes. Nur so konnten weitere Zuordnungen gefunden werden. Um Fehler im Code zulassen zu können, musste auf eine
Zuordnung über die Codes als komplette Zeichen-Zahlenkette verzichtet werden.
Bei der Identifizierung sowohl der einzelnen Codes, als auch bei deren Zuordnung
zwischen den Wellen wurden darüber hinaus die Schulinformation18 und das Geschlecht der Probanden hinzugenommen. Das schließlich angewendete, fehlertolerante Verfahren mit manuellem Handschriftenvergleich bestand aus drei Schritten:
In einem ersten Schritt wurden maschinell alle exakt übereinstimmenden Codes aus
zwei Erhebungswellen herausgefunden. Die zusammengehörigen Fragebögen und
Codeblätter wurden daraufhin einer manuellen Handschriftenkontrolle unterzogen,
wobei die offensichtlich nicht passenden Zuordnungen aussortiert wurden. Die passenden Fragebogennummern wurden aus dem Datensatz genommen, so dass sie für
die nachfolgenden Schritte nicht mehr zur Verfügung standen. Im zweiten Schritt
wurde nach Codeübereinstimmungen unter Zulassung eines Fehlers und im dritten
Schritt unter Zulassung von zwei Fehlern gesucht und die zugehörigen Bogennummern herausgeschrieben. Auch in diesen beiden Schritten wurden als Validierung
der Zuordnungen Handschriftenvergleiche durchgeführt, die offensichtlich nicht
passenden Zuordnungen verworfen und vor der Durchführung des nächsten Schrittes
18 Die Hinzunahme der Schulinformation war beim ursprünglichen Verfahren für die Identifizierung einkalkuliert worden; in diesen Ausführungen wurde auf eine Darstellung bewusst verzichtet, um die beschränkte Leistungsfähigkeit des Codes stärker zu betonen.
62
ZA-Information 56
die passenden Nummern aus dem Datensatz entfernt. Das geschilderte Verfahren ist
codegeleitet und hierarchisch. Zum einen ist das erste Kriterium für eine Zuordnung
nach wie vor der Code, es wurden nur offensichtliche Fehlzuordnungen ausgesondert, zum anderen wird durch die schrittweise Durchführung gewährleistet, dass
weniger Fehler im Code bei der Zuordnung bevorzugt werden.
4.1 Realisierte Paneldatensätze Münster 2000-2003
Mit Hilfe des oben beschriebenen Zuordnungsverfahrens mit manuellem Handschriftenvergleich konnten die in Tabelle 3 aufgeführten Datensatzgrößen erreicht
werden. So war es möglich, in den Daten aus jeweils zwei aufeinander folgenden
Erhebungszeitpunkten zwischen ca. 1.270 und ca. 1.400 Zuordnungen zu finden.
Für drei aufeinander folgende Erhebungspunkte ergaben sich 997 bzw. 1.075 und
für alle vier Zeitpunkte 813 Zuordnungen.
Tabelle 3
Datensatz
Paneldatensätze Münster 2000-2003
N
Beschreibung
Pt1,t2
1.271 Zwei-Wellen-Panel Münster 2000/2001
Pt2,t3
1.373 Zwei-Wellen-Panel Münster 2001/2002
Pt3,t4
1.406 Zwei-Wellen-Panel Münster 2002/2003
Pt1,t2,t3
997 Drei-Wellen-Panel Münster 2000/2001/2002
Pt2,t3,t4
1.075 Drei-Wellen-Panel Münster 2001/2002/2003
Pt1,t2,t3,t4
813 Vier-Wellen-Panel Münster 2000/2001/2002/2003
4.2 Bewertung der Ausschöpfung
Will man eine Bewertung der Ausschöpfungsquote anhand der realisierten Paneldatensätze vornehmen, so muss zunächst eine Unterscheidung zwischen Zuordnungsverfahren und gesamter Erhebungsmethode getroffen werden. Da zur eigentlichen
Grundgesamtheit der Münsteraner Schulbefragung alle Schülerinnen und Schüler
gehören, die zu den Befragungszeitpunkten auf eine Münsteraner Schule gingen,
könnte die Bewertung der gesamten Erhebungsmethode anhand der Schülerzahlen
der Schulstatistik erfolgen. Dieser Fragestellung soll hier jedoch nicht weiter nachgegangen werden, vielmehr soll das Zuordnungsverfahren begutachtet werden. Es
soll die Frage im Vordergrund stehen, wie viele der Fragebögen, die hätten zugeordnet werden können, mit dem oben vorgestellten, tatsächlich angewendeten hierarchischen Zuordnungsverfahren tatsächlich gefunden werden konnten.
ZA-Information 56
63
Die Frage nach der Anzahl derjenigen Schülerinnen und Schüler, deren Bögen zwischen den Befragungswellen hätten zugeordnet werden können, ist dabei schwieriger zu beantworten, als dies auf den ersten Blick erscheint.19 Zunächst beschränkt
sich auf Schulebene die Grundgesamtheit auf die Jugendlichen der befragten Jahrgänge, die eine Schule besuchten, die zu allen Zeitpunkten der Befragung zustimmten. Diese Anzahl kann relativ genau den jeweiligen Schulstatistiken entnommen
werden (siehe Tabelle 1). Auch die Schulstatistiken selbst sind meist nicht exakt, da
die ausgewiesenen Belegungszahlen zu den Statistikstichtagen durch zwischenzeitliche Ab- und Zugänge der Schulen von den tatsächlichen Belegungen an den
Befragungsstichtagen abweichen können; diese Abweichungen scheinen jedoch
vernachlässigbar klein. Darüber hinaus problematisch sind Veränderungen der
Schulpopulation über den gesamten Befragungszeitraum (vier Jahre) im Sinne von
Zu- und Wegzügen nach bzw. aus Münster, Schulwechsler in bzw. von Schulen, die
nicht an den Befragungen teilnahmen, Sitzenbleiber etc. Durch die Wahl der Erhebungsmethode (Fragebogeninterviews im Klassenverband) ist die erreichbare Probandenzahl auf diejenigen beschränkt, die an den jeweiligen Befragungstagen
anwesend waren. Da die Fragebogenzuordnungen über die oben geschilderte Methode unter Zuhilfenahme von Codeblättern vorgenommen wurden, reduziert sich
die Zahl weiter auf diejenigen Befragten, die ihr Codeblatt verwertbar ausgefüllt
hatten.20 Da als einzige Referenzdaten die aggregierten Schulstatistiken der vier
Befragungsjahre zur Verfügung stehen und diese keinen befriedigenden Aufschluss
über die oben genannten Probleme geben können, kann die Zahl der Probanden, die
tatsächlich mehrfach befragt wurden, also hätten zugeordnet werden können, nur
geschätzt werden. Um die zu erwartende Zahl (Ne) der möglichen Zuordnungen
19 Dazu folgendes Beispiel: Zum Zeitpunkt t1 gingen 2.105 Schülerinnen und Schüler auf die von
uns befragten Schulen, 1.850 von ihnen konnten von uns (verwertbar) befragt werden, 255
nicht. Zum Zeitpunkt t2 waren es laut Schulstatistik 2.181 Probanden, von denen wir 1.915 befragen konnten, 266 nicht. Wie viele der Probanden aus t1 haben wir zu t2 wiederbefragt bzw.
wie viele der Fragebögen aus t1 können Bögen aus t2 theoretisch zugeordnet werden? Nimmt
man an, dass die Schulpopulation (relativ) stabil blieb, kann man zwei Extrempunkte formulieren. Zum einen könnten alle 1.850 wiederbefragt worden sein, die 255 Ausfälle (t1) sind in den
266 Ausfällen (t2) enthalten. Zum anderen könnten alle 255 Ausfälle (t1) zum zweiten Zeitpunkt
wiederbefragt worden sein, alle 266 Ausfälle (t2) könnten allerdings im ersten Zeitpunkt schon
befragt worden sein, so dass nur noch 1.329 Personen zu beiden Zeitpunkten befragt wurden.
Die realisierten Zuordnungen von 1.271 ergeben somit Quoten von 96 Prozent im besten oder
68 Prozent im schlechtesten Fall. Beides ist unwahrscheinlich.
20 Lässt man diese Betrachtungen außer Acht, so sind noch 813 Jugendliche von den ursprünglichen 1.850 im Vier-Wellen-Panel enthalten. Dies sind Jugendliche, die im beobachteten Zeitraum dreimal versetzt wurden, nie umgezogen sind, nie auf eine Schule außerhalb der Stichprobe
umgeschult wurden, nie an den Befragungstagen gefehlt haben und bei jeder Befragung einen
hinreichenden Code geliefert haben. Bei einem sehr konservativen Standpunkt kann hieraus mit
einer gewissen Berechtigung eine Panelmortalität von 56 Prozent abgeleitet werden.
64
ZA-Information 56
zwischen den jeweiligen Zeitpunkten schätzen zu können, seien folgende Annahmen zugelassen:
1.
In der größten offiziellen Schulpopulation der Befragungszeitpunkte sind alle
Schülerinnen und Schüler der anderen Zeitpunkte enthalten
2.
Die Differenzen zwischen den Stichproben und den jeweiligen Schulstatistiken beruhen auf zufälligen, stichprobenneutralen Ausfällen
Annahme 1 ist notwendig, um eine Referenzgröße über die Anzahl aller Probanden
zu bestimmen, die überhaupt zu irgendeinem Zeitpunkt hätten teilnehmen können.
Problematisch ist die Annahme deshalb, da Veränderungen der Schulpopulation
stattgefunden haben, die auf Aggregatebene nicht mehr erkennbar sind. Es wird
vernachlässigt, dass zu jedem Zeitpunkt ein gewisser Teil an Schülerinnen und
Schülern nicht in der größten Population enthalten waren. Dies führt zu einer Unterschätzung der Zuordnungsquoten.
Annahme 2 ist notwendig, um die Zahl der Ausfälle (Querschnitts-Rückläufe) einzubeziehen. Sie ist problematisch, da in der Realität die Befragungsteilnahme vermutlich nicht zufällig, sondern von bestimmten Faktoren abhängig ist. So haben
erste Analysen gezeigt, dass der Rücklauf in den Querschnitten unter anderem von
Geschlecht und Schulform abhängt, es kann also vermutet werden, dass auch der
Anteil der Personen, die zu mehreren Zeitpunkten nicht teilnahmen, nicht zufällig
verteilt ist, sondern von denselben Faktoren abhängt. Dies führt tendenziell zu einer
Überschätzung der Zuordnungsquoten.
Lässt man die o. g. Annahmen zu, kann formuliert werden: Die zu erwartende Anzahl der Befragungsteilnehmer (Ne) zu bestimmten Zeitpunkten (ti) ergibt sich aus
der größten Schulpopulation (max(N(Sti)) multipliziert mit dem Produkt der Quotienten aus den jeweiligen Anzahlen der realisierten Querschnittsstichproben
(N(Qti)) und den Schulpopulationen nach Schulstatistik (N(Sti )).21
k
N e = max ( N ( S ti )) * ∏
i =1,..., k
i =1
( N (Qti ))
( N ( S ti ))
(2)
21 Anders ausgedrückt entspricht dies dem Produkt der größten Ausgangsstichprobe und den multiplizierten Rücklaufquoten der beteiligten Querschnitte.
ZA-Information 56
65
Aus den zu erwartenden Anzahlen (Ne) und den tatsächlich beobachteten bzw. realisierten Anzahlen der Zuordnungen (Nb) lassen sich nun die in Tabelle 4 angeführten
Quoten berechnen. Sie dürften, wie oben angedeutet, die „wahre“ Zuordnungsquote
eher unterschätzen, da auf aggregierter Ebene der Schulstatistiken nicht sichtbare
Veränderungen (Sitzenbleiber, Umzüge etc., die sich pro Jahr (aber nicht im Panel)
ausgleichen), nicht berücksichtigt werden. Dieser Anteil liegt schätzungsweise bei
mindestens zehn Prozent. Eine Überschätzung der Quoten durch nicht berücksichtigte, systematische Ausfälle erscheint im Vergleich dazu weniger bedeutsam.
Tabelle 4
Zuordnungsgüte der Paneldaten Münster 2000-2003
Ne
Nb
Zuordnungsquote (%)
Pt1,t2
1.683
1.271
76
Pt2,t3
1.710
1.373
80
Pt3,t4
1.705
1.406
82
Pt1,t2,t3
1.502
997
66
Pt2,t3,t4
1.497
1.075
72
Pt1,t2,t3,t4
1.316
813
62
Ne bedeutet erwartetes N nach Formel 2
Nb bedeutet beobachtetes N
Um die Zuordnungsquoten der realisierten Paneldatensätze zu bewerten, können
Quoten, die in anderen Panelstudien erreicht wurden, herangezogen werden. Ein
übliches Verfahren bei Paneluntersuchungen stellt die Zuordnung der Fragebögen
über erhobene Adressen der Schülerinnen und Schüler dar. Hierbei tritt erfahrungsgemäß schon bei der Adresserhebung ein Ausfall von ca. 50 Prozent auf, der im
Laufe solcher Addresspanels deutlich größer wird.22
Die Zuordnungsquoten für die Zwei-Wellen-Panels aus jeweils zwei aufeinander
folgenden Zeitpunkten liegen zwischen 76 und 82 Prozent. Es ist ersichtlich, dass
die Quoten im Verlauf der Befragungen besser wurden. So wurde die schlechteste
Zuordnungsquote zwischen den Jahren 2000 (t1) und 2001 (t2), die beste zwischen
den Jahren 2002 (t3) und 2003 (t4) verwirklicht; auch die absolute Fallzahl stieg
entsprechend an. Dies mag zum einen am steigenden Alter der Befragten und der
möglicherweise damit verbundenen höheren Fähigkeit, die Codefragen richtig zu
22 Exemplarisch hierzu siehe Böttger et al. (2003, S. 35 ff.) mit einem Ausfall von 42 Prozent zwischen t1 und t2 verglichen mit hier 24 Prozent (realistische, korrigierte Schätzung) bzw. 31 Prozent (konservativste Schätzung) Ausfall zwischen t1 und t2.
66
ZA-Information 56
beantworten bzw. sich zu konzentrieren liegen. Zum anderen mag auch ein positiver
Gewöhnungseffekt bei den Probanden eine Rolle spielen. Die Quoten der beiden
lückenlosen Drei-Wellen-Panels liegen bei 66 und 72 Prozent, die des Vier-WellenPanels erwartungsgemäß niedriger bei 62 Prozent. Die realisierten Quoten liegen
damit deutlich über denen von Adresspanels.
4.3 Verzerrung der Paneldaten
Am Beispiel des Paneldatensatzes Pt3,t4 (Münster 2002/2003) soll erläutert werden,
welche Auswirkungen das angewendete Zuordnungsverfahren in Bezug auf die Repräsentativität der Daten hat. In Tabelle 5 finden sich die Paneldaten aufgeschlüsselt
nach den zugelassenen Fehlern in der Codezuordnung. Zum Vergleich sind dort die
Münsteraner Querschnittsdaten aus 2003 und die Daten der Schulstatistik desselben
Jahres aufgeführt.
Tabelle 5
Verzerrung der Paneldaten Münster 2002/2003
Codezuordnung Pt3,t4
0 Fehler 1 Fehler 2 Fehler
N
637
523
Gesamt Gesamt Gesamt
Pt3,t4
Q,t4
St4
246
1.406
1.819
2.077
Geschlecht
Mädchen (%)
59
49
41
52
50
49
Jungen (%)
41
51
59
48
50
51
Schulform
Hauptschüler (%)
16
21
27
19
23
23
Realschüler (%)
33
33
33
33
32
31
Gymnasiasten (%)
50
44
34
45
41
39
Sonderschüler (%)
2
3
5
3
4
6
P bedeutet Panel
Q bedeutet Querschnitt
S bedeutet Schulstatistik (nur befragte Schulen)
ZA-Information 56
67
Es wird deutlich, dass zwar der größte Teil (N = 637) der Schülerinnen und Schüler
bei der Beantwortung des Codeblattes in 2002 und 2003 keinen Fehler machte, der
Anteil derjenigen, die einen Fehler (N = 523) machten jedoch kaum kleiner ist. Der
Anteil der Probanden, die zwei Fehler (N = 246) machten ist zwar deutlich geringer,
jedoch ebenfalls noch erheblich. Bei dem ursprünglich geplanten Zuordnungsverfahren mit Hilfe des gesamten Codes, hätte man nur auf die 637 Zuordnungen ohne
Fehler zurückgreifen können. Ein Verzicht auf die Zuordnungen mit einem oder
zwei Fehlern erscheint daher unvernünftig. Vielmehr rechtfertigt der Ertrag der gefundenen fehlerhaften Zuordnungen den oben geschilderten Aufwand eines Zuordnungsverfahrens mit manuellem Handschriftenvergleich.
Aus Tabelle 5 wird darüber hinaus ersichtlich, dass die Anzahl der Fehler bei der
Beantwortung des Codeblattes mit Geschlecht und Schulbildung der Befragten korrelieren. Während die Verzerrungen auf Ebene des Gesamt-Paneldatensatzes (der
Zuordnungen bis zu zwei Fehler beinhaltet) nur leicht sind, lassen sich bei der Aufschlüsselung der Zuordnungen nach Fehlern deutliche Verschiebungen erkennen.
Augenscheinlich war es den weiblichen Befragungsteilnehmern eher möglich, in
zwei Jahren fehlerfrei zu antworten, der Anteil der Mädchen ist bei den Zuordnungen mit keinem Fehler deutlich größer als derjenige der Jungen. Auch die Schulbildung hat einen (erwartungsgemäßen) Effekt. Je höher die Schulbildung, desto
weniger Fehler wurden bei der Beantwortung gemacht. Über die Ursachen können
an dieser Stelle nur Mutmaßungen angestellt werden. Es ist zu vermuten, dass kognitive Fähigkeiten - bei aller Einfachheit der Fragen - ebenso eine Rolle spielen, wie
Konzentrationsfähigkeit und -wille.
Auch unter dem Gesichtspunkt der Verzerrung der Daten erscheint die Beschränkung nur auf fehlerfreie Zuordnungen nicht wünschenswert. Muss der Code zwischen den Jahren komplett übereinstimmen, so sind die zu erwartenden Datensätze
deutlich verzerrt. Erst ein fehlertolerantes Zuordnungsverfahren unter Zulassung
von (bis zu zwei) Fehlern liefert hier Daten, deren Verzerrung in Bezug auf Geschlecht und Schulbildung deutlich geringer ist.
68
5
ZA-Information 56
Fazit
Resümiert man die Erfahrungen, die in unserer Studie mit einem Zuordnungsverfahren
über persönliche Codes gemacht wurden, so muss man zu dem Ergebnis kommen,
dass sich das ursprünglich geplante Verfahren in der Praxis nur teilweise bewährt
hat, jedoch mit Hilfe der geschilderten Problemlösestrategie als Ergebnis bessere
Zuordnungsquoten realisiert werden konnten als in vergleichbaren Adresspanels.
Die Grundvoraussetzungen des Verfahrens erwiesen sich zunächst als unzureichend
erfüllt, so dass wegen der zu geringen Zuordnungsquote und einer starken Verzerrung der Daten eine Abweichung vom ursprünglich geplanten Verfahren notwendig
war. Die Voraussetzung, dass jeder Proband einen eindeutigen Code aufweisen
muss, war in unserer Studie nicht gegeben. Zu einem großen Teil lag dies an Kompromissen (Art der Fragen, Fragestellung), die während der Verhandlungen mit dem
Datenschutz eingegangen werden mussten. Für zukünftige Forschungsvorhaben
erscheint diese Voraussetzung allerdings durch die Wahl geeigneter Codes bzw.
Codefragen realisierbar.
Als sehr viel schwieriger zu realisieren, dürfte sich die zweite Voraussetzung des
Verfahrens - exakt übereinstimmende Codes in den einzelnen Erhebungswellen erweisen. In unserer Studie zeigte sich, dass ein sehr großer Teil der befragten Jugendlichen nicht in der Lage war, die Codefragen in den unterschiedlichen Jahren
gleich zu beantworten. Bei einem Zuordnungsverfahren über den kompletten Code
wäre dann eine angemessene Zuordnungsquote nicht mehr zu erreichen gewesen.
Für die Phase der Zuordnungsfindungen mussten deshalb „fehlerhafte“ Codes zugelassen werden, um die Fragebögen, die von denselben Personen in unterschiedlichen Wellen ausgefüllt wurden, einander zuordnen zu können.
Die Schwierigkeitsstufe der gestellten Fragen war unseres Erachtens nach Schülerinnen und Schüler der befragten Altersstufen zumutbar. Es zeigte sich darüber hinaus, dass die Fehlerhaftigkeit des Codes bei fortschreitendem Alter der Befragten
nicht wesentlich geringer wurde. Es steht also eher zu vermuten, dass generell ein
nicht zu vernachlässigender Teil von fehlerhaften bzw. differierenden Antworten zu
erwarten ist, stellt man Jugendlichen in mehreren Jahren fünf oder mehr Fragen. Ein
Zuordnungsverfahren über Codes, welcher auf Einzelfragen beruht, muss die Möglichkeit eines fehlertoleranten Zusammenspiels von Daten bieten.
ZA-Information 56
69
Literatur
Boers, K. und Kurz, P. (2000). Schule, Familie, Einstellungen, Lebensstile, delinquentes und abweichendes
Verhalten. Erste Ergebnisse der Münsteraner Schülerbefragung 2000. Eigendruck. Münster.
Boers, K. und Pöge, A. (2003). Wertorientierungen und Jugenddelinquenz. In: S. Lamnek und M. Boatca
(Hrsg.), Geschlecht, Gewalt, Gesellschaft (S. 246-269). Opladen: Leske + Budrich.
Boers, K., Reinecke, J., Wittenberg, J. und Motzke, K. (2002). Wertorientierungen, Freizeitstile und Jugenddelinquenz. Neue Kriminalpolitik, 14(4), 141-146.
Böttger, A., Ehret, B., Othold, F., Prein, G., Schumann, K. F. und Seus, L. (2003). Methoden der Untersuchung.
In: K. F. Schumann (Hrsg.), Delinquenz im Lebensverlauf. Bremer Längsschnittstudie zum Übergang von
der Schule in den Beruf bei ehemaligen Hauptschülern (Bd. 2, S. 35-66). Weinheim, München: Juventa.
Motzke, K. und Wittenberg, J. (2004). Methodendokumentation der kriminologischen Schülerbefragung in
Münster 2000 (Schriftenreihe „Jugendkriminalität in der modernen Stadt - Methoden“ Nr. 1). Münster, Trier.
Pöge, A. (2002). Der Zusammenhang von Lebensmilieu, Einstellungen und deviantem Verhalten bei Jugendlichen. Münster. (unveröffentlichte Magisterarbeit)
Pöge, A. (2005a). Ethnicity and self-reported delinquency. How to define ethnicity? In: Queloz, R. Brossard,
R.F. Bütikofer, B. Meyer-Bisch und D. Pittet (Hrsg.), Délinquance des jeunes et justice des mineurs. Les
défis des migrations et de la pluralité ethnique. Youth Crime and Juvenile Justice. The challenge of migration
and ethnic diversity. Berne, Bruylant, Bruxelles: Editions Staempfli. (in Druck)
Pöge, A. (2005b). Methodendokumentation der kriminologischen Schülerbefragung in Münster 2000-2003 (VierWellen-Panel) (Schriftenreihe „Jugendkriminalität in der modernen Stadt - Methoden“ Nr. 9). Münster, Trier.
Raithel, J. (2002). Jugendkriminalität und elterliches Erziehungsverhalten. Neue Kriminalpolitik, 14(2), 62-65.
Wittenberg, J. (2004a). Methodendokumentation der kriminologischen Schülerbefragung in Münster 2001
(Schriftenreihe „Jugendkriminalität in der modernen Stadt - Methoden“ Nr. 2). Münster, Trier.
Wittenberg, J. (2004b). Methodendokumentation der kriminologischen Schülerbefragung in Münster 2002
(Schriftenreihe „Jugendkriminalität in der modernen Stadt - Methoden“ Nr. 4). Münster, Trier.
Wittenberg, J. (2004c). Methodendokumentation der kriminologischen Schülerbefragung in Münster 2003
(Schriftenreihe „Jugendkriminalität in der modernen Stadt - Methoden“ Nr. 7). Münster, Trier.
70
ZA-Information 56
Abbrüche bei Online-Befragungen:
Ergebnisse einer Befragung von Medizinern
von Yasemin El-Menouar und Jörg Blasius 1
Zusammenfassung
Ein großes Problem bei Online-Befragungen ist der hohe Anteil von Abbrüchen.
Diese Abbrüche erfolgen zum einen direkt bei der Kontaktierung, d.h. die zu Befragenden reagieren nicht auf ein zuvor verschicktes Anschreiben bzw. auf eine Aufforderung via Banner oder via Pop-up Fenster. Zum anderen wird häufig die Startseite der Untersuchung aufgerufen, nicht aber der Fragebogen. Die uns hier interessierenden Abbrüche sind jene, die während der Bearbeitung des Fragebogens entstehen. Anhand einer empirischen Erhebung wird gezeigt, dass der Anteil der Abbrüche mit der Art der Ansprache (E-Mail, Banner, Pop-up Fenster), mit fragebogenspezifischen (u.a. Komplexität der Fragen) und mit personenspezifischen Faktoren (u.a. Interneterfahrung) variiert.
Abstract
The high rate of dropouts provides a substantial problem for online surveys. On the
one hand, these dropouts take place right away when the respondents are contacted, i.e., they do not respond to an invitation letter or an invitation via banner or
pop-up window. On the other hand, people often open the study’s start-up page, but
not the questionnaire. The dropouts of concern to us are those which happen during
the processing of the questionnaire. An empirical survey revealed that the share of
the dropouts varies according to the kind of invitation (email, banner, pop-up window) and to questionnaire-specific (e.g. complexity of the questions) and personal
factors (e.g. Internet experience).
1 Yasemin El-Menouar , M.A., ist Wissenschaftliche Mitarbeiterin am Lehrstuhl für Soziologie
der Heinrich-Heine-Universität Düsseldorf, Universitätsstr. 1, 40225 Düsseldorf, Tel.0211/8115290, E-Mail: [email protected]
Dr. Jörg Blasius ist Professor am Seminar für Soziologie der Rheinischen Friedrich-WilhelmsUniversität Bonn, Lennéstr. 27, 53113 Bonn, Telefon: 0228/73-8421, E-Mail: [email protected]
ZA-Information 56
1
71
Einleitung
Seit gut fünf Jahren ist ein stetig steigender Anteil von Online-Befragungen in der
empirischen Sozialforschung zu beobachten, lag er 1998 in Deutschland noch bei 1%,
so waren es 2003 bereits 10% (ADM 2004). Diese Zunahme dürfte insbesondere
auf folgende Gründe zurückzuführen sein (vgl. Batinic 2001, Dillman 2000, Gräf
1999, Janetzko 1999, Reips 1997): Erstens können innerhalb kürzester Zeit große
Erhebungszahlen kostengünstig erzielt werden. Zweitens ist mit steigendem Stichprobenumfang kein Mehraufwand verbunden, weder in finanzieller noch in zeitlicher
Hinsicht. Drittens können Online-Umfragen unabhängig von Zeit und Raum durchgeführt werden, die zu Befragenden müssen lediglich über das Internet erreichbar
sein. Die Beantwortung der Fragen kann 24 Stunden am Tag und 365 Tage im Jahr
von nahezu jedem Ort in der Welt erfolgen. Ein weiterer Vorteil ist, dass die Daten
zu jedem Zeitpunkt der Erhebung in auswertbarer Form vorliegen.
Die Kontaktierung der Befragten kann auf zwei Arten vorgenommen werden (Zerr
2001): Zum einen anhand einer persönlich adressierten E-Mail, in der die Internetadresse des Fragebogens angegeben wird, zum anderen über eine anonyme Ansprache im Internet. Bei der zweiten Kontaktmethode wird entweder ein Pop-up Fenster
oder ein Banner auf einer bestimmten Internetseite platziert. Benutzer dieser Seite
gelangen zum Online-Fragebogen, indem sie einem dort integrierten Link folgen.
Das Hauptproblem von Online-Befragungen besteht darin, dass mit dieser Methode
derzeit keine repräsentativen Stichproben2 gezogen werden können. Die Ursache
dafür ist eine immer noch unzureichende Internetausstattung der Bevölkerung
(Bandilla 2003) und die sich ständig wandelnde Zusammensetzung der Internetpopulation, die nicht genau definiert werden kann (Hauptmanns und Lander 2001,
Hauptmanns 1999). Des Weiteren fehlen geeignete Auswahlbasen für die Stichprobenziehung wie z.B. ein Verzeichnis der E-Mail-Adressen ähnlich dem Telefonbuch3 oder dem Einwohnermelderegister. Doch auch bei Telefonbefragungen gab es
in den alten Bundesländern bis in die Mitte der 80er Jahre ähnliche Probleme; erst
seit dieser Zeit kann von einer ausreichenden Ausstattung der privaten Haushalte
mit Telefonanschlüssen ausgegangen werden (Blasius und Reuband 1995). Mittlerweile ist die telefonische Befragung auch in Deutschland ein Standardinstrument
2 Zu einem Versuch eine repräsentative Stichprobe aus einem Online-Panel zu ziehen siehe
Brandt (2005)
3 Durch die zunehmende Nutzung von Mobiltelefonen und einem damit verbundenen Verzicht
auf Festanschlüsse dürfte in naher Zukunft auch das Ziehen von repräsentativen Telefonstichproben immer schwerer werden.
72
ZA-Information 56
zur Durchführung von repräsentativen Umfragen und hat seit ein paar Jahren sogar
einen größeren Anteil an allen Befragungen als die face-to-face Befragung (für
2003: telefonische Befragung: 43%, face-to-face Befragung: 28%; vgl. ADM 2004).
Die nähere Zukunft wird zeigen, ob sich das auch für die Online-Befragung realisieren lässt.
Unabhängig davon, welches Erhebungsinstrument eingesetzt wird, ob eine repräsentative Stichprobe gezogen werden kann und wie die jeweiligen Zielpersonen
kontaktiert werden, ist die Kooperation der zu befragenden Personen zwingend erforderlich. Ein großes Problem bei Online-Befragungen ist, dass ein relativ großer
Anteil an Personen die Befragung vorzeitig abbricht, also nur sehr unvollständige
bzw. nur unbrauchbare Daten liefert. Das zentrale Anliegen dieser Studie ist, jene
Faktoren zu bestimmen, die zu einem vorzeitigen Abbruch führen, um in der Folge
Strategien anbieten zu können, anhand derer der Anteil der Abbrüche reduziert
werden kann. Um diese Faktoren bestimmen zu können, müssen u.a. der genaue Ort
des Abbruchs im Fragebogen sowie das Antwortverhalten der Personen vor dem
Zeitpunkt des Beendens der Befragung bekannt sein. Sind diese Informationen
vorhanden, so kann geprüft werden, ob es an bestimmten Stellen im Fragebogen
gehäuft zu Abbrüchen kam und inwiefern die dort platzierten Fragen dies verursacht
haben könnten.
Des Weiteren muss die Art der Rekrutierung berücksichtigt werden: Zielpersonen,
die durch eine persönliche E-Mail angesprochen werden, können einer anderen Internetpopulation angehören bzw. ein anderes Teilnahme- und Abbruchverhalten
haben als jene, die mit Hilfe eines Pop-up Fensters bzw. eines Banners kontaktiert
werden. Wenn dem so ist, bedürfen Online-Befragungen je nach gewählter Rekrutierungsmethode auch spezifischer Design-Kriterien, um die Anzahl der Abbrüche
zu reduzieren. Bis dato werden jedoch meistens allgemeine Kriterien zur Gestaltung
von Online-Fragebögen verwendet, ohne dass die Rekrutierungsmethode berücksichtigt wird. Um im Folgenden den Einfluss der Rekrutierungsmethode auf das
Abbruchverhalten untersuchen zu können, werden die Daten einer OnlineBefragung verwendet, die mit Hilfe von drei unterschiedlichen Rekrutierungsarten
durchgeführt wurde (E-Mail, Pop-up Fenster, Banner).
2
Forschungsstand und Fragestellung
Während bei face-to-face und telefonischen Befragungen der Interviewer die Zielperson zur Teilnahme motivieren und anschließend für die Aufrechterhaltung des
Interesses der Befragten sorgen kann, fehlt diese direkte Bezugsperson bei postalischen und Online-Befragungen. Daher hängt es ausschließlich vom Anschreiben
ZA-Information 56
73
und vom Fragebogen ab, ob es zu einer erfolgreichen Rekrutierung und dann zu
einem erfolgreichen Beenden der Befragung kommt. Während das Anschreiben
bzw. „die Werbung“ das Interesse für die Befragung wecken soll, muss während der
Teilnahme mit Hilfe des Fragebogens das Interesse aufrechterhalten werden. Doch
häufig gelingt es bei Online-Befragungen nicht, die Teilnehmer dazu zu motivieren,
den Fragebogen vollständig zu bearbeiten; Tuten et al. (2002) zufolge brechen bis
zu 80 Prozent der anfänglichen Teilnehmer die Befragung vorzeitig ab.
Bei der postalischen Befragung führen frühzeitige Abbrüche meistens dazu, dass die
Zielpersonen den Fragebogen nicht abschicken; so bleibt es ungewiss, ob diese Personen die Teilnahme von vornherein verweigert haben oder ob zwar zunächst eine
Teilnahmebereitschaft vorhanden war, aber fragebogenspezifische Faktoren später
zum Abbruch der Beantwortung führten. Da bei Online-Befragungen jeder Schritt
im Teilnahmeprozess der Befragten dokumentiert werden kann, ist es möglich, genau anzugeben, wann ein Abbruch erfolgte. Die technische Voraussetzung dafür ist,
dass die kompletten Fragebögen nicht erst bei Beendigung der Befragung an den
Server abgeschickt werden, sondern sukzessive, also Seite für Seite. Auf diese Weise
kann zum einen das vorangegangene Antwortverhalten der Abbrecher ermittelt und
zum anderen die genaue Stelle angegeben werden, an welcher ein Abbruch erfolgte.
Dies kann z.B. bei sehr komplex gestalteten Fragen oder bei Grafiken, die eine
längere Ladezeit benötigen, der Fall sein. Aus der Summe dieser Informationen sind
Rückschlüsse auf die Ursachen möglich, die zum Abbruch führten. Um die Teilnehmer möglichst lange in der Untersuchung zu halten, sollte ein Weiterkommen
im Fragebogen auch dann möglich sein, wenn vorhergehende Items unbeantwortet
blieben (Bosnjak 2001).
Die Entscheidung für oder gegen die Teilnahme bzw. für ein vorzeitiges Beenden
der Teilnahme ist ein Prozess, der in verschiedene Selektionsstufen unterteilt werden kann (Bosnjak et al. 1998, Theobald 2000); diese können wie folgt zusammengefasst werden (Bosnjak 2001):
ƒ
In Kenntnis setzen:
In der ersten Stufe wird der potenzielle Teilnehmer über die Umfrage in Kenntnis
gesetzt. Bei einer WWW-Ansprache wird durch ein Banner oder ein Pop-up Fenster
über das Projekt informiert; bei einer E-Mail-Rekrutierung wird der Befragte durch
ein persönliches Anschreiben zur Teilnahme aufgefordert.
ƒ
Aufruf der Startseite:
Nach der Information über die geplante Untersuchung erfolgt bei Interesse (oder
Neugier) der Aufruf der Startseite der Befragung/des Projektes.
74
ZA-Information 56
ƒ
Befragungsbeginn:
Bei weiterhin positiver Entscheidung kommt es zum Aufruf des Fragebogens und
zur Beantwortung der ersten Frage. Ist der Teilnehmer bis zu dieser Stelle fortgeschritten, ist davon auszugehen, dass eine relativ hohe Teilnahmemotivation besteht.
ƒ
vollständige Teilnahme:
Die vollständige Teilnahme hat dann stattgefunden, wenn die Befragung ohne Abbruch bzw. ohne das Auslassen von zentralen Themen beendet wurde.
Theobald (2000) skizziert eine diesen Stufen entsprechende Berechnung der Selektionsraten; er gibt dabei an, wie auf jeder dieser Stufen die Rücklaufquote bestimmt
werden kann (Abbildung 1).
Abbildung 1
n1
Selektionsraten auf dem Weg zum bearbeiteten Fragebogen
Kenntnis
n2
n2/n1
Startseite
1. Selektionsrate =
Werbeerfolg
n3
Fragebogen
n3/n2
2. Selektionsrate =
Motivationserfolg
n4
Bearbeitung
n4/n3
3. Selektionsrate =
Gestaltungserfolg
Quelle: Theobald (2000, S. 72)
Tuten et al. (2002) zeigen, dass die Selektionsraten sehr stark variieren; so reicht
der „Werbeerfolg“ von unter einem bis zu über 70 Prozent. Einschränkend muss
dabei angemerkt werden, dass die Berechnung der ersten Selektionsrate oft nicht
eindeutig ist: Werden beispielsweise Personen per E-Mail zur Teilnahme an einer
Befragung aufgefordert, so kann nicht genau angegeben werden, wie viele Zielpersonen die E-Mail auch tatsächlich erhielten. Nicht alle ungültigen Adressen werden
an den Absender zurückgesandt, andere E-Mails kommen nicht bei der Zielperson
an, da E-Mailfilter diese automatisch aussortieren (Vehovar et al. 2002). Noch
problematischer ist die Berechnung der ersten Selektionsstufe, wenn die Kontaktaufnahme im WWW stattfindet: Pop-up Fenster werden oft einfach ausgeschaltet,
ohne dass der Inhalt zur Kenntnis genommen wird; Banner können leicht übersehen
werden.
ZA-Information 56
75
Auch bei der zweiten Selektionsrate gibt es große Unterschiede zwischen den Studien. Diese dürften zum einen vom Thema der Befragung, zum anderen von den
Anreizen, die mit der jeweiligen Teilnahme verbunden sind, abhängig sein. Eine
weitere Ursache für die Unterschiede beim „Motivationserfolg“ ist der unterschiedliche Grad an Seriosität, den eine Online-Befragung vermitteln kann (Dillman
2000). Die Seriosität einer Befragung ist ein Indikator dafür, ob in Aussicht gestellte
Anreize auch tatsächlich realisiert werden; kommerzielle Umfragen werden als weniger vertrauenswürdig bewertet als wissenschaftliche (Bosnjak und Batinic 1999).
Auf der Basis einer Metaanalyse kommt Theobald (2000) zu der Schlussfolgerung,
dass eine zweite Selektionsrate von 55 Prozent als gutes Ergebnis bezeichnet werden kann.
Im Mittelpunkt unserer Untersuchung stehen die Ausfälle, die während der Befragung stattfinden, d.h. in der dritten Selektionsstufe. Auch auf dieser Stufe variiert
die Abbruchrate beträchtlich, wobei ein „Gestaltungserfolg“ von weniger als 50
Prozent nicht selten ist (Batagelj et al. 1998). Die Ursachen für Abbrüche auf dieser
Stufe sind vielfältig, sie hängen u.a. von der Fragebogenlänge und den verwendeten
Fragentypen ab (Batagelj und Vehovar 1999; Knapp und Heidingsfelder 2001).
Abbrüche finden überdurchschnittlich häufig statt, wenn mehr als 25 bis 30 Fragen
gestellt werden; bei Matrixfragen wird häufiger abgebrochen als bei einfachen Fragentypen. Auch bei offenen Fragen kommt es Knapp und Heidingsfelder (2001)
zufolge überdurchschnittlich oft zum Abbruch der Befragung; diese werden zudem
häufiger von späteren Abbrechern unbeantwortet überblättert. Wurden die offenen
Fragen von den späteren Abbrechern beantwortet, so haben diese dafür im Durchschnitt weniger Zeit benötigt als die Teilnehmer, die den Fragebogen bis zum Ende
ausgefüllt haben. Des Weiteren neigen Abbrecher in ihrem Antwortverhalten
stärker zu Antwortmustern als vollständige Teilnehmer. Dieses Verhalten könnte
ein Indiz dafür sein, dass bereits zu Beginn der Befragung nur eine relativ geringe
Teilnahmemotivation bestand. Eine weitere Ursache könnte auch eine relativ geringe Internetkompetenz sein, die sich in Problemen beim Ausfüllen von Internetformularen niederschlägt und schließlich zum Abbruch der Befragung führen kann.
Dies wäre auch ein Grund dafür, warum „Heavy-User“ bei Online-Befragungen
stark überrepräsentiert sind (Brenner 2002).
Bezogen auf den Einfluss des Fragebogenlayouts fanden Dillman et al. (1998) heraus, dass bei einem mit grafischem Schmuckwerk versehenen Fragebogen häufiger
Abbrüche stattfinden als bei einem mit einfach gehaltenem Layout. Die Autoren
erklären dies mit den längeren Ladezeiten, die für den Aufbau von Internetseiten
benötigt werden, die grafische Elemente enthalten. Technische Erschwernisse sieht
76
ZA-Information 56
auch Smith (1997) als eine der wichtigsten Ursachen für den frühzeitigen Abbruch
einer Befragung.
Weiterhin konnte gezeigt werden, dass Belohnungen für eine Interviewteilnahme
nicht relevant für den Motivationserfolg sind, wohl aber für den weiteren Verlauf
der Befragung: Frick et al. (2001) konnten nachweisen, dass bei der Befragung mit
anschließender Gewinnverlosung nur halb so viele Teilnehmer den Fragebogen vorzeitig verließen wie bei derselben Befragung, die keine Verlosung enthielt. Diesen
Zusammenhang konnte Theobald (2000) in einem ähnlichen Experiment jedoch
nicht nachweisen.
Wirksamer als materielle Anreize sind nach Bosnjak und Batinic (1999) sowie
nach Dillman (2000) immaterielle Anreize, wobei drei Formen unterschieden werden können (Porst und von Briel 1995). Erstens: Altruismus ist dann ein Motiv zur
Teilnahme, wenn der Anreiz in der Unterstützung von Gruppenwerten gesehen bzw.
als ein Beitrag für eine übergeordnete Gruppe verstanden wird, zu der man sich zugehörig bzw. für die man sich mitverantwortlich fühlt. Zweitens: Egoistische Gründe sind dann entscheidend, wenn die Teilnahme in der Zukunft subjektive Verbesserungen oder Vorteile zu schaffen verspricht. Drittens gibt es persönliche Gründe,
die mit der Befragung selbst in Zusammenhang stehen und wo sich der Nutzen
schon während der Teilnahme einstellt. Letzteres kann beispielsweise ein Interesse
zur Selbstkontrolle bzw. ein intendierter Lerneffekt sein, im Fall von OnlineUmfragen sind es vor allem auch Spaßmomente (vgl. Gräf 1999).
Werden die Ergebnisse der vorgestellten Untersuchungen zusammengefasst, so sind
folgende Faktoren zu unterscheiden, die zu einem Abbruch bei Online-Befragungen
führen können: Erstens, fragebogenspezifische Faktoren: Hierzu zählt ein zu langer
Fragebogen, die Einbindung komplexer Fragentypen wie z.B. Matrixfragen oder
auch die Verwendung von grafischen Elementen, die zu einer verlängerten Dauer in
der Datenübertragung führen können. Zweitens, befragungsspezifische Faktoren:
Das Thema der Befragung verspricht dem potenziellen Teilnehmer keinen oder nur
einen zu geringen Nutzen. Drittens, befragtenspezifische Faktoren: Aufgrund einer
geringen Internetnutzung fehlt die Kompetenz, einen Onlinefragebogen auszufüllen.
Bisher wurden diese Faktoren meistens isoliert voneinander betrachtet, aber die unterschiedlichen Effekte könnten sich auch gegenseitig verstärken oder aufheben: So
kann es sein, dass die Verwendung von Matrixfragen bei Umfrageteilnehmern mit
einer relativ geringen Internetkompetenz die Wahrscheinlichkeit für einen Abbruch
noch erhöht. Des Weiteren könnte der anfänglich in der Teilnahme an einer OnlineBefragung gesehene Nutzen durch subjektive Erschwernisse im Fragebogen
ZA-Information 56
77
nivelliert werden, so dass es trotz dieser relativ hohen Teilnahmemotivation zum
Abbruch der Befragung kommt. Andererseits ist es möglich, dass die Motivation
erst mit dem „Spaß“ am Fragebogen entsteht, auch wenn dieser nur aus Neugier und
nicht aus Interesse am Thema aufgerufen wurde.
Obwohl Abbrüche bei Online-Befragungen ein zentrales Thema und Studien, die
sich mit diesem Thema beschäftigen, unerlässlich sind, um standardisierte Richtlinien für Online-Befragungen zu generieren, gibt es bislang nur wenige Arbeiten zu
dieser Thematik (Tuten et al. 2002); insbesondere fehlen Untersuchungen darüber,
welchen Einfluss die Form der Ansprache (E-Mail, Banner, Pop-up) auf die Abbrüche
hat. Es kann vermutet werden, dass Personen, die persönlich per E-Mail angeschrieben wurden, anders auf bestimmte Stimuli im Fragebogen reagieren als solche, die
anonym per Pop-up Fenster oder Banner im WWW rekrutiert wurden.
Mit den folgenden Analysen soll überprüft werden, welchen Einfluss die Form der
Ansprache (E-Mail, Pop-up Fenster, Banner) und welchen die Fragebogengestaltung (Art und Länge der Fragen, Einbindung von Grafiken, Fragebogenaufbau) auf
die Abbruchrate haben. Ebenso soll untersucht werden, in welchem Zusammenhang
die Abbruchrate mit den (technischen) Kompetenzen der Teilnehmer und ihrem
vorhergehenden Antwortverhalten steht. Zusätzlich werden die Teilnahmemotive in
die Analyse einbezogen; so können z.B. momentspezifische Teilnahmegründe wie
Neugier schneller zu einem vorzeitigen Abbruch der Befragung führen als altruistische wie Hilfsbereitschaft. Um diese unterschiedlichen Einflüsse beschreiben zu
können, wurde ein für Online-Befragungen überdurchschnittlich langer Fragebogen
verwendet, der ein großes Spektrum möglicher Fragen- und Layoutformate abdeckt.
3
Datenbasis
Im Rahmen einer Studie der Deutschen Zentralbibliothek für Medizin (ZBMed)
wurden Nutzer von medizinischen Informationen, überwiegend Ärzte in verschiedenen Tätigkeitsbereichen, zu ihrem Informationsverhalten befragt (El-Menouar
2002). Da Mediziner in Deutschland eine nahezu vollständige Internetpenetration
aufweisen, kann zumindest theoretisch jede Person der Grundgesamtheit auf diese
Weise erreicht werden. Die Umfrage fand im Zeitraum von Juni bis August 2001
statt. Die Rekrutierung der Teilnehmer erfolgte über drei verschiedene Anspracheformen im Internet, die jeweils mit dem Online-Fragebogen verlinkt waren.
ƒ
Erstens, Ärzte wurden per E-Mail angeschrieben und zur Teilnahme an der
Befragung eingeladen; die hierfür benötigten Adressen der zu kontaktierenden
Ärzte wurden von der ZBMed zur Verfügung gestellt. Ein personengebundener
78
ZA-Information 56
Link, der zur Startseite der Umfrage führte, wurde in das elektronische Anschreiben integriert.
ƒ
Zweitens wurden Pop-up Fenster auf den Internetseiten des Deutschen Gesundheitsnetzes (Pop-up 1) und der ZBMed (Pop-up 2) installiert; beides sind
Anbieter medizinischer Fachinformationen, die speziell medizinische Berufsgruppen bedienen. Während das Deutsche Gesundheitsnetz (DGN) vornehmlich niedergelassene Ärzte anspricht, liegt der Nutzerschwerpunkt der ZBMed
bei wissenschaftlich arbeitenden Medizinern und Medizinstudenten. Die Fenster öffneten sich bei jedem Aufruf der Seite und enthielten zusätzlich zu der
Teilnahmeaufforderung einen Link zur Umfrage. Cookies zur Verhinderung
der wiederholten Teilnahme vom gleichen PC wurden nicht gesetzt, da verschiedene Mitarbeiter von Einrichtungen wie von Krankenhäusern z.T. dieselbe
IP-Adresse haben. Bei Teilnahme eines Mitarbeiters wären alle anderen ausgeschlossen gewesen. Doppelteilnahmen sind bei Ärzten, die sehr bewusst mit
ihrer Zeit umgehen, nicht anzunehmen.
ƒ
Drittens wurde auf einem weiteren Internetportal für medizinische Fachinformationen (Multimedica, das hauptsächlich in Krankenhäusern arbeitende Ärzte bedient) ein Banner integriert, der zunächst an zentraler Stelle auf der Seite
erschien und ab dem dritten Tag nach Beginn der Umfrage am Seitenrand
platziert war.
Die Motivation zur Teilnahme erfolgte über materielle und nicht-materielle Anreize.
Materieller Anreiz waren Gutscheine für kostenlose Bestellungen von drei Aufsätzen bei der ZBMed; als nicht-materieller Anreiz wurde die Verbesserung der Informationsversorgung in der Medizin auf der Basis der Ergebnisse dieser Umfrage in
Aussicht gestellt. Die Seriosität der Studie wurde durch die Nennung des Auftraggebers (die ZBMed ist in der Medizin eine wichtige und angesehene Institution)
hervorgehoben.
Der Fragebogen enthielt insgesamt 71 Fragen, die auf 21 Seiten verteilt waren. Die
ersten sechs Seiten enthielten jeweils nur ein bis zwei Fragen einfachen Typs, mit
denen die Internetkompetenz der Befragten ermittelt werden sollte (Interneterfahrung, Nutzungsdauer und -intensität, genutzte Internetdienste). Auf den Seiten 7 bis
11 befanden sich Matrixfragen mit steigender Anzahl an Items (bis zu 14); Gegenstand dieser Fragen waren Nutzung und Wichtigkeit von verschiedenen medizinischen Informationsmedien. Auf der elften Seite des Fragebogens war eine Grafik
eingebunden. Dies war ein Vorschlag für eine neue Suchmaske für die Literaturrecherche in der Medizin, die von den Befragten nach verschiedenen Kriterien evaluiert werden sollte. Auf den Seiten 12 bis 21 befanden sich wiederum einfache
ZA-Information 56
Tabelle 1
79
Rückläufe in den verschiedenen Stufen der Selektion,
getrennt nach den vier Stichproben
E-Mail
gültige Adressen:
Banner
Pop-up 1
Pop-up 2
unbekannt
geöffnet:
geöffnet:
15 311
17 485
2871
n
in %
n
in %
n
in %
n
in %
Startseite
583
20,3
367
?
2010
13,1
2557
14,6
erste Fragebogenseite
542
93,0
266
72,5
866
43,1
1127
44,1
Rücklauf
459
84,7
225
84,6
599
69,2
602
53,4
Fragentypen, mit denen die Demografie, die Teilnahmemotivation, die Teilnahmesituation und die Umfrageerfahrung abgefragt wurden (für den Fragebogen: siehe
El-Menouar, 2002).
In Tabelle 1 werden die unterschiedlichen Teilnahmequoten der vier Stichproben
entsprechend des vorgestellten Selektionsmodells von Theobald (2000) wiedergegeben. Insgesamt haben 1885 Personen den Fragebogen vollständig ausgefüllt. Die
erste Fragebogenseite haben 2801 Personen gesehen, 926 (33,1%) entschlossen sich
zum Abbruch ohne den Fragebogen vollständig zu bearbeiten.
Von den mit Hilfe eines elektronischen Anschreibens persönlich kontaktierten
n1(E-Mail) = 2871 Zielpersonen, bei denen die vorhandene E-Mail-Adresse zumindest nicht als ungültig erkannt wurde, haben n2(E-Mail) = 583 (n2/n1=20,3%; erste
Selektionsrate = Werbeerfolg) die Startseite der Untersuchung geöffnet, von diesen
583 Personen haben wiederum n3(E-Mail) = 542 (n3/n2=88,7%; zweite Selektionsrate = Motivationserfolg) die erste Fragebogenseite geöffnet (bezogen auf alle 2871
Zielpersonen beträgt die Ausschöpfungsquote an dieser Stelle 19,3%), und davon
haben n4(E-Mail) = 459 (n4/n3=84,7%; dritte Selektionsrate = Gestaltungserfolg)
den Fragebogen vollständig ausgefüllt (bezogen auf die 2871 Zielpersonen beträgt
die Ausschöpfungsrate 16,0%, bezogen auf die 583 Personen, welche die Startseite
geöffnet haben, 78,7%). Damit ist die Ausschöpfungsquote bei der ersten Selektionsstufe relativ niedrig, auf den anderen beiden Selektionsstufen ist sie, verglichen
mit den Angaben von Theobald (2000), relativ hoch.
Bei der Kontaktierung mittels Banner kann die erste Selektionsrate nicht berechnet
werden, da unbekannt ist, wie viele Personen dieses Banner wahrgenommen haben.
Auf der zweiten Selektionsstufe liegt der Wert für die erfolgreich Motivierten bei
80
ZA-Information 56
n3(Banner)/n2(Banner) = 72,5%, also deutlich unterhalb des Wertes der Stichprobe,
die mit Hilfe einer E-Mail kontaktiert wurde, aber immer noch oberhalb des von
Theobald (2000) angegebenen Wertes. Deutlich stärker sind die Ausfälle auf dieser
Stufe bei jenen, die über ein Pop-up Fenster auf die erste Fragebogenseite kamen;
die entsprechenden Werte liegen hier bei 43,1% und 44,1%, und damit auch unterhalb des von Theobald (2000) angegebenen Wertes. Auf der dritten Selektionsstufe
hat die Rekrutierung per Banner, wie auch die per E-Mail, einen deutlich höheren
Rücklauf (84,7% bzw. 84,6%) als per Pop-up Fenster. An dieser Stelle unterscheiden sich auch die Rückläufe der beiden Pop-up Stichproben, die des Deutschen Gesundheitsnetzes war mit 69,2% erfolgreicher als jene der ZBMed mit 53,4%. Verglichen mit den Ergebnissen von Theobald (2000) haben E-Mail und Banner damit
einen sehr guten Rücklauf auf der dritten Stufe, Pop-up 1 einen relativ guten und
Pop-up 2 zumindest noch einen ausreichenden Rücklauf.
Bevor eine genauere Untersuchung der Abbrüche erfolgt, wird im Folgenden die
demografische Zusammensetzung der vier Stichproben beschrieben (Tabelle 2). Da
diese Daten erst am Ende des Fragebogens erhoben wurden, werden nur die Teilnehmer betrachtet, die den Fragebogen vollständig ausfüllten. Aufgrund von unzureichenden Informationen über die Nutzer der jeweiligen Internetdienste sowie über
die Personen der E-Mailadressdatei kann leider nicht angegeben werden, in welchem Maß die Differenzen in der demografischen Zusammensetzung der Stichproben auf die unterschiedlichen Rekrutierungsplattformen sowie auf methodische Effekte zurückzuführen sind, d.h. in welchem Maß unterschiedliche Personen mit der
einen oder anderen Befragungsmethode besonders gut bzw. besonders schlecht zu
erreichen sind.
Anhand von Tabelle 2 wird deutlich, dass die Zusammensetzung der vier Stichproben nach Alter und Geschlecht sehr unterschiedlich ist. Während der Anteil der
Frauen in der über die Internetseite der ZBMed rekrutierten Stichprobe relativ hoch
ist (38,7% Frauen, 61,3% Männer) und er bei der über die DGN und Multimedica
rekrutierten Stichproben bei etwa 20% liegt, beträgt er in der E-Mail-Stichprobe
nur 9%. Wird die Altersverteilung betrachtet, so ist die über die ZBMed rekrutierte
Stichprobe im Durchschnitt am jüngsten; über die Hälfte der Befragten sind keine
35 Jahre alt. Die Befragten der E-Mailstichprobe sind am ältesten; rund drei Viertel
sind über 40 Jahre alt. Von allen Befragten sind nur etwa 5% 60 Jahre und älter.
ZA-Information 56
Tabelle 2
81
Geschlechts- und Altersverteilung der Stichproben im Vergleich,
Spaltenprozente
E-Mail
(n=459)
Geschlecht(1)
männlich
weiblich
Alter(2)
bis 34 Jahre
35 bis 39 Jahre
40 bis 49 Jahre
50 bis 59 Jahre
60 bis 65 Jahre
über 65 Jahre
(1)
Banner
(n=225)
Pop-up 1
(n=599)
Pop-up 2
(n=602)
Gesamt
(n=1885)
91,0
78,8
82,7
61,3
77,4
9,0
21,2
17,3
38,7
22,6
7,2
18,2
39,2
29,1
4,6
1,8
22,7
21,8
34,2
15,6
3,6
2,2
16,6
17,3
35,9
23,8
5,5
0,8
54,6
16,7
18,9
7,7
1,3
0,5
27,2
17,9
31,1
19,0
3,7
1,2
χ2 = 147,0; df = 3; p < 0,001; Cramer's V = 0,28
χ = 389,6; df = 15; p < 0,001; Cramer's V = 0,27
(2) 2
Bei den Verteilungen von Alter und Geschlecht wird deutlich, dass der Anteil der
Frauen um so größer ist, je jünger das Durchschnittsalter der Stichprobe ist: die
ZBMed Stichprobe, welche das jüngste Durchschnittsalter hat, enthält auch den
größten Anteil an Frauen; die E-Mail Stichprobe hat im Durchschnitt die ältesten
Befragten und den höchsten Anteil an Männern. Inwiefern dieser Zusammenhang
auch in den vier Bruttostichproben4 besteht oder ob er ein Effekt der Befragungsmethode ist, kann an dieser Stelle nicht gesagt werden. Erfahrungsgemäß sind auch bei
anderen Online-Befragungen ähnliche Verzerrungen zu beobachten; in der Regel
sind Frauen und ältere Personen unterdurchschnittlich repräsentiert. Dabei sind die
geschlechtsspezifischen Unterschiede bei den älteren Befragten noch stärker ausgeprägt als bei den jüngeren.
Anhand von Tabelle 3 wird ersichtlich, dass sich die beruflichen Positionen der Befragten in den drei WWW-Stichproben sehr stark unterscheiden, sie entsprechen
aber in etwa der Nutzerstruktur der jeweiligen Internetanbieter: Während über die
Internetseite des Deutschen Gesundheitsnetzes (Pop-up 1) überwiegend niedergelassene Ärzte erreicht werden konnten, waren es über die Homepage von Multimedica
(Banner) und der ZBMed (Pop-up 2) vor allem die Ärzte, die in Krankenhäusern
4 Bei den vier Bruttostichproben handelt es sich erstens um alle per E-Mail angeschriebenen Per-
sonen, zweitens um alle Personen, die das Banner gesehen haben sowie drittens und viertens um
die Personen, die das Pop-up Fenster gesehen haben.
82
ZA-Information 56
tätig sind. Bei der ZBMed gehören hierzu insbesondere angehende Ärzte, Universitätsprofessoren und Ärzte, die an Universitätskliniken und Lehrkrankenhäusern
(vgl. dazu El-Menouar 2002) tätig sind, sowie Studierende, die sich dort mit Literatur und Informationen versorgen.
Tabelle 3
Berufliche Position der Befragten in den vier Stichproben,
Zeilenprozente
Berufliche Position
N
Universitätsprofessor
Chefarzt
Oberarzt
Niedergelassener Arzt
Assistenzarzt
Arzt im praktischen Jahr
Sonstiger Beruf
Student
Durchschnitt
44
84
181
651
271
55
362
203
1851
E-Mail
Banner
45,5
45,2
26,5
47,2
10,0
7,3
3,4
1,0
24,5
2,3
13,1
18,2
7,7
22,1
16,4
13,2
4,9
11,9
Pop-up1
13,6
32,1
35,9
41,6
32,8
25,5
24,9
12,8
32,0
Pop-up2
38,6
9,5
19,3
3,5
35,1
50,9
58,5
81,3
31,6
χ2 = 840,1; df = 21; p < 0,001; Cramer's-V = 0,39.
Die Teilnehmer der E-Mailstichprobe befinden sich überwiegend in höheren Positionen. Diese Abweichung vom Durchschnitt der gezogenen Stichprobe könnte zum
einen auf die Stichprobenauswahl zurückzuführen sein (die berufliche Zusammensetzung der Bruttostichprobe ist leider nicht bekannt), zum anderen könnten sich
Ärzte in höheren Positionen durch die persönliche Ansprache überdurchschnittlich
oft verpflichtet fühlen, an einer Befragung teilzunehmen, die zur Verbesserung der
ärztlichen Informationsversorgung beitragen soll. Bei den Sonstigen handelt es sich
überwiegend um Journalisten, die vermutlich auf der Suche nach medizinischen
Informationen waren, oder aber um andere, an die Medizin angrenzende, Berufsgruppen.
4
Ergebnisse
Nach Theobald (2000) sollten Ausfälle bei Online-Befragungen insbesondere auf
den ersten Fragebogenseiten zu verzeichnen sein und mit dem Fortschritt der Befragung deutlich zurückgehen. Dieses Ergebnis kann auch mit der hier vorliegenden
Untersuchung bestätigt werden. In Abbildung 2 ist der prozentuale Verlauf der Abbrüche nach Stichproben und Fragebogenseiten wiedergegeben. Anhand dieser Abbildung wird ersichtlich, dass bei allen vier Stichproben am Anfang die meisten
Abbrüche zu verzeichnen sind. Während bei der E-Mail- und bei der Bannerstichprobe die Abbruchquote schon auf den ersten Fragebogenseiten deutlich zurückgeht,
ZA-Information 56
Abbildung 2
83
Abbruchverlauf im Fragebogen,
dargestellt sind die Verbliebenen in Prozent
100
90
80
70
Prozent
60
50
40
30
20
E-Mail
10
Banner
Pop-up 1
Pop-up 2
0
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20 21
Fragebogenseite
gilt dieses für die beiden Pop-up Stichproben erst ab etwa der Mitte des Fragebogens. Dabei ist die Quote der Abbrecher bei den über die Homepage der ZBMed
rekrutierten Personen deutlich stärker als bei denen, die über das Deutsche Gesundheitsnetz angesprochen wurden.
Um Zusammenhänge zwischen den Abbrüchen und den unterschiedlichen Fragetypen festzustellen, wurden in Tabelle 4 die Ausfallquoten auf jeder Seite zusammen
mit den auf diesen Seiten vorkommenden Fragetypen für jede der vier Stichproben
angegeben. Vermerkt ist jeweils der Anteil der Personen, welche die jeweilige Seite
an den Server abgeschickt haben. So haben von den 542 Personen, die per E-Mail
kontaktiert wurden und welche die erste Seite des Fragebogens aufgerufen haben,
95,4% (=517 Personen) die erste Seite „bearbeitet“, d.h. sie haben die zweite Seite
aufgerufen und dort bzw. noch während des Ladens dieser zweiten Seite die Befragung abgebrochen. Von den über die ZBMed angesprochenen Teilnehmern sind
von den 1127 Personen, die sich auf der ersten Fragebogenseite befanden, nur
83,5% (=941 Personen) auf die zweite Seite gekommen.
84
ZA-Information 56
Tabelle 4
Ausfälle auf den einzelnen Seiten, getrennt für die vier Stichproben,
alle Angaben in Prozent;
angegeben sind die in der Stichprobe Verbliebenen
E-Mail
Banner
Pop-up 1
Pop-up 2
(n=542)
(n=266)
(n=866)
(n=1127)
Seite
Fragetyp
1
Einfachauswahl
95,4
91,7
88,5
83,5
2–4
Einfachauswahl
94,6
90,6
84,2
76,9
5
Mehrfachauswahl
94,3
89,8
82,2
74,4
6
Einfachauswahl
94,3
89,8
81,9
74,0
7
Matrix mit 7 Items
91,7
87,2
78,6
69,2
8
Matrix mit 14 Items
90,6
86,8
76,7
65,6
9
Matrix mit 11 Items
89,5
86,8
76,0
62,5
10
Matrix mit 5 Items
88,4
86,8
75,4
60,6
11
Grafik und Matrix
86,5
85,7
72,7
56,3
12
Einfachauswahl
86,0
85,3
71,5
55,1
13 – 21 Einfach- und Mehrfachauswahl
84,7
84,6
69,2
53,4
N
459
225
599
602
vollständig
Anhand von Tabelle 4 wird ersichtlich, dass es Sprünge bei den Abbrüchen gab:
Überdurchschnittlich viele Befragte brachen bei der Bearbeitung der siebten Seite
ab; so haben z.B. in der E-Mail Stichprobe 94,3% derjenigen, welche die erste Fragebogenseite öffneten, die sechste Seite bearbeitet, aber nur 91,7% die siebte. Dieser Rückgang um 2,6 Prozentpunkte kann vermutlich auf die zeitintensive und auch
etwas kompliziertere Bearbeitung der Matrixfrage mit sieben Items zurückgeführt
werden. Bei den beiden Pop-up Stichproben ist der Sprung an dieser Stelle mit 3,3
Prozentpunkten bzw. 4,8 Prozentpunkten noch deutlicher. Einen zweiten Sprung bei
den Ausfällen gibt es auf der elften Fragebogenseite – während noch 88,4% der per
E-Mail kontaktierten Teilnehmer die Matrixfrage mit den fünf Items auf Seite 10
beantworteten, waren es bei der Beantwortung der Matrixfrage, die sich auf die
Grafik bezieht, nur noch 86,5%; noch deutlichere Ausfälle an dieser Stelle sind bei
den beiden Pop-up Stichproben festzustellen. Dieser Rückgang kann vermutlich zu
einem großen Teil auf die überdurchschnittlich langen Ladezeiten zurückgeführt
werden, die für den Aufbau von grafischen Elementen benötigt werden.
Es kann damit festgehalten werden, dass Matrixfragen und Grafiken zu überdurchschnittlich vielen Abbrüchen führen. Weiterhin ist festzustellen, dass Teilnehmer,
die per Pop-up Fenster angesprochen wurden, sensibler auf derartige Erschwernisse
ZA-Information 56
85
im Fragebogen reagieren als die Personen der anderen beiden Stichproben; der Anteil an Abbrüchen ist bei den beiden Pop-up Stichproben überdurchschnittlich hoch.
Es bleibt zu fragen, ob es ohne den Einsatz von Matrixfragen und der Grafik zu weniger Abbrüchen gekommen wäre. Ein Indikator, um diese Frage zu beantworten,
ist das Antwortverhalten der Abbrecher bis zu der Stelle, an der sie den Fragebogen
verlassen haben. Die Beantwortung bzw. die Nicht-Beantwortung der ersten Fragen
soll als eine bestehende bzw. nicht-bestehende Teilnahmeabsicht interpretiert werden. Im Folgenden wird untersucht, ob sich die 583 Abbrecher, die zumindest die
erste Fragebogenseite überschritten haben, von den 1885 Teilnehmern, die den Fragebogen vollständig ausfüllten, in den Anteilen an fehlenden Antworten unterscheiden. Für diese Analyse werden drei Gruppen von Abbrechern unterschieden: Erstens, Befragte, die auf den Seiten zwei bis sieben abbrachen, die also spätestens
beim Erkennen der ersten Matrixfrage die Befragung verließen. Zweitens, Personen,
die den Fragebogen verließen, als sie entweder mit den aufeinander folgenden Matrixfragen konfrontiert wurden oder spätestens bevor sie die Matrixfragen mit der
integrierten Grafik beantwortet haben (S. 8 bis einschließlich 11). Drittens, Personen, welche die Matrixfragen beantwortet (bzw. sie zumindest überblättert, S. 12 bis
S. 21) haben, aber an späterer Stelle vor dem Ende der Befragung abbrachen. Als
vierte und letzte Gruppe sind die Teilnehmer der Untersuchung aufgeführt, die den
Fragebogen vollständig ausgefüllt haben.
Für die einzelnen Gruppen wurde der Anteil der fehlenden Werte berechnet. Um
auch die erste Gruppe in die Analyse der fehlenden Antworten einbeziehen zu können, wurden für alle Gruppen lediglich die ersten acht Fragen (Seite 1 bis 6 des Fragebogens) berücksichtigt. Da bei der ersten Gruppe nicht alle Befragten bis zur
siebten Seite kamen (vgl. Tabelle 4), variiert für diese die Basis der Prozentuierung:
Für die Personen, die nur die ersten beiden Seiten überschritten haben und auf der
dritten Seite abbrachen, wurden nur die Fragen der ersten beiden Seiten ausgewertet. Für die Personen, die auf der sechsten Seite abbrachen, wurden nur die ersten
fünf Seiten ausgewertet, und die Personen, die bereits auf der ersten Seite abbrachen, wurden überhaupt nicht berücksichtigt. Die Anteile der fehlenden Werte für
die drei Gruppen der Abbrecher sowie für die Gruppe der Teilnehmer, unterteilt
nach den vier Stichproben, sind in Tabelle 5 wiedergegeben.
86
Tabelle 5
ZA-Information 56
Anteil fehlender Angaben und Abbrüche, durchschnittlicher Anteil an
fehlenden Angaben bei den ersten acht Fragen
Abbrecher
bis S. 7
n
%
Abbrüche von
S. 8 bis S. 11
n
%
Abbrüche von
S. 12 bis S. 21
n
%
n
%
Teilnehmer
E-Mail (n=517)
Banner (n=244)
Pop-up-1 (n=766)
Pop-up-2 (n=941)
20
12
85
161
73,2
68,2
71,8
71,9
28
4
51
145
1,3
25,0
6,1
8,2
10
3
31
33
0,0
0,0
4,0
4,9
459
225
599
602
0,5
0,3
0,7
1,7
N
278 71,8
228
7,2
77
3,7
1885
0,9
Wie anhand von Tabelle 5 ersichtlich wird, haben diejenigen, die schon in einem
sehr frühen Stadium die Befragung abbrachen, mit durchschnittlich 71,8% einen
sehr hohen Anteil an fehlenden Angaben, und zwar unabhängig von der Art der
Kontaktierung. Dieser hohe Wert ist ein Indikator dafür, dass ein großer Teil dieser
278 Befragten gar nicht die Absicht hatte, an der Studie teilzunehmen, sondern sich
lediglich über den Inhalt der Befragung näher informieren wollte.
In der zweiten Gruppe ist der Anteil fehlender Antworten deutlich geringer und
beträgt im Durchschnitt nur noch 7,2%, in der E-Mail-Stichprobe sogar lediglich
etwas mehr als 1%. Es kann vermutet werden, dass die Personen dieser Gruppe eine
relativ hohe Teilnahmemotivation hatten und erst aufgrund der aufeinander folgenden komplexen Matrixfragen bzw. aufgrund der überdurchschnittlich langen Ladezeit der Grafik das Interesse verloren. Mit zunehmender Bearbeitung des Fragebogens sinkt der Anteil der fehlenden Angaben: In der dritten Gruppe der Abbrecher
beträgt sie im Durchschnitt nur noch 3,7%, die der Teilnehmer liegt bei 0,9%. Matrixfragen scheinen somit für Personen, die zunächst eine Teilnahmeabsicht bekunden, indem sie die ersten Fragen beantworten, nicht per se ein Problem zu sein,
sondern nur dann, wenn mehrere aufeinander folgen bzw. wenn durch eine Grafik
das Laden einer Fragebogenseite zu stark verzögert wird.
Inwiefern die Internetkompetenz5 der Befragten mit einem vorzeitigen Abbruch
zusammenhängt, wird anhand der nachfolgenden Tabellen ersichtlich: Wird die
Selbsteinschätzung der Interneterfahrung betrachtet (Tabelle 6), so stuften sich die
Abbrecher im Vergleich zu den Teilnehmern überdurchschnittlich oft als „eher unerfahren“ ein. Während der Anteil derjenigen, die sich als „sehr erfahren“ oder „eher
5 Unterschiede zwischen den unterschiedlich rekrutierten Gruppen können vernachlässigt werden,
sie sind nur sehr geringfügig und statistisch nicht signifikant. Von den frühen Abbrechern (bis
S. 7) haben nur wenige diese Frage beantwortet, diese Gruppe wird daher in den Tabelle 6 bis 8
nicht berücksichtigt.
ZA-Information 56
87
erfahren“ einstuften, bei den Teilnehmern bei 80% liegt, beträgt er bei den Abbrechern weniger als 70% (Tabelle 6). Diese Differenzen in der Selbsteinschätzung
werden auch durch die Unterschiede des Zeitpunktes, seitdem das Internet genutzt
wird, deutlich: Während fast 70% der vollständigen Teilnehmer angaben, das Internet zwei Jahre und länger zu nutzen, beträgt dieser Anteil bei den Abbrechern nur
etwa 55% (Tabelle 7).6
Tabelle 6
Selbsteinschätzung der Interneterfahrung der Abbrecher im Vergleich
zu den Teilnehmern, Spaltenprozente
sehr erfahren
eher erfahren
eher unerfahren
sehr unerfahren
Abbrecher von S.8
bis S. 11
(n=210)
18,6
50,5
29,5
1,4
100,0
Abbrecher von S. 12
bis S.21
(n=74)
18,9
45,9
31,1
4,1
100,0
Teilnehmer
(n=1875)
19,5
60,3
19,3
1,0
100,0
χ2=25,4; df = 6; p < 0,01, Cramer’s V=0,08
Tabelle 7
Internetnutzungszeitraum der Abbrecher im Vergleich,
Spaltenprozente
weniger als ½ Jahr
½ bis 1 Jahr
1 bis 2 Jahre
2 bis 3 Jahre
länger als 3 Jahre
Abbrecher von S.8
bis S. 11
(n = 206)
7,3
9,2
27,2
20,4
35,9
100,0
Abbrecher von S. 12
bis S.21
(n=72)
12,5
22,2
9,7
16,7
38,9
100,0
Teilnehmer
(n=1849)
4,8
6,9
18,7
25,8
43,8
100,0
χ2=49,2; df = 8; p < 0,01, Cramer’s V=0,11
Ein weiterer Indikator zur Messung der Internetkompetenz ist der Umfang der genutzten Online-Dienste (Tabelle 8). Die deutlichsten Unterschiede zwischen Abbrechern und Teilnehmern gibt es bei der Nutzung solcher Dienste, die das Ausfüllen
von Formularen beinhalten, also bei Diensten, die ebenso wie Online-Befragungen
6 Der Anteil der fehlenden Werte in Tabelle 6 beträgt für die drei Gruppen 7,9%, 3,9% und 0,5%
(in der Reihenfolge der Spalten): In Tabelle 7 sind die entsprechenden Werte 9,6%, 6,5% und
1,9%; die Werte belegen damit auch die in Tabelle 5 angegebenen Durchschnittswerte für fehlende Angaben.
88
ZA-Information 56
auf einer standardisierten Form der Interaktion basieren: Vor allem Online-Banking,
Online-Shopping und Reisebuchungen werden von einem geringeren Anteil der
Abbrecher vorgenommen als von den Teilnehmern. Des Weiteren ist die Nutzung
von E-Maildiensten für Abbrecher seltener selbstverständlich als für Teilnehmer:
Von den Personen, die auf den Seiten 8 bis 11 abbrachen, nutzen 88,3% E-Mail,
von denen, die auf den Seiten 12 bis 21 abbrachen, nutzen dieses Angebot 90,7%,
bei den Teilnehmern waren es 97,4%.
Tabelle 8
Genutzte Online-Dienste der Abbrecher im Vergleich mit den Teilnehmern, Angaben in Prozent
Abbrecher Abbrecher
von S.7 bis von S. 12
S. 11
bis S. 20
E-Mail
88,3
90,7
medizinische Informationsdienste
86,9
93,3
Suchmaschinen
85,9
81,3
Informationen und Nachrichten
73,2
94,7
Online-Banking
46,5
48,0
Online-Shopping
38,0
32,0
Reisebuchungen
31,5
38,7
Aktien- und Börseninformationen
20,7
36,0
Unterhaltung
28,2
29,3
Ticketreservierung
22,1
28,0
N
213
75
Teilnehmer
97,4
93,8
90,1
82,9
60,6
46,0
40,9
31,5
25,7
24,3
χ2
CV
50,9***
14,2***
8,8*
20,5***
19,3***
10,0**
7,1*
11,7**
n.s.
n.s.
0,15
0,08
0,06
0,10
0,10
0,07
0,06
0,07
1876
Für alle Zeilen: df = 2; *** = p < 0,001, ** = p < 0,01, *=p < 0,05
Aus diesen Ergebnissen kann abgeleitet werden, dass insbesondere eine geringere
Erfahrung im Umgang mit dem Internet und dem Ausfüllen eines Fragebogens am
Computer zu Abbrüchen führt – und hier verstärkt, wenn die Komplexität des Fragebogens zunimmt. Somit gibt es einen Zusammenhang von fragebogenspezifischen und befragtenspezifischen Faktoren.
Im Folgenden wird untersucht, ob befragungsspezifische Faktoren mit dem Teilnahmeverhalten zusammenhängen. Bei jedem der in Tabelle 9 aufgelisteten Faktoren sollten die Befragten angeben, ob dieser Grund für die Teilnahme an der Befragung zutrifft oder nicht. Diesen Angaben zufolge war in allen vier Stichproben das
Interesse am Thema das am häufigsten genannte Teilnahmemotiv. Besonders stark
ist das Interesse bei den mittels Banner kontaktierten Personen ausgeprägt, deren
Wert liegt im Schnitt 20 Prozentpunkte über dem der anderen Stichproben. Der
zweitwichtigste Grund für die Teilnahme war Neugier, von den per Pop-up Fenster
ZA-Information 56
Tabelle 9
89
Teilnahmemotive der Stichproben im Vergleich,
Angaben der Nennungen, in Prozent
Interesse am Thema
Neugier
Hilfsbereitschaft
Aufsatzkopien der ZBMed
wissenschaftlicher Anspruch
Erhalt des Ergebnisberichtes
Kommunikationsfreudigkeit
E-Mail
(n=460)
Banner
(n=225)
65,4
37,7
39,9
25,3
25,9
26,6
26,4
84,4
44,4
28,9
44,0
29,8
28,0
19,6
Pop-up1
(n=602)
64,6
51,3
36,7
33,4
24,8
26,9
27,9
Pop-up2
(n=597)
62,2
49,8
41,1
39,1
26,7
22,1
20,1
χ2
CV
38,4***
23,1***
11,6**
32,7***
0n.s.**
0n.s.**
13,8**
0,14
0,11
0,08
0,13
0,09
Für alle Zeilen: df = 3; ** = p < 0,01, *** = p < 0,001
rekrutierten Befragten wurde dieser noch öfter angegeben als von Personen der anderen beiden Stichproben.
Die unerwartete Ansprache durch ein Pop-up Fenster erfordert eine relativ spontane
Entscheidung für oder gegen eine Teilnahme, in so einer Situation ist die Neugier
ein überdurchschnittlich wichtiger Faktor für eine positive Teilnahmeentscheidung.
Ob der Fragebogen bis zum Ende bearbeitet wurde, hängt vermutlich insbesondere
damit zusammen, inwieweit das Interesse und die Neugier durch den Fragebogen
aufrechterhalten werden konnten.
Die versprochene Belohnung, Aufsatzkopien von der ZBMed kostenlos zu erhalten,
hatte einen verhältnismäßig geringen Effekt auf die Teilnahmebereitschaft. Es muss
allerdings gefragt werden, ob die versprochene Belohnung für die Befragten auch
attraktiv war – Ärzte in Krankenhäusern und Mitarbeiter der Universitäten haben
über ihre Dienststelle in der Regel einen für sie kostenlosen Zugriff auf wissenschaftliche Literatur.
5
Fazit
Die Untersuchung hat gezeigt, dass sich die Ausfallquoten der vier betrachteten
Stichproben zum Teil stark voneinander unterscheiden. Während von den Teilnehmern, die per E-Mail angeschrieben wurden bzw. die einem Banner gefolgt sind,
nur relativ wenige die Befragung frühzeitig abbrachen, liegt der Anteil der Abbrecher bei den Teilnehmern, die über ein Pop-up Fenster zum Fragebogen gelangten,
bei 31,8% (Pop-up 1) bzw. bei 46,6% (Pop-up 2). In den meisten Fällen scheint es
sich um Ausfälle zu handeln, die nicht direkt auf die Rekrutierungsmethode zurückgeführt werden können, sondern auf fragebogen- und befragtenspezifische Faktoren.
90
ZA-Information 56
Überdurchschnittlich viele Abbrüche sind auf der ersten Fragebogenseite zu verzeichnen; des Weiteren, wenn der Fragentyp von einfach zu komplex wechselt und
wenn sich die Bearbeitung des Fragebogens durch verlängerte Ladezeiten aufgrund
einer eingebundenen Grafik verzögert. Die überdurchschnittliche Länge des Fragebogens der hier diskutierten Untersuchung scheint dagegen nur einen geringen Effekt
auf die Abbruchquote gehabt zu haben: Wurden die komplexen Fragebogenseiten
bearbeitet, dann wurde auf den neun folgenden Seiten nur noch selten abgebrochen.
Somit haben fragebogenspezifische Faktoren einen entscheidenden Einfluss auf das
Abbruchverhalten der Teilnehmer, vor allem dann, wenn diese weniger erfahren
sind im Umgang mit dem Internet und einer standardisierten Form der OnlineKommunikation sind. Daraus kann gefolgert werden, dass fragebogenspezifische
Faktoren vor allem dann für einen Abbruch relevant sind, wenn diese mit befragtenspezifischen Faktoren einhergehen (Komplexität des Fragebogens plus geringe
Internetkompetenz).
Schließlich wurde gezeigt, dass Personen, die sehr früh die Bearbeitung des Fragebogens abbrachen, vermutlich keine starke Teilnahmeintention hatten. Ihr Anteil an
fehlenden Angaben ist bei den Fragen, die sie sich zumindest angesehen haben, sehr
hoch; diese Personen scheinen von Anfang an skeptisch gegenüber der Teilnahme
gewesen zu sein und wollten vielleicht nur aus Neugier noch ein wenig im Fragebogen „blättern“. Sie brachen spätestens bei der ersten Matrixfrage ab.
Der relativ geringe Anteil an Abbrüchen in der E-Mail- wie auch Banner-Stichprobe
ist vermutlich darauf zurückzuführen, dass sich die derart Angesprochenen nicht
unmittelbar für oder gegen eine Teilnahme entscheiden mussten, sondern Zeit hatten, diese zu überdenken; d.h. es kann davon ausgegangen werden, dass die Entscheidung für das vollständige Ausfüllen des Fragebogens überdurchschnittlich oft
bereits im Vorfeld getroffen wurde. So ist bei Online-Befragungen, die eine Rekrutierung anhand einer personalisierten E-Mail oder per Banner vorsehen, die Verwendung von relativ langen und komplexen Fragebögen möglich.
Bei der Banner-Stichprobe ist aufgrund des weit überdurchschnittlichen Interesses
dieser Gruppe am Thema von einer selektiven Stichprobe auszugehen, bei der die
Hochinteressierten überrepräsentiert sind. Ob dies angesichts der Tatsache, dass
Online-Stichproben generell nur bedingt repräsentativ sind, ein Nachteil ist, kann
im Rahmen dieser Studie nicht entschieden werden.
Bei der Pop-up Ansprache ist Neugier ein sehr wichtiges Teilnahmemotiv. Diese
muss im gesamten Verlauf des Fragebogens jedoch immer wieder geweckt bzw.
konstant hoch gehalten werden, da anscheinend auf nahezu jeder Seite neu darüber
ZA-Information 56
91
entschieden wird, ob der Fragebogen weiter bearbeitet wird oder nicht. Matrixfragen, die eine relativ lange Bearbeitungszeit erfordern, können dann in verstärktem
Maß dazu führen, dass die Teilnehmer die Befragung vorzeitig beenden. Wird die
Rekrutierung der Befragten per Pop-up Fenster vorgenommen, so sollte darauf
geachtet werden, dass der Fragebogen schnell und ohne große Mühe ausgefüllt werden kann.
Literatur
ADM 2004: Jahresbericht 2003. URL: http://www.adm-ev.de/pdf/Jahresbericht_03.pdf..
Bandilla, W. 2003: Die Internetgemeinde als Grundgesamtheit. S. 71-83 In: ADM Arbeitkreis Deutscher
Markt- und Sozialforschungsinstitute/ Arbeitsgemeinschaft Sozialwissenschaftlicher Institute (ASI)/ Statistisches Bundesamt (Hrsg.): Online-Erhebungen. Sozialwissenschaftlicher Tagungsbericht, Band 7. Bonn:
Informationszentrum Sozialwissenschaften.
Batagelj, Z., Vehovar, V. 1999: Web Surveys: Revolutionising the Survey Industry or (Only) Enriching its
Spectrum? Proceedings of the ESOMAR Worldwide Internet Conference Net Effects: S. 159-176. Amsterdam: ESOMAR.
Batagelj, Z., Lozar, K., Vehovar, V. 1998: Respondent’s Satisfaction in WWW Surveys. Paper presented at
the International Conference on Methodology and Statistics. Preddvor, Slovenia.
Batinic, B. 2001: Fragebogenuntersuchungen im Internet. Aachen: Shaker.
Blasius, J., Reuband, K.-H. 1995: Telefoninterviews in der empirischen Sozialforschung: Ausschöpfungsquoten und Antwortqualität. ZA-Information, 37: S. 64-87.
Bosnjak, M. 2001: Participation in Non-Restricted Web Surveys: A Typology and Explanatory Model for
Item Non-Response. S. 193-208. In: U.-D. Reips, M. Bosnjak (Eds.): Dimensions of Internet Science. Lengerich: Pabst Science Publishers.
Bosnjak, M., Bandilla, W., Tuten, T. L. 1998: Mehrstufige (Selbst-) Selektion: Anwendung des ‘Elaboration-Likelihood-Modells’ auf per Banner beworbene Web-Untersuchungen. Vortag auf der German Online
Research Tagung, Mannheim.
Bosnjak, M., Batinic, B. 1999: Determinanten der Teilnahmebereitschaft an internet-basierten Fragebogenuntersuchungen am Beispiel E-Mail. S. 145-157. In: B. Batinic, A. Werner, L. Gräf, W. Bandilla (Hrsg.):
Online-Research. Methoden, Anwendungen und Ergebnisse. Göttingen: Hogrefe.
Brandt, M. 2005: Repräsentativität von Online-Befragungen. ALLBUS und Online-Panel im Vergleich.
Unveröffentlichte Magisterarbeit am Seminar für Soziologie der Universität Bonn.
Brenner, V. 2002: Generalizability issues in internet-based survey research: Implications for the internet
addiction controversy. S. 93-113. In: B. Batinic, U.-D. Reips, M. Bosnjak (Eds.): Online social sciences.
Göttingen: Hogrefe.
Dillman, D. 2000: Mail and Internet Surveys – The Tailored Design Method. New York, NY: Wiley.
Dillman, D., Totora, R.D., Conradt, J., Bowker, D. 1998: Influence of plain versus fancy design on response
rates for web surveys. Paper presented at annual meeting of the American Statistical Association, Dallas, TX.
URL: http://survey.sesrc.wsu.edu./dillman/papers/AAPORpaper00.pdf. Stand: 23.03.2005
El-Menouar, Y. 2002: Was erwarten Nutzerinnen und Nutzer vom Internet-Angebot medizinischer Bibliotheken? Ergebnisse einer internetbasierten Umfrage. Köln: Deutsche Zentralbibliothek für Medizin.
92
ZA-Information 56
Frick, A., Bächtiger, M. T., Reips, U.-D. 2001: Financial Incentives, Personal Information and Drop-Out
Rate in Online Studies. S. 209-220. In: U.-D. Reips, M. Bosnjak (Eds.): Dimensions of Internet Science.
Lengerich: Pabst Science Publishers.
Janetzko, D. 1999: Statistische Anwendungen im Internet. In Netzumgebungen Daten erheben, auswerten
und präsentieren. Addison Wesley Verlag.
Knapp, F., Heidingsfelder, M. 2001: Drop-out analysis: the effect of research design. S. 221-230. In: U.-D.
Reips, M. Bosnjak (Eds.): Dimensions of Internet Science. Lengerich: Pabst Science Publishers.
Gräf, L. 1999: Optimierung von WWW-Umfragen: Das Online Pretest-Studio. S. 159-178. In: (Hrsg.) B.
Batinic, A. Werner, L. Gräf, W. Bandilla (Eds.): Online Research. Methoden, Anwendungen und Ergebnisse. Göttingen – Bern- Toronto – Seattle: Hogrefe.
Hauptmanns, P., Lander, B. 2001: Zur Problematik von Internet-Stichproben. S. 27-40 In: Theobald, A.,
Dreyer, M., Starsetzki, T. (Hrsg.): Online-Marktforschung, theoretische Grundlagen und praktische Erfahrungen. Wiesbaden: Gabler.
Hauptmanns, P. 1999: Grenzen und Chancen von quantitativen Befragungen mit Hilfe des Internet. S. 21-38
In: Batinic, B., Werner, A., Gräf, L., Bandilla, W. (Hrsg.): Online-Research. Methoden, Anwendungen und
Ergebnisse. Göttingen: Hogrefe.
Porst, R., von Briel, C. 1995: Wären Sie vielleicht bereit, sich gegebenenfalls noch einmal befragen zu lassen? Oder: Gründe für die Teilnahme an Panelbefragungen. ZUMA Arbeitsberichte, S. 1-17.
Reips, U-D. 1997: Das psychologische Experimentieren im Internet. S. 245-266 In: B. Batinic (Eds.): Internet für Psychologen. Göttingen: Hogrefe.
Schnell, R. 1997: Nonresponse in Bevölkerungsumfragen. Ausmaß, Entwicklung und Ursachen. Opladen:
Leske + Budrich.
Smith, C. 1997: Casting the NET: Surveying an Internet population. Journal of Communication Mediated by
Computers, 3. [Online].http://www.ascusc.org/jcmc/vol3/issue1/smith.html.
Theobald, A. 2000: Das World Wide Web als Befragungsinstrument. Wiesbaden: Deutscher UniversitätsVerlag.
Tuten, T., Urban, D.J., Bosnjak, M. 2002: Internet Surveys and Data Quality – A Review. S. 7-25. In:
B. Batinic, U.-D. Reips, M. Bosnjak (Eds.): Online Social Sciences. Seattle, WA: Hogrefe & Huber.
Vehovar, V., Batagelj, Z., Manfreda, K. L., Zaletelj, M. 2002: Nonresponse in Web Surveys. S. 229-242 In:
R. M. Groves, D. A. Dillman, J. L. Eltinge, R. J. A. Little (Eds.): Survey nonresponse (Wiley Series in
Probability and Statistics: Survey Methodology Section. New York: Wiley.
Zerr, K. 2001: Erscheinungsformen des Online-Research – Klassifikation und kritische Betrachtung. Beiträge
der Fachhochschule Pforzheim, 95.
ZA-Information 56
93
MTB: Ein Record-Linkage-Programm für die
empirische Sozialforschung
von Rainer Schnell, Tobias Bachteler und Jörg Reiher 1
Zusammenfassung
In der Praxis der empirischen Sozialforschung werden häufig Datensätze aus verschiedenen Datenquellen zusammengeführt (Record-Linkage). Solange in unterschiedlichen Datenquellen gemeinsame fehlerfreie Schlüssel (z.B. Namen oder Matrikelnummern) existieren, ist die Zusammenführung problemlos. Fehler in den gemeinsamen Schlüsseln erzwingen fast immer aufwändige manuelle Korrekturen.
Um die Zusammenführung unterschiedlicher Datenbestände trotz fehlerhafter
Schlüssel zu ermöglichen, wurde im Rahmen eines DFG-Projekts ein Computerprogramm entwickelt, um diese Aufgabe zu erleichtern: Die „Merge-Toolbox“, kurz:
„MTB“.
Abstract
Bringing together data files from different sources (record linkage) is a common
task in social science. As long as the data files contain clean merging keys (e.g.
names or identification numbers) the procedure is rather trivial. However, if the
merging keys are error prone, manual corrections are inevitable. To facilitate record linkage using error prone keys we developed the computer programme
“Merge Toolbox” (MTB) within the scope of the DFG-funded research project
“Record linkage using error prone strings”.
1 Dr. Rainer Schnell ist Professor im Fachbereich für Verwaltungswissenschaft, Methoden der
empirischen Politik- und Verwaltungsforschung, Universität Konstanz Postfach D 92, 78434
Konstanz, E-Mail: [email protected],
Tobias Bachteler (M.A.) ist Wiss. Angestellter am Fachbereich für Verwaltungswissenschaft,
Methoden der empirischen Politik- und Verwaltungsforschung, Universität Konstanz,
Jörg Reiher studiert Informatik an der Fernuniversität Hagen.
94
1
ZA-Information 56
Einleitung
Datenanalytiker stehen oft vor dem Problem, Datenbanken aus verschiedenen Quellen verknüpfen zu müssen. In der Regel werden Datensätze verwendet, die sich auf
dasselbe Objekt (Personen, Haushalte) beziehen2. Dieses Problem wird in der statistischen Literatur als „Record-Linkage“ bezeichnet. Neuere Beispiele für RecordLinkage-Anwendungen in der Bundesrepublik reichen von der Vorbereitung des
Zensus-Test (Fürnrohr u.a. 2002), der Zuspielung von Telefonnummern zu Betrieben
bei Stichproben aus Betriebsstättendateien bzw. von Telefonnummern bei CATIInterviews auf der Basis von Einwohnermelde- oder Random-Walk-Stichproben
über die Verlinkung von Geburts- und Einschulregistern bei epidemiologischen
Studien (Heller u.a. 2001) bis zur Ergänzung von Befragtenangaben in Surveys
durch Daten der angegebenen Arbeitsstätten (Schnell u.a. 2003).3 Besonders bei
Surveydaten wird Record-Linkage durch Rechtschreib- und Tippfehler in den Angaben der Befragten erschwert. Da die meisten Statistikprogrammpakete (wie z.B.
SAS, SPSS, STATA) Verknüpfungen verschiedener Datensätze nur dann erlauben,
wenn die zur Zusammenführung verwandte Schlüssel (z.B. Namen oder Matrikelnummern) in den jeweiligen Datenbanken vollständig übereinstimmen, müssen häufig die Schlüssel zahlreicher Datensätze manuell bereinigt werden. Liegen tatsächlich Daten aus unterschiedlichen Quellen in dem in der Sozialforschung üblichen
Umfang vor, dann kann der erforderliche manuelle Aufwand mehrere Arbeitswochen beanspruchen. Oft führt allein dieser Sachverhalt dazu, dass existierende
Datenbestände nicht zusammengeführt werden.
Die maschinelle Verknüpfung von fehlerbehafteten Daten erfordert spezielle Software, die bislang faktisch kaum allgemein verfügbar war.4 Da zudem kaum Untersuchungen zu den verwendeten Algorithmen auf der Basis realer Datenbestände
existierten, haben wir im Rahmen eines DFG-Projekts ein eigenes Record-LinkageProgramm entwickelt. Eine vorläufige Version dieses Programms steht nunmehr
zum Download bereit (vgl. Abschnitt 4).
2 Im Gegensatz dazu werden bei der „Datenfusion“ Daten unterschiedlicher Objekte zusammen-
geführt.
3 Bei solchen Projekten ergeben sich erhebliche Datenschutzprobleme; daher wird im Regelfall
eine schriftliche Einverständniserklärung der Befragten mit der Zusammenführung erforderlich
sein.
4 In der statistischen Literatur sind vor allem die Programme „Matcher-2“ des „US-Bureau of the
Census“ (Winkler 1999) sowie OXLINK (Gill 1999) bekannt. Beide Programme sind schwer
zugänglich, weiterhin ist OXLINK auf Grund besonderer Hard- und Softwarevoraussetzungen
kaum portabel; Matcher-2 läuft zwar auf Standard-PCs, ist jedoch nur schwer adaptierbar und
wenig benutzerfreundlich.
ZA-Information 56
2
95
Durchführung eines Record-Linkage-Prozesses mit MTB
Der tatsächliche Ablauf eines Record-Linkage-Prozesses besteht aus
1. der Bereitstellung der zu verknüpfenden Datensätze
2. der Standardisierung der Verknüpfungsschlüssel
3. der Berechnung der Ähnlichkeiten der potentiellen Paare
4. der manuellen Verknüpfung ungeklärter Fälle
5. der tatsächlichen Zusammenführung der Datensätze.
Der erste und der letzte Punkt sind technisch trivial. Für die Konvertierung von
Datensätzen in das STATA-Format stehen kommerzielle Programme wie z.B.
„DBMScopy“ und „Stat/Transfer“ sowie frei zugängliche Software zur Verfügung
(z.B. die Bibliothek „foreign“ in „R“)5. Die tatsächliche Zusammenführung erfolgt
innerhalb von STATA durch das „Merge“-Kommando. Zur Ausführung der
Arbeitsschritte 2. bis 4. dienen die drei Module der Merge-Toolbox (MTB):
ƒ
„Pre-processing Tool“,
ƒ
„Deterministisches Record Linkage“
ƒ
„Manual Merge Modul“
Die drei Module von MTB wurden entwickelt, um die beschriebenen nicht-trivialen
Schritte eines Record-Linkage-Prozesses zu erleichtern. Alle Module sind unabhängig voneinander laufende Programme. Alle Module wurden als JAVA-Programme
realisiert und sind damit unter allen üblichen Betriebssystemen (Linux, Mac-OS,
Windows) lauffähig. Das Standarddatenformat der MTB ist das Datenformat von
STATA-8.6 Neben STATA-8 kann das Pre-processing-Modul der MTB ASCII-Files
(CSV) lesen, welche von fast jedem Datenbank- bzw. Statistikprogramm erzeugt
werden können. Alle Module verwenden STATA-8 als Format für die Datenausgabe.
2.1 Die Standardisierung der Verknüpfungsschlüssel
Das Modul „Pre-processing“ enthält eine Reihe von Prozeduren zur Standardisierung von Verknüpfungsschlüsseln. Solche Standardisierungen sind z.B. notwendig,
wenn die Schlüssel oft in den beiden zu verknüpfenden Datenfiles in unterschiedlicher
Schreibweise auftreten, man denke etwa an Dr. und Doktor oder Str. und Straße. So
trivial solche Prozeduren auch scheinen mögen: Mit Standardsoftware sind diese
Operationen nicht möglich.
5 Einzelheiten zu DBMScopy finden sich unter www.dataflux.com, Details zu Stat/Transfer unter
http://www.stattransfer.com und die Sammlung von Bibliotheken und Programmen zu R über
http://cran.r-project.org.
6 Das Datenformat von STATA ist öffentlich dokumentiert und über alle verfügbaren Plattformen
binärkompatibel, d.h. STATA-Datenfiles können problemlos zwischen unterschiedlichen
Betriebssystemen ausgetauscht werden, vgl. StataCorp. (2003).
96
Abbildung 1
ZA-Information 56
Pre-processing Tool
Die beiden zu verknüpfenden Datensätze werden nacheinander mittels des Preprocessing-Tools standardisiert. Nach dem Laden des jeweiligen Datensatzes wird
dieser doppelt in den beiden nebeneinander liegenden Fenstern dargestellt. Damit
der Anwender die Effekte der ausgewählten Prozeduren direkt nachvollziehen kann,
werden im rechten Fenster die Veränderungen in den geänderten Datenzellen grün
markiert dargestellt, während im linken Fenster die Daten in ihrer ursprünglichen
Form zu sehen sind. Vor der Ausführung eines jeden Vorgangs wird durch einen
Klick auf den Variablennamen im rechten Fenster die zu bearbeitende Variable
ausgewählt. Alle Standardisierungsprozeduren finden sich im Menü Process.
Der Menübefehl Replace Umlauts ersetzt in der gewählten Datenspalte die Umlaute
„ä“, „ö“ und „ü“ mit „ae“, „oe“ und „ue“, um verschiedenen Schreibformaten vorzubeugen.
Der Menübefehl Slack erlaubt die Auswahl einer so genannten slack list (ein ASCIIFile, welches zu entfernende Zeichenketten enthält). Aus der markierten Variablen
werden durch die Auswahl einer Slack-Liste alle dort verzeichneten Zeichenketten
entfernt. Solche Entfernungen sind etwa dann nötig, wenn die Datenfiles oft auftretende Namensbestandteile aufweisen wie etwa die Präfixe O’ und Mac/Mc bei englischen Namen oder GmbH, Firma, Rechtsanwaltskanzlei bei Firmennamen. Diese
sollten entfernt werden, weil sie wenig zur Differenzierung von unterschiedlichen
Objekten beitragen und sie eine etwaige Ähnlichkeitsberechnung dominieren könn-
ZA-Information 56
97
ten. Der Benutzer sollte je nach Anwendung seine eigene Slack-Liste zusammenstellen. Dies kann z.B. eine Liste von Titeln sein, die aus Nachnamensfeldern entfernt werden sollen.
Der Befehl Parse dient zum Umgang mit Doppelnamen. Nach dem Aufruf des Befehls ist festzulegen, anhand welcher Trennung Doppelnamen erkannt werden sollen. Zur Auswahl steht die Trennung durch Leerzeichen, Großbuchstaben oder
Bindestrich. Mittels wiederholter Ausführung können diese Optionen kombiniert
werden. Wird eine Option aktiviert, werden zusätzlich zu der ursprünglichen Datenzeile automatisch zwei weitere Datenzeilen erzeugt, welche jeweils nur einen der
Namensteile enthalten und ansonsten mit der ursprünglichen Datenzeile identisch
sind. Der Doppelname „Müller-Thurgau“ resultiert in drei Datenzeilen „MüllerThurgau“, „Müller“ und „Thurgau“.
2.2 Deterministisches Record-Linkage
Mit Hilfe des Moduls „Deterministisches Record-Linkage“ werden nun die beiden
Datenfiles über die zuvor standardisierten Verknüpfungsschlüssel zusammengeführt. Hierzu berechnet das Modul die Ähnlichkeit zwischen den Schlüsseln potentieller Record-Paare. Die grundlegende Idee hierbei ist, dass zwei sehr ähnliche
Schlüssel eher aus zusammengehörenden Datenzeilen stammen sollten. Die Ähnlichkeit zweier Schlüssel wird durch die Berechnung von Stringähnlichkeitsfunktionen ermittelt.
Das Argument einer Stringähnlichkeitsfunktion ist ein Paar von Zeichenketten –
z.B. zwei Namen –, deren Ähnlichkeit als Funktionswert wiedergegeben wird. Der
Wertebereich der in MTB implementierten Stringähnlichkeitsfunktionen ist stets auf
das Intervall zwischen 0 und 1 normiert, so dass ein Funktionswert näher an 1 eine
größere Ähnlichkeit für zwei Zeichenketten ausdrückt. Sind die beiden Zeichenketten identisch, wird ein Funktionswert von 1 wiedergegeben.
Derzeit sind 24 verschiedene solcher Funktionen implementiert.7 Die Vergleichsergebnisse beliebig vieler Algorithmen können zu einem Wert zusammengefasst werden. Anschließend gibt das Programm für jeden Fall eine vom Benutzer gewünschte
Anzahl derjenigen Records aus, welche die besten Übereinstimmungen in den
Schlüsseln aufweisen. Das Prinzip der Zusammenführung besteht bei einer deterministischen Verknüpfung darin, dass zuerst für jedes Record-Paar eine Ähnlichkeit
7 Einzelheiten finden sich bei Schnell u.a. (2004).
98
ZA-Information 56
berechnet wird und dann Paare oberhalb eines geeigneten Schwellenwertes als
„Positive“, die anderen Paare als „Negative“ klassifiziert werden.
Da jeder Fall mit jedem anderen Fall verglichen wird, fallen bei zwei Datenfiles der
Größen na und nb na*nb Vergleiche an. Bei größeren Fallzahlen wächst daher die
Rechenzeit über vertretbare Grenzen hinaus. Die Rechenzeit wird dann in der Regel
dadurch begrenzt, dass der Vergleich potentieller Paare auf Teilmengen beschränkt
wird: Blocking. Die Teilmengen werden durch Variablen definiert, die als relativ
fehlerfrei betrachtet werden: z.B. durch Postleitzahlen bei Betrieben. Die Berechnung der Ähnlichkeit würde hier nur zwischen solchen Fällen stattfinden, welche
dieselbe Postleitzahl aufweisen. Das Modul erlaubt die Definition eines BlockingSchemas durch Kombination beliebig vieler Blockingvariablen. Es können keine,
eine oder mehrere Block-Variablen festgelegt werden. Sind es mehrere, werden die
Blöcke durch die Wertekombinationen aller Block-Variablen definiert.
Der Anwender legt zunächst im Bereich „In/Out Data“ über die Eingabefelder
„A-File“ und „B-File“ die beiden Datenfiles fest. Dabei sollte der kleinere der beiden Datensätze als B-File festgelegt werden, weil MTB nur den B-File komplett in
den Arbeitsspeicher lädt. Während des Record-Linkage-Prozesses erzeugt MTB
zwei neue Dateien, ein so genanntes „Log-File“, in dem die beim Starten des letzten
Merge-Prozesses gültigen Einstellungen und die Laufzeiten dokumentiert werden
und das „Out-File“, in das die Ausgabe der Ähnlichkeitsberechnungen geschrieben
wird. Log-Files sind ASCII-Dateien, Out-Files werden als STATA-Files geschrieben.
In den Feldern „Out-File“ (vgl. Abbildung 2) und „Log-File“ legt der Anwender
den Speicherort dieser Dateien fest. Im Bereich „Out variables“ wird über die
Knöpfe „Add“ und „Remove“ festgelegt, welche Variablen aus den beiden InputFiles in das Out-File geschrieben werden.
Dabei sollte der Benutzer darauf achten, vorher sowohl im A- als auch im B-File
eine Identifizierungsvariable anzulegen und das Programm anzuweisen, die beiden
Variablen in das Outfile zu schreiben. Über diese Identifizierungsvariablen kann
später die eigentliche Verknüpfung der beiden Ausgangsfiles vorgenommen werden.8
In den unteren Bereichen des Fensters wird der eigentliche Verknüpfungsprozess
spezifiziert. Im Bereich „Block by“ wird über den Button „Add...“ festgelegt, nach
welchen Variablen während der Verknüpfung „geblockt“ werden soll, d.h. innerhalb
8 Ebenso können über diese ID-Variablen mittels des „Manual Merge“-Moduls, die um die auto-
matisch gefundenen Zuordnungen reduzierten Datenfiles für die manuelle Nachbereitung gewonnen werden (vgl. Abschnitt 2.3).
ZA-Information 56
Abbildung 2
99
Deterministisches Record Linkage
welcher Gruppen („Blöcke“) die Ähnlichkeitsberechnungen erfolgen sollen. Für
numerische Variablen kann zwischen Blocken nach exakter Übereinstimmung oder
innerhalb einer Abweichung von +/- 1 gewählt werden.
Die Auswahl der gewünschten Stringähnlichkeitsfunktionen erfolgt im Bereich
„Merge by“. Durch den Knopf „Add...“ werden die Variablen angegeben, die den
gewünschten Verknüpfungsschlüssel im jeweiligen File enthalten. Dann wird über
das mittlere Pull-Down-Menü die Ähnlichkeitsfunktion für diesen Schlüssel ausgewählt. Es können auch mehrere Verknüpfungsschlüssel mit unterschiedlichen Ähnlichkeitsfunktionen bestimmt werden (in diesem Fall werden die jeweils resultierenden Ähnlichkeitswerte zu einer Gesamtähnlichkeit addiert).
Über das Feld „Number of best matches“ (vgl. Abbildung 3) wird festgelegt, wie
viele Zuordnungen aus dem B-File für jeden Fall aus dem A-File in das Out-File
geschrieben werden. Gibt der Anwender etwa „25“ an, so werden zu jeder Zeile des
A-Files die 25 Zeilen aus dem B-File mit den höchsten Ähnlichkeitswerten in das
Out-File geschrieben. Soll nur der Fall mit der bestmöglichen Übereinstimmung
zugeschrieben werden, ist entsprechend „1“ anzugeben.
100
Abbildung 3
ZA-Information 56
Deterministisches Record Linkage: Number of best matches
2.3 Manuelle Verknüpfung mittels „Manual Merge“
Ist nach der deterministischen Verknüpfung nicht allen Records des A-Files ein Record des B-Files zugeordnet, kann durch das Modul „Manual Merge“ eine manuelle
Zuordnung erfolgen.9 Dazu stellt das Manual-Merge-Modul die beiden zu verbindenden Datensätze in zwei Datenfenstern dar. Beide Datensätze können gleichzeitig
und unabhängig voneinander durchsucht werden; entsprechend können die beiden
Datenfenster unabhängig voneinander „gescrollt“ werden. Weiterhin ist eine unabhängige Sortierung der Datensätze nach verschiedenen Kriterien möglich. Glaubt
der Anwender, ein zueinander gehörendes Record-Paar erkannt zu haben, klickt er
mit der Maus nacheinander auf die Records. Durch Betätigen der rechten Maustaste
wird dieses Paar dann als „definite pair“ oder „probable pair“ klassifiziert. Je nach
Klassifizierung werden die betreffenden Records aus den Hauptfenstern entfernt
und in den Datenfenstern im unteren Bereich der Oberfläche angezeigt (vgl.
Abbildung 4 unten). Die resultierenden Listen von „Record-Paaren“ lassen sich über
das Menü „File“ speichern.
9 Derzeit müssen dazu die bereits automatisch zugeordneten Records durch den Benutzer über im
Outfile enthaltene Identifizierungsvariablen aus den zu verbindenden Datensätzen entfernt werden. Die Automatisierung dieses Arbeitsschrittes ist in Planung. Es soll dann möglich sein, die
nicht automatisch zugeordneten Records direkt in das „Manual Merge“- Modul zu laden.
ZA-Information 56
101
Wesentlich vereinfacht wird die manuelle Suche in großen Datensätzen durch die
Bildung von Subgruppen. Die Subgruppenbildung erfolgt, um – ähnlich dem
„Blocken“ – die Anzahl der zu vergleichenden Paare im Rahmen zu halten, wobei
die aus Sicht des Anwenders am ehesten in Frage kommenden Vergleichsfälle ausgewählt werden sollen. Innerhalb des Moduls können solche Subgruppen durch die
Verwendung so genannter „regulärer Ausdrücke“10 gebildet werden. Weiterhin ist
die Bildung von Subgruppen durch die Angabe einer minimalen Ähnlichkeit zweier
Strings möglich. Alle Subgruppenbildungsbefehle werden gespeichert und können
durch einen Mausklick wiederholt werden. Die Subgruppenbildung erfolgt durch
einen rechten Mausklick in das Feld „Subgroups“ unter den Hauptfenstern. Aus
dem dann erscheinenden Menü kann die angestrebte Art der Subgruppenbildung
ausgewählt werden. Hierzu stehen drei Möglichkeiten zur Verfügung.
Durch den Befehl „Add LIKE restriction“ lassen sich Subgruppen durch die Angabe
regulärer Ausdrücke für die gewünschte Variable bilden. Gibt man z.B. für eine
Variable mit Nachnamen den Ausdruck „F.*“ an, so werden alle Fälle mit Nachnamen, die mit dem Buchstaben „F“ beginnen, als Subgruppe definiert. Durch einen
Doppelklick auf eine Zeile im „Subgroups“-Fenster wird die entsprechende Subgruppe in das Hauptfenster geladen.
Durch den Befehl „Add Approxlike restriction“ (vgl. Abbildung 5) lassen sich Subgruppen bilden, deren Mitglieder eine gewisse Ähnlichkeit (gemäß einer wählbaren
Stringähnlichkeitsfunktion) in Hinsicht auf einen Ausdruck aufweisen. Wird z.B.
der Ausdruck „Mueller“ festgelegt und als Stringähnlichkeitsfunktion die Zahl der
gemeinsamen Buchstabenpaare im Verhältnis zur Länge des Schlüssels mit dem
Schwellenwert 0.9 ausgewählt, so enthält die Subgruppe alle Fälle, deren Namen zu
„Mueller“ mindestens die so genannte Bigramm-Ähnlichkeit 0.9 aufweisen.
Eine weitere Möglichkeit ist die Subgruppenbildung aus der Schnittmenge bereits
bestehender Subgruppen. Dies erfolgt durch den Befehl „clone selected objects“.
10 „Reguläre Ausdrücke“ (im Unix-Sprachgebrauch kurz „regexp“) sind Suchmasken, bei denen
die gesuchten Zeichen durch spezielle Symbole ersetzt werden. So findet z. B. der reguläre
Ausdruck „Me.*er“ jedes Record, in dem „Me“ nach beliebig vielen Zeichen von „er“ gefolgt
wird, also z. B. „Meyer“, „Meier“, „Meer“ oder „Meter“.
102
ZA-Information 56
Abbildung 4
Manual Merge Modul
Abbildung 5
Manual Merge Modul: Approxlike restriction
ZA-Information 56
3
103
Weiterentwicklung
Die Projektgruppe arbeitet an der Implementierung eines so genannten „probabilistischen Record-Linkage-Moduls“, das u.a. eine Schätzung optimaler Schwellenwerte für die Bestimmung der Ähnlichkeit zweier potentieller Record-Paare erlaubt. Weiterhin wurden umfangreiche Namensdatenbanken (getrennt nach Nationalität und Geschlecht) aufgebaut, welche die Korrektur fehlerhafter Schlüssel erleichtern sollen. Schließlich bemüht sich die Arbeitsgruppe innerhalb eines neuen
Projekts („Safe-Link“) um die Implementierung und öffentliche Bereitstellung datenschutzrechtlich unbedenklicher Record-Linkage-Verfahren.
4
Programmverfügbarkeit
Mit MTB steht der empirischen Sozialforschung nunmehr ein funktionsfähiges
Softwarepaket zur Durchführung von Record-Linkage-Anwendungen zur Verfügung. Die derzeitige, vorläufige Version des Programms kann für akademische
Zwecke kostenlos von der Homepage des Projekts heruntergeladen werden.11 Bei
Anwendungen des Programms wären die Autoren für eine Mitteilung und eine angemessene Zitierweise dankbar.
Literatur
Fürnrohr, M., Rimmelspacher, B., von Roncador, T. (2002): Zusammenführung von Datenbeständen ohne
numerische Identifikatoren: ein Verfahren im Rahmen der Testuntersuchungen zu einem registergestützten
Zensus. In: Bayern in Zahlen, 7, S. 308-321.
Gill, L.E. OX-LINK: The Oxford Medical Record Linkage System, In: National Research Council (NRC)
(1999): Record Linkage Techniques - 1997. Proceedings of an International Workshop and Exposition, Washington, S. 15-33.
Heller, G., Schnell, R., Schmidt, S. (2001): Welchen Einfluss hat die subpartuale Asphyxie auf die spätere
gesundheitliche Entwicklung? In: Der Gynäkologe, 34, 2, S. 126-129.
Schnell, R., Bachteler, T., Bender, S. (2003): Record linkage using error prone strings; In: American Statistical Association, Proceedings of the Joint Statistical Meetings, S. 3713-3717.
Schnell, R., Bachteler, T., Bender, S. (2004): A toolbox for record linkage; In: Austrian Journal of Statistics,
33, 1-2, S. 125-133.
StataCorp. (2003): Stata Statistical Software, Release 8.0, College Station, Texas (Stata Corporation).
Winkler, W.E. (1999): The State of Record Linkage and Current Research Problems. Statistics of Income
Division, Internal Revenue Service Publication. Washington D.C., US Bureau of the Census, Statistical Research Division.
11 Die Homepage des Projekts ist http://www.uni-konstanz.de/FuF/Verwiss/Schnell/recordli.html.
104
ZA-Information 56
Berlin-Datenbank von Prof. H. Hurwitz:
Präsentation im Dezember in Berlin
von Ekkehard Mochmann
Prof. Dr. Harold Hurwitz lehrte bis
zu seiner Pensionierung 1988 am
Fachbereich Politische Wissenschaft;
seine Forschungen führte er am
Zentralinstitut für Sozialwissenschaftliche Forschung der Freien
Universität Berlin durch. Im Mittelpunkt stand viele Jahre sein Umfrageprogramm, das er in Reaktion
auf das Chrutschow-Ultimatum vom
Herbst 1958 für die Senatskanzlei konzipierte. Die Daten und Auswertungsberichte
hat er in seinem Forschungsarchiv über die Jahrzehnte hinweg gehütet. In den vergangenen Jahren hat das Zentralarchiv Arbeiten unterstützt, diese einmalige Sammlung für weitere Analysen zu erschließen.
Die Dokumente wurden von Hans-Berthold Hohmann in einer Datenbank im PDF
Format für den direkten Zugriff auf die zugehörigen Analysedateien aufbereitet.
Außer Dokumenten zur Entstehung des Umfrageprogramms werden Berichte, dazu
gehörige Briefe und auch vertrauliche Vermerke im Landesarchiv Berlin deponiert.
Die Daten und Dokumente stehen im Zentralarchiv als Datenbank auf DVD zur
Verfügung und werden z. Zt. in Kooperation mit dem Otto-Stammer-Zentrum
der FU Berlin für den Internet Zugriff vorbereitet. Der nachfolgende Beitrag von
Harold Hurwitz erläutert die Hintergründe der Entstehung und lässt das reiche
Analysepotential dieses Datenschatzes für die Einstellungsforschung im zeitgeschichtlichen Kontext der Berliner Nachkriegsentwicklung erkennen. In der Datenbank ist dieser Beitrag enthalten und – wie in der gesamten Sammlung – mit Links
zu allen hier angesprochenen Daten und Dokumenten versehen.
Die Datenbank wird voraussichtlich am Freitag den 16. Dezember 2005 von Prof.
Hurwitz, H. Hohmann und Weggefährten in Berlin präsentiert. Interessenten können
sich jetzt schon beim ZA für eine Teilnahme vormerken lassen: [email protected]
ZA-Information 56
105
Wie es dazu kam:
Meine Sammlung von Primärdaten und Dokumenten
zur Politik in Berlin nach dem zweiten Weltkrieg
In Memoriam Heinz Fanselau (1935-2001)
als Dank für langjährige Förderung
von Harold Hurwitz 1
In der Sammlung von Daten und Dokumenten, die z.Zt. als DVD beim ZA verfügbar ist2, werden die Ergebnisse eines Prozesses des Lernens und Forschens erfasst,
der vor fast sechzig Jahre begann und mich schließlich an den Punkt brachte, der
Richard Löwenthal zu der Feststellung veranlasste:
"It became his life work to unravel the paradox of a city whose population, 'the Berliners', personified resistance to communism and yet gladly became conductors of
détente between East and West."
1
Der Beginn meines Interesses für Deutschland und die Soziologie
Es begann zur Zeit des Ausbruchs des Zweiten Weltkriegs. Im Jahre 1939 war ich
15 Jahre alt, aber die persönliche Bekanntschaft mit Menschen, die aus rassischen
und politischen Gründen Deutschland hatten entfliehen müssen, würde mich bald
veranlassen, fortan intensiver zu fragen, weshalb der Wille zur Demokratie in
Deutschland, dessen historische Manifestationen bereits mein Interesse weckten,
sich immer wieder als zu schwach und hilflos erwiesen hatte. Zum Romantisieren
geneigt, beschäftige ich mich im College mit dem Scheitern der bayrischen Revolution von 1918-19 und mit Kurt Eisner, der als ethischer Sozialist die missglückte
Revolution von 1848 wiedergutmachen wollte. Und ich interessierte mich für das
Dilemma von Ernst Toller, einem Pazifisten, der im Exil immer noch an ein "anderes
1 Dr. Harold Hurwitz war Professor für politische Soziologie am Zentralinstitut für Sozialwissenschaftliche Forschung (ZI6) der Freien Universität Berlin (jetzt Otto-Stammer-Zentrum) und
davor langjähriger Berater des damaligen Regierenden Bürgermeisters Willy Brandt.
2 Mein Dank gilt Hans-Berthold Hohmann, MA, Diplom-Politologe, der diese Sammlung
grundlegend konzipiert und erstellt hat.
106
ZA-Information 56
Deutschland" glaubte, aber zu einem Mahner wurde, der schließlich meinte, dass
die westlichen Demokratien Hitlers Reich auch militärisch bekämpfen müssten.
Als graduate student der Soziologie an der Columbia University bereitete ich mich
auf eine Dissertation über die bayrische Revolution vor und nahm, mit nur zwei anderen Amerikanern, bei den dort beherbergten brillanten, aber damals ziemlich isolierten, Exilanten der Frankfurter Schule an einem zweisemestrigen Seminar über
autoritäre Tradierung in Deutschland teil. Um zu Forschungszwecken nach Bayern
zu gelangen, bewarb ich mich um eine zivile Stelle in der U.S.-Militärregierung,
wurde aber im November 1946 nicht nach München, sondern nach Berlin geschickt.
So bin ich Wahlberliner auf Dauer geworden. Erst Jahre danach sollte ich eine ganz
andere Dissertation schreiben. Aber aus dem damaligen Impuls des amerikanischen
Schülers und Studenten nährt sich bis heute die Neugier eines Sozialwissenschaftlers, der Zeit seines Lebens zeitgeschichtlich in und über Deutschland gearbeitet
hat.
Insofern haben die Ursprünge meines Interesses am Problem von Demokratie und
Autoritarismus in Deutschland auch mit der Datensammlung zu tun, die aus Erhebungen besteht, welche ich als wissenschaftlicher Berater von Willy Brandt und
Egon Bahr selbst durchgeführt oder anschließend an der Freien Universität gesammelt habe; Erhebungen über Einstellungen und Lebenserfahrungen von WestBerlinern, die während des Kalten Krieges und der Zeit, als diese Stadt eine Versuchsstation für die Entspannungspolitik ihrer demokratisch gewählten politischen
Führung geworden war, zu Betroffenen bzw. zu Mittragenden wurden.3
Beim Soziologiestudium an der Columbia University hatte ich angesichts der genannten Interessen keine Zeit gefunden, auch Kurse über Statistik und quantitative
Forschungsmethoden zu belegen. Deshalb habe ich an Paul Lazarsfelds Lehrveranstaltungen nicht teilgenommen. Die Analyse-Methoden dieses Meisters lernte ich
erst anhand der empirischen Untersuchungen von Robert K. Merton kennen; er
wurde für mich zum Mentor und dessen Auffassung vom structural functionalism
und von einer schrittweisen Theorie-Entwicklung über Theorien mittlerer Reichweite
wurde für mich als Empiriker richtungweisend. Einen ersten Geschmack von den
Deutungsmöglichkeiten der deskriptiven Statistik bekam ich gleichwohl in Robert
MacIvers Grundkurs über Social Causation. Damit war ich aber überhaupt nicht auf
die Aufgaben einer quantitativen Forschung vorbereitet, um die es in dieser Datensammlung gehen würde.
3 Siehe hierzu: Harold Hurwitz: Mein Leben in Berlin. In: Leviathan, Heft 2, Juni 1999, S. 264279.
ZA-Information 56
2
107
Erste empirische Forschung in Deutschland
Dass es dennoch dazu kommen würde, hat damit zu tun, dass damals in Deutschland Methoden der quantifizierenden Sozialforschung und der multivariaten Analyse mit "weichen" Indikatoren fast unbekannt waren. Als ich 1947 bei der Zentralstelle für Medienkontrolle der U.S.-Militärregierung (Information Control Division,
ICD, OMGUS) zuerst in der Forschung beschäftigt wurde, erfuhr ich von Repräsentativumfragen in Berlin, die außerhalb der bekannten ICD-Berichtsreihen seit 1945
durchgeführt und während der Blockade intensiviert wurden.4 Eigene Erfahrungen
machte ich erst, als sich 1947 mein Vorschlag realisieren ließ, auf der Bielefelder
Tagung des Sozialistischen Deutschen Studentenbundes (SDS) eine schriftliche Befragung der Teilnehmer zu ihrer sozialen Herkunft und ihrem politischen Werdegang
durchzuführen.5 Schließlich versuchte ich, in einem leider nicht zu Ende geführten
Projekt, bei der Auswertung von Intensivinterviews mit KPD/SED-Mitgliedern, die
anhand eines standardisierten Fragenschemas gemacht worden waren, quantitative
Vergleiche anzustellen.6
3
Mein Start in Berlin
Nachdem ich im Sommer 1949 aus dem amerikanischen Regierungsdienst hatte
ausscheiden müssen, wurde ich freiberuflich tätig und studierte an der Freien Universität Berlin. So konnte ich mich zwei Aufgaben widmen, die später für mich
wichtig wurden. Ich schrieb eine wissenssoziologisch relevante Monografie zur
Wandlung bolschewistischer Geschichtsschreibung in der UdSSR7 und forschte
zweieinhalb Jahre lang für Willy Brandt und Richard Löwenthal über das Leben
von Ernst Reuter.8
4 Diese Berichte, Tabellen etc. wurden ausgewertet in: Harold Hurwitz, Demokratie und Antikommunismus in Berlin nach 1945, Band I: Die politische Kultur der Bevölkerung und der
Neubeginn konservativer Politik, Köln 1983, Kapitel 1 bis 3, S. 21-214.
Eine detaillierte Erläuterung der Sonderberichtsmaterialien in Kapitel 1, Anmerkung 1, S. 333335. Diese Dokumente stehen sowohl hier als auch im Landesarchiv Berlin, Deposition Hurwitz
(2100-2107) zur Verfügung.
Zur Methode der Indikatorenfindung siehe Anmerkung 1 zu Kapitel 2, S. 345.
5 German Socialist University Youth, Information Control Review (ICR), ICD/ISD, OMGUS,
No. 29, 5. Juli 1947. Die Befragung fand ebenfalls 1948 bei SDS-Mitgliedern in Frankfurt statt.
Die ausgefüllten Fragebögen und Arbeitsnotizen befinden sich neben SDS-Dokumenten im
Landesarchiv Berlin, Deposition Hurwitz.
6 Befragungsschema und Intensivinterviews (4 Ordner) sind in der Bibliothek des Zentrums für
Zeithistorische Forschung (ZZF) in Potsdam deponiert.
7 Siehe Franz Borkenau, Das Jahr 1917 (Sonderdruck Der Monat), 1952, 48 S.
8 Willy Brandt u. Richard Löwenthal, Ernst Reuter. Ein Leben für die Freiheit, München 1957.
108
ZA-Information 56
Zur gleichen Zeit, in den Jahren 1950 bis 1956, nahm für mich die empirische Feldforschung einen Stellenwert ein, der das schrittweise Nachholen dessen erforderlich
machte, was ich während meines Soziologiestudiums an der Columbia University
versäumt hatte. Damals herrschte anhaltende Massenarbeitslosigkeit in West-Berlin,
weshalb ich mit zwei Erhebungen betraut wurde: Die erste wurde mit amerikanischen
Forschungsmitteln vom DGB bundesweit durchgeführt, die zweite im Auftrag des
Berliner Senators für Sozialwesen. Diese Aufträge boten 20 bis 30 Soziologie- und
Psychologie-Studenten der Freien Universität neben willkommener Beschäftigung
als Interviewer auch die Möglichkeit einer Empirie-Ausbildung. Als Leiter der zentralen Forschungsstelle in Berlin konnten Heinz Kluth und ich für die methodische
Vielfalt unserer Untersuchungen über arbeitslose Jugendliche in der Bundesrepublik
sorgen. Wir erfuhren, was multivariate Tabellenanalyse mit Hilfe einer IBMFachzählsortiermaschine bedeuten konnte.9
Noch lehrreicher für mich und Dieter Claessens war in dieser Hinsicht unsere Untersuchung über die Sicherungsleistungen von Sozialunterstützungsempfängern in
West-Berlin,10 denn hier ging es darum, Unterschieden in den zeitgeschichtlich beeinflussten Lebensläufen der Rezipienten Rechnung zu tragen. Auf Grund dieser
Erfahrung lernte ich, dass erst die zusammenhängende Betrachtung von beruflichem
Werdegang, Familienverpflichtungen und Alter mit den zeitgeschichtlichen Kontextbedingungen ein Indikatorenbündel definiert, welches das Schicksal oder die
Verhaltensweisen jedes Einzelnen zwar nicht exakt oder ausreichend erklärt, sich
dem aber auf griffige und plausible Weise annähert. Das gilt in weit stärkeren Maße
für meine Dissertation, wo ich Erhebungen auswertete, die ich früher einmal für den
Monat, eine seit 1948 von Melvin J. Lasky in amerikanischem Auftrag herausgegebene, sehr anspruchsvolle "Internationale Zeitschrift für Politik und geistiges Leben", durchgeführt hatte. Mit einem schriftlichen Fragebogen wurden in der DDR
und Ost-Berlin beheimatete Leser anonym interviewt, als sie Exemplare in Westberliner Lesesälen und den dortigen "Ostbüros" der demokratischen Parteien und Verbände abholten. Die Erhebungen fanden 1952 und 1954 statt, also vor und nach
9 Schelsky u.a., Arbeitslosigkeit und Berufsnot der Jugend, Bund-Verlag 1952. Siehe Landesarchiv Berlin, Deposition Hurwitz.
10 Harold Hurwitz u. Dieter Claessens, Die Sozialunterstützten in West-Berlin, nach ihrer wirtschaftlichen und sozialen Stellung in der Vergangenheit unter besonderer Berücksichtigung
einmal getroffener Sicherungsmaßnahmen, In: Soziale Arbeit, 4. Jahrgang/Heft 3 (März 1955),
112-162.
ZA-Information 56
109
dem Arbeiteraufstand vom Juni 1953. Zum Vergleich ließ sich eine Erhebung der
Leser in der BRD und West-Berlin heranziehen.11
Das Mitnehmen und vor allem das Weiterreichen von Exemplaren des Monat bedeuteten ein Risiko in der DDR. Das Kommunikationsverhalten der "heimlichen
Leser" und der Bereitschaft, sich anderen anzuvertrauen variierte stark mit Alter,
Beruf und sozialer Stellung. Deswegen schien das Weiterreichen illegaler Zeitschriften als Indikator für die Bereitschaft zu aktivem Dissens in der DDRGesellschaft geeignet zu sein. Unter Vorbehalt betrachtet schienen solche Verhaltensweisen soziologisch aufschlussreich zu sein hinsichtlich der Zustände und Vergesellschaftungsprozesse (wie Anpassung und Abkapselung: Nischendasein). So
konnte der Frage nach Möglichkeiten spontaner Vergesellschaftung unter dem Totalitarismus realistischer nachgegangen werden. Denn damals, siehe Hannah Arendt,
verstand man Totalitarismus als Herrschaftssystem in dem weit reichenden Sinne,
dass es die Fähigkeit besaß, eine Gesellschaft bis zur "Atomisierung" gleichzuschalten und danach Mensch und Gesellschaft ganz neu zu erschaffen.
Nicht zu realisieren war ein Vorschlag, den ich dem Kongress für die Freiheit der
Kultur im April 1951 unterbreitet hatte, um Erkenntnisse über das "Widerstandspotenzial" in der West-Berliner Bevölkerung zu erhalten.12 Dazu sollten auch Fragen
nach den Zuständen in der DDR beantwortet werden, die indirekt über Eindrücke
nach Gesprächen von West-Berlinern mit Verwandten, Freunden und Bekannten in
Ost-Berlin und der "Zone" berichten. Themen und Inhalte sollten nicht explizit politisch, wohl aber politisch relevant sein. Jahre danach, zur Zeit der Passierscheinaktionen, also der ersten entspannungspolitischen Schritte des Berliner Senats, schien
mir dieses gewiss nicht unumstrittene Instrument einer indirekten Ermittlung jedenfalls erprobungswürdig zu sein. Deshalb stehen dem Benutzer entsprechende Variablen (siehe Variablen im ABCDE-Gesamt-File) zur Verfügung.13
11 Harold Hurwitz, Der heimliche Leser: Beiträge zur Soziologie des geistigen Widerstandes,
Köln/Berlin 1966, 441 S. Die multivariaten Auswertungen des heimlichen Lesers erfolgten für
beide Perioden 1952 und 1954 per "handcounting". Im Auftrag der Redaktion hat IBM 1954
vergleichbare Auswertungen maschinell vorgenommen. Das gesamte Material einschließlich
der Fragebögen ist im Landesarchiv Berlin, Deposition Hurwitz.
12 Proposal for an Opinion Survey on the Resistance Potential of West Berliners, April 26, 1951,
im Landesarchiv Berlin, Deposition Hurwitz (2200 A).
13 Die Ergebnisse schienen mit denen von Befragungen ehemaliger Sowjetbürger nach dem Zweiten Weltkrieg und Besucher aus der DDR während der Grünen Woche in West-Berlin übereinzustimmen. Siehe Raymon A. Bauer, Alex Inkeles u. Clyde Kluckhohn, How the Soviet System Works, Cultural, Psychological and Social Themes, Cambridge, Mass, 1956.
Auch die Untersuchungen von Infratest: Viggo Graf Blücher, Industriearbeiterschaft in der
volkseigenen Industrie der SBZ, Stuttgart, 1959. Und die beiden vervielfältigten Berichte von
Infratest: Angestellte in der Sowjetzone Deutschlands, Verhaltensweisen und gesellschaftliche
110
ZA-Information 56
Während der durch das Chruschtschow-Ultimatum vom Herbst 1958 verursachten
zweiten großen und lang andauernden Berlin-Krise musste ich die Fertigstellung
meiner Dissertation14 immer wieder aufschieben. Mein seit langem gehegter
Wunsch, dass es sinnvoll wäre, demoskopische Erhebungen über die politische Moral der Bevölkerung West-Berlins durchzuführen – Untersuchungen der Amerikaner
mit Vergleichsmöglichkeiten aus früheren Zeiten lagen vor – schien sich nach dem
unglücklichen Verlauf der Genfer Konferenz auf dringende Weise zu bestätigen.
Eine entsprechende Anregung habe ich im Juni 1960 an Willy Brandt gerichtet.
4
Zusammenarbeit mit Klaus Schreiber vom Institut für Markt- und
Verbrauchsforschung
Da der für das demoskopische Forschungsprogramm des Instituts für Markt- und
Verbrauchsforschung der Freien Universität Berlin (IfMF) verantwortliche Fachmann, Dr. Klaus Schreiber, ebenso dachte wie ich, besorgte ich die veröffentlichten
Berichte seiner Erhebungen von Herbst 1958 und 1959,15 um den Regierenden Bürgermeister im Sommer 1960 mit einer Auswertung auf "morale levels, deviations,
tensions and strengths" aufmerksam zu machen.16
Aufgrund dieser Erhebungsberichte und statistischer Daten stellte ich fest, dass sich
die Erwartungen der West-Berliner hinsichtlich der wirtschaftlichen Zukunft der
Stadt verschlechtert hatten, obwohl sich die wirtschaftliche Lage Berlins, nach einem Jahr verbaler Drohungen, dank finanzieller Hilfsmaßnahmen materiell verbessert hatte. Dies traf in noch stärkerem Maße zu, wenn nach einer Verbesserung der
wirtschaftlichen Lage des Individuums gefragt wurde. Bedenklich war das schwache
Zuversichtsniveau der Bevölkerung im Hinblick auf das "kommende Jahr". Dagegen war das Vertrauen in die politische Führung Willy Brandts hoch geblieben. Es
galt also, die Imponderabilien dieser Moralkrise der Bevölkerung zu untersuchen.
Die Startbedingungen beim Institut für Markt- und Verbrauchsforschung (IfMF)
schien besonders günstig, weil sie eine zuverlässige Feldarbeit, regelmäßige Trenderhebungen, Blitzumfragen in Ereignisnähe ebenso garantierte wie eine Politikberatung
Einordnung der mitteldeutschen Angestellten, München, Mai 1958 und Alltagsleben der sowjetzonalen Bevölkerung, Alltagsverhaltern und politische Einflüsse, 1959. Siehe dazu Notizen
von Hurwitz im Landesarchiv Berlin, Deposition Hurwitz (001, Notizkasten)
Vgl. auch die Auswertungen von Infas-Erhebungen mit entsprechenden Variablen einschließlich der Analyse "Aspekte der Systemanpassung" von dem DDR-Forscher Ernst Richert.
14 Promotion 1963, Der heimliche Leser, siehe Fußnote 10.
15 Landesarchiv Berlin, Deposition Hurwitz.
16 Expectations of the Berliners as Criteria for their Morale, (Sommer 1960), 15 S.
ZA-Information 56
111
des Senats auf der Basis eigener, schneller Auswertungen. Jedoch scheiterte diese
Hoffnung an der Weigerung des für das Institut zuständigen Ordinarius, einen Senatsauftrag auszuführen. In einem Brief erklärte er, "grundsätzlich nicht in politische Ereignisse eingreifen" zu wollen, obwohl er aus dem Auftragsangebot wusste,
dass "unsere Sorge der Sicherung der Moral der Berliner Bevölkerung während der
gegenwärtigen und vielleicht kommenden Krisen gilt".17
Dennoch gaben wir die Hoffnung auf Kooperation mit dem IfMF nicht gleich auf.
Zum einem wartete der Lehrstuhlinhaber auf eine auswärtige Berufung, zum anderen hatte Dr. Schreiber beste Aussichten auf Bewilligung seines Drittmittelantrages
an die DFG zur Erforschung des Zusammenhangs zwischen wirtschaftlicher und
politischer Moral in der Berliner Bevölkerung.
Die Senatskanzlei war, auf jeden Fall bereit einen Ausweg zu finden. So konnte ich
Überlegungen über die Gestaltung eines langfristigen Erhebungsprogramms anstellen, das sich mit der Fragestellung der politischen Moral der Bevölkerung in einem
bedrohten Berlin befasste. Es war mir klar geworden, dass West-Berliner MoralHaltungen am besten mit solchen Rangordnungsskalen untersucht werden konnten,
denen eine umfassende Fragenbatterie zu Grunde lag, u.a. weil "... one of the major
problems will be to get behind responses given in conformity with the 'what-isexpected-of-a Berliner' role and reach genuine, personal and private judgements ..."18
5
Zusammenarbeit mit Infas
Zugleich mussten wir nach einer Alternativlösung für unsere Pläne Ausschau halten. Das wenige Jahre zuvor gegründete SPD-nahe Institut für angewandte Sozialforschung (Infas) bot sich als Möglichkeit an. (Infas hatte bereits im Sommer 1960
eine Erhebung im Bundesgebiet für die Berliner Senatskanzlei durchgeführt.) Inzwischen hatte ich Frageformulierungen gesammelt, die über die Jahre in WestBerlin von den Amerikanern bzw. in deren Auftrag von DIVO19 angewendet worden waren und sich für Vergleiche eigneten. Einige exakte Trendanschlüsse mit
breaks (Kreuztabellierung) reichten bis in die Blockadezeit zurück. Das galt auch
17 Die hiermit zusammenhängende Korrespondenz befindet sich im Landesarchiv Berlin, Deposition Hurwitz (2200 A).
18 Notes on Planning a Continuing Program of Morale Analysis with Opinion Surveys in Berlin.
Part I, 30. Oktober 1960, 7 S.; Part II, December 1960, 9 S. Landesarchiv Berlin, Deposition
Hurwitz (2200 A).
19 Deutsches Institut für Volksumfragen, Frankfurt
112
ZA-Information 56
für Perspektiv-Fragen des Allensbacher Instituts, die das IfMF regelmäßig benutzt
hatte. Dr. Schreiber war in Allensbach ausgebildet worden, und die Gründer von
Infas kannten sich bei DIVO gut aus. Die Sammlung von Trendfragen legte ich
Egon Bahr mit Erläuterungen vor.20 Als Chef des Presse- und Informationsamtes
der Senatskanzlei war er für Planung und Durchführung des Meinungsforschungsprogramms zuständig.
Man entschied sich erstmals für ein Infas-Angebot, um im April/Mai 1961 eine gediegene Berlin-Umfrage durchführen zu lassen. Sie ist die erste Erhebung im wichtigsten Teil unseres Datenbestandes, eine zeitübergreifende Kumulation, bestehend
aus 83 vergleichbaren Berlin-Erhebungen (ABCDE-Gesamtdatei); die Umfragen
wurden zumeist im Senatsauftrag durchgeführt und reichen in der Gesamtdatei bis
ins Jahr 1971. Insgesamt stehen hier Umfragedaten bis 1974 zur Verfügung.
Zwei Monate nach Errichtung der Mauer ging eine zweite Trenderhebung mit situationsgerechten Ergänzungen ins Feld. Nach der ersten Berichterstattung in Berlin
verbrachte ich zwei Wochen in Bad Godesberg, um in Tag- und Nacht-Arbeit an
der Fachzählsortiermaschine beide Erhebungen gründlich auszuwerten, damit ich
Brandt und Bahr zwischen den Jahren mündlich berichten konnte. Denn es war
deutlich geworden, dass nach zweieinhalb Jahren Aushöhlung der konsensuellen
Abwehrhaltungen der West-Berliner in einer nicht fassbaren, bis dato lediglich auf
verbalen Drohungen beruhende Krise, der Mauerbau für große Teile der Bevölkerung eine Moral fordernde Zäsur darstellte. Aber während die allgemeine Abwehrhaltung gestärkt zu sein schien, zeigten abwanderungsfähige Gruppen, wenn sie
(z.B. im Unterschied zu Beschäftigten im öffentlichen Dienst) nicht an Berlin
gebunden waren, Erschütterungen, die in anderen Schichten selten oder nicht so
deutlich geäußert wurden. Die Thesen, die ich dazu im Januar und Februar 1962 für
den Regierenden Bürgermeister und auf dessen Wunsch für einige mit Berlin befreundete amerikanische und britische Opinion Leaders in englischer Sprache
schrieb, behandelten, wie die Erwartungshaltungen und Forderungen der WestBerliner mitgeprägt waren durch die unterschiedlichen Funktionen und Leistungen
ihrer wichtigsten "Bezugspersonen" bzw. "-kräfte": die Westmächte (als "Schutzmächte"), die Senatsführung (als Vertrauensobjekt angesichts des Charismas von
Willy Brandt) und die Bundesregierung (als gefordertes Objekt und, wie sich herausstellte, als Sündenbock).21
20 Fragenkatalog: Vorschläge und Überlegungen, 10./11. März 1961, 14 S. Landesarchiv Berlin,
Deposition Hurwitz (2200 A)
21 Siehe hierzu das Analyse-Modell in "Die politische Moral der Berliner nach dem 13.8.1961 und
früher". Landesarchiv Berlin, Deposition Hurwitz (2200 B). Außerdem in der Berichtssamm-
ZA-Information 56
113
Dieser Bericht in Englisch an Opinion Leaders war der Anfang der Berlin Briefings,
vertraulicher Unterrichtungen, die ich unter Bahrs Anleitung von 1963 bis 1966/67
fortsetzen konnte.22
6
Berlin-Test
Inzwischen hatte sich Dr. Schreiber selbständig gemacht, nachdem klar geworden
war, dass der ihm vorgesetzte Lehrstuhlinhaber in Berlin bleiben würde. Dieser hatte
ihm verboten, sein Drittmittelprojekt zur Erforschung des Zusammenhangs zwischen politischer und wirtschaftlicher Meinungsbildung in West-Berlin am Institut
für Marktforschung der Freien Universität durchzuführen.23
So wurde trotz der guten Erfahrungen mit Infas bei der Erstellung unserer Fragenkataloge entschieden, Schreibers neues Unternehmen Berlin-Test zu beauftragen
und ab April 1963 regelmäßige Standard- sowie Blitzumfragen durchführen zu lassen. Darüber hinaus wurde in den Befragungen, die Schreiber für seine eigenen
wissenschaftlichen Vorhaben und als Marktforscher unternahm, neben den sowieso
zu eigenen Zwecken wiederholten Trendfragen, Raum für einige Fragen des Senats
reserviert, die auf Zuruf geschaltet werden konnten. Infas wurde zu dieser Zeit von
der Senatskanzlei mit der Durchführung von Repräsentativumfragen im Bundesgebiet beauftragt.
Auch in anderer Hinsicht hat Berlin-Test uns ungewöhnliche Möglichkeiten geboten: Wir erhielten ein außerordentlich sicheres Forschungsinstrument. Die wissenschaftskritische Forschung über die demoskopische Praxis, der sich Schreiber
schon beim IfMF gewidmet hatte, setzte er mit Berlin-Test fort. Dabei ging es um
die ständige Überprüfung der Feldarbeit und das strenge Festhalten an bewährten
Erhebungsstandards. Dies begann mit der begrenzten Anzahl der Interviews pro
Interviewer und deren Kontrolle durch Fangfragen und reichte bis zu Methoden einer
ständigen Überprüfung der Festlegung und Verlässlichkeit von Quotenstichproben.
Letztere geschah anhand von Merkmalen der Amts- und Kirchenstatistik. Indem
lung enthalten: Aspects of Morale in Berlin - Before August 13th. Trends, Perspectives, Analyses. Spätherbst 1961; On Misunderstanding Berlin, January 1962; Morale in West Berlin after
the Wall, April 1962.
22 Landesarchiv Berlin, Deposition Hurwitz (2035).
23 Hinweis: Schreibers Ergebnisberichte zu diesem Projekt, sowie zu Folgeprojekten, die er bis
1974 mit Forschungsmitteln des Senators für Wirtschaft durchführen konnte, befinden sich im
Landesarchiv Berlin, Deposition Hurwitz (2281/2). Siehe: Abschlussberichte 1963/66, 102 S.;
Abschlussbericht 1967/69, 64S.; Fortsetzung, 1970/72, 12 S.; Fortsetzung u. Abschluss
1973/74, 12+4 S.
114
ZA-Information 56
Schreiber die Quotenmerkmale miteinander verknüpfte, waren jedem Interviewer
stärker als üblich die Hände gebunden.
Die sofortige Überstellung der Lochkartensätze erlaubte es mir schließlich in kritischen Situationen (in besonderen Fällen sogar vorläufig, noch bevor die Stichprobe
vollständig war), in Ereignisnähe auswerten und berichten zu können. Das geschah
umso häufiger, als sich die Standard- und Blitzumfragen des Senats mit Schreibers
eigenen Berlin-Test Erhebungen fast kontinuierlich abwechselten. So wurde zwischen März 1963 und Februar 1965 mit 15 Standarderhebungen, 5 Blitzumfragen
und 12 weiteren Berlin-Test Omnibus-Umfragen eine Abfolge-Dichte erreicht, in
der es möglich war, Ereigniswirkungen in den Zeitabständen: (a) unmittelbar danach, (b) etwas später und (c, d usw.) im "Nachhinein" zu verfolgen. Das erwies
sich anhand von wichtigen Ereignissen und Entwicklungen als außerordentlich lehrreich, so nach Geschehnissen wie dem Scheitern des Treffens zwischen Brandt und
Chruschtschow, das die große Koalition zwischen SPD und CDU in West-Berlin
beendete, dem Besuch Kennedys im Juni 1963, nach dessen Ermordung am 22. November, bei der "Count Down"-Autobahn-Konfrontation im Oktober/November 1963,
während der umstrittenen Passierscheinverhandlungen mit den nachfolgenden Passierscheinaktionen in den Jahren 1963 sowie 1964 und beim umstrittenen Verlauf
des S-Bahn Boykotts. Im Übrigen wurde es für die Senatsführung immer wichtiger,
die Verhandlungsbereitschaft der West-Berliner im Zeitverlauf zu messen und zu
beeinflussen. Aufgrund dieser Erfahrung mussten wir uns Gedanken machen über
kurz- und längerfristige Wirkungen, über kumulative Nachwirkungen von Ereignissen auf konsensuelle Einstellungsentwicklungen sowie über die Festigkeit, Anfälligkeit und Wandlungsfähigkeit solcher Einstellungen.
Inzwischen hatte Infas im Anschluss an die beiden vorangegangenen Untersuchungen – vor und nach dem Mauerbau – eine weitere Erhebung in Berlin durchgeführt,
und zwar im Oktober/ November 1962 – per Zufall vor und während der Kubakrise
– diesmal ohne Auftrag, aber in der Hoffnung, das Umfrageprogramm des Senats in
Berlin fortsetzen zu können. Ein Jahr später, anlässlich der ersten Passierscheinaktion im Dezember 1963, beauftragte der Senat Infas mit einer Untersuchung, die die
entsprechende Erhebung von Berlin-Test ergänzen sollte.
7
Berater des Regierenden Bürgermeisters
Als wissenschaftlicher Betreuer der beiden Untersuchungsreihen (für Berlin und
Westdeutschland) erhielt ich Arbeitsräume der Innenverwaltung am Fehrbelliner
Platz. Eine IBM-Fachzählsortiermaschine und ein Panzerschrank kamen als
Ausstattung hinzu. Ich konnte eine Sekretärin und auch eine technische Hilfskraft
ZA-Information 56
115
(Teilzeit) einstellen. Wir gewöhnten uns an einen Arbeitsrhythmus von 12 bis 14
Stunden, Wochenenden eingeschlossen. Für mein Auskommen konnte deshalb gesorgt werden, weil die Ford-Stiftung nach dem Mauerbau ein Förderungsprogramm
für das geistige Leben in Berlin auf den Weg gebracht hatte, das den Verbleib von
kreativen Ausländern in der Stadt sichern sollte. Ich erhielt einen Werkvertrag, um
den Regierenden Bürgermeister zu beraten und den Stiftungsvorstand Shepard Stone
über Entwicklungen in Berlin zu unterrichten.
Für meine vertrauliche Berichterstattung an den Regierenden Bürgermeister wurden
Regeln festgelegt. Neben Willy Brandt erhielt Egon Bahr als verantwortlicher Leiter des Presse- und Informationsamtes einen Bericht. Weitere Kopien gingen an den
Chef der Senatskanzlei, Dietrich Spangenberg, in der Regel auch an den Bürgermeister Heinrich Albertz und an Klaus Schütz, den Senator für Bundesangelegenheiten. Dieser Verteilungsmodus wurde in Abstimmung mit Bahr und Spangenberg
gewählt. Die Umfrageergebnisse sollten im Rathaus keine Rivalitäten nähren.
Andere Senatoren wurden ermutigt, das Forschungsprogramm für ihre Belange in
Anspruch zu nehmen. Infolgedessen wurden von 1963 bis 1967, dem Zeitraum, in
dem ich Gestaltung und Koordination des Forschungsprogramms zu verantworten
hatte, verschiedene Themen der Senatsressorts aufgenommen. Dazu gehörten: Polizei, Wirtschaftsförderung, Sparmaßnahmen, Ost-West-Handel, Freie Volksbühne,
Volksschulen und verschiedene Aspekte der Schulpolitik (z.B. der Verzicht auf
Samstag als Schultag).
Als gravierende politische Dauerprobleme kamen vor allem die Belastungen für die
Bevölkerung durch den S-Bahn-Boykott hinzu und später die Studentenrevolte als
Provokation bzw. Prüfung der demokratischen Gesinnung (Solidarität, Toleranz/
Intoleranz) in der Bevölkerung.
Natürlich galt es Reaktionen auf situationsbedingte Vorkommnisse und Senatskrisen kurzfristig zu erfassen: der Schahbesuch, ein Korruptionsskandal, der Rücktritt
von Heinrich Albertz als Regierender Bürgermeister, die Aussichten der Parteien
während der Wahlkämpfe und die Gefahren des Rechtsradikalismus. Das galt ebenfalls für Reaktionen auf Probleme der Bundesrepublik und der westlichen Verteidigungsgemeinschaft, z.B. die Konjunkturkrise von 1965 bis 1967 und der Streit um
den Atomwaffensperrvertrag.
116
8
ZA-Information 56
Im Infas-Büro am Kurfürstendamm
Der Senatsvertrag mit Berlin-Test wurde im Frühjahr 1965 nicht verlängert. Es
schien opportun, Infas mit der Fortführung der Berliner Erhebungsreihe zu beauftragen. Nun sollte ich meine Betreuungs- und Auswertungstätigkeit für die Senatskanzlei als Angestellter von Infas fortsetzen und Berichte schreiben, die in Bad
Godesberg fertig gestellt und nach einem Schlüssel verschickt wurden. Im übrigen
lief die vertrauliche Berichterstattung an die Senatskanzlei weiter, ohne dass ich
jemals mit Bad Godesberg Rücksprache zu nehmen hatte. Auch meine Sekretärin
und mein Assistent, Volker Hauff, arbeiteten jetzt als Angestellte von Infas. Da ich
inzwischen 39 Jahre alt und seit 1949 stets freiberuflich tätig gewesen war, bedeutete der Eintritt in das deutsche Versicherungssystem für mich eine große Erleichterung. Nachteile gab es jetzt im Arbeitsablauf: Infas richtete am Kurfürstendamm ein
Büro ein. Aus Bad Godesberg wurden uns über Fernschreiber die Korrelationen
übermittelt, die wir vorher anfordern mussten. Das war umständlich, und wir erhielten keine Kartensätze mehr von unseren Umfragen. Mit unserer Fachzählsortiermaschine konnten wir nur noch die Lochkarten aus der Berlin-Test-Zeit auswerten, um
Trendvergleiche mit Breaks anzustellen.
Von Frühjahr 1965 bis Frühjahr 1967, dem Zeitraum, in dem ich am Kurfürstendamm arbeitete, wurden in Berlin ebenso viele Umfragen von Infas durchgeführt
wie in den vorangegangenen zwei Jahren von Berlin-Test. Von diesen 28 Erhebungen waren 15 Standardumfragen. Aber im Unterschied zu den streng kontrollierten
Quotenumfragen von Berlin-Test basierten die regelmäßigen Standardumfragen von
Infas auf Zufallsstichproben. Die Folge war, dass weit größere Zeiträume für die
Feldarbeit benötigt wurden. Die Abstände zwischen den Umfragen vergrößerten
sich. Berichterstattung in Ereignisnähe war anhand der Standardumfragen nicht
mehr möglich. Andererseits erfassten die aus Einwohnerkarteien gezogenen Stichproben jetzt ca. 600 Befragte. So konnte Infas den Wünschen des Senats nach Berichterstattung in Ereignisnähe nicht entsprechen. Das machte Blitzumfragen erforderlich
und Infas brachte 13 davon ins Feld. Was die Infas-Standardumfragen betrifft, so
konnten Schreibers hohe Standards der Interviewer-Kontrolle nicht mehr erreicht
werden. Dafür sollte ja das Verfahren der Zufallsstichprobe Sicherheit bieten. In
den letzten Monaten meiner Tätigkeit im Büro am Kurfürstendamm gab es einen
Grund zur Besorgnis: Bad Godesberg hatte zwei Personen zur Betreuung der Feldarbeit in Berlin angestellt, die ihren Interviewern allzu oft 20 bis 30 Befragungspersonen aufbürdeten. Das stellte eine Missachtung der erprobten Sicherheitskriterien
für Interviewer dar.
ZA-Information 56
117
Diese und andere Erfahrungen hatten meine Beziehung zur Institutsleitung in Bad
Godesberg derart belastet, dass ich an Kündigung dachte und andere Wege sondierte,
um dennoch meine wissenschaftliche Beratungstätigkeit für den Senat aufrechtzuerhalten. Dabei war der Senatsauftrag an Infas für die praktische Durchführung der
Umfragen nicht in Frage zu stellen. Natürlich war es der Institutsleitung in Bad
Godesberg nicht leicht gefallen, mich als einen Infas-Beauftragten hinzunehmen,
der den Senat selbständig und intern beriet. Es folgten Schikanen, die meine Verantwortung für die Berliner Erhebungspraxis am Ende zwar beschnitten, jedoch
meine vertrauliche Beratertätigkeit nicht beeinträchtigen konnten. Und nach wie vor
schloss diese Beratung die Unabhängigkeit hinsichtlich Auswahl und Formulierung
der Fragen ein. Ich blieb noch ein Jahr am Kurfürstendamm, suchte aber währenddessen nach einer neuen Beschäftigung.
9
Arbeit im ZI6
Eine solche bot sich an, als Richard Löwenthal, der aus England zurückgekehrt war
um Ordinarius für Politische Wissenschaft an der Freie Universität zu werden. Bei
Bleibeverhandlungen sah er die Möglichkeit, meine Tätigkeit für den Senat zu etablieren. Ich wurde bei ihm als Assistent und Akademischer Rat mit Sitz am Zentralinstitut für Sozialwissenschaftliche Forschung (ZI6) eingestellt. Bei Infas hatte ich
weiterhin die Verantwortung für die Durchführung und Berichterstattung. Ich hatte
nun auch Zeit, Policy-Science-Neuland für die Senatskanzlei zu erkunden. An ein
Simulationsmodell für "Morale Responses" und Planspiele für Ost-West-Verhandlungen wurde gedacht.
Nach der Bildung der Großen Koalition in Bonn und dem Abschied von Willy
Brandt und Egon Bahr aus Berlin im Dezember 1966 lief vieles anders. Zwar setzte
ich meine Beratertätigkeit für die Berliner Senatskanzlei und die Mitwirkung an der
Gestaltung des Meinungsforschungsprogramms unter den Regierenden Bürgermeistern Heinrich Albertz (1966 bis 1967) und später unter Klaus Schütz (1967 bis
1977) bis in die 70er Jahre fort – allerdings ohne Zusammenarbeit mit Infas. Die
Studentenrevolte veränderte dann die Bedingungen, unter denen ich am ZI6 und
dem Otto-Suhr-Institut als Akademischer Rat und später als Professor arbeiten
konnte. Da Richard Löwenthals Pläne, am ZI6 zu wirken, für ihn nicht mehr in
Frage kamen, war ich ohne Fürsprecher dort, als das Gerücht umging, ich sei ein
CIA-Agent, der bisher in der Berliner Senatskanzlei angesiedelt war, aber nun an
der Freien Universität wirken sollte. Meine "Nebentätigkeit" für die Senatskanzlei
war und blieb Jahre lang suspekt und wurde im ZI6 wiederholt beanstandet. Auch
mein "Berlin-Projekt" blieb manchen Kollegen ein Dorn im Auge, bis unser
118
ZA-Information 56
Institutsvorsitzender, Theo Pirker, Anfang der 80er Jahre die Roh-Manuskripte der
ersten drei der 1983/84 veröffentlichten Bände meiner Reihe "Demokratie und Antikommunismus in Berlin" las und beschützend empfahl.
Am ZI6 wurde es mir dank Förderung der Senatskanzlei, der DFG und der VWStiftung möglich, die Voraussetzungen für die Erstellung der jetzt im Zentralarchiv
zur Verfügung gestellten Sammlung zu schaffen. Diese Datensammlung kam auch
meinen Lehrveranstaltungen am Otto-Suhr-Institut zugute.
10
Zeitreihen und Kontextinformationen aus der Zeit
Die Idee zur Datensammlung begann damit, dass der ab 1967 für Meinungsforschung zuständige Beamte der Senatskanzlei, Heinz Fanselau, mit mir der Meinung war, dass die gesammelten, für Moral und Verhandlungsbereitschaft relevanten, Primärdaten und Berichtsmaterialien der seit 1945 durchgeführten Berliner
Meinungsumfragen, in Zusammenhang mit unseren seit 1961 produzierten Primärdaten eine Grundlage für weiterreichende Projekte darstellen könnte. Er dachte an
die Entwicklung von Simulationsmodellen: Einmal um auf der Basis von spieltheoretischen Annahmen Senatsangehörige auf Verhandlungen in Krisen- und Entspannungssituationen besser vorzubereiten, zum anderen um in solchen Situationen
Reaktionen der Bevölkerung auf der Basis eines empirischen Simulationsmodells
einschätzen zu können.
So war mein Anliegen, als Berater und akademischer Forscher unter Hinzuziehung
älterer Daten und weiterreichender Analysen mehr zu lernen und auch zu verwirklichen. Für die Entwicklung dieser Modelle sollte ich als Kenner West-Berliner Einstellungsentwicklungen die notwendigen deskriptiv-historischen Voraussetzungen
leisten, während Lutz Erbring, der damals beim Institute for Social Research an der
University of Michigan lehrte, von der Senatskanzlei über Infas beauftragt wurde,
die statistischen und inhaltsanalytischen Voraussetzungen für das Modell zu erarbeiten. Da hierfür eine Verknüpfung zwischen Indikatoren für Einstellungsentwicklungen und Ereignissen erforderlich war, wurde meine Aufmerksamkeit auf die
Möglichkeiten zur Erstellung von Zeitreihen mit Zeitungsnachrichten gelenkt, die
so hervorgehoben waren, dass sie theoretisch für jeden Leser wahrnehmbar waren.
Hieraus entstand im Berlin-Projekt das Vorhaben, dynamische Modelle der Zeitreihenanalyse zu entwickeln bzw. zu adaptieren.
Für dieses Ziel reichten die damals gängigen statistischen Verfahren der Zeitreihenanalyse – Transferfunktionen waren noch unbekannt – nicht aus. Auch die von Infas
in unregelmäßigen Abständen erhobenen Daten waren ein Problem. Um dieses zu
ZA-Information 56
119
beheben, hat Lutz Erbring in Folge des Senatsauftrages ein sehr komplexes Modell
entwickelt, insbesondere ein Verfahren, um "fehlende Werte" in den Zeitreihen
aggregierter Einstellungsdaten zu schätzen ("fehlend" vor allem wegen der nicht
regelmäßigen und oft langen zeitlichen Abstände zwischen den einzelnen Meinungsumfragen). Der nächste Schritt wäre gewesen, für das Simulationsmodell ein fiktives
Szenario zu entwerfen. Das ist nicht geschehen, und es fragt sich, wie der Fall der
Mauer wohl in einem Simulationsmodell ausgesehen hätte. Auch die Möglichkeiten
des Berlin-Projektes stießen an ihre Grenzen.
Der Projekt-Mitarbeiter Helmut Thome benutze inhaltsanalytisch ausgewertete
Meldungen des Tagesspiegel 1963-64 und Daten der eher geeigneten, da regelmäßigen, Berlin-Test-Erhebungen aus dieser Zeit, um dynamische Modelle der Wirkung kontinuierlich registrierter (wahrnehmbarer) Ereignisse auf aggregierte Einstellungen zu entwickeln. Obwohl der theoretische Ansatz als Intention weiterhin
beachtenswert bleibt und unserer Meinung nach ausgebaut werden sollte, ist das
damals angewandte Verfahren, auch aus Sicht des Autors, noch nicht befriedigend –
u. a. deshalb, weil a) die Zahl der Messzeitpunkte ("Beobachtungen") mit n=31 für
multivariate Verfahren der Zeitreihenanalyse prinzipiell zu gering ist (die Schätzung
der Modellparameter ist zu instabil), b) weil das Verfahren der "polynomial distributed lag regression", das damals eingesetzt wurde, zu wenig flexibel ist in der
Vorgabe möglicher Verlaufsformen für die Wirkung von Ereignissen auf Einstellungen. Hier stehen heute flexiblere Verfahren, etwa Box/Jenkins-Transferfunktionsmodelle, zur Verfügung. Thome hat in einem späteren Versuch, gemeinsam
mit Margret Rottleuthner-Lutter, diese flexibleren Verfahren eingesetzt, um den
längerfristigen Verlauf der Wirkung eines einzelnen einschneidenden Ereignisses,
des Chruschtschow-Ultimatums vom November 1958, auf die Entwicklung der Parteipräferenzen und das Niveau der symbolischen Unterstützungsmaßnahmen der
Westmächte zu modellieren.24 Hierfür benutzten sie von den Projektmitarbeitern
Andreas Büning und Monika Lindgens-Knoche erstellte langfristige Daten zwischen 1950 und 1963.
In dieser Datei wurden Trendfragen vom Allensbacher Institut für Demoskopie als
Berlinanteil der monatlichen bundesweiten Umfragen mit inhaltsanalytisch erfassten Indikatoren über die potenzielle Wahrnehmbarkeit25 des politischen Geschehens
mit Bevölkerungs- und Wirtschaftsstatistiken verknüpft. Trotz hoher Stichproben-
24 Margret Rottleuthner-Lutter, Helmut Thome, Wirkung von Ereignissen auf kollektive Einstellungen: Ein Anwendungsbeispiel für Transferfunktionsmodelle nach Box und Jenkins. In: Zeitschrift für Sozialpsychologie, S. 118-138, 1983.
25 Vgl. Kap. 13
120
ZA-Information 56
fehler (die Stichproben der Meinungsumfragen hatten einen Umfang zwischen 40
und 80) konnten schlüssige Ergebnisse erzielt werden. Dieses Verfahren der "Interventionsanalyse" mit Hilfe von Transferfunktionsmodellen wäre sicherlich auch für
weitere Analysen der Wirkung einschneidender Ereignisse einsetzbar, die in den
Zeitraum der Gesamtdatei fallen. Dieses Modell zur Erfassung der unmittelbaren
und kumulativen Wirkungen eines einschneidenden Ereignisses bleibt gleichwohl
brauchbar. Die Datei bleibt aber auch geeignet, weil sie ohne komplexe Modellansprüche für Thematisierung und Deskriptionen konsultiert werden kann, z.B. hinsichtlich der Auswirkungen vom 17. Juni 1953, des Ungarn-Aufstands, des Mauerbaus und der Kuba-Krise.
Trotz alledem erwiesen sich beide Vorhaben als maßgebend für meine langfristigen
Forschungsabsichten, Buchplanungen sowie meine Lehrtätigkeit, und somit schließlich
für das, was diese Datensammlung einem Benutzer primär- und sekundäranalytisch
anbieten kann.
Lutz Erbring hatte mir in Ann Arbor klar gemacht, was SPSS leisten konnte. Bis
dahin waren wir für die Erstellung von drei-dimensionalen Kontingenztabellen auf
ein Programm angewiesen, welches der Projektmitarbeiter Hajo Haas hatte schreiben
lassen. Jetzt wurde SPSS, erstmalig in Berlin, an der Freien Universität installiert,
wo Haas, ein Doktorand der Wirtschaftswissenschaft, am Rechenzentrum die ersten
Kurse in SPSS als Lehrangebot des Berlin-Projekts durchführte, bis ich 1972 selbst
soweit war, diese Aufgabe als Lehrangebot des Fachbereichs Politikwissenschaft zu
übernehmen. Jahrelang geschah dies in Wochenend-Intensivkursen mit dem Angebot,
anschließend an einer vierstündigen Übung mit Vorlesungscharakter teilzunehmen,
die anspruchsvoll hieß: Die Logik der multivariaten Kausalanalyse für Sozialwissenschaftler.26
11
Umfang und Inhalt der Datensätze in der Datensammlung
Dank meiner Nebentätigkeit als Berater und durch gezielte Zuwendungen der
Senatskanzlei erhielt ich die Möglichkeit, Berichte und Lochkartensätze mit den
Primärdaten aller relevanten Meinungsumfragen in Berlin zu besorgen, die vor Beginn des Erhebungsprogramms des Senats mit Infas und Berlin-Test durchgeführt
worden waren. Insgesamt wurden so Primärdaten von sechs verschiedenen Instituten
gesammelt. Wie die Berichtssammlung zeigt, fing es 1945 mit Erhebungen der amerikanischen Militärregierung an. Die Umfragen wurden dann zur Zeit der Hohen
26 Siehe die Lehr- und Übungsmaterialen, im Landesarchiv Berlin, Deposition Hurwitz.
ZA-Information 56
121
Kommission von DIVO in amerikanischem Auftrag bis 1959 fortgeführt27. Besorgt
wurden außerdem die Berlin-Anteile der monatlichen Bundesumfragen des Allensbacher Instituts für Demoskopie im Zeitraum 1950 bis 1963, Erhebungen des Instituts für Marktforschung der FU Berlin (IfMF) von 1953 bis 1968, Berlin-Test Umfragen aus den Jahren 1970 bis 1974 und die von EMNID im Auftrag der Berliner
CDU zwischen 1960 und 1963 durchgeführten Erhebungen in Vorbereitung der
Kommunalwahl von Februar 1963.
Wie bereits erwähnt, haben alle diese Institute mit Ausnahme von EMNID Frageformulierungen verwendet, die über Berlin-Test und Infas in das Erhebungsprogramm des Senats Aufnahme fanden. "Wie es dazu kam", dass Trends mit gleichen
Frageformulierungen zusammengestellt werden konnten, soll die folgende Abbildung verdeutlichen. Die Darstellung zeigt die Weiterverwendung der ursprünglich
von der US Survey Branch auf der einen und von Allensbach der anderen Seite
entwickelten Fragen. Die institutsübergreifende Weitergabe basierte auf den Kontakten zwischen den Institutsmitarbeitern bzw. auf der Arbeit der Mitarbeiter in den
"nachfolgenden" Instituten.
Abbildung
Die Weitergabe der Frageformulierungen zwischen den Meinungsforschungsinstituten
US Survey Branch
Allensbach
DIVO
Institut für MarktABCDE-Gesamtdatei (83 Studien)
forschung der
FU Berlin (IfMF)
Senatsumfragen
Infas
Infas
1961-62
Berlin-Test 1963-65
1965-69
Berlin-Test 1963-65
1965-71*
Senatsumfragen seit
Frühjahr 1969
* Hinzu kommen eigene Umfragen von Berlin-Test aus den Jahren 1972 und 1974
27 Vgl. die Sammlung der OMGUS- und HICOG-Berichte im Zentralarchiv.
Berlin-Test
122
ZA-Information 56
Diese Meinungsumfragen habe ich nicht nur für Lehrveranstaltungen über Methodenlehre und Demokratisierungsprobleme im Nachkriegs-Deutschland, sondern
auch für meine Buchplanung über die Berliner Nachkriegszeit verwendet. Die Idee
war, eine zeitgeschichtliche Analyse der interaktiven Entwicklung von Einstellungen in einer Triade von Beziehungen zu verfolgen: nämlich zwischen der WestBerliner Bevölkerung, politisch engagierten Teilen dieser Bevölkerung (auch als
Partei-Eliten) und den Besatzungsmächten, die Schutzmächte werden würden. Mit
der Buchplanung im Auge waren wir im Berlin-Projekt und für meine Lehrveranstaltungen bemüht, die Entwicklung im Kalten Krieg und auf dem Weg zur Entspannungspolitik soweit wie möglich ereignisbezogen und über längere Zeiträume
zu verfolgen. Da ich Wert darauf legte, Zeitgeschichtlern quantifizierende Analyse
mit einem stochastischen Anspruch schmackhaft zu machen, sowie umgekehrt übertrieben behavioristisch orientierten Feldforschern – Soziologen, Politologen und
Psychologen – Geschichte nahe zu bringen, bot es sich an, im Rahmen meiner
Buchplanung, Darstellung und Analyse durch weitere Arten von quantifizierenden
Erhebungen zu untermauern und zu erweitern. Das führte neben den oben erwähnten
inhaltsanalytischen Daten zu den biographischen Daten von einfachen und führenden Mitgliedern der SPD, derjenigen Berliner Partei, die den Abwehrkampf und die
Entspannungspolitik maßgeblich beeinflusst hat.
12
Weitere Inhalte der Datensammlung
In dieser Datensammlung findet der Nutzer insgesamt vier Arten von Primärdaten
sowie die dazu eingescannten Veröffentlichungen und Ergebnisse: Repräsentative
Meinungsumfragen, biographische Daten, Inhaltsanalysen Berliner Tagezeitungen
und Aggregatdaten über verschiedene Berliner Wahlen.
Was die demoskopische Sammlung betrifft, so ist zu berücksichtigen, dass die Primärdaten (Lochkartensätze) für repräsentative Berlin-Erhebungen erst ab 1952 auffindbar waren. Umso wichtiger wurde es, die Ergebnisberichte zu Berlin-Umfragen
amerikanischer Stellen zu finden. So konnte relevantes Berichtsmaterial eingescannt
werden. Diese Berichte und Tabellen, stammen entweder von einer vormals von
Forschern unbeachteten Berlin-Unit (bei der Militärregierung des Berlin-Sektors)
oder aus den bekannten amerikanischen Berichtsreihen, den Stellen für Meinungsforschung bei der Information Control Division bzw. Information Services Division
beim Hauptquartier des Office of Military Government (ICD/ISD, OMGUS), sowie
von der Hohen Kommission und der Botschaft der Vereinigten Staaten.
ZA-Information 56
123
Auf der Daten-CD als auch im Berliner Landesarchiv sind die Berichte von Infas,
Berlin-Test, EMNID*, IfMF* und Allensbach* vorhanden, ebenso die Berichte und
vertraulichen Auswertungen aus meiner Zeit der Beratungstätigkeit für die Berliner
Senatskanzlei. Eine Reihe von Trendfragen können vom Benutzer selbst ausgewertet werden. Chroniken und zeitgeschichtliche Hintergrundlektüre werden als Zusatzinformation bereit gestellt. Zu den eingescannten Berichten und TabellenMaterialien zählen auch Auswertungen von Mitarbeitern des Berlin-Projekts und
von Seminarteilnehmern.
Wie bereits erwähnt, wurden auch biographische Daten gesammelt und die Voraussetzungen für eine Inhaltsanalyse Berliner Tageszeitungen geschaffen. Das geschah
auch, um meiner Publikationsreihe Demokratie und Antikommunismus in Berlin
nach 1945 eine quantitativ-analytische Dimension der Indikatorenfindung und der
Argumentation zu geben. Diese Aufgaben wurden konzeptionell in einem Mitarbeiter-Seminar geplant und zum Teil auch ausgeführt und ausgewertet. So wurde methodisches Neuland erkundet. In der Sammlung sind Aufsätze zu lesen, in denen
Mitarbeiter über Ergebnisse berichten. Auch die von unserer damaligen Studentischen Hilfskraft, Wolfram Schulz, aufbereiteten Aggregatdaten von Berliner Wahlergebnissen auf verschiedenen Ebenen (Bezirk, Ortsteil, Stimmbezirk) und zu verschiedenen Zeiten (1929 bis 1963) sind so entstanden.28
Entsprechend ihrer Bedeutung für den Abwehrkampf und die Erprobung entspannungspolitischer Schritte werden in sechs biographischen Dateien vor allem die Lebensdaten und die politischen und beruflichen Kariereverläufe von Berliner Sozialdemokraten, Mitgliedern und Funktionären festgehalten, um sie unter dem Gesichtspunkt der Sekundärsozialisation im Ablauf der Systeme zu untersuchen: im
Kaiserreich, der Weimarer Republik, dem Drittem Reich, der Viermächte-Stadt und
der Bundesrepublik. Zwecks Indikatorenfindung zum Wandel der machtpolitischen
Verhältnisse und dem Einfluss der Besatzungsmächte in ihren Sektoren zwischen
1945 und 1949 wurde von der Parteizugehörigkeit sämtlicher Bezirksstadträte in
allen 20 Rathäusern ausgegangen. Außerdem wurden die Daten der Kandidaten von
KPD/SED und SPD bei den Kommunalwahlen 1929, 1933 und 1946 erfasst, sowie
die Kandidaten von CDU und SPD bei den Kommunalwahlen von 1946 bis 1963.
In zwei Dateien über SPD-Mitglieder und SPD-Funktionäre konnten wir aus Mitgliederunterlagen, selbstverfassten Lebensläufen, Entnazifizierungsfragebögen und
* Nur im Landesarchiv.
28 Politische und Soziale Determinanten des Wahlverhaltens in Berlin von 1946 bis 1950, Diplomarbeit am Fachbereich Politische Wissenschaft der FU Berlin, Juli 1988.
124
ZA-Information 56
anderen Quellen die Detail-Informationen gewinnen, die erforderlich waren, um
Karriereverläufe und Lebenserfahrungen im Kontext einer Sekundärsozialisation im
Ablauf der Systeme differenziert untersuchen zu können. Um diese Fragestellung
zeitlich weiter zu verfolgen, wurde eine dritte Datei erstellt, die aus selbstverfassten
Lebensläufen von SPD-Kandidaten zu den Abgeordnetenhauswahlen von 1958,
1963 und 1967 in drei Bezirken besteht. Sie wurde ergänzt durch Amtsblätterdaten
über Listenplatzentwicklung, Berufsänderungen und Wohnbezirkswechsel, ferner
gegebenenfalls durch andere Quellen, wenn Angaben über die Zeiten vor 1933, das
Dritte Reich und danach bis 1958 zu finden waren. Leider kamen wir nicht dazu,
den Auswertungsmöglichkeiten annähernd gerecht zu werden.
13
Inhaltsanalytische Daten
Gleiches gilt für vier Dateien, die inhaltsanalytische Daten enthalten. Artikel auf
den Titelseiten Berliner Tageszeitungen sind unter einem speziellen Gesichtspunkt
ausgewertet worden. Fokus war vor allem der Ost-West-Konflikt und die Entspannungspolitik. Neben dem semantischen Inhalt wurde jeweils die Wahrnehmbarkeit
eines Artikels erfasst. In Form einer von uns entwickelten Rangordnungsskala
wurde die Positionierung sowie die drucktechnische Beschaffenheit des Zeitungsbeitrags29, also die Augenfälligkeit, eingestuft.
In zwei Dateien werden Zeitungen der Westsektoren und des Sowjetsektors verglichen. So können bei unterschiedlichem Erscheinungsbeginn und -turnus zwischen
Oktober 1945 und November 1946 Der Tagespiegel (US lizenziert) und der Telegraf (britisch lizenziert und SPD nahestehend) sowohl miteinander als auch mit
dem unter sowjetischer Kontrolle stehenden Volk (Parteiorgan des Zentralausschusses der SPD) und der Deutschen Volkszeitung (KPD) bzw. als deren Nachfolger
dem Neuen Deutschland (SED) verglichen werden. Über den Indikator "Wahrnehmbarkeit" hinaus, ist dieser Vergleich indikativ für Unterschiede in der Öffentlichkeitspolitik der Besatzungsmächte vor und während des Berliner Fusionskampfes
sowie danach bis zu den Wahlen im Oktober 1946.
Die Datenreihe wurde fortgeführt mit einer Datei, die Vergleiche zwischen dem
Tagespiegel, dem Telegraf und dem Neuen Deutschland30 ermöglicht, also eine
Entwicklung, die 1947 mit lang anhaltenden Auseinandersetzungen zwischen den
29 Die Ausprägungen reichten von "Schlagzeile" (unterschiedlicher Prominenz) über "halb fett" bis
zu "normal" gesetzten Texten.
30 bis März 1948 für Neues Deutschland und bis August 1949 (nach Beendigung der Luftbrücke)
für den West-Berliner Tagesspiegel.
ZA-Information 56
125
Selbstverwaltungsansprüchen der demokratischen Parteien und den ViermächteKontrollgremien, der Kommandantur und dem Kontrollrat begann und die im März
1948 im Ost-West Konflikt mündete. Der anschließende Zusammenbruch der
Viermächteverwaltung, die Blockadezeit und die getrennte Staatengründung wurden nur im Tagesspiegel weiter verfolgt.
Mit diesen Dateien können vielfältige Vergleiche angestellt werden. Im bildungsbürgerlichen Tagespiegel und dem sozialdemokratischen Sprachrohr Telegraf (bis
Ende Oktober 1946) können die unterschiedlichen Entwicklungen im Stil der Ansprache bis hin zur engagierten Mobilisierung der Bevölkerung bis Ende 1946 untersucht werden. Danach kann der Prozess indirekt beleuchtet werden, in welchem
Amerikaner das Gebot nach Eintracht der Siegermächte gegenüber den Deutschen
allmählich überwanden. Ebenso kann der Frage nachgegangen werden, wie die aggressive Redaktionspolitik des Neuen Deutschland von der neuen Situation tangiert
wurde, in der die Westmächte das Viermächte-Experiment nicht nur sehr allmählich, sondern in der Konfrontation endgültig aufgaben.
Die beiden Dateien für die Zeit danach, 1950 bis 1963 und 1961bis 1965, – mit dem
Kalten Krieg der 50er Jahre, dem Mauerbau als Höhepunkt des Ost-West-Konfliktes
und den ersten entspannungspolitischen "kleinen Schritten" – beschränken sich auf
Fragen der Wahrnehmbarkeit für die West-Berliner Bevölkerung anhand von
Mitteilungen auf der ersten Seite des Tagespiegel.
Die insgesamt 4099 Zeitungsausgaben von Januar 1950 bis Juni 1963 wurden mit
Hilfe eines Codeplans erfasst, der kurz und handlich war. Hier wurde erstmals unsere
sog. "Druck-Drohungs-Skala"31 eingeführt, ferner werden Themen wie Stützungsmaßnahmen des Westens (symbolisch, materiell), Spannungen zwischen Berlin und
Bonn, aber auch zwischen den Trägern des Widerstandskonsenses in Berlin und
schließlich die Darstellung von Entspannungsangeboten des Ostens behandelt.
Weit ausführlicher wird das Geschehen der Zeiträume Januar bis Dezember 1961
und Januar 1963 bis Juni 1965 in der zweiten inhaltsanalytischen Datei (in 1059
Ausgaben) bearbeitet. Neben der vorgenannten Druck-Drohungs-Skala wurde die
Skala zur Wahrnehmbarkeit von Entspannungsmeldungen erprobt. Anhand des sehr
differenzierten Codeplanes sollte berücksichtigt werden: Die Erwägung von entspannungspolitischen Schritten im "Westen", hervorgehobene Hinweise auf die
31 Die Ordinalskala repräsentiert den semantischen Charakter des Zeitungsartikels zwischen verba-
ler Drohung (unterschiedlicher Stärke) auf der einen Seite und manifester Haltung – bis hin zur
militärischen Konfrontation – auf der anderen.
126
ZA-Information 56
Rollenentsprechung der Gegenparteien (d.h. Durchsetzung des Ostens/Stützung
durch den Westen), Dissonanzen und Differenzen in den Lagern der Akteure, das
Vorkommen von Feindbildern und das Bild der Westalliierten als Schutzmächte
sowie wertende Hinweise auf die herkömmliche und eine neue Deutschland- und
Berlinpolitik.
14
Pensionierung
Nach meiner Pensionierung im Jahre 1988, nach dem Ende des Kalten Krieges und
dem Beginn des steinigen Prozesses einer wirklichen Wiedervereinigung Deutschlands, stand ich – angesichts meiner im Laufe von Jahrzehnten gesammelten ungeheuren Fülle von Materialien aus der quantifizierenden Forschung über die politischen Haltungen von West-Berlinern in der Zwickmühle zwischen stalinistischer
Bedrohungen, dem Ost-West-Konflikt und entspannungspolitischen Schritten – vor
der Frage, ob künftige Generationen irgendetwas Interessantes oder Lehrreiches an
dem finden würden, was mich ein Leben lang bewegt und angespornt hat.
Ob etwa Sozialwissenschaftler diesen interdisziplinären Forschungsansatz irgendwie anregend finden würden, ob Historiker aufgefordert werden könnten, in ihre
Arbeit quantifizierende Analysen und Indikatoren einzubeziehen, und ob andere
Neugierige mit Blick auf die vermeintlichen Absurditäten dieser für Deutschland –
Ost und West – und auch für Europa so wichtigen Stadt es überhaupt interessant,
geschweige denn lehrreich finden könnten, wenn sie auf einfache und bequeme
Weise, d.h. benutzerfreundlich, Zugriff auf meine Daten- und Materialsammlung
haben.
So entstand zusammen mit dem mit diesen Daten und Materialien seit inzwischen
zwei Jahrzehnten bestens vertrauten Mitarbeiter, Hans-Berthold Hohmann, die
Idee, die übliche Trennung zwischen der Aufbewahrung von Daten (Zentralarchiv
Köln) und schriftlichen Materialien (Landesarchiv Berlin) unter Nutzung der rasanten
technischen Entwicklung in Form einer DVD von dieser Sammlung aufzuheben.
Die "Stiftung Deutsche Klassenlotterie Berlin" hat die Umsetzung dieser Idee ebenso
gefördert wie die drei institutionellen Träger des Projekts: Zentralarchiv für Empirische Sozialforschung an der Universität zu Köln, das Landesarchiv Berlin und das
Otto-Stammer-Zentrum der Freien Universität Berlin. Bei ihnen ist die Sammlung
zunächst als DVD vorhanden, das Otto-Stammer-Zentrum ist dabei, eine InternetVersion zu erstellen.
ZA-Information 56
127
The Mannheim Eurobarometer Trend File 1970 - 2002
Aktualisierung und Erweiterung der ZA-Studien-Nr. 3521
von Meinhard Moschner
Die von der Europäischen Kommission seit 35 Jahren durchgeführten Eurobarometer
stellen die Ressource für international vergleichende Forschung zu politischen Einstellungen und politischem Verhalten auf europäischer Ebene dar. Die Eurobarometer enthalten eine Reihe von Fragen, die über einen längeren Zeitraum wiederholt
erhoben worden sind. Der kumulierte Datensatz dieser Trendfragen ist The Mannheim Eurobarometer Trend File. Er bietet für komparative und longitudinale Forschung eine erhebliche Erleichterung. Analysen über die 15 Mitgliedsländer der
Europäischen Gemeinschaft und in der aktuellen Version über 86 Messzeitpunkte
hinweg sind auf der Basis dieses Datensatzes möglich. Grundlage für die Auswahl
und Aufbereitung der wichtigsten Trends durch das Mannheimer Zentrum für Europäische Sozialforschung (MZES) und das Zentrum für Umfragen, Methoden und
Analysen (ZUMA) war die Datenbank des ehemaligen Zentrums für Europäische
Umfrageanalysen und Studien (ZEUS). Die erste Ausgabe der Kumulation deckte
den Zeitraum bis 1999 ab.
Die vom Zentralarchiv überarbeitete und aktualisierte zweite Edition umfasst den
Zeitraum von der ersten European Communities Study1 1970 bis zum Eurobarometer
57.2 vom Frühjahr 2002. Der File umfasst jetzt 146 Variablen und weit über eine
Million Befragte.
The Mannheim Eurobarometer Trend File basiert im Wesentlichen auf den Standardtrends der ersten Edition zu Einstellungen und Verhalten der Bevölkerung zu Europa,
der europäischen Integration, zur Europäischen Union und ihren Institutionen.
Daneben gibt es insbesondere die Variablen zu allgemeinen politischen Einstellungen,
insbesondere ideologische Orientierungen und Wahlverhalten. Als demographische
Merkmale sind Alter, Geschlecht, Bildung, Beruf oder Religionszugehörigkeit enthalten. Im technischen Teil finden sich Variablen zur Identifizierung der Sample
und Wellen sowie die über den gesamten Zeitraum harmonisierten Gewichtungen.
1 Allgemein als Vorläuferstudie zu den später Eurobarometer genannten Studien angesehen.
128
ZA-Information 56
Letztere dienen der Angleichungen der Struktur der Zufallsstichproben an diejenige
der abzubildenden Grundgesamtheit nach ausgewählten Merkmalen (Zellengewichtung) und dem Ausgleich unterschiedlicher Bevölkerungsanteile für Ost und Westdeutschland, Großbritannien und Nordirland sowie für Gesamteuropa.
Aus den Standard-Eurobarometern sind diejenigen Fragen ausgewählt und als
Trends in den File aufgenommen worden, die mindestens zu fünf Zeitpunkten in
identischer Formulierung gestellt worden sind. Zulässige geringe Abweichungen in
der Frageformulierung sind detailliert im Codebuch dokumentiert. Unterschiedliche
Kodierungen bei prinzipiell vergleichbaren Antwortkategorien bzw. Skalen sind so
standardisiert, dass gleiche Kategorien über alle betroffenen Wellen hinweg die
gleiche Bedeutung haben. Für einige Variablen unterscheiden sich die Antwortkategorien in ihrer Bedeutung notwendigerweise nach Ländern, insbesondere bei den
Fragen zu politischen Parteien (Wahlverhalten, Verbundenheit usw.). Sie wurden
auf der Grundlage des aktualisierten, vom Zentrum für Europäische Umfrageanalysen und Studien (ZEUS) entwickelten Kodierungsschemas für politische Parteien
nach „Familienzugehörigkeit“ (Sozialisten, Liberale, Konservative usw.) harmonisiert. Für die zweite Edition wurden die über Zeit unterschiedlich spezifizierten Berufskategorien ohne Informationsverlust in hierarchischer Kodierung standardisiert.
Die Aktualisierung des Trendfiles erfolgte beim ZA durch Iris Leim und Meinhard
Moschner. Die Produzenten der Ursprungskumulation, Hermann Schmitt (MZES)
und Evi Scholz (ZUMA), waren beratend beteiligt bzw. unterstützten die Endkontrolle. Die Analysedatei sowie die ausführliche Codebuchdokumentation werden
vom ZA bereitgestellt. Mehr Informationen unter:
http://www.gesis.org/en/data_service/eurobarometer/standard_eb_trend/trendfile.htm
ZA-Information 56
129
Consolidation of Democracy in Central and Eastern
Europe 1990 - 2001:
Cumulation of PCP Wave I and Wave II
by Brigitte Hausstein
The cumulative data set of the comparative study series “Post-Communist Publics
Study” (PCP) is now available at ZA (Study No. 4054).
The data are prepared for secondary analysis according to the archival standards and
are available with the documentation (study description, questionnaires, and codebook). The cumulative data set offers favourable opportunities for cross-time
comparison.
The main goal of the study series is to analyze the current state of consolidation of
the newly implemented democracies in the countries of Central and Eastern Europe.
A key criterion for evaluating democratic consolidation is the emergence of a political culture which is congruent to the created democratic structures. After a decade
of personal experience with the new political and economic systems, the most interesting question refers to the effects of this specific experience on the formation of
the political culture.
The cumulated data set comprises the data of wave 1 and 2 of the study series:
1.
“The Post-communist Citizen 1990-1992”. This project was coordinated by
László Bruszt (Central European University, Budapest) and János Simon
(Institute for Political Science of the Hungarian Academy of Sciences, Budapest). The data have been collected in eleven Central and Eastern European
countries including Eastern Germany. The data set has been distributed by the
ZA under the ZA-study-No. 3218 (n = 12.635).
2.
”Consolidation of Democracy in Central and Eastern Europe 1998-2001:
A Fifteen Country Study”. The research project was coordinated by
Edeltraud Roller, Dieter Fuchs, Hans-Dieter Klingemann, Bernhard Wessels
(Social Science Research Center Berlin, WZB), and János Simon (Hungarian
Academy of Sciences, Budapest). The data set consists of representative population surveys (18 years and older) that have been conducted by national research
130
ZA-Information 56
teams in fourteen Central and Eastern European countries (including East
Germany) between 1998 and 2001. Additionally, the survey has been carried
out in West Germany. The data set has been distributed by ZA under the
ZA-study-No. 3999 (n = 16.561).
Table Number of respondents per country and wave ZA-Study No. 4054
Belarus
Bulgaria
Czech Republic
Slovakia
Estonia
East Germany
West Germany
Hungary
Latvia
Lithuania
Poland
Romania
Russia
Slovenia
Ukraine
Krasnoyarsk
Total
Wave 1
1990-1992
1074
679
324
943
1087
1277
918
919
1234
686
1739
1485
12365
Wave 2
1998-2001
1000
1021
1004
1033
1000
1013
1022
1086
1099
1005
1369
1208
1500
1001
1200
16561
For ordering, please consult:
http://www.gesis.org/en/data_service/eastern_europe/order/order-www.htm
or contact:
Brigitte Hausstein
GESIS Service Agency Eastern Europe
Schiffbauerdamm 19, 10117 Berlin
E-mail: [email protected]
Phone: +49 (0)30 233611314
Fax: +49 (0)30 233611330
ZA-Information 56
131
Lebenssituation, Sicherheit und Gesundheit
von Frauen in Deutschland:
Eine Kurzbeschreibung der Studie
von Monika Schröttle 1
Die vom Bundesministerium für Familie, Senioren, Frauen und Jugend (BMFSFJ)
in Auftrag gegebene Studie „Lebenssituation, Sicherheit und Gesundheit von Frauen in Deutschland“ ist die erste große deutsche Repräsentativuntersuchung zu den
Gewalterfahrungen von Frauen in Deutschland. Sie wurde von 2002 bis 2004 unter
der Leitung von Prof. Dr. Ursula Müller und Dr. Monika Schröttle am Zentrum für
Interdisziplinäre Frauen- und Geschlechterforschung (IFF) der Universität Bielefeld
und in Kooperation mit infas durchgeführt. Die Studie wurde von einem internationalen wissenschaftlichen Beirat begleitet.
Ziel der Studie war, bestehende Dunkelfelder bestmöglich aufzudecken und Wissenslücken über das Ausmaß, die Formen und Ursachen von Gewalt gegen Frauen
zu schließen. Die erhobenen Daten bilden darüber hinaus eine empirische Basis für
die Ermittlung konkreter Handlungs- und Hilfebedarfe und für die Verbesserung
von Maßnahmen und Strategien zum Abbau von Gewalt im Geschlechterverhältnis
und zur Unterstützung gewaltbetroffener Frauen.
Für die Hauptuntersuchung wurden auf der Basis einer repräsentativen Gemeindestichprobe 10.264 in Deutschland lebende Frauen im Alter von 16-85 Jahren umfassend zu ihren Gewalterfahrungen in unterschiedlichen Lebenskontexten, zu den
Folgen von Gewalt, zur Inanspruchnahme von institutioneller Hilfe und Unterstützung sowie zu ihrem Sicherheitsgefühl und ihren Ängsten befragt (vgl. zu den Inhalten und der Methodik der Erhebung auch den Methodenbericht). Um zudem die
beiden größten Migrantinnengruppen in Deutschland – türkische Migrantinnen und
Aussiedlerinnen aus der ehemaligen UdSSR und Osteuropa – zu erfassen, wurden
zusätzlich jeweils 250 Interviews in türkischer und russischer Sprache durchgeführt.
1 Dr. Monika Schröttle, Universität Bielefeld, [email protected]
132
ZA-Information 56
Die bundesweite Erhebung erfolgte durch infas von Februar bis Oktober 2003. Es
handelte sich um standardisierte face-to-face-Interviews, die in den Haushalten der
Befragten, wahlweise auch an anderen Orten, durchgeführt wurden, und die durch
einen schriftlichen drop-off-Fragebogen zu Gewalt in Familien- und Paarbeziehungen ergänzt wurden. Die ca. 60-90-minütigen Interviews wurden allein und in Abwesenheit Dritter durchgeführt, um eine ruhige, ungestörte Interviewsituation zu
gewährleisten. Es wurden ausschließlich weibliche Interviewerinnen eingesetzt, die
für diese Aufgabe im Vorfeld durch infas und IFF spezifisch geschult und während
der Feldphase intensiv begleitet wurden. Im Anschluss an das Interview erhielten
die Befragten ein Informationsblatt mit regionalen Hilfemöglichkeiten für Frauen in
Gewaltsituationen, sowie mit der Nummer einer Studien begleitenden Telefonhotline, die während der Feldzeit am Zentrum für Interdisziplinäre Frauen- und Geschlechterforschung der Universität Bielefeld für Befragte und Interviewerinnen
eingerichtet wurde. Damit sollte möglichen negativen Folgen, die sich aus der Teilnahme an den Interviews für die Befragten ergeben können, entgegengewirkt werden.
Die Erhebungsinstrumente zur Erfassung von Gewalt wurden aus international
verwendeten Instrumenten der Gewaltforschung zusammengestellt und weiterentwickelt. Sie wurden so gewählt, dass sekundäranalytische Vergleiche mit anderen
europäischen Prävalenzstudien möglich sind und bestehende Dunkelfelder bestmöglich aufgedeckt werden können.
Zentrale Gewaltformen, die in der Studie erfasst wurden, sind: körperliche Gewalt,
sexuelle Gewalt, sexuelle Belästigung und psychische Gewalt. Die Betroffenheit
durch alle vier Gewaltformen wurde zunächst im mündlichen Befragungsteil abgefragt, und zwar jeweils anhand einer allgemeinen Einstiegsfrage zum Erleben dieser
Gewalt seit dem 16. Lebensjahr, der eine spezifizierte Liste mit konkreten Gewalthandlungen folgte, anhand derer die Befragten mithilfe von Kennbuchstaben benennen konnten, ob diese Gewalthandlung seit dem Alter von 16 Jahren einmal,
mehrmals oder nie erlebt wurde (die Einstiegsfragen und Itemlisten der abgefragten
Gewalthandlungen finden sich im Anhang dieser Kurzbeschreibung). Dem folgten
dann jeweils – falls eine der Handlungen erlebt wurde – weitere Nachfragen zur
Häufigkeit erlebter Situationen, zum Täter-Opfer-Kontext, in dem die Gewalt stattfand, zu den Folgen der Gewalt und zu weiteren Details bezogen auf konkrete
Gewaltsituationen.
Darüber hinaus wurde körperliche, sexuelle und psychische Gewalt auch im schriftlichen Fragebogen erfasst – einmal bezogen auf Gewalt durch aktuelle und frühere
Beziehungspartnerinnen und -partner, zum anderen bezogen auf Gewalt in Kindheit
und Jugend der Befragten bis zum Alter von 16 Jahren. Durch diese Methodik der
ZA-Information 56
133
zusätzlichen Abfrage sensibler Themenbereiche in einem schriftlichen Fragebogen,
wie sie auch in anderen Untersuchungen für die Erfassung von häuslicher und von
sexueller Gewalt bereits erfolgreich angewendet wurde2, konnte anhand des schriftlichen Fragebogens deutlich mehr Gewalt in Paarbeziehungen aufgedeckt werden
als durch den mündlichen Fragebogen allein. Offenbar sind viele Befragte eher bereit, über Gewalt in Familien- und Paarbeziehungen im anonymer wirkenden Setting eines schriftlichen, auf die Problematik zugeschnittenen Fragebogens Auskunft
zu geben als direkt im mündlichen Interview gegenüber einer dritten Person.
Gewaltprävalenzen bezeichnen den Prozentsatz derer, die in einem bestimmten
Zeitraum Opfer von Gewalt und Übergriffen geworden sind. Die für die Studie
dokumentierten Prävalenzdaten zur Gewaltbetroffenheit von Frauen seit dem 16.
Lebensjahr beziehen sich bei körperlicher und sexueller Gewalt auf alle Angaben
aus dem mündlichen und schriftlichen Fragebogenteil. Die Prävalenzdaten zu sexueller Belästigung und zu psychischer Gewalt beziehen sich nur auf die Angaben im
mündlichen Fragebogenteil. Eine Befragte galt als von einer Gewaltform betroffen,
wenn sie in der Einstiegsfrage oder in der nachfolgenden Itemliste angab, mindestens eine der genannten Gewalthandlungen mindestens einmal in ihrem Erwachsenenleben erlebt zu haben; weitere Differenzierungen zur Schwere und Häufigkeit
erlebter Gewaltsituationen wurden anhand der nachfolgenden Angaben zu erlebter
Gewalt vorgenommen.
Die Befunde der Untersuchung verweisen insgesamt auf hohe Gewaltbetroffenheiten in Deutschland. Demnach haben:
ƒ
37% aller befragten Frauen körperliche Übergriffe seit dem 16. Lebensjahr
erlebt, die von wütendem Wegschubsen und leichten Ohrfeigen ohne Verletzungsfolgen bis hin zu Treten, Verprügeln und Waffengewalt reichten. Etwa
zwei Drittel dieser Frauen haben auch mittlere bis schwere Formen von körperlicher Gewalt erlebt, die mit Verletzungsfolgen, Angst vor ernsthafter/lebensgefährlicher Verletzung, Waffengewalt oder einer höheren Frequenz von
Situationen einhergingen.
ƒ
13% der befragten Frauen, also etwa jede siebte in Deutschland lebende Frau,
hat sexuelle Gewalt seit dem 16. Lebensjahr erlitten. Dieser Anteil bezieht
sich auf eine enge Definition strafrechtlich relevanter Formen von erzwungener sexueller Gewalt wie Vergewaltigung, versuchte Vergewaltigung und
sexuelle Nötigung; bei breiteren Gewaltdefinitionen, die auch schwerere
2 Vgl. u.a. Wetzels/Pfeiffer (1995); Britisch Crime Survey (1996 und 2004).
134
ZA-Information 56
Formen von sexueller Belästigung einbeziehen, würde dieser Anteil auf bis zu
34% ansteigen.
ƒ
Unterschiedliche Formen sexueller Belästigung haben 58% der Befragten
erlebt.
ƒ
Formen psychischer Gewalt, die von eingeschüchtert Werden oder aggressivem Anschreien über Verleumdungen, Drohungen und Demütigungen bis hin
zu Psychoterror reichten, haben 42% der befragten Frauen benannt.
ƒ
Die Ergebnisse der Studie zeigen auf, dass Gewalt gegen Frauen überwiegend
Gewalt durch männliche Beziehungspartner ist und überwiegend im häuslichen Bereich erlebt wird. Insgesamt rund 25% der Frauen haben körperliche
oder sexuelle Übergriffe (oder beides) durch aktuelle oder frühere Beziehungspartner erlebt.
Das in der Studie erhobene Gewaltausmaß bestätigt bisherige Schätzungen zum
Ausmaß von Gewalt gegen Frauen in Deutschland. Im Vergleich zu den in anderen
europäischen Untersuchungen gemessenen Werten liegt das Gewaltausmaß im mittleren bis oberen Bereich, wobei die Vergleichbarkeit der europäischen Prävalenzdaten und der Einfluss unterschiedlicher Methoden auf die Ergebnisse derzeit noch
durch eine internationale Arbeitsgruppe zur Prävalenzforschung im Rahmen der
EU-Coordination Action on Human Rights Violations (CAHRV) geprüft wird.
Die Ergebnisse der Studie zeigen auf, dass alle erlebten Formen von Gewalt mit
erheblichen gesundheitlichen, psychischen und psychosozialen Folgen verbunden
sein können.
Viele Frauen, die Gewalthandlungen erlebt haben, sprechen mit niemandem über
das Ereignis; das gaben – je nach Schwere, Gewaltform und Kontext der Gewalt –
etwa 40-50% der gewaltbetroffenen Frauen an. Wenn Dritte angesprochen werden,
dann sind das am häufigsten FreundInnen und Personen aus dem engsten Familienkreis. Dies zeigt auf, wie wichtig die sozialen Umfelder der Betroffenen sind, wenn
es um Hilfe und Unterstützung in Gewaltsituationen geht.
Erst mit einigem Abstand werden dann Institutionen und Personen aus dem Hilfesystem, etwa ÄrztInnen, psychosoziale Hilfseinrichtungen und die Polizei als AnsprechpartnerInnen nach Gewaltsituationen in Anspruch genommen. Ärzte und
Ärztinnen werden – je nach Formen und Kontexten der Gewalt – von etwa einem
Drittel der Frauen, die Gewalt mit Verletzungsfolgen erlebt haben, eingeschaltet
und bilden eine zentrale Berufsgruppe, die mit Opfern von Gewalt in Berührung
kommen. Psychosoziale Hilfseinrichtungen und/oder die Polizei wurden – je
ZA-Information 56
135
nach Schwere, Form und Kontext der Gewalt – von 13-29% der gewaltbetroffenen
Frauen in Anspruch genommen.
Die Studie verweist – auch wegen des hohen Ausmaßes unterschiedlich schwerer
Formen von Gewalt gegen Frauen in Deutschland – auf einen erheblichen Hilfeund Unterstützungsbedarf für gewaltbetroffene Frauen, insbesondere auf die Notwendigkeit niedrigschwelliger Hilfe und Unterstützung, durch die betroffene Frauen
frühzeitiger erreicht werden können. Spezifische, stärker frequentierte Berufsgruppen wie ÄrztInnen und PsychotherapeutInnen, aber auch die sozialen Umfelder der
Betroffenen sind noch stärker als bisher in die Informations- und Öffentlichkeitsarbeit, und in die Entwicklung von Hilfe- und Präventionsstrategien einzubeziehen.
Die Studie enthält reichhaltiges Datenmaterial, das in den nächsten Jahren noch
weiter vertiefend und differenziert ausgewertet werden soll, insbesondere in Bezug
auf unterschiedliche Gewaltbetroffenheiten und Hilfe-/Unterstützungsbedarfe,
sowie die Frage nach gewaltfördernden bzw. -verringernden Bedingungen im
Lebensverlauf. Auch sind vertiefende Auswertungen über die gesundheitlichen
Folgen der Gewalt mit Blick auf verschiedene Bevölkerungsgruppen, sowie zu
den gesamtgesellschaftlichen Kosten der Gewalt geplant.
Publikation der Ergebnisse:
Kurzfassung:
BMFSFJ (Hrsg., 2004): Lebenssituation, Sicherheit und Gesundheit von Frauen in
Deutschland. Eine repräsentative Untersuchung zu Gewalt gegen Frauen in
Deutschland. Zusammenfassung zentraler Studienergebnisse. Berlin. (Erhältlich
über [email protected], Tel.: 080/5329329, Download unter
www.bmfsfj.de Stichwort → Forschungsnetz → Forschungsberichte)
Ausführliche Dokumentation aller Studienergebnisse im Internet
www.bmfsfj.de Stichwort → Forschungsnetz → Forschungsberichte
unter:
ƒ
Ergebnisse der repräsentativen Hauptuntersuchung (Schröttle und Müller 2004)
ƒ
Ergebnisse der Teilpopulationen-Zusatzbefragung (I Asylbewerberinnen,
II Prostituierte, III Frauen in Haft )
ƒ
Ergebnisse der Gruppendiskussionen zum Unterstützungs- und Hilfebedarf aus
der Sicht gewaltbetroffener Frauen (Glammeier, Müller u. Schröttle 2004)
ƒ
Methodenbericht (infas)
ƒ
Fragebogen (IFF/infas)
136
Projektteam am IFF:
Projektleitung:
Wissenschaftliche Mitarbeiterinnen:
Sachbearbeitung:
Studentische Hilfskraft:
Projektteam bei infas:
Projektleitung:
MitarbeiterInnen:
ZA-Information 56
Prof. Dr. Ursula Müller, Dr. Monika Schröttle
Sandra Glammeier, Christa Oppenheimer
Barbara Schulz
Alexandra Münster
Doris Hess, Dr. Angela Prussog-Wagner
Karen Marwinski, Christine Fredebeul,
Reiner Gilberg, Gerd Kästner
Im Folgenden ein Auszug aus der Studienbeschreibung, die im Internet vollständig
abrufbar ist. Er bezieht sich auf einen Teil der mündlichen Befragung3 und vermittelt einen Eindruck von der Detailliertheit mit der das Thema angegangen wird.
Themen der Befragung:
Angaben zur Person: bisheriger Lebensverlauf; Selbsteinschätzung; Sozialverhalten.
Sicherheitsempfinden: Auf dem nächtlichen Heimweg, in öffentlichen Verkehrsmitteln
und in Parkhäusern (Skalometer); Häufigkeit des Verweilens in solchen Situationen;
Unsicherheitsempfinden als Grund für den Rückzug aus diesen Situationen; Angst
vor körperlichen oder sexuellen Übergriffen durch Fremde, Bekannte, Familie/
Partner oder Kollegen; höheres Sicherheitsgefühl auf Frauenparkplätzen; Sicherheitsempfinden nachts alleine in der eigenen Wohnung; Maßnahmen zur Verstärkung des
persönlichen Sicherheitsempfindens: mitgeführte Gegenstände zur Selbstverteidigung,
mentale Vorbereitung, Selbstverteidigungskurs, Meiden von unsicheren Wegen,
Ausweichen auf andere Straßenseite, Einschließen im Auto, Umsehen nach verdächtigen Personen, Taxinutzung und selbstbewusstes Auftreten.
Opfererfahrung: gewaltsamer Überfall, Wohnungseinbruch oder Geiselnahme und
Häufigkeit der Geschehnisse in den letzten fünf Jahren sowie 12 Monaten, TäterOpfer-Beziehung.
Sexuelle Belästigung: Häufigkeit sowie Art und Weise eigener Erfahrungen; Vorkommnisse allgemein und in den letzten 12 Monaten (Skala: Telefonterror, Nachpfeifen, sexuelle Anspielungen, Obszönitäten, körperliche Berührung und Verfolgung); detaillierte Angaben zum Täter-Opfer-Kontext: Häufigkeit sexueller Belästigungen durch Fremde, Arbeitskollegen, Vertrauenspersonen, Freunde/Bekannte,
3 In der ZA-Studien-Nr. 4194 ist darüber hinaus die schriftliche Befragung mit vergleichbaren
Befragungsinhalten archiviert.
ZA-Information 56
137
Partner, Familienangehörige; Geschlecht und Alter der Personen; Häufigkeit des
Gefühls ernsthafter Bedrohung.
Psychische Gewalt, Skala: Abwertung, Einschüchterung, Ausgrenzung, Verleumdung
und Psychoterror durch andere Personen; Vorkommnisse allgemein und in den letzten
12 Monaten; detaillierte Angaben zum Täter-Opfer-Kontext und zu den psychischen
und physischen Folgen.
Körperliche Gewalt: Häufigkeit körperlicher Angriffe seit dem 16. Lebensjahr und
in den letzten 12 Monaten: (Skala der Angriffe in Form von Ohrfeigen, Schlägen,
Würgen, Bedrohen oder Verletzen mit Messer bzw. Pistole und Morddrohung);
Bekanntschaftsgrad, Geschlecht und Alter der Täter; Orte der Angriffe (in der
Wohnung oder draußen sowie in Deutschland oder im Ausland); Befragte als
Angreiferin; Art der Verletzungen; Angst vor lebensgefährlichen Verletzungen.
Ergriffene Maßnahmen: medizinische Hilfe, Polizei eingeschaltet, Anzeigeverhalten;
vermutete Gründe für Angriffe: Geschlecht, sozialer Status, ausländische Erscheinung oder Behinderung der Befragten; detaillierte Angaben über die als besonders
belastend empfundene Tat bzw. Situation.
Folgen des Angriffs: gesundheitliche und seelische Probleme (z.B. Depression,
Rachegefühle, Suizidgedanken), Konsum von Alkohol, Drogen oder Medikamenten;
langfristige Folgen; Beurteilung des Verbrechens; Einschaltung der Polizei durch die
Befragte oder andere; Gründe für eine eventuelle Nichteinschaltung der Polizei: Angst
vor Rache, Schutz des Täters, Schamgefühl; verstrichene Zeit bis zur Anzeige, Art
der erwarteten Behandlung durch die Polizei, Reaktion der Polizei, Zufriedenheit
mit dem Handeln der Polizei; Scheu vor Gerichtsverhandlung; Aufrechterhaltung
oder Zurückziehen der Anzeige; Gründe für eine eventuelle Nichterstattung einer
Anzeige; Gerichtsverhandlung: Strafgericht oder Zivilgericht, Auftritt der Befragten
als Nebenklägerin, Dauer des Prozesses, Prozess abgeschlossen, Ausgang der Verhandlung, Zufriedenheit mit der Verhandlung, Probleme und Belastungen vor
Gericht; Rat der Befragten an andere in ähnlicher Situation.
Sexuelle Gewalt: Ungewollte sexuelle Handlungen seit dem Alter von 16 Jahren:
Unwillen vorher deutlich gemacht, Häufigkeit der Handlungen in den letzten 12
Monaten, fünf Jahren, seit dem Alter von 16 Jahren, Art und Weise der sexuellen
Handlungen; Bekanntschaftsgrad, Geschlecht und Alter der Täter; Orte der sexuellen
Handlungen (in der Wohnung oder draußen sowie in Deutschland oder im Ausland); Art der Verletzungen; Angst vor lebensgefährlichen Verletzungen; ergriffene
Maßnahmen: medizinische Hilfe, Anzeigeverhalten; Bekanntschaftsgrad, Geschlecht
und Alter des Täters; detaillierte Angaben über die Tat bzw. Situation in diesem
Bereich; Kenntnis und Inanspruchnahme von Hilfseinrichtungen.
138
ZA-Information 56
Japan zu Gast im Zentralarchiv
von Wolfgang Jagodzinski
Als ein Testfall für die Modernisierungstheorien wird der asiatische Raum in den
nächsten Jahren noch an Bedeutung gewinnen. Dabei scheinen Konzepte wie Rationalisierung, Postmodernisierung, Säkularisierung oder Individualisierung, die wir
im Westen zur Erklärung sozialen Wandels benutzen, auf asiatische Länder wie Japan nur eingeschränkt übertragbar. Auch mit der Messung von Werten tut man sich
schwer. Beim ersten Anblick der zweidimensionalen Wertdiagramme von Ronald
Inglehart stellt der deutsche Leser mit großer Verwunderung fest, dass Japan in
unmittelbarer Nachbarschaft von Ostdeutschland liegt. Die Ostdeutschen sind den
Japanern im Hinblick auf ihre Wertorientierungen ähnlicher als den Westdeutschen
– wer hätte das gedacht! Auf den zweiten Blick, wenn wir nämlich die Inglehartschen Operationalisierungen und die Anordnung der geographischen Einheiten im
Werteraum verstanden haben, beschleicht uns das Gefühl, dass diese Diagramme
zentrale kulturelle Werte nur unzureichend erfassen. Dafür spricht auch, dass die in
internationalen Umfragen gemessenen Werte konkretere Einstellungen und Verhaltensweisen in Japan kaum erklären.
Wenn wir die Modernisierungsprozesse in dem Land besser verstehen wollen, dann
bleibt kein anderer Weg, als in intensivere Kooperationen mit japanischen Sozialwissenschaftlern einzutreten. Bislang scheiterte das häufig an Sprachbarrieren1 wie
auch daran, dass der Zugang zu japanischen Daten nicht einfach war. In beiden
Punkten zeichnet sich in den letzten Jahren ein erfreulicher Wandel ab. Die Kommunikationsmöglichkeiten in englischer Sprache haben sich erheblich verbessert.
Gleichzeitig sind in Japan Bestrebungen im Gange, der internationalen Scientific
Community den Zugang zu japanischen Daten zu erleichtern, indem man Datendokumentationen in englischer Sprache erstellt und die Möglichkeit von Downloads
im Internet anbietet. Besonders eindrucksvoll ist der Service, der in den vergangenen Jahren unter der Leitung von Professor Naoi, dem langjährigen Vorsitzenden
der japanischen Gesellschaft für Soziologie, an der Universität Osaka entstanden ist,
wo japanische Umfragen zur sozialen Mobilität und zur Informationsgesellschaft
1 Wobei zu betonen ist, dass der Anteil der japanischen Wissenschaftler, die deutsch sprechen,
ungleich höher ist, als der Anteil der deutschen Wissenschaftler, die japanisch sprechen.
ZA-Information 56
139
unter einem auch technisch anspruchsvollen System SRDQ (Social Research
Database on Questionnaires) für empirische Analysen zur Verfügung stehen
(http://srdq.hus.osaka-u.ac.jp). Über eine weitere Datenquelle, den japanischen General
Social Survey (JGSS), wurde in der letzten Ausgabe dieser Zeitschrift berichtet.
Ferner sind Bestrebungen im Gange, in Japan verschiedene Datenzentren aufzubauen
und unter dem Dach eines Konsortiums zusammen zu schließen.
Das ZA unterstützt diese Bemühungen. Es hat im Februar dieses Jahres eine kleine
Gruppe von japanischen Wissenschaftlern nach Köln eingeladen, um mit ihnen die
Möglichkeiten japanisch-deutscher bzw. europäisch-asiatischer Forschungskooperationen auszuloten. Dabei wurden am ersten Tag japanische Datensätze vorgestellt,
die für Ländervergleiche besonders geeignet erscheinen. Am zweiten Tag wurden
mit den japanischen Gästen infrastrukturelle Maßnahmen zur Förderung des Datenaustauschs und der Forschungskooperationen diskutiert. An dem Treffen nahmen,
in der Reihenfolge ihrer Vorträge, auf japanischer Seite folgende Personen teil:
Kazufumi Manabe, Kwansei Gakuin University
Akira Kawabata, Osaka University
Tsuyoshi Sugano, Nihon University
Shunroku Yoshida, Takaoka National College
Masato Yoneda, National Institute for Japanese Language
Hiroshi Aramaki, NHK Broadcasting Culture Research Institute.
Auf deutscher Seite waren neben Mitarbeitern des ZA auch Experten der international vergleichenden Forschung bei dem Treffen zugegen.
Der Koordinator der Gruppe, Professor Manabe, berichtete am ersten Tag über die
Organisation der Umfrageforschung in Japan. In den folgenden Beiträgen wurden die Möglichkeiten des SRDQ Systems vorgestellt und das Analysepotential
der in Osaka archivierten Studien an konkreten empirischen Analysen aufgezeigt
(Kawabata und Sugano). Professor Yoshida stellte die von japanischen Versicherungen finanzierten Japanese People's Values in Life Surveys vor. Diese Umfragen
dokumentieren u. a. einen erheblichen Rückgang der Lebenszufriedenheit der japanischen Bevölkerung in der letzten Dekade. The International Census on Attitudes
toward Languages könnte ein interessanter Datensatz für Personen sein, die sich
ländervergleichend mit Einstellungen zu Fremdsprachen beschäftigen wollen
(Yoneda). Um die Beschränkungen international-vergleichender Umfragen zu
überwinden, entwickelt NHK zu bestimmten Themenkomplexen Zusatzmodule, die
eine differenziertere Erfassung der fraglichen Einstellungen und Verhaltensweisen
ermöglichen. Beispielsweise werden im Zusatzmodul zum Religionsmodul des
140
ZA-Information 56
ISSP (1998) spezifische religiöse Praktiken in Japan erhoben, die nicht Gegenstand
der Hauptbefragung sind (Aramaki).
Wie solche und weitere Umfragen künftig europäischen Sozialwissenschaftlern zugänglich gemacht werden, ist noch nicht abschließend geklärt. Verschiedene Modelle
wurden diskutiert. Mitarbeiter des ZA zeigten den japanischen Gästen am zweiten
Tag, welche Standards die im ZA archivierten Umfragen erfüllen müssen. Außerdem wurden wichtige Produkte und Entwicklungsprojekte des ZA vorgestellt. Im
weiteren Verlauf des Symposiums wurden die Eckpunkte eines Kooperationsabkommens besprochen und konkrete Maßnahmen der Zusammenarbeit vereinbart.
Eine solche Maßnahme ist die Veranstaltung von Data Confrontation Seminars im
ZA, in denen wichtige international vergleichende Studien unter japanischer Federführung europäischen Sozialwissenschaftlern vorgestellt werden sollen. Die Professoren Inoguchi (AsiaBarometer) und Yoshino (East Asia Value Survey) haben ihr
Kommen bereits zugesagt. Wir werden die Veranstaltungen rechtzeitig auf unserer
Homepage ankündigen.
Structural Equation (SEM) and
Mixture Modelling (MM)
Overview and Specialisations
35th Spring Seminar at the Zentralarchiv, March 6 - 24, 2006
First announcement
The Spring Seminar is a training course for social scientists interested in advanced
techniques of data analysis and in the application of these techniques to data. Participants must have a sound basic knowledge of statistics as well as experience in
the handling of PCs and of working with statistical packages like SPSS.
The Spring Seminar comprises lectures, exercises and practical work using personal
computers. While in the lectures the logic of models and the corresponding analysis
strategies will be explained, during the exercises and in the practical work the participants are given the opportunity to apply these methods to data. As in the past
Spring Seminars, the focus will be on teaching multivariate analysis techniques. In
ZA-Information 56
141
addition to the lectures, the participants will be provided with information about
functions and services of the Zentralarchiv which is the German data archive for
survey data.
The seminar covers three modules of one week each, to some extent based upon one
another. The courses can be booked either separately or as a block:
For news and updates concerning the Spring Seminar, please refer to the following
website: http://www.gesis.org/za
1. Week: March 6-10
Prof. Dr. Peter Schmidt with Dr. Eldad Davidov
(Both: University of Gießen, Germany)
Structural Equation Models:
Theory, Applications and Extensions of the basic Model
2. Week: March 13-17
Prof. Dr. Joop Hox
(Utrecht University, The Netherlands)
Multi-Level Models in SEM
3. Week: March 20-24
Prof. Dr. Jan-Eric Gustafsson
(Gothenburg University, Sweden)
Mixture Models + SEM - Applications within Stream
For questions please refer to:
Zentralarchiv für Empirische Sozialforschung, Universität zu Köln
Bachemer Str. 40, 50931 Köln
Spring Seminar secretariat:
Marianne Hurt, phone: +49-221-47694-101, e-mail: [email protected]
Or: [email protected]
Facsimile: +49-221-47694-904
Scientific coordinator:
Maria Rohlinger, phone: +49-221-47694-45,
e-mail: [email protected]
142
ZA-Information 56
Forschungsmethoden, Datenbankmanagement und
Statistik in der Historischen Sozialforschung
Basis- und Aufbaumodule des ZHSF-Methodenseminars
Das Lehrangebot des ZHSF-Methodenseminars (seit 1980 auch bekannt als "ZHSFHerbstseminar") ist modular strukturiert, d.h. es besteht aus in sich geschlossenen
Lehreinheiten, die thematisch aufeinander abgestimmt sind. Die Module des ZHSFMethodenseminars werden teils virtuell im Internet, teils vor Ort in Köln angeboten.
Virtuell werden angeboten: das dreimonatige Basismodul "Forschungsmethoden"
(einschließlich der Propädeutika der Vor-Ort-Basis-Module "Datenbankmanagement" und "Deskriptive Statistik") und das zweimonatige "Follow-Up-Seminar" zu
den Basismodulen. Vor Ort in Köln werden angeboten: das zweitägige Einstiegsseminar zum virtuellen Basismodul, zwei viertägige Basismodule und zwei sechstägige
Aufbaumodule.
Die Basismodule vermitteln die Grundlagen der Methodik Historischer Sozialforschung (Forschungsmethoden, Datenbankmanagement und Deskriptive Statistik).
Sie können ohne besondere Vorkenntnisse besucht werden. Die Aufbaumodule
befassen sich mit der Theorie und Anwendung der multiplen Regression sowie
verwandten Methoden des allgemeinen linearen Modells für metrische und diskrete
abhängige Merkmale. Die Teilnahme an den Aufbaumodulen setzt Vorkenntnisse
im Bereich der bivariaten Datenanalyse (bivariate Regression, einfache Varianzanalyse) und der Inferenzstatistik (Verteilungsmodelle, Grundlagen statistischer
Hypothesentests) voraus.
Termine:
Basismodule
Einstiegsseminar zum virtuellen Basismodul I:
29.04.-01.05.2005; vor Ort in Köln
Basismodul I "Forschungsmethoden":
Mai bis Juli 2005; virtuell im Internet
Basismodul II "Datenbankmanagement":
30.07.-03.08.2005; vor Ort in Köln
ZA-Information 56
143
Basismodul III "Deskriptive Statistik":
03.08.-07.08.2005; vor Ort in Köln
Follow-Up-Seminar zu den Basismodulen:
August-Oktober 2005; virtuell im Internet
Aufbaumodule
Aufbaumodul I: "Allgemeines Lineares Regressionsmodell/Submodelle":
21.08.-26.08.2005; vor Ort in Köln
Aufbaumodul II: "Analyse diskreter abhängiger Merkmale":
29.08.-02.09.2005; vor Ort in Köln
Gebühren:
Repetitorium:
€ 50,- (Studenten und arbeitslose Teilnehmer: € 25,-).
Basismodule:
€ 120,- für alle Basismodule (Studenten und arbeitslose Teilnehmer: € 60,-).
€ 50,- je Einzelmodul (Studenten und arbeitslose Teilnehmer: € 25,-).
Aufbaumodule:
€ 120,- für beide Module inkl. Kursmaterialien (Studenten und arbeitslose Teilnehmer: € 60,-).
€ 75,- für ein Einzelmodul inkl. Kursmaterialien (Studenten und arbeitslose Teilnehmer: € 37).
Anmeldeschluss: Basismodule: 15. April 2005; Aufbaumodule: 30. Juni 2005
Kontakt:
ZHSF-Support, Liliencronstr. 6, 50931 Köln
Tel. 0221 47694 -56, -35, -34
Fax 0221 47694 55
[email protected] und [email protected]
Weitere Informationen zu den Seminaren und Anmeldeformulare finden sich auf
dem Server des Zentralarchivs und auf dem ZHSF-Server unter
http://www.gesis.org/Veranstaltungen/
http://zhsf.za.uni-koeln.de/
144
ZA-Information 56
Erweiterungen im Datenangebot des Zentralarchivs
Diese Aufstellung gibt eine Auswahl von Neuzugängen wider. Neben der Archivnummer und dem Studientitel sind die Primärforscher bzw. die Erhebungsinstitute
und das Erhebungsjahr aufgeführt. Weitere Details zu den einzelnen Datensätzen sind
in Form von Studienbeschreibungen über das Internet zugänglich: www.gesis.org/za
Internationale Institutionen und Beziehungen
3204 Eurobarometer 52.0: 1999 (European Parliament Elections, the Single European Currency, and Financial Services)
3205 Eurobarometer 52.1: 1999 (Modern Biotechnology, Quality of Life, and
Consumers’ Access to Justice)
3296 Eurobarometer 53: 2000 (Racism, Information Society, General Services,
and Food Labeling)
3386 Eurobarometer 54.0: 2000 (The Euro, Financial Services, and Information
Communication Technologies)
3387 Eurobarometer 54.1: 2000 (Building Europe and the European Union, The
European Parliament, Public Safety, and Defence Policy)
3388 Eurobarometer 54.2: 2001 (Impact of New Technologies, Employment and
Social Affairs, and Disabilities)
3389 Eurobarometer 54LAN: 2000 (Special Survey on Languages)
3506 Eurobarometer 55.0: 2001 (European Union Enlargement, the Euro, and Dialogue on Europe)
3507 Eurobarometer 55.1: 2001 (Globalization and Humanitarian Aid)
3508 Eurobarometer 55.1OVR: 2001 (Young Europeans)
3509 Eurobarometer 55.2: 2001 (Science and Technology, Agriculture, the Euro,
and Internet Access)
3625 Eurobarometer 56.0: 2001 (Information and Communication Technologies,
Financial Services, and Cultural Activities)
3626 Eurobarometer 56.1: 2001 (Social Exclusion and Modernization of Pension
Systems)
ZA-Information 56
145
3627 Eurobarometer 56.2: 2001 (Radio Active Waste, Demographic Issues, the
Euro, and European Union Enlargement)
3635 Eurobarometer 56.3: 2002 (Getting Information on Europe and European
Union Enlargement)
3638 Eurobarometer 57.0: 2002 (Agriculture, Energy, and Discrimination Issues)
3639 Eurobarometer 57.1: 2002 (European Union Enlargement, the European Parliament, and the Euro)
3640 Eurobarometer 57.2: 2002 (Health Issues, Cross-Border Purchases, and
National Identities)
3641 Eurobarometer 57.2 OVR: 2002 (Attitudes and Opinions of Young People in
the European Union on Drugs)
3692 Eurobarometer 58.0: 2002 (Services of General Interest, New Technologies,
ICT, Health, Environment, and Public Safety)
3693 Eurobarometer 58.1: 2002 (The Euro, European Enlargement, and Financial
Services)
3886 Eurobarometer 58.2: 2002
3903 Eurobarometer 59.0: 2003 (Lifelong Learning, Health, and Partners and
Fertility)
3904 Eurobarometer 59.1: 2003 (The Euro and Parental Leave)
3905 Eurobarometer 59.2: 2003
3937 Eurobarometer 60.0: 2003
3938 Eurobarometer 60.1: 2003 (Citizenship and Sense of Belonging, Fraud, and
the European Parliament)
3939 Eurobarometer 60.2: 2003
3940 Eurobarometer 60.3: 2003-2004
4056 Eurobarometer 61: 2004 (The European Union, Globalization, and the European Parliament - 30 Years of Eurobarometers)
Europäische Kommission, Brüssel
3521 The Mannheim Eurobarometer Trend File 1970-2002 (ed. 2.00)
MZES, Mannheim; ZUMA, Mannheim; ZA, Köln
146
ZA-Information 56
Eurobarometer für Mittel- und Osteuropa
3648 Central and Eastern Eurobarometer 1990-1997: Trends CEEB 1-8
3978 Candidate Countries Eurobarometer 2001
3979 Candidate Countries Eurobarometer 2002.2
3980 Candidate Countries Eurobarometer 2002.3 (Agriculture)
3981 Candidate Countries Eurobarometer 2002.3 (Science and Technology)
3982 Candidate Countries Eurobarometer 2003.1 (Youth in New Europe)
3983 Candidate Countries Eurobarometer 2003.2
3984 Candidate Countries Eurobarometer 2003.3
3986 Candidate Countries Eurobarometer 2003.4
Europäische Kommission, Brüssel
Flash Eurobarometer
3191 Flash Eurobarometer 68: 1999 (EOS Managers 15)
3192 Flash Eurobarometer 69: 1999 (Dialogue with Citizens)
3193 Flash Eurobarometer 70: 1999 (EOS Managers 16)
3194 Flash Eurobarometer 71: 1999 (Town twinning Mayors/Responsibles)
3487 Flash Eurobarometer 78: 2000 (Multimedia Internet Services: Special Enterprises)
3600 Flash Eurobarometer 111: 2001 (Small and Medium Enterprises and the
Euro 6)
3604 Flash Eurobarometer 115: 2001 (Euro Introduction Attitudes, Step 12 - Euro
Zone)
3605 Flash Eurobarometer 115: 2001 (Euro Introduction Attitudes, Step 12 - NonEuro Zone)
3606 Flash Eurobarometer 116: 2001 (Special Target: E-Commerce)
Europäische Kommission, Brüssel
International Social Survey Programme (ISSP)
3190 International Social Survey Programme 1998: Religion II (ISSP 1998)
3390 International Social Survey Programme: Religion I/II (ISSP 1991 - 1998)
ZA-Information 56
147
3430 International Social Survey Programme 1999: Social Inequality III (ISSP
1999)
3440 International Social Survey Programme 2000: Environment II (ISSP 2000)
3680 International Social Survey Programme 2001: Social Relations and Support
Systems ('Social Networks II') (ISSP 2001)
3880 International Social Survey Programme 2002: Family and Gender Roles III
(ISSP 2002)
Studien aus Osteuropa
1. Bulgarien
3960 Die Bulgarische Sicherheitspolitik 1999
3961 Die Bulgarische Sicherheitspolitik 2000
3962 Die Bulgarische Sicherheitspolitik 2001
3963 Die öffentliche Wahrnehmung ethnischer Beziehungen in Bulgarien 2003
3964 Einstellung Jugendlicher zu Drogen und Drogengebrauch in Bulgarien 1998
Y. Yanakiev, Institute for Advanced Defence Research of the Bulgarian
Ministry of Defence, Sofia
2. Polen
3358 The Transformation Process in Poland 1993 (Business Survey)
H.P. Haarland, H.-J. Niessen, W. Franzen, W. Uellner, Forschungsstelle für
empirische Sozialökonomik e. V., Köln
3946 Polish General Social Survey 1992-1999
B. Cichomski, Institute for Social Studies, University of Warsaw
3. Rumänien
3643 Quality of Life Diagnosis in Romania 1994
3644 Quality of Life Diagnosis in Romania 1995
3645 Quality of Life Diagnosis in Romania 1996
3646 Quality of Life Diagnosis in Romania 1997
3647 Quality of Life Diagnosis in Romania 1998
I. Marginean, Institute for Quality of Life Research, Romanian Academy,
Bukarest
148
ZA-Information 56
4. Serbien
3893 Political and Social Attitudes in Serbia 2002
R. Domm, OSCE Mission to the Federal Republic of Yugoslavia, Belgrad
5. Slowenien
3215 Role of Government and Role of Slovenian Public Opinion 1989
N. Tos, u.a., Public Opinion Research Centre, Faculty of Social Science,
University of Ljubljana
3216 Slovenian-Austrian Comparative Values Survey 1994
N. Tos, Public Opinion Research Centre, Faculty of Social Science University of Ljubljana, Slowenien; G. Ogris, Institute for Social Research and
Analysis (SORA), Wien; M. Lay, E. Gehmacher, Institute for Empirical Social
Research (IFES), Wien
3217 Slovenian Public Opinion Survey - Repeated questions from German Politbarometer 1990-1998
3527 Slovenian Public Opinion 1990
3528 Slovenian Public Opinion 1992: The Process of Democratisation
3529 Slovenian Public Opinion 1996: Comparative Study of Electoral Systems
(CSES)
3530 Slovenian Public Opinion 1997: Slovenians‘ Attitudes on Integration in the
European Union
N. Tos, Public Opinion and Mass Communication Research Centre,
University of Ljubliana
6. Tschechien und Slowakei
3360 The Transformation Process in the Czech and Slovak Republic 1994
(Business Survey)
H.P. Haarland, H.-J. Niessen, W. Franzen, W. Uellner, Forschungsstelle für
empirische Sozialökonomik e. V., Köln
3631 1996 Czech Pre-Election Survey (April 1996)
3632 1996 Czech Pre-Election Survey (May 1996)
ZA-Information 56
149
3633 1996 Czech Post-Election Survey (June 1996)
G. Toka, Central University Budapest
3888 Party Preferences Czech Republic 1996 (Trend)
3889 Party Preferences Czech Republic 1998 (Trend)
3890 Party Preferences Czech Republic 1999 (Trend)
3891 Party Preferences Czech Republic 2000 (Trend)
3892 Party Preferences Czech Republic 2001 (Trend)
Institute for Public Opinion Research (IVVM), Prague
7. Ukraine
3965 Die Ukrainische Gesellschaft am Übergang zum 21. Jahrhundert 1998
3966 Die Ukrainische Gesellschaft am Übergang zum 21. Jahrhundert 1999
3967 Die Ukrainische Gesellschaft am Übergang zum 21. Jahrhundert 2000
V. Vorona, E. Golovakha, N. Panina, Institute of Sociology of Academy of
Sciences of Ukraine
8. Ungarn
3370 The Transformation Process in Hungary 1995 (Business Survey)
H.P. Haarland, H.-J. Niessen, W. Franzen, W. Uellner, Forschungsstelle für
empirische Sozialökonomik e. V., Köln
9. Weißrussland
4053 Demokratische Einstellungen in Weißrussland 2002
L. Titarenko, Staatliche Universität Weißrussland, Abteilung Soziologie,
Minsk
10. diverse
3218 Post communist Citizens I 1990-1992 - 11 Countries - First wave (= PCP I)
(hierin enthalten: 3219 Post communist Citizens Eastern Germany 1992)
3999 Consolidation of Democracy in Central and Eastern Europe 1998-2001 (PCP II)
150
ZA-Information 56
4054 Consolidation of Democracy in Central and Eastern Europe 1990-2001:
Kumulation PCP I und II
D. Fuchs, u.a., Wissenschaftszentrum Berlin für Sozialforschung;
sowie Forscher aus den teilnehmenden Ländern
3399 The Transformation Process in Hungary, Poland, in the Czech and Slovak
Republic 1993-1995 (Population Survey)
H.P. Haarland, H.-J. Niessen, W. Franzen, W. Uellner, Forschungsstelle für
empirische Sozialökonomik, Köln
3299 Transition Barometer 1997
H. P. Haarland, H.-J. Niessen, W. Franzen, W. Uellner, Forschungsstelle für
empirische Sozialökonomik, Köln
4046 Transatlantische Beziehungen
IPOS, Institut für praxisorientierte Sozialforschung, Mannheim; W. Bürklin,
Bundesverband deutscher Banken, Berlin
Politische Einstellungen und Verhaltensweisen
Wahlen
3861 Politische Einstellungen, politische Partizipation und Wählerverhalten im
vereinigten Deutschland 2002 (= Bundestagswahlstudie 2002)
J.W. Falter, Universität Mainz; O.W. Gabriel, Universität Stuttgart;
H. Rattinger, Universität Bamberg
3272 Wahlstudie 1957
Institut für Demoskopie, Allensbach
3381 Landtagswahl in Baden-Württemberg 2001
3955 Landtagswahl in Bayern 2003
3894 Wahl zum Abgeordnetenhaus in Berlin 1999
3862 Wahl zum Abgeordnetenhaus in Berlin 2001
3895 Landtagswahl in Brandenburg 1999
3992 Landtagswahl in Brandenburg 2004
ZA-Information 56
3953 Bürgerschaftswahl in Bremen 2003
3863 Bürgerschaftswahl in Hamburg 2001
3990 Bürgerschaftswahl in Hamburg 2004
3866 Landtagswahl in Hessen 2003
3864 Landtagswahl in Mecklenburg-Vorpommern 2002
3867 Landtagswahl in Niedersachsen 2003
3436 Landtagswahl in Nordrhein-Westfalen 2000
3382 Landtagswahl in Rheinland-Pfalz 2001
3896 Landtagswahl im Saarland 1999
3993 Landtagswahl im Saarland 2004
3897 Landtagswahl in Sachsen 1999
3994 Landtagswahl in Sachsen 2004
3865 Landtagswahl in Sachsen-Anhalt 2002
3435 Landtagswahl in Schleswig-Holstein 2000
3898 Landtagswahl in Thüringen 1999
3991 Landtagswahl in Thüringen 2004
Forschungsgruppe Wahlen, Mannheim
3261 Politbarometer West 1999
3262 Politbarometer Ost 1999
3425 Politbarometer West 2000
3426 Politbarometer Ost 2000
3554 Politbarometer West 2001
3555 Politbarometer Ost 2001
3849 Politbarometer West 2002
3850 Politbarometer Ost 2002
Forschungsgruppe Wahlen, Mannheim
151
152
ZA-Information 56
3380 Forsa-Bus 1991
3300 Forsa-Bus 1992
3289 Forsa-Bus 1999
3486 Forsa-Bus 2000
3675 Forsa-Bus 2001
3909 Forsa-Bus 2002
4070 Forsa-Bus 2003
4192 Forsa-Bus 2004
FORSA, Berlin
3238 Europawahl 1999
3995 Europawahl 2004
3475 Volksabstimmung in Berlin und Brandenburg 1996
3954 Zur politischen Lage in Bayern 2003
3869 Zur politischen Lage in Berlin im Oktober 2001
4067 Zur politischen Lage in Brandenburg im September 2004
3868 Zur politischen Lage in Hamburg im September 2001
4100 Zur politischen Lage in Hamburg im Februar 2004
3872 Zur politischen Lage in Hessen im Januar 2003
3870 Zur politischen Lage in Mecklenburg-Vorpommern im August 2002
3871 Zur politischen Lage in Niedersachsen Januar 2003
4068 Zur politischen Lage im Saarland im August 2004
4069 Zur politischen Lage in Sachsen im September 2004
3998 Zur politischen Lage in Thüringen 2004
Forschungsgruppe Wahlen, Mannheim
4047 Das Amerikabild der Deutschen (Ost) 1991
4049 Das Amerikabild der Deutschen (Ost) 1993
4048 Das Amerikabild der Deutschen (West) 1991
4050 Das Amerikabild der Deutschen (West) 1993
IPOS, Institut für praxisorientierte Sozialforschung, Mannheim
ZA-Information 56
153
3429 Kölner Lokalstudie zum politischen Informationsverhalten: Landtagswahl in
NRW 1995
St. Kühnel, D. Ohr, Institut für Angewandte Sozialforschung, Universität zu
Köln
3476 Politische Einstellungen in Berlin (November 1960)
3477 Politische Einstellungen in Berlin (Mai-Juni 1961)
3478 Politische Einstellungen in Berlin (Juni 1962)
3479 Politische Einstellungen in Berlin (Dezember 1962)
3480 Politische Einstellungen in Berlin (Januar 1963)
3481 Politische Einstellungen in Berlin (Kumulierter Datensatz: November 1960 Januar 1963)
EMNID, Bielefeld
Bundesverband deutscher Banken
3222 50 Jahre Bundesrepublik Deutschland 1999
3223 Die ‘Berliner Republik’ 1999
3874 Nach der Bundestagswahl 2002: Deutschland im Aufbruch?
3875 Nach der Bundestagswahl 2002: Das Regierungsprogramm
3384 Deutschland im Wandel 2000
IPOS, Institut für praxisorientierte Sozialforschung, Mannheim; W. Bürklin,
Bundesverband deutscher Banken, Berlin
Wirtschaftspolitik, wirtschaftliche Lage
3220 Deutschland Richtung geben 1998
3221 Deutschland nach dem Regierungswechsel 1998
3224 Wirtschaftsstandort Deutschland 2000
3383 Chancen der Globalisierung 2000
3873 Wirtschaftsstandort Deutschland 2002
4000 Wirtschaftsstandort Deutschland 2004
IPOS, Institut für praxisorientierte Sozialforschung, Mannheim; W. Bürklin,
Bundesverband deutscher Banken, Berlin
154
ZA-Information 56
Staatliche Einnahmen
3265 Steuermoral und Steuermentalität der bundesdeutschen Bevölkerung und
deren Einstellungen zur Steuerreform 1997
H.P. Haarland, H.-J. Niessen; Forschungsstelle für empirische
Sozialökonomik, Köln
Arbeit und Betrieb
3957 Geringfügige Beschäftigung und Nebenerwerbstätigkeiten 2001/2002
Infratest Sozialforschung, Forschungsteam Internationaler Arbeitsmarkt,
Internationales Institut für empirische Sozialökonomie
Beruf
3374 Berufliche Selbständigkeit in den neuen Bundesländern (Leipziger Gründerstudie) 1992-1995
S.H. Wilsdorf, Institut für Soziologie, Universität Leipzig; R. Ziegler,
P. Preisendörfer, T. Hinz, Institut für Soziologie, Universität München
BIBB/IAB-Studien
3348 IAB-Beschäftigtenstichprobe 1975-1997 – Regionalfile
U. Blien, St. Bender, A. Haas, IAB-Institut für Arbeitsmarkt- und Berufsforschung der Bundesanstalt für Arbeit, Nürnberg;
J. Möller, J. Ludsteck, Universität Regensburg
3379 Erwerb und Verwertung beruflicher Qualifikationen 1998/99 (Qualifikation
und Berufsverlauf)
R. Jansen, Bundesinstitut für Berufsbildung Bonn (BIBB);
W. Dostal, Institut für Arbeitsmarkt- und Berufsforschung der Bundesanstalt
für Arbeit, Nürnberg
Konsumstruktur, Konsumverhalten
3653 Outfit 5 2001
SPIEGEL-Verlag, Hamburg;
SINUS Sociovision, Heidelberg
ZA-Information 56
155
Sparen, Geldanlagen, Vermögensbildung
3654 Alterssicherung in Deutschland 1986 (ASID ‘86)
3655 Alterssicherung in Deutschland 1992 (ASID ‘92)
3656 Alterssicherung in Deutschland 1995 (ASID ‘95)
3657 Alterssicherung in Deutschland 1999 (ASID ‘99)
Bundesministerium für Arbeit und Sozialordnung, Bonn;
Infratest Sozialforschung, München
3968 Bertelsmann Stiftung Vorsorgeerhebung 2002-2003
Bertelsmann Stiftung, Gütersloh;
K. Kortmann, Th. Heien, Infratest München
3652 Soll und Haben 5 2000
SPIEGEL-Verlag, Hamburg; Manager Magazin, Hamburg;
SINUS Sociovision, Heidelberg
Gesellschaft, Kultur
3523 Ausländer in Deutschland 1997
3524 Ausländer in Deutschland 1998
3366 Ausländer in Deutschland 1999 - 1. Welle
3367 Ausländer in Deutschland 1999 - 2. Welle
3649 Ausländer in Deutschland 2000 - 1. Welle
3650 Ausländer in Deutschland 2000 - 2. Welle
MARPLAN, Offenbach
3444 Erlebnisgesellschaft in Chemnitz 1996
D. Brock, G. Lechner, Technische Universität Chemnitz-Zwickau, Lehrstuhl
für Soziologie II
3350 Freiwilligensurvey 1999
Bundesministerium für Familie, Senioren, Frauen und Jugend, Berlin;
Infratest Burke Sozialforschung, München
156
ZA-Information 56
3522 International Social Justice Project 1991 und 1996 (ISJP 1991 und 1996)
B. Wegener, Universität Heidelberg und Humboldt Universität Berlin;
D. Mason, Butler University, Indianapolis;
International Social Justice Project (ISJP)
3974 Labour Migration, Market Competition and Ethnocentrism: Guest workers in
Israel and Germany 1996-1999
P. Schmidt, A. Heyder, Universität Gießen
Lebensverlaufsstudie
3925 Ostdeutsche Lebensverläufe im Transformationsprozeß - Lebensverlaufsstudie
LVOst Panel 1996-1997
3926 Ostdeutsche Lebensverläufe im Transformationsprozeß - Lebensverlaufsstudie
LVOst 71 1996-1997
K.U. Mayer, Max-Planck-Institut für Bildungsforschung, Berlin
3927 Ausbildungs- und Berufsverläufe der Geburtskohorten 1964 und 1971 in
Westdeutschland (LVWest 64/71) 1998-1999
K.U. Mayer, Max-Planck-Institut für Bildungsforschung, Berlin;
G. Kleinhenz, Institut für Arbeitsmarkt- und Berufsforschung, IAB, Nürnberg
3398 Wohlfahrtssurvey 1998
W. Zapf, R. Habich, Wissenschaftszentrum Berlin;
H.-H. Noll, ZUMA, Mannheim
Gemeinde
3391 Bürgerumfrage Halle 1993
3392 Bürgerumfrage Halle 1994
3393 Bürgerumfrage Halle und Saalkreis 1995
3394 Bürgerumfrage Halle 1997
3395 Bürgerumfrage Halle 1999
3512 Soziale Vernetzung städtischer und ländlicher Bevölkerungen am Beispiel
der Stadt Halle 2000
ZA-Information 56
157
3607 Bürgerumfrage Halle 2001
H. Sahner Institut für Soziologie der Martin-Luther-Universität, HalleWittenberg; Stadtverwaltung Halle/Saale
3462 Duisburger Bürgerumfrage (Frühjahr 1997)
3463 Duisburger Bürgerumfrage (Herbst 1997)
3464 Duisburger Bürgerumfrage (Frühjahr 1998)
3466 Duisburger Bürgerumfrage (Frühjahr 1999)
Stadt Duisburg, Amt für Statistik, Stadtforschung und Europaangelegenheiten
3637 Eheschließungen in Euskirchen 1949-2000
J. Friedrichs, R. Kecskes, Chr. Wolf, Forschungsinstitut für Soziologie der
Universität zu Köln
3378 Lebensstile, Wohnbedürfnisse und Mobilitätsbereitschaft 1996
F. Böltken, Bundesamt für Bauwesen und Raumordnung, Bonn; N. Schneider,
A. Spellerberg, Wissenschaftszentrum Berlin für Sozialforschung, Berlin
3636 Sozialer Wandel einer Mittelstadt (Euskirchen-Studie 2001)
J. Friedrichs, R. Kecskes, Chr. Wolf, Forschungsinstitut für Soziologie der
Universität zu Köln
Familie
3264 Alters-Survey 1996
F. Dittmann-Kohli, Forschungsgruppe Psychogerontologie, Universität
Nijmegen (Niederlande);
M. Kohli, Forschungsgruppe Altern und Lebenslauf (FALL), Freie Universität Berlin
3952 BdB-Jugendstudie 2003 (Erwachsene)
3951 BdB-Jugendstudie 2003: Wirtschaftsverständnis und Finanzkultur
4058 Deutschland vor der demographischen Herausforderung 2004
IPOS, Institut für praxisorientierte Sozialforschung, Mannheim; W. Bürklin,
Bundesverband deutscher Banken, Berlin
158
ZA-Information 56
3400 Deutscher Family and Fertility Survey 1992
Bundesinstitut für Bevölkerungsforschung, Wiesbaden
3371 DJI-Ausländersurvey - Jugendliche 1996-1997
3372 DJI-Ausländersurvey - Kinder 1996-1997
3298 DJI-Jugendsurvey 1997
3608 DJI-Jugendsurvey 1992 und 1997 (Kumulierter Datensatz)
3609 DJI-Jugendsurvey 2000
Deutsches Jugendinstitut (DJI), München
Familiensurvey
3211 Kinder in nichtehelichen Lebensgemeinschaften 1995
3212 Persönlichkeit und soziale Beziehungen 1995
3921 Stieffamilien in Deutschland - Übersicht, Lebenssituation, Perspektiven
(Familiensurvey) 2000
3920 Wandel und Entwicklung familialer Lebensformen - 3. Welle
(Familiensurvey) 2000
3210 Wandel und Entwicklung familialer Lebensformen (Kumulierter File 19881995)
3209 Wandel und Entwicklung familialer Lebensformen (Panel 1988-1994)
Deutsches Jugendinstitut (DJI), München
3473 Frauenleben (Berufe im weiblichen Lebenslauf und sozialer Wandel) 1997
H. Krüger, C. Born, C. Erzberger, K. Bird, Sonderforschungsbereich 186
der Universität Bremen
Freiburger Institut für angewandte Sozialwissenschaft
3446 Ältere Menschen in Offenburg 1997
R. Meßmer, N. Albert, Seniorenbüro Offenburg;
FIFAS - Freiburger Institut für angewandte Sozialwissenschaft
ZA-Information 56
159
3445 Pflege im sozialen Wandel 1996
Sozialministerium Baden-Württemberg; AOK Baden-Württemberg
FIFAS, Freiburger Institut für angewandte Sozialwissenschaft, Freiburg
3447 Pflegekulturelle Orientierungen 1999
Evangelische Fachhochschule Freiburg; Institut für Soziologie der Universität Freiburg; FIFAS - Freiburger Institut für angewandte Sozialwissenschaft
3694 Jugend 2002 (14. Shell-Jugendstudie)
K. Hurrelmann, Universität Bielefeld; Jugendwerk der Deutschen Shell,
Hamburg
3431 Kindheit, Jugend und Erwachsenwerden 1991-1997 - Jugendlängsschnitt
1991-1995/96
3432 Kindheit, Jugend und Erwachsenwerden 1991-1997 - Junge-ErwachseneLängsschnitt 1991-1995/96
3433 Kindheit, Jugend und Erwachsenwerden 1991-1997 - Kinderlängsschnitt
1993-1997
3434 Kindheit, Jugend und Erwachsenwerden 1991-1997 - Querschnitt 1996
R.K. Silbereisen, Friedrich-Schiller-Universität Jena, Institut für Psychologie,
Entwicklungspsychologie; L.A. Vaskovics, Otto-Friedrich-Universität Bamberg, Fakultät Sozial- und Wirtschaftswissenschaften, Soziologie;
J. Zinnecker, Universität-Gesamthochschule Siegen, Erziehungswissenschaft,
Sozialpädagogik
3188 Mannheimer Scheidungsstudie 1996
H. Esser, Lehrstuhl für Soziologie und Wissenschaftslehre, Universität
Mannheim;
Chr. Babka von Gostomski, J. Hartmann, Mannheimer Zentrum für europäische Sozialforschung (MZES), Mannheim
3266 Sexual- und Verhütungsverhalten 16- bis 24jähriger Jugendlicher und junger
Erwachsener 1996
Bundeszentrale für gesundheitliche Aufklärung, Köln
160
ZA-Information 56
Universität, Forschung, Wissenschaft
3214 Rangliste der deutschen Universitäten 1999
H.-D. Daniel, Universität Kassel; DER SPIEGEL, Hamburg
3263 Studentischer Drogenkonsum 1995-1997
T. Baumgärtner, Institut für Soziologie, Universität Leipzig; K.-H. Reuband,
V. Hüfken, Institut für Soziologie, Technische Universität Dresden; H. Renn,
B. Antholz, Institut für Soziologie, Universität Hamburg
3443 Studentische Erwerbstätigkeit und Teilzeitstudium 1999
W. Nienhüser, C. Becker, M. Jans Fachbereich 5, Wirtschaftswissenschaften,
Universität Gesamthochschule Essen
3511 Studiensituation und studentische Orientierungen 1997/98
T. Bargel, Arbeitsgruppe Hochschulforschung, Universität Konstanz
4154 Karrierewege von ProfessorInnen an Hochschulen in Deutschland 20022003
A. Zimmer, Universität Münster
Religion und Weltanschauung
3385 Kirchenmitgliedschafts-Studie der EKD 1992
Evangelische Kirche Deutschland; GFM-GETAS, Hamburg
Technik
3277 Umweltbewusstsein in Deutschland 1998
P. Preisendörfer, Institut für Soziologie, Universität Rostock; A Diekmann,
Institut für Soziologie, Universität Bern
3278 Umweltbewusstsein in Deutschland 2000
U. Kuckartz, Institut für Erziehungswissenschaft, Philipps-Universität Marburg
3902 Umweltbewusstsein in Deutschland 2002
H. Grunenberg und U. Kuckartz, Institut für Erziehungswissenschaft,
Philipps-Universität Marburg
ZA-Information 56
161
Medizin
3505 Aids im öffentlichen Bewusstsein der Bundesrepublik Deutschland 1999
3428 Aids im öffentlichen Bewusstsein der Bundesrepublik Deutschland 2000
3699 Aids im öffentlichen Bewusstsein der Bundesrepublik Deutschland 2001
G. Christiansen, J. Töppich, Bundeszentrale für gesundheitliche Aufklärung,
Köln
3201 Die Drogenaffinität Jugendlicher in der Bundesrepublik Deutschland 1993/1994
3510 Die Drogenaffinität Jugendlicher in der Bundesrepublik Deutschland 2001
Bundeszentrale für gesundheitliche Aufklärung, Köln;
Institut für Jugendforschung (IJF), München
3470 Gebrauch psychoaktiver Substanzen bei Erwachsenen in Deutschland 1997
(Konsum und Mißbrauch von illegalen Drogen, alkoholischen Getränken,
Medikamenten und Tabakwaren)
IFT, Institut für Therapieforschung, München
4055 Soziale Ungleichheit, Krankheit und Gesundheit (SUKUG) 1999-2000
C. Wolf, Institut für Angewandte Sozialforschung, Universität zu Köln
Freizeit
3442 Außenrepräsentanz von Museen 1999
G. Wersig, P. Schuck-Wersig, Institut für Publizistik- und Kommunikationswissenschaft Freie Universität Berlin
3349 Reiseanalyse 1998
Forschungsgemeinschaft Urlaub und Reisen, Hamburg
162
ZA-Information 56
Die Nutzung der ALLBUS-Daten in Publikationen der
Jahre 1980 - 2004
Die Allgemeine Bevölkerungsumfrage der Sozialwissenschaften
(ALLBUS) dient der Erhebung aktueller Daten über Einstellungen,
Verhaltensweisen und Sozialstruktur der Bevölkerung in der Bundesrepublik Deutschland. Seit 1980 wird alle zwei Jahre ein repräsentativer Querschnitt der Bevölkerung mit einem teils stetigen, teils variablen Fragenprogramm
befragt. Der ALLBUS ist ein Infrastrukturprojekt, insbesondere für die deutsche
Sozialwissenschaft. Deshalb ist es wichtig, Informationen über die Nutzung und den
Erfolg des ALLBUS-Programms der Profession bereitzustellen. Hierfür kann einerseits die Nachfrage bzw. die Weitergabe der Daten bzw. Studienmaterialien (siehe
Terwey 2003, KVI 2001: 187, Klein 2002: 119), andererseits aber auch die Nutzung
der ALLBUS-Daten in Publikationen (siehe auch Terwey 1998, Terwey 2003, Koch
und Wasmer 2004) analysiert werden. Im Folgenden soll letzteres näher betrachtet
werden. Aufschluss über die Nutzung in Publikationen bietet die ALLBUSBibliographie. Diese dokumentiert Arbeiten mit ALLBUS-Daten, die in Büchern
oder Fachzeitschriften veröffentlicht sind oder uns als „graue Literatur“ (in Form
von Arbeitsberichten, Diplom- oder Magisterarbeiten usw.) vorliegen.1
Als ein Indikator soll zunächst die Häufigkeit der Verwendung von ALLBUS-Daten
in Publikationen betrachtet werden. In der aktuellen Fassung der ALLBUSBibliographie (Stand: 31.12.2004) sind insgesamt 1266 wissenschaftliche Arbeiten
verzeichnet2 (vgl. Abbildung 1), wobei allerdings von einer nicht unbeträchtlichen
Dunkelziffer auszugehen ist, da bedauerlicherweise die AutorInnen ihre Veröffentlichungen unter Verwendung von ALLBUS-Daten nur in Ausnahmefällen unaufgefordert an das Zentralarchiv bzw. an ZUMA melden.3 Der Abbildung ist weiter zu
1 Die ALLBUS-Bibliographie kann in der jeweils aktuellen Fassung von unserer Homepage abge-
rufen werden (http://www.zuma-mannheim.de/data/allbus/biblio.htm). Darüber hinaus bieten wir
eine Online-Recherche in der aktuellen Version der Bibliographie (http://www.zuma-mannheim.
de/data/allbus/bibrech.htm) an.
2 An dieser Stelle wird eine geringere Fallzahl als in Terwey (2003) berichtet, da wir nur Einträge
auswerten, für die die in diesem Beitrag benötigten Informationen vorliegen.
3 Die überwiegende Mehrzahl der Einträge in der ALLBUS-Bibliographie wird vom Zentralarchiv
bzw. der ALLBUS-Abteilung bei ZUMA durch Recherchen in Datenbanken, Zeitschriften,
Sammelbänden, etc. ermittelt.
ZA-Information 56
163
entnehmen, dass die Zahl der Veröffentlichungen mit ALLBUS-Daten über die Zeit
stark zugenommen hat. Auch die Anzahl der Beiträge pro Jahr nimmt zu. Für die
Jahrgänge ab 2000 ist zwar bislang eine leicht abnehmende Tendenz zu verzeichnen,
diese ist aber dem Verzug bei der Recherche bzw. bei der Bereitstellung der Arbeiten geschuldet.4
Abbildung 1
Kumulierte Anzahl der in der ALLBUS-Bibliographie dokumentierten Veröffentlichungen mit ALLBUS-Daten, getrennt nach
Publikationsform und Erscheinungsjahr
1400
1200
1000
M onographie
Buchbeitrag
800
Fachzeitschrift
(Arbeits-)Bericht
600
Qualifikationsarbeit
Vortrag
400
200
04
20
20
02
00
20
98
19
96
19
94
19
92
19
90
19
88
19
19
86
84
19
82
19
19
80
0
Unterscheidet man die Einträge nach Publikationsform, so ist zu konstatieren, dass
die meisten Beiträge in Fachzeitschriften erschienen sind (415), am zweithäufigsten
handelt es sich bei den Einträgen um Beiträge in (Fach-)Büchern (403). Insgesamt
machen die Artikel in den Fachzeitschriften und die Buchbeiträge ca. 65% der Einträge aus. Weniger häufig wird der ALLBUS dagegen in Monographien und Arbeitsberichten verwendet. Wir gehen aber davon aus, dass gerade bei diesen Publikationsformen die Dunkelziffer besonders hoch ist. Der Abbildung ist auch die wichtige
Rolle des ALLBUS für Lehre und Studium zu entnehmen. Mehr als 102 Qualifika-
4 Ein Beispiel soll die Größenordnung dieser Verzögerung verdeutlichen: Während in der 16. Fas-
sung der ALLBUS-Bibliographie (Stand 1.6.2000) für den Zeitraum 1980 bis 1998 insgesamt
720 Publikationen vorlagen, sind dies für den gleichen Zeitraum in der 20. Fassung (Stand
31.12.2004) mit 799 deutlich mehr Einträge.
164
ZA-Information 56
tionsarbeiten sind in der aktuellen ALLBUS-Bibliographie (Stand 31.12. 2004)
dokumentiert.5
Betrachtet man die drei wichtigsten „reviewed journals“ der deutschen Soziologie
(vgl. Lüschen 1979, Pötschke und Simonson 2003: 78) – die Kölner Zeitschrift für
Soziologie und Sozialpsychologie, die Soziale Welt und die Zeitschrift für Soziologie – näher, so ergibt sich folgendes Bild (siehe Tabelle 1).
Tabelle 1
Anzahl der empirischen Beiträge und Anzahl der Beiträge mit ALLBUSDaten in der Kölner Zeitschrift für Soziologie und Sozialpsychologie,
der Sozialen Welt und der Zeitschrift für Soziologie der Jahre
2000-2004
2000
Anzahl Beiträge, in
denen Daten
verwendet wurden
40
Beiträge mit
ALLBUSDaten
6
2001
39
6
2002
35
4
2003
37
8
2004
44
4
Summe
195
28
Jahrgang
In den Jahrgängen 2000 bis 2004 sind in den drei Zeitschriften insgesamt 28 Beiträge
erschienen, die unter Verwendung von ALLBUS-Daten entstanden sind. Von uns
wurde dabei jeder Beitrag gezählt, aus dem ersichtlich ist, dass Daten des ALLBUS
ausgewertet wurden. Dabei variierte selbstverständlich die „Nutzungsintensität“ der
Daten. Auf der einen Seite gibt es Beiträge, in denen die Daten die zentrale Grundlage des Beitrags bilden bzw. in denen eine große Anzahl an Variablen untersucht
wird. Auf der anderen Seite werden in manchen Beiträgen die Daten lediglich für
eine Häufigkeitsauszählung verwendet.6 Nach unseren Auszählungen der drei
5 Auch in Methoden- und Statistiklehrbüchern (vgl. z.B. Kühnel und Krebs 2001; Wittenberg und
Cramer 2000; Gehring und Weins 2000) findet der ALLBUS Verwendung. Die Bedeutung für
die Lehre zeigte sich auch bei einer Internetrecherche im Jahr 2003. Es wurden für das Wintersemester 2002 und das Sommersemester 2003 insgesamt 71 Methoden- und Statistikveranstaltungen an Universitäten und Fachhochschulen im Internet recherchiert, in denen der ALLBUS
verwendet wurde.
6 An dieser Stelle sei angeführt, dass wir bei unserer Auszählung auf ein anderes Ergebnis kom-
men als Pötschke und Simonson (vgl. Pötschke und Simonson 2003: 88, Tabelle 7). Dort wurden für die Jahrgänge 2000 und 2001 insgesamt 4 Arbeiten mit ALLBUS-Daten ausgewiesen. In
unseren Auszählungen kommen wir auf insgesamt 12 Beiträge (siehe Tabelle 1). Vermutlich
ZA-Information 56
165
deutschsprachigen Fachzeitschriften sind die ALLBUS-Daten neben denen des
SOEP diejenigen, die mit Abstand am häufigsten in Beiträgen dieser Fachzeitschriften
genutzt werden.
Was die Inhalte angeht, spiegelt sich in den Veröffentlichungen die ganze Bandbreite des ALLBUS-Fragenprogramms wider. Ein Schwerpunkt ist bei Untersuchungen
zum Wandel von Einstellungen und Werten zu erkennen. Auch andere Variablen
des ALLBUS, wie Verhaltensindikatoren oder sozialstrukturelle Merkmale, finden
in den Veröffentlichungen Verwendung. In Querschnittsanalysen sind der ALLBUS
1991 (Sonderstudie zur deutschen Wiedervereinigung) und der ALLBUS 1996
(Thema: Einstellungen gegenüber ethnischen Gruppen in Deutschland) am häufigsten
verwendet worden. Der ALLBUS wird zudem nicht nur zur inhaltlichen Forschung
genutzt, sondern auch in der methodischen Forschung.
Ein Hauptzweck des ALLBUS ist die Nutzung für zeitvergleichende Analysen. Als
quantitativen Indikator für die Auswertung von ALLBUS-Zeitreihen ziehen wir die
Häufigkeit heran, mit der der kumulierte ALLBUS bzw. zwei oder mehr einzelne
ALLBUS-Erhebungen in den Publikationen der ALLBUS-Bibliographie verwendet
wurden.7
Abbildung 2 zeigt, dass in den Anfangsjahren des ALLBUS nur eine kleine Minderheit der Veröffentlichungen auf zwei oder mehr Einzeldatensätze zurückgreift
(der erste kumulierte Datensatz mit den Daten der Erhebungen 1980, 1982 und 1984
wurde vom Zentralarchiv 1985 erstellt). Seit den 90er Jahren nimmt die Anzahl der
Arbeiten, die mehr als einen Datensatz verwenden, und damit vermutlich auch der
Anteil der längsschnittlichen Auswertungen sehr stark zu.
spielen unterschiedliche Kriterien bei der Einschätzung der Verwendung von Daten eine Rolle
für diese Differenz.
7 Selbstverständlich kann auch der kumulierte ALLBUS im Querschnitt ausgewertet werden, in-
dem z.B. die gepoolten Daten zur Analyse kleiner Subgruppen verwendet werden. Ebenso ist es
möglich, dass zwei Einzeldatensätze genutzt werden, weil die interessierenden Fragen jeweils
nur in einem Datensatz enthalten sind. Der verwendete Indikator stellt damit eine obere Grenze
für die Nutzung ALLBUS-interner Zeitreihen dar. Die Durchsicht der 88 Artikel aus den Jahren
2000 bis 2002, in denen entweder der kumulierte ALLBUS oder zwei oder mehr Einzeldatensätze verwendet wurden, ergab, dass bei den so abgegrenzten Publikationen die zeitvergleichenden
Analysen tatsächlich weit überwiegen: 66 (75%) der 88 Publikationen haben mit den ALLBUSDaten längsschnittliche Fragestellungen bearbeitet. Andererseits wird der ALLBUS unter Umständen auch, wenn nur auf einen Datensatz zurückgegriffen wird, für zeitvergleichende Analysen verwendet, nämlich dann wenn der ALLBUS mit anderen Studien zusammen analysiert wird.
166
ZA-Information 56
Abbildung 2
Kumulierte Anzahl Beiträge in der ALLBUS-Bibliographie,
getrennt nach der Anzahl der verwendeten ALLBUSDatensätze und dem Erscheinungsjahr
700
600
500
400
1 Datensatz
2 od. mehr Datensätze
300
200
100
20
04
20
02
20
00
19
98
19
96
19
94
19
92
19
90
19
88
19
86
19
84
19
82
19
80
0
Fazit
Die ALLBUS-Daten finden breite Verwendung in Publikationen, und dies mit steigender Tendenz pro Jahr. Bezüglich der Anzahl der Publikationen in den hier zentral ausgezählten Fachzeitschriften können wir festhalten, dass der ALLBUS im Untersuchungszeitraum der am häufigsten genutzte Datensatz ist. In jedem ca. siebten
Beitrag, in dem Daten verwendet wurden, sind Daten des ALLBUS ausgewertet
worden. Im Hinblick auf das zentrale Anliegen des ALLBUS, sozialen Wandel zu
erfassen und zu erforschen, ist aus den Publikationen ersichtlich, dass der Anteil der
Arbeiten, die zumindest Daten aus zwei Erhebungsjahren verwenden, derzeit bei ca.
60% (Koch und Wasmer 2004: 23) liegt.
ZA-Information 56
167
Zuletzt noch eine Bitte:
Die ALLBUS-Bibliographie kann nur vollständig und aktuell bleiben, wenn alle
Datennutzer/innen uns Kopien ihrer Veröffentlichungen zusenden. Wir bitten daher
alle Nutzer, uns von jeder Forschungsarbeit, in der ALLBUS-Daten verwendet
wurden, ein Belegexemplar zu überlassen oder uns zumindest in Kenntnis zu setzen.
Durch die Aufnahme der Arbeit wird dazu beigetragen, dass die ALLBUSBibliographie eine interessante und vielfältige Recherchequelle bleibt, zum anderen
stellt eine umfassende Dokumentation der Nutzung des ALLBUS auch eine wichtige
Legitimationsbasis für die längerfristige Fortführung des Programms dar.
Michael Blohm
Zentrum für Umfragen, Methoden und Analysen, ZUMA
Postfach 12 21 55
D-68072 Mannheim
E-mail: [email protected]
Literatur
Gehring, Uwe W. und Cornelia Weins 2000: Grundkurs Statistik für Politologen. 2.
Klein, Markus 2002: Das Zentralarchiv für Empirische Sozialforschung im Urteil von Soziologieprofessorinnen und –professoren aus Deutschland, Österreich und der Schweiz, in: ZA-Information 50: 103-129.
KVI (Hg.; Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und
Statistik) 2001: Wege zu einer besseren informationellen Infrastruktur, Baden-Baden: Nomos.
Koch, Achim und Martina Wasmer 2004: Der ALLBUS als Instrument zur Untersuchung sozialen Wandels:
Eine Zwischenbilanz nach 20 Jahren. In: Schmitt-Beck, Rüdiger, Wasmer, Martina und Koch Achim
(Hrsg.:) Sozialer und politischer Wandel in Deutschland. Analysen mit ALLBUS-Daten aus zwei Jahrzehnten
Kühnel, Steffen-M. und Dagmar Krebs 2001: Statistik für die Sozialwissenschaften. Grundlagen, Methoden,
Anwendungen, Reinbeck bei Hamburg: Rowohlt.
Lüschen, Günther 1979: Die Entwicklung der deutschen Soziologie in ihrem Fachschrifttum, in: Lüschen,
Günther (Hg.): Deutsche Soziologie seit 1945. Entwicklungsrichtungen und Praxisbezug. (Sonderheft 21 der
Kölner Zeitschrift für Soziologie und Sozialpsychologie) Opladen: Westdeutscher Verlag: 169-192.
Pötschke, Manuela und Julia Simonson 2003: Konträr und ungenügend? Ansprüche an Inhalt und Qualität
einer sozialwissenschaftlichen Methodenausbildung, ZA-Information 52: 72-92.
Terwey, Michael 2003: Zum aktuellen Wandel im Zugriff auf ALLBUS-Materialien und zur ALLBUSNutzung in Publikationen, in: ZA-Information 53: 195-202.
Terwey, Michael 1998: Analysen zur Verbreitung von ALLBUS, in: ZA-Information 42: 44-52.
Wittenberg, Reinhard und Hans Cramer 2000: Datenanalyse mit SPSS für Windows. Handbuch für computerunterstützte Datenanalyse Band 9, Stuttgart: Lucius und Lucius.
168
ZA-Information 56
Die Forschungsdatenzentren der Statistischen Ämter des
Bundes und der Länder
von Sylvia Zühlke, Markus Zwick, Sebastian Scharnhorst und
Thomas Wende 1
Zusammenfassung
In den letzten Jahren wurde in Deutschland intensiv über den Zugang der Wissenschaft zu den Mikrodaten der amtlichen Statistik diskutiert. Durch die „Kommission
zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und
Statistik“ (KVI) wurden dafür im Auftrag des Bundesministeriums für Bildung und
Forschung verschiedene Vorschläge zur Verbesserung der Wechselwirkungen zwischen Wissenschaft und Statistik erarbeitet. Eine der zentralen institutionellen
Empfehlungen dieser Kommission bestand in der möglichst raschen Einrichtung
von Forschungsdatenzentren bei den öffentlichen Datenproduzenten. Diese Empfehlung wurde von der amtlichen Statistik aufgegriffen. Im Jahr 2001 hat das Statistische Bundesamt ein solches Forschungsdatenzentrum etabliert. Ein weiteres Forschungsdatenzentrum der Statistischen Landesämter wurde im März 2002 als
gemeinsame Einrichtung aller Statistischen Landesämter mit 16 regionalen Standorten eingerichtet. Mit diesen Forschungsdatenzentren intensiviert die deutsche
amtliche Statistik ihre bisherigen Bemühungen, Mikrodaten der amtlichen Statistik
für wissenschaftliche Analysen zugänglich zu machen. Wesentliche Aufgabe der
Forschungsdatenzentren ist es, die Dateninfrastruktur zu verbessern sowie den
Zugang der Wissenschaft zu den Mikrodaten der amtlichen Statistik durch die Einrichtung mehrerer Zugangswege zu erleichtern.
1 Dr. Sylvia Zühlke und Sebastian Scharnhorst, Dipl.-Sozialwirt, sind in der Geschäftsstelle des
Forschungsdatenzentrums der Statistischen Landesämter tätig, die im Landesamt für Datenverarbeitung und Statistik Nordrhein-Westfalen angesiedelt ist. Markus Zwick, Dipl.-Volkswirt
und Thomas Wende, Dipl.-Soziologe, sind Mitarbeiter im Forschungsdatenzentrum des Statistischen Bundesamtes, www.forschungsdatenzentrum.de.
Dieser Beitrag ist eine aktualisierte Fassung des erstmals in: Wirtschaft und Statistik 10/2003, S.
906 - 911, Statistisches Bundesamt, Wiesbaden veröffentlichten Artikels.
ZA-Information 56
169
Abstract
In Germany, an intensive discussion has been going on over the last few years on
granting the scientific community access to microdata of official statistics. Commissioned by the Federal Ministry of Education and Science, the Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik
(KVI - Commission to improve the informational infrastructure by co-operation of
the scientific community and official statistics) developed several proposals on how
to improve the interaction between the scientific community and official statistics
(cf. Kommission zur Verbesserung der informationellen Infrastruktur 2000). One of
the central institutional recommendations of that Commission was that research
data centres be set up as soon as possible at the location of data producers. That
recommendation has been taken up by official statistics. In 2001, the Federal Statistical Office established such a research data centre. Another research data centre
of the statistical offices of the Länder was set up in March 2002 as a joint facility of
all statistical offices of the Länder with 16 regional locations. By establishing the
research data centres, German official statistics has been intensifying its efforts to
make official statistical micro-data accessible for scientific analyses. The major
goal of the research data centres of the Federal Statistical Office and the statistical
offices of the Länder is to facilitate access to microdata of official statistics for the
scientific community by establishing various ways of data use. A major prerequisite
for achieving that goal is a fundamental improvement of the data infra-structure by
setting up a system (centralised in terms of subject-matter) of data maintenance for
selected statistics and by establishing a metadata information system.
1
Einleitung
Die Komplexität des wirtschaftlichen und sozialen Wandels sowie die Fortschritte
in Wissenschaft und Informationstechnik haben den Datenbedarf moderner Gesellschaften grundlegend verändert. Die zur Analyse und Gestaltung moderner Gesellschaften erforderlichen Daten müssen insbesondere Informationen über Teilgruppen
der Gesellschaft liefern sowie Analysen des wirtschaftlichen und sozialen Wandels
auf der Basis von Längsschnittdaten erlauben. Aufgrund des geänderten Informationsbedarfs ist die Veröffentlichung von Ergebnissen in Form von Tabellen heute
nicht mehr ausreichend. Vielmehr entspricht es den methodischen und inhaltlichen
Erfordernissen, statistische Daten entsprechend dem wissenschaftlichen Datenbedarf bereitzustellen. Dazu gehört auch, Zugangsmöglichkeiten zu anonymisierten
und nicht anonymisierten Mikrodaten zu schaffen, mit denen differenziertere Analysen durchgeführt werden können.
170
ZA-Information 56
Vor diesem Hintergrund wurde in den letzten Jahren in Deutschland intensiv über
den Zugang der Wissenschaft zu den Mikrodaten der amtlichen Statistik diskutiert.
Durch die „Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik“ (KVI) wurden dafür im Auftrag des Bundesministeriums für Bildung und Forschung verschiedene Vorschläge zur Verbesserung
der Wechselwirkungen zwischen Wissenschaft und Statistik erarbeitet.2 Eine der
zentralen institutionellen Empfehlungen dieser Kommission bestand in der möglichst raschen Einrichtung von Forschungsdatenzentren bei den öffentlichen Datenproduzenten.
Diese Empfehlung wurde von der amtlichen Statistik aufgegriffen. Im Jahr 2001 hat
das Statistische Bundesamt ein solches Forschungsdatenzentrum etabliert. Ein weiteres Forschungsdatenzentrum der Statistischen Landesämter wurde im März 2002
als gemeinsame Einrichtung aller Statistischen Landesämter mit 16 regionalen
Standorten eingerichtet. Mit diesen Forschungsdatenzentren intensiviert die deutsche amtliche Statistik ihre bisherigen Bemühungen, Mikrodaten der amtlichen
Statistik für wissenschaftliche Analysen zugänglich zu machen.
Ziel dieses Aufsatzes ist es, die neuen Formen und Wege der Nutzung amtlicher
Mikrodaten, die sich aus der Einrichtung der Forschungsdatenzentren ergeben
haben, vorzustellen. Hierfür folgt zunächst ein Überblick über die Entwicklung der
Rahmenbedingungen für die Nutzung von Mikrodaten der amtlichen Statistik in
Deutschland. Anschließend werden die Ziele und Aufgaben der Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder beschrieben sowie die
unterschiedlichen Möglichkeiten der Datennutzung präsentiert, die mit den Forschungsdatenzentren angeboten werden.
2
Die Nutzung von Mikrodaten der amtlichen Statistik in Deutschland
Die Nutzung von Mikrodaten der amtlichen Statistik durch die Wissenschaft wurde
in Deutschland sehr stark von der Entwicklung des Gesetzes über die Statistik für
Bundeszwecke (Bundesstatistikgesetz – BStatG) beeinflusst, das 1953 verabschiedet
und in den Jahren 1980 und 1987 novelliert wurde.
Bei der Entstehung des Bundesstatistikgesetzes wurde die Übermittlung von Mikrodaten an die Wissenschaft kaum diskutiert, so dass in der Gesetzesfassung von 1953
2 Siehe Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft
und Statistik (Hrsg.): Wege zu einer besseren informationellen Infrastruktur, Baden-Baden
2001.
ZA-Information 56
171
hierzu noch keine explizite Regelung enthalten war. Aufgrund der fehlenden Möglichkeiten, umfangreiche Mikrodaten zu verarbeiten, war die Nachfrage nach Mikrodaten
in den fünfziger, sechziger und frühen siebziger Jahren des letzten Jahrhunderts
relativ gering. Sofern die Übermittlung von Einzelangaben nicht explizit in anderen
Gesetzen geregelt war, wurden nur für wenige Projekte formal anonymisierte Mikrodaten3 zur Verfügung gestellt. So wurden amtliche Mikrodaten seitens der Wissenschaft erstmals in dem Projekt „Sozialpolitisches Entscheidungs- und Indikatorensystem für die Bundesrepublik Deutschland (SPES)“ analysiert, das 1972 bis
1978 durchgeführt wurde.4 Für dieses Projekt stellte die amtliche Statistik formal
anonymisierte Mikrodaten des Mikrozensus und der Einkommens- und Verbrauchsstichprobe zur Verfügung. Für das gleiche Projekt wurde auch eine Stichprobe der
Volkszählung 1970 (VZ70) auf der Grundlage des Volkszählungsgesetzes bereitgestellt.
Als die Nachfrage nach Mikrodaten mit der Fortentwicklung der Informationstechnik
schnell anstieg, wurden die allgemeinen Regelungen des im Jahr 1977 verabschiedeten Bundesdatenschutzgesetzes über die Datenübermittlung mit der Novellierung
des BStatG im Jahr 1980 für den speziellen Bereich der Statistik konkretisiert und
präzisiert. Der Kreis möglicher Empfänger von Einzelangaben wurde dabei an die
Bestimmungen des Strafgesetzbuches über die Strafbarkeit bei Verletzung von
Privatgeheimnissen angepasst. Mit der Einführung der so genannten Weiterleitungsvorschrift des § 11 Abs. 5 BStatG 1980 wurde die Absicht verfolgt, den Zugang zu den amtlichen Mikrodaten allgemein zu regeln. Diese Vorschrift sah die
Weitergabe von Mikrodaten in absolut anonymisierter Form an die Nutzer vor. Bei
Anwendung dieser Möglichkeit innerhalb konkreter Projekte zeigte sich allerdings,
dass die Anforderungen an ein solchermaßen absolut anonymisiertes Datenmaterial
so restriktiv waren, dass es in der Folgezeit nur noch zu wenigen Datennutzungen
kam. Aufgrund der gesetzlichen Vorgaben des BStatG konnten für nachfolgende
Projekte wie „Vergleichende Analysen der Sozialstruktur mit Massendaten“
(VASMA) oder für den Sonderforschungsbereich 3 „Mikroanalytische Grundlagen der Gesellschaftspolitik“ der Deutschen Forschungsgemeinschaft nur noch
3 Formal anonymisiert bedeutet, dass aus dem Originaldatenmaterial direkte Identifikatoren wie
etwa Name, Anschrift oder Sozialversicherungsnummer gelöscht wurden, es aber darüber hinaus unverändert ist.
4 Siehe: Krupp, H.-J.: Sozialpolitisches Entscheidungs- und Indikatorensystem für die Bundesrepublik Deutschland, Allgemeines Statistisches Archiv, Band 57, 1973, S. 380 ff.
172
ZA-Information 56
absolut anonymisierte Mikrodaten zu relativ hohen Kosten zur Verfügung gestellt
werden.5
Sowohl die informationelle Selbstbestimmung als auch die Wissenschaftsfreiheit
sind als Grundrechte im Grundgesetz verankert. Damit ist der Gesetzgeber aufgerufen, für einen angemessenen Ausgleich dieser Grundrechte Sorge zu tragen. Bei der
Novellierung des Bundesstatistikgesetzes im Jahr 1987, mit der das Recht der amtlichen Statistik an die Anforderungen des Volkszählungsurteils von 19836 angepasst
werden sollte, wurde dem Rechnung getragen, als nunmehr der Wissenschaft auch
Daten übermittelt werden konnten, die eine Deanonymisierung zwar nicht mit
Sicherheit ausschließen, aber Betroffenen nur zugeordnet werden können, wenn der
Datenempfänger einen unverhältnismäßig großen Aufwand an Zeit, Kosten und
Arbeitskraft erbringen musste. Die Einführung des Begriffs der faktischen Anonymität
für die Weitergabe von Mikrodaten an die Wissenschaft erlaubte es nun, im Rahmen des so genannten Wissenschaftsprivilegs unter bestimmten Voraussetzungen
Mikrodaten an die Wissenschaft zu liefern, die ein Restrisiko der Deanonymisierung aufwiesen. In der Folgezeit konkretisierten verschiedene Projekte die Ausgestaltung faktisch anonymisierter Mikrodatensätze. Insbesondere die Ergebnisse des
Projektes „Die faktische Anonymisierung von Mikrodaten“ erlaubten es, ab Mitte
der neunziger Jahre des letzten Jahrhunderts erste standardisierte faktisch anonymisierte Mikrodatensätze für den Bereich der Haushalts- und Personenerhebungen
zur Verfügung zu stellen.7
Während hierdurch und durch weitere Aktivitäten außerhalb der amtlichen Statistik8
insbesondere für sozialwissenschaftliche Fragestellungen eine neue Datenbasis geschaffen wurde, konnten im Bereich der Wirtschaftswissenschaften aufgrund der
größeren Schwierigkeiten bei der Anonymisierung von Betriebs- und Unternehmensdaten zunächst keine vergleichbaren Fortschritte erzielt werden. Der fehlende
Datenzugang, insbesondere zu den Unternehmens- und Betriebsdaten, wurde seitens
5 Zu den Projekten siehe Hauser, R. (Hrsg.): „Mikroanalytische Grundlagen der
Gesellschaftspolitik: Ergebnisse aus dem gleichnamigen Sonderforschungsbereich“, Band 1
und 2, Berlin 1994. Die Ergebnisse des Projektes VASMA sind unter
http://www.gesis.org/Dauerbeobachtung/Mikrodaten/Daten/brd/literatur.pdf dokumentiert.
6 BVerfGE 65, 1.
7 Siehe hierzu insbesondere Müller, W.; Blien, U.; Knoche, P.; Wirth, H. u. a.: Die faktische
Anonymität von Mikrodaten, Band 19 der Schriftenreihe „Forum der Bundesstatistik“, Statistisches Bundesamt (Hrsg.), Wiesbaden 1991.
8 Außerhalb der amtlichen Statistik haben sich insbesondere mit dem Sozio-oekonomischen Panel
(SOEP) und der „Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS)“
Erhebungen etabliert, die regelmäßig durchgeführt werden und für wissenschaftliche Analysezwecke zur Verfügung stehen.
ZA-Information 56
173
der Wissenschaft in dem Memorandum „Erfolgsbedingungen empirischer Wirtschaftsforschung und empirisch gestützter wirtschafts- und sozialpolitischer Beratung“9
aufgegriffen. Hierin wurde gefordert, den Zugang zu schwer anonymisierbaren
Mikrodaten innerhalb der Räumlichkeiten der Datenproduzenten zu ermöglichen.
Die Diskussion über den Mikrodatenzugang der Wissenschaft gewann mit dem
Memorandum sowie dem Symposium „Kooperation zwischen Wissenschaft und
amtlicher Statistik – Praxis und Perspektiven“10 im Jahr 1999 eine neue Dynamik,
die auch von der Politik aufgegriffen wurde.
In der Folge erarbeitete die „Kommission zur Verbesserung der informationellen
Infrastruktur zwischen Wissenschaft und Statistik“ (KVI) eine Reihe von Empfehlungen zur Verbesserung der Kooperation von Wissenschaft und Statistik. Diese
reichen von der Mitwirkung der Datennutzer bei der Aufstellung der Erhebungsund Aufbereitungsprogramme über die Perspektiven einer modernen Aus- und Weiterbildung in der Statistik bis zu den verschiedenen Möglichkeiten für den Zugang
der Wissenschaft zu den Mikrodaten der öffentlichen Datenproduzenten. Eine
wesentliche institutionelle Forderung bezieht sich auf die Einrichtung von Forschungsdatenzentren bei den Datenproduzenten und auf die Einrichtung von
Servicezentren. Derzeit werden die Empfehlungen der Kommission zur Verbesserung der informationellen Infrastruktur vom Rat für Sozial- und Wirtschaftsdaten
umgesetzt. Eine Reihe von Forschungsdatenzentren und Servicezentren konnten
ihre Arbeit bereits aufnehmen.11
Hierzu zählen auch die beiden Forschungsdatenzentren der amtlichen Statistik.
Zwar sind diese zwei voneinander unabhängige Einrichtungen, gleichwohl stimmen
sie ihre Arbeit eng untereinander ab, um der Wissenschaft ein nutzungsgerechtes
Angebot für einen verbesserten Datenzugang zu unterbreiten. Den Empfehlungen
der KVI folgend, nach denen die Einrichtung einer leistungsfähigen Dateninfrastruktur eine Aufgabe der Forschungsförderung ist, haben sowohl das Statistische
Bundesamt als auch die Statistischen Landesämter für ihr Projekt einen Förderantrag
9 Siehe Hauser, R.; Wagner, G.; Zimmermann, K.-F.: Erfolgsbedingungen empirischer Wirtschaftsforschung und empirisch gestützter wirtschafts- und sozialpolitischer Beratung: Ein Memorandum, Allgemeines Statistisches Archiv, Band 82, 1998, S. 369 ff.
10 Die Ergebnisse des Symposiums sind dokumentiert in Müller, W.; Schimpl-Neimanns, B.;
Krupp, H.-J.; Wiegert, R. u. a.: Kooperation zwischen Wissenschaft und amtlicher Statistik –
Praxis und Perspektiven, Band 34 der Schriftenreihe „Forum der Bundesstatistik“, Statistisches
Bundesamt (Hrsg.), Wiesbaden 1999.
11 Für einen Überblick siehe Lüttinger, P.; Schimpl-Neimanns, B.; Wirth, H. und Papastefanou, G.:
Mikrodaten (German Microdata Lab): Das Servicezentrum für amtliche Mikrodaten bei ZUMA,
ZUMA Nachrichten Nr. 52, 2003, S. 153 ff.
174
ZA-Information 56
beim Bundesministerium für Bildung und Forschung gestellt. Mit Hilfe dieser Mittel
soll die Infrastruktur für ein umfangreiches Dienstleistungs- und Datenangebot
geschaffen werden.
3
Ziele und Aufgaben der Forschungsdatenzentren
Das wesentliche Ziel der Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder besteht darin, den Zugang der Wissenschaft zu den Mikrodaten
der amtlichen Statistik durch die Einrichtung unterschiedlicher Datennutzungswege
zu erleichtern. Eine wesentliche Voraussetzung für die Erreichung dieses Ziels besteht in der grundsätzlichen Verbesserung der Dateninfrastruktur durch den Aufbau
einer fachlich zentralisierten Datenhaltung für ausgewählte Statistiken und durch
die Einrichtung eines Metadateninformationssystems.
In Deutschland wird der überwiegende Teil der Statistiken dezentral in den Statistischen Landesämtern durchgeführt, so dass dort über 90 % aller Mikrodaten der
amtlichen Statistik erhoben, aufbereitet und gespeichert werden. Da sich wissenschaftliche Analysen in der Regel jedoch auf mehrere Bundesländer oder das
gesamte Bundesgebiet beziehen, bauen die Statistischen Landesämter eine fachlich
zentralisierte Datenhaltung auf. Hierdurch wird es möglich, die Mikrodaten der
amtlichen Statistik länderübergreifend an allen regionalen Standorten der Forschungsdatenzentren zu nutzen.
Damit wissenschaftliche Nutzer die Mikrodaten der amtlichen Statistik analysieren
und interpretieren können, benötigen sie zudem umfassende Informationen über die
Datensätze sowie über die Erhebung, die Aufbereitung und die Qualität der Daten.
Hierfür werden die Forschungsdatenzentren der Statistischen Ämter des Bundes
und der Länder ein internetbasiertes Metadateninformationssystem entwickeln, in
dem sich die Nutzer über die Erhebungen der amtlichen Statistik informieren können.
4
Datennutzungswege
Um der Wissenschaft den Zugang zum gesamten Informationspotenzial der amtlichen Statistik zu öffnen, haben die Forschungsdatenzentren der Statistischen Ämter
des Bundes und der Länder unterschiedliche Zugangswege zur Nutzung ihrer Mikrodaten eingerichtet. Damit werden den Nutzern zusätzliche und weitergehende Möglichkeiten zur Analyse von Mikrodaten der amtlichen Statistik eröffnet, als dies bislang möglich war.
ZA-Information 56
175
Ansatzpunkt dieser zusätzlichen Nutzungswege ist es, die Vermeidung einer Reidentifikation der Auskunftgebenden nicht mehr allein durch Veränderungen im
Datenmaterial sicherzustellen, sondern auch durch die Regulierung des Datenzugriffs. Die einzelnen Nutzungswege resultieren daher aus verschiedenen Kombinationen von Datenanonymisierung und Zugriffsregulierung.
4.1 Absolut anonymisierte Mikrodatensätze
Absolut anonymisierte Daten werden durch Aggregation oder durch die Entfernung
einzelner Merkmale so weit verändert, dass eine Identifizierung der Auskunftgebenden nach menschlichem Ermessen unmöglich gemacht wird. Die amtliche Statistik
bietet absolut anonymisierte Mikrodaten in Form so genannter Public Use Files (PUF)
an. Diese können allen interessierten Personen zur Verfügung gestellt werden.
Bislang wurden solche Datensätze für die Sozialhilfestatistik sowie für die Zeitbudgeterhebung erstellt. Die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder arbeiten verstärkt an einer Ausweitung dieses Angebotes. Eine
weitere Hauptzielrichtung der Public Use Files liegt im Bereich der Hochschullehre.
Die Forschungsdatenzentren entwickeln derzeit so genannte Campus-Files, die an
Hochschulen zu Lehrzwecken eingesetzt werden können. Diese Datensätze sollen
Studentinnen und Studenten schon frühzeitig die Möglichkeit bieten, die Besonderheiten der Analyse von amtlichen Mikrodaten kennen zu lernen. Erste Campusfiles
liegen für den Mikrozensus, die Sozialhilfestatistik und die Kostenstrukturerhebung
vor.
4.2 Faktisch anonymisierte Mikrodatensätze
Eine absolute Datenanonymisierung birgt den Nachteil, dass damit auch ein erheblicher Teil der statistischen Information verloren geht. Dagegen werden Mikrodaten
als faktisch anonym bezeichnet, wenn die Deanonymisierung zwar nicht gänzlich
ausgeschlossen werden kann, die Angaben jedoch nur mit einem unverhältnismäßig
hohen Aufwand an Zeit, Kosten und Arbeitskraft dem jeweiligen Merkmalsträger
zugeordnet werden können.12 Nach Maßgabe des Bundesstatistikgesetzes können
faktisch anonymisierte Daten allerdings nur wissenschaftlichen Einrichtungen und
nur zur Durchführung wissenschaftlicher Vorhaben zugänglich gemacht werden.
12 Diese Regelung geht zurück auf den § 16 Abs. 6 BStatG.
176
ZA-Information 56
Die Hauptzielrichtung der faktischen Anonymisierung besteht darin, durch behutsame Informationsreduktion und Informationsveränderungen die Zuordnungsmöglichkeiten von Merkmalsausprägungen zu den entsprechenden Merkmalsträgern zu
verringern, dabei jedoch den statistischen Informationsgehalt zu schonen. Hierfür
müssen für jede einzelne Erhebung der Aufwand und der Nutzen einer Deanonymisierung analysiert werden. Dabei können unterschiedliche Anonymisierungsverfahren zur Anwendung kommen.13
Faktische Anonymität resultiert allerdings nicht allein aus dem realen Informationsgehalt der Daten, sondern auch aus den bestehenden Möglichkeiten zur Deanonymisierung. Wann ein Mikrodatensatz als faktisch anonym bezeichnet werden kann,
hängt daher insbesondere davon ab, unter welchen Rahmenbedingungen die Daten
verarbeitet werden. So ist von entscheidender Bedeutung, welches Zusatzwissen
vorliegt und wo die Datennutzung stattfindet. Abhängig davon, ob die Mikrodaten
extern oder in den statistischen Ämtern genutzt werden, kann die faktische Anonymität mit mehr oder minder starken Informationseinbußen erreicht werden.
Ein immer wieder deutlich vorgetragener Wunsch der Wissenschaft ist es, Mikrodaten in anonymisierter Form am eigenen Arbeitsplatz zu nutzen. Die faktische
Anonymisierung der Mikrodaten ermöglicht diese Übermittlung nicht vollständig
anonymisierter Mikrodaten zur externen (Off-Site-)Nutzung in wissenschaftlichen
Einrichtungen. Da jedoch allein durch die Herausgabe dieser Daten ein höheres
Deanonymisierungsrisiko besteht als bei der Nutzung in einem statistischen Amt,
ist die Datenanonymisierung relativ stark ausgeprägt. Die für diese Nutzungsform
erzeugten Datensätze werden als Scientific Use Files (SUF) bezeichnet.
Die amtliche Statistik bietet im Bereich der personenbezogenen Daten mit dem
Mikrozensus, der Einkommens- und Verbrauchsstichprobe, der Zeitbudgeterhebung
sowie der Lohn- und Einkommensteuerstatistik bereits ein breites Datenspektrum
als Scientific Use Files an. Im Rahmen des Projektes „Faktische Anonymisierung
wirtschaftsstatistischer Einzeldaten“ sind darüber hinaus erste Scientific Use Files
für wirtschaftsstatistische Einzeldaten entwickelt worden, und zwar für die Einzelhandelsstatistik, die Umsatzsteuerstatistik sowie die Kostenstrukturerhebung.14
13 Ein Überblick über Anonymisierungsmethoden ist zu finden in: Köhler, S.: Anonymisierung
von Mikrodaten in der Bundesrepublik und ihre Nutzung – Ein Überblick in Band 31 der Schriftenreihe Forum der Bundesstatistik, Statistisches Bundesamt (Hrsg.), 1999, S. 133 ff.
14 Siehe hierzu Sturm, R.: Wirtschaftsstatistische Einzeldaten für die Wissenschaft. In: WiSta 2/
2002, S. 101 ff, Lenz, R.; Vorgrimler, Dr. und Rosemann, M.: Ein Scientific-Use-File der Kostenstrukturerhebung im Verarbeitenden Gewerbe in WiSta 2/2005, S. 91ff., Scheffler, M.: Ein
Scientific-Use-File der Einzelhandelsstatistik 1999 in WiSta 3/2005, S.197ff., Vorgrimler, Dr.;
ZA-Information 56
177
Die Forschungsdatenzentren des Bundes und der Länder sind bestrebt, das Angebot
an Scientific Use Files sukzessive zu erweitern. So laufen zurzeit Projekte zur Anonymisierung der Gehalts- und Lohnstrukturerhebung sowie der Diagnosestatistik.
4.3 Projektbezogene faktische Anonymisierung zur On-Site-Nutzung
Bei geringer Nachfrage nach einzelnen Statistiken und bei schwer zu anonymisierenden Mikrodaten wird es in vielen Fällen nicht sinnvoll sein, in einem aufwändigen
Verfahren standardisierte Scientific Use Files zu erstellen. Hier ist eine projektbezogene Anonymisierung der Daten sinnvoller. Dies hat den praktischen Vorteil,
dass dabei nicht die gesamten Ergebnisse einer Statistik anonymisiert werden, sondern lediglich die daraus benötigten Merkmale.
Die projektbezogene Anonymisierung erzeugt ebenfalls eine faktische Datenanonymität. Diese Daten können jedoch nur in den Räumlichkeiten der Forschungsdatenzentren
des Bundes und der Länder an so genannten Gastwissenschaftlerarbeitsplätzen ausgewertet werden. Da die Mikrodaten dabei in den Räumlichkeiten der amtlichen Statistik
verbleiben und kaum mit Zusatzinformationen kombiniert werden können, hat diese
Nutzungsform einen weiteren wesentlichen Vorteil: Faktische Anonymität wird hier
bereits bei wesentlich geringeren Veränderungen im Datenmaterial erreicht als bei der
Erstellung von Scientific Use Files für die Off-Site-Nutzung und folglich verbleiben
mehr Informationen im Datenmaterial.
Um die Attraktivität dieser so genannten On-Site-Nutzung von Mikrodaten zusätzlich zu erhöhen und die regionale Erreichbarkeit dieser Nutzungsform zu gewährleisten, haben die Forschungsdatenzentren Gastwissenschaftlerarbeitsplätze in allen
19 regionalen Standorten eingerichtet. An diesen Arbeitsplätzen können die Daten
mit gängigen statistischen Analyseprogrammen (SAS, SPSS, teilweise STATA)
ausgewertet werden.
Dittrich, S.; Lenz, R. und Rosemann M.: Ein Scientific-Use-File der Umsatzsteuerstatistik 2000
in WiSta 3/2005, S. 201ff.
178
ZA-Information 56
4.4 Nutzung amtlicher Mikrodaten durch kontrollierte Datenfernverarbeitung
Die Datennutzung via Datenfernverarbeitung ist eine relativ neue Entwicklung,
deren Bedeutung in der Zukunft zunehmen wird.15 Mit diesem Verfahren ist es der
Wissenschaft möglich, das Informationspotenzial von nur formal anonymisiertem
Mikrodatenmaterial zu nutzen, ohne jedoch selbst direkten Zugriff auf diese Daten
zu haben. Die Wissenschaftler entwickeln dabei Auswertungsprogramme (SyntaxSkripte), die dann von den Mitarbeitern der Forschungsdatenzentren an den Originaldaten angewendet werden. Diese Datendienstleistung wird zurzeit in den Programmen SPSS, SAS und STATA angeboten. Die Datenfernverarbeitung ist im Gegensatz zu den Scientific Use Files nicht auf einen bestimmten Personenkreis beschränkt und bietet daher auch für ausländische Wissenschaftler und für den nichtwissenschaftlichen Interessentenkreis eine Möglichkeit, Mikrodaten der amtlichen
Statistik zu nutzen.
Zur praktikablen Anwendung der Datenfernverarbeitung stellen die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder Datenstrukturfiles
zur Verfügung, die es den Nutzern ermöglichen, ihre Auswertungsprogramme auf
die Struktur der Originaldaten abzustimmen. Diese Datenstrukturfiles geben die
Datenstruktur des originären Datensatzes wieder, ohne inhaltliche Informationen zu
transportieren. Das Material ist also in der Merkmalsstruktur, Anzahl der Satzstellen
und Datensatzlänge identisch mit dem Originalmaterial. Durch ein technisches
Verfahren sind die Daten aber so verfälscht, dass nur noch synthetische inhaltsleere
Datensätze zur Verfügung stehen. Zurzeit stehen solche Datenstrukturfiles für die
Mikrodaten des Mikrozensus, der Gehalts- und Lohnstrukturerhebung und der Lohnund Einkommensteuerstatistik zur Verfügung.
Derzeit ist die Datenfernverarbeitung ein relativ arbeitsaufwändiges Verfahren, da
die Programmsyntax vorab auf Deanonymisierungsstrategien und der Datenoutput
anschließend auf Geheimhaltungsfälle überprüft werden müssen. Bislang werden
diese Schritte noch manuell durchgeführt. Zwar liegen mittlerweile auch erste
automatisierte Verfahren für diese Prüfungen vor, jedoch ist auch mit diesen
Lösungsansätzen derzeit noch keine vollständige Automatisierung der Datenfernverarbeitung möglich.
15 Erste Erfahrungen wurden hier im Bereich der Steuerstatistiken gesammelt. Siehe hierzu Zwick, M.:
Steuerstatistische Einzeldaten und ihre Auswertungsmöglichkeiten für die Wissenschaft.
Allgemeines Statistisches Archiv, Band 83, 1999, S. 248 ff.
ZA-Information 56
179
Ein wesentliches Ziel der Forschungsdatenzentren besteht daher darin, Verfahren zu
entwickeln, die eine stärkere Automatisierung der Datenfernverarbeitung erlauben.
Ansatzpunkte hierfür bieten insbesondere die LIS/LES-Datenbank sowie das in
Dänemark praktizierte Verfahren einer Online-Datenverarbeitung.16 Die LIS/LESDatenbank erlaubt den direkten Datenzugriff auf die Mikrodaten der Luxembourg
Income Study/Luxembourg Employment Study über das Internet.17 Über die Angabe
eines projektbezogenen Passworts können durch die Übermittlung von SAS-, SPSSoder STATA-Files automatisch Datenauswertungen gestartet werden. LIS/LES ist
so ausgestaltet, dass auch eine begrenzte Syntax- und Ergebnisüberprüfung erfolgt.
Das dänische Modell sieht hingegen vor, dass Wissenschaftler direkt von ihrem
Arbeitsplatz aus auf einen Server zugreifen können, der vom statistischen Amt für
Forschungszwecke eingerichtet und gepflegt wird.18 Die Wissenschaftler erhalten
hierzu Zugriff auf ein Verzeichnis, in dem nur die Daten abgelegt sind, die sie für
ihr Forschungsvorhaben benötigen. Die Daten können von den Wissenschaftlern in
ein für sie angelegtes Arbeitsverzeichnis kopiert werden; von dort werden auch die
Analysen durchgeführt. Die Ergebnisse werden automatisch per E-Mail versendet.
Der gesamte Prozess der Datenverarbeitung kann von dem statistischen Amt jederzeit daraufhin überprüft werden, ob die vertraglich vereinbarten Regeln eingehalten
werden.
Mit den Gastwissenschaftlerarbeitsplätzen und der Datenfernverarbeitung stehen
der Wissenschaft, neben den Scientific Use Files, zwei weitere Möglichkeiten für
den Zugang zu Mikrodaten der amtlichen Statistik offen. Diese können auch
miteinander kombiniert werden. Unabhängig davon, welche Möglichkeit des
Datenzugangs gewählt wird, unterliegt die Datenbereitstellung, abgesehen von den
Public Use Files, allerdings einer Zweckbindung. Dies bedeutet, dass die Mikrodaten nicht für allgemeine Forschungszwecke zur Verfügung gestellt werden können, sondern nur für ein definiertes und zeitlich begrenztes Forschungsvorhaben.
16 Darüber hinaus bietet das Programm τ-ARGUS die Möglichkeit, Ergebnisse, die in Form von
Tabellen vorliegen, maschinell geheim zu halten. Das Programm wurde vom Statistischen Zentralamt der Niederlande für Eurostat entwickelt und für die tabellenübergreifende Geheimhaltung vom Landesamt für Datenverarbeitung und Statistik Nordrhein-Westfalen erweitert. Es
wird zurzeit in Deutschland ausführlich getestet.
17 Siehe hierzu ausführlich Smeeding, T. M.; Jesuit, D. K und Alkemade, P.: The LIS/LES Project
Databank: Introduction and Overview. In: Schmollers Jahrbuch, Zeitschrift für Wirtschafts- und
Sozialwissenschaften, 122. Jg., Heft 3, 2002, S. 497 ff
18 Das Modell wird in dem Bericht Access to Microdata beschrieben, der vom Statistischen Amt
Schwedens 2003 herausgegeben wurde.
180
5
ZA-Information 56
Sonderaufbereitungen
Neben den dargestellten Datennutzungswegen besteht für alle Nutzergruppen
weiterhin die Möglichkeit, gegen Entgelt Sonderaufbereitungen in Auftrag zu geben. Hierbei handelt es sich um Datenauswertungen, die auf den speziellen Informationsbedarf eines bestimmten Nutzers zugeschnitten sind und nicht oder nur unzureichend mit den sonstigen Datennutzungswegen umgesetzt werden können. Im
Gegensatz zur kontrollierten Datenfernverarbeitung werden die AuswertungsProgramme nicht von den Nutzern, sondern von der amtlichen Statistik erstellt.
Hierzu wird der Datenbedarf im Dialog zwischen amtlicher Statistik und Nutzer
soweit konkretisiert, dass ein Auswertungsprogramm erstellt werden kann. Anschließend wird das formal anonymisierte Datenmaterial mit Hilfe des entwickelten
Programms in den statistischen Ämtern ausgewertet. Die Ergebnisse werden nach
einer Geheimhaltungsprüfung an die Nutzer übermittelt. Die Nutzer haben hierbei
keinerlei direkten Kontakt mit den Mikrodaten.
6
Datenbedarf der Wissenschaft und Nutzungspräferenzen
Die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder
streben an, ihr Dienstleistungsangebot dem wissenschaftlichen Bedarf entsprechend
weiterzuentwickeln und befragen daher regelmäßig potenzielle Nutzer nach ihren
Präferenzen. Um den konkreten Datenbedarf der Wissenschaft bei der Entwicklung
des Dienstleistungsangebotes zu berücksichtigen, hat das Forschungsdatenzentrum
der Statistischen Landesämter im Sommer 2002 eine Nutzerbefragung durchgeführt.19 Ziel der Umfrage war es, die potenziellen Nutzerinnen und Nutzer des künftigen Datenangebotes der Forschungsdatenzentren anzusprechen und ihren konkreten
Datenbedarf zu ermitteln. Dabei konnten sich die Befragten auch zu den unterschiedlichen Nutzungsmöglichkeiten, den von ihnen eingesetzten Analyseprogrammen
und ihrem Interesse an geplanten Veranstaltungen der beiden Forschungsdatenzentren äußern.
Von den 700 befragten Wissenschaftlern gaben immerhin knapp 600 an, dass sie im
Rahmen ihrer wissenschaftlichen Tätigkeit Mikrodaten nutzen oder zukünftig benötigen werden. Insgesamt weisen die Ergebnisse der Nutzerbefragung somit auf ein
großes Interesse der Wissenschaft an der Nutzung von Mikrodaten der amtlichen
Statistik hin. Da der in der Umfrage angegebene Datenbedarf fachlich sehr breit
19 Siehe hierzu ausführlich Zühlke, S. und Hetke, U.: Datenbedarf und Datenzugang: Ergebnisse
der ersten Nutzerbefragung des Forschungsdatenzentrums der Statistischen Landesämter. In:
Allgemeines Statistisches Archiv, Band 87, 2003, S. 321 ff. (erscheint demnächst).
ZA-Information 56
181
gestreut ist, werden sich die Forschungsdatenzentren nicht auf die Bereitstellung
einzelner weniger Statistiken konzentrieren können, sondern müssen mittelfristig
ein breites Datenangebot bereithalten.
Bezüglich der angebotenen Datennutzungswege weist die Befragung auf eine eindeutige Präferenz für die Nutzung von faktisch und absolut anonymisierten Daten am
eigenen Arbeitsplatz hin, während die Arbeit an den Gastwissenschaftlerarbeitsplätzen und die kontrollierte Datenfernverarbeitung zum Befragungszeitpunkt kaum auf
das Interesse der Wissenschaft stießen. Es wird jedoch nicht möglich sein, alle relevanten Erhebungen der amtlichen Statistik als anonymisierte Datensätze anzubieten.
Die Forschungsdatenzentren planen daher, die Attraktivität der alternativen Nutzungswege durch deren nutzungsgerechte Ausgestaltung deutlich zu steigern. Insbesondere die Einrichtung von Gastwissenschaftlerarbeitsplätzen in allen regionalen
Standorten der Forschungsdatenzentren verbessert die regionale Erreichbarkeit des
Dienstleistungsangebots der amtlichen Statistik deutlich, so dass der Zugang zu den
Mikrodaten wesentlich erleichtert wird.
7
Ausblick
Durch die beschriebene Weiterentwicklung der Dateninfrastruktur und die Einrichtung unterschiedlicher Datennutzungswege wird die Mikrodatenbasis für wissenschaftliche Analysezwecke entscheidend verbessert. Die Diskussion um den Zugang
der Wissenschaft zu dem Informationspotenzial der öffentlichen Datenproduzenten
ist jedoch mit der Einrichtung von Forschungsdatenzentren bei den unterschiedlichen öffentlichen Datenproduzenten nicht abgeschlossen. Zukünftige Fragen des
Datenzugangs betreffen neben grundsätzlichen Regelungen insbesondere auch die
Bereitstellung international vergleichbarer Mikrodaten.
Die Diskussion um eine grundsätzliche Regelung des Datenzugangs wird vom Rat
für Sozial- und Wirtschaftsdaten unter dem Begriff des „Forschungsdatengeheimnisses“ geführt. Der Vorschlag des Rates sieht vor, dass Wissenschaftlerinnen und
Wissenschaftler den Mitarbeiterinnen und Mitarbeitern der Datenproduzenten
gleich gestellt werden und somit weitergehende Rechte zur Nutzung der Mikrodaten
als bisher erhalten sollen. Gleichzeitig sollen ein Zeugnisverweigerungsrecht sowie
ein Beschlagnahmeverbot den unbefugten Zugriff Dritter auf die bei den Wissenschaftlern gespeicherten Mikrodaten verhindern.
182
ZA-Information 56
Ein wesentliches Problem, Mikrodaten für die international vergleichende wissenschaftliche Forschung zu nutzen, besteht darin, dass in den einzelnen Ländern der
Mikrodatenzugang sehr unterschiedlich geregelt ist.20 Dadurch ist die Heranziehung
verschiedener nationaler Mikrodaten für die Wissenschaft mit einem recht hohen
Aufwand verbunden. Erste Ansätze, den Datenzugang zu den Erhebungen der
Europäischen Union zu vereinheitlichen, wurden mit den Verordnungen Nr. 322/97
und darauf aufbauend 831/2002 für Gemeinschaftsstatistiken unternommen.21 Mit
diesen Verordnungen wird die länderübergreifende Bereitstellung von Mikrodaten
der Arbeitskräftestichprobe, des Europäischen Haushaltspanels, der Erhebung über
die berufliche Weiterbildung und der Innovationserhebung der Gemeinschaft angestrebt. Die Umsetzung dieser Verordnungen wird jedoch zurzeit dadurch erschwert,
dass die dort vorgesehenen Regelungen teilweise noch den nationalen Regelungen
in den Ländern der Europäischen Union widersprechen.
Aufgrund der dargestellten Entwicklungen ist davon auszugehen, dass sich die
Datenzugangsmöglichkeiten der Wissenschaft auch zukünftig weiterentwickeln werden.
Die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder
werden sich an diesem Prozess durch eigene Ausgestaltungsvorschläge weiterhin
intensiv beteiligen.
20 Eine Darstellung der verschiedenen nationalen Ansätze zum Datenzugang findet sich in den
Tagungsbeiträgen zum internationalen Workshop on Microdata vom 21./22. August 2003 unter
http://www.micro2122.scb.se.
21 Verordnung (EG) Nr. 831/2002 der Kommission vom 17. Mai 2002 zur Durchführung der Verordnung (EG) Nr. 322/97 des Rates über die Gemeinschaftsstatistiken – Regelung des Zugangs
zu vertraulichen Daten für wissenschaftliche Zwecke (Amtsbl. der EG Nr. L 133 vom 18. Mai
2002, S. 7 ff.).
ZA-Information 56
183
European Mothers in Science - EMIS
by Ingvill C. Mochmann
EMIS is an interdisciplinary network for all female academics who want to pursue
both scientific interests and have children. Main goals are:
•
increase the proportion of female academics with children in all positions at
universities or research institutions
•
encourage female academics to pursue both family life and academic career
•
increase knowledge among employers about the positive qualities of academic
mothers
1
Introduction
Most children are born scientists. From early years on they are eager to understand
and explore the world and its peculiarities: why doesn’t it snow in the summer?
Why do I have to brush my teeth? How can Grandpa be in heaven when we buried
him in the ground? These questions and a million similar ones are known to all parents who try to answer them more or less accurately. From a scientific point of view
answering such questions in a correct way can be a real challenge as facts, paradigms or concepts do not exist in the heads of the children yet.
In daily life mothers are often those left to discuss and answer these questions. In
academic life discussing and answering questions are mainly left to male academics. The proportion of female academics becomes less and less the higher the positions get, although in the meantime many European countries have more female
then male graduates. Looking at the proportion of mothers in science the situation is
even more dramatic, in Germany for example, 40% of female academics are childless. A part of this development might be explained by individual preferences, but
there is no doubt that many women who want to have children leave academic life
because they consider an academic career and family life incompatible. Those wishing to pursue academic life decide against family life from the beginning or postpone the decision until it is too late.
184
ZA-Information 56
We want female academics to have a real chance to decide whether they want to
become mothers or not without having to risk their academic career or neglect their
scientific interests.
2
Aims of EMIS
Emphasise the following aspects and many more:
Most women who are interested in research don’t lose this interest just because they
become mothers. Ideas, theories, solutions to problems keep running though their
heads even if they feed their children, are at the playground or empty the dishwasher. Furthermore, being a mother often exposes you to situations and people you
otherwise would not have been exposed to and which can open up for new thoughts.
Being a scientist is a mentality, not just a job!
Mothers in general are said to be highly efficient, organised and multi-tasking. Academic mothers are in addition capable of using vacant minutes to concentrate on
producing scientific papers and theses or reading academic journals even if children
are running around.
Quantity of achieved academic output should be weighted in relation to family
responsibilities!
For about 15 out of 40 years of a female academic’s life children and family have
to be on the top priority position, depending of course on the number of children.
During this phase mothers are dependent
•
on clear arrangements and time schedules from the employers’ side,
•
on acceptance from the employer to concentrate on few tasks – mainly such
relevant to their academic career – and reduce travel and conference activities
to those relevant for these tasks,
•
on being treated as equal colleague and receive positive feedback and promotion from employers on achievements even if they become mothers and even if
they work part-time.
Becoming a mother does not imply becoming incompetent!
ZA-Information 56
3
185
Who can become member?
•
Mothers in academic positions at universities or research institutions, both in
science and administration
•
Female students, PhD-candidates, researchers etc. who would like to acquire
knowledge on how to combine academic life and children
•
Women and men, with or without own children, in higher academic positions
who would like to support female academics who want to combine science and
family life.
Although EMIS mainly aims at improving the position of academic mothers in research, female academics in administrative positions are often in similar difficult
situations. As a change of mentality within the university system is also dependent
on the mentality of administrative staff, we highly encourage academic mothers in
administrative positions to join this network.
4
Future plans
The first task of this network is to collect suggestions, ideas and problems from
mothers in all scientific disciplines. Based on these, guidelines should be established for politics and employers. Send these to the author. Another important task
would be to organise meetings at a regular basis in order to exchange experiences
and intensify the network.
5
Contact
If you are interested in participating or have any questions or comments, please contact:
Dr. Ingvill C. Mochmann, ZA-EUROLAB Coordinator
Zentralarchiv für Empirische Sozialforschung, Universität zu Köln
Bachemer Str. 40, D-50931 Köln
[email protected]
http://www.mothersinscience.org
186
ZA-Information 56
Internationales Forschungsprojekt über die Diskriminierung und Chancengleichheit von Kriegskindern 1
von Stein Ugelvik Larsen2 und Ingvill C. Mochmann
Zusätzlich zu den militärischen Konsequenzen, haben Kriege meist auch für die
zivile Bevölkerung große Folgen. Folgen, die insbesondere verschwiegen werden,
wenn sie daraus entstehen, dass zum Feind ein näherer persönlicher Kontakt bestand. Zwischen 1939 und 1945 wurden hunderttausende von Kindern in Europa
geboren, deren Väter deutsche Soldaten sind. Die Anzahl ist unsicher; viele Frauen
verschwiegen ihre Schwangerschaft oder den Kindesvater aus Angst vor Rache und
Repressalien aus der Gemeinde. Geschätzt wurden zwischen 10.000 und 12.000
Kinder deutscher Soldaten in Norwegen, 6.000 in Dänemark, 40.000 in Belgien,
50.000 in den Niederlanden, 800 auf Jersey und bis zu 200.000 in Frankreich. Auch
in Russland und Osteuropäischen Ländern wurden Kriegskinder geboren. Wenig ist
über die Schicksale der Mütter und ihrer Kinder bekannt. Während in der Öffentlichkeit in den ersten Nachkriegsjahren die Mütter verpönt und ihre Kinder bestenfalls ignoriert wurden, herrscht seit den 1950er Jahren weitestgehend Schweigen.
Neuerdings steht dieses Thema wieder auf der öffentlichen Agenda und auch die
Forschung widmet sich zunehmend der Frage, was aus den Kriegskindern geworden
ist (vgl. Larsen 1997, Øland 2001, Olsen 2002, Picaper 2003, Borgersrud 2004,
Drolshagen 2004, Ellingsen 2004).
Neben Monographien, Erzählungen und Zeitungsberichten gibt es auch Fotoausstellungen zu den Schicksalen von Kriegskindern. Akten u. a. vom norwegischen „Riksarkiv“ (Reichsarchiv) geben eine Vorstellung über das Leben der Frauen, die sich
auf deutschen Soldaten eingelassen haben, und deren Kinder (Olsen 2002). Um systematische und umfangreichere Informationen über die Lebensverläufe norwegischer Kriegskinder zu bekommen, wurde 1997 eine Studie in Kooperation mit dem
in 1986 gegründeten norwegischen Kriegskindverbund durchgeführt. Inzwischen ist
1 In diesem Forschungsprojekt werden als Kriegskinder, Kinder bezeichnet, die aus einer Bezie-
hung zwischen einen ausländischen Soldaten, sei es von feindlichen-, alliierten- oder Friedenstruppen, und einer einheimischen Frau entstanden sind.
2 Stein Ugelvik Larsen ist Leiter des Forschungsprojektes und Professor am Institut für Vergleichende Politikwissenschaften, Universität Bergen, Norwegen ([email protected]).
ZA-Information 56
187
die Untersuchung auf Kriegskinder in Dänemark und Niederlanden ausgeweitet
worden. Die Umfrage wurde unter den 650 Mitgliedern des norwegischen Kriegskindverbundes (NKBF) in 1997 und knapp 400 Mitgliedern des dänischen Kriegskindverbundes (DKBF) in 2003 durchgeführt. Zusätzlich wurden ca. 50 niederländische Kriegskinder befragt. Mit 250 Fragen ist der Fragebogen sehr umfassend und
beinhaltet Themen wie Sozialstruktur, Gesundheit, Wohnorte, Jugend- und Erwachsenleben, Identität, Fragen zur Mutter und zum biologischen Vater, Fragen zur eigenen
Familie, sozialer Integration und Identität als Kriegskind. Die Antwortquote lag in
Norwegen und Dänemark bei ca. 50%. Die Auswahl ist nicht repräsentativ für die
Gruppe der Kriegskinder insgesamt, da sie sich hauptsächlich auf Mitglieder der
Verbände bezieht und zu wenig über die Grundgesamtheit der Kriegskinder bekannt
ist. Auch die Anzahl der Frauen in der Auswahl ist größer als die der Männer, in Norwegen 218 Frauen und 108 Männer und in Dänemark 129 Frauen und 85 Männer.
Trotzdem kann davon ausgegangen werden, dass diese Daten aufgrund ihrer komparativen Orientierung, strukturierten und teilweise standardisierten Frageform, eher
Ähnlichkeiten und Unterschiede zwischen Kriegskindern wiedergeben können, als
Monographien und Einzelinterviews, die bis jetzt in diesem Forschungsbereich meist
angewandt worden sind. Erste Ergebnisse der Untersuchung zeigen u.a. wie wichtig es
für die Kriegskinder ist, die eigene biologische Identität zu kennen (Mochmann und
Larsen 2005). Weitere Ergebnisse aus der Untersuchung sind in Bearbeitung.
Obwohl sich die Wissenschaft zunehmend mit diesem Thema beschäftigt, sind zahlreiche Aspekte unberücksichtigt und in vielen Ländern wird dieses Thema immer
noch tabuisiert. Auch wenn die direkt Betroffenen schon 60 Jahre oder älter und
viele gar nicht mehr am Leben sind, kann die Forschung dazu beitragen, dass Gesellschaften in Zukunft mit dieser Problematik besser umgehen. Solange es Kriege
gibt, werden auch Kriegskinder geboren, man denke nur an z.B. Korea, Vietnam,
Balkan und Ruanda (vgl. War and Children Identity Project, Report 1, 2 und 3).
Literatur
Borgersrud, Lars: Staten og krigsbarna. En historisk undersøkelse av statsmyndigheternes behandling av
krigsbarna i de første etterkrigsårene, Oslo, 2004.
Drolshagen, Ebba D.: Wehrmachtskinder. Auf der Suche nach dem nie gekannten Vater, München, 2005.
Ellingsen, Dag, Krigsbarns levekår. En registerbasert undersøkelse. Statistics Norway, Rapport Nr. 2004/19,
Oslo, 2004.
Larsen, Stein Ugelvik (Hrsg.) I krigens kjølevann, Oslo, 1999.
Mochmann, Ingvill C. und Stein Ugelvik Larsen: Kriegskinder in Europa. In: Aus Politik und Zeitgeschichte, Nr. 18-19/2005, S. 34-38.
Olsen, Kåre: Vater: Deutscher. Das Schicksal der norwegischen Lebensbornkinder und ihrer Mütter von
1940 bis heute, Frankfurt/M. 2002.
Picaper, Jean-Paul und Ludwig Norz, Enfant maudit, Paris 2004
Øland, Arne: Horeunger og helligdage – tyskerbørns beretninger, Kopenhagen, 2001.
War and Children Identity Project (WCIP): The War Children of the World Report, Report 1, 2 und 3 Bergen, 2002, 2003, 2004, http://www.warandchildren.org.
188
ZA-Information 56
Buchhinweise
Baur, Nina; Fromm, Sabine (Hrsg.):
Datenanalyse mit SPSS für Fortgeschrittene: Ein Arbeitsbuch.
Verlag für Sozialwissenschaften: Wiesbaden, 2004; EUR 24,90
ISBN 3-531-14163-5
von Thomas Müller-Schneider1
Das von Nina Baur und Sabine Fromm
herausgegebene Lehrbuch wendet sich an
„fortgeschrittene Anfänger“ der sozialwissenschaftlichen Datenanalyse, die zwar über
erste Kenntnisse in Methodenlehre, Statistik, Wissenschaftstheorie und im Umgang
mit SPSS verfügen, aber noch kaum Erfahrung mit der eigenständigen Umsetzung von
Forschungsfragen in statistische Konzepte
und deren Bearbeitung mit SPSS haben.
Diesem Publikum möchte das Buch – ausgehend von konkreten Fragestellungen und
Forschungsproblemen – einen leicht verständlichen Einstieg in die Praxis der sozialwissenschaftliche Datenanalyse bieten. Behandelt werden vor allem typische Probleme
des Datenmanagements sowie grundlegende
Auswertungsstrategien der uni-, bi- und multivariaten Statistik einschließlich damit
verbundener methodischer Probleme.
Im ersten Teil des Buches geht es um wichtige Schritte im Forschungsprozess, die
der eigentlichen Datenanalyse unmittelbar vorausgehen bzw. ihr nachgelagert sind.
Sehr intensiv und präzise werden in mehreren Kapiteln Datenerfassung („Wie
kommen die Daten in den Datensatz?“), Zusammenführung von Datensätzen (auch
1 Dr. Thomas Müller-Schneider ist Professor für Soziologie an der Universität Koblenz-Landau,
Campus Landau, Institut für Sozialwissenschaften, Abteilung Soziologie, Thomas-Nast-Str. 44,
76829 Landau.
ZA-Information 56
189
verschiedener Analyseebenen), Techniken der Plausibilitätskontrolle, Fehlerdiagnose
und Datenbereinigung sowie die Konstruktion neuer Variablen (u.a. komplexe
Typenvariablen) behandelt. Zwei anschließende Kapitel widmen sich der Gestaltung von Tabellen und Grafiken mit SPSS sowie der Präsentation statistischer Ergebnisse. Hervorzuheben ist ein weiteres Kapitel, das auf nützliche Software aus
verschiedenen Anwendungsbereichen und insbesondere auf immer wichtiger werdende Fundstellen für sekundäranalytisch auswertbare Datensätze hinweist. Im Mittelpunkt des zweiten Teils steht dann die Umsetzung statistischer Konzepte in SPSS.
Das Themenspektrum der einzelnen Kapitel umfasst das Informationspotenzial eindimensionaler Häufigkeitsverteilungen, die Auswertung von Kreuztabellen bzw.
Kontingenzanalyse, umfangreiche und wichtige Erläuterungen zum Ordinalskalenproblem, die Drittvariablenkontrolle für bivariate Beziehungen (Partialzusammenhänge), die Faktorenanalyse (auch klassische Testtheorie) und die multiple Regressionsanalyse.
Das Grundkonzept des Buchs besteht darin, forschungspraktisch relevantes Wissen,
das in anderen Lehrbüchern häufig viel zu kurz kommt, auf ineinander greifenden
und sich ergänzenden Wegen zu vermitteln. Die behandelten Inhalte werden anhand
„realer“ Datensätze verschiedener an der Universität Bamberg durchgeführten Lehrforschungsprojekte (z.B. „Lebensläufe im Wandel. Vergleich dreier Geburtskohorten hinsichtlich Ausbildung, Familienverlauf, Freizeit, Einstellungen) eingehend
erarbeitet und veranschaulicht. Durchgehend werden die verwendete SPSS-Syntax
und die dazugehörige SPSS-Ausgabe dokumentiert und vor dem Hintergrund der
jeweiligen Problemstellung erläutert. Die analysierten Datensätze finden sich auf
einer beiliegenden CD-ROM, so dass die betreffenden Prozeduren und Ergebnisse
in „Eigenregie“ auch unmittelbar nachvollzogen werden können. Die CD-Rom enthält auch eine umfangreiche – und im Lehrbetrieb bereits erfolgreich eingesetzte –
Aufgabensammlung, die genau auf die Lehrinhalte abgestimmt ist. Ausführliche
Musterlösungen bieten zudem eine effektive Lernkontrolle.
Das vorgelegte Buch ist ein gelungenes Beispiel einer noch viel zu wenig verbreiteten Gattung von Lehrbüchern der Datenanalyse, der es darauf ankommt den primär
an statistischen Kriterien ausgerichteten Denkhorizont zu überwinden und die zu
vermittelnden Verfahren sowohl in den forschungspraktischen als auch in den methodologischen Kontext der Sozialwissenschaften einzubetten. Diese Einbettung
wird beispielsweise bei der Behandlung der Faktorenanalyse sichtbar. Methodologisch wird sie auf die Erkennung von Dispositionsvariablen bezogen, die aber nur
scheinbar – weil vom Verfahren erzwungen – statistisch unabhängig sind. Um die
einzelnen Dimensionen bestmöglich zu messen und die „natürlichen“ Korrelationsverhältnisse wiederzugeben, wird ein besserer Weg als die oblique Rotation
190
ZA-Information 56
vorgeschlagen, nämlich die eindimensionale Erfassung der Faktoren nach der klassischen Testtheorie (Reliability). Seinen besonderen Stellenwert erhält das Lehrbuch auch durch das didaktische Prinzip des „learning by doing“, das in den sehr
guten Begleitmaterialien schrittweise angelegt und für Lernende kontrollierbar ist.
Das Buch eignet sich nicht nur zum Selbststudium, sondern kann auch als wertvolle
Arbeitshilfe für Dozierende entsprechender Methoden- bzw. Analysekurse verwendet werden. Bei einer aktualisierten Neuauflage wäre an eine Erweiterung um solche multivariate Analyseverfahren zu denken, die – wie z.B. die logistische Regression – immer stärker in die alltägliche sozialwissenschaftliche Forschungspraxis
vordringen.
Stascheit, Ulrich; Winkler, Ute:
Leitfaden für Arbeitslose: Der Rechtsratgeber zum SGB III
22. Auflage, Stand: 1.1.2005.
Fachhochschulverlag: Frankfurt am Main 2005. EUR 11,ISBN: 3-936065-35-7, 592 S.
von Wolfgang Hübner
TuWas ist ein Arbeitslosenprojekt am Fachbereich Sozialarbeit der Fachhochschule Frankfurt. Unter der Leitung von Ulrich Stascheit 2
und Ute Winkler 3 erschien nunmehr die mittlerweile 22. (der jährlich aktualisierten) Auflage
dieses Ratgebers. Der „Leitfaden für Arbeitslose“ versteht sich als Hilfsmittel für Arbeitslose, Ratsuchende sowie Ratgebende, die aktuelle Informationen und Gesetzesgrundlagen
suchen.
Aus dem Inhalt:
Worauf muss man achten, wenn man arbeitslos
wird? Hilfe bei Arbeitssuche und bei Arbeitsaufnahme; Wer bekommt Arbeitslosengeld?
2 Professor für Arbeitslosenrecht an der Fachhochschule Frankfurt am Main, FB Sozialarbeit mit
den Schwerpunkten: Arbeitslosenrecht, Arbeitsrecht, insbesondere kirchliches Arbeitsrecht, und
Geschichte der Wohltätigkeit.
3 Amtierende Präsidentin des Landessozialgerichts Sachsen-Anhalt.
ZA-Information 56
191
Höhe des Arbeitslosengeldes und Anrechnung von Nebeneinkommen; Zumutbarkeit; Dauer des Arbeitslosengeldes; Beschäftigung von Ausländern; Sperrzeiten;
Ruhen von Leistungen; Kurzarbeitergeld; Insolvenzgeld; Fördermöglichkeiten und
Berufsausbildungsbeihilfen; Teilnahme behinderter Menschen am Arbeitsleben;
Maßnahmen zur Schaffung und Erhaltung von Arbeitsplätzen; Existenzgründungshilfen; Mittel aus dem Europäischen Sozialfonds; Sozialversicherung; Widerspruch
und Klage; Musterbriefe. Ein Stichwortverzeichnis ermöglicht den gezielten Zugriff
auf die Themen. Erstmals gibt es auch ein Kapitel ,,Beschäftigung von Ausländern“,
in dem die Auswirkungen des neuen „Aufenthaltsgesetzes“ auf Arbeitserlaubnisse
und das Recht auf Leistungsbezug dargestellt sind.
Da die Arbeitslosenhilfe seit Jahresbeginn in der bisherigen Form nicht mehr existiert, sondern im Rahmen der umfangreichen Hartz IV-Gesetzgebung mit dem AlG II
verschmolzen wurde, ist auch das Kapitel zur Arbeitslosenhilfe ersatzlos gestrichen
worden. Das Arbeitslosenprojekt TuWas hat daher einen zweiten Reader, den „Leitfaden zum Arbeitslosengeld II: Der Rechtsratgeber zum SGB II“ veröffentlicht, der
sich ganz dieser Neuregelung widmet.
Die komplizierte Materie wird anschaulich und leicht nachvollziehbar dargelegt. Beispiele mit Urteilen und entsprechenden Paragrafenhinweisen machen das Buch zu
einem wertvollen Ratgeber für Laien. Die Preisgestaltung ist ausgesprochen moderat, besonders wenn man den Umfang, den zweifarbigen Druck und vergleichbare
Veröffentlichungen in Betracht zieht. Der Band kostet (einschließlich Versandkosten)
11,- Euro und ist zu beziehen über:
Fachhochschulverlag
Der Verlag für angewandte Wissenschaften
Kleiststr. 31, 60389 Frankfurt
Tel.: 0 69 15 33-28 20
Fax: 0 69 15 33-28 40
[email protected]
www.fhverlag.de
192
ZA-Information 56
ADM Arbeitskreis Deutscher Markt- und Sozialforschungsinstitute
e.V. (Hrsg.):
Nonresponse und Stichprobenqualität:
Ausschöpfung in Umfragen der Markt- und Sozialforschung.
Verlagsgruppe Deutscher Fachverlag, 60264 Frankfurt am Main,
2004. EUR 25,- ISBN – 3-87150-897-7
Die Ausschöpfungsquoten von Umfragen, die auf repräsentativen Zufallsstichproben basieren, sind in den vergangenen Jahren kontinuierlich gesunken oder stagnieren auf einem unbefriedigenden Niveau. Gibt es Chancen, den Trend umzukehren?
Wo liegen die Ursachen für diesen Trend, wie kann die empirische Forschung reagieren, welche Lösungsmöglichkeiten bieten sich an? Wie ist die Qualität einer realisierten Stichprobe zu bewerten? Ist es ausreichend, die Ausschöpfungsquote allein
als Maßstab heranzuziehen?
Aus dem Inhalt:
Zur Ausschöpfung bei Umfragen der Markt- und Sozialforschung; Trends in den
non-response-rates; Teilnahmebereitschaft von Befragten; Forschungskonzepte; die
Qualität realisierter Zufallsstichproben; zur Stichprobenqualität in Online-Befragungen; Potentiale und Probleme bei Access Panels.
Die Analyse der deutschen Situation im Bereich der Ausschöpfungsquoten wird in
Vergleich mit anderen Ländern gestellt. Es wird deutlich, dass ein solcher Vergleich
nicht trivial ist. Die Variabilität der methodischen Basis, so z.B. unterschiedliche
Feldstrategien, das Survey-Klima und die Einstellung zu Umfragen machen einen
Vergleich über die Ländergrenzen hinweg schwierig. Ausführlich beschrieben wird
"Dillmann’s Tailored Design" Methode.
Uwe Engel (Universität Bremen) und seine Mitarbeiterinnen haben eine umfassende
Zusammenstellung der Parameter erarbeitet, die sich auf die Höhe der Ausschöpfungsquoten bei Umfragen auswirken. Ein umfangreiches Literaturverzeichnis reflektiert den aktuellen Stand der Forschung.
Das Buch besteht aus zwei im Layout unterschiedlich gestalteten Teilen, die nicht
gänzlich aufeinander abgestimmt sind. Etwas Sorgfalt bei der Satzlegung des Buches
hätte man sich gewünscht.
Bezug über:
Horizont Productions, Verlagsgruppe Deutscher Fachverlag
Hans H. Kopsch
E-Mail: [email protected], Telefon 069-75 95 28 41

Documentos relacionados