ZA-Information 56 Mai 2005
Transcrição
ZA-Information 56 Mai 2005
ZA-Information 56 Mai 2005 Herausgeber: Zentralarchiv für Empirische Sozialforschung Universität zu Köln Direktor: Prof. Dr. Wolfgang Jagodzinski Geschäftsführer: Dr. h.c. Ekkehard Mochmann Postanschrift: Postfach 410 960 50869 Köln Hausanschrift: Bachemer Straße 40 50931 Köln Telefon: Zentrale 0221 / 4 76 94 - 0 Telefax - 44 Redaktion - 50 Redaktion: Franz Bauske E-Mail: [email protected] Internet: http://www.gesis.org/za ISSN: 0723-5607 © Zentralarchiv Die ZA-Information erscheint jeweils im Mai und November eines Jahres. Sie wird kostenlos an Interessenten und Benutzer des Zentralarchivs abgegeben. Die Zeitschrift ist auch im Internet abrufbar unter: www.gesis.org/Publikationen/Zeitschriften/ZA_Information Das Zentralarchiv ist Mitglied der Gesellschaft Sozialwissenschaftlicher Infrastruktureinrichtungen (GESIS) Die GESIS ist eine Einrichtung der Leibniz Gemeinschaft ZA-Information 56 Mai 2005 Inhaltsverzeichnis Mitteilungen der Redaktion ....................................................................................... 5 Forschungsnotizen Messen wird immer einfacher! von Jürgen Rost......................................................................................................... 6 Warum auch Mehrfachindikatoren manchmal nicht helfen: Überlegungen zu einem multiplen Indikatorenmodell für interpersonales Vertrauen im Anschluss an die Anmerkungen von Jürgen Rost von Wolfgang Jagodzinski und Kazufumi Manabe ................................................. 8 Determinanten und Konsequenzen von Nonresponse in egozentrierten Netzwerkstudien von Volker Stocké.................................................................................................... 18 Persönliche Codes bei Längsschnittstudien: Ein Erfahrungsbericht von Andreas Pöge.................................................................................................... 50 Abbrüche bei Online-Befragungen: Ergebnisse einer Befragung von Medizinern von Yasemin El-Menouar und Jörg Blasius .......................................................... 70 MTB: Ein Record-Linkage-Programm für die empirische Sozialforschung von Rainer Schnell, Tobias Bachteler und Jörg Reiher ....................................... 93 Berichte aus dem Archiv Berlin-Datenbank von Prof. H. Hurwitz: Präsentation im Dezember in Berlin von Ekkehard Mochmann..................................................................................... 104 Wie es dazu kam: Meine Sammlung von Primärdaten und Dokumenten zur Politik in Berlin nach dem zweiten Weltkrieg von Harold Hurwitz............................................................................................... 105 The Mannheim Eurobarometer Trend File 1970 - 2002 Aktualisierung und Erweiterung der ZA-Studien-Nr. 3521 von Meinhard Moschner....................................................................................... 127 Consolidation of Democracy in Central and Eastern Europe 1990 - 2001: Cumulation of PCP Wave I and Wave II by Brigitte Hausstein............................................................................................. 129 Mai 2005 ZA-Information 56 Lebenssituation, Sicherheit und Gesundheit von Frauen in Deutschland: Eine Kurzbeschreibung der Studie von Monika Schröttle ............................................................................................ 131 Japan zu Gast im Zentralarchiv von Wolfgang Jagodzinski .................................................................................... 138 Structural Equation (SEM) and Mixture Modelling (MM): 35th Spring Seminar at the Zentralarchiv 6-24 March, 2006.................................. 140 Forschungsmethoden, Datenbankmanagement und Statistik in der Historischen Sozialforschung: Basis und Aufbaumodelle des ZHSF-Methodenseminars ......... 142 Erweiterungen im Datenangebot des Zentralarchivs ............................................. 144 Berichte aus anderen Instituten Die Nutzung der ALLBUS-Daten in Publikationen der Jahre 1980 - 2004 ........... 162 Die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder von Sylvia Zühlke, Markus Zwick, Sebastian Scharnhorst und Thomas Wende ...................................................................................................... 168 Ankündigungen und Mitteilungen European Mothers in Science – EMIS by Ingvill C. Mochmann ....................................................................................... 183 Internationales Forschungsprojekt über die Diskriminierung und Chancengleichheit von Kriegskindern von Stein Ugelvik Larsen und Ingvill C. Mochmann .......................................... 186 Buchhinweise Baur, Nina; Fromm, Sabine (Hrsg.): Datenanalyse mit SPSS für Fortgeschrittene: Ein Arbeitsbuch ............................. 188 Stascheit, Ulrich; Winkler, Ute: Leitfaden für Arbeitslose: Der Rechtsratgeber zum SGB III ................................. 190 ADM Arbeitskreis Deutscher Markt- und Sozialforschungsinstitute e.V. (Hrsg.): Nonresponse und Stichprobenqualität: Ausschöpfung in Umfragen der Markt- und Sozialforschung .............................. 192 Bei Beiträgen, die nicht von Mitarbeitern des Zentralarchivs verfasst wurden, ist die Anschrift der Autoren beim jeweiligen Artikel angegeben. Die Inhalte der Beiträge entsprechen der Meinung der Autoren und geben nicht unbedingt die Ansicht der Redaktion wieder. Alle inhaltlichen Beiträge sind Gegenstand einer Beurteilung durch externe Gutachter. ZA-Information 56 5 Mitteilungen der Redaktion International vergleichende Forschung wird durch eine Reihe von Datensätzen aus dem Zentralarchiv unterstützt, so z.B. ISSP oder EVS. Meinhard Moschner weist auf einen solchen, jetzt erweiterten, Datensatz, den Eurobarometer-Trendfile, hin. Das schwierige Tagesgeschäft international harmonisierter Umfragen liegt darin, alle Teilnehmerländer für eine Fragenbatterie zu einer Einstellungsdimension zu gewinnen. In diesem Verhandlungsprozess reduziert sich der gemeinsame Nenner manchmal auf ein einzelnes Item. Wolfgang Jagodzinski und Kazufumi Manabe hatten in der letzten Ausgabe ein solches Item in zwei Studien verglichen. Jürgen Rost nimmt das zum Anlass daran zu erinnern, dass doch wenigstens zwei Indikatoren vonnöten wären. Wir drucken auch die Antwort der beiden Autoren dazu ab. Die besondere Situation Berlins in der Nachkriegszeit war das Forschungsfeld von Harold Hurwitz. Er hat die politischen Geschehnisse forschend begleitet und dabei nicht vergessen, eine umfangreiche Sammlung von Daten und Fakten anzulegen. In einem persönlichen Bericht beschreibt er, wie sein Weg als Forscher und Politikberater in Berlin verlaufen ist und wie es zu dieser Datensammlung gekommen ist, die jetzt auch im Zentralarchiv zur Verfügung steht. Aus welchen Gründen brechen Befragte bei Online-Befragungen ab? Yasemin El-Menouar und Jörg Blasius überprüfen, ob der Grund bei fragebogenspezifischen oder bei personenspezifischen Faktoren liegt, wenn Befragte im Verlauf einer Befragung aussteigen. Zwei Datensätze zu integrieren ist einfach, wenn es einen eindeutigen Link gibt, z.B. in Form von Befragtennummern. Schwierig wird es, wenn es keine eindeutige Verbindung gibt, man z.B. Daten aus externen Unterlagen zu einer befragten Person hinzuspielen möchte. Rainer Schnell, Tobias Bachteler und Jörg Reiher haben ein Programm entwickelt, das das Zusammenfügen solcher Dateien wesentlich erleichtert. Einen Einblick in die Praxis der Datenverknüpfung gibt auch Andreas Pöge. Er schildert die Problematik bei der Zuordnung mehrerer Erhebungswellen, wenn der Datenschutz es erforderlich macht, dass mit persönlichen Codes gearbeitet werden muss. Die Fehleranfälligkeit des Verfahrens hat zu starken Verzerrungen geführt. Nachfolgeuntersuchungen sind auch das Thema von Volker Stocké. Er versucht bei egozentrierten Netzwerken die Alteri zu befragen und stellt dabei fest, dass die Ausfallwahrscheinlichkeit mit Merkmalen der Ego wie auch der Alteri verbunden ist. Franz Bauske 6 ZA-Information 56 Messen wird immer einfacher! von Jürgen Rost 1 Vorbei die Zeiten der großen alten Männer der sozialwissenschaftlichen Messtheorie. Vorbei Paul Lazarsfeld, der uns lehrte, latente Strukturen, latente Profile und latente Klassen anhand von manifesten Indikatoren zu erfassen. Vorbei Luis Guttman, der uns lehrte, dass manifeste Indikatoren ein Kontinuum aufspannen, in das Personen eingeordnet werden können. Vorbei R. Likert, der uns die Korrespondenz von Ratingskala und Einstellungsdimension als Kriterium für Messung bescherte. Vorbei L. Thurstone, der uns lehrte, dass Antworttendenzen nicht immer monoton mit der latenten Variable zusammenhängen müssen. Vorbei H. Gulliksen, der uns zeigte, dass eine beobachtete Variable immer eine Summe von zwei Variablen darstellt. Vorbei Georg Rasch, der uns lehrte, dass auch Personenmesswerte unabhängig vom Messinstrument sein müssen. Die Reihe ließe sich beliebig fortsetzen. Die sozialwissenschaftliche Messtheorie ist eine Profession. Wer wollte das bestreiten? Wenn man die professionelle Umfrageforschung anschaut, so bekommt man das Gefühl, dass der Korrelationskoeffizient die einzige Messtheorie ist, die sie kennt. Oh ja, der Korrelationskoeffizient ist eine Messtheorie und stammt sogar auch von großen alten Männern. Karl Pearson gab ihm seinen Namen und Charles Spearman lehrte uns vor nunmehr 101 Jahren, wie man mit Hilfe des Messfehlers aus einer Korrelation von 0,3 eine von 0,99 macht. Also woher die Aufregung über den vermeintlichen Ausverkauf der Professionalität sozialwissenschaftlicher Messung? Was haben all die genannten Messtheorien gemeinsam? Dass sie in der Praxis der Umfrageforschung zu umständlich anzuwenden sind? Oder dass sie zu alt sind? Oder dass sie in den einschlägigen Studiengängen nicht mehr gelehrt werden? Oder dass sie der Rezipient von Umfrageergebnissen nicht versteht? Nein, weit gefehlt. Sie haben nur eines gemeinsam. Im Unterschied zu naturwissenschaftlichen Messungen, bei denen der auf einem Messinstrument abgelesene Wert selbst der Messwert ist, gibt es in den Sozialwissenschaften die prinzipielle Trennung von gemessener Variable und beobachtbaren Indikatoren. Menschen 1 Dr. Jürgen Rost ist Professor am IPN - Leibniz-Institut für die Pädagogik der Naturwissen- schaften an der Universität Kiel Olshausenstraße 62, 24098 Kiel, [email protected] ZA-Information 56 7 produzieren zwar einen Messwert, wenn man sie nach ihrer Schuhgröße oder ihrem Alter fragt, aber nur deshalb weil sie den Messwert kennen. Wenn man sie fragt, ob sie zufrieden sind oder ob ihnen die Familie wichtig ist, erhält man keinen Messwert, sondern einen Indikator. Wie man von Indikatoren zu Messwerten kommt, ja genau das ist der Gegenstand von Messtheorien. Meines Erachtens haben alle sozialwissenschaftlichen Messtheorien gemeinsam, dass man mindestens zwei Indikatoren braucht, um eine Variable zu messen. Zwei ist die absolute Untergrenze der Itemanzahl eines Tests, nicht Eins. Umso erstaunter war ich, als ich gleich in beiden GESIS-Zeitschriften, der ZA-Information und den ZUMA-Nachrichten, ein Loblied der Single Item Messung fand (Jagodzinski und Manabe, ZA-Information 55, S. 85-98 und Rammsted, Koch, Borg und Reitz, ZUMA-Nachrichten 55, S. 5-28). Beide Beiträge sind von sachkundiger Hand geschrieben. Daher möchte ich mich auch nicht mit kleinkarierten methodischen Kriteleien aufhalten, sondern die Frage stellen, um die es mir wirklich geht. Sollten wir nicht das höchstmögliche Niveau an methodischer Expertise zeigen, wenn es um die Messung sozialwissenschaftlicher Variablen geht, seien sie soziologischer, psychologischer oder pädagogischer Provenienz? Sollten wir diese Expertise nicht gerade bei routinemäßigen Unternehmungen wie dem ALLBUS zeigen, auch wenn dort der Praxisdruck (sprich: Geld, Zeit, Verständlichkeit etc.) am größten ist? Wir sollten uns nicht davon leiten lassen, wo die gerade noch tolerierbare unterste Grenze an psychometrischer Expertise liegt (die bei mir, pardon, immer noch bei zwei Items und nicht bei einem Item liegt), sondern wo das höchste, noch durchsetzbare Niveau wissenschaftlicher Professionalität liegt. Im deutschen PISAKonsortium haben wir uns dieser vom internationalen PISA-Konsortium vertretenen Philosophie angeschlossen, um mit den neuesten und besten Methoden das Kompetenzniveau in einer Testsituation zu messen, in der jeder Schüler und jede Schülerin nur einen Bruchteil der gesamten Itemmenge bearbeitet hat. Wir sind sehr zufrieden mit diesem Weg, denn Fragen danach, wie unser kompliziertes methodisches Vorgehen aussieht, sind einfacher zu beantworten als die Frage, wo wir den Glauben hernehmen, überhaupt etwas gemessen zu haben. 8 ZA-Information 56 Warum auch Mehrfachindikatoren manchmal nicht helfen: Überlegungen zu einem multiplen Indikatorenmodell für interpersonales Vertrauen im Anschluss an die Anmerkung von Jürgen Rost1 von Wolfgang Jagodzinski und Kazufumi Manabe2 Rost wiederholt in seiner Kritik im Grunde das, was wir (Jagodzinski und Manabe 2004) im Schlusswort unseres Aufsatzes sagen. Dort beklagen wir nochmals das Missverhältnis zwischen der Häufigkeit der Verwendung des Vertrauenskonzepts in der Literatur und der rudimentär entwickelten Theorie und Messtheorie. Ein Loblied auf die Verwendung von Einzelindikatoren singen wir ganz gewiss nicht. Im vorletzten Satz heißt es ganz explizit: „A measurement model … cannot be based on a single item” (Jagodzinski und Manabe 2004: 96). Unsere Botschaft ist vielmehr: Sowohl die Theorie des interpersonalen Vertrauens als auch die Messtheorie sind bislang kaum ausgearbeitet. Eigentlich braucht man zur Messung mehrere Indikatoren, aber wenn man schon Einzelindikatoren verwendet, dann ist der neue besser als der alte. Wir hatten uns in unserem Beitrag auf Einzelindikatoren konzentriert, weil diese in international vergleichenden Umfragen nach wie vor eine bedeutsame Rolle spielen. Als pragmatischen Grund hatten wir angeführt, dass es manchmal schwierig sei, in einer Mehrthemenbefragung mit einer sehr begrenzten Anzahl von Fragen und einer großen Zahl von Forschern multiple Indikatoren durchzusetzen. Der Kommentar von Rost gibt uns jedoch Gelegenheit, anhand einer neueren Studie zum interpersonalen Vertrauen einige Zusatzprobleme bei der Verwendung multipler Indikatoren anzusprechen. Studien dieser Art sehen sich mit drei zentralen Herausforderungen konfrontiert: Erstens müssen sie zuverlässige Indikatoren entwickeln. Zweitens 1 Karoline Harzenetter hat uns beim Erstellen der Grafiken und Tabellen geholfen. Steffen Kühnel und Markus Quandt haben eine frühere Fassung kommentiert und eine Reihe von Anregungen gegeben. Wir danken ihnen allen für ihre Unterstützung. 2 Prof. Kazufumi Manabe, School of Sociology, Kwansei Gakuin University, 1-1-155 Uegahara, Nishinomiya, Hyogo 662, Japan, [email protected] ZA-Information 56 9 müssen diese Indikatoren den Erfordernissen einer äquivalenten Messung in allen Ländern genügen. Und drittens müssen die Indikatoren tatsächlich das messen, was sie nach Auffassung ihrer Urheber messen sollen, in unserem Falle also interpersonales Vertrauen. 1 Zuverlässige Messung und Modellanpassung Saris und Gallhofer (www.europeansocialsurvey.org) demonstrieren in einem methodisch ausgefeilten MTMM Experiment, dass bei Face-to-Face-Interviews die folgende 11-Punkte-Skala einer 7-Punkte-Skala überlegen ist: [Trust] Generally speaking, would you say that most people can be trusted, or that you can’t be too careful in dealing with people? Please tick the box that is closest to your opinion, where 0 means you can’t be too careful and 10 means that most people can be trusted. You can’t be too careful 0 1 2 Most people can be trusted 3 4 5 6 7 8 9 10 Das scheint zunächst dafür zu sprechen, die von uns favorisierte Skala durch eine 11-Punkte-Skala, bei der nur die beiden Pole inhaltlich bestimmt werden (endpointlabels), zu ersetzen. Solche Skalen stellen jedoch vergleichsweise hohe kognitive Ansprüche an Interviewer und Respondenten. Das ISSP hat sich hauptsächlich aus der Erwägung heraus, dass in einer Reihe von Mitgliedsländern schriftliche Umfragen3 durchgeführt werden und die kulturelle Vielfalt relativ groß ist, für die Beibehaltung seiner 4-Punkte-Skala ausgesprochen. Da der European Social Survey (ESS) mit dem einen Problem gar nicht und mit dem anderen in geringerem Maße konfroniert ist, hat man sich dort für die Verwendung der 11-Punkte-Skala entschieden. Saris und Gallhofer verfeinern aber nicht nur diese Skala, sie machen sich auch die Forderung zueigen, das Konzept des interpersonalen Vertrauens durch multiple Indikatoren zu erfassen. Sie beziehen daher zwei weitere Indikatoren in die Analyse ein: [Fair] Do you think that most people would try to take advantage of you if they got the chance, or would they try to be fair? Please tick one box. Most people would try to take advantage of me 0 1 2 3 4 5 Most people would try to be fair 6 7 3 Häufig als Drop-Off von allgemeinen Bevölkerungsumfragen. 8 9 10 10 ZA-Information 56 [Help] Would you say that most of the time people try to be helpful or that they are mostly looking out for themselves? Please tick one box. People mostly look out for themselves 0 1 2 3 4 People mostly try to be helpful 5 6 7 8 9 10 Alle drei Items sind im ersten Modul des ESS enthalten und können daher als multiple Indikatoren für eine – vorläufig als interpersonales Vertrauen bezeichnete – gemeinsame latente Variable verwendet werden. Wir wollen nicht nur untersuchen, wie hoch die drei Indikatoren in jedem Land auf dieser gemeinsamen Variablen laden, sondern zugleich die Korrelation zwischen dem interpersonalen und dem institutionellen Vertrauen in einer konfirmatorischen Faktorenanalyse mit LISREL schätzen. Zu diesem Zweck wird für alle Länder das in Abbildung 1 dargestellte Model spezifiziert. Wie man sieht, können wir im ESS auch das institutionelle Vertrauen durch zwei Indikatoren erfassen, da neben dem Vertrauen in verschiedene Institutionen auch das Vertrauen in Politiker mit einer 11-Punkte-Skala erfragt wurde. Da diese letztgenannte Variable mit dem Vertrauen in das Parlament relativ hoch korreliert, scheint die Annahme plausibel, dass beide Variablen zusammen das Vertrauen in die Kerninstitution der repräsentativen Demokratie erfassen. Wenn wir nachfolgend abkürzend von institutionellem Vertrauen sprechen, so ist immer dieses spezielle Vertrauen gemeint. Die in Tabelle 1a) berichteten Modelle für die einzelnen Länder4 haben alle die im Pfaddiagramm dargestellte Struktur. Sie unterscheiden sich allerdings in den Parameterschätzungen und in der Modellanpassung, wobei Grundlage der Schätzung jeweils die für das Land berechnete Varianz-Kovarianz-Matrix ist. Zum Zwecke der Parameteridentifikation haben wir die erste Ladung auf jedem Faktor mit 1 fest vorgegeben. Die geschätzten unstandardisierten Faktorladungen werden in der Anhangstabelle wiedergegeben. In Tabelle 1a) sind die Faktorenladungen und -korrelationen der vollstandardisierten Lösung aufgeführt, da diese im gegenwärtigen Kontext aussagekräftiger sind. Um die Zuordnung der Koeffizienten in Tabelle 1a) zu den Beziehungen zwischen den Variablen zu erleichtern, sind in Abbildung 1 die Schätzwerte aus der ersten Zeile von Tabelle 1a), also die Schätzungen für Belgien, eingetragen. 4 Im Falle von Deutschland und England sind zusätzlich Modelle für einzelne Landesteile ge- schätzt worden, weil diese Landesteile in vielen internationalen Untersuchungen als separate Einheiten behandelt werden. Das Modell für Nordirland hat allerdings wegen seiner kleinen Fallzahl nur begrenzte Aussagekraft. ZA-Information 56 Abbildung 1 11 Konfirmatorische Faktorenanalyse von interpersonalem und institutionellem Vertrauen Anmerkungen: Die rechteckigen Kästchen repräsentieren die Indikatoren, die ovalen die beiden Faktoren oder latenten Variablen. In der Grafik sind die Parameterschätzungen für Polen wiedergegeben (Tabelle 1, erste Zeile). Confparl: Vertrauen in das Parlament (11-Punkte-Skala; Indikator) Confpol: Vertrauen in Politiker (11-Punkte-Skala; Indikator) (Zur Bedeutung der übrigen Indikatoren vgl. den Text) IP-TRUST: Interpersonales Vertrauen (Faktor) INST_CON: Institutionelles Vertrauen (Faktor) Das erste von uns aufgeworfene Problem löst das von Saris und Gallhofer vorgeschlagene Messmodell mit Bravour: Nicht nur für Belgien sondern auch für alle anderen Länder schätzt LISREL erfreulich hohe Ladungen der Indikatoren auf den Faktoren. Alle standardisierten Ladungen überschreiten die Schwelle von 0,5, in den meisten Fällen sogar die von 0,7. Bei den Indikatoren des institutionellen Vertrauens unterschreitet keine einzige Ladung den Wert von 0,7. Es gibt in der nichtexperimentellen international vergleichenden Forschung nur wenig Messmodelle von dieser Qualität. 12 Tabelle ZA-Information 56 1a) Konfirmatorische Faktorenanalyse von interpersonalem und institutionellem Vertrauen. Standardisierte Ladungen auf den beiden latenten Variablen (LV) Land Trust Belgien Dänemark Deutschland - Ost - West Finnland Griechenland Irland Israel Italien Luxemburg Niederlande Norwegen Österreich Polen Portugal Schweden Schweiz Slowenien Spanien Tschechien Ungarn UK (England) 0,71 0,77 0,63 0,63 0,63 0,73 0,73 0,69 0,70 0,68 0,71 0,75 0,70 0,72 0,65 0,79 0,72 0,69 0,69 0,79 0,80 0,76 0,71 LV: IP_TRUST Fair Help 0,67 0,75 0,69 0,72 0,67 0,71 0,76 0,79 0,80 0,80 0,66 0,75 0,71 0,81 0,69 0,69 0,72 0,70 0,76 0,74 0,78 0,70 0,75 0,59 0,52 0,61 0,62 0,60 0,59 0,68 0,61 0,52 0,64 0,45 0,56 0,46 0,71 0,52 0,56 0,53 0,56 0,63 0,63 0,63 0,70 0,63 LV: INST_CON Parl Pol 0,79 0,79 0,79 0,83 0,77 0,82 0,75 0,81 0,74 0,78 0,76 0,75 0,82 0,81 0,74 0,70 0,80 0,73 0,84 0,75 0,83 0,77 0,84 0,87 0,89 0,84 0,82 0,85 0,87 0,88 0,83 0,86 0,81 0,87 0,92 0,81 0,79 0,80 0,86 0,88 0,87 0,76 0,80 0,83 0,82 0,87 r(IP_Trust, INST_CON) 0,54 0,39 0,45 0,41 0,48 0,55 0,31 0,35 0,27 0,41 0,49 0,54 0,45 0,33 0,40 0,40 0,53 0,48 0,46 0,39 0,47 0,46 0,46 Abkürzungen: LV: Latente Variable IP_Trust: Interpersonales Vertrauen INST_CON: Institutionelles Vertrauen (s. Text) r(IP_Trust, INST_CON): Korrelation zwischen interpersonalem und institutionellem Vertrauen Was die Korrelation zwischen sozialem und institutionellem Vertrauen anbelangt, so kommt die Messfehlerkorrektur (correction for attenuation) in vollem Umfang zum Tragen. Die in der letzten Spalte von Tabelle 1a) wiedergegebenen Korrelationen liegen immer weit über den Werten, die Jagodzinski und Manabe (2004) berechnet haben. Die niedrigste Korrelation schätzen wir mit 0,27 für Israel, die höchste mit 0,55 für Finnland. Im Durchschnitt erreichen die Korrelationen den beachtlichen Wert von 0,44. ZA-Information 56 Tabelle 13 1b) Konfirmatorische Faktorenanalyse von interpersonalem und institutionellem Vertrauen. Modellanpassung und Gruppenvergleich Land Belgien Dänemark Deutschland Ost West Finnland Griechenland Irland Israel Italien Luxemburg Niederlande Norwegen Österreich Polen Portugal Schweden Schweiz Slowenien Spanien Tschechien Ungarn UK (England) Global χ2 Df Nichtrestringiert χ2 P 19,00 2,62 (36,93) 3,84 37,26 18,86 9,21 7,17 13,03 5,39 5,91 36,67 15,57 16,48 4,40 15,85 24,86 24,10 7,21 12,63 0,66 10,07 17,99 308,78 88 0,001 0,620 0,000 0,430 0,000 0,001 0,056 0,130 0,011 0,250 0,210 0,000 0,004 0,002 0,350 0,003 0,000 0,000 0,120 0,013 0,960 0,039 0,001 Restringiert χ2 28,41 9,57 0 7,13 39,58 23,87 13,43 9,85 46,06 19,69 15,35 60,41 28,60 39,69 8,91 32,67 28,80 31,43 22,95 14,72 4,66 23,62 20,77 530,16 151 N 1742 1467 2841 1066 1775 1972 2430 1921 2344 1147 1235 2291 2022 2127 1951 1373 1931 1924 1425 1539 1254 1577 2007 Vergleicht man die Korrelationen zwischen den latenten Variablen mit jenen, die wir im letzten Aufsatz berichtet haben, so registriert man ein deutliches Gefälle. Dies verdeutlicht Abbildung 2, in der wir die Länder alphabetisch angeordnet haben. Die drei im Diagramm links von oben nach unten verlaufenden Linien geben die Korrelationen von Einzelindikatoren wieder: am niedrigsten fallen sie durchweg im European Values Survey (EVS, gestrichelte dünne Linie) aus. An zweiter Stelle folgen die Korrelationen im ISSP (durchgezogene Linie), die nur in einem einzigen Fall über den ESS-Indikatoren liegen (Österreich). Auch wenn man Vertrauen jeweils mit nur einem Indikator misst, schneiden die 11-Punkt-Skalen des ESS (dünne strichpunktierte Linie) am besten ab. Noch deutlicher wird der Unterschied, wenn man im multiplen Indikatorenmodell eine Messfehlerkorrektur durchführt (rechte strichpunktierte fette Linie). Der Abstand zwischen der rechten und den übrigen Linien ist mit Abstand am größten. 14 ZA-Information 56 Abbildung 2 Korrelationen zwischen interpersonalem und institutionellem Vertrauen in international vergleichenden Umfragen AU CZ DE-E DE-W DN ES GB HU IR IT NIRE EVS NL ISSP PL Land PO ESS SL SV 0.0 ESS_LSRL .1 .2 .3 .4 .5 .6 Was die Anpassung der überidentifizierten Modelle an die Daten anbelangt, so hängt viel davon ab, für welches Fitmaß man sich entscheidet. Wählt man den vergleichsweise harten χ2-Test (Tabelle 1b), Spalte 1), so passen die Modelle einiger Länder zwar sehr gut zu den Daten (neben Polen z.B. auch Dänemark; Ostdeutschland; Tschechische Republik), die von anderen Ländern wie den Niederlanden, der Schweiz oder Westdeutschland aber nur mäßig. 2 Bedeutungsäquivalenz Wenn die Indikatoren wirklich die gleiche latente Eigenschaft messen, dann sollten zumindest die unstandardisierten Ladungen der Indikatoren gleich sein. Diese Restriktion wurde den Modellen in Tabelle 1a) bzw. Tabelle 1b), Spalte 1 nicht auferlegt. Das wird aber in einem Gruppenvergleich möglich, wenn man die unstandardisierte Faktorenladungsmatrix in allen Ländern als invariant fixiert. Dabei müssen wir uns entscheiden, ob wir in der Bundesrepublik Deutschland ein Modell oder zwei getrennte Modelle für West- und Ostdeutschland zu Grunde legen. Der mäßige Fit des Gesamtmodells in Tabelle 1b) spricht für die zweite Alternative. ZA-Information 56 15 Führt man diese Restriktion ein, so ergeben sich die in der dritten Spalte von Tab. 1b) berichteten χ2-Werte für die einzelnen Länder. Sie addieren sich zu einem χ2Wert von 530,16. Die Gesamtzahl der Freiheitsgrade beträgt mit den Gleichheitsrestriktionen 151. Diese Information kann man nun verwenden, um die Hypothese der Bedeutungsgleichheit bzw. gleicher Faktorladungen zu testen. Addiert man die χ2-Werte in der ersten Spalte auf (unter Ausschluss des Modells für die Bundesrepublik Deutschland), so ergibt sich ein Gesamtwert von 308,78. Dieser Wert entspricht dem globalen χ2 eines Gruppenvergleichs, bei dem die Modelle für die einzelnen Länder unabhängig voneinander – d.h. ohne Gleichheitsrestriktionen – geschätzt werden. Die Gesamtzahl der Freiheitsgrade beträgt in diesem Fall 88. Durch einen Likelihood-Ratio-Test lässt sich nun überprüfen, ob durch Wegfall der Invarianzrestriktion eine signifikante Verbesserung eintritt. Nach einer bekannten Faustregel ist das bei mehr als sechs Freiheitsgraden mindestens auf dem 5%Signifikanzniveau der Fall, wenn der χ2-Wert mindestens doppelt so stark sinkt wie die Zahl der Freiheitsgrade. Die Differenz der beiden globalen χ2-Werte beträgt 221,38 (=530,16 - 308,78), die Differenz der Freiheitsgrade beträgt 63 (=151 - 88). Der Quotient beider Zahlen liegt bei ungefähr 3,51, mithin weit über zwei. Selbst wenn man das Signifikanzniveau bei 1% oder noch niedriger ansetzen würde, müssten wir die Hypothese invarianter Faktorenladungen verwerfen. Die Annahme der Bedeutungsgleichheit ist also mit den Daten nicht verträglich. Man muss allerdings hinzufügen, dass in der international vergleichenden Forschung kaum ein Modell dieses harte Kriterium der Bedeutungsgleichheit erfüllt. Daher geben sich Praktiker meist mit der sehr viel schwächeren Forderung zufrieden, dass die latenten Variablen „ungefähr“ das gleiche messen. Als Nachweis dienen oft explorative Faktorenanalysen, die ähnlich hohe Ladungen in allen untersuchten Ländern zeigen. Wenn man dieses schwächere Kriterium akzeptiert, dann schneidet das Messmodell von Saris und Gallhofer im relativen Vergleich sicher immer noch hervorragend ab. 3 Gültigkeit der Messung Bleibt zuletzt die Frage, ob die drei Indikatoren, wie wir tentativ angenommen hatten, tatsächlich interpersonales Vertrauen messen. Saris und Gallhofer sprechen zwar von sozialem Vertrauen, sie messen jedoch interpersonale Beziehungen, nämlich die Wahrnehmung von Eigenschaften generalisierter anderer Personen. Wer der Kohlbergschen Stadientheorie anhängt, mag argumentieren, dass interpersonales Vertrauen auf einer früheren Stufe der Entwicklung entsteht als ein Konzept der Fairness, das im zweiten Item angesprochen wird. Wer andere für fair hält, vertraut 16 ZA-Information 56 ihnen vielleicht auch, doch wer anderen vertraut, muss sie nicht unbedingt auch für fair halten. Und Hilfsbereitschaft wird zwar mit Vertrauenswürdigkeit korrelieren, dürfte aber doch eine völlig andere Eigenschaft sein. Über die drei Indikatoren wird also eher erfasst, ob man seine Mitmenschen positiv oder negativ sieht. Vertrauenswürdigkeit erscheint so nur als eine Komponente eines insgesamt optimistischen oder pessimistischen Menschenbildes. In der Tat waren die drei Items ursprünglich Bestandteil eines aus fünf Items bestehenden Index’, den Rosenberg (1956) als Misanthropieskala eingeführt hat – Misanthropie deshalb, weil hohe Indexwerte eine negative Wahrnehmung der Mitmenschen indizieren. Diese fünf Items5 sind in den amerikanischen GSS aufgenommen worden und einige haben von dort aus Eingang in viele nationale und internationale Surveys gefunden. Mit dem breiteren Konzept der Philanthropie/ Misanthropie wird aber das, was die Items tatsächlich messen, weit besser benannt als durch den Begriff des sozialen oder interpersonalen Vertrauens. So kann man argumentieren, dass Saris und Gallhofer vielleicht die Messung von Misanthropie im Rosenbergschen Sinne verbessert haben, nicht aber unbedingt die des interpersonalen oder sozialen Vertrauens. Zwingend ist diese Bewertung allerdings nicht. Um definitiv entscheiden zu können, müsste man klären, ob sich Philanthropie und interpersonales Vertrauen in ihren Ursachen oder Wirkungen voneinander unterscheiden oder nicht. Bestehen keine Unterschiede, dann sind die Konzepte gegeneinander austauschbar. Wenn es – was plausibler erscheint – Differenzen gibt, dann könnte man im Prinzip empirisch klären, ob das Modell von Saris und Gallhofer eher das eine erfasst oder das andere. Aber wo könnten diese Differenzen liegen? Entscheidet man auf Grund des Sprachgefühls, so ist Philanthropie eine noch generellere Eigenschaft als interpersonales Vertrauen. Auch in den generalisierteren Formen sind Vertrauen und Misstrauen immer noch an Verhaltenserwartungen geknüpft. Wer anderen Personen vertraut, der erwartet, dass sich diese vereinbarungs- bzw. normgemäß verhalten. Umgekehrt ist das Misstrauen umso größer, je weniger man an das normgemäße Verhalten der anderen glaubt. Bei der Misanthropie ist dieser Verhaltensbezug weniger stark ausgeprägt. Dementsprechend könnte ein Testfall sein, wie Personen auf Mitmenschen reagieren, die das in sie gesetzte Vertrauen wiederholt enttäuschen. Sind unsere Überlegungen zutreffend, so sollte das interpersonale Vertrauen davon tangiert werden, die Philanthropie dagegen nicht. Um dies aber zu überprüfen, ist eine weitere empirische Untersuchung erforderlich. Und so führt uns die Verwendung der multiplen Indikatoren manchmal nicht zu besseren Antworten, sondern zu neuen Problemen. Wir entnehmen den Ausführungen von Jürgen Rost, dass vergleichbare Probleme bei den relevanten Variablen der PISA-Studien offensichtlich schon 5 Sie hatten in der ursprünglichen Fassung jeweils nur zwei Ausprägungen. ZA-Information 56 17 gelöst worden sind. Wir warten deshalb sehr gespannt auf die Publikation der einschlägigen Methodenstudien. Literatur: Jagodzinski, Wolfgang und Kazufumi Manabe, 2004: How to Measure Interpersonal Trust? A Comparison of two Different Measures. In: ZA-Information 55: S. 85-98. Rosenberg, Morris, 1956: Misanthropy and Political Ideology. American Sociological Review, 21/1-6: S. 690-695. Rost, Jürgen, Messen wird immer einfacher! In diesem Heft, S. 6-7. Saris, Willem E. und Irmtraud Gallhofer (o. J.): Report on the MTMM Experiments in the Pilot Studies and Proposals for Round 1 of the ESS (www.europeansocialsurvey.org ESS DOCS - Methodology - Quality measurement of the questionnaire). 4 Anhang: Die unstandardisierten Faktorladungen LV: IP_TRUST Land Belgien Dänemark Deutschland - Ost - West Finnland Griechenland Irland Israel Italien Luxemburg Niederlande Norwegen Österreich Polen Portugal Schweden Schweiz Slowenien Spanien Tschechien Ungarn UK (England) Global LV: INST_CON Trust 1,00 1,00 Fair 0,88 0,87 Help 0,81 0,70 Parl 1,00 1,00 Pol 1,11 1,05 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,07 0,97 0,93 1,01 1,04 1,11 1,22 1,04 0,88 0,95 1,10 1,10 0,80 0,92 0,96 1,12 0,93 0,95 0,95 1,02 0,98 0,88 0,85 0,84 0,86 0,81 0,68 0,91 0,68 0,69 0,67 0,95 0,80 0,65 0,72 0,75 0,90 0,79 0,75 0,90 0,84 0,80 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 0,94 0,99 1,04 1,10 0,95 1,02 1,01 1,16 1,18 0,89 0,94 0,97 1,07 1,04 1,19 0,84 1,05 0,93 0,95 0,97 1,03 Anmerkungen: Zur Schätzung des Models wurden die unstandardisierten Ladungen von Trust auf dem ersten Faktor und von Parl (confidence in Parliament) mit eins fest vorgegeben (kursive Werte in der Tabelle). Aus insgesamt 15 Varianzen und Kovarianzen pro Land müssen dann drei Faktorenladungen, die Varianz- Kovarianzmatrix der beiden Faktoren (drei Parameter) und fünf Fehlervarianzen geschätzt werden. Das Modell für das einzelne Land hat daher 15-11=4 Freiheitsgrade. Für alle Länder zusammen ergeben sich ohne Gleichheitsrestriktionen 22*4=88 Freiheitsgrade. Mit der Invarianzrestriktion gewinnt man zusätzliche 21*3=63 Freiheitsgrade, weil für alle Länder gleiche Faktorenladungen geschätzt werden. Diese Schätzwerte sind in der letzten Zeile (Global) wiedergegeben. 18 ZA-Information 56 Determinanten und Konsequenzen von Nonresponse in egozentrierten Netzwerkstudien1 von Volker Stocké 2 Zusammenfassung Ein Hauptziel egozentrierter Netzwerkstudien besteht in der Erfassung der Einbettung von Akteuren in bestimmte Bezugsgruppen und der Analyse der hiervon ausgehenden Einflüsse. Die Realisierung dieses Ziels macht eine möglichst vollständige Erfassung der für diese Einflüsse bedeutsamen Merkmale der Bezugspersonen (Alteri) im sozialen Kontext der Zielpersonen (Ego) notwendig. Die Grundlage hierfür sind entweder die (Proxy-)Angaben von Ego über die Alteri oder die Angaben der Bezugspersonen selbst. Inwieweit die Charakteristiken der Bezugsgruppe vollständig erfasst werden können, hängt bei der ersten Vorgehensweise von der Fähigkeit und Bereitschaft der Zielpersonen zur Beantwortung der Proxy-Fragen ab. Dagegen setzt die Verwendung der von den Bezugspersonen selbstberichteten Merkmale sowohl die Bereitschaft von Ego zur Herausgabe von Kontaktinformationen wie auch die Befragungsbereitschaft der Alteri voraus. Der vorliegende Beitrag untersucht mit einer Stichprobe von Grundschuleltern jene Bestimmungsfaktoren, die sich auf den Erfolg beider Operationalisierungen von Bezugsgruppeneinflüssen auswirken. Die analysierten Faktoren sind die soziodemografischen Merkmale der Zielpersonen sowie die der Bezugspersonen, die Stärke der Beziehung zwischen beiden Personengruppen und Indikatoren für die generelle Antwortbereitschaft. Nach den Ergebnissen unserer Untersuchung sind weder die Ausfälle der ProxyAngaben von Ego noch die der Selbstberichte der Alteri das Ergebnis eines Zufallsprozesses. Vielmehr variiert die Ausfallwahrscheinlichkeit signifikant nach 1 Ich danke ganz herzlich Hartmut Esser, Stephan Ganter und Angela Jäger sowie den Gutach- tern dieser Zeitschrift für hilfreiche Kommentare und Anregungen. Christian Hunkler und Diana Schirowski waren eine große Unterstützung bei der Erstellung des Manuskriptes. Der Beitrag wurde durch finanzielle Förderung der Deutschen Forschungsgemeinschaft an den Sonderforschungsbereich 504 der Universität Mannheim ermöglicht. 2 Dr. Volker Stocké ist Hochschulassistent am Sonderforschungsbereich 504 „Rationalitätskon- zepte, Entscheidungsverhalten und ökonomische Modellierung“ der Universität Mannheim, L13, 15; D-68131 Mannheim. E-Mail: [email protected]. ZA-Information 56 19 Merkmalen von Ego wie auch der der Alteri und unterscheidet sich nach der Beziehungsstärke genauso wie nach der allgemeinen Disposition der Befragten zu Nonresponse. Die Konsequenz ist erstens, dass sich die Größe der für die Analyse von Bezugsgruppeneffekten effektiv verfügbaren Netzwerke systematisch nach den Charakteristiken der Zielpersonen unterscheidet. Es hat sich zweitens gezeigt, dass die Zusammensetzung der verfügbaren Netzpersonenstichprobe einer im Vergleich zur Grundgesamtheit systematischen Selektivität unterliegt. Abstract It is the main aim of egocentric network studies to include the embedding of actors into certain reference groups and to analyse the resulting effects. The realisation of this aim makes it necessary to cover as completely as possible the characteristics of the relevant reference persons (alters) within the social context of the target persons (ego), which are important for these influences. The basis for this are either proxy responses given by ego about the alters’ characteristics or self-reports obtained from the reference persons themselves. To what extent one can measure the complete reference group’s characteristics depends in the first approach on the ability and willingness of the ego to answer proxy questions about the alters. In contrast, the use of the reference persons’ self-reported characteristics require the ego’s willingness to provide contact information as well as the alters’ willingness to take part in the interview. The present article examines, by means of a sample of elementary school parents, the factors which determine the success of both types of operationalisations of reference group influences. Analysed factors are the egos’ and alters’ socio-demographic characteristics, the strength of the relationship between both groups as well as indicators for the general willingness to answer questions. According to our results, neither the failure to obtain proxy information from the ego nor the impossibility to acquire self reports of the alters are the result of a random process. In fact, the dropout probability varies significantly according to the target and reference persons’ characteristics, and differs according to the strength of their ties as well as to the respondents’ overall disposition toward nonresponse. The first consequence is that the available size for the analysis of reference group effects of the social networks differs according to the characteristics of the ego. Secondly, the composition of the available sample of network persons has been found to be subject to a systematic selectivity in comparison to the population of alters. 20 1 ZA-Information 56 Einleitung Bei Verwendung netzwerkanalytischer Untersuchungsdesigns können systematisch die vom sozialen Kontext der Akteure ausgehenden Bezugsgruppeneinflüsse bei soziologischen Erklärungen berücksichtigt werden. Entsprechend werden in jüngster Zeit auch zunehmend empirische Studien mit einem entsprechenden Forschungsdesign durchgeführt (vgl. Ganter 2003; Huckfeldt et al. 2004; Lubbers 2003; Schenk 1995; Völker und Flap 2001). Die Merkmale des sozialen Kontextes der Akteure kann hierbei durch zwei unterschiedliche Vorgehensweisen erfasst werden. So können erstens für eine Stichprobe von Befragten deren Merkmale, die zwischen allen diesen Befragten bestehenden Beziehungen und damit das komplette Netzwerk erfasst werden (van Duijn et al. 2003). Die Erfassung von egozentrierten Netzwerken ist die zweite und wegen des geringeren Aufwandes verbreitetere Untersuchungsform (Diaz-Bone 1997; van der Poel 1993). Hierbei werden zuerst für jede Zielperson (Ego) einer Stichprobe die relevanten Bezugspersonen (Alteri) mittels eines Netzwerkgenerators ausgewählt. Im zweiten Schritt werden dann die für die jeweilige Fragestellung relevanten Merkmale dieser Alteri erfasst. Da bei diesem Untersuchungsdesign die Egonetze als unabhängige Untersuchungseinheiten in die Analyse einbezogen werden, können egozentrierte Netzwerkstudien mit Zufallsstichproben und im Rahmen normaler Bevölkerungsumfragen durchgeführt werden. Bei der Operationalisierung von Bezugsgruppeneffekten können im Rahmen egozentrierter Netzwerkstudien zwei unterschiedliche Datenerhebungsmethoden herangezogen werden. So wurde einerseits argumentiert, dass sich die Bezugsgruppe alleine durch die von Ego bei dieser Gruppe subjektiv wahrgenommenen Merkmale auf die Einstellung und das Handeln auswirken (Jansen 1999: 79f.). In diesem Fall müssen diese Wahrnehmungen mithilfe von Proxy-Fragen bei Ego erfasst werden. Es kann andererseits aber auch angenommen werden, dass Bezugsgruppeneinflüsse auch durch Fehlwahrnehmungen des sozialen Kontextes vermittelt sind und somit den tatsächlichen Eigenschaften der Bezugspersonen eine eigenständige Bedeutung zukommt (Koßmann 1996). Daher und weil andere Fragestellungen, etwa die nach dem Ausmaß und der Wirkung von Unterstützungsbeziehungen in sozialen Netzwerken, die Kenntnis der „objektiven“ Charakteristiken der Bezugsumwelt voraussetzen, wird in egozentrierten Netzwerkstudien oft auch eine Nachbefragung der Netzpersonen angestrebt. Der Erfolg bei der Erfassung von Proxy-Angaben, also von Angaben von Ego über die Merkmale der Alteri, hängt in kritischer Weise davon ab, dass die Zielpersonen zur Beantwortung dieser Fragen über ihre Bezugspersonen motiviert und in der Lage sind. Da es sich bei Proxy-Fragen allerdings um schwierige und teilweise auch ZA-Information 56 21 heikle Fragen handelt, muss mit einem überdurchschnittlich hohen Ausmaß an Item-Nonresponse gerechnet werden (für diese Unterscheidung der Ursachen von Nonresponse vgl. Shoemaker et al. 2002). Die wenigen in der Literatur verfügbaren Angaben zeigen, dass bis zu 37,0 Prozent der Befragten keine Angaben über ihre Netzpersonen machen konnten oder wollten (Pappi und Wolf 1984). Dabei ist für die Aussagekraft der mit Proxy-Daten erzielten Ergebnisse von großer Bedeutung, ob fehlende Werte zufällig verteilt oder mit bestimmten Merkmalen von Ego korreliert sind. Item-Nonresponse führt in jedem Fall zu einer Reduktion der für die Analyse von Bezugsgruppeneinflüssen verfügbaren Größe der Egonetzwerke. Unterscheidet sich aber das Ausmaß der fehlenden Werte nach soziodemografischen Charakteristiken der Befragten, so muss mit einer nach diesen Merkmalen systematischen Verzerrung der Netzgrößen gerechnet werden. Ob dies der Fall ist und mit welcher Selektivität hierbei gerechnet werden muss, wurde bisher empirisch nicht überprüft. Mit welcher Wahrscheinlichkeit in egozentrierten Netzwerkstudien erfolgreich Nachbefragungen der Bezugspersonen durchgeführt werden können, ergibt sich als Ergebnis eines zweistufigen Prozesses. So müssen in einem ersten Schritt die für eine Befragung der Alteri notwendigen Kontaktinformationen bei Ego erhoben werden. Da es sich hierbei um persönliche Daten der Netzpersonen handelt, besteht die Gefahr, dass Ego solche Angaben als Eingriff in die Privatsphäre der Bezugspersonen ansieht. Aus diesem Grund muss hierbei, wie bei anderen sensiblen Fragen, mit einem substantiellen Anteil an Antwortverweigerungen gerechnet werden. In den wenigen deutschen Studien, in denen eine Nachbefragung von Netzpersonen durchgeführt wurde, konnten für 23,0 bis 54,2 Prozent der anfänglich von den Befragten genannten Alteri keine Kontaktinformationen erfasst werden (Jäger 2004: 57; Pappi und Wolf 1984). Auch hier besteht die Gefahr, dass sich das Ausmaß der dadurch bewirkten Ausfälle systematisch nach Merkmalen von Ego und denen der Alteri unterscheidet. Diese Vermutung wurde in der vom Zentrum für Umfragen, Methoden und Analysen (ZUMA) durchgeführten egozentrierten Netzwerkstudie für die Bildung, die Wohnortgröße und den Familienstand von Ego bestätigt (Schenk et al. 1992). Dagegen liegen keine Ergebnisse darüber vor, ob sich die Neigung der Befragten zur Weitergabe der Kontaktinformation ihrer Netzpersonen auch nach deren Eigenschaften unterscheidet. Die Bereitschaft der kontaktierbaren Alteri zur Interviewteilnahme ist die zweite Vorbedingung für eine erfolgreiche Nachbefragung von Netzpersonen. Da die Interviewer als Grund der Befragung die Nennung der Zielperson durch Ego angeben können und damit quasi mit einer Empfehlung durch eine persönlich bekannte Person ausgestattet sind, kann von einer überdurchschnittlich hohen Teilnahmebereit- 22 ZA-Information 56 schaft der Alteri ausgegangen werden. Erfahrungen bei Nachbefragungen in anderen egozentrierten Netzwerkstudien haben gezeigt, dass mit einem Anteil zwischen 56,0 und 62,0 Prozent der Netzpersonen mit Kontaktinformationen Interviews realisiert werden konnten (Jäger 2004: 61; Schenk et al. 1992). Trotz der relativ hohen Ausschöpfungsquoten besteht jedoch auch hier das Risiko, dass sich a) die Teilnahmebereitschaft der Alteri nach Merkmalen von Ego unterscheidet, und dass b) Netzpersonen mit bestimmten Attributen überproportional aus der Stichprobe ausscheiden. Darüber, ob und durch welche Charakteristiken vermittelt sich die mangelnde Teilnahmebereitschaft von Netzpersonen in einer Stichprobenverzerrung niederschlägt, sind derzeit keine Untersuchungsergebnisse verfügbar. Wegen des geschilderten zweistufigen Ausfallprozesses muss bei der Nachbefragung von Netzpersonen insgesamt mit einer relativ geringen Ausschöpfung gerechnet werden. So hat sich im Rahmen des am Mannheimer Zentrum für Europäische Sozialforschung (MZES) durchgeführten Forschungsprojektes „Ethnische Grenzziehung und ethnische Konflikte“ gezeigt, dass nur 25,6 Prozent der im Interview mit Ego identifizierten Bezugspersonen letztendlich erfolgreich befragt werden konnten (Jäger 2004). Im „Cross-National Election Study Project“ (CNEP) lag dieser Anteil in Ostdeutschland bei 14,7 und in Westdeutschland sogar nur bei 8,2 Prozent der Ausgangsstichprobe (Schmitt-Beck und Koßmann 1994). Auch hier stellt sich die Frage nach der insgesamt resultierenden Selektivität der Netzpersonenstichprobe und der damit verbundenen Generalisierbarkeit der mit den Daten gefundenen Untersuchungsergebnisse. Abgesehen von der Studie von Laumann (1969) sind uns hierzu keine Untersuchungen bekannt. 2 Theoretischer Rahmen Befragte beantworten Fragen mit „weiß nicht“, wenn diese einen bestimmten Schwierigkeitsgrad überschreiten und verweigern die Antwort, wenn sie eine Frage als zu sensibel erachten (Shoemaker et al. 2002). Dabei ist die Schwierigkeit von Fragen eine Funktion des kognitiven Aufwandes der für ihr Verständnis, den Gedächtnisabruf antwortrelevanter Informationen, die Formulierung einer Antwort und die Passung dieser Antwort in die Antwortvorgaben notwendig ist (Tourangeau und Rasinski 1988). Proxy-Fragen sind, im Vergleich zu Fragen über die eigene Person, überdurchschnittlich schwierig, weil sie auf Merkmale anderer Personen zielen, die der befragten Person möglicherweise unzureichend oder im Extremfall nicht bekannt sind. Es kann davon ausgegangen werden, dass die Schwierigkeit von Proxy-Fragen mit abnehmender „Sichtbarkeit“ der abgefragten Merkmale zunimmt. Außerdem kann angenommen werden, dass Fragen über Bezugspersonen, zu denen ZA-Information 56 23 Ego eine weniger starke Beziehungen unterhält, durch einen höheren Schwierigkeitsgrad gekennzeichnet sind: „Weak ties“ sind durch eine geringere Interaktionshäufigkeit und damit durch weniger Gelegenheit zur Informationsaufnahme gekennzeichnet (Marsden 1990). Demnach wäre bei Proxy-Fragen über weniger „sichtbare“ innere Zustände von Netzpersonen, wie etwa Einstellungen oder Überzeugungen, und bei solchen über Personen, zu denen eine weniger intensive Beziehung besteht, mit mehr „weiß nicht“-Angaben zu rechnen, verglichen mit Fragen über äußere Charakteristiken und nahe stehende Alteri. Fragen sind sensibel, wenn deren Beantwortung unabhängig vom Inhalt der Antwort durch eine befragte Person als unangenehm erlebt wird. Proxy-Fragen sind daher sensibel, weil Angaben über persönliche Merkmale der Bezugspersonen durch die befragte Person als unerlaubter Eingriff in deren Privatsphäre angesehen werden können (Schenk et al. 1992). Dabei kann angenommen werden, dass dies umso stärker der Fall ist, wenn das Merkmal weniger „sichtbar“ ist und die Information somit mehr der Privatsphäre zugehörig angesehen wird. Wegen der hohen Sensibilisierung der Öffentlichkeit für Belange des Datenschutzes ist die Frage nach den Kontaktinformationen der Netzperson besonders sensibel. Hinzu kommt, dass hierbei das erklärte Ziel einer späteren Kontaktierung und Befragung der betreffenden Personen besteht. Demnach muss Ego davon ausgehen, dass die Bezugspersonen mit Sicherheit Kenntnis über die Verletzung ihrer Privatheitsrechte erlangen werden. Die hiermit verbundene Möglichkeit einer Störung der Beziehung zu den Bezugspersonen verringert die Bereitschaft einer Herausgabe von Kontaktinformationen. Ein weiteres Argument kann die Annahme von Ego sein, dass eine Interviewteilnahme für bestimmte Alteri eine besondere Belastung darstellen würde, die es zu vermeiden gilt. Dies ist beispielsweise umso wahrscheinlicher, wenn Ego bei Alter von einer besonderen Zeitknappheit oder einem mangelnden Interesse am Befragungsthema ausgeht. Dagegen kann argumentiert werden, dass die Bereitschaft zur Weitergabe von Kontaktinformation mit steigender Beziehungsstärke zunimmt: Bei nahe stehenden Personen kann Ego eher darauf vertrauen, dass eine Preisgabe der Kontaktinformationen keine negative Reaktion der Bezugsperson nach sich zieht (Schenk et al. 1992). Die Beantwortung schwerer und sensibler Fragen ist eine hohe Belastung von Umfrageteilnehmern und stellt hohe Anforderungen an deren Kooperationsbereitschaft. Es kann angenommen werden, dass sich diese Kooperationsbereitschaft und die Wahrscheinlichkeit einer damit verbundenen Einnahme einer kooperativen Befragtenrolle zwischen den Befragten unterscheidet. Demnach wäre zu erwarten, dass Umfrageteilnehmer in unterschiedlichem und situational invariantem Ausmaß zur Unterstützung von Umfragen durch möglichst vollständige Antworten motiviert 24 ZA-Information 56 sind (Stocké 2005). Demnach könnte vermutet werden, dass die generelle Neigung der Befragten zu „weiß nicht“-Angaben und Antwortverweigerungen das Ausmaß von Nonresponse bei Proxy-Fragen sowie die Verweigerung einer Bereitstellung von Kontaktinformationen erklärt. Eine wichtige Determinante für die Bereitschaft zur Teilnahme an Umfragen ist die Erwartung, dadurch einen positiven Beitrag zur Realisierung wertgeschätzter Ziele leisten zu können (Esser 1986). Solche Ziele können beispielsweise darin bestehen, eine Umfrage durch eine anerkannte Sponsorenorganisation zu unterstützen, ein als legitim angesehenes Umfrageziel zu fördern, oder einfach dem Interviewer gegenüber hilfsbereit zu sein. Ein weiterer Teilnahmegrund ist das Interesse am Befragungsthema und die persönliche Bedeutsamkeit dieses Themas für die befragte Person (Schnell 1997: 181ff.). Entsprechend hat es sich als für die Befragungsbereitschaft förderlich herausgestellt, wenn die Befragten einen Bezug zwischen dem Thema einer Umfrage und ihrer eigenen Lebenssituation wahrnehmen (Loosveldt et al. 1998). Auch die bei einer Interviewteilnahme erwarteten Belastungen sind für die Teilnahmebereitschaft bedeutsam. So führt etwa die mit einer steigenden Interviewlänge verbundene Zunahme der Zeitkosten zu einer Reduktion der Befragungsbereitschaft (Groves et al. 1999). Die Opportunitätskosten einer Umfrageteilnahme steigen auch dann an, wenn die einer Person verfügbare Zeit durch zusätzliche Pflichten, etwa bei Erwerbstätigkeit, eingeschränkt ist. 3 Forschungsstand 3.1 Ausmaß und Determinanten des Nonresponse bei Proxy-Fragen Über das Ausmaß und insbesondere die Determinanten des Item-Nonresponse bei Proxy-Fragen ist wenig bekannt. In einer Untersuchung von Laumann (1969) mit den Daten der „Detroit Area Study“3 wurde eine Zufallsstichprobe der Bewohner des Ballungsraums von Detroit über verschiedene Merkmale ihrer Freunde befragt. Diese Merkmale waren das Alter, der Beruf und die Bildung der Alteri sowie deren Parteipräferenz und welcher ethnischen Gruppe sich die Alteri zugehörig fühlen. Es hat sich gezeigt, dass bei der Frage über das Alter der Bezugspersonen niemand, aber bei der über deren gefühlte Zugehörigkeit zu einer ethnischen Gruppe 15,2 Prozent der Hauptbefragten angegeben haben, die Antwort nicht zu wissen. In der ZUMA-Netzwerkstudie haben sich ebenfalls sehr unterschiedlich hohe Nonresponse- 3 Die Daten dieser Studie sind im Zentralarchiv unter der ZA-Studien-Nr. 0533 archiviert. ZA-Information 56 25 Raten gezeigt. Hier wurden in einer lokalen Zufallsstichprobe die Bezugspersonen von Ego mit dem Namensgenerator von Burt (1984) sowie dem von Fischer (1982) ausgewählt. Bei der Befragung der Zielpersonen über verschiedene Merkmale der Alteri lag der Anteil der unbeantworteten Fragen zwischen 1,6 Prozent beim Geschlecht der Bezugspersonen und 30,1 Prozent bei deren Parteipräferenz (Pfenning et al. 1991). Weitere Ergebnisse liegen aus Studien vor, die untersucht haben, ob die ProxyAngaben von Befragten über die Merkmale nahe stehender Personen als Substitut für deren Selbstberichte herangezogen werden können. So wurde in einer britischen Studie eine Haushaltsstichprobe mit zwei durch Partnerschaft oder Verwandtschaft verbundenen Haushaltsmitgliedern herangezogen. Eine der beiden Personen wurde über insgesamt 47 Merkmale des jeweils anderen Haushaltsmitgliedes befragt (Martin und Butcher 1982). Es hat sich herausgestellt, dass bei den Fragen über den Erwerbsstatus der nahe stehenden Person, über die Art des von ihr für die Fahrt zur Arbeit verwendeten Verkehrsmittels und die Zufriedenheit mit der gemeinsamen Wohnung keiner der Proxy-Befragten mit „weiß nicht“ geantwortet hat. Das höchste Ausmaß an Nonresponse wurde bei den Fragen über das Einkommen der anderen Person (43 Prozent), die Anzahl der von ihm oder ihr in der vergangenen Woche gearbeiteten Stunden (9 Prozent) und die Zufriedenheit der anderen Person mit öffentlichen Verkehrsmitteln (8 Prozent) beobachtet. Ähnliche Ergebnisse finden sich in einer Studie mit Befragten des „British Labor Force Survey“, die über verschiedene Merkmale von Mitgliedern des gleichen Haushaltes befragt wurden (Dawe und Knight 1997). Auch hier hat sich das Ausmaß des Nonresponse stark nach dem Inhalt der Fragen unterschieden. So hat bei den Fragen über das Lebensalter, den Familien- und den Erwerbsstatus keine der befragten Personen die Antwort offen gelassen. Als schwieriger oder sensibler haben sich die Proxy-Fragen über das Alter, mit dem die Ausbildung abgeschlossen wurde (6 Prozent), und vor allem die über das Einkommen der anderen Person (29 Prozent) erwiesen. Uns sind keine Studien über die Bestimmungsfaktoren des Item-Nonresponse speziell bei Proxy-Fragen bekannt. Untersucht wurden allerdings die soziodemografischen Korrelate des Nonresponse bei Fragen über Merkmale der befragten Person selbst. So wurde in einer frühen Studie aus diesem Forschungsbereich festgestellt, dass Frauen sowie ältere und weniger gebildete Befragte, jeweils verglichen mit der Komplementärgruppe, mit größerer Wahrscheinlichkeit Fragen unbeantwortet lassen (Ferber 1966). Diese Ergebnisse mit einem Nonresponse-Index aus Antwortverweigerungen und „weiß nicht“-Angaben konnten mit Daten des “Survey of Consumer Attitudes“ bestätigt werden (Singer et al. 2000). Bei Fragen über den Ethnozentrismus belgischer Befragungsteilnehmer hat sich speziell für „weiß nicht“- 26 ZA-Information 56 Angaben gezeigt, dass diese Form von Nonresponse ebenfalls bei Frauen, älteren sowie weniger gebildeten und bei weniger wohlhabenden Befragten wahrscheinlicher ist (Pickery und Loosveldt 1998). Eine andere Untersuchung mit Daten der Umfrage „Cultural Shifts in Flanderns: Survey 2000” hat die Korrelate unterschiedlicher Formen von Nonresponse detailliert untersucht (Pickery und Loosveldt 2004). Es hat sich gezeigt, dass die Wahrscheinlichkeit die Einkommensfrage unbeantwortet zu lassen, mit zunehmendem Alter sowie mit steigender Bildung zurückgeht und für Männer niedriger liegt als für Frauen. Das gleiche Ergebnis lässt sich auch für die Wahrscheinlichkeit von „weiß nicht“-Antworten feststellen. Diese Form von Item-Nonresponse nimmt allerdings mit dem Alter zu. Es liegen empirische Hinweise dafür vor, dass das Ausmaß von Nonresponse mit dem Schwierigkeitsgrad der Fragen ansteigt. So nimmt die Wahrscheinlichkeit, mit der eine Frage unbeantwortet bleibt, dann zu, wenn eine Antwort mehr Nachdenken erfordert und die Frage daher von den Befragten als schwierig eingeschätzt wurde (Dickinson und Kirzner 1985). Auch der mit der Verwendung von elf- statt fünfstufigen Antwortskalen verbundene Anstieg der kognitiven Anforderungen bei der Beantwortung einer Frage hat sich als Nonresponse verstärkend ausgewirkt (Leigh und Martin jr. 1987). Weitere und direktere Evidenz hat sich in einer Untersuchung gezeigt, in der Experten die Schwierigkeit unterschiedlicher Fragen eingeschätzt und diese Urteile mit dem Prozentsatz der beobachteten „weiß nicht“-Angaben in Beziehung gesetzt hat. Der Zusammenhang war positiv und statistisch signifikant. Das gleiche Ergebnis hat sich bei der eingeschätzten Sensibilität der Fragen und der Wahrscheinlichkeit von Antwortverweigerungen gezeigt (Shoemaker et al. 2002). Empirische Ergebnisse belegen auch eine positive Korrelation zwischen unterschiedlichen Formen des Nonresponse. So wurde mit Daten der longitudinalen „Belgian General Election Study“ festgestellt, dass die Wahrscheinlichkeit, mit der Befragte die Einkommensfrage und andere Fragen in der ersten Panelwelle nicht beantwortet hatten, signifikant die Wahrscheinlichkeit einer Teilnahme an der zweiten Befragungswelle vorhersagt (Loosveldt et al. 2002). In der „Cultural Shifts in Flanders“-Umfrage wurde gezeigt, dass der Anteil der „weiß nicht“-Angaben signifikant mit dem Prozentsatz der Antwortverweigerungen ansteigt (Pickery und Loosveldt 2004). Diese Ergebnisse können als Beleg für die Existenz einer generellen Disposition von Befragten zu unterschiedlichen Formen von Nonresponse angesehen werden. ZA-Information 56 3.2 27 Ausmaß und Determinanten der Bereitstellung von Kontaktinformationen über Bezugspersonen Der Anteil der Alteri, für den erfolgreich Kontaktinformationen zur Durchführung einer Nachbefragung erhoben werden konnte, hat sich als sehr unterschiedlich erwiesen. So hatten die Befragten in der „Detroit Area Study“ drei ihrer Freunde genannt, deren Merkmale mit Proxy-Fragen erfasst wurden. Am Ende der Telefoninterviews wurden die Hauptbefragten gebeten, die Kontaktinformationen für eine zufällig ausgewählte Bezugsperson bereitzustellen. Die Begründung war, dass beabsichtigt sei, mit dieser Person ein 6-7-minütiges Interview durchzuführen. Es hat sich gezeigt, dass nur 3,5 Prozent der Befragten nicht zur Weitergabe der Telefonnummer der betreffenden Netzperson bereit waren (Laumann 1969). In der ZUMANetzwerkstudie lag die Verweigerungsrate dagegen deutlich höher. In dieser Studie konnten die Befragten bis zu zehn Alteri nennen, für die sie am Ende der Befragung um die Adressen gebeten wurden. Hier haben 54 Prozent der Befragten nicht einmal für eine ihrer Bezugspersonen die Adresse angegeben (Schenk et al. 1992). In der MZES-Netzwerkstudie wurden die egozentrierten Netzwerke von Befragten mehrerer lokaler Zufallsstichproben erfasst und die Befragten gebeten, für bis zu fünf der genannten Alteri die Telefonnummern für eine Nachbefragung zu nennen. In dieser Studie haben die Befragten diese Bitte bei 54,2 Prozent aller Netzpersonen abgeschlagen (Jäger 2004: 57). Der von den Hauptbefragten mit 30,5 Prozent am häufigsten genannte Verweigerungsgrund war, dass den Bezugspersonen eine Weitergabe ihrer Kontaktinformation nicht recht sein könnte. Mit 16,8 Prozent am zweithäufigsten wurden Bedenken hinsichtlich des Datenschutzes genannt. Mit den Daten der ZUMA-Netzwerkstudie wurde untersucht, welche Merkmale der Hauptbefragten mit deren Bereitschaft zur Weitergabe von Kontaktinformationen für ihre Bezugspersonen assoziiert sind. Bivariate Analysen haben gezeigt, dass dies für die Bildung, den Familienstand und die Wohnortgröße der Zielpersonen der Fall ist: Besser gebildete und verheiratete Personen sowie solche, die in einem kleineren Ort leben, waren eher zur Weitergabe der Kontaktinformationen bereit (Schenk et al. 1992). Da für Befragte mit diesen Merkmalen, vorbehaltlich der Teilnahmebereitschaft der Alteri, mehr Netzpersonen befragt werden können, führt schon die selektive Bereitschaft von Ego zur Nennung von Kontaktinformationen zu einer Verzerrung der für die Analyse von Bezugsgruppeneinflüssen verfügbaren Netzgrößen. In welchem Umfang dies der Fall war und welchen zusätzlichen Effekt eine möglicherweise selektive Teilnahmeentscheidung der Alteri hatte, wurde in dieser Untersuchung nicht analysiert. 28 3.3 ZA-Information 56 Ausmaß und Determinanten der Teilnahmebereitschaft von Netzpersonen In einer U.S.-amerikanischen Studie wurden die Proxy-Angaben von Befragten einer lokalen Quotenstichprobe der Bewohner von Toledo (Ohio) über die Merkmale von bis zu drei ihrer Netzpersonen erfasst (Crandall 1976). Für die ausgewählten Bezugspersonen konnten in 93 Prozent der Fälle Kontaktinformationen erfasst und mit 84 Prozent dieser Teilstichprobe erfolgreich Befragungen durchgeführt werden. Die kumulative Ausschöpfungsrate lag entsprechend bei einem sehr hohen Wert von 78,1 Prozent. In der „Detroit Area Study“ konnte mit 59,0 Prozent der Bezugspersonen, für die Kontaktinformationen verfügbar waren, eine Nachbefragung durchgeführt werden. Unter Einbezug der Fälle, bei denen die Befragten einer Weitergabe der Kontaktinformationen nicht zugestimmt hatten, war es somit möglich, mit insgesamt 56,9 Prozent der anfänglich für ein Interview ausgewählten Netzpersonen ein Follow-up-Interview durchzuführen (Laumann 1969). Die von Ego bei den Proxy-Fragen berichteten Merkmale der erfolgreich befragten Alteri und die der Netzpersonen, mit denen aus verschiedenen Gründen kein Interview durchgeführt werden konnte, haben sich signifikant unterschieden. Demnach haben Netzpersonen, die nicht befragt werden konnten, einen geringeren beruflichen Status sowie weniger Bildung und waren mit höherer Wahrscheinlichkeit protestantisch und Arbeiter. Als Konsequenz sind Mitglieder der Bezugsgruppe von Ego mit diesen Merkmalen in der Stichprobe der befragten Alteri unterrepräsentiert. Im Vergleich zu den frühen amerikanischen Untersuchungen hat sich die Nachbefragung von Bezugspersonen in deutschen Netzwerkstudien als schwieriger erwiesen. So waren in der erst jüngst durchgeführten MZES-Netzwerkstudie 56,0 Prozent der Alteri, für die Kontaktinformation vorlagen, zu einer telefonischen Nachbefragung bereit (Jäger 2004: 61). Von den anfänglich für eine Befragung ausgewählten Bezugspersonen konnten letztendlich 25,6 Prozent erfolgreich befragt werden. 4 Empirische Untersuchung 4.1 Stichprobe der Hauptbefragten Die bei der folgenden Untersuchung verwendeten Daten stammen aus einer im Rahmen des Forschungsprojektes „Bildungsaspirationen, Bezugsgruppen und Bildungsentscheidungen“ der Universität Mannheim durchgeführten Befragung von Grundschuleltern. Grundgesamtheit der lokal definierten Stichprobe waren alle Familien, die im Schuljahr 2002/2003 Kinder in der 2. Klassenstufe einer Grund- ZA-Information 56 29 schule hatten und ihren Wohnsitz in den kreisfreien Städten Ludwigshafen, Frankenthal und Speyer oder im Landkreis Rhein-Pfalz hatten. Nicht in die Stichprobe einbezogen wurden Kinder, deren Elternteile beide nicht in Deutschland geboren waren. In der ersten Stufe der Stichprobenziehung wurden nach dem Zufallsprinzip 52 Grundschulen aus allen im Untersuchungsgebiet existierenden Schulen ausgewählt. Von diesen haben 48 Schulen und damit 92,3 Prozent an der Studie teilgenommen. In diesen waren insgesamt 2.186 Kinder der Grundgesamtheit eingeschult. Es konnte mit 994 und damit 45,5 Prozent der in den teilnehmenden Schulen repräsentierten Grundschuleltern eine verwertbare Befragung durchgeführt werden. Die kumulative Ausschöpfungsrate, bezogen auf die in den insgesamt 52 Schulen der Ausgangsstichprobe repräsentierten 2.402 Familien, betrug somit 41,4 Prozent. In den Familien wurde die Person befragt, die sich am meisten um die schulischen Angelegenheiten des betreffenden Grundschülers kümmert. Dies war in 92,5 Prozent der Familien die Mutter, in 7,0 Prozent der Vater und in 0,5 Prozent der Fälle eine Person, die in einer anderen Beziehung zu dem Grundschüler stand. Die Zusammensetzung der Stichprobe der Hauptbefragten hinsichtlich ihrer soziodemografischen Merkmale ist in Tabelle 9 im Anhang dokumentiert. 4.2 Vorgehensweise Die Interviews mit den Hauptbefragten wurden computeradministriert bei den Befragten zu Hause durchgeführt und dauerten durchschnittlich 71,7 Minuten. In der ersten Interviewhälfte haben die Eltern Fragen über verschiedene Aspekte des aktuellen und zukünftigen Bildungsweges ihrer Kinder beantwortet. Außerdem wurden die soziodemografischen Merkmale der befragten Person sowie Proxy-Angaben über die der Partnerin bzw. des Partners erhoben. Im zweiten Teil des Interviews wurden dann mithilfe des Namensgenerators von Burt (1984) sowie der Teilgeneratoren „Geselligkeit“ und „Versorgung der Wohnung“ von Fischer (1982) die Bezugspersonen der Eltern erfasst. Bei jedem der drei Generatoren konnten bis zu fünf und damit insgesamt fünfzehn Personen genannt werden. Mehrfachnennungen waren möglich. Von den insgesamt 994 teilnehmenden Eltern haben 985 und damit 99,1 Prozent bei den Namensgeneratoren mindestens eine Bezugsperson genannt. Im nächsten Interviewteil haben die Eltern Proxy-Fragen über verschiedene Merkmale ihrer Bezugspersonen beantwortet. Um die Belastung der Befragten in Grenzen zu halten, wurden diese Fragen auf maximal fünf Netzpersonen beschränkt. Hatten die Befragten mehr Alteri genannt, so wurden mit einer quotierten Zufallsregel genau fünf Bezugspersonen für die nachfolgenden Proxy-Fragen ausgewählt. Bei dieser Auswahl war das Ziel, drei Viertel Alteri mit starken und ein Viertel mit 30 ZA-Information 56 schwächeren Beziehungen zu Ego in die Befragung einzubeziehen. In anderen Untersuchungen hat sich gezeigt, dass mit dem Namensgenerator von Burt vornehmlich Netzpersonen mit einer starken Beziehung zu Ego gelistet werden, wohingegen das Fischer-Instrument durchschnittlich eher schwächere Beziehungstypen erfasst (Schenk 1995: 34ff.). Als Kriterium für deren Auswahl wurde daher herangezogen, bei welchem der Namensgeneratoren die Netzperson genannt worden war. Von den 4.292 letztendlich für eine Befragung ausgewählten Netzpersonen hatte Ego 73,5 Prozent beim Namensgenerator von Burt und die restlichen 26,5 Prozent ausschließlich bei einem der Fischer-Generatoren genannt. Die durchschnittliche Größe der Egonetzwerke lag in dieser Ausgangsstichprobe bei 4,4 Netzpersonen. Die Eltern sollten im Anschluss für jede Netzperson Proxy-Fragen über deren Lebensalter, die Schulbildung, den Erwerbs- sowie Berufsstatus und deren Kinderanzahl beantworten. Die Eltern sollten auch angeben, welchen Schulabschluss sich jede der Netzpersonen für das Kind der Grundschuleltern wünscht.4 Außerdem wurde mit zwei Items die Wahrnehmung der Eltern darüber abgefragt, welche Einstellung zu Bildung die Bezugspersonen haben.5 Jede Information wurde blockweise für alle Netzpersonen abgefragt. Am Ende des Interviews wurden die Eltern für jede der ausgewählten Netzpersonen um die Telefonnummer gebeten. Wurde diese Bitte abgeschlagen, so wurde den Befragten vorgeschlagen, das Einverständnis hierfür bei der jeweiligen Netzperson einzuholen. Sind die Hauptbefragten auf diesen Vorschlag eingegangen, so haben die Interviewer eine Woche nach dem Interview das Ergebnis dieser Nachfrage telefonisch erfragt und gegebenenfalls die ausstehenden Telefonnummern aufgezeichnet. 4.3 Netzpersoneninterviews Im Durchschnitt 10,6 Wochen nach der Befragung der Eltern wurden die Netzpersonen, für die Telefonnummern akquiriert werden konnten, telefonisch kontaktiert und um ein Interview gebeten. Als Grund für die Befragung wurde genannt, dass 4 Fragetext: „Was meinen Sie, zu welchem Schulabschluss würde Ihnen [Name von Alter] für [Name von Kind] raten, wenn es alleine nach seiner/ihrer Idealvorstellung eines Abschlusses ginge?“ Antwortoptionen: (1) Hauptschulabschluss, (2) Realschulabschluss, (3) Fachabitur, (4) Abitur, (5) Anderer Abschluss. 5 Fragetext: „Wenn Sie sich einmal in [Name von Alter] hineinversetzen. Was glauben Sie, wie stark würde er/sie den folgenden Aussagen über die Bedeutung von Bildung zustimmen? (1) Was hält er/sie von der Ansicht, dass Kinder später nur arrogant werden, wenn sie zu lange zur Schule gehen? (2) Und wie stark wäre seine/ihre Zustimmung zu der Meinung, dass eine gute Schulbildung ein Wert an sich ist?“ Antwortskala von 1 (stimmt überhaupt nicht zu) bis 7 (stimmt voll und ganz zu). ZA-Information 56 31 Ego die Zielperson in einem Interview mit der Universität Mannheim als eine für sie „wichtige Person“ genannt hatte. Es wurde außerdem angegeben, dass das Interview über das Thema „Schule“ und „Bildung“ gehen solle.6 Auf Nachfrage haben die Interviewer eine Befragungsdauer von rund 25 Minuten angegeben. 4.4 Ergebnisse 4.4.1 Ausmaß und Determinanten des Nonresponse bei den Proxy-Fragen Insgesamt haben die Hauptbefragten in der vorliegenden Studie wenige ProxyFragen unbeantwortet gelassen. So haben die Eltern im Durchschnitt 2,7 Prozent der vier Fragen über die soziodemografischen Merkmale ihrer Bezugspersonen nicht beantwortet (vgl. Tabelle 1).7 Dieser Anteil liegt bei den drei Proxy-Fragen über die Einstellungen der Bezugspersonen mit durchschnittlich 4,0 Prozent signifikant höher (t=3,8, p ≤ .05). Eine differenziertere Betrachtung hat gezeigt, dass sich das Gesamtausmaß des Nonresponse bei den Faktenfragen aus 2,6 Prozent „weiß nicht“-Angaben und 0,1 Prozent Antwortverweigerungen zusammengesetzt hat. Bei den Einstellungsfragen lagen beide Arten von Nonresponse mit Durchschnittswerten von 3,8 und 0,2 Prozent höher. Der Unterschied zwischen den Fragetypen ist für die „weiß nicht“-Angaben (t=3,7, p ≤ .05), nicht aber für den Anteil der Antwortverweigerungen (t=1,4, p > .05) statistisch signifikant. Demnach haben die Befragten die Fragen über die weniger „sichtbaren“ Einstellungen der Alteri, im Vergleich zur denen über deren soziodemografische Charakteristiken, zwar als schwerer, nicht aber als sensibler betrachtet. Es kann außerdem festgestellt werden, dass die insgesamt fehlenden Angaben bei den Einstellungsfragen (t=11,6, p ≤ .05) und bei den Faktenfragen (t=14,7, p ≤ .05) gleichermaßen signifikant stärker auf „weiß nicht“Angaben und weniger auf Antwortverweigerungen zurückgehen. Dieses Ergebnis legt nahe, dass das Problem fehlender Werte bei den Proxy-Fragen mehr auf unzureichendes Wissen über die Alteri und weniger auf eine mangelnde Antwortbereitschaft der Befragten zurückgeht. 6 Der folgende Einleitungstext wurde von den Interviewern beim Erstkontakt vorgelesen: „Guten Tag. Ich rufe im Auftrag der Universität Mannheim an. Ich würde gerne mit [Name von Alter] sprechen. Frau/Herr [Name von Ego] hat Sie bei einem Interview über die schulischen Angelegenheiten von [Name von Kind] als wichtige Person genannt. Wir würden gerne auch mit Ihnen ein kurzes Interviewgespräch über das Thema ‚Schule‘ und ‚Bildung‘ führen.“ 7 In die Berechnung ging das Antwortverhalten bei den Fragen über das Alter, die Schulbildung, den Erwerbsstatus sowie die Kinderzahl der Netzpersonen ein. Da die Frage nach dem beruflichen Status nicht bei Alteri gestellt wurde, die noch nie in ihrem Leben erwerbstätig waren, wurde diese nicht in den Nonresponse-Indikator aufgenommen. 32 Tabelle 1 ZA-Information 56 Durchschnittlicher Prozentsatz der von Ego bei unterschiedlichen Fragentypen für jede Netzperson nicht beantworteten Proxy-Fragen „Weiß nicht“Angaben % (STD) Antwortverweigerungen % (STD) Nonresponse gesamt % (STD) Fragentyp - Demografische Fragen (N=4) - Einstellungsfragen (N=3) 2.64 ( 8.6) 3.77 (13.0) 0.11 (3.1) 0.19 (3.9) 2.75 ( 9.1) 3.96 (13.6) Gesamt 3.13 ( 8.1) 0.14 (3.3) 3.27 ( 8.8) Im nächsten Schritt unserer Analyse wurde geprüft, ob sich die Neigung der Hauptbefragten zu Nonresponse nach deren Zugehörigkeit zu soziodemografischen Gruppen unterscheidet. Wegen der geringen Anzahl von Befragten, die bei mindestens einer Netzperson die Antwort bei einer der sieben Proxy-Fragen verweigert hatten (N=7), war eine separate Analyse der Determinanten dieser Art von Nonresponse nicht möglich. Um eine eindeutige Interpretierbarkeit der Ergebnisse zu gewährleisten, beschränkt sich die folgende Analyse auf die „weiß nicht“-Antworten.8 Die Kriteriumsvariable der Analyse ist dyadisch organisiert und beinhaltet den Prozentsatz der insgesamt sieben Proxy-Fragen, den Ego bei jeder Netzperson mit „weiß nicht“ beantwortet hat.9 Die Ergebnisse von negativ binomialen Regressionsanalysen haben in einem ersten Schritt gezeigt, dass sich das Ausmaß der von den Befragten mit „weiß nicht“ beantworteten Fragen signifikant nach zwei der insgesamt fünf untersuchten Merkmalsdimensionen unterscheidet (vgl. Tabelle 2, Regressionsmodell 1).10 So hat sich der Erwerbsstatus (Wald-χ2=8,7, df=2, p ≤ .05) und das Alter (Wald-χ2=8,4, df=1, p ≤ .05) 8 Alle berichteten Analysen über die Bestimmungsfaktoren des Item-Nonresponse wurden auch mit einer Kriteriumsvariablen durchgeführt, bei der neben den „weiß-nicht“-Angaben auch die Antwortverweigerungen einbezogen wurden. Die hierbei erzielten Ergebnisse unterscheiden sich in keinem Fall substantiell von den hier dargestellten. 9 Die abhängige Variable dieser und der folgenden Analysen besteht aus dem bei bis zu fünf Alte- ri des gleichen Hauptbefragten beobachteten Antwortverhalten. Die Beobachtungen können daher nicht als unabhängig angesehen werden. Dies bewirkt eine Unterschätzung der Standardfehler der Regressionskoeffizienten und damit eine Überschätzung ihrer Zuverlässigkeit. Dieses Problem wird durch Verwendung des „Huber-White Sandwich“-Schätzers für robuste Standardfehler mit den befragten Eltern als Cluster korrigiert (STATA Corporation 1999: 165). 10 Da es sich bei der als Prozentsatz ausgedrückten Anzahl an “weiß nicht”-Antworten um eine Häufigkeitsverteilung handelt, ist eine Poisson-Regression eigentlich das angemessene Analyseverfahren. Allerdings zeigt die Antwortverteilung ein hohes Ausmaß an Überdispersion (α=20,7, p ≤ .05). Eine Unterschätzung der Standardfehler der Koeffizienten wurde daher durch die Verwendung negativ-binomialer Regressionsanalysen vermieden (Long und Freese 2003: 266). ZA-Information 56 33 der befragten Personen signifikant auf deren Neigung zu „weiß nicht“-Antworten auswirkt. Entsprechend haben Befragte, die noch nie erwerbstätig waren, im Vergleich zu solchen, die früher oder am Befragungszeitpunkt einer Erwerbsarbeit nachgegangen waren, signifikant häufiger Proxy-Fragen unbeantwortet gelassen. Der Alterseffekt besagt dagegen, dass der Anteil der mit „weiß nicht“ beantworteten Proxy-Fragen mit dem Alter der Befragten ansteigt. Die Stellung im Beruf, das Geschlecht und die Schulbildung der Hauptbefragten haben sich nicht als signifikant mit dem Ausmaß des Nonresponse assoziiert erwiesen. In einem zweiten Schritt wurde untersucht, ob sich die mit der Nennung einer Netzperson beim Namensgenerator von Burt verbundene höhere Beziehungsstärke auf den Anteil der von Ego mit „weiß nicht“ beantworteten Fragen ausgewirkt hat (vgl. Tabelle 2, Regressionsmodell 2). Das Ergebnis ist, dass diese Art des Nonresponse bei höherer Beziehungsstärke signifikant geringer ist (Wald-χ2=99,5, df=1, p ≤ .05). Demnach kann festgestellt werden, dass die bei stärkeren Beziehungen durchschnittlich längere Bekanntheitsdauer und höhere Interaktionsrate die Verfügbarkeit der mit den Proxy-Fragen erfassten Informationen verbessert. In einem dritten Schritt wurde geprüft, ob das Ausmaß der von Ego unbeantworteten Proxy-Fragen auch das Resultat einer generellen Neigung der Befragten zu Nonresponse ist. Es wurde daher erstens überprüft, ob die Bereitschaft zur Herausgabe der Kontaktinformationen für Alter erklärt, in welchem Umfang Ego die ProxyFragen mit „weiß nicht“ beantwortet hat. Es wurde zweitens geprüft, ob der Prozentsatz der bei den insgesamt 75 Fragen über Merkmale der befragten Person selbst beobachteten „weiß nicht“-Antworten und Antwortverweigerungen die Neigung zu Nonresponse bei den Proxy-Fragen erklärt.11 Diese drei Indikatoren für die generelle Tendenz der Eltern Fragen unbeantwortet zu lassen, wurden gleichzeitig in die Analyse einbezogen (vgl. Tabelle 2, Regressionsmodell 3). Die Ergebnisse zeigen, dass der Prozentsatz der mit „weiß nicht“ beantworteten Fragen signifikant höher liegt, wenn sich die befragte Person im Anschluss geweigert hat, die Telefonnummer der betreffenden Netzperson zu nennen (Wald-χ2=28,2, df=1, p ≤ .05). Dieser Prozentsatz steigt außerdem signifikant an, wenn Ego bei Fragen über die eigene Person häufiger mit „weiß nicht“ geantwortet hat (Wald-χ2=26,2, df=1, p ≤ .05) und öfter die Antwort verweigert hat (Wald-χ2=9,3, df=1, p ≤ .05). 11 Bei der Berechnung der beiden Nonresponse-Indikatoren wurden alle Fragen über Merkmale von Ego herangezogen. Proxy-Fragen über den Partner/die Partnerin von Ego wurden nicht einbezogen. Ebenfalls nicht berücksichtigt wurden Fragen, die in einem Filter lagen. Im Durchschnitt hatten die Befragten 0.12 Prozent (Range: 0.00-8.00; Std.: .50) der 75 Fragen mit „weiß nicht“ beantwortet und bei 0.09 Prozent (Range: 0.0-10.67; Std.: .50) eine Antwort verweigert. 34 Tabelle 2 ZA-Information 56 Determinanten der „weiß nicht“-Angaben von Ego bei Proxy-Fragen über die Alteri (Ergebnisse negativ-binomialer Regressionsanalysen) Merkmale von Ego (1) Erwerbsstatus a) - Voll-/Teilzeit erwerbstätig - Noch nie erwerbstätig (2) Lebensalter (Jahre) (3) Kontaktinformation bereitgestellt? (nein) b) (4) Verweigerte Eigenangaben (%) (5) „Weiß nicht“ bei Eigenangaben (%) (6) Beziehungsstärke (stark) c) Konstante Log-Likelihood McFaddens Pseudo-R2 Anzahl Beobachtungen Modell 1 B (STD) Modell 2 B (STD) .04 (.11) 1.13 (.38)** .03 (.01)** -- .10 (.11) 1.36 (.41)** .03 (.01)** -- Modell 3 B (STD) .13 1.26 .02 .53 (.12) (.38)** (.01) (.10)** --- --- .59 (.19)** .77 (.15)** -- -.83 (.08)** -.77 (.09)** -.24 (.47) .33 (.46) .23 (.48) -5152.6 .001 4292 -5138.1 .004 4292 -5123.0 .007 4292 Referenzkategorie: a) früher erwerbstätig; b) ja; c) schwach. Signifikanz: * p ≤ .05; ** p ≤ .01. Ein weiteres Ergebnis ist, dass der zuvor signifikante Effekt des Lebensalters seine Erklärungskraft für die Wahrscheinlichkeit von „weiß nicht“-Antworten verliert, wenn die verschiedenen Indikatoren für die generelle Neigung der Befragten zu Nonresponse statistisch kontrolliert werden (Wald-χ2=3,8, df=1, p > .05). Weitere Analysen haben gezeigt, dass das Alter der Befragten signifikant mit deren Neigung zu „weiß nicht“-Angaben (r=.11, p ≤ .05) und Antwortverweigerungen (r=.10, p ≤ .05) bei Fragen über die eigenen Merkmale assoziiert ist. Demnach geht der anfänglich beobachtete Alterseffekt auf das Ausmaß der „weiß nicht“-Angaben auf eine generell höhere Neigung älterer Befragter zu Nonresponse zurück. 4.4.2 Konsequenzen des Nonresponse bei den Proxy-Fragen Nach unseren Ergebnissen haben die Hauptbefragten unserer Studie einen nur geringen Teil der Proxy-Fragen mit „weiß nicht“ beantwortet. Geht man von einem für die sieben erfragten Merkmale listenweisen Ausschluss der fehlenden Werte aus, so reduziert dies die Ausgangsstichprobe der 4.292 Netzpersonen dennoch auf 3.577 und damit um 16,7 Prozent, für die vollständige Proxy-Angaben zur Verfügung stehen. Es stellt sich nun die Frage, in welcher Weise sich dies und insbesondere die nach dem Erwerbsstatus von Ego unterschiedliche Ausfallwahrscheinlichkeit ZA-Information 56 Tabelle 3 35 Einfluss des Item-Nonresponse bei den Proxy-Fragen auf die durchschnittliche Größe der Egonetze Gesamtstichprobe der Alteri (G) ∅ (STD) Alteri mit vollständigen Proxy-Angaben (V) ∅ (STD) Differenz (G-V) ∅ Erwerbsstatus von Ego - Voll-/Teilzeit erwerbstätig (N=535) - Früher erwerbstätig (N=434) - Noch nie erwerbstätig (N=16) 4.4 (1.0) 4.3 (1.0) 4.0 (1.2) 3.7 (1.4) 3.6 (1.4) 2.8 (1.5) 0.7 0.7 1.2 Durchschnittliche Netzgröße 4.3 (1.0) 3.6 (1.4) 0.7 Einbezogene Alteri (%) 100.0 83.3 auf die für die Analyse von Bezugsgruppeneinflüssen verfügbare Größe der Egonetzwerke auswirkt. In Tabelle 3 wird die durch Nonresponse bei den Proxy-Fragen bewirkte Verkleinerung der durchschnittlich pro Ego verfügbaren Netzpersonen, differenziert nach dem Erwerbsstatus der Hauptbefragten, dargestellt. Die Ergebnisse zeigen, dass sich das mit vollständigen Proxy-Angaben verfügbare Netzwerk für am Befragungszeitpunkt erwerbstätige Befragte ausgehend von 4,4 Alteri auf 3,7 und damit um 0,7 Alteri verkleinert. Dieser Effekt des Item-Nonresponse entspricht genau dem, der bei früher erwerbstätigen Befragten beobachtet wird: Die anfängliche Netzwerkgröße schrumpft von 4,3 auf 3,6 Alteri. Dagegen fällt die Reduktion der Netzgröße bei der im besonderen Ausmaß zu „weiß nicht“-Angaben neigenden Gruppe der noch nie Erwerbstätigen deutlich stärker aus. In dieser Gruppe geht die Netzgröße von 4,0 Alteri um 1,2 Bezugspersonen und damit auf einen Wert von nur noch 2,8 zurück. 4.4.3 Determinanten der mangelnden Bereitschaft zur Nennung von Kontaktinformationen In unserer Studie konnten für 2.550 und damit für 59,4 Prozent der ursprünglich 4.292 für eine Befragung vorgesehenen Alteri Telefonnummern akquiriert werden. Es wurde mit einer Reihe logistischer Regressionsanalysen getestet, welche Faktoren sich auf die fehlende Bereitschaft zur Nennung der Telefonnummern ausgewirkt haben. Zuerst wurde geprüft, ob dies für die soziodemografischen Merkmale von Ego zutrifft. Nach den Ergebnissen war dies nicht der Fall: Das Geschlecht, der Erwerbsstatus, die berufliche Stellung und das Alter von Ego haben weder unter Kontrolle der jeweils anderen Faktoren, noch bivariat einen Einfluss auf die Weitergabe der Telefonnummern ausgeübt (Ergebnisse nicht berichtet). 36 ZA-Information 56 Im zweiten Schritt wurde der Einfluss der von Ego über die Netzpersonen berichteten soziodemografischen Merkmale auf die Verweigerung einer Weitergabe der Kontaktinformationen getestet. Die Ergebnisse zeigen, dass sich das Geschlecht (Wald-χ2=23,7, df=1, p ≤ .05) und der Erwerbsstatus (Wald-χ2=6,4, df=2, p ≤ .05) der Alteri signifikant auf die Wahrscheinlichkeit einer fehlenden Bereitschaft der Hauptbefragten zur Bereitstellung von Kontaktinformationen ausgewirkt haben: Diese Wahrscheinlichkeit liegt für männliche im Vergleich zu weiblichen und für aktuell im Vergleich zu früher erwerbstätigen Netzpersonen höher (vgl. Tabelle 4, Regressionsmodell 4). Diese Effekte können so interpretiert werden, dass Ego bei männlichen Bezugspersonen von einem nur geringen Interesse an einem Interview über die schulischen Angelegenheiten von Grundschülern ausgeht. Trifft dies zu, so ist die bei männlichen Netzpersonen besonders geringe Bereitschaft zur Weitergabe der Kontaktinformationen das Ergebnis des Bestrebens von Ego, eine Belastung dieser Netzpersonen durch die Teilnahme an einer unangenehmen Befragung zu verhindern. Die gleiche Motivation kann auch als Grundlage der Unterschiede nach dem Erwerbsstatus der Alteri angenommen werden. Demnach liegt der geringeren Bereitschaft zur Weitergabe der Kontaktinformation von berufstätigen Netzpersonen die Annahme zugrunde, dass für diese eine Befragungsteilnahme eine besondere zeitliche Belastung darstellt. Drittens wurde geprüft, ob sich die Beziehungsstärke zwischen Ego und Alter auf die Weitergabe der Kontaktinformationen ausgewirkt hat (vgl. Tabelle 4, Regressionsmodell 5). Nach den vorliegenden Ergebnissen hat Ego bei Alteri, die er oder sie beim Namensgenerator von Burt genannt hat und zu denen somit eine starke soziale Beziehung besteht, signifikant weniger häufig die Herausgabe der Telefonnummer verweigert (Wald-χ2=41,6, df=1, p ≤ .05). Demnach kann die Hypothese bestätigt werden, dass Ego beim Vorliegen einer vertrauensvolleren Beziehung zu den Netzpersonen eher einen Eingriff in deren Privatsphäre riskiert. In vierten Schritt unserer Analyse wurde geprüft, ob sich die Neigung von Ego zu „weiß nicht“-Angaben bei den Proxy-Fragen sowie das Ausmaß von „weiß nicht“Angaben und Antwortverweigerungen bei Fragen über die eigene Person auf die Bereitschaft zur Weitergabe von Kontaktinformationen ausgewirkt hat. Wie nach dem Ergebnis über die Bestimmungsfaktoren des Nonresponse bei den ProxyFragen zu erwarten war, steigt die Wahrscheinlichkeit der Antwortverweigerung bei der Frage nach der Kontaktinformation signifikant mit dem Anteil der mit „weiß nicht“ beantworteten Proxy-Fragen an (Wald-χ2=32,5, df=1, p ≤ .05; vgl. Tabelle 4, Regressionsmodell 6). Diese Wahrscheinlichkeit steigt auch mit dem Ausmaß der Antwortverweigerungen (Wald-χ2=24,2, df=1, p ≤ .05), nicht aber mit dem der „weiß nicht“-Angaben (Wald-χ2=2,7, df=1, p > .05) bei den Selbstbeschreibungsfragen ZA-Information 56 Tabelle 4 37 Determinanten der fehlenden Bereitschaft zur Nennung von Kontaktinformationen der Alteri (Ergebnisse logistischer Regressionsanalysen)12 Merkmale der Alteri Geschlecht (weiblich) a) (1) Erwerbsstatus b) - Voll-/Teilzeit erwerbstätig - Noch nie erwerbstätig Modell 4 B (STD) Modell 5 B (STD) Modell 6 B (STD) -.36 (.07)** -.34 (.08)** -.33 (.08)** .16 (.07)* .28 (.18) .15 (.07)* .27 (.18) .17 (.07)** .29 (.18) Merkmale von Ego (2) „Weiß nicht“ bei Proxy-Angaben (%) (3) Verweigerte Eigenangaben (%) (4) „Weiß nicht“ bei Eigenangaben (%) ---- ---- .03 (.01)** 1.19 (.24)** -.33 (.20) (5) Beziehungsstärke (stark) c) -- -.51 (.08)** -.43 (.08)** .13 (.11) -.07 (.11) -2847.9 .02 4292 -2785.0 .04 4292 Konstante Log-Likelihood McFaddens Pseudo-R2 Anzahl Beobachtungen -.22 (.09)* -2873.7 .01 4292 Referenzkategorie: a) männlich; b) früher erwerbstätig; c) schwach. Signifikanz: * p ≤ .05; ** p ≤ .01. an. Demnach hängt der Erfolg bei der Akquirierung der Kontaktinformationen zumindest teilweise von der generellen Antwortbereitschaft der Befragten ab. 4.4.4 Determinanten der Realisierungswahrscheinlichkeit der Netzpersoneninterviews Ausgehend von der Bruttostichprobe der 2.550 Alteri, für die Telefonnummern verfügbar waren, wurde bei 2.354 versucht ein Telefoninterview durchzuführen.13 In 1.768 Fällen oder 75,1 Prozent der bearbeiteten Bruttostichprobe konnte dies realisiert 12 Alteri mit fehlenden Werten beim Erwerbsstatus wurden durch eine Dummy-Variable in der Regressionsgleichung repräsentiert, der Parameter aus Übersichtlichkeitsgründen jedoch nicht berichtet. Dies trifft bei den folgenden Regressionsanalysen auch für deren berufliche Stellung und Bildung sowie für die berufliche Stellung von Ego zu. Die Erklärungskraft dieser MissingDummies gehen bei den für diese Faktoren berichteten χ2-Tests nicht ein. 13 Nach den ersten zwei Dritteln der Feldzeit hat sich gezeigt, dass wegen finanzieller Beschrän- kungen nicht mit allen mit Telefonnummern ausgestatteten Netzpersonen Befragungen durchgeführt werden können. Es wurden daher 196 Telefonnummern ohne jegliche Kontaktversuche aus der Stichprobe genommen. Diese Teilstichprobe geht nicht in die Berechnung der hier angegebenen Ausschöpfungsquote und die Analyse der Ausfallswahrscheinlichkeit ein. 38 Tabelle 5 ZA-Information 56 Determinanten des Misserfolges bei der Realisierung von Netzpersoneninterviews (Ergebnisse logistischer Regressionsanalysen) Merkmale der Alteri (1) Geschlecht (weiblich) a) (2) Erwerbsstatus b) - Voll-/Teilzeit erwerbstätig - Noch nie erwerbstätig (3) Berufliche Stellung c) - Angestellter - Beamter - Selbstständiger Merkmale von Ego (4) Bildung d) - Realschulabschluss - Fachhochschulreife - Abitur (5) Erwerbsstatus b) - Voll-/Teilzeit erwerbstätig - Noch nie erwerbstätig (6) Berufliche Stellung c) - Angestellter - Beamter - Selbstständiger (7) „Weiß nicht“ bei Proxy-Angaben (%) (8) Verweigerte Eigenangaben (%) (9) „Weiß nicht“ bei Eigenangaben (%) (10) Beziehungsstärke (stark) e) Konstante Log-Likelihood McFaddens Pseudo-R2 Anzahl Beobachtungen Modell 7 B (STD) Modell 8 B (STD) Modell 9 B (STD) -.42 (.12)** -.42 (.12)** -.42 (.12)** .07 (.10) 1.40 (.36)** .07 (.10) 1.39 (.36)** .07 (.10) 1.37 (.36)** -.29 (.16) -.48 (.24)* -.09 (.22) -.29 (.16) -.49 (.24)* -.08 (.22) -.29 (.16) -.49 (.24)* -.08 (.22) -.46 (.15)** -.66 (.23)** -.69 (.16)** -.46 (.15)** -.66 (.23)** -.68 (.16)** -.47 (.15)** -.67 (.23)** -.69 (.16)** .27 (.11)* 1.13 (.74) .27 (.11)* 1.15 (.73) .27 (.11)* 1.13 (.74) -.52 (.20)* -.46 (.30) -.54 (.26)* ---- -.51 (.20)* -.46 (.30) -.53 (.26)* ---- -.51 (.20)* -.45 (.30) -.53 (.26)* -.01 (.01) .16 (.24) -.08 (.20) -.10 (.12) -.11 (.12) .25 (.22) .27 (.23) -1270.7 .04 2354 -1270.2 .04 2354 -.19 (.21) -1271.1 .04 2354 Referenzkategorie: a) männlich; b) früher erwerbstätig; c) Arbeiter; d) Hauptschulabschluss; e) schwach. Signifikanz: * p ≤ .05; ** p ≤ .01. werden.14 In einem ersten Schritt wurde analysiert, welche Merkmale der Alteri und welche Charakteristiken von Ego mit der Ausfallwahrscheinlichkeit eines Netzpersoneninterviews assoziiert sind (vgl. Tabelle 5, Regressionsmodell 7). 14 Die Gründe für den Misserfolg bei der Befragung der Netzpersonen setzt sich wie folgt zusam- men: 12,6%: Teilnahmeverweigerung, 5,2%: kein Kontakt mit Zielperson möglich, 4,9%: falsche Telefonnummer, 2,2%: Interview abgebrochen. ZA-Information 56 39 Nach den Ergebnissen hat sich das Geschlecht der Alteri (Wald-χ2=12,8, df=1, p ≤ .05), deren Erwerbsstatus (Wald-χ2=14,9, df=2, p ≤ .05) sowie die Stellung im Beruf (Wald-χ2=21,3, df=4, p ≤ .05) signifikant auf die Ausfallwahrscheinlichkeit eines Interviews ausgewirkt. Demnach war die Ausfallwahrscheinlichkeit erstens für weibliche Netzpersonen geringer als für männliche. In diesem Unterschied drückt sich möglicherweise das geringere Interesse von Männern am Befragungsthema „schulische Angelegenheiten von Grundschülern“ aus. Zweitens haben noch nie erwerbstätige Bezugspersonen signifikant weniger an einer Befragung teilgenommen, verglichen mit den früher und aktuell Erwerbstätigen. Es konnte drittens mit Arbeitern, im Vergleich zu allen anderen Statusgruppen, weniger wahrscheinlich ein Interview realisiert werden. Dieser Unterschied hat sich allerdings nur für den Vergleich mit der Gruppe der Beamten als statistisch signifikant erwiesen. Die Ergebnisse haben zweitens gezeigt, dass die Bildung (Wald-χ2=19,5, df=3, p ≤ .05), der Erwerbsstatus (Wald-χ2=8,3, df=2, p ≤ .05) sowie die Stellung im Beruf (Waldχ2=9,6, df=4, p ≤ .05) von Ego einen zusätzlichen Effekt auf die Wahrscheinlichkeit eines Misserfolgs bei der Befragung der Netzpersonen ausgeübt haben. So liegt die Ausfallwahrscheinlichkeit von Alteri, die von einem Hauptbefragten mit Hauptschulabschluss genannt wurden, verglichen mit Bezugspersonen von Abiturienten signifikant höher. Außerdem haben Netzpersonen von Hauptbefragten, die am Befragungszeitpunkt oder noch nie zuvor erwerbstätig waren, im Vergleich zu solchen, die früher erwerbstätig waren, häufiger kein Interview absolviert. Dabei ist der Unterschied zwischen den Gruppen der aktuell und früher Erwerbstätigen statistisch signifikant. Auch haben Bezugspersonen von Arbeitern, im Vergleich zu allen anderen, seltener ein Interview absolviert. Es wurde auch geprüft, ob sich die mit der Nennung einer Bezugsperson beim Namensgenerator von Burt verbundene höhere Beziehungsstärke auf die Befragungsteilnahme der Alteri ausgewirkt hat (vgl. Tabelle 5, Regressionsmodell 8). Die Ergebnisse haben gezeigt, dass dies nicht der Fall ist (Wald-χ2=0,7, df=1, p > .05). Ebenfalls nicht relevant war, wie häufig Ego bei Fragen über die eigenen Merkmale Antworten verweigert (Wald-χ2=0,4, df=1, p > .05) und mit „weiß nicht“ geantwortet hat (Wald-χ2=0,2, df=1, p > .05) oder in welchem Umfang „weiß nicht“Antworten bei den Proxy-Fragen gegeben wurden (Wald-χ2=0,6, df=1, p > .05). 4.4.5 Determinanten der kumulativen Wahrscheinlichkeit einer Realisierung von Netzpersoneninterviews Von den 4.096 anfänglich von Ego genannten Netzpersonen, bei denen versucht worden war eine Befragung durchzuführen, konnte in 43,2 Prozent der Fälle letzt- 40 ZA-Information 56 endlich ein Interview realisiert werden. Es stellt sich die Frage, nach welchen Merkmalen der Ziel- und Netzpersonen sich die kumulative Ausfallwahrscheinlichkeit eines Netzpersoneninterviews unterscheidet. Die Analysen haben erstens gezeigt, dass sich die Bildungsabschlüsse (Wald-χ2=16,2, df=3, p ≤ .05) und der Erwerbsstatus (Wald-χ2=13,7, df=2, p ≤ .05) von Ego, sowie das Geschlecht (Waldχ2=43,3, df=1, p ≤ .05), die Bildungsabschlüsse (Wald-χ2=11,7, df=3, p ≤ .05) und der Erwerbsstatus (Wald-χ2=16,3, df=2, p ≤ .05) der Alteri signifikant auf die Ausfallwahrscheinlichkeit einer Befragung der Bezugspersonen ausgewirkt hat (vgl. Tabelle 6, Regressionsmodell 10). Auch die Stärke der Beziehung zwischen Ego und Alter hat sich zusätzlich als statistisch signifikanter Erklärungsfaktor erwiesen (Wald-χ2=28,0, df=1, p ≤ .05; vgl. Tabelle 6, Regressionsmodell 11). Die vorherigen Analysen haben gezeigt, dass dieser Effekt auf die nach dieser Dimension selektive Bereitstellung von Kontaktinformationen durch Ego zurückzuführen ist. Auch das Ausmaß der „weiß nicht“-Angaben bei den Proxy-Fragen (Wald-χ2=7,6, df=1, p ≤ .05) und die Neigung zu Antwortverweigerungen bei Fragen über die eigene Person (Wald-χ2=22,6, df=1, p ≤ .05) haben einen signifikanten Effekt auf die Wahrscheinlichkeit, dass kein Interview mit einer Bezugsperson realisiert werden konnte (vgl. Tabelle 6, Regressionsmodell 12). Mit zwei Ausnahmen handelt es sich bei den hier festgestellten Determinanten um die „Vereinigungsmenge“ der für die Nennung der Kontaktinformation und die Realisierung der Netzpersonenbefragungen festgestellten Erklärungsfaktoren. Bei diesen Ausnahmen handelt es sich erstens um den beruflichen Status von Ego sowie um den der Alteri, die sich zwar bei der konditionalen Teilnahmeentscheidung der Netzpersonen als relevant erwiesen hatten, das Signifikanzkriterium bei der Vorhersage der Gesamtrealisierungswahrscheinlichkeit aber verfehlt haben. Die Bildungsabschlüsse der Alteri haben zwar bei beiden Selektionsstufen knapp die Signifikanzmarke verfehlt, erweisen sich aber bei der Erklärung der kumulierten Ausfallwahrscheinlichkeit als eindeutig relevanter Erklärungsfaktor. Dieser „neue“ Effekt besagt, dass Hauptschulabsolventen, verglichen mit allen anderen Bildungsgruppen, ein höheres Risiko dafür haben, dass ihre selbstberichteten Merkmale bei der Analyse von Bezugsgruppeneffekten nicht einbezogen werden können. Diese Wahrscheinlichkeitsunterschiede sind, mit Ausnahme der Befragten mit Abitur, für alle Bildungsgruppen statistisch signifikant. Die inhaltlichen Aussagen der anderen Effekte sind substantiell die gleichen, wie die in den Detailanalysen dargestellten. ZA-Information 56 Tabelle 6 41 Determinanten der kumulativen Ausfallwahrscheinlichkeit einer Netzpersonenbefragung (Ergebnisse logistischer Regressionsanalysen) Merkmale der Alteri (1) Geschlecht (weiblich) a) (2) Bildung b) - Realschulabschluss - Fachhochschulreife - Abitur (3) Erwerbsstatus c) - Voll-/Teilzeit erwerbstätig - Noch nie erwerbstätig Merkmale von Ego (4) Bildung b) - Realschulabschluss - Fachhochschulreife - Abitur (5) Erwerbsstatus c) - Voll-/Teilzeit erwerbstätig - Noch nie erwerbstätig (6) „Weiß nicht“ bei Proxy-Angaben (%) (7) Verweigerte Eigenangaben (%) (8) „Weiß nicht“ bei Eigenangaben (%) (9) Beziehungsstärke (stark) d) Konstante Log-Likelihood McFaddens Pseudo-R2 Anzahl Beobachtungen Modell 10 B (STD) Modell 11 B (STD) Modell 12 B (STD) -.52 (.08)** -.50 (.08)** -.49 (.08)** -.18 (.09)* -.50 (.16)** -.08 (.10) -.18 (.09) -.51 (.16)** -.07 (.10) -.20 (.09)* -.58 (.17)** -.07 (.10) .19 (.07)** .67 (.19)** .18 (.07)** .67 (.20)** .20 (.07)** .66 (.20)** -.23 (.12) -.17 (.19) -.49 (.13)** -.22 (.12) -.16 (.19) -.49 (.13)** -.26 (.12)* -.19 (.20) -.56 (.13)** .30 (.09)** .51 (.25)* ---- .31 (.09)** .52 (.24)* ---- .28 (.09)** .53 (.25)* .02 (.01)** 1.12 (.24)** -.27 (.17) -- -.43 (.08)** -.39 (.08)** .71 (.14)** 1.01 (.15)** .98 (.15)** -2722.8 .03 4096 -2706.4 .03 4096 -2675.7 .04 4096 Referenzkategorie: a) männlich; b) Hauptschulabschluss; c) früher erwerbstätig; d) schwach. Signifikanz: * p ≤ .05; ** p ≤ .01. 4.4.6 Konsequenzen der zweistufig kumulativen Ausfälle von Netzpersoneninterviews Welchen kumulativen Effekt hatten nun die systematischen Unterschiede in den Ausfallwahrscheinlichkeiten auf die Größe der egozentrierten Netzwerke, für die selbstberichtete Merkmale der Alteri verfügbar sind und auf die Zusammensetzung dieser Teilstichprobe der Netzpersonen? In einem ersten Schritt hat sich gezeigt, dass die durchschnittliche Größe der Egonetzwerke ausgehend von 4,2 Alteri in der Bruttostichprobe auf 1,8 und damit auf 42,8 Prozent geschrumpft ist. Ein Vergleich dieser Reduktion der Netzgrößen nach jenen Merkmalen von Ego, die signifikant mit der Ausfallwahrscheinlichkeit von Netzpersoneninterviews assoziiert waren, hat 42 ZA-Information 56 folgende Resultate erbracht: Für Befragte, die am Interviewzeitpunkt oder noch nie erwerbstätig waren, lässt sich eine starke Reduktion der für eine Analyse verfügbaren Netzgrößen um durchschnittlich 2,5 Alteri feststellen. Dieser Wert liegt für früher erwerbstätige Befragte um 0,3 Netzpersonen und damit um immerhin 12 Prozent niedriger (vgl. Tabelle 7). Die Bildung der Befragten hat sich dergestalt ausgewirkt, dass die Verkleinerung der Egonetze mit zunehmender Bildung geringer ausgefallen ist. Während sich bei Befragten mit Hauptschulabschluss eine durchschnittliche Reduktion der Netzgröße um 2,5 Alteri feststellen lässt, liegt dieser Wert bei solchen mit Abitur nur bei 2,2 Netzpersonen. Auch diese Extremgruppen unterscheiden sich um 12 Prozent in der Verkleinerung ihrer Egonetzwerke. Tabelle 7 Einfluss der unterschiedlichen Ausfallursachen auf die Größe der Netzwerke, für die Eigenangaben der Alteri verfügbar sind (Unterschiede nach den Merkmalen von Ego) Gesamtstichprobe der Alteri (G) ∅ (STD) Alteri mit Interview (I) ∅ (STD) Differenz (G-I) ∅ Erwerbsstatus - Voll-/Teilzeit erwerbstätig - Früher erwerbstätig - Noch nie erwerbstätig 4.2 (1.1) 4.1 (1.1) 3.9 (1.1) 1.7 (1.4) 1.9 (1.4) 1.4 (1.0) 2.5 2.2 2.5 Bildung - Hauptschulabschluss - Realschulabschluss - Fachhochschulreife - Abitur 4.0 4.1 4.1 4.3 1.5 1.7 1.8 2.1 (1.3) (1.4) (1.5) (1.4) 2.5 2.4 2.3 2.2 Durchschnittliche Netzgröße 4.2 (1.1) 1.8 (1.4) 2.4 Einbezogene Alteri 100.0 % 43.2 % (1.2) (1.1) (1.1) (1.0) Wie stark und in welcher Weise haben sich die systematischen Ausfallgründe in einer Verzerrung der sozialen Zusammensetzung der Netto- im Vergleich zur Bruttostichprobe der Alteri niedergeschlagen? Diese Frage lässt sich durch einen Vergleich der in Tabelle 8 dargestellten Merkmale der Alteri vor und nach dem doppelten Ausfallprozess beantworten. Es hat sich erstens gezeigt, dass durch die systematischen Ausfälle die ohnehin schon starke Dominanz weiblicher Netzpersonen weiter zugenommen hat: Der Anteil männlicher Bezugspersonen ist um 4,8 Prozentpunkte zugunsten der weiblichen Alteri zurückgegangen. Dies ist die Konsequenz der geringen Bereitschaft der Egos zur Weitergabe der Telefonnummern männlicher Netzpersonen. Zweitens hat der Ausfallprozess zu einer um 3,6 Prozentpunkte verringerten Repräsentation von früher erwerbstätigen Alteri in der Stichprobe geführt. Hiervon haben alle anderen Erwerbsstatusgruppen, am stärksten aber die ZA-Information 56 43 am Befragungszeitpunkt erwerbstätigen Alteri profitiert (+2,1 Prozentpunkte). Diese Stichprobenverzerrung geht sowohl auf die selektive Kooperationsbereitschaft von Ego bei der Herausgabe der Kontaktinformationen wie auch auf die unterschiedliche Teilnahmebereitschaft der Netzpersonen zurück. Hinsichtlich der Zusammensetzung der Alteri nach ihren Bildungsabschlüssen führt der kumulative Ausfallprozess zu einer Unterrepräsentation von Personen mit einem Hauptschulabschluss (-1,7 Prozentpunkte) und einer starken Reduktion von Alteri, deren Bildungsabschluss die Hauptbefragten nicht nennen wollten oder konnten (-2,5 Prozentpunkte). Tabelle 8 Einfluss der unterschiedlichen Ausfallursachen auf die soziale Zusammensetzung der Alteri-Stichprobe Gesamtstichprobe der Alteri (G) % (N) Alteri mit Interview (I) Differenz (G-I) % (N) Geschlecht - weiblich - männlich Gesamt 77.9 (3189) 22.1 ( 907) 100.0 (4096) 82.7 (1463) 17.3 ( 305) 100.0 (1768) -4.8 +4.8 Erwerbsstatus - Voll-/Teilzeit erwerbstätig - Früher erwerbstätig - Noch nie erwerbstätig - Missing Gesamt 56.5 (2315) 38.8 (1589) 3.3 ( 135) 1.4 ( 57) 100.0 (4096) 54.4 ( 961) 42.4 ( 750) 2.4 ( 42) 0.8 ( 15) 100.0 (1768) +2.1 -3.6 +0.9 +0.6 Schulbildung - Hauptschulabschluss - Realschulabschluss - Fachhochschulreife - Abitur - Missing Gesamt 29.4 (1205) 29.0 (1186) 5.6 ( 228) 26.9 (1103) 9.1 ( 374) 100.0 (4096) 27.7 ( 490) 31.4 ( 555) 6.6 ( 117) 27.7 ( 489) 6.6 ( 117) 100.0 (1768) +1.7 -2.4 -1.0 -0.8 +2.5 Beziehungsstärke - stark - schwach Gesamt 73.4 (3006) 26.6 (1090) 100.0 (4096) 78.7 (1391) 21.3 ( 377) 100.0 (1768) -5.3 +5.3 Einbezogene Alteri 100.0 % 43.2 % An Gewicht gewinnt dadurch primär die Gruppe der Befragten mit Realschulabschluss (+2,4 Prozentpunkte), die der Fachabiturienten (+1,0 Prozentpunkte) und der Abiturienten (+0,8 Prozentpunkte). Diese Selektivität nach der Bildung der Alteri resultiert aus der selektiven Bereitschaft der Hauptbefragten zur Nennung der Kontaktinformationen und der unterschiedlichen Teilnahmebereitschaft der Alteri. Obwohl dieser Effekt ausschließlich auf die ungleiche Wahrscheinlichkeit einer Herausgabe der Telefonnummer der Alteri beruht, lässt sich die stärkste Stichproben- 44 ZA-Information 56 verzerrung nach der Beziehungsstärke zwischen Ego und Alter feststellen. So ist der Anteil der Bezugspersonen, die Ego beim Namensgenerator von Burt genannt hat und die somit in einer engen Beziehung zum Hauptbefragten stehen, in der Nettoim Vergleich zur Bruttostichprobe um 5,3 Prozentpunkte angestiegen. Demnach führt die Stichprobenselektivität zu einer Überrepräsentation von „strong ties“ und damit zu einer zunehmenden Beschränkung der verfügbaren Daten auf das Primärnetzwerk von Ego. 5 Zusammenfassung und Diskussion In unserer egozentrierten Netzwerkstudie hat sich ein insgesamt sehr geringes Ausmaß an Item-Nonresponse der Hauptbefragten bei den Proxy-Fragen über die Merkmale ihrer Bezugspersonen gezeigt. Demnach haben die Befragten durchschnittlich nur 3,3 Prozent der sieben analysierten Fragen unbeantwortet gelassen. Dieser Anteil variiert allerdings stark nach dem Inhalt der Fragen: Während nur 0,4 Prozent der Befragten keine Angaben über die Kinderzahl der Netzpersonen gemacht haben, beträgt dieser Prozentsatz bei der Frage über die von den Alteri am idealsten eingeschätzten Schulabschlüsse 8,8 Prozent. Es hat sich auch herausgestellt, dass Fragen über die Einstellungen der Alteri signifikant stärker durch Nonresponse betroffen waren, verglichen mit solchen, die sich auf die stärker sichtbaren demografischen Merkmale bezogen haben. Auch die Nachbefragung der Netzpersonen konnte mit relativ gutem Erfolg durchgeführt werden. Hierzu mussten zuerst die Kontaktinformationen erfolgreich bei Ego erfragt und die Alteri dann zu einer Teilnahme an der Befragung bewegt werden. Obwohl somit eine erfolgreiche Realisierung der Netzpersoneninterviews die gleichzeitige Kooperation von Ego und der Bezugsperson notwendig gemacht hat, konnte für immerhin 42,8 Prozent aller Bezugspersonen eine Nachbefragung realisiert werden. Ungeachtet des zufrieden stellenden Erfolges bei beiden Teilen der Netzwerkstudie hat unsere Analyse gezeigt, dass die dennoch aufgetretenen Ausfälle bei keinem der Auswahlschritte als zufällig verteilt angesehen werden können. Demnach hat sich die Bildung von Ego auf die Wahrscheinlichkeit, dass eine Nachbefragung mit den Bezugspersonen realisiert werden konnte und dessen Erwerbstatus auf diese und die Vollständigkeit der Proxy-Angaben über die Netzpersonen ausgewirkt. Das Geschlecht, die Bildung und der Erwerbsstatus der Bezugspersonen war dagegen von Bedeutung dafür, ob mit diesen Personen erfolgreich ein Interview durchgeführt werden konnte. Nach den Ergebnissen weiterer Analysen haben diese Effekte substantielle Konsequenzen in der Form, dass a) die Größenstruktur der letztendlich verfügbaren Netzwerke systematisch nach den Ausfallgründen verzerrt sind, und ZA-Information 56 45 dass b) die soziale Zusammensetzung der für Analysen verfügbaren Nettostichprobe der Alteri deutlich von der der Bruttostichprobe abweicht. Es hat sich herausgestellt, dass die Stärke der Beziehung zwischen Ego und Alter eine besonders wichtige Determinante der Vollständigkeit der Proxy-Angaben und auch der Möglichkeit einer erfolgreichen Nachbefragung der Netzpersonen ist. In beiden Fällen können Informationen über die Merkmale der Bezugspersonen mit höherer Wahrscheinlichkeit erfasst werden, wenn diese in einer engeren Beziehung zu Ego stehen. Der positive Effekt auf das Ausmaß des Item-Nonresponse bei Proxy-Fragen über die Merkmale der Alteri kann als das Resultat einer in intensiveren Beziehungen besseren Verfügbarkeit der abgefragten Informationen interpretiert werden. Die besseren Chancen einer erfolgreichen Nachbefragungen von Netzpersonen mit einer stärken Beziehung zu Ego war dagegen das Ergebnis einer höheren Bereitschaft der Befragten zur Herausgabe der Kontaktinformationen für diese Bezugspersonen. Obwohl dies hätte erwartet werden können, haben die Netzpersonen selbst nicht mit höherer Wahrscheinlichkeit an einer Befragung teilgenommen, wenn sie nach den Angaben von Ego in einer engeren Beziehung zueinander standen. Demnach bewirkt eine engere Beziehung zu Ego entweder tatsächlich keine stärkere Verpflichtung zu einer Befragungsteilnahme oder die von Ego eingeschätzte Beziehungsqualität entspricht nicht der der Alteri (Schenk et al. 1992). Jedenfalls bewirkt der Effekt der Beziehungsstärke insgesamt, dass die Stichprobe der Netzpersonen mit vollständigen Proxy-Informationen und die für die Interviewdaten verfügbar sind, in Richtung auf eine Überrepräsentation von „strong ties“ verzerrt sind. Vor dem Hintergrund der vorliegenden Ergebnisse kann dann mit einer erfolgreicheren Durchführung egozentrierter Netzwerkstudien gerechnet werden, wenn das Ziel die Erfassung der Merkmale des Primärnetzwerkes von Ego ist. Ein weiteres Ergebnis unserer Untersuchung war, dass Befragte, die bei Fragen über ihre eigene Person häufiger mit „weiß nicht“ geantwortet und öfter eine Antwort auf diese Fragen verweigert haben, auch stärker zu „weiß nicht“-Antworten bei den Proxy-Fragen über die Merkmale ihre Bezugspersonen neigten. Diese Neigung war außerdem signifikant mit der Wahrscheinlichkeit assoziiert, keine Kontaktinformation für die betreffende Netzperson herausgeben zu wollen. Dieses Resultat bestätigt die Ergebnisse anderer Studien, wonach unterschiedliche Formen von Nonresponse in substantiellem Ausmaß korreliert sind (Loosveldt et al. 2002; Pickery und Loosveldt 2004). Es kann vermutet werden, dass diese Unterschiede in der generellen Befragungsbereitschaft durch die Haltung der Befragten zu Umfragen bewirkt werden. Diese Interpretation wird durch Ergebnisse gestützt, wonach die generalisierte Einstellung zu Umfragen gleichermaßen unterschiedliche Formen des Nonresponse erklärt: So haben Befragte mit einer positiven und kognitiv stark ausgeprägten 46 ZA-Information 56 Umfrageeinstellung sowohl weniger häufig Fragen mit „weiß nicht“ beantwortet, wie auch in geringerem Umfang die Beantwortung von Fragen verweigert (Stocké 2005). Eine solche generelle Disposition zu Nonresponse bewirkt in egozentrierten Netzwerkstudien, dass sich das Problem fehlender Proxy-Angaben und nicht verfügbare Interviewdaten mit den Bezugspersonen in gewissem Umfang auf bestimmte Hauptbefragte konzentriert. Proxy-Fragen über die Merkmale von Netzpersonen sind sensible Fragen, weil deren Beantwortung leicht als Verletzung der Privatsphäre der betreffenden Person aufgefasst werden kann. Entsprechend hatten wir bei diesen Fragen mit einem substantiellen Anteil an Antwortverweigerungen gerechnet. Dieser Anteil, so das Argument, sollte bei weniger „sichtbaren“ Merkmalen wegen der größeren Privatheit dieser Informationen höher liegen. Diese Befürchtungen wurden in unserer Studie nicht bestätigt. Im Durchschnitt haben die Befragten bei einem nur sehr geringen Anteil von 0,1 Prozent der Proxy-Fragen die Antwort verweigert. Auch lag die Wahrscheinlichkeit von Antwortverweigerungen bei Proxy-Fragen über weniger „sichtbare“ Einstellungen nicht höher als bei solchen über die weniger privaten soziodemografischen Merkmale der Netzpersonen. Das geringe und wenig differenzierte Ausmaß an Antwortverweigerungen ist möglicherweise die Konsequenz dessen, dass den Befragten bei der Beantwortung der Proxy-Fragen die Gelegenheit gegeben wurde, die Netzpersonen nur mit Vornamen oder Pseudonymen zu benennen. Befragte, die die Fragen über Merkmale ihrer Bezugspersonen als Verletzung deren Privatsphäre angesehen haben, konnten in dieser Weise die Anonymität der Alteri wahren und so eine Reduktion der von ihnen selbst gefühlten Sensibilität der Fragen erreichen. Unsere Ergebnisse über die soziodemografischen Korrelate des Item-Nonresponse bei Proxy-Fragen und einer erfolgreichen Nachbefragung von Bezugspersonen sind ein Beitrag zur realistischen Einschätzung der Repräsentativität von Daten egozentrierter Netzwerkstudien. Eine Erklärung der Ursachen der festgestellten Unterschiede im Nonresponse sind sie aber nicht. Es bleibt also die Frage offen, durch welche theoretisch begründbaren und mit den verschiedenen Sozialgruppen korrelierten Erklärungsfaktoren die selektiven Ausfallwahrscheinlichkeiten verstehbar rekonstruiert und kausal erklärt werden können. Eine weitere Frage betrifft die Validität der in unserer Studie zur Bestimmung der Stichprobenselektivität verwendeten Proxy-Angaben der Hauptbefragten über die Merkmale der Netzpersonen. Einige Studien haben gezeigt, dass Proxy-Angaben durch ein beträchtliches Ausmaß an Invalidität betroffen sein können (Dawe und Knight 1997; White und Watkins 2000). So konnte etwa belegt werden, dass Egos ZA-Information 56 47 Proxy-Angaben oft systematisch in Richtung auf eine zu hohe Übereinstimmung der Alteri-Merkmale mit den eigenen verzerrt sind. Allerdings hat sich auch gezeigt, dass Proxy-Angaben über faktische Merkmale, wie die in unserer Untersuchung verwendeten, ein relativ hohes Ausmaß an Übereinstimmung mit den realen Merkmalen der Netzpersonen aufweisen (Pappi und Wolf 1984). Weitere Untersuchungen müssen klären, in welchem Umfang sich unsere Ergebnisse auf die Verhältnisse einer egozentrierten Netzwerkstudie mit einer allgemeinen Bevölkerungsstichprobe generalisieren lassen. Eine solche Generalisierung ist daher nicht ohne Weiteres möglich, da unsere Ergebnisse auf Daten mit einer zwar zufällig ausgewählten, aber dennoch regional beschränkten Stichprobe von Grundschuleltern beruhen. In dieser Hinsicht ist möglicherweise auch von Bedeutung, dass das Thema der Studie „Schule und Bildung“ in unserer Stichprobe auf ein Ausmaß an Interesse gestoßen ist, das über dem eines durchschnittlichen Befragungsgegenstandes in einer allgemeinen Bevölkerungsstichprobe liegt. Es könnte demnach vermutet werden, dass die vorliegenden Ergebnisse über die Antwortbereitschaft der Hauptbefragten ein, verglichen mit anderen Stichproben und Befragungsthemen, zu optimistisches Bild zeichnen. Literatur Burt, Ronald S. 1984: Network Items and the General Social Survey. In: Social Networks 6: 293-339. Crandall, Rick 1976: Validation of Self-Report Measures Using Ratings by Others. In: Sociological Methods & Research 4: 380-400. Dawe, Fiona; Knight, Ian 1997: A Study of Proxy Response on the Labor Force Survey. In: Survey Methodology Bulletin 40: 30-36. Diaz-Bone, Rainer 1997: Ego-zentrierte Netzwerkanalyse und familiale Beziehungssysteme. Wiesbaden: Deutscher Universitäts-Verlag. Dickinson, John R.; Kirzner, Eric 1985: Questionnaire Item Omission as a Function of Within-Group Question Position. In: Journal of Business Research 13: 71-75. Esser, Hartmut 1986: Über die Teilnahme an Befragungen. In: ZUMA-Nachrichten 18: 38-47. Ferber, Robert 1966: Item Nonresponse in a Consumer Survey. In: Public Opinion Quarterly 30: 399-415. Fischer, Claude S. 1982: To Dwell among Friends. Personal Networks in Town and City. Chicago: The University of Chicago. Ganter, Stephan 2003: Soziale Netzwerke und interethnische Distanz: Theoretische und empirische Analysen zum Verhältnis von Deutschen und Ausländern. Wiesbaden: Westdeutscher Verlag. Groves, Robert M.; Singer, Eleanor; Corning, Amy D.; Bowers, Ashley 1999: A Laboratory Approach to Measuring the Effects on Survey Participation of Interview Length, Incentives, Differential Incentives, and Refusal Conversion. In: Journal of Official Statistics 15: 251-268. Huckfeldt, Robert; Morehouse Mendez, Jeannette; Osborn, Tracy 2004: Disagreement, Ambivalence, and Engagement: The Political Consequences of Heterogeneous Networks. In: Political Psychology 25: 65-95. 48 ZA-Information 56 Jäger, Angela 2004: Forschungsprojekt Ethnische Grenzziehung und soziale Kontexte (II). Methodenbericht: Mannheimer Zentrum für Europäische Sozialforschung. Jansen, Dorothea 1999: Einführung in die Netzwerkanalyse: Grundlagen, Methoden, Anwendungen. Opladen: Leske + Budrich. Koßmann, Ingo 1996: Meinungsbildungsprozesse in egozentrierten Netzwerken. Frankfurt a.M.: Lang. Laumann, Edward O. 1969: Friends of Urban Men: An Assessment of Accuracy in Reporting Their Socioeconomic Attributes, Mutual Choice, and Attitude Agreement. In: Sociometry 32: 54-69. Leigh, James H.; Martin jr., Claude R. 1987: “Don’t Know” Item Nonresponse in a Telephone Survey: Effects of Question Form and Respondent Characteristics. In: Journal of Marketing Research 24: 418-424. Long, Scott; Freese, Jeremy 2003: Regression Models for Categorical Dependent Variables Using Stata. College Station: Stata Press. Loosveldt, Geert; Carton, Ann; Pickery, Jan 1998: The Effect of Interviewer and Respondent Characteristics on Refusals in a Panel Survey. In: Koch, Achim; Porst, Rolf (eds.), Nonresponse in Survey Research. Mannheim: Zentrum für Umfragen, Methoden und Analysen (ZUMA). Loosveldt, Geert; Pickery, Jan; Billiet, Jaak 2002: Item Nonresponse as a Predictor of Unit Nonresponse in a Panel Survey. In: Journal of Official Statistics 18: 545-557. Lubbers, Miranda J. 2003: Group Composition and Network Structure in School Classes: A Multilevel Application of the p* Model. In: Social Networks 25: 309-332. Marsden, Peter V. 1990: Network Data and Measurement. In: Annual Review of Sociology 16: 435-463. Martin, Jean; Butcher, Bob 1982: The Quality of Proxy Information – Some Results from a Large-scaleStudy. In: The Statistician 31: 293-319. Pappi, Franz U.; Wolf, Gunter 1984: Wahrnehmung und Realität sozialer Netzwerke. In: Meulemann, Heiner; Reuband, Karl-Heinz (Hrsg.), Soziale Realität im Interview. Frankfurt: Campus. Pfenning, Astrid; Pfenning, Uwe; Mohler, Peter Ph. 1991: Zur Reliabilität von egozentrierten Netzwerken in Massenumfragen. In: ZUMA-Nachrichten 28: 92-108. Pickery, Jan; Loosveldt, Geert 1998: The Impact of Respondent and Interviewer Characteristics on the Number of "No Opinion" Answers: A Multilevel Model for Count Data. In: Quality & Quantity 32: 31-45. Pickery, Jan; Loosveldt, Geert 2004: A Simultaneous Analysis of Interviewer Effects on Various Data Quality Indicators with Identification of Exceptional Interviewers. In: Journal of Official Statistics 20: 77-89. Schenk, Michael (Hrsg.) 1995: Soziale Netzwerke und Massenmedien. Tübingen: J.C.B.Mohr. Schenk, Michael; Mohler, Peter Ph.; Pfenning, Uwe; Ell, Renate 1992: Egozentrierte Netzwerke in der Forschungspraxis: Ausschöpfungsquoten und Validität soziodemographischer Variablen. In: ZUMANachrichten 31: 87-120. Schmitt-Beck, Rüdiger; Koßmann, Ingo 1994: Cross-National Election Project (CNEP): West German and East German Surveys - Study Design, Data Description, Field Report. Mannheim: Mannheimer Zentrum für Europäische Sozialforschung. Schnell, Rainer 1997: Nonresponse in Bevölkerungsumfragen: Ausmaß, Entwicklung und Ursachen. Opladen: Leske + Budrich. Shoemaker, Pamela J.; Eichholz, Martin; Skewes, Elizabeth A. 2002: Item Nonresponse: Distinguishing between Don’t Know and Refuse. In: International Journal of Public Opinion Research 14: 193-201. Singer, Eleanor; van Hoewyk, John; Maher, Mary P. 2000: Experiments with Incentives for Survey Participation in Telephone Surveys. In: Public Opinion Quarterly 64: 171-188. ZA-Information 56 49 STATA Corporation 1999: STATA. Reference Manual. Release 6. (Vol. 3). College Station: Stata Press. Stocké, Volker 2005: Attitudes toward Surveys, Attitude Accessibility and the Effect on Respondents’ Susceptibility to Nonresponse. Quality & Quantity (im Druck). Tourangeau, Roger; Rasinski, Kenneth A. 1988: Cognitive Processes Underlying Context Effects in Attitude Measurement. In: Psychological Bulletin 103: 299-314. van der Poel, Mart 1993: Personal Networks: A Rational-Choice Explanation of Their Size and Composition. Lisse: Swets & Zeitlinger. van Duijn, Marijtje A.J.; Zeggelink, Evelien P.H.; Huisman, Mark; Stokman, Frans N.; Wasseur, Frans W. 2003: Evolution of Sociology Freshmen into a Friendship Network . In: Journal of Mathematical Sociology 27: 153-191. Völker, Beate; Flap, Henk 2001: Weak Ties as a Liability: The Case of East Germany. In: Rationality and Society 13: 397-428. White, Kevin; Watkins, Susan C. 2000: Accuracy, Stability and Reciprocity in Informal Conversational Networks in Rural Kenya. In: Social Networks 22: 337-355. Anhang Tabelle 9 Soziodemografische Merkmale der Elternstichprobe % (N) Geschlecht - weiblich - männlich Gesamt 92.9 (915) 7.1 ( 70) 100.0 (985) Bildung - Hauptschulabschluss - Realschulabschluss - Fachhochschulreife - Abitur Gesamt 19.8 (195) 41.7 (411) 7.7 ( 76) 30.8 (303) 100.0 (985) Erwerbsstatus - Voll-/Teilzeit erwerbstätig - Früher erwerbstätig - Noch nie erwerbstätig Gesamt 54.3 (535) 44.1 (434) 1.6 ( 16) 100.0 (985) Beruflicher Status - Arbeiter - Angestellte - Beamte - Selbstständige - Andere Gesamt 6.7 ( 66) 75.8 (747) 5.6 ( 55) 9.5 ( 94) 2.3 ( 23) 100.0 (985) Lebensalter (Jahre) ∅ (STD) 39.0 (5.01) 50 ZA-Information 56 Persönliche Codes bei Längsschnittstudien: Ein Erfahrungsbericht von Andreas Pöge 1 Zusammenfassung Anhand der Münsteraner Längsschnittdaten des DFG-Projektes „Jugendkriminalität in der modernen Stadt“ wird die Fragebogenzuordnung zwischen den Erhebungswellen mit Hilfe eines Verfahrens über persönliche Codes dargestellt und dessen Auswirkungen geschildert. Solch ein Verfahren ist im Hinblick auf Fehleranfälligkeit und Uneindeutigkeit der Codes und einer Verzerrung der daraus resultierenden Paneldaten nicht unproblematisch. Trotz dieser Probleme ist bei der gewählten Erhebungsmethode, Schülerinterviews im Klassenverband, und der besonderen Berücksichtigung datenschutzrelevanter Belange das genannte Verfahren alternativlos. Abstract On the basis of longitudinal data taken from the DFG project “Juvenile delinquency in modern town” the assignment of questionnaires between the survey waves by means of personal codes is described and the effects are analysed. Such a method is problematic because the codes tend to be ambiguous, prone to errors and the resulting panel data is biased. Despite these problems there is no alternative to the chosen method of assignment with regard to the survey method (interviews with pupils in their classrooms) and in consideration of data protection. 1 Andreas Pöge, M.A., Universität Trier, ist Wissenschaftlicher Mitarbeiter des DFG-Projektes „Jugendkriminalität in der modernen Stadt“. Universität Trier, FB IV – Soziologie, Universitätsring 15, 54286 Trier und Westfälische Wilhelms-Universität Münster, Institut für Kriminalwissenschaften, Abteilung IV – Kriminologie, Bispinghof 24/25, 48143 Münster. E-Mail: [email protected]. ZA-Information 56 1 51 Einleitung Längsschnitt- bzw. Paneluntersuchungen in der Umfrageforschung bringen zwangsläufig das Problem der Verbindung von Daten aus mehreren Erhebungswellen mit sich. Oftmals werden hierbei die Umfrageinformationen mit schon bekannten oder gleichzeitig erhobenen Adressdaten oder anderen datenschutzrechtlich sensiblen Informationen zusammengespielt, um über diese persönlichen Daten die gewünschten Zuordnungen über die Zeit gewährleisten zu können. Anonymität kann bei einem solchen Verfahren meist - mit oftmals negativen Auswirkungen auf die Rücklaufquoten - nicht gewährleistet werden. Im Zuge der nachfolgend näher vorgestellten DFG-geförderten Panelstudie „Jugendkriminalität in der modernen Stadt“2 wurden Jugendliche im Alter von 13 bis 17 Jahren zu Opferwerdung, selbstberichteter Delinquenz sowie verschiedensten Bereichen des täglichen Lebens befragt. Die Befragungen fanden als schriftliche Fragebogeninterviews im Klassenverband in einjährigem Rhythmus in den Städten Münster und Duisburg statt. Angesichts des geringen Alters der Probanden sollten datenschutzrelevante Belange besonders sorgfältig beachtet werden. Möglicherweise wären nicht alle Personen in der Lage, ihre eigenen Interessen zu erkennen und zu vertreten. Außerdem wollte man besondere datenschutz-psychologische Vorsicht walten lassen, um die Stichprobenrückläufe (auch im Hinblick auf die nötige Zustimmung der Erziehungsberechtigten) nicht zu gefährden. Mit der Landesbeauftragten für Datenschutz und Informationsfreiheit Nordrhein-Westfalen wurde deshalb ein Verfahren vereinbart, mit welchem unter Zuhilfenahme von persönlichen Codes ein Zusammenspielen der Daten aus den einzelnen Erhebungswellen, bei Anonymität der Probanden, ermöglicht werden sollte. Dieser Bericht stellt das geplante Zuordnungsverfahren vor und dokumentiert dabei aufgetretene Probleme und deren Lösungsstrategien. 2 Das Projekt „Jugendkriminalität in der modernen Stadt“ Die Ziele des DFG-Projektes „Jugendkriminalität in der modernen Stadt“ liegen unter anderem in der Untersuchung der Entstehung und Entwicklung delinquenter bzw. devianter Handlungsstile bei Jugendlichen und deren sozialer Kontrolle (und zwar formeller Art durch Polizei und Justiz und informeller Art durch Schule und Familie).3 2 Projektleitung: Prof. Dr. Klaus Boers, Institut für Kriminalwissenschaften, WWU Münster und Prof. Dr. Jost Reinecke, Fakultät für Soziologie, Universität Bielefeld, DFG-Förderzeichen: Bo 1234/6-1, 6-2 und Re 832/4-1, 4-2. 3 Zu ersten Ergebnissen siehe Boers, Reinecke, Wittenberg und Motzke (2002). 52 ZA-Information 56 Abbildung 1 Erhebungsdesign 2000-2004 Jahrgang 11 Münster Duisburg 10 9 Münster Münster Duisburg Duisburg 8 7 Duisburg Münster Münster Duisburg Münster 2000 2001 2002 2003 2004 Jahr Untersucht werden unter anderem die dynamischen Zusammenhänge zwischen Sozialstruktur und Delinquenz, sowie die Art der Moderierung von Selektionsprozessen formeller Kontrollinstanzen über die Jugendphase hinweg. Insbesondere wird hierbei den Fragen nachgegangen, ob und inwieweit Delinquenz episodaler Teil der Dynamik jugendlicher Milieus4 ist oder ob und inwieweit sich Delinquenz in der institutionellen Eigendynamik selektiver Kontrollprozesse zu kriminellen Karrieren verdichtet. Der methodische Zugang zu diesen Problemkomplexen erforderte ein für diesen theoretischen und inhaltlichen Kontext in Deutschland zum ersten Mal geplantes kohortenspezifisches Längsschnittdesign, das in zwei westdeutschen Städten unterschiedlicher Größe und Sozialstruktur, Münster und Duisburg, umgesetzt wurde. Die durch wiederholte Schülerbefragungen erhobenen Längsschnittinformationen (Paneldaten) sollen sowohl die Analyse von Ursache-Wirkungsbeziehungen zwischen den zentralen Untersuchungsvariablen (einschließlich möglicher Rückkopplungsprozesse) als auch die Analyse von Stabilität und Veränderung der individuellen Kriminalitätsraten ermöglichen. 4 Zu ersten Ergebnisse siehe Boers und Pöge (2003). ZA-Information 56 53 Seit dem Jahr 2000 wurden in einjährigen Abständen an Münsteraner5, seit dem Jahr 2002 auch an Duisburger Schulen Fragebogeninterviews durchgeführt. Entsprechend der methodischen Konzeption des Forschungsprojektes als Panelstudie, wurden dabei dieselben Personen wiederholt befragt. Der genaue Erhebungsplan kann Abbildung 1 entnommen werden.6 2.1 Durchführung der Befragungen Aus Gründen des Umfangs und der bisher zur Verfügung stehenden Daten (erste Erhebung Münster im Jahr 2000, erste Erhebung Duisburg im Jahr 2002) wird im Folgenden nur auf die Münsteraner Daten eingegangen. In der ersten Münsteraner Schülerbefragung im Jahr 2000 wurde eine Vollerhebung der Schülerinnen und Schüler der Jahrgangsstufe 7 angestrebt. Ergänzt wurde die Studie durch Stichproben aus den Klassen des 9. und 11. Jahrgangs sowie den Eingangsklassen an den Münsteraner Berufskollegs.7 Die zweite Schülerbefragung im Jahr 2001 strebte eine Wiederbefragung der Schülerinnen und Schüler aus der ersten Studie an. Alle Schülerinnen und Schüler der Jahrgangsstufe 8, die Schulen besuchten, die an der ersten Erhebung teilgenommen hatten, sollten erneut wiederbefragt werden.8 Der geschilderten Erhebungssystematik folgend sollten in der dritten und vierten Schülerbefragung im Jahr 20029 und 200310 alle Schülerinnen und Schüler der Jahrgangsstufe 9 bzw. 10, die eine Schule besuchten, die an den ersten beiden Erhebungen teilgenommen hatte, wiederbefragt werden. Der eingesetzte Fragebogen zu Opferwerdung, selbstberichteter Delinquenz, Ethnizität11, Erziehungsstilen12, Konfliktverhalten, Kriminalitätseinstellungen13 sowie zu Lebens-, Freizeit- und Konsumstilen war für eine schriftliche, anonyme Befragung der Schülerinnen und Schüler konzipiert. So weit wie möglich wurden Fragen verwendet, die bereits in anderen Jugendstudien eingesetzt wurden. Die Fragebögen der 5 Zu ersten Ergebnissen siehe Boers und Kurz (2000). 6 Zur Dokumentation der Münsteraner Panel-Studie 2000-2003 vgl. Pöge (2005b). 7 Zur Dokumentation der Münsteraner Studie aus dem Jahr 2000 vgl. Motzke und Wittenberg (2004). 8 Zur Dokumentation der Münsteraner Studie aus dem Jahr 2001 vgl. Wittenberg (2004a). 9 Zur Dokumentation der Studie aus dem Jahr 2002 vgl. Wittenberg (2004b). 10 Zur Dokumentation der Studie aus dem Jahr 2003 vgl. Wittenberg (2004c). 11 Zu ersten Ergebnissen siehe Pöge (2005a). 12 Zu ersten Ergebnissen siehe Raithel (2002). 13 Zu ersten Ergebnissen siehe Pöge (2002). 54 ZA-Information 56 einzelnen Jahre sind aufgrund des Panelansatzes der Studie weitgehend identisch.14 Vor den jeweiligen Haupterhebungen wurden die Eltern und Schüler über die Untersuchungsziele informiert und auf die Freiwilligkeit der Teilnahme hingewiesen. Die schriftlichen Befragungen fanden im Klassenverband statt, der zeitliche Rahmen erstreckte sich über eine Schuldoppelstunde. In wenigen Einzelfällen kam es jedoch vor, dass die Beantwortung der Fragen mehr Zeit in Anspruch nahm, insbesondere wenn sprachliche Schwierigkeiten die Beantwortung beeinträchtigten. 2.2 Datengrundlage der Querschnitte Einige grundlegende Informationen der Münsteraner Querschnitts-Datengrundlage können Tabelle 1 entnommen werden. Die Stichprobengröße der einzelnen Querschnitte liegt zwischen 1.819 und 1.949 Personen. Grundlage hierfür sind Schülerinnen und Schüler, die Schulen besuchten, welche den Befragungen in jedem Zeitpunkt zugestimmt hatten. Unberücksichtigt blieben Fälle, deren Fragebögen Plausibilitätskontrollen nicht standhielten. Um den Rücklauf bestimmen zu können, wurde die Schulstatistik herangezogen, wiederum Bezug nehmend auf die Schulen, die in jedem Befragungszeitpunkt an der Umfrage teilnahmen. Die sich hieraus ergebenden Quoten liegen, wie in Tabelle 1 ersichtlich, zwischen 86 und 88 Prozent, sind also als sehr gut zu bezeichnen. Tabelle 1 Zusammenfassung der Befragungen in Münster 2000-2003 Münster Münster Münster Münster 2000 (t1) 2001 (t2) 2002 (t3) 2003 (t4) Jahrgang 7 8 9 10 Schulstatistik (N) 2.105 2.181 2.251 2.077 Stichprobe (N) 1.850 1.915 1.947 1.819 Rücklaufquote (%) 88 88 86 88 Geschlecht (Stichprobe) Anteil Mädchen (%) 49 50 51 50 Anteil Jungen (%) 51 50 49 50 Alter (Stichprobe) Durchschnittsalter in Jahren 13 14 15 16 14 Muster der verwendeten Fragebögen können über den Autor bezogen werden. ZA-Information 56 3 55 Geplante Fragebogenzuordung mit persönlichen Codes Um eine Zuordnung der Fragebögen aus den verschiedenen Erhebungswellen zu ermöglichen, wurden über Codeblätter abgefragte Codes verwendet. In jeder Erhebungswelle wurden solche Codeblätter den Schülerinnen und Schülern zum Ausfüllen vorgelegt, so dass bei einem stabilen Antwortverhalten der Schüler, die Codeblätter, die von ein und derselben Person in den verschiedenen Wellen ausgefüllt wurden, denselben Code aufweisen mussten (siehe Abbildung 2). Im Einzelnen waren die geplanten Schritte wie folgt: Während der Befragung im Klassenverband füllen die Schülerinnen und Schüler zunächst die Codeblätter und die Fragebögen sorgfältig aus. Auf einem Codeblatt und einem Fragebogen, die dieselbe Person ausfüllt, befindet sich dieselbe Nummer. Die Codeblätter und Fragebögen werden getrennt voneinander in Briefumschläge gesteckt, verschlossen und abgegeben. Codeblätter und Fragebögen gehen getrennt voneinander in die Datenerfassung, das einzige Verbindeglied stellt die Nummer auf Codeblatt und Fragebogen dar. Daraufhin werden Codeblätter und die Original-Fragebögen vernichtet. Die persönlichen Codes können dann mit den Fragebogendaten anhand der Codeblatt- bzw. Fragebogennummer zusammengespielt werden. Dieses Procedere sollte in jeder Erhebungswelle wiederholt werden, wodurch die Fragebogendaten über den Code einander zugeordnet werden könnten, ohne dass jemals ursprüngliche Informationen aus den Codeblatt-Fragen mit Informationen aus den Fragebögen zusammengeführt werden müssten. Dieses Verfahren sollte somit die völlige Anonymität der befragten Personen gewährleisten. Die persönlichen Fragen, die auf den Codeblättern gestellt wurden, betrafen die Privatsphäre der Befragten und deren Familien und mussten mit dem Datenschutz abgestimmt werden. Während der ersten Befragung im Jahr 2000 sollte auf den Codeblättern15 hierbei Folgendes handschriftlich notiert werden: 1. Der letzte Buchstabe der natürlichen Haarfarbe des Vaters 2. Der erste Buchstabe des Vornamens der Oma mütterlicherseits 3. Der letzte Buchstabe der eigenen natürlichen Haarfarbe 4. Die beiden Tagesziffern des eigenen Geburtstages 5. Der letzte Buchstabe der eigenen Augenfarbe 15 Muster der verwendeten Codeblätter können über den Autor bezogen werden. 56 Abbildung 2 ZA-Information 56 Geplantes Zuordnungsverfahren in Münster 2000/2001 Im Jahr 2001 wurde das Codeblatt um die Fragen nach Klassenwechsel und Schulwechsel ergänzt, hierbei konnte eine Antwortvorgabe angekreuzt werden. Für die Befragung in 2002 wurde das Codeblatt um die Frage nach einer Befragungsteilnahme im vorigen Jahr erweitert. In 2003 wurde das Layout grundlegend geändert, so dass kein handschriftliches Ausfüllen mehr erfolgen musste, sondern alle Antwortvorgaben zum Ankreuzen aufgeführt wurden. Außerdem wurde eine weitere Frage aufgenommen, nämlich die nach dem ersten Buchstaben des eigenen Vornamens.16 Darüber hinaus wurde die Frage nach einem Klassenwechsel zum besseren Verständnis umformuliert. Das geschilderte Verfahren mit diesen Fragen konnte nur unter zwei Grundvoraussetzungen funktionieren. Als erste Grundvoraussetzung mussten die Befragungsteilnehmerinnen und -teilnehmer in den unterschiedlichen Wellen exakt denselben Code aufweisen, da die Zuordnung über den gesamten Code erfolgen sollte. Dies bedeutete insbesondere, dass die Codefragen auf den Codeblättern der Befragungsjahre von den Probanden exakt gleich beantwortet werden mussten. Ergäben sich 16 Diese Frage blieb jedoch ohne Bedeutung, da in Münster auf eine weitere Befragungswelle verzichtet wurde. ZA-Information 56 57 Differenzen im Antwortmuster ein und derselben Person bei den Codefragen der unterschiedlichen Jahre, könnte eine Zuordnung in der geplanten Art und Weise (über den kompletten Code) nicht mehr stattfinden! Als zweite Grundvoraussetzung musste gewährleistet sein, dass jede Person einen eindeutigen Code aufwies. Hätten mehrere Personen denselben Code, könnte eine Zuordnung in der geplanten Art und Weise (ohne Hinzunahme weiterer Informationen) nicht mehr stattfinden! 3.1 Durchführung des Verfahrens Bei der technischen Durchführung der Zuordnungen der Fragebögen aus den einzelnen Wellen traten Probleme auf, die die Grundvoraussetzungen des Verfahrens verletzten und Änderungen notwendig machten. Eine Analyse der Daten, die über die ausgefüllten Codeblätter zur Verfügung stehen, lässt in Bezug auf die gebildeten Codes erkennen, dass in jeder Welle nicht jede Schülerin und jeder Schüler einen eindeutigen (d. h. nur einmal vorkommenden) Code aufweist. Wie in Tabelle 2 ersichtlich, treten in jeder der vier Erhebungswellen jeweils nur bei ungefähr drei Vierteln der Probanden eindeutige Codes auf (z. B. gibt es in 2000 nur 1.497 einmal vorkommende Codes). Bei einem Viertel der Befragten weisen unterschiedliche Personen einen gleichen Code auf (in 2001 trat sogar ein Code sechs Mal auf). Diese Personen sind über den Code ohne Hinzunahme weiterer Informationen nicht eindeutig zu identifizieren. Im Folgenden soll dieses Problem als Problem der Identifizierung bezeichnet werden. Wählt man aus jeder Welle nur die eindeutigen Codes aus und ordnet zwischen den Wellen diese Codes einander zu, so finden sich zwischen jeweils zwei Erhebungszeitpunkten lediglich rund 600 Zuordnungen mit exakt gleichem Code (für t3/t4 siehe Tabelle 5). Man kann also davon ausgehen, dass gleiche Personen in unterschiedlichen Wellen nicht denselben Code aufweisen. Die Hauptursache hierfür liegt darin, dass die Schülerinnen und Schüler den Code nicht exakt in jeder Welle reproduzieren konnten. Dieses Problem soll im Folgenden als Problem der Reproduktion bezeichnet werden. Die Grundprobleme des Verfahrens sind also: Mehrfaches Auftreten gleicher Codes innerhalb der Wellen (Identifizierung) Zu geringes Auftreten gleicher Codes zwischen den Wellen (Reproduktion) Die oben aufgeführten zwei Grundvoraussetzungen des geplanten Verfahrens sind offensichtlich (und schwerwiegend) verletzt. Nachfolgend werden die Ursachen für die aufgetretenen Probleme analysiert und die schließlich angewendete Problemlösestrategie erläutert. 58 ZA-Information 56 Tabelle 2 Häufigkeiten der Codes 2000 (t1) 2001 (t2) 2002 (t3) Häufigkeit Anz. Codes 1 1.497 1.497 1.538 1.538 1.533 2 208 416 161 322 3 28 84 21 4 3 12 5 1 6 Summea Gesamt Gesamt 2003 (t4) Anz. Codes Gesamt 1.533 1.449 1.449 176 352 151 302 63 24 72 21 63 1 4 6 24 4 16 5 - - 1 5 1 5 - - 1 6 - - - - 1.737 2.014 1.722 1.933 1.740 1.986 1.626 1.835 Anz. Codes Anz. Codes Gesamt a Die Anzahlen für die Codeblätter können von den Stichprobengrößen abweichen. Zum einen wurden die Codeblätter von Schulen, die nicht an allen Befragungszeitpunkten teilnahmen, zum anderen Codeblätter deren Fragebögen durch die Plausibilitätskontrollen fielen, verwendet. 3.2 Probleme der Zuordnungsmethode Die Ursachen für die aufgetretenen Zuordnungsprobleme der Identifizierung und Reproduktion sind unterschiedlicher Art und überlappen sich teilweise. Zusammenfassend lassen sich folgende Hauptursachen ausmachen: Datenschutzbedingte Vorgaben, die das Ausfüllen der Codeblätter durch komplizierte Fragestellungen erschwerten Zu hohe Schwierigkeit der Codefragen, die eine Reproduzierbarkeit erschwerte Ungünstige Auswahl der Fragen bzw. Antwort-Buchstaben, die eine eindeutige Identifizierung der Codes verhinderte Mangelnde Reproduktion der Codes durch die Schüler aufgrund von Flüchtigkeitsfehlern oder beabsichtigten Falschangaben beim Ausfüllen der Codeblätter Layoutmängel und dadurch unleserliches Ausfüllen der Codeblätter ZA-Information 56 59 Datenschutzvorgaben Durch die nötige Abstimmung mit dem Datenschutz musste bei der Fragengestaltung Rücksicht genommen werden. Dies resultierte in einem Kompromiss dergestalt, dass nicht bei den Antworten auf jede Frage (wie ursprünglich geplant) die ersten Buchstaben notiert werden konnten, sondern zum Teil die jeweils letzten. Die Begründung hierfür lag in der Befürchtung, dass, falls die im Klassenverband ausgefüllten Codeblätter in die Hände von Personen mit genügend Information über die Schülerinnen und Schüler fielen, diese zu identifizieren wären. Dann hätten die datenschutzrelevanten Informationen aus den Fragebögen im ungünstigsten Fall von unbefugten Personen den einzelnen Schülerinnen und Schülern zugeordnet werden können und diesen hieraus Nachteile entstehen können. Der Wechsel von „erster Buchstabe…“ und „letzter Buchstabe…“ scheint jedoch möglicherweise für die ausfüllenden Personen zu unübersichtlich gewesen zu sein. Zu hohe Schwierigkeit der Codefragen Da ein erheblicher Teil der Schülerinnen und Schüler nicht in der Lage war, das Codeblatt in beiden Jahren richtig oder zumindest gleich auszufüllen, muss die Frage gestellt werden, ob die Codefragen zu schwierig waren. Möglicherweise waren nicht alle Schülerinnen und Schüler der vier befragten Jahrgangsstufen in der Lage, die oben genannten Fragen richtig zu beantworten oder sich bei der Beantwortung genügend zu konzentrieren. Zwar waren einige Fragen schwieriger zu beantworten, z. B. Haarfarbe des Vaters oder Vorname der Oma mütterlicherseits, falls persönliche Gründe die Beantwortung schwierig oder unmöglich machten (z. B. beim Fehlen einer solchen Bezugsperson). Jedoch waren die Interviewerinnen und Interviewer diesbezüglichen angewiesen worden, die problematischen Fälle vor dem Ausfüllen anzusprechen bzw. in diesen Fällen Antwortvorgaben zu nennen. Ungünstige Auswahl und Anzahl an Fragen für die Identifizierung Neben der Tatsache, dass Codes, die in beiden Jahren gleich sein müssten, unterschiedlich sind, ist das Auftreten von Mehrfachcodes das gewichtigste Problem. Offensichtlich eignet sich der Code, so wie er konzipiert ist, nicht dazu, die ca. 2.000 Umfrageteilnehmerinnen und -teilnehmer eindeutig zu bestimmen. Dieser Code setzt sich, wie oben erläutert, aus Buchstaben bzw. Zahlen zusammen, die aus den Antworten der fünf Codefragen hervorgehen. Die Anzahl der Kombinationsmöglichkeiten, die sich aus diesen Zahlen und Buchstaben ergeben, ist nicht zahlreich genug, als dass mit genügender Wahrscheinlichkeit jede Schülerin und jeder 60 ZA-Information 56 Schüler einen einzigartigen Code erhält.17 Um eine Identifizierung der Codeblätter bzw. Fragebögen schon in einer Welle zu ermöglichen, müssen zusätzliche Informationen hinzugezogen werden. Eine Lösung für dieses Problem kann nur in der Modifizierung der Fragen bestehen, so dass eine höhere Anzahl von Antwortbuchstaben bzw. -zahlen erreicht wird, oder in der Erhöhung der Anzahl der Codevariablen bzw. -fragen selbst. Eine Änderung der Fragen hätte den großen Nachteil, dass der Code über die Zeit dann nicht mehr derselbe sein kann, also Bögen aus späteren Wellen nicht mehr über den Code zugeordnet werden könnten. Eine Erhöhung der Anzahl der Codevariablen hat den Nachteil, dass dadurch natürlich auch die Fehleranfälligkeit des Codes weiter steigen und somit das Problem der Reproduktion eher verschärft würde. Beabsichtigte Falschangaben und Flüchtigkeitsfehler Bei der Beantwortung der einzelnen Fragen auf dem Codeblatt können selbstverständlich sowohl beabsichtigte wie unbeabsichtigte Fehler auftreten, so dass der Code ein und desselben Schülers oder derselben Schülerin aus zwei Jahren unterschiedlich sein kann, obwohl er gleich sein müsste. Grundsätzlich kann dieses Problem bei jeder Frage auftreten, absichtliche Falschangaben können nicht vermieden werden, jedoch sollten leicht und eindeutig zu beantwortende Fragen unbeabsichtigte Fehler vermeiden helfen. Layoutmängel und dadurch unleserliches Ausfüllen der Codeblätter Ein nicht vom Forschungsteam direkt beeinflussbares Problem, welches in diesem Ausmaß nicht zu erwarten war, ist das zum Teil unleserliche Ausfüllen der Codeblätter. Dies führte dazu, dass in einer Reihe von Fällen die Codes nicht eindeutig zu entziffern waren, somit nicht oder nur eingeschränkt für die EDV zur Verfügung standen und deshalb zu fehlerhaften bzw. keinen Zuordnungen führten. Eine Lösung dieses Problems ist für die Datensätze 2000, 2001 und 2002 nicht möglich, jedoch 17 Allgemein kann hierzu folgendes Problem formuliert werden: Bei einem Zufallsexperiment mit „Zurücklegen“ wird aus einer Menge der Größe N von unterschiedlichen Codes eine bestimmte Anzahl m von Codes gezogen. Die Frage ist nun, wie groß die Codemenge sein muss, damit die Wahrscheinlichkeit P(N,m), dass kein Code mehrfach gezogen wird, mindestens einen bestimmten Wert, z. B. 0,95, übersteigt. Eine allgemeine, näherungsweise Lösung lautet: N (m) ≈ 9,74 x 2 − 9,4 x + 1,1 . (1) In unserem Fall, bei ca. 2.000 zu identifizierenden Personen lautet die Lösung näherungsweise 39 Millionen. Die Codemenge N ergibt sich aus der Multiplikation der Merkmalsausprägungen der einzelnen Codestellen. Im vorliegenden Fall reicht die Anzahl der Ausprägungen nicht aus, um die erforderliche Größe der Codemenge N zu erreichen (Zur Herleitung vgl. Pöge 2005b, S. 63.) ZA-Information 56 61 wurde das Codeblattlayout dergestalt geändert, dass in der Erhebungswelle 2003 kein handschriftliches Ausfüllen mehr nötig war, sondern nur noch Antwortvorgaben angekreuzt werden mussten. Ein solches Layout mit vorgegebenen Antwortkästchen, die nur angekreuzt werden müssen, erwies sich als sehr viel vorteilhafter. Zwar verschlechterte sich dadurch die Übersichtlichkeit des Codeblattes leicht, jedoch wiegt der Vorteil der besseren Lesbarkeit dieses Problem wieder auf. 4 Zuordnungsverfahren mit manuellem Handschriftenvergleich Wie oben aufgezeigt, hätte das ursprünglich geplante Verfahren nur zu einer Zuordnung von rund 600 Personen geführt (für t3/t4 siehe Tabelle 5). Beide Grundvoraussetzungen des Verfahrens sind nicht ausreichend gewährleistet, um eine Zuordnung eines befriedigend großen Teils der Probanden zu ermöglichen. Um weitere Zuordnungen realisieren zu können, musste das ursprüngliche Zuordnungsverfahren abgeändert werden. Das Problem der Identifizierung erforderte die Hinzunahme weiterer Informationen zum Code, das Problem der Reproduktion erforderte das Zuordnen von Personen über „fehlerhafte“ Codes. Nur so konnten weitere Zuordnungen gefunden werden. Um Fehler im Code zulassen zu können, musste auf eine Zuordnung über die Codes als komplette Zeichen-Zahlenkette verzichtet werden. Bei der Identifizierung sowohl der einzelnen Codes, als auch bei deren Zuordnung zwischen den Wellen wurden darüber hinaus die Schulinformation18 und das Geschlecht der Probanden hinzugenommen. Das schließlich angewendete, fehlertolerante Verfahren mit manuellem Handschriftenvergleich bestand aus drei Schritten: In einem ersten Schritt wurden maschinell alle exakt übereinstimmenden Codes aus zwei Erhebungswellen herausgefunden. Die zusammengehörigen Fragebögen und Codeblätter wurden daraufhin einer manuellen Handschriftenkontrolle unterzogen, wobei die offensichtlich nicht passenden Zuordnungen aussortiert wurden. Die passenden Fragebogennummern wurden aus dem Datensatz genommen, so dass sie für die nachfolgenden Schritte nicht mehr zur Verfügung standen. Im zweiten Schritt wurde nach Codeübereinstimmungen unter Zulassung eines Fehlers und im dritten Schritt unter Zulassung von zwei Fehlern gesucht und die zugehörigen Bogennummern herausgeschrieben. Auch in diesen beiden Schritten wurden als Validierung der Zuordnungen Handschriftenvergleiche durchgeführt, die offensichtlich nicht passenden Zuordnungen verworfen und vor der Durchführung des nächsten Schrittes 18 Die Hinzunahme der Schulinformation war beim ursprünglichen Verfahren für die Identifizierung einkalkuliert worden; in diesen Ausführungen wurde auf eine Darstellung bewusst verzichtet, um die beschränkte Leistungsfähigkeit des Codes stärker zu betonen. 62 ZA-Information 56 die passenden Nummern aus dem Datensatz entfernt. Das geschilderte Verfahren ist codegeleitet und hierarchisch. Zum einen ist das erste Kriterium für eine Zuordnung nach wie vor der Code, es wurden nur offensichtliche Fehlzuordnungen ausgesondert, zum anderen wird durch die schrittweise Durchführung gewährleistet, dass weniger Fehler im Code bei der Zuordnung bevorzugt werden. 4.1 Realisierte Paneldatensätze Münster 2000-2003 Mit Hilfe des oben beschriebenen Zuordnungsverfahrens mit manuellem Handschriftenvergleich konnten die in Tabelle 3 aufgeführten Datensatzgrößen erreicht werden. So war es möglich, in den Daten aus jeweils zwei aufeinander folgenden Erhebungszeitpunkten zwischen ca. 1.270 und ca. 1.400 Zuordnungen zu finden. Für drei aufeinander folgende Erhebungspunkte ergaben sich 997 bzw. 1.075 und für alle vier Zeitpunkte 813 Zuordnungen. Tabelle 3 Datensatz Paneldatensätze Münster 2000-2003 N Beschreibung Pt1,t2 1.271 Zwei-Wellen-Panel Münster 2000/2001 Pt2,t3 1.373 Zwei-Wellen-Panel Münster 2001/2002 Pt3,t4 1.406 Zwei-Wellen-Panel Münster 2002/2003 Pt1,t2,t3 997 Drei-Wellen-Panel Münster 2000/2001/2002 Pt2,t3,t4 1.075 Drei-Wellen-Panel Münster 2001/2002/2003 Pt1,t2,t3,t4 813 Vier-Wellen-Panel Münster 2000/2001/2002/2003 4.2 Bewertung der Ausschöpfung Will man eine Bewertung der Ausschöpfungsquote anhand der realisierten Paneldatensätze vornehmen, so muss zunächst eine Unterscheidung zwischen Zuordnungsverfahren und gesamter Erhebungsmethode getroffen werden. Da zur eigentlichen Grundgesamtheit der Münsteraner Schulbefragung alle Schülerinnen und Schüler gehören, die zu den Befragungszeitpunkten auf eine Münsteraner Schule gingen, könnte die Bewertung der gesamten Erhebungsmethode anhand der Schülerzahlen der Schulstatistik erfolgen. Dieser Fragestellung soll hier jedoch nicht weiter nachgegangen werden, vielmehr soll das Zuordnungsverfahren begutachtet werden. Es soll die Frage im Vordergrund stehen, wie viele der Fragebögen, die hätten zugeordnet werden können, mit dem oben vorgestellten, tatsächlich angewendeten hierarchischen Zuordnungsverfahren tatsächlich gefunden werden konnten. ZA-Information 56 63 Die Frage nach der Anzahl derjenigen Schülerinnen und Schüler, deren Bögen zwischen den Befragungswellen hätten zugeordnet werden können, ist dabei schwieriger zu beantworten, als dies auf den ersten Blick erscheint.19 Zunächst beschränkt sich auf Schulebene die Grundgesamtheit auf die Jugendlichen der befragten Jahrgänge, die eine Schule besuchten, die zu allen Zeitpunkten der Befragung zustimmten. Diese Anzahl kann relativ genau den jeweiligen Schulstatistiken entnommen werden (siehe Tabelle 1). Auch die Schulstatistiken selbst sind meist nicht exakt, da die ausgewiesenen Belegungszahlen zu den Statistikstichtagen durch zwischenzeitliche Ab- und Zugänge der Schulen von den tatsächlichen Belegungen an den Befragungsstichtagen abweichen können; diese Abweichungen scheinen jedoch vernachlässigbar klein. Darüber hinaus problematisch sind Veränderungen der Schulpopulation über den gesamten Befragungszeitraum (vier Jahre) im Sinne von Zu- und Wegzügen nach bzw. aus Münster, Schulwechsler in bzw. von Schulen, die nicht an den Befragungen teilnahmen, Sitzenbleiber etc. Durch die Wahl der Erhebungsmethode (Fragebogeninterviews im Klassenverband) ist die erreichbare Probandenzahl auf diejenigen beschränkt, die an den jeweiligen Befragungstagen anwesend waren. Da die Fragebogenzuordnungen über die oben geschilderte Methode unter Zuhilfenahme von Codeblättern vorgenommen wurden, reduziert sich die Zahl weiter auf diejenigen Befragten, die ihr Codeblatt verwertbar ausgefüllt hatten.20 Da als einzige Referenzdaten die aggregierten Schulstatistiken der vier Befragungsjahre zur Verfügung stehen und diese keinen befriedigenden Aufschluss über die oben genannten Probleme geben können, kann die Zahl der Probanden, die tatsächlich mehrfach befragt wurden, also hätten zugeordnet werden können, nur geschätzt werden. Um die zu erwartende Zahl (Ne) der möglichen Zuordnungen 19 Dazu folgendes Beispiel: Zum Zeitpunkt t1 gingen 2.105 Schülerinnen und Schüler auf die von uns befragten Schulen, 1.850 von ihnen konnten von uns (verwertbar) befragt werden, 255 nicht. Zum Zeitpunkt t2 waren es laut Schulstatistik 2.181 Probanden, von denen wir 1.915 befragen konnten, 266 nicht. Wie viele der Probanden aus t1 haben wir zu t2 wiederbefragt bzw. wie viele der Fragebögen aus t1 können Bögen aus t2 theoretisch zugeordnet werden? Nimmt man an, dass die Schulpopulation (relativ) stabil blieb, kann man zwei Extrempunkte formulieren. Zum einen könnten alle 1.850 wiederbefragt worden sein, die 255 Ausfälle (t1) sind in den 266 Ausfällen (t2) enthalten. Zum anderen könnten alle 255 Ausfälle (t1) zum zweiten Zeitpunkt wiederbefragt worden sein, alle 266 Ausfälle (t2) könnten allerdings im ersten Zeitpunkt schon befragt worden sein, so dass nur noch 1.329 Personen zu beiden Zeitpunkten befragt wurden. Die realisierten Zuordnungen von 1.271 ergeben somit Quoten von 96 Prozent im besten oder 68 Prozent im schlechtesten Fall. Beides ist unwahrscheinlich. 20 Lässt man diese Betrachtungen außer Acht, so sind noch 813 Jugendliche von den ursprünglichen 1.850 im Vier-Wellen-Panel enthalten. Dies sind Jugendliche, die im beobachteten Zeitraum dreimal versetzt wurden, nie umgezogen sind, nie auf eine Schule außerhalb der Stichprobe umgeschult wurden, nie an den Befragungstagen gefehlt haben und bei jeder Befragung einen hinreichenden Code geliefert haben. Bei einem sehr konservativen Standpunkt kann hieraus mit einer gewissen Berechtigung eine Panelmortalität von 56 Prozent abgeleitet werden. 64 ZA-Information 56 zwischen den jeweiligen Zeitpunkten schätzen zu können, seien folgende Annahmen zugelassen: 1. In der größten offiziellen Schulpopulation der Befragungszeitpunkte sind alle Schülerinnen und Schüler der anderen Zeitpunkte enthalten 2. Die Differenzen zwischen den Stichproben und den jeweiligen Schulstatistiken beruhen auf zufälligen, stichprobenneutralen Ausfällen Annahme 1 ist notwendig, um eine Referenzgröße über die Anzahl aller Probanden zu bestimmen, die überhaupt zu irgendeinem Zeitpunkt hätten teilnehmen können. Problematisch ist die Annahme deshalb, da Veränderungen der Schulpopulation stattgefunden haben, die auf Aggregatebene nicht mehr erkennbar sind. Es wird vernachlässigt, dass zu jedem Zeitpunkt ein gewisser Teil an Schülerinnen und Schülern nicht in der größten Population enthalten waren. Dies führt zu einer Unterschätzung der Zuordnungsquoten. Annahme 2 ist notwendig, um die Zahl der Ausfälle (Querschnitts-Rückläufe) einzubeziehen. Sie ist problematisch, da in der Realität die Befragungsteilnahme vermutlich nicht zufällig, sondern von bestimmten Faktoren abhängig ist. So haben erste Analysen gezeigt, dass der Rücklauf in den Querschnitten unter anderem von Geschlecht und Schulform abhängt, es kann also vermutet werden, dass auch der Anteil der Personen, die zu mehreren Zeitpunkten nicht teilnahmen, nicht zufällig verteilt ist, sondern von denselben Faktoren abhängt. Dies führt tendenziell zu einer Überschätzung der Zuordnungsquoten. Lässt man die o. g. Annahmen zu, kann formuliert werden: Die zu erwartende Anzahl der Befragungsteilnehmer (Ne) zu bestimmten Zeitpunkten (ti) ergibt sich aus der größten Schulpopulation (max(N(Sti)) multipliziert mit dem Produkt der Quotienten aus den jeweiligen Anzahlen der realisierten Querschnittsstichproben (N(Qti)) und den Schulpopulationen nach Schulstatistik (N(Sti )).21 k N e = max ( N ( S ti )) * ∏ i =1,..., k i =1 ( N (Qti )) ( N ( S ti )) (2) 21 Anders ausgedrückt entspricht dies dem Produkt der größten Ausgangsstichprobe und den multiplizierten Rücklaufquoten der beteiligten Querschnitte. ZA-Information 56 65 Aus den zu erwartenden Anzahlen (Ne) und den tatsächlich beobachteten bzw. realisierten Anzahlen der Zuordnungen (Nb) lassen sich nun die in Tabelle 4 angeführten Quoten berechnen. Sie dürften, wie oben angedeutet, die „wahre“ Zuordnungsquote eher unterschätzen, da auf aggregierter Ebene der Schulstatistiken nicht sichtbare Veränderungen (Sitzenbleiber, Umzüge etc., die sich pro Jahr (aber nicht im Panel) ausgleichen), nicht berücksichtigt werden. Dieser Anteil liegt schätzungsweise bei mindestens zehn Prozent. Eine Überschätzung der Quoten durch nicht berücksichtigte, systematische Ausfälle erscheint im Vergleich dazu weniger bedeutsam. Tabelle 4 Zuordnungsgüte der Paneldaten Münster 2000-2003 Ne Nb Zuordnungsquote (%) Pt1,t2 1.683 1.271 76 Pt2,t3 1.710 1.373 80 Pt3,t4 1.705 1.406 82 Pt1,t2,t3 1.502 997 66 Pt2,t3,t4 1.497 1.075 72 Pt1,t2,t3,t4 1.316 813 62 Ne bedeutet erwartetes N nach Formel 2 Nb bedeutet beobachtetes N Um die Zuordnungsquoten der realisierten Paneldatensätze zu bewerten, können Quoten, die in anderen Panelstudien erreicht wurden, herangezogen werden. Ein übliches Verfahren bei Paneluntersuchungen stellt die Zuordnung der Fragebögen über erhobene Adressen der Schülerinnen und Schüler dar. Hierbei tritt erfahrungsgemäß schon bei der Adresserhebung ein Ausfall von ca. 50 Prozent auf, der im Laufe solcher Addresspanels deutlich größer wird.22 Die Zuordnungsquoten für die Zwei-Wellen-Panels aus jeweils zwei aufeinander folgenden Zeitpunkten liegen zwischen 76 und 82 Prozent. Es ist ersichtlich, dass die Quoten im Verlauf der Befragungen besser wurden. So wurde die schlechteste Zuordnungsquote zwischen den Jahren 2000 (t1) und 2001 (t2), die beste zwischen den Jahren 2002 (t3) und 2003 (t4) verwirklicht; auch die absolute Fallzahl stieg entsprechend an. Dies mag zum einen am steigenden Alter der Befragten und der möglicherweise damit verbundenen höheren Fähigkeit, die Codefragen richtig zu 22 Exemplarisch hierzu siehe Böttger et al. (2003, S. 35 ff.) mit einem Ausfall von 42 Prozent zwischen t1 und t2 verglichen mit hier 24 Prozent (realistische, korrigierte Schätzung) bzw. 31 Prozent (konservativste Schätzung) Ausfall zwischen t1 und t2. 66 ZA-Information 56 beantworten bzw. sich zu konzentrieren liegen. Zum anderen mag auch ein positiver Gewöhnungseffekt bei den Probanden eine Rolle spielen. Die Quoten der beiden lückenlosen Drei-Wellen-Panels liegen bei 66 und 72 Prozent, die des Vier-WellenPanels erwartungsgemäß niedriger bei 62 Prozent. Die realisierten Quoten liegen damit deutlich über denen von Adresspanels. 4.3 Verzerrung der Paneldaten Am Beispiel des Paneldatensatzes Pt3,t4 (Münster 2002/2003) soll erläutert werden, welche Auswirkungen das angewendete Zuordnungsverfahren in Bezug auf die Repräsentativität der Daten hat. In Tabelle 5 finden sich die Paneldaten aufgeschlüsselt nach den zugelassenen Fehlern in der Codezuordnung. Zum Vergleich sind dort die Münsteraner Querschnittsdaten aus 2003 und die Daten der Schulstatistik desselben Jahres aufgeführt. Tabelle 5 Verzerrung der Paneldaten Münster 2002/2003 Codezuordnung Pt3,t4 0 Fehler 1 Fehler 2 Fehler N 637 523 Gesamt Gesamt Gesamt Pt3,t4 Q,t4 St4 246 1.406 1.819 2.077 Geschlecht Mädchen (%) 59 49 41 52 50 49 Jungen (%) 41 51 59 48 50 51 Schulform Hauptschüler (%) 16 21 27 19 23 23 Realschüler (%) 33 33 33 33 32 31 Gymnasiasten (%) 50 44 34 45 41 39 Sonderschüler (%) 2 3 5 3 4 6 P bedeutet Panel Q bedeutet Querschnitt S bedeutet Schulstatistik (nur befragte Schulen) ZA-Information 56 67 Es wird deutlich, dass zwar der größte Teil (N = 637) der Schülerinnen und Schüler bei der Beantwortung des Codeblattes in 2002 und 2003 keinen Fehler machte, der Anteil derjenigen, die einen Fehler (N = 523) machten jedoch kaum kleiner ist. Der Anteil der Probanden, die zwei Fehler (N = 246) machten ist zwar deutlich geringer, jedoch ebenfalls noch erheblich. Bei dem ursprünglich geplanten Zuordnungsverfahren mit Hilfe des gesamten Codes, hätte man nur auf die 637 Zuordnungen ohne Fehler zurückgreifen können. Ein Verzicht auf die Zuordnungen mit einem oder zwei Fehlern erscheint daher unvernünftig. Vielmehr rechtfertigt der Ertrag der gefundenen fehlerhaften Zuordnungen den oben geschilderten Aufwand eines Zuordnungsverfahrens mit manuellem Handschriftenvergleich. Aus Tabelle 5 wird darüber hinaus ersichtlich, dass die Anzahl der Fehler bei der Beantwortung des Codeblattes mit Geschlecht und Schulbildung der Befragten korrelieren. Während die Verzerrungen auf Ebene des Gesamt-Paneldatensatzes (der Zuordnungen bis zu zwei Fehler beinhaltet) nur leicht sind, lassen sich bei der Aufschlüsselung der Zuordnungen nach Fehlern deutliche Verschiebungen erkennen. Augenscheinlich war es den weiblichen Befragungsteilnehmern eher möglich, in zwei Jahren fehlerfrei zu antworten, der Anteil der Mädchen ist bei den Zuordnungen mit keinem Fehler deutlich größer als derjenige der Jungen. Auch die Schulbildung hat einen (erwartungsgemäßen) Effekt. Je höher die Schulbildung, desto weniger Fehler wurden bei der Beantwortung gemacht. Über die Ursachen können an dieser Stelle nur Mutmaßungen angestellt werden. Es ist zu vermuten, dass kognitive Fähigkeiten - bei aller Einfachheit der Fragen - ebenso eine Rolle spielen, wie Konzentrationsfähigkeit und -wille. Auch unter dem Gesichtspunkt der Verzerrung der Daten erscheint die Beschränkung nur auf fehlerfreie Zuordnungen nicht wünschenswert. Muss der Code zwischen den Jahren komplett übereinstimmen, so sind die zu erwartenden Datensätze deutlich verzerrt. Erst ein fehlertolerantes Zuordnungsverfahren unter Zulassung von (bis zu zwei) Fehlern liefert hier Daten, deren Verzerrung in Bezug auf Geschlecht und Schulbildung deutlich geringer ist. 68 5 ZA-Information 56 Fazit Resümiert man die Erfahrungen, die in unserer Studie mit einem Zuordnungsverfahren über persönliche Codes gemacht wurden, so muss man zu dem Ergebnis kommen, dass sich das ursprünglich geplante Verfahren in der Praxis nur teilweise bewährt hat, jedoch mit Hilfe der geschilderten Problemlösestrategie als Ergebnis bessere Zuordnungsquoten realisiert werden konnten als in vergleichbaren Adresspanels. Die Grundvoraussetzungen des Verfahrens erwiesen sich zunächst als unzureichend erfüllt, so dass wegen der zu geringen Zuordnungsquote und einer starken Verzerrung der Daten eine Abweichung vom ursprünglich geplanten Verfahren notwendig war. Die Voraussetzung, dass jeder Proband einen eindeutigen Code aufweisen muss, war in unserer Studie nicht gegeben. Zu einem großen Teil lag dies an Kompromissen (Art der Fragen, Fragestellung), die während der Verhandlungen mit dem Datenschutz eingegangen werden mussten. Für zukünftige Forschungsvorhaben erscheint diese Voraussetzung allerdings durch die Wahl geeigneter Codes bzw. Codefragen realisierbar. Als sehr viel schwieriger zu realisieren, dürfte sich die zweite Voraussetzung des Verfahrens - exakt übereinstimmende Codes in den einzelnen Erhebungswellen erweisen. In unserer Studie zeigte sich, dass ein sehr großer Teil der befragten Jugendlichen nicht in der Lage war, die Codefragen in den unterschiedlichen Jahren gleich zu beantworten. Bei einem Zuordnungsverfahren über den kompletten Code wäre dann eine angemessene Zuordnungsquote nicht mehr zu erreichen gewesen. Für die Phase der Zuordnungsfindungen mussten deshalb „fehlerhafte“ Codes zugelassen werden, um die Fragebögen, die von denselben Personen in unterschiedlichen Wellen ausgefüllt wurden, einander zuordnen zu können. Die Schwierigkeitsstufe der gestellten Fragen war unseres Erachtens nach Schülerinnen und Schüler der befragten Altersstufen zumutbar. Es zeigte sich darüber hinaus, dass die Fehlerhaftigkeit des Codes bei fortschreitendem Alter der Befragten nicht wesentlich geringer wurde. Es steht also eher zu vermuten, dass generell ein nicht zu vernachlässigender Teil von fehlerhaften bzw. differierenden Antworten zu erwarten ist, stellt man Jugendlichen in mehreren Jahren fünf oder mehr Fragen. Ein Zuordnungsverfahren über Codes, welcher auf Einzelfragen beruht, muss die Möglichkeit eines fehlertoleranten Zusammenspiels von Daten bieten. ZA-Information 56 69 Literatur Boers, K. und Kurz, P. (2000). Schule, Familie, Einstellungen, Lebensstile, delinquentes und abweichendes Verhalten. Erste Ergebnisse der Münsteraner Schülerbefragung 2000. Eigendruck. Münster. Boers, K. und Pöge, A. (2003). Wertorientierungen und Jugenddelinquenz. In: S. Lamnek und M. Boatca (Hrsg.), Geschlecht, Gewalt, Gesellschaft (S. 246-269). Opladen: Leske + Budrich. Boers, K., Reinecke, J., Wittenberg, J. und Motzke, K. (2002). Wertorientierungen, Freizeitstile und Jugenddelinquenz. Neue Kriminalpolitik, 14(4), 141-146. Böttger, A., Ehret, B., Othold, F., Prein, G., Schumann, K. F. und Seus, L. (2003). Methoden der Untersuchung. In: K. F. Schumann (Hrsg.), Delinquenz im Lebensverlauf. Bremer Längsschnittstudie zum Übergang von der Schule in den Beruf bei ehemaligen Hauptschülern (Bd. 2, S. 35-66). Weinheim, München: Juventa. Motzke, K. und Wittenberg, J. (2004). Methodendokumentation der kriminologischen Schülerbefragung in Münster 2000 (Schriftenreihe „Jugendkriminalität in der modernen Stadt - Methoden“ Nr. 1). Münster, Trier. Pöge, A. (2002). Der Zusammenhang von Lebensmilieu, Einstellungen und deviantem Verhalten bei Jugendlichen. Münster. (unveröffentlichte Magisterarbeit) Pöge, A. (2005a). Ethnicity and self-reported delinquency. How to define ethnicity? In: Queloz, R. Brossard, R.F. Bütikofer, B. Meyer-Bisch und D. Pittet (Hrsg.), Délinquance des jeunes et justice des mineurs. Les défis des migrations et de la pluralité ethnique. Youth Crime and Juvenile Justice. The challenge of migration and ethnic diversity. Berne, Bruylant, Bruxelles: Editions Staempfli. (in Druck) Pöge, A. (2005b). Methodendokumentation der kriminologischen Schülerbefragung in Münster 2000-2003 (VierWellen-Panel) (Schriftenreihe „Jugendkriminalität in der modernen Stadt - Methoden“ Nr. 9). Münster, Trier. Raithel, J. (2002). Jugendkriminalität und elterliches Erziehungsverhalten. Neue Kriminalpolitik, 14(2), 62-65. Wittenberg, J. (2004a). Methodendokumentation der kriminologischen Schülerbefragung in Münster 2001 (Schriftenreihe „Jugendkriminalität in der modernen Stadt - Methoden“ Nr. 2). Münster, Trier. Wittenberg, J. (2004b). Methodendokumentation der kriminologischen Schülerbefragung in Münster 2002 (Schriftenreihe „Jugendkriminalität in der modernen Stadt - Methoden“ Nr. 4). Münster, Trier. Wittenberg, J. (2004c). Methodendokumentation der kriminologischen Schülerbefragung in Münster 2003 (Schriftenreihe „Jugendkriminalität in der modernen Stadt - Methoden“ Nr. 7). Münster, Trier. 70 ZA-Information 56 Abbrüche bei Online-Befragungen: Ergebnisse einer Befragung von Medizinern von Yasemin El-Menouar und Jörg Blasius 1 Zusammenfassung Ein großes Problem bei Online-Befragungen ist der hohe Anteil von Abbrüchen. Diese Abbrüche erfolgen zum einen direkt bei der Kontaktierung, d.h. die zu Befragenden reagieren nicht auf ein zuvor verschicktes Anschreiben bzw. auf eine Aufforderung via Banner oder via Pop-up Fenster. Zum anderen wird häufig die Startseite der Untersuchung aufgerufen, nicht aber der Fragebogen. Die uns hier interessierenden Abbrüche sind jene, die während der Bearbeitung des Fragebogens entstehen. Anhand einer empirischen Erhebung wird gezeigt, dass der Anteil der Abbrüche mit der Art der Ansprache (E-Mail, Banner, Pop-up Fenster), mit fragebogenspezifischen (u.a. Komplexität der Fragen) und mit personenspezifischen Faktoren (u.a. Interneterfahrung) variiert. Abstract The high rate of dropouts provides a substantial problem for online surveys. On the one hand, these dropouts take place right away when the respondents are contacted, i.e., they do not respond to an invitation letter or an invitation via banner or pop-up window. On the other hand, people often open the study’s start-up page, but not the questionnaire. The dropouts of concern to us are those which happen during the processing of the questionnaire. An empirical survey revealed that the share of the dropouts varies according to the kind of invitation (email, banner, pop-up window) and to questionnaire-specific (e.g. complexity of the questions) and personal factors (e.g. Internet experience). 1 Yasemin El-Menouar , M.A., ist Wissenschaftliche Mitarbeiterin am Lehrstuhl für Soziologie der Heinrich-Heine-Universität Düsseldorf, Universitätsstr. 1, 40225 Düsseldorf, Tel.0211/8115290, E-Mail: [email protected] Dr. Jörg Blasius ist Professor am Seminar für Soziologie der Rheinischen Friedrich-WilhelmsUniversität Bonn, Lennéstr. 27, 53113 Bonn, Telefon: 0228/73-8421, E-Mail: [email protected] ZA-Information 56 1 71 Einleitung Seit gut fünf Jahren ist ein stetig steigender Anteil von Online-Befragungen in der empirischen Sozialforschung zu beobachten, lag er 1998 in Deutschland noch bei 1%, so waren es 2003 bereits 10% (ADM 2004). Diese Zunahme dürfte insbesondere auf folgende Gründe zurückzuführen sein (vgl. Batinic 2001, Dillman 2000, Gräf 1999, Janetzko 1999, Reips 1997): Erstens können innerhalb kürzester Zeit große Erhebungszahlen kostengünstig erzielt werden. Zweitens ist mit steigendem Stichprobenumfang kein Mehraufwand verbunden, weder in finanzieller noch in zeitlicher Hinsicht. Drittens können Online-Umfragen unabhängig von Zeit und Raum durchgeführt werden, die zu Befragenden müssen lediglich über das Internet erreichbar sein. Die Beantwortung der Fragen kann 24 Stunden am Tag und 365 Tage im Jahr von nahezu jedem Ort in der Welt erfolgen. Ein weiterer Vorteil ist, dass die Daten zu jedem Zeitpunkt der Erhebung in auswertbarer Form vorliegen. Die Kontaktierung der Befragten kann auf zwei Arten vorgenommen werden (Zerr 2001): Zum einen anhand einer persönlich adressierten E-Mail, in der die Internetadresse des Fragebogens angegeben wird, zum anderen über eine anonyme Ansprache im Internet. Bei der zweiten Kontaktmethode wird entweder ein Pop-up Fenster oder ein Banner auf einer bestimmten Internetseite platziert. Benutzer dieser Seite gelangen zum Online-Fragebogen, indem sie einem dort integrierten Link folgen. Das Hauptproblem von Online-Befragungen besteht darin, dass mit dieser Methode derzeit keine repräsentativen Stichproben2 gezogen werden können. Die Ursache dafür ist eine immer noch unzureichende Internetausstattung der Bevölkerung (Bandilla 2003) und die sich ständig wandelnde Zusammensetzung der Internetpopulation, die nicht genau definiert werden kann (Hauptmanns und Lander 2001, Hauptmanns 1999). Des Weiteren fehlen geeignete Auswahlbasen für die Stichprobenziehung wie z.B. ein Verzeichnis der E-Mail-Adressen ähnlich dem Telefonbuch3 oder dem Einwohnermelderegister. Doch auch bei Telefonbefragungen gab es in den alten Bundesländern bis in die Mitte der 80er Jahre ähnliche Probleme; erst seit dieser Zeit kann von einer ausreichenden Ausstattung der privaten Haushalte mit Telefonanschlüssen ausgegangen werden (Blasius und Reuband 1995). Mittlerweile ist die telefonische Befragung auch in Deutschland ein Standardinstrument 2 Zu einem Versuch eine repräsentative Stichprobe aus einem Online-Panel zu ziehen siehe Brandt (2005) 3 Durch die zunehmende Nutzung von Mobiltelefonen und einem damit verbundenen Verzicht auf Festanschlüsse dürfte in naher Zukunft auch das Ziehen von repräsentativen Telefonstichproben immer schwerer werden. 72 ZA-Information 56 zur Durchführung von repräsentativen Umfragen und hat seit ein paar Jahren sogar einen größeren Anteil an allen Befragungen als die face-to-face Befragung (für 2003: telefonische Befragung: 43%, face-to-face Befragung: 28%; vgl. ADM 2004). Die nähere Zukunft wird zeigen, ob sich das auch für die Online-Befragung realisieren lässt. Unabhängig davon, welches Erhebungsinstrument eingesetzt wird, ob eine repräsentative Stichprobe gezogen werden kann und wie die jeweiligen Zielpersonen kontaktiert werden, ist die Kooperation der zu befragenden Personen zwingend erforderlich. Ein großes Problem bei Online-Befragungen ist, dass ein relativ großer Anteil an Personen die Befragung vorzeitig abbricht, also nur sehr unvollständige bzw. nur unbrauchbare Daten liefert. Das zentrale Anliegen dieser Studie ist, jene Faktoren zu bestimmen, die zu einem vorzeitigen Abbruch führen, um in der Folge Strategien anbieten zu können, anhand derer der Anteil der Abbrüche reduziert werden kann. Um diese Faktoren bestimmen zu können, müssen u.a. der genaue Ort des Abbruchs im Fragebogen sowie das Antwortverhalten der Personen vor dem Zeitpunkt des Beendens der Befragung bekannt sein. Sind diese Informationen vorhanden, so kann geprüft werden, ob es an bestimmten Stellen im Fragebogen gehäuft zu Abbrüchen kam und inwiefern die dort platzierten Fragen dies verursacht haben könnten. Des Weiteren muss die Art der Rekrutierung berücksichtigt werden: Zielpersonen, die durch eine persönliche E-Mail angesprochen werden, können einer anderen Internetpopulation angehören bzw. ein anderes Teilnahme- und Abbruchverhalten haben als jene, die mit Hilfe eines Pop-up Fensters bzw. eines Banners kontaktiert werden. Wenn dem so ist, bedürfen Online-Befragungen je nach gewählter Rekrutierungsmethode auch spezifischer Design-Kriterien, um die Anzahl der Abbrüche zu reduzieren. Bis dato werden jedoch meistens allgemeine Kriterien zur Gestaltung von Online-Fragebögen verwendet, ohne dass die Rekrutierungsmethode berücksichtigt wird. Um im Folgenden den Einfluss der Rekrutierungsmethode auf das Abbruchverhalten untersuchen zu können, werden die Daten einer OnlineBefragung verwendet, die mit Hilfe von drei unterschiedlichen Rekrutierungsarten durchgeführt wurde (E-Mail, Pop-up Fenster, Banner). 2 Forschungsstand und Fragestellung Während bei face-to-face und telefonischen Befragungen der Interviewer die Zielperson zur Teilnahme motivieren und anschließend für die Aufrechterhaltung des Interesses der Befragten sorgen kann, fehlt diese direkte Bezugsperson bei postalischen und Online-Befragungen. Daher hängt es ausschließlich vom Anschreiben ZA-Information 56 73 und vom Fragebogen ab, ob es zu einer erfolgreichen Rekrutierung und dann zu einem erfolgreichen Beenden der Befragung kommt. Während das Anschreiben bzw. „die Werbung“ das Interesse für die Befragung wecken soll, muss während der Teilnahme mit Hilfe des Fragebogens das Interesse aufrechterhalten werden. Doch häufig gelingt es bei Online-Befragungen nicht, die Teilnehmer dazu zu motivieren, den Fragebogen vollständig zu bearbeiten; Tuten et al. (2002) zufolge brechen bis zu 80 Prozent der anfänglichen Teilnehmer die Befragung vorzeitig ab. Bei der postalischen Befragung führen frühzeitige Abbrüche meistens dazu, dass die Zielpersonen den Fragebogen nicht abschicken; so bleibt es ungewiss, ob diese Personen die Teilnahme von vornherein verweigert haben oder ob zwar zunächst eine Teilnahmebereitschaft vorhanden war, aber fragebogenspezifische Faktoren später zum Abbruch der Beantwortung führten. Da bei Online-Befragungen jeder Schritt im Teilnahmeprozess der Befragten dokumentiert werden kann, ist es möglich, genau anzugeben, wann ein Abbruch erfolgte. Die technische Voraussetzung dafür ist, dass die kompletten Fragebögen nicht erst bei Beendigung der Befragung an den Server abgeschickt werden, sondern sukzessive, also Seite für Seite. Auf diese Weise kann zum einen das vorangegangene Antwortverhalten der Abbrecher ermittelt und zum anderen die genaue Stelle angegeben werden, an welcher ein Abbruch erfolgte. Dies kann z.B. bei sehr komplex gestalteten Fragen oder bei Grafiken, die eine längere Ladezeit benötigen, der Fall sein. Aus der Summe dieser Informationen sind Rückschlüsse auf die Ursachen möglich, die zum Abbruch führten. Um die Teilnehmer möglichst lange in der Untersuchung zu halten, sollte ein Weiterkommen im Fragebogen auch dann möglich sein, wenn vorhergehende Items unbeantwortet blieben (Bosnjak 2001). Die Entscheidung für oder gegen die Teilnahme bzw. für ein vorzeitiges Beenden der Teilnahme ist ein Prozess, der in verschiedene Selektionsstufen unterteilt werden kann (Bosnjak et al. 1998, Theobald 2000); diese können wie folgt zusammengefasst werden (Bosnjak 2001): In Kenntnis setzen: In der ersten Stufe wird der potenzielle Teilnehmer über die Umfrage in Kenntnis gesetzt. Bei einer WWW-Ansprache wird durch ein Banner oder ein Pop-up Fenster über das Projekt informiert; bei einer E-Mail-Rekrutierung wird der Befragte durch ein persönliches Anschreiben zur Teilnahme aufgefordert. Aufruf der Startseite: Nach der Information über die geplante Untersuchung erfolgt bei Interesse (oder Neugier) der Aufruf der Startseite der Befragung/des Projektes. 74 ZA-Information 56 Befragungsbeginn: Bei weiterhin positiver Entscheidung kommt es zum Aufruf des Fragebogens und zur Beantwortung der ersten Frage. Ist der Teilnehmer bis zu dieser Stelle fortgeschritten, ist davon auszugehen, dass eine relativ hohe Teilnahmemotivation besteht. vollständige Teilnahme: Die vollständige Teilnahme hat dann stattgefunden, wenn die Befragung ohne Abbruch bzw. ohne das Auslassen von zentralen Themen beendet wurde. Theobald (2000) skizziert eine diesen Stufen entsprechende Berechnung der Selektionsraten; er gibt dabei an, wie auf jeder dieser Stufen die Rücklaufquote bestimmt werden kann (Abbildung 1). Abbildung 1 n1 Selektionsraten auf dem Weg zum bearbeiteten Fragebogen Kenntnis n2 n2/n1 Startseite 1. Selektionsrate = Werbeerfolg n3 Fragebogen n3/n2 2. Selektionsrate = Motivationserfolg n4 Bearbeitung n4/n3 3. Selektionsrate = Gestaltungserfolg Quelle: Theobald (2000, S. 72) Tuten et al. (2002) zeigen, dass die Selektionsraten sehr stark variieren; so reicht der „Werbeerfolg“ von unter einem bis zu über 70 Prozent. Einschränkend muss dabei angemerkt werden, dass die Berechnung der ersten Selektionsrate oft nicht eindeutig ist: Werden beispielsweise Personen per E-Mail zur Teilnahme an einer Befragung aufgefordert, so kann nicht genau angegeben werden, wie viele Zielpersonen die E-Mail auch tatsächlich erhielten. Nicht alle ungültigen Adressen werden an den Absender zurückgesandt, andere E-Mails kommen nicht bei der Zielperson an, da E-Mailfilter diese automatisch aussortieren (Vehovar et al. 2002). Noch problematischer ist die Berechnung der ersten Selektionsstufe, wenn die Kontaktaufnahme im WWW stattfindet: Pop-up Fenster werden oft einfach ausgeschaltet, ohne dass der Inhalt zur Kenntnis genommen wird; Banner können leicht übersehen werden. ZA-Information 56 75 Auch bei der zweiten Selektionsrate gibt es große Unterschiede zwischen den Studien. Diese dürften zum einen vom Thema der Befragung, zum anderen von den Anreizen, die mit der jeweiligen Teilnahme verbunden sind, abhängig sein. Eine weitere Ursache für die Unterschiede beim „Motivationserfolg“ ist der unterschiedliche Grad an Seriosität, den eine Online-Befragung vermitteln kann (Dillman 2000). Die Seriosität einer Befragung ist ein Indikator dafür, ob in Aussicht gestellte Anreize auch tatsächlich realisiert werden; kommerzielle Umfragen werden als weniger vertrauenswürdig bewertet als wissenschaftliche (Bosnjak und Batinic 1999). Auf der Basis einer Metaanalyse kommt Theobald (2000) zu der Schlussfolgerung, dass eine zweite Selektionsrate von 55 Prozent als gutes Ergebnis bezeichnet werden kann. Im Mittelpunkt unserer Untersuchung stehen die Ausfälle, die während der Befragung stattfinden, d.h. in der dritten Selektionsstufe. Auch auf dieser Stufe variiert die Abbruchrate beträchtlich, wobei ein „Gestaltungserfolg“ von weniger als 50 Prozent nicht selten ist (Batagelj et al. 1998). Die Ursachen für Abbrüche auf dieser Stufe sind vielfältig, sie hängen u.a. von der Fragebogenlänge und den verwendeten Fragentypen ab (Batagelj und Vehovar 1999; Knapp und Heidingsfelder 2001). Abbrüche finden überdurchschnittlich häufig statt, wenn mehr als 25 bis 30 Fragen gestellt werden; bei Matrixfragen wird häufiger abgebrochen als bei einfachen Fragentypen. Auch bei offenen Fragen kommt es Knapp und Heidingsfelder (2001) zufolge überdurchschnittlich oft zum Abbruch der Befragung; diese werden zudem häufiger von späteren Abbrechern unbeantwortet überblättert. Wurden die offenen Fragen von den späteren Abbrechern beantwortet, so haben diese dafür im Durchschnitt weniger Zeit benötigt als die Teilnehmer, die den Fragebogen bis zum Ende ausgefüllt haben. Des Weiteren neigen Abbrecher in ihrem Antwortverhalten stärker zu Antwortmustern als vollständige Teilnehmer. Dieses Verhalten könnte ein Indiz dafür sein, dass bereits zu Beginn der Befragung nur eine relativ geringe Teilnahmemotivation bestand. Eine weitere Ursache könnte auch eine relativ geringe Internetkompetenz sein, die sich in Problemen beim Ausfüllen von Internetformularen niederschlägt und schließlich zum Abbruch der Befragung führen kann. Dies wäre auch ein Grund dafür, warum „Heavy-User“ bei Online-Befragungen stark überrepräsentiert sind (Brenner 2002). Bezogen auf den Einfluss des Fragebogenlayouts fanden Dillman et al. (1998) heraus, dass bei einem mit grafischem Schmuckwerk versehenen Fragebogen häufiger Abbrüche stattfinden als bei einem mit einfach gehaltenem Layout. Die Autoren erklären dies mit den längeren Ladezeiten, die für den Aufbau von Internetseiten benötigt werden, die grafische Elemente enthalten. Technische Erschwernisse sieht 76 ZA-Information 56 auch Smith (1997) als eine der wichtigsten Ursachen für den frühzeitigen Abbruch einer Befragung. Weiterhin konnte gezeigt werden, dass Belohnungen für eine Interviewteilnahme nicht relevant für den Motivationserfolg sind, wohl aber für den weiteren Verlauf der Befragung: Frick et al. (2001) konnten nachweisen, dass bei der Befragung mit anschließender Gewinnverlosung nur halb so viele Teilnehmer den Fragebogen vorzeitig verließen wie bei derselben Befragung, die keine Verlosung enthielt. Diesen Zusammenhang konnte Theobald (2000) in einem ähnlichen Experiment jedoch nicht nachweisen. Wirksamer als materielle Anreize sind nach Bosnjak und Batinic (1999) sowie nach Dillman (2000) immaterielle Anreize, wobei drei Formen unterschieden werden können (Porst und von Briel 1995). Erstens: Altruismus ist dann ein Motiv zur Teilnahme, wenn der Anreiz in der Unterstützung von Gruppenwerten gesehen bzw. als ein Beitrag für eine übergeordnete Gruppe verstanden wird, zu der man sich zugehörig bzw. für die man sich mitverantwortlich fühlt. Zweitens: Egoistische Gründe sind dann entscheidend, wenn die Teilnahme in der Zukunft subjektive Verbesserungen oder Vorteile zu schaffen verspricht. Drittens gibt es persönliche Gründe, die mit der Befragung selbst in Zusammenhang stehen und wo sich der Nutzen schon während der Teilnahme einstellt. Letzteres kann beispielsweise ein Interesse zur Selbstkontrolle bzw. ein intendierter Lerneffekt sein, im Fall von OnlineUmfragen sind es vor allem auch Spaßmomente (vgl. Gräf 1999). Werden die Ergebnisse der vorgestellten Untersuchungen zusammengefasst, so sind folgende Faktoren zu unterscheiden, die zu einem Abbruch bei Online-Befragungen führen können: Erstens, fragebogenspezifische Faktoren: Hierzu zählt ein zu langer Fragebogen, die Einbindung komplexer Fragentypen wie z.B. Matrixfragen oder auch die Verwendung von grafischen Elementen, die zu einer verlängerten Dauer in der Datenübertragung führen können. Zweitens, befragungsspezifische Faktoren: Das Thema der Befragung verspricht dem potenziellen Teilnehmer keinen oder nur einen zu geringen Nutzen. Drittens, befragtenspezifische Faktoren: Aufgrund einer geringen Internetnutzung fehlt die Kompetenz, einen Onlinefragebogen auszufüllen. Bisher wurden diese Faktoren meistens isoliert voneinander betrachtet, aber die unterschiedlichen Effekte könnten sich auch gegenseitig verstärken oder aufheben: So kann es sein, dass die Verwendung von Matrixfragen bei Umfrageteilnehmern mit einer relativ geringen Internetkompetenz die Wahrscheinlichkeit für einen Abbruch noch erhöht. Des Weiteren könnte der anfänglich in der Teilnahme an einer OnlineBefragung gesehene Nutzen durch subjektive Erschwernisse im Fragebogen ZA-Information 56 77 nivelliert werden, so dass es trotz dieser relativ hohen Teilnahmemotivation zum Abbruch der Befragung kommt. Andererseits ist es möglich, dass die Motivation erst mit dem „Spaß“ am Fragebogen entsteht, auch wenn dieser nur aus Neugier und nicht aus Interesse am Thema aufgerufen wurde. Obwohl Abbrüche bei Online-Befragungen ein zentrales Thema und Studien, die sich mit diesem Thema beschäftigen, unerlässlich sind, um standardisierte Richtlinien für Online-Befragungen zu generieren, gibt es bislang nur wenige Arbeiten zu dieser Thematik (Tuten et al. 2002); insbesondere fehlen Untersuchungen darüber, welchen Einfluss die Form der Ansprache (E-Mail, Banner, Pop-up) auf die Abbrüche hat. Es kann vermutet werden, dass Personen, die persönlich per E-Mail angeschrieben wurden, anders auf bestimmte Stimuli im Fragebogen reagieren als solche, die anonym per Pop-up Fenster oder Banner im WWW rekrutiert wurden. Mit den folgenden Analysen soll überprüft werden, welchen Einfluss die Form der Ansprache (E-Mail, Pop-up Fenster, Banner) und welchen die Fragebogengestaltung (Art und Länge der Fragen, Einbindung von Grafiken, Fragebogenaufbau) auf die Abbruchrate haben. Ebenso soll untersucht werden, in welchem Zusammenhang die Abbruchrate mit den (technischen) Kompetenzen der Teilnehmer und ihrem vorhergehenden Antwortverhalten steht. Zusätzlich werden die Teilnahmemotive in die Analyse einbezogen; so können z.B. momentspezifische Teilnahmegründe wie Neugier schneller zu einem vorzeitigen Abbruch der Befragung führen als altruistische wie Hilfsbereitschaft. Um diese unterschiedlichen Einflüsse beschreiben zu können, wurde ein für Online-Befragungen überdurchschnittlich langer Fragebogen verwendet, der ein großes Spektrum möglicher Fragen- und Layoutformate abdeckt. 3 Datenbasis Im Rahmen einer Studie der Deutschen Zentralbibliothek für Medizin (ZBMed) wurden Nutzer von medizinischen Informationen, überwiegend Ärzte in verschiedenen Tätigkeitsbereichen, zu ihrem Informationsverhalten befragt (El-Menouar 2002). Da Mediziner in Deutschland eine nahezu vollständige Internetpenetration aufweisen, kann zumindest theoretisch jede Person der Grundgesamtheit auf diese Weise erreicht werden. Die Umfrage fand im Zeitraum von Juni bis August 2001 statt. Die Rekrutierung der Teilnehmer erfolgte über drei verschiedene Anspracheformen im Internet, die jeweils mit dem Online-Fragebogen verlinkt waren. Erstens, Ärzte wurden per E-Mail angeschrieben und zur Teilnahme an der Befragung eingeladen; die hierfür benötigten Adressen der zu kontaktierenden Ärzte wurden von der ZBMed zur Verfügung gestellt. Ein personengebundener 78 ZA-Information 56 Link, der zur Startseite der Umfrage führte, wurde in das elektronische Anschreiben integriert. Zweitens wurden Pop-up Fenster auf den Internetseiten des Deutschen Gesundheitsnetzes (Pop-up 1) und der ZBMed (Pop-up 2) installiert; beides sind Anbieter medizinischer Fachinformationen, die speziell medizinische Berufsgruppen bedienen. Während das Deutsche Gesundheitsnetz (DGN) vornehmlich niedergelassene Ärzte anspricht, liegt der Nutzerschwerpunkt der ZBMed bei wissenschaftlich arbeitenden Medizinern und Medizinstudenten. Die Fenster öffneten sich bei jedem Aufruf der Seite und enthielten zusätzlich zu der Teilnahmeaufforderung einen Link zur Umfrage. Cookies zur Verhinderung der wiederholten Teilnahme vom gleichen PC wurden nicht gesetzt, da verschiedene Mitarbeiter von Einrichtungen wie von Krankenhäusern z.T. dieselbe IP-Adresse haben. Bei Teilnahme eines Mitarbeiters wären alle anderen ausgeschlossen gewesen. Doppelteilnahmen sind bei Ärzten, die sehr bewusst mit ihrer Zeit umgehen, nicht anzunehmen. Drittens wurde auf einem weiteren Internetportal für medizinische Fachinformationen (Multimedica, das hauptsächlich in Krankenhäusern arbeitende Ärzte bedient) ein Banner integriert, der zunächst an zentraler Stelle auf der Seite erschien und ab dem dritten Tag nach Beginn der Umfrage am Seitenrand platziert war. Die Motivation zur Teilnahme erfolgte über materielle und nicht-materielle Anreize. Materieller Anreiz waren Gutscheine für kostenlose Bestellungen von drei Aufsätzen bei der ZBMed; als nicht-materieller Anreiz wurde die Verbesserung der Informationsversorgung in der Medizin auf der Basis der Ergebnisse dieser Umfrage in Aussicht gestellt. Die Seriosität der Studie wurde durch die Nennung des Auftraggebers (die ZBMed ist in der Medizin eine wichtige und angesehene Institution) hervorgehoben. Der Fragebogen enthielt insgesamt 71 Fragen, die auf 21 Seiten verteilt waren. Die ersten sechs Seiten enthielten jeweils nur ein bis zwei Fragen einfachen Typs, mit denen die Internetkompetenz der Befragten ermittelt werden sollte (Interneterfahrung, Nutzungsdauer und -intensität, genutzte Internetdienste). Auf den Seiten 7 bis 11 befanden sich Matrixfragen mit steigender Anzahl an Items (bis zu 14); Gegenstand dieser Fragen waren Nutzung und Wichtigkeit von verschiedenen medizinischen Informationsmedien. Auf der elften Seite des Fragebogens war eine Grafik eingebunden. Dies war ein Vorschlag für eine neue Suchmaske für die Literaturrecherche in der Medizin, die von den Befragten nach verschiedenen Kriterien evaluiert werden sollte. Auf den Seiten 12 bis 21 befanden sich wiederum einfache ZA-Information 56 Tabelle 1 79 Rückläufe in den verschiedenen Stufen der Selektion, getrennt nach den vier Stichproben E-Mail gültige Adressen: Banner Pop-up 1 Pop-up 2 unbekannt geöffnet: geöffnet: 15 311 17 485 2871 n in % n in % n in % n in % Startseite 583 20,3 367 ? 2010 13,1 2557 14,6 erste Fragebogenseite 542 93,0 266 72,5 866 43,1 1127 44,1 Rücklauf 459 84,7 225 84,6 599 69,2 602 53,4 Fragentypen, mit denen die Demografie, die Teilnahmemotivation, die Teilnahmesituation und die Umfrageerfahrung abgefragt wurden (für den Fragebogen: siehe El-Menouar, 2002). In Tabelle 1 werden die unterschiedlichen Teilnahmequoten der vier Stichproben entsprechend des vorgestellten Selektionsmodells von Theobald (2000) wiedergegeben. Insgesamt haben 1885 Personen den Fragebogen vollständig ausgefüllt. Die erste Fragebogenseite haben 2801 Personen gesehen, 926 (33,1%) entschlossen sich zum Abbruch ohne den Fragebogen vollständig zu bearbeiten. Von den mit Hilfe eines elektronischen Anschreibens persönlich kontaktierten n1(E-Mail) = 2871 Zielpersonen, bei denen die vorhandene E-Mail-Adresse zumindest nicht als ungültig erkannt wurde, haben n2(E-Mail) = 583 (n2/n1=20,3%; erste Selektionsrate = Werbeerfolg) die Startseite der Untersuchung geöffnet, von diesen 583 Personen haben wiederum n3(E-Mail) = 542 (n3/n2=88,7%; zweite Selektionsrate = Motivationserfolg) die erste Fragebogenseite geöffnet (bezogen auf alle 2871 Zielpersonen beträgt die Ausschöpfungsquote an dieser Stelle 19,3%), und davon haben n4(E-Mail) = 459 (n4/n3=84,7%; dritte Selektionsrate = Gestaltungserfolg) den Fragebogen vollständig ausgefüllt (bezogen auf die 2871 Zielpersonen beträgt die Ausschöpfungsrate 16,0%, bezogen auf die 583 Personen, welche die Startseite geöffnet haben, 78,7%). Damit ist die Ausschöpfungsquote bei der ersten Selektionsstufe relativ niedrig, auf den anderen beiden Selektionsstufen ist sie, verglichen mit den Angaben von Theobald (2000), relativ hoch. Bei der Kontaktierung mittels Banner kann die erste Selektionsrate nicht berechnet werden, da unbekannt ist, wie viele Personen dieses Banner wahrgenommen haben. Auf der zweiten Selektionsstufe liegt der Wert für die erfolgreich Motivierten bei 80 ZA-Information 56 n3(Banner)/n2(Banner) = 72,5%, also deutlich unterhalb des Wertes der Stichprobe, die mit Hilfe einer E-Mail kontaktiert wurde, aber immer noch oberhalb des von Theobald (2000) angegebenen Wertes. Deutlich stärker sind die Ausfälle auf dieser Stufe bei jenen, die über ein Pop-up Fenster auf die erste Fragebogenseite kamen; die entsprechenden Werte liegen hier bei 43,1% und 44,1%, und damit auch unterhalb des von Theobald (2000) angegebenen Wertes. Auf der dritten Selektionsstufe hat die Rekrutierung per Banner, wie auch die per E-Mail, einen deutlich höheren Rücklauf (84,7% bzw. 84,6%) als per Pop-up Fenster. An dieser Stelle unterscheiden sich auch die Rückläufe der beiden Pop-up Stichproben, die des Deutschen Gesundheitsnetzes war mit 69,2% erfolgreicher als jene der ZBMed mit 53,4%. Verglichen mit den Ergebnissen von Theobald (2000) haben E-Mail und Banner damit einen sehr guten Rücklauf auf der dritten Stufe, Pop-up 1 einen relativ guten und Pop-up 2 zumindest noch einen ausreichenden Rücklauf. Bevor eine genauere Untersuchung der Abbrüche erfolgt, wird im Folgenden die demografische Zusammensetzung der vier Stichproben beschrieben (Tabelle 2). Da diese Daten erst am Ende des Fragebogens erhoben wurden, werden nur die Teilnehmer betrachtet, die den Fragebogen vollständig ausfüllten. Aufgrund von unzureichenden Informationen über die Nutzer der jeweiligen Internetdienste sowie über die Personen der E-Mailadressdatei kann leider nicht angegeben werden, in welchem Maß die Differenzen in der demografischen Zusammensetzung der Stichproben auf die unterschiedlichen Rekrutierungsplattformen sowie auf methodische Effekte zurückzuführen sind, d.h. in welchem Maß unterschiedliche Personen mit der einen oder anderen Befragungsmethode besonders gut bzw. besonders schlecht zu erreichen sind. Anhand von Tabelle 2 wird deutlich, dass die Zusammensetzung der vier Stichproben nach Alter und Geschlecht sehr unterschiedlich ist. Während der Anteil der Frauen in der über die Internetseite der ZBMed rekrutierten Stichprobe relativ hoch ist (38,7% Frauen, 61,3% Männer) und er bei der über die DGN und Multimedica rekrutierten Stichproben bei etwa 20% liegt, beträgt er in der E-Mail-Stichprobe nur 9%. Wird die Altersverteilung betrachtet, so ist die über die ZBMed rekrutierte Stichprobe im Durchschnitt am jüngsten; über die Hälfte der Befragten sind keine 35 Jahre alt. Die Befragten der E-Mailstichprobe sind am ältesten; rund drei Viertel sind über 40 Jahre alt. Von allen Befragten sind nur etwa 5% 60 Jahre und älter. ZA-Information 56 Tabelle 2 81 Geschlechts- und Altersverteilung der Stichproben im Vergleich, Spaltenprozente E-Mail (n=459) Geschlecht(1) männlich weiblich Alter(2) bis 34 Jahre 35 bis 39 Jahre 40 bis 49 Jahre 50 bis 59 Jahre 60 bis 65 Jahre über 65 Jahre (1) Banner (n=225) Pop-up 1 (n=599) Pop-up 2 (n=602) Gesamt (n=1885) 91,0 78,8 82,7 61,3 77,4 9,0 21,2 17,3 38,7 22,6 7,2 18,2 39,2 29,1 4,6 1,8 22,7 21,8 34,2 15,6 3,6 2,2 16,6 17,3 35,9 23,8 5,5 0,8 54,6 16,7 18,9 7,7 1,3 0,5 27,2 17,9 31,1 19,0 3,7 1,2 χ2 = 147,0; df = 3; p < 0,001; Cramer's V = 0,28 χ = 389,6; df = 15; p < 0,001; Cramer's V = 0,27 (2) 2 Bei den Verteilungen von Alter und Geschlecht wird deutlich, dass der Anteil der Frauen um so größer ist, je jünger das Durchschnittsalter der Stichprobe ist: die ZBMed Stichprobe, welche das jüngste Durchschnittsalter hat, enthält auch den größten Anteil an Frauen; die E-Mail Stichprobe hat im Durchschnitt die ältesten Befragten und den höchsten Anteil an Männern. Inwiefern dieser Zusammenhang auch in den vier Bruttostichproben4 besteht oder ob er ein Effekt der Befragungsmethode ist, kann an dieser Stelle nicht gesagt werden. Erfahrungsgemäß sind auch bei anderen Online-Befragungen ähnliche Verzerrungen zu beobachten; in der Regel sind Frauen und ältere Personen unterdurchschnittlich repräsentiert. Dabei sind die geschlechtsspezifischen Unterschiede bei den älteren Befragten noch stärker ausgeprägt als bei den jüngeren. Anhand von Tabelle 3 wird ersichtlich, dass sich die beruflichen Positionen der Befragten in den drei WWW-Stichproben sehr stark unterscheiden, sie entsprechen aber in etwa der Nutzerstruktur der jeweiligen Internetanbieter: Während über die Internetseite des Deutschen Gesundheitsnetzes (Pop-up 1) überwiegend niedergelassene Ärzte erreicht werden konnten, waren es über die Homepage von Multimedica (Banner) und der ZBMed (Pop-up 2) vor allem die Ärzte, die in Krankenhäusern 4 Bei den vier Bruttostichproben handelt es sich erstens um alle per E-Mail angeschriebenen Per- sonen, zweitens um alle Personen, die das Banner gesehen haben sowie drittens und viertens um die Personen, die das Pop-up Fenster gesehen haben. 82 ZA-Information 56 tätig sind. Bei der ZBMed gehören hierzu insbesondere angehende Ärzte, Universitätsprofessoren und Ärzte, die an Universitätskliniken und Lehrkrankenhäusern (vgl. dazu El-Menouar 2002) tätig sind, sowie Studierende, die sich dort mit Literatur und Informationen versorgen. Tabelle 3 Berufliche Position der Befragten in den vier Stichproben, Zeilenprozente Berufliche Position N Universitätsprofessor Chefarzt Oberarzt Niedergelassener Arzt Assistenzarzt Arzt im praktischen Jahr Sonstiger Beruf Student Durchschnitt 44 84 181 651 271 55 362 203 1851 E-Mail Banner 45,5 45,2 26,5 47,2 10,0 7,3 3,4 1,0 24,5 2,3 13,1 18,2 7,7 22,1 16,4 13,2 4,9 11,9 Pop-up1 13,6 32,1 35,9 41,6 32,8 25,5 24,9 12,8 32,0 Pop-up2 38,6 9,5 19,3 3,5 35,1 50,9 58,5 81,3 31,6 χ2 = 840,1; df = 21; p < 0,001; Cramer's-V = 0,39. Die Teilnehmer der E-Mailstichprobe befinden sich überwiegend in höheren Positionen. Diese Abweichung vom Durchschnitt der gezogenen Stichprobe könnte zum einen auf die Stichprobenauswahl zurückzuführen sein (die berufliche Zusammensetzung der Bruttostichprobe ist leider nicht bekannt), zum anderen könnten sich Ärzte in höheren Positionen durch die persönliche Ansprache überdurchschnittlich oft verpflichtet fühlen, an einer Befragung teilzunehmen, die zur Verbesserung der ärztlichen Informationsversorgung beitragen soll. Bei den Sonstigen handelt es sich überwiegend um Journalisten, die vermutlich auf der Suche nach medizinischen Informationen waren, oder aber um andere, an die Medizin angrenzende, Berufsgruppen. 4 Ergebnisse Nach Theobald (2000) sollten Ausfälle bei Online-Befragungen insbesondere auf den ersten Fragebogenseiten zu verzeichnen sein und mit dem Fortschritt der Befragung deutlich zurückgehen. Dieses Ergebnis kann auch mit der hier vorliegenden Untersuchung bestätigt werden. In Abbildung 2 ist der prozentuale Verlauf der Abbrüche nach Stichproben und Fragebogenseiten wiedergegeben. Anhand dieser Abbildung wird ersichtlich, dass bei allen vier Stichproben am Anfang die meisten Abbrüche zu verzeichnen sind. Während bei der E-Mail- und bei der Bannerstichprobe die Abbruchquote schon auf den ersten Fragebogenseiten deutlich zurückgeht, ZA-Information 56 Abbildung 2 83 Abbruchverlauf im Fragebogen, dargestellt sind die Verbliebenen in Prozent 100 90 80 70 Prozent 60 50 40 30 20 E-Mail 10 Banner Pop-up 1 Pop-up 2 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Fragebogenseite gilt dieses für die beiden Pop-up Stichproben erst ab etwa der Mitte des Fragebogens. Dabei ist die Quote der Abbrecher bei den über die Homepage der ZBMed rekrutierten Personen deutlich stärker als bei denen, die über das Deutsche Gesundheitsnetz angesprochen wurden. Um Zusammenhänge zwischen den Abbrüchen und den unterschiedlichen Fragetypen festzustellen, wurden in Tabelle 4 die Ausfallquoten auf jeder Seite zusammen mit den auf diesen Seiten vorkommenden Fragetypen für jede der vier Stichproben angegeben. Vermerkt ist jeweils der Anteil der Personen, welche die jeweilige Seite an den Server abgeschickt haben. So haben von den 542 Personen, die per E-Mail kontaktiert wurden und welche die erste Seite des Fragebogens aufgerufen haben, 95,4% (=517 Personen) die erste Seite „bearbeitet“, d.h. sie haben die zweite Seite aufgerufen und dort bzw. noch während des Ladens dieser zweiten Seite die Befragung abgebrochen. Von den über die ZBMed angesprochenen Teilnehmern sind von den 1127 Personen, die sich auf der ersten Fragebogenseite befanden, nur 83,5% (=941 Personen) auf die zweite Seite gekommen. 84 ZA-Information 56 Tabelle 4 Ausfälle auf den einzelnen Seiten, getrennt für die vier Stichproben, alle Angaben in Prozent; angegeben sind die in der Stichprobe Verbliebenen E-Mail Banner Pop-up 1 Pop-up 2 (n=542) (n=266) (n=866) (n=1127) Seite Fragetyp 1 Einfachauswahl 95,4 91,7 88,5 83,5 2–4 Einfachauswahl 94,6 90,6 84,2 76,9 5 Mehrfachauswahl 94,3 89,8 82,2 74,4 6 Einfachauswahl 94,3 89,8 81,9 74,0 7 Matrix mit 7 Items 91,7 87,2 78,6 69,2 8 Matrix mit 14 Items 90,6 86,8 76,7 65,6 9 Matrix mit 11 Items 89,5 86,8 76,0 62,5 10 Matrix mit 5 Items 88,4 86,8 75,4 60,6 11 Grafik und Matrix 86,5 85,7 72,7 56,3 12 Einfachauswahl 86,0 85,3 71,5 55,1 13 – 21 Einfach- und Mehrfachauswahl 84,7 84,6 69,2 53,4 N 459 225 599 602 vollständig Anhand von Tabelle 4 wird ersichtlich, dass es Sprünge bei den Abbrüchen gab: Überdurchschnittlich viele Befragte brachen bei der Bearbeitung der siebten Seite ab; so haben z.B. in der E-Mail Stichprobe 94,3% derjenigen, welche die erste Fragebogenseite öffneten, die sechste Seite bearbeitet, aber nur 91,7% die siebte. Dieser Rückgang um 2,6 Prozentpunkte kann vermutlich auf die zeitintensive und auch etwas kompliziertere Bearbeitung der Matrixfrage mit sieben Items zurückgeführt werden. Bei den beiden Pop-up Stichproben ist der Sprung an dieser Stelle mit 3,3 Prozentpunkten bzw. 4,8 Prozentpunkten noch deutlicher. Einen zweiten Sprung bei den Ausfällen gibt es auf der elften Fragebogenseite – während noch 88,4% der per E-Mail kontaktierten Teilnehmer die Matrixfrage mit den fünf Items auf Seite 10 beantworteten, waren es bei der Beantwortung der Matrixfrage, die sich auf die Grafik bezieht, nur noch 86,5%; noch deutlichere Ausfälle an dieser Stelle sind bei den beiden Pop-up Stichproben festzustellen. Dieser Rückgang kann vermutlich zu einem großen Teil auf die überdurchschnittlich langen Ladezeiten zurückgeführt werden, die für den Aufbau von grafischen Elementen benötigt werden. Es kann damit festgehalten werden, dass Matrixfragen und Grafiken zu überdurchschnittlich vielen Abbrüchen führen. Weiterhin ist festzustellen, dass Teilnehmer, die per Pop-up Fenster angesprochen wurden, sensibler auf derartige Erschwernisse ZA-Information 56 85 im Fragebogen reagieren als die Personen der anderen beiden Stichproben; der Anteil an Abbrüchen ist bei den beiden Pop-up Stichproben überdurchschnittlich hoch. Es bleibt zu fragen, ob es ohne den Einsatz von Matrixfragen und der Grafik zu weniger Abbrüchen gekommen wäre. Ein Indikator, um diese Frage zu beantworten, ist das Antwortverhalten der Abbrecher bis zu der Stelle, an der sie den Fragebogen verlassen haben. Die Beantwortung bzw. die Nicht-Beantwortung der ersten Fragen soll als eine bestehende bzw. nicht-bestehende Teilnahmeabsicht interpretiert werden. Im Folgenden wird untersucht, ob sich die 583 Abbrecher, die zumindest die erste Fragebogenseite überschritten haben, von den 1885 Teilnehmern, die den Fragebogen vollständig ausfüllten, in den Anteilen an fehlenden Antworten unterscheiden. Für diese Analyse werden drei Gruppen von Abbrechern unterschieden: Erstens, Befragte, die auf den Seiten zwei bis sieben abbrachen, die also spätestens beim Erkennen der ersten Matrixfrage die Befragung verließen. Zweitens, Personen, die den Fragebogen verließen, als sie entweder mit den aufeinander folgenden Matrixfragen konfrontiert wurden oder spätestens bevor sie die Matrixfragen mit der integrierten Grafik beantwortet haben (S. 8 bis einschließlich 11). Drittens, Personen, welche die Matrixfragen beantwortet (bzw. sie zumindest überblättert, S. 12 bis S. 21) haben, aber an späterer Stelle vor dem Ende der Befragung abbrachen. Als vierte und letzte Gruppe sind die Teilnehmer der Untersuchung aufgeführt, die den Fragebogen vollständig ausgefüllt haben. Für die einzelnen Gruppen wurde der Anteil der fehlenden Werte berechnet. Um auch die erste Gruppe in die Analyse der fehlenden Antworten einbeziehen zu können, wurden für alle Gruppen lediglich die ersten acht Fragen (Seite 1 bis 6 des Fragebogens) berücksichtigt. Da bei der ersten Gruppe nicht alle Befragten bis zur siebten Seite kamen (vgl. Tabelle 4), variiert für diese die Basis der Prozentuierung: Für die Personen, die nur die ersten beiden Seiten überschritten haben und auf der dritten Seite abbrachen, wurden nur die Fragen der ersten beiden Seiten ausgewertet. Für die Personen, die auf der sechsten Seite abbrachen, wurden nur die ersten fünf Seiten ausgewertet, und die Personen, die bereits auf der ersten Seite abbrachen, wurden überhaupt nicht berücksichtigt. Die Anteile der fehlenden Werte für die drei Gruppen der Abbrecher sowie für die Gruppe der Teilnehmer, unterteilt nach den vier Stichproben, sind in Tabelle 5 wiedergegeben. 86 Tabelle 5 ZA-Information 56 Anteil fehlender Angaben und Abbrüche, durchschnittlicher Anteil an fehlenden Angaben bei den ersten acht Fragen Abbrecher bis S. 7 n % Abbrüche von S. 8 bis S. 11 n % Abbrüche von S. 12 bis S. 21 n % n % Teilnehmer E-Mail (n=517) Banner (n=244) Pop-up-1 (n=766) Pop-up-2 (n=941) 20 12 85 161 73,2 68,2 71,8 71,9 28 4 51 145 1,3 25,0 6,1 8,2 10 3 31 33 0,0 0,0 4,0 4,9 459 225 599 602 0,5 0,3 0,7 1,7 N 278 71,8 228 7,2 77 3,7 1885 0,9 Wie anhand von Tabelle 5 ersichtlich wird, haben diejenigen, die schon in einem sehr frühen Stadium die Befragung abbrachen, mit durchschnittlich 71,8% einen sehr hohen Anteil an fehlenden Angaben, und zwar unabhängig von der Art der Kontaktierung. Dieser hohe Wert ist ein Indikator dafür, dass ein großer Teil dieser 278 Befragten gar nicht die Absicht hatte, an der Studie teilzunehmen, sondern sich lediglich über den Inhalt der Befragung näher informieren wollte. In der zweiten Gruppe ist der Anteil fehlender Antworten deutlich geringer und beträgt im Durchschnitt nur noch 7,2%, in der E-Mail-Stichprobe sogar lediglich etwas mehr als 1%. Es kann vermutet werden, dass die Personen dieser Gruppe eine relativ hohe Teilnahmemotivation hatten und erst aufgrund der aufeinander folgenden komplexen Matrixfragen bzw. aufgrund der überdurchschnittlich langen Ladezeit der Grafik das Interesse verloren. Mit zunehmender Bearbeitung des Fragebogens sinkt der Anteil der fehlenden Angaben: In der dritten Gruppe der Abbrecher beträgt sie im Durchschnitt nur noch 3,7%, die der Teilnehmer liegt bei 0,9%. Matrixfragen scheinen somit für Personen, die zunächst eine Teilnahmeabsicht bekunden, indem sie die ersten Fragen beantworten, nicht per se ein Problem zu sein, sondern nur dann, wenn mehrere aufeinander folgen bzw. wenn durch eine Grafik das Laden einer Fragebogenseite zu stark verzögert wird. Inwiefern die Internetkompetenz5 der Befragten mit einem vorzeitigen Abbruch zusammenhängt, wird anhand der nachfolgenden Tabellen ersichtlich: Wird die Selbsteinschätzung der Interneterfahrung betrachtet (Tabelle 6), so stuften sich die Abbrecher im Vergleich zu den Teilnehmern überdurchschnittlich oft als „eher unerfahren“ ein. Während der Anteil derjenigen, die sich als „sehr erfahren“ oder „eher 5 Unterschiede zwischen den unterschiedlich rekrutierten Gruppen können vernachlässigt werden, sie sind nur sehr geringfügig und statistisch nicht signifikant. Von den frühen Abbrechern (bis S. 7) haben nur wenige diese Frage beantwortet, diese Gruppe wird daher in den Tabelle 6 bis 8 nicht berücksichtigt. ZA-Information 56 87 erfahren“ einstuften, bei den Teilnehmern bei 80% liegt, beträgt er bei den Abbrechern weniger als 70% (Tabelle 6). Diese Differenzen in der Selbsteinschätzung werden auch durch die Unterschiede des Zeitpunktes, seitdem das Internet genutzt wird, deutlich: Während fast 70% der vollständigen Teilnehmer angaben, das Internet zwei Jahre und länger zu nutzen, beträgt dieser Anteil bei den Abbrechern nur etwa 55% (Tabelle 7).6 Tabelle 6 Selbsteinschätzung der Interneterfahrung der Abbrecher im Vergleich zu den Teilnehmern, Spaltenprozente sehr erfahren eher erfahren eher unerfahren sehr unerfahren Abbrecher von S.8 bis S. 11 (n=210) 18,6 50,5 29,5 1,4 100,0 Abbrecher von S. 12 bis S.21 (n=74) 18,9 45,9 31,1 4,1 100,0 Teilnehmer (n=1875) 19,5 60,3 19,3 1,0 100,0 χ2=25,4; df = 6; p < 0,01, Cramer’s V=0,08 Tabelle 7 Internetnutzungszeitraum der Abbrecher im Vergleich, Spaltenprozente weniger als ½ Jahr ½ bis 1 Jahr 1 bis 2 Jahre 2 bis 3 Jahre länger als 3 Jahre Abbrecher von S.8 bis S. 11 (n = 206) 7,3 9,2 27,2 20,4 35,9 100,0 Abbrecher von S. 12 bis S.21 (n=72) 12,5 22,2 9,7 16,7 38,9 100,0 Teilnehmer (n=1849) 4,8 6,9 18,7 25,8 43,8 100,0 χ2=49,2; df = 8; p < 0,01, Cramer’s V=0,11 Ein weiterer Indikator zur Messung der Internetkompetenz ist der Umfang der genutzten Online-Dienste (Tabelle 8). Die deutlichsten Unterschiede zwischen Abbrechern und Teilnehmern gibt es bei der Nutzung solcher Dienste, die das Ausfüllen von Formularen beinhalten, also bei Diensten, die ebenso wie Online-Befragungen 6 Der Anteil der fehlenden Werte in Tabelle 6 beträgt für die drei Gruppen 7,9%, 3,9% und 0,5% (in der Reihenfolge der Spalten): In Tabelle 7 sind die entsprechenden Werte 9,6%, 6,5% und 1,9%; die Werte belegen damit auch die in Tabelle 5 angegebenen Durchschnittswerte für fehlende Angaben. 88 ZA-Information 56 auf einer standardisierten Form der Interaktion basieren: Vor allem Online-Banking, Online-Shopping und Reisebuchungen werden von einem geringeren Anteil der Abbrecher vorgenommen als von den Teilnehmern. Des Weiteren ist die Nutzung von E-Maildiensten für Abbrecher seltener selbstverständlich als für Teilnehmer: Von den Personen, die auf den Seiten 8 bis 11 abbrachen, nutzen 88,3% E-Mail, von denen, die auf den Seiten 12 bis 21 abbrachen, nutzen dieses Angebot 90,7%, bei den Teilnehmern waren es 97,4%. Tabelle 8 Genutzte Online-Dienste der Abbrecher im Vergleich mit den Teilnehmern, Angaben in Prozent Abbrecher Abbrecher von S.7 bis von S. 12 S. 11 bis S. 20 E-Mail 88,3 90,7 medizinische Informationsdienste 86,9 93,3 Suchmaschinen 85,9 81,3 Informationen und Nachrichten 73,2 94,7 Online-Banking 46,5 48,0 Online-Shopping 38,0 32,0 Reisebuchungen 31,5 38,7 Aktien- und Börseninformationen 20,7 36,0 Unterhaltung 28,2 29,3 Ticketreservierung 22,1 28,0 N 213 75 Teilnehmer 97,4 93,8 90,1 82,9 60,6 46,0 40,9 31,5 25,7 24,3 χ2 CV 50,9*** 14,2*** 8,8* 20,5*** 19,3*** 10,0** 7,1* 11,7** n.s. n.s. 0,15 0,08 0,06 0,10 0,10 0,07 0,06 0,07 1876 Für alle Zeilen: df = 2; *** = p < 0,001, ** = p < 0,01, *=p < 0,05 Aus diesen Ergebnissen kann abgeleitet werden, dass insbesondere eine geringere Erfahrung im Umgang mit dem Internet und dem Ausfüllen eines Fragebogens am Computer zu Abbrüchen führt – und hier verstärkt, wenn die Komplexität des Fragebogens zunimmt. Somit gibt es einen Zusammenhang von fragebogenspezifischen und befragtenspezifischen Faktoren. Im Folgenden wird untersucht, ob befragungsspezifische Faktoren mit dem Teilnahmeverhalten zusammenhängen. Bei jedem der in Tabelle 9 aufgelisteten Faktoren sollten die Befragten angeben, ob dieser Grund für die Teilnahme an der Befragung zutrifft oder nicht. Diesen Angaben zufolge war in allen vier Stichproben das Interesse am Thema das am häufigsten genannte Teilnahmemotiv. Besonders stark ist das Interesse bei den mittels Banner kontaktierten Personen ausgeprägt, deren Wert liegt im Schnitt 20 Prozentpunkte über dem der anderen Stichproben. Der zweitwichtigste Grund für die Teilnahme war Neugier, von den per Pop-up Fenster ZA-Information 56 Tabelle 9 89 Teilnahmemotive der Stichproben im Vergleich, Angaben der Nennungen, in Prozent Interesse am Thema Neugier Hilfsbereitschaft Aufsatzkopien der ZBMed wissenschaftlicher Anspruch Erhalt des Ergebnisberichtes Kommunikationsfreudigkeit E-Mail (n=460) Banner (n=225) 65,4 37,7 39,9 25,3 25,9 26,6 26,4 84,4 44,4 28,9 44,0 29,8 28,0 19,6 Pop-up1 (n=602) 64,6 51,3 36,7 33,4 24,8 26,9 27,9 Pop-up2 (n=597) 62,2 49,8 41,1 39,1 26,7 22,1 20,1 χ2 CV 38,4*** 23,1*** 11,6** 32,7*** 0n.s.** 0n.s.** 13,8** 0,14 0,11 0,08 0,13 0,09 Für alle Zeilen: df = 3; ** = p < 0,01, *** = p < 0,001 rekrutierten Befragten wurde dieser noch öfter angegeben als von Personen der anderen beiden Stichproben. Die unerwartete Ansprache durch ein Pop-up Fenster erfordert eine relativ spontane Entscheidung für oder gegen eine Teilnahme, in so einer Situation ist die Neugier ein überdurchschnittlich wichtiger Faktor für eine positive Teilnahmeentscheidung. Ob der Fragebogen bis zum Ende bearbeitet wurde, hängt vermutlich insbesondere damit zusammen, inwieweit das Interesse und die Neugier durch den Fragebogen aufrechterhalten werden konnten. Die versprochene Belohnung, Aufsatzkopien von der ZBMed kostenlos zu erhalten, hatte einen verhältnismäßig geringen Effekt auf die Teilnahmebereitschaft. Es muss allerdings gefragt werden, ob die versprochene Belohnung für die Befragten auch attraktiv war – Ärzte in Krankenhäusern und Mitarbeiter der Universitäten haben über ihre Dienststelle in der Regel einen für sie kostenlosen Zugriff auf wissenschaftliche Literatur. 5 Fazit Die Untersuchung hat gezeigt, dass sich die Ausfallquoten der vier betrachteten Stichproben zum Teil stark voneinander unterscheiden. Während von den Teilnehmern, die per E-Mail angeschrieben wurden bzw. die einem Banner gefolgt sind, nur relativ wenige die Befragung frühzeitig abbrachen, liegt der Anteil der Abbrecher bei den Teilnehmern, die über ein Pop-up Fenster zum Fragebogen gelangten, bei 31,8% (Pop-up 1) bzw. bei 46,6% (Pop-up 2). In den meisten Fällen scheint es sich um Ausfälle zu handeln, die nicht direkt auf die Rekrutierungsmethode zurückgeführt werden können, sondern auf fragebogen- und befragtenspezifische Faktoren. 90 ZA-Information 56 Überdurchschnittlich viele Abbrüche sind auf der ersten Fragebogenseite zu verzeichnen; des Weiteren, wenn der Fragentyp von einfach zu komplex wechselt und wenn sich die Bearbeitung des Fragebogens durch verlängerte Ladezeiten aufgrund einer eingebundenen Grafik verzögert. Die überdurchschnittliche Länge des Fragebogens der hier diskutierten Untersuchung scheint dagegen nur einen geringen Effekt auf die Abbruchquote gehabt zu haben: Wurden die komplexen Fragebogenseiten bearbeitet, dann wurde auf den neun folgenden Seiten nur noch selten abgebrochen. Somit haben fragebogenspezifische Faktoren einen entscheidenden Einfluss auf das Abbruchverhalten der Teilnehmer, vor allem dann, wenn diese weniger erfahren sind im Umgang mit dem Internet und einer standardisierten Form der OnlineKommunikation sind. Daraus kann gefolgert werden, dass fragebogenspezifische Faktoren vor allem dann für einen Abbruch relevant sind, wenn diese mit befragtenspezifischen Faktoren einhergehen (Komplexität des Fragebogens plus geringe Internetkompetenz). Schließlich wurde gezeigt, dass Personen, die sehr früh die Bearbeitung des Fragebogens abbrachen, vermutlich keine starke Teilnahmeintention hatten. Ihr Anteil an fehlenden Angaben ist bei den Fragen, die sie sich zumindest angesehen haben, sehr hoch; diese Personen scheinen von Anfang an skeptisch gegenüber der Teilnahme gewesen zu sein und wollten vielleicht nur aus Neugier noch ein wenig im Fragebogen „blättern“. Sie brachen spätestens bei der ersten Matrixfrage ab. Der relativ geringe Anteil an Abbrüchen in der E-Mail- wie auch Banner-Stichprobe ist vermutlich darauf zurückzuführen, dass sich die derart Angesprochenen nicht unmittelbar für oder gegen eine Teilnahme entscheiden mussten, sondern Zeit hatten, diese zu überdenken; d.h. es kann davon ausgegangen werden, dass die Entscheidung für das vollständige Ausfüllen des Fragebogens überdurchschnittlich oft bereits im Vorfeld getroffen wurde. So ist bei Online-Befragungen, die eine Rekrutierung anhand einer personalisierten E-Mail oder per Banner vorsehen, die Verwendung von relativ langen und komplexen Fragebögen möglich. Bei der Banner-Stichprobe ist aufgrund des weit überdurchschnittlichen Interesses dieser Gruppe am Thema von einer selektiven Stichprobe auszugehen, bei der die Hochinteressierten überrepräsentiert sind. Ob dies angesichts der Tatsache, dass Online-Stichproben generell nur bedingt repräsentativ sind, ein Nachteil ist, kann im Rahmen dieser Studie nicht entschieden werden. Bei der Pop-up Ansprache ist Neugier ein sehr wichtiges Teilnahmemotiv. Diese muss im gesamten Verlauf des Fragebogens jedoch immer wieder geweckt bzw. konstant hoch gehalten werden, da anscheinend auf nahezu jeder Seite neu darüber ZA-Information 56 91 entschieden wird, ob der Fragebogen weiter bearbeitet wird oder nicht. Matrixfragen, die eine relativ lange Bearbeitungszeit erfordern, können dann in verstärktem Maß dazu führen, dass die Teilnehmer die Befragung vorzeitig beenden. Wird die Rekrutierung der Befragten per Pop-up Fenster vorgenommen, so sollte darauf geachtet werden, dass der Fragebogen schnell und ohne große Mühe ausgefüllt werden kann. Literatur ADM 2004: Jahresbericht 2003. URL: http://www.adm-ev.de/pdf/Jahresbericht_03.pdf.. Bandilla, W. 2003: Die Internetgemeinde als Grundgesamtheit. S. 71-83 In: ADM Arbeitkreis Deutscher Markt- und Sozialforschungsinstitute/ Arbeitsgemeinschaft Sozialwissenschaftlicher Institute (ASI)/ Statistisches Bundesamt (Hrsg.): Online-Erhebungen. Sozialwissenschaftlicher Tagungsbericht, Band 7. Bonn: Informationszentrum Sozialwissenschaften. Batagelj, Z., Vehovar, V. 1999: Web Surveys: Revolutionising the Survey Industry or (Only) Enriching its Spectrum? Proceedings of the ESOMAR Worldwide Internet Conference Net Effects: S. 159-176. Amsterdam: ESOMAR. Batagelj, Z., Lozar, K., Vehovar, V. 1998: Respondent’s Satisfaction in WWW Surveys. Paper presented at the International Conference on Methodology and Statistics. Preddvor, Slovenia. Batinic, B. 2001: Fragebogenuntersuchungen im Internet. Aachen: Shaker. Blasius, J., Reuband, K.-H. 1995: Telefoninterviews in der empirischen Sozialforschung: Ausschöpfungsquoten und Antwortqualität. ZA-Information, 37: S. 64-87. Bosnjak, M. 2001: Participation in Non-Restricted Web Surveys: A Typology and Explanatory Model for Item Non-Response. S. 193-208. In: U.-D. Reips, M. Bosnjak (Eds.): Dimensions of Internet Science. Lengerich: Pabst Science Publishers. Bosnjak, M., Bandilla, W., Tuten, T. L. 1998: Mehrstufige (Selbst-) Selektion: Anwendung des ‘Elaboration-Likelihood-Modells’ auf per Banner beworbene Web-Untersuchungen. Vortag auf der German Online Research Tagung, Mannheim. Bosnjak, M., Batinic, B. 1999: Determinanten der Teilnahmebereitschaft an internet-basierten Fragebogenuntersuchungen am Beispiel E-Mail. S. 145-157. In: B. Batinic, A. Werner, L. Gräf, W. Bandilla (Hrsg.): Online-Research. Methoden, Anwendungen und Ergebnisse. Göttingen: Hogrefe. Brandt, M. 2005: Repräsentativität von Online-Befragungen. ALLBUS und Online-Panel im Vergleich. Unveröffentlichte Magisterarbeit am Seminar für Soziologie der Universität Bonn. Brenner, V. 2002: Generalizability issues in internet-based survey research: Implications for the internet addiction controversy. S. 93-113. In: B. Batinic, U.-D. Reips, M. Bosnjak (Eds.): Online social sciences. Göttingen: Hogrefe. Dillman, D. 2000: Mail and Internet Surveys – The Tailored Design Method. New York, NY: Wiley. Dillman, D., Totora, R.D., Conradt, J., Bowker, D. 1998: Influence of plain versus fancy design on response rates for web surveys. Paper presented at annual meeting of the American Statistical Association, Dallas, TX. URL: http://survey.sesrc.wsu.edu./dillman/papers/AAPORpaper00.pdf. Stand: 23.03.2005 El-Menouar, Y. 2002: Was erwarten Nutzerinnen und Nutzer vom Internet-Angebot medizinischer Bibliotheken? Ergebnisse einer internetbasierten Umfrage. Köln: Deutsche Zentralbibliothek für Medizin. 92 ZA-Information 56 Frick, A., Bächtiger, M. T., Reips, U.-D. 2001: Financial Incentives, Personal Information and Drop-Out Rate in Online Studies. S. 209-220. In: U.-D. Reips, M. Bosnjak (Eds.): Dimensions of Internet Science. Lengerich: Pabst Science Publishers. Janetzko, D. 1999: Statistische Anwendungen im Internet. In Netzumgebungen Daten erheben, auswerten und präsentieren. Addison Wesley Verlag. Knapp, F., Heidingsfelder, M. 2001: Drop-out analysis: the effect of research design. S. 221-230. In: U.-D. Reips, M. Bosnjak (Eds.): Dimensions of Internet Science. Lengerich: Pabst Science Publishers. Gräf, L. 1999: Optimierung von WWW-Umfragen: Das Online Pretest-Studio. S. 159-178. In: (Hrsg.) B. Batinic, A. Werner, L. Gräf, W. Bandilla (Eds.): Online Research. Methoden, Anwendungen und Ergebnisse. Göttingen – Bern- Toronto – Seattle: Hogrefe. Hauptmanns, P., Lander, B. 2001: Zur Problematik von Internet-Stichproben. S. 27-40 In: Theobald, A., Dreyer, M., Starsetzki, T. (Hrsg.): Online-Marktforschung, theoretische Grundlagen und praktische Erfahrungen. Wiesbaden: Gabler. Hauptmanns, P. 1999: Grenzen und Chancen von quantitativen Befragungen mit Hilfe des Internet. S. 21-38 In: Batinic, B., Werner, A., Gräf, L., Bandilla, W. (Hrsg.): Online-Research. Methoden, Anwendungen und Ergebnisse. Göttingen: Hogrefe. Porst, R., von Briel, C. 1995: Wären Sie vielleicht bereit, sich gegebenenfalls noch einmal befragen zu lassen? Oder: Gründe für die Teilnahme an Panelbefragungen. ZUMA Arbeitsberichte, S. 1-17. Reips, U-D. 1997: Das psychologische Experimentieren im Internet. S. 245-266 In: B. Batinic (Eds.): Internet für Psychologen. Göttingen: Hogrefe. Schnell, R. 1997: Nonresponse in Bevölkerungsumfragen. Ausmaß, Entwicklung und Ursachen. Opladen: Leske + Budrich. Smith, C. 1997: Casting the NET: Surveying an Internet population. Journal of Communication Mediated by Computers, 3. [Online].http://www.ascusc.org/jcmc/vol3/issue1/smith.html. Theobald, A. 2000: Das World Wide Web als Befragungsinstrument. Wiesbaden: Deutscher UniversitätsVerlag. Tuten, T., Urban, D.J., Bosnjak, M. 2002: Internet Surveys and Data Quality – A Review. S. 7-25. In: B. Batinic, U.-D. Reips, M. Bosnjak (Eds.): Online Social Sciences. Seattle, WA: Hogrefe & Huber. Vehovar, V., Batagelj, Z., Manfreda, K. L., Zaletelj, M. 2002: Nonresponse in Web Surveys. S. 229-242 In: R. M. Groves, D. A. Dillman, J. L. Eltinge, R. J. A. Little (Eds.): Survey nonresponse (Wiley Series in Probability and Statistics: Survey Methodology Section. New York: Wiley. Zerr, K. 2001: Erscheinungsformen des Online-Research – Klassifikation und kritische Betrachtung. Beiträge der Fachhochschule Pforzheim, 95. ZA-Information 56 93 MTB: Ein Record-Linkage-Programm für die empirische Sozialforschung von Rainer Schnell, Tobias Bachteler und Jörg Reiher 1 Zusammenfassung In der Praxis der empirischen Sozialforschung werden häufig Datensätze aus verschiedenen Datenquellen zusammengeführt (Record-Linkage). Solange in unterschiedlichen Datenquellen gemeinsame fehlerfreie Schlüssel (z.B. Namen oder Matrikelnummern) existieren, ist die Zusammenführung problemlos. Fehler in den gemeinsamen Schlüsseln erzwingen fast immer aufwändige manuelle Korrekturen. Um die Zusammenführung unterschiedlicher Datenbestände trotz fehlerhafter Schlüssel zu ermöglichen, wurde im Rahmen eines DFG-Projekts ein Computerprogramm entwickelt, um diese Aufgabe zu erleichtern: Die „Merge-Toolbox“, kurz: „MTB“. Abstract Bringing together data files from different sources (record linkage) is a common task in social science. As long as the data files contain clean merging keys (e.g. names or identification numbers) the procedure is rather trivial. However, if the merging keys are error prone, manual corrections are inevitable. To facilitate record linkage using error prone keys we developed the computer programme “Merge Toolbox” (MTB) within the scope of the DFG-funded research project “Record linkage using error prone strings”. 1 Dr. Rainer Schnell ist Professor im Fachbereich für Verwaltungswissenschaft, Methoden der empirischen Politik- und Verwaltungsforschung, Universität Konstanz Postfach D 92, 78434 Konstanz, E-Mail: [email protected], Tobias Bachteler (M.A.) ist Wiss. Angestellter am Fachbereich für Verwaltungswissenschaft, Methoden der empirischen Politik- und Verwaltungsforschung, Universität Konstanz, Jörg Reiher studiert Informatik an der Fernuniversität Hagen. 94 1 ZA-Information 56 Einleitung Datenanalytiker stehen oft vor dem Problem, Datenbanken aus verschiedenen Quellen verknüpfen zu müssen. In der Regel werden Datensätze verwendet, die sich auf dasselbe Objekt (Personen, Haushalte) beziehen2. Dieses Problem wird in der statistischen Literatur als „Record-Linkage“ bezeichnet. Neuere Beispiele für RecordLinkage-Anwendungen in der Bundesrepublik reichen von der Vorbereitung des Zensus-Test (Fürnrohr u.a. 2002), der Zuspielung von Telefonnummern zu Betrieben bei Stichproben aus Betriebsstättendateien bzw. von Telefonnummern bei CATIInterviews auf der Basis von Einwohnermelde- oder Random-Walk-Stichproben über die Verlinkung von Geburts- und Einschulregistern bei epidemiologischen Studien (Heller u.a. 2001) bis zur Ergänzung von Befragtenangaben in Surveys durch Daten der angegebenen Arbeitsstätten (Schnell u.a. 2003).3 Besonders bei Surveydaten wird Record-Linkage durch Rechtschreib- und Tippfehler in den Angaben der Befragten erschwert. Da die meisten Statistikprogrammpakete (wie z.B. SAS, SPSS, STATA) Verknüpfungen verschiedener Datensätze nur dann erlauben, wenn die zur Zusammenführung verwandte Schlüssel (z.B. Namen oder Matrikelnummern) in den jeweiligen Datenbanken vollständig übereinstimmen, müssen häufig die Schlüssel zahlreicher Datensätze manuell bereinigt werden. Liegen tatsächlich Daten aus unterschiedlichen Quellen in dem in der Sozialforschung üblichen Umfang vor, dann kann der erforderliche manuelle Aufwand mehrere Arbeitswochen beanspruchen. Oft führt allein dieser Sachverhalt dazu, dass existierende Datenbestände nicht zusammengeführt werden. Die maschinelle Verknüpfung von fehlerbehafteten Daten erfordert spezielle Software, die bislang faktisch kaum allgemein verfügbar war.4 Da zudem kaum Untersuchungen zu den verwendeten Algorithmen auf der Basis realer Datenbestände existierten, haben wir im Rahmen eines DFG-Projekts ein eigenes Record-LinkageProgramm entwickelt. Eine vorläufige Version dieses Programms steht nunmehr zum Download bereit (vgl. Abschnitt 4). 2 Im Gegensatz dazu werden bei der „Datenfusion“ Daten unterschiedlicher Objekte zusammen- geführt. 3 Bei solchen Projekten ergeben sich erhebliche Datenschutzprobleme; daher wird im Regelfall eine schriftliche Einverständniserklärung der Befragten mit der Zusammenführung erforderlich sein. 4 In der statistischen Literatur sind vor allem die Programme „Matcher-2“ des „US-Bureau of the Census“ (Winkler 1999) sowie OXLINK (Gill 1999) bekannt. Beide Programme sind schwer zugänglich, weiterhin ist OXLINK auf Grund besonderer Hard- und Softwarevoraussetzungen kaum portabel; Matcher-2 läuft zwar auf Standard-PCs, ist jedoch nur schwer adaptierbar und wenig benutzerfreundlich. ZA-Information 56 2 95 Durchführung eines Record-Linkage-Prozesses mit MTB Der tatsächliche Ablauf eines Record-Linkage-Prozesses besteht aus 1. der Bereitstellung der zu verknüpfenden Datensätze 2. der Standardisierung der Verknüpfungsschlüssel 3. der Berechnung der Ähnlichkeiten der potentiellen Paare 4. der manuellen Verknüpfung ungeklärter Fälle 5. der tatsächlichen Zusammenführung der Datensätze. Der erste und der letzte Punkt sind technisch trivial. Für die Konvertierung von Datensätzen in das STATA-Format stehen kommerzielle Programme wie z.B. „DBMScopy“ und „Stat/Transfer“ sowie frei zugängliche Software zur Verfügung (z.B. die Bibliothek „foreign“ in „R“)5. Die tatsächliche Zusammenführung erfolgt innerhalb von STATA durch das „Merge“-Kommando. Zur Ausführung der Arbeitsschritte 2. bis 4. dienen die drei Module der Merge-Toolbox (MTB): „Pre-processing Tool“, „Deterministisches Record Linkage“ „Manual Merge Modul“ Die drei Module von MTB wurden entwickelt, um die beschriebenen nicht-trivialen Schritte eines Record-Linkage-Prozesses zu erleichtern. Alle Module sind unabhängig voneinander laufende Programme. Alle Module wurden als JAVA-Programme realisiert und sind damit unter allen üblichen Betriebssystemen (Linux, Mac-OS, Windows) lauffähig. Das Standarddatenformat der MTB ist das Datenformat von STATA-8.6 Neben STATA-8 kann das Pre-processing-Modul der MTB ASCII-Files (CSV) lesen, welche von fast jedem Datenbank- bzw. Statistikprogramm erzeugt werden können. Alle Module verwenden STATA-8 als Format für die Datenausgabe. 2.1 Die Standardisierung der Verknüpfungsschlüssel Das Modul „Pre-processing“ enthält eine Reihe von Prozeduren zur Standardisierung von Verknüpfungsschlüsseln. Solche Standardisierungen sind z.B. notwendig, wenn die Schlüssel oft in den beiden zu verknüpfenden Datenfiles in unterschiedlicher Schreibweise auftreten, man denke etwa an Dr. und Doktor oder Str. und Straße. So trivial solche Prozeduren auch scheinen mögen: Mit Standardsoftware sind diese Operationen nicht möglich. 5 Einzelheiten zu DBMScopy finden sich unter www.dataflux.com, Details zu Stat/Transfer unter http://www.stattransfer.com und die Sammlung von Bibliotheken und Programmen zu R über http://cran.r-project.org. 6 Das Datenformat von STATA ist öffentlich dokumentiert und über alle verfügbaren Plattformen binärkompatibel, d.h. STATA-Datenfiles können problemlos zwischen unterschiedlichen Betriebssystemen ausgetauscht werden, vgl. StataCorp. (2003). 96 Abbildung 1 ZA-Information 56 Pre-processing Tool Die beiden zu verknüpfenden Datensätze werden nacheinander mittels des Preprocessing-Tools standardisiert. Nach dem Laden des jeweiligen Datensatzes wird dieser doppelt in den beiden nebeneinander liegenden Fenstern dargestellt. Damit der Anwender die Effekte der ausgewählten Prozeduren direkt nachvollziehen kann, werden im rechten Fenster die Veränderungen in den geänderten Datenzellen grün markiert dargestellt, während im linken Fenster die Daten in ihrer ursprünglichen Form zu sehen sind. Vor der Ausführung eines jeden Vorgangs wird durch einen Klick auf den Variablennamen im rechten Fenster die zu bearbeitende Variable ausgewählt. Alle Standardisierungsprozeduren finden sich im Menü Process. Der Menübefehl Replace Umlauts ersetzt in der gewählten Datenspalte die Umlaute „ä“, „ö“ und „ü“ mit „ae“, „oe“ und „ue“, um verschiedenen Schreibformaten vorzubeugen. Der Menübefehl Slack erlaubt die Auswahl einer so genannten slack list (ein ASCIIFile, welches zu entfernende Zeichenketten enthält). Aus der markierten Variablen werden durch die Auswahl einer Slack-Liste alle dort verzeichneten Zeichenketten entfernt. Solche Entfernungen sind etwa dann nötig, wenn die Datenfiles oft auftretende Namensbestandteile aufweisen wie etwa die Präfixe O’ und Mac/Mc bei englischen Namen oder GmbH, Firma, Rechtsanwaltskanzlei bei Firmennamen. Diese sollten entfernt werden, weil sie wenig zur Differenzierung von unterschiedlichen Objekten beitragen und sie eine etwaige Ähnlichkeitsberechnung dominieren könn- ZA-Information 56 97 ten. Der Benutzer sollte je nach Anwendung seine eigene Slack-Liste zusammenstellen. Dies kann z.B. eine Liste von Titeln sein, die aus Nachnamensfeldern entfernt werden sollen. Der Befehl Parse dient zum Umgang mit Doppelnamen. Nach dem Aufruf des Befehls ist festzulegen, anhand welcher Trennung Doppelnamen erkannt werden sollen. Zur Auswahl steht die Trennung durch Leerzeichen, Großbuchstaben oder Bindestrich. Mittels wiederholter Ausführung können diese Optionen kombiniert werden. Wird eine Option aktiviert, werden zusätzlich zu der ursprünglichen Datenzeile automatisch zwei weitere Datenzeilen erzeugt, welche jeweils nur einen der Namensteile enthalten und ansonsten mit der ursprünglichen Datenzeile identisch sind. Der Doppelname „Müller-Thurgau“ resultiert in drei Datenzeilen „MüllerThurgau“, „Müller“ und „Thurgau“. 2.2 Deterministisches Record-Linkage Mit Hilfe des Moduls „Deterministisches Record-Linkage“ werden nun die beiden Datenfiles über die zuvor standardisierten Verknüpfungsschlüssel zusammengeführt. Hierzu berechnet das Modul die Ähnlichkeit zwischen den Schlüsseln potentieller Record-Paare. Die grundlegende Idee hierbei ist, dass zwei sehr ähnliche Schlüssel eher aus zusammengehörenden Datenzeilen stammen sollten. Die Ähnlichkeit zweier Schlüssel wird durch die Berechnung von Stringähnlichkeitsfunktionen ermittelt. Das Argument einer Stringähnlichkeitsfunktion ist ein Paar von Zeichenketten – z.B. zwei Namen –, deren Ähnlichkeit als Funktionswert wiedergegeben wird. Der Wertebereich der in MTB implementierten Stringähnlichkeitsfunktionen ist stets auf das Intervall zwischen 0 und 1 normiert, so dass ein Funktionswert näher an 1 eine größere Ähnlichkeit für zwei Zeichenketten ausdrückt. Sind die beiden Zeichenketten identisch, wird ein Funktionswert von 1 wiedergegeben. Derzeit sind 24 verschiedene solcher Funktionen implementiert.7 Die Vergleichsergebnisse beliebig vieler Algorithmen können zu einem Wert zusammengefasst werden. Anschließend gibt das Programm für jeden Fall eine vom Benutzer gewünschte Anzahl derjenigen Records aus, welche die besten Übereinstimmungen in den Schlüsseln aufweisen. Das Prinzip der Zusammenführung besteht bei einer deterministischen Verknüpfung darin, dass zuerst für jedes Record-Paar eine Ähnlichkeit 7 Einzelheiten finden sich bei Schnell u.a. (2004). 98 ZA-Information 56 berechnet wird und dann Paare oberhalb eines geeigneten Schwellenwertes als „Positive“, die anderen Paare als „Negative“ klassifiziert werden. Da jeder Fall mit jedem anderen Fall verglichen wird, fallen bei zwei Datenfiles der Größen na und nb na*nb Vergleiche an. Bei größeren Fallzahlen wächst daher die Rechenzeit über vertretbare Grenzen hinaus. Die Rechenzeit wird dann in der Regel dadurch begrenzt, dass der Vergleich potentieller Paare auf Teilmengen beschränkt wird: Blocking. Die Teilmengen werden durch Variablen definiert, die als relativ fehlerfrei betrachtet werden: z.B. durch Postleitzahlen bei Betrieben. Die Berechnung der Ähnlichkeit würde hier nur zwischen solchen Fällen stattfinden, welche dieselbe Postleitzahl aufweisen. Das Modul erlaubt die Definition eines BlockingSchemas durch Kombination beliebig vieler Blockingvariablen. Es können keine, eine oder mehrere Block-Variablen festgelegt werden. Sind es mehrere, werden die Blöcke durch die Wertekombinationen aller Block-Variablen definiert. Der Anwender legt zunächst im Bereich „In/Out Data“ über die Eingabefelder „A-File“ und „B-File“ die beiden Datenfiles fest. Dabei sollte der kleinere der beiden Datensätze als B-File festgelegt werden, weil MTB nur den B-File komplett in den Arbeitsspeicher lädt. Während des Record-Linkage-Prozesses erzeugt MTB zwei neue Dateien, ein so genanntes „Log-File“, in dem die beim Starten des letzten Merge-Prozesses gültigen Einstellungen und die Laufzeiten dokumentiert werden und das „Out-File“, in das die Ausgabe der Ähnlichkeitsberechnungen geschrieben wird. Log-Files sind ASCII-Dateien, Out-Files werden als STATA-Files geschrieben. In den Feldern „Out-File“ (vgl. Abbildung 2) und „Log-File“ legt der Anwender den Speicherort dieser Dateien fest. Im Bereich „Out variables“ wird über die Knöpfe „Add“ und „Remove“ festgelegt, welche Variablen aus den beiden InputFiles in das Out-File geschrieben werden. Dabei sollte der Benutzer darauf achten, vorher sowohl im A- als auch im B-File eine Identifizierungsvariable anzulegen und das Programm anzuweisen, die beiden Variablen in das Outfile zu schreiben. Über diese Identifizierungsvariablen kann später die eigentliche Verknüpfung der beiden Ausgangsfiles vorgenommen werden.8 In den unteren Bereichen des Fensters wird der eigentliche Verknüpfungsprozess spezifiziert. Im Bereich „Block by“ wird über den Button „Add...“ festgelegt, nach welchen Variablen während der Verknüpfung „geblockt“ werden soll, d.h. innerhalb 8 Ebenso können über diese ID-Variablen mittels des „Manual Merge“-Moduls, die um die auto- matisch gefundenen Zuordnungen reduzierten Datenfiles für die manuelle Nachbereitung gewonnen werden (vgl. Abschnitt 2.3). ZA-Information 56 Abbildung 2 99 Deterministisches Record Linkage welcher Gruppen („Blöcke“) die Ähnlichkeitsberechnungen erfolgen sollen. Für numerische Variablen kann zwischen Blocken nach exakter Übereinstimmung oder innerhalb einer Abweichung von +/- 1 gewählt werden. Die Auswahl der gewünschten Stringähnlichkeitsfunktionen erfolgt im Bereich „Merge by“. Durch den Knopf „Add...“ werden die Variablen angegeben, die den gewünschten Verknüpfungsschlüssel im jeweiligen File enthalten. Dann wird über das mittlere Pull-Down-Menü die Ähnlichkeitsfunktion für diesen Schlüssel ausgewählt. Es können auch mehrere Verknüpfungsschlüssel mit unterschiedlichen Ähnlichkeitsfunktionen bestimmt werden (in diesem Fall werden die jeweils resultierenden Ähnlichkeitswerte zu einer Gesamtähnlichkeit addiert). Über das Feld „Number of best matches“ (vgl. Abbildung 3) wird festgelegt, wie viele Zuordnungen aus dem B-File für jeden Fall aus dem A-File in das Out-File geschrieben werden. Gibt der Anwender etwa „25“ an, so werden zu jeder Zeile des A-Files die 25 Zeilen aus dem B-File mit den höchsten Ähnlichkeitswerten in das Out-File geschrieben. Soll nur der Fall mit der bestmöglichen Übereinstimmung zugeschrieben werden, ist entsprechend „1“ anzugeben. 100 Abbildung 3 ZA-Information 56 Deterministisches Record Linkage: Number of best matches 2.3 Manuelle Verknüpfung mittels „Manual Merge“ Ist nach der deterministischen Verknüpfung nicht allen Records des A-Files ein Record des B-Files zugeordnet, kann durch das Modul „Manual Merge“ eine manuelle Zuordnung erfolgen.9 Dazu stellt das Manual-Merge-Modul die beiden zu verbindenden Datensätze in zwei Datenfenstern dar. Beide Datensätze können gleichzeitig und unabhängig voneinander durchsucht werden; entsprechend können die beiden Datenfenster unabhängig voneinander „gescrollt“ werden. Weiterhin ist eine unabhängige Sortierung der Datensätze nach verschiedenen Kriterien möglich. Glaubt der Anwender, ein zueinander gehörendes Record-Paar erkannt zu haben, klickt er mit der Maus nacheinander auf die Records. Durch Betätigen der rechten Maustaste wird dieses Paar dann als „definite pair“ oder „probable pair“ klassifiziert. Je nach Klassifizierung werden die betreffenden Records aus den Hauptfenstern entfernt und in den Datenfenstern im unteren Bereich der Oberfläche angezeigt (vgl. Abbildung 4 unten). Die resultierenden Listen von „Record-Paaren“ lassen sich über das Menü „File“ speichern. 9 Derzeit müssen dazu die bereits automatisch zugeordneten Records durch den Benutzer über im Outfile enthaltene Identifizierungsvariablen aus den zu verbindenden Datensätzen entfernt werden. Die Automatisierung dieses Arbeitsschrittes ist in Planung. Es soll dann möglich sein, die nicht automatisch zugeordneten Records direkt in das „Manual Merge“- Modul zu laden. ZA-Information 56 101 Wesentlich vereinfacht wird die manuelle Suche in großen Datensätzen durch die Bildung von Subgruppen. Die Subgruppenbildung erfolgt, um – ähnlich dem „Blocken“ – die Anzahl der zu vergleichenden Paare im Rahmen zu halten, wobei die aus Sicht des Anwenders am ehesten in Frage kommenden Vergleichsfälle ausgewählt werden sollen. Innerhalb des Moduls können solche Subgruppen durch die Verwendung so genannter „regulärer Ausdrücke“10 gebildet werden. Weiterhin ist die Bildung von Subgruppen durch die Angabe einer minimalen Ähnlichkeit zweier Strings möglich. Alle Subgruppenbildungsbefehle werden gespeichert und können durch einen Mausklick wiederholt werden. Die Subgruppenbildung erfolgt durch einen rechten Mausklick in das Feld „Subgroups“ unter den Hauptfenstern. Aus dem dann erscheinenden Menü kann die angestrebte Art der Subgruppenbildung ausgewählt werden. Hierzu stehen drei Möglichkeiten zur Verfügung. Durch den Befehl „Add LIKE restriction“ lassen sich Subgruppen durch die Angabe regulärer Ausdrücke für die gewünschte Variable bilden. Gibt man z.B. für eine Variable mit Nachnamen den Ausdruck „F.*“ an, so werden alle Fälle mit Nachnamen, die mit dem Buchstaben „F“ beginnen, als Subgruppe definiert. Durch einen Doppelklick auf eine Zeile im „Subgroups“-Fenster wird die entsprechende Subgruppe in das Hauptfenster geladen. Durch den Befehl „Add Approxlike restriction“ (vgl. Abbildung 5) lassen sich Subgruppen bilden, deren Mitglieder eine gewisse Ähnlichkeit (gemäß einer wählbaren Stringähnlichkeitsfunktion) in Hinsicht auf einen Ausdruck aufweisen. Wird z.B. der Ausdruck „Mueller“ festgelegt und als Stringähnlichkeitsfunktion die Zahl der gemeinsamen Buchstabenpaare im Verhältnis zur Länge des Schlüssels mit dem Schwellenwert 0.9 ausgewählt, so enthält die Subgruppe alle Fälle, deren Namen zu „Mueller“ mindestens die so genannte Bigramm-Ähnlichkeit 0.9 aufweisen. Eine weitere Möglichkeit ist die Subgruppenbildung aus der Schnittmenge bereits bestehender Subgruppen. Dies erfolgt durch den Befehl „clone selected objects“. 10 „Reguläre Ausdrücke“ (im Unix-Sprachgebrauch kurz „regexp“) sind Suchmasken, bei denen die gesuchten Zeichen durch spezielle Symbole ersetzt werden. So findet z. B. der reguläre Ausdruck „Me.*er“ jedes Record, in dem „Me“ nach beliebig vielen Zeichen von „er“ gefolgt wird, also z. B. „Meyer“, „Meier“, „Meer“ oder „Meter“. 102 ZA-Information 56 Abbildung 4 Manual Merge Modul Abbildung 5 Manual Merge Modul: Approxlike restriction ZA-Information 56 3 103 Weiterentwicklung Die Projektgruppe arbeitet an der Implementierung eines so genannten „probabilistischen Record-Linkage-Moduls“, das u.a. eine Schätzung optimaler Schwellenwerte für die Bestimmung der Ähnlichkeit zweier potentieller Record-Paare erlaubt. Weiterhin wurden umfangreiche Namensdatenbanken (getrennt nach Nationalität und Geschlecht) aufgebaut, welche die Korrektur fehlerhafter Schlüssel erleichtern sollen. Schließlich bemüht sich die Arbeitsgruppe innerhalb eines neuen Projekts („Safe-Link“) um die Implementierung und öffentliche Bereitstellung datenschutzrechtlich unbedenklicher Record-Linkage-Verfahren. 4 Programmverfügbarkeit Mit MTB steht der empirischen Sozialforschung nunmehr ein funktionsfähiges Softwarepaket zur Durchführung von Record-Linkage-Anwendungen zur Verfügung. Die derzeitige, vorläufige Version des Programms kann für akademische Zwecke kostenlos von der Homepage des Projekts heruntergeladen werden.11 Bei Anwendungen des Programms wären die Autoren für eine Mitteilung und eine angemessene Zitierweise dankbar. Literatur Fürnrohr, M., Rimmelspacher, B., von Roncador, T. (2002): Zusammenführung von Datenbeständen ohne numerische Identifikatoren: ein Verfahren im Rahmen der Testuntersuchungen zu einem registergestützten Zensus. In: Bayern in Zahlen, 7, S. 308-321. Gill, L.E. OX-LINK: The Oxford Medical Record Linkage System, In: National Research Council (NRC) (1999): Record Linkage Techniques - 1997. Proceedings of an International Workshop and Exposition, Washington, S. 15-33. Heller, G., Schnell, R., Schmidt, S. (2001): Welchen Einfluss hat die subpartuale Asphyxie auf die spätere gesundheitliche Entwicklung? In: Der Gynäkologe, 34, 2, S. 126-129. Schnell, R., Bachteler, T., Bender, S. (2003): Record linkage using error prone strings; In: American Statistical Association, Proceedings of the Joint Statistical Meetings, S. 3713-3717. Schnell, R., Bachteler, T., Bender, S. (2004): A toolbox for record linkage; In: Austrian Journal of Statistics, 33, 1-2, S. 125-133. StataCorp. (2003): Stata Statistical Software, Release 8.0, College Station, Texas (Stata Corporation). Winkler, W.E. (1999): The State of Record Linkage and Current Research Problems. Statistics of Income Division, Internal Revenue Service Publication. Washington D.C., US Bureau of the Census, Statistical Research Division. 11 Die Homepage des Projekts ist http://www.uni-konstanz.de/FuF/Verwiss/Schnell/recordli.html. 104 ZA-Information 56 Berlin-Datenbank von Prof. H. Hurwitz: Präsentation im Dezember in Berlin von Ekkehard Mochmann Prof. Dr. Harold Hurwitz lehrte bis zu seiner Pensionierung 1988 am Fachbereich Politische Wissenschaft; seine Forschungen führte er am Zentralinstitut für Sozialwissenschaftliche Forschung der Freien Universität Berlin durch. Im Mittelpunkt stand viele Jahre sein Umfrageprogramm, das er in Reaktion auf das Chrutschow-Ultimatum vom Herbst 1958 für die Senatskanzlei konzipierte. Die Daten und Auswertungsberichte hat er in seinem Forschungsarchiv über die Jahrzehnte hinweg gehütet. In den vergangenen Jahren hat das Zentralarchiv Arbeiten unterstützt, diese einmalige Sammlung für weitere Analysen zu erschließen. Die Dokumente wurden von Hans-Berthold Hohmann in einer Datenbank im PDF Format für den direkten Zugriff auf die zugehörigen Analysedateien aufbereitet. Außer Dokumenten zur Entstehung des Umfrageprogramms werden Berichte, dazu gehörige Briefe und auch vertrauliche Vermerke im Landesarchiv Berlin deponiert. Die Daten und Dokumente stehen im Zentralarchiv als Datenbank auf DVD zur Verfügung und werden z. Zt. in Kooperation mit dem Otto-Stammer-Zentrum der FU Berlin für den Internet Zugriff vorbereitet. Der nachfolgende Beitrag von Harold Hurwitz erläutert die Hintergründe der Entstehung und lässt das reiche Analysepotential dieses Datenschatzes für die Einstellungsforschung im zeitgeschichtlichen Kontext der Berliner Nachkriegsentwicklung erkennen. In der Datenbank ist dieser Beitrag enthalten und – wie in der gesamten Sammlung – mit Links zu allen hier angesprochenen Daten und Dokumenten versehen. Die Datenbank wird voraussichtlich am Freitag den 16. Dezember 2005 von Prof. Hurwitz, H. Hohmann und Weggefährten in Berlin präsentiert. Interessenten können sich jetzt schon beim ZA für eine Teilnahme vormerken lassen: [email protected] ZA-Information 56 105 Wie es dazu kam: Meine Sammlung von Primärdaten und Dokumenten zur Politik in Berlin nach dem zweiten Weltkrieg In Memoriam Heinz Fanselau (1935-2001) als Dank für langjährige Förderung von Harold Hurwitz 1 In der Sammlung von Daten und Dokumenten, die z.Zt. als DVD beim ZA verfügbar ist2, werden die Ergebnisse eines Prozesses des Lernens und Forschens erfasst, der vor fast sechzig Jahre begann und mich schließlich an den Punkt brachte, der Richard Löwenthal zu der Feststellung veranlasste: "It became his life work to unravel the paradox of a city whose population, 'the Berliners', personified resistance to communism and yet gladly became conductors of détente between East and West." 1 Der Beginn meines Interesses für Deutschland und die Soziologie Es begann zur Zeit des Ausbruchs des Zweiten Weltkriegs. Im Jahre 1939 war ich 15 Jahre alt, aber die persönliche Bekanntschaft mit Menschen, die aus rassischen und politischen Gründen Deutschland hatten entfliehen müssen, würde mich bald veranlassen, fortan intensiver zu fragen, weshalb der Wille zur Demokratie in Deutschland, dessen historische Manifestationen bereits mein Interesse weckten, sich immer wieder als zu schwach und hilflos erwiesen hatte. Zum Romantisieren geneigt, beschäftige ich mich im College mit dem Scheitern der bayrischen Revolution von 1918-19 und mit Kurt Eisner, der als ethischer Sozialist die missglückte Revolution von 1848 wiedergutmachen wollte. Und ich interessierte mich für das Dilemma von Ernst Toller, einem Pazifisten, der im Exil immer noch an ein "anderes 1 Dr. Harold Hurwitz war Professor für politische Soziologie am Zentralinstitut für Sozialwissenschaftliche Forschung (ZI6) der Freien Universität Berlin (jetzt Otto-Stammer-Zentrum) und davor langjähriger Berater des damaligen Regierenden Bürgermeisters Willy Brandt. 2 Mein Dank gilt Hans-Berthold Hohmann, MA, Diplom-Politologe, der diese Sammlung grundlegend konzipiert und erstellt hat. 106 ZA-Information 56 Deutschland" glaubte, aber zu einem Mahner wurde, der schließlich meinte, dass die westlichen Demokratien Hitlers Reich auch militärisch bekämpfen müssten. Als graduate student der Soziologie an der Columbia University bereitete ich mich auf eine Dissertation über die bayrische Revolution vor und nahm, mit nur zwei anderen Amerikanern, bei den dort beherbergten brillanten, aber damals ziemlich isolierten, Exilanten der Frankfurter Schule an einem zweisemestrigen Seminar über autoritäre Tradierung in Deutschland teil. Um zu Forschungszwecken nach Bayern zu gelangen, bewarb ich mich um eine zivile Stelle in der U.S.-Militärregierung, wurde aber im November 1946 nicht nach München, sondern nach Berlin geschickt. So bin ich Wahlberliner auf Dauer geworden. Erst Jahre danach sollte ich eine ganz andere Dissertation schreiben. Aber aus dem damaligen Impuls des amerikanischen Schülers und Studenten nährt sich bis heute die Neugier eines Sozialwissenschaftlers, der Zeit seines Lebens zeitgeschichtlich in und über Deutschland gearbeitet hat. Insofern haben die Ursprünge meines Interesses am Problem von Demokratie und Autoritarismus in Deutschland auch mit der Datensammlung zu tun, die aus Erhebungen besteht, welche ich als wissenschaftlicher Berater von Willy Brandt und Egon Bahr selbst durchgeführt oder anschließend an der Freien Universität gesammelt habe; Erhebungen über Einstellungen und Lebenserfahrungen von WestBerlinern, die während des Kalten Krieges und der Zeit, als diese Stadt eine Versuchsstation für die Entspannungspolitik ihrer demokratisch gewählten politischen Führung geworden war, zu Betroffenen bzw. zu Mittragenden wurden.3 Beim Soziologiestudium an der Columbia University hatte ich angesichts der genannten Interessen keine Zeit gefunden, auch Kurse über Statistik und quantitative Forschungsmethoden zu belegen. Deshalb habe ich an Paul Lazarsfelds Lehrveranstaltungen nicht teilgenommen. Die Analyse-Methoden dieses Meisters lernte ich erst anhand der empirischen Untersuchungen von Robert K. Merton kennen; er wurde für mich zum Mentor und dessen Auffassung vom structural functionalism und von einer schrittweisen Theorie-Entwicklung über Theorien mittlerer Reichweite wurde für mich als Empiriker richtungweisend. Einen ersten Geschmack von den Deutungsmöglichkeiten der deskriptiven Statistik bekam ich gleichwohl in Robert MacIvers Grundkurs über Social Causation. Damit war ich aber überhaupt nicht auf die Aufgaben einer quantitativen Forschung vorbereitet, um die es in dieser Datensammlung gehen würde. 3 Siehe hierzu: Harold Hurwitz: Mein Leben in Berlin. In: Leviathan, Heft 2, Juni 1999, S. 264279. ZA-Information 56 2 107 Erste empirische Forschung in Deutschland Dass es dennoch dazu kommen würde, hat damit zu tun, dass damals in Deutschland Methoden der quantifizierenden Sozialforschung und der multivariaten Analyse mit "weichen" Indikatoren fast unbekannt waren. Als ich 1947 bei der Zentralstelle für Medienkontrolle der U.S.-Militärregierung (Information Control Division, ICD, OMGUS) zuerst in der Forschung beschäftigt wurde, erfuhr ich von Repräsentativumfragen in Berlin, die außerhalb der bekannten ICD-Berichtsreihen seit 1945 durchgeführt und während der Blockade intensiviert wurden.4 Eigene Erfahrungen machte ich erst, als sich 1947 mein Vorschlag realisieren ließ, auf der Bielefelder Tagung des Sozialistischen Deutschen Studentenbundes (SDS) eine schriftliche Befragung der Teilnehmer zu ihrer sozialen Herkunft und ihrem politischen Werdegang durchzuführen.5 Schließlich versuchte ich, in einem leider nicht zu Ende geführten Projekt, bei der Auswertung von Intensivinterviews mit KPD/SED-Mitgliedern, die anhand eines standardisierten Fragenschemas gemacht worden waren, quantitative Vergleiche anzustellen.6 3 Mein Start in Berlin Nachdem ich im Sommer 1949 aus dem amerikanischen Regierungsdienst hatte ausscheiden müssen, wurde ich freiberuflich tätig und studierte an der Freien Universität Berlin. So konnte ich mich zwei Aufgaben widmen, die später für mich wichtig wurden. Ich schrieb eine wissenssoziologisch relevante Monografie zur Wandlung bolschewistischer Geschichtsschreibung in der UdSSR7 und forschte zweieinhalb Jahre lang für Willy Brandt und Richard Löwenthal über das Leben von Ernst Reuter.8 4 Diese Berichte, Tabellen etc. wurden ausgewertet in: Harold Hurwitz, Demokratie und Antikommunismus in Berlin nach 1945, Band I: Die politische Kultur der Bevölkerung und der Neubeginn konservativer Politik, Köln 1983, Kapitel 1 bis 3, S. 21-214. Eine detaillierte Erläuterung der Sonderberichtsmaterialien in Kapitel 1, Anmerkung 1, S. 333335. Diese Dokumente stehen sowohl hier als auch im Landesarchiv Berlin, Deposition Hurwitz (2100-2107) zur Verfügung. Zur Methode der Indikatorenfindung siehe Anmerkung 1 zu Kapitel 2, S. 345. 5 German Socialist University Youth, Information Control Review (ICR), ICD/ISD, OMGUS, No. 29, 5. Juli 1947. Die Befragung fand ebenfalls 1948 bei SDS-Mitgliedern in Frankfurt statt. Die ausgefüllten Fragebögen und Arbeitsnotizen befinden sich neben SDS-Dokumenten im Landesarchiv Berlin, Deposition Hurwitz. 6 Befragungsschema und Intensivinterviews (4 Ordner) sind in der Bibliothek des Zentrums für Zeithistorische Forschung (ZZF) in Potsdam deponiert. 7 Siehe Franz Borkenau, Das Jahr 1917 (Sonderdruck Der Monat), 1952, 48 S. 8 Willy Brandt u. Richard Löwenthal, Ernst Reuter. Ein Leben für die Freiheit, München 1957. 108 ZA-Information 56 Zur gleichen Zeit, in den Jahren 1950 bis 1956, nahm für mich die empirische Feldforschung einen Stellenwert ein, der das schrittweise Nachholen dessen erforderlich machte, was ich während meines Soziologiestudiums an der Columbia University versäumt hatte. Damals herrschte anhaltende Massenarbeitslosigkeit in West-Berlin, weshalb ich mit zwei Erhebungen betraut wurde: Die erste wurde mit amerikanischen Forschungsmitteln vom DGB bundesweit durchgeführt, die zweite im Auftrag des Berliner Senators für Sozialwesen. Diese Aufträge boten 20 bis 30 Soziologie- und Psychologie-Studenten der Freien Universität neben willkommener Beschäftigung als Interviewer auch die Möglichkeit einer Empirie-Ausbildung. Als Leiter der zentralen Forschungsstelle in Berlin konnten Heinz Kluth und ich für die methodische Vielfalt unserer Untersuchungen über arbeitslose Jugendliche in der Bundesrepublik sorgen. Wir erfuhren, was multivariate Tabellenanalyse mit Hilfe einer IBMFachzählsortiermaschine bedeuten konnte.9 Noch lehrreicher für mich und Dieter Claessens war in dieser Hinsicht unsere Untersuchung über die Sicherungsleistungen von Sozialunterstützungsempfängern in West-Berlin,10 denn hier ging es darum, Unterschieden in den zeitgeschichtlich beeinflussten Lebensläufen der Rezipienten Rechnung zu tragen. Auf Grund dieser Erfahrung lernte ich, dass erst die zusammenhängende Betrachtung von beruflichem Werdegang, Familienverpflichtungen und Alter mit den zeitgeschichtlichen Kontextbedingungen ein Indikatorenbündel definiert, welches das Schicksal oder die Verhaltensweisen jedes Einzelnen zwar nicht exakt oder ausreichend erklärt, sich dem aber auf griffige und plausible Weise annähert. Das gilt in weit stärkeren Maße für meine Dissertation, wo ich Erhebungen auswertete, die ich früher einmal für den Monat, eine seit 1948 von Melvin J. Lasky in amerikanischem Auftrag herausgegebene, sehr anspruchsvolle "Internationale Zeitschrift für Politik und geistiges Leben", durchgeführt hatte. Mit einem schriftlichen Fragebogen wurden in der DDR und Ost-Berlin beheimatete Leser anonym interviewt, als sie Exemplare in Westberliner Lesesälen und den dortigen "Ostbüros" der demokratischen Parteien und Verbände abholten. Die Erhebungen fanden 1952 und 1954 statt, also vor und nach 9 Schelsky u.a., Arbeitslosigkeit und Berufsnot der Jugend, Bund-Verlag 1952. Siehe Landesarchiv Berlin, Deposition Hurwitz. 10 Harold Hurwitz u. Dieter Claessens, Die Sozialunterstützten in West-Berlin, nach ihrer wirtschaftlichen und sozialen Stellung in der Vergangenheit unter besonderer Berücksichtigung einmal getroffener Sicherungsmaßnahmen, In: Soziale Arbeit, 4. Jahrgang/Heft 3 (März 1955), 112-162. ZA-Information 56 109 dem Arbeiteraufstand vom Juni 1953. Zum Vergleich ließ sich eine Erhebung der Leser in der BRD und West-Berlin heranziehen.11 Das Mitnehmen und vor allem das Weiterreichen von Exemplaren des Monat bedeuteten ein Risiko in der DDR. Das Kommunikationsverhalten der "heimlichen Leser" und der Bereitschaft, sich anderen anzuvertrauen variierte stark mit Alter, Beruf und sozialer Stellung. Deswegen schien das Weiterreichen illegaler Zeitschriften als Indikator für die Bereitschaft zu aktivem Dissens in der DDRGesellschaft geeignet zu sein. Unter Vorbehalt betrachtet schienen solche Verhaltensweisen soziologisch aufschlussreich zu sein hinsichtlich der Zustände und Vergesellschaftungsprozesse (wie Anpassung und Abkapselung: Nischendasein). So konnte der Frage nach Möglichkeiten spontaner Vergesellschaftung unter dem Totalitarismus realistischer nachgegangen werden. Denn damals, siehe Hannah Arendt, verstand man Totalitarismus als Herrschaftssystem in dem weit reichenden Sinne, dass es die Fähigkeit besaß, eine Gesellschaft bis zur "Atomisierung" gleichzuschalten und danach Mensch und Gesellschaft ganz neu zu erschaffen. Nicht zu realisieren war ein Vorschlag, den ich dem Kongress für die Freiheit der Kultur im April 1951 unterbreitet hatte, um Erkenntnisse über das "Widerstandspotenzial" in der West-Berliner Bevölkerung zu erhalten.12 Dazu sollten auch Fragen nach den Zuständen in der DDR beantwortet werden, die indirekt über Eindrücke nach Gesprächen von West-Berlinern mit Verwandten, Freunden und Bekannten in Ost-Berlin und der "Zone" berichten. Themen und Inhalte sollten nicht explizit politisch, wohl aber politisch relevant sein. Jahre danach, zur Zeit der Passierscheinaktionen, also der ersten entspannungspolitischen Schritte des Berliner Senats, schien mir dieses gewiss nicht unumstrittene Instrument einer indirekten Ermittlung jedenfalls erprobungswürdig zu sein. Deshalb stehen dem Benutzer entsprechende Variablen (siehe Variablen im ABCDE-Gesamt-File) zur Verfügung.13 11 Harold Hurwitz, Der heimliche Leser: Beiträge zur Soziologie des geistigen Widerstandes, Köln/Berlin 1966, 441 S. Die multivariaten Auswertungen des heimlichen Lesers erfolgten für beide Perioden 1952 und 1954 per "handcounting". Im Auftrag der Redaktion hat IBM 1954 vergleichbare Auswertungen maschinell vorgenommen. Das gesamte Material einschließlich der Fragebögen ist im Landesarchiv Berlin, Deposition Hurwitz. 12 Proposal for an Opinion Survey on the Resistance Potential of West Berliners, April 26, 1951, im Landesarchiv Berlin, Deposition Hurwitz (2200 A). 13 Die Ergebnisse schienen mit denen von Befragungen ehemaliger Sowjetbürger nach dem Zweiten Weltkrieg und Besucher aus der DDR während der Grünen Woche in West-Berlin übereinzustimmen. Siehe Raymon A. Bauer, Alex Inkeles u. Clyde Kluckhohn, How the Soviet System Works, Cultural, Psychological and Social Themes, Cambridge, Mass, 1956. Auch die Untersuchungen von Infratest: Viggo Graf Blücher, Industriearbeiterschaft in der volkseigenen Industrie der SBZ, Stuttgart, 1959. Und die beiden vervielfältigten Berichte von Infratest: Angestellte in der Sowjetzone Deutschlands, Verhaltensweisen und gesellschaftliche 110 ZA-Information 56 Während der durch das Chruschtschow-Ultimatum vom Herbst 1958 verursachten zweiten großen und lang andauernden Berlin-Krise musste ich die Fertigstellung meiner Dissertation14 immer wieder aufschieben. Mein seit langem gehegter Wunsch, dass es sinnvoll wäre, demoskopische Erhebungen über die politische Moral der Bevölkerung West-Berlins durchzuführen – Untersuchungen der Amerikaner mit Vergleichsmöglichkeiten aus früheren Zeiten lagen vor – schien sich nach dem unglücklichen Verlauf der Genfer Konferenz auf dringende Weise zu bestätigen. Eine entsprechende Anregung habe ich im Juni 1960 an Willy Brandt gerichtet. 4 Zusammenarbeit mit Klaus Schreiber vom Institut für Markt- und Verbrauchsforschung Da der für das demoskopische Forschungsprogramm des Instituts für Markt- und Verbrauchsforschung der Freien Universität Berlin (IfMF) verantwortliche Fachmann, Dr. Klaus Schreiber, ebenso dachte wie ich, besorgte ich die veröffentlichten Berichte seiner Erhebungen von Herbst 1958 und 1959,15 um den Regierenden Bürgermeister im Sommer 1960 mit einer Auswertung auf "morale levels, deviations, tensions and strengths" aufmerksam zu machen.16 Aufgrund dieser Erhebungsberichte und statistischer Daten stellte ich fest, dass sich die Erwartungen der West-Berliner hinsichtlich der wirtschaftlichen Zukunft der Stadt verschlechtert hatten, obwohl sich die wirtschaftliche Lage Berlins, nach einem Jahr verbaler Drohungen, dank finanzieller Hilfsmaßnahmen materiell verbessert hatte. Dies traf in noch stärkerem Maße zu, wenn nach einer Verbesserung der wirtschaftlichen Lage des Individuums gefragt wurde. Bedenklich war das schwache Zuversichtsniveau der Bevölkerung im Hinblick auf das "kommende Jahr". Dagegen war das Vertrauen in die politische Führung Willy Brandts hoch geblieben. Es galt also, die Imponderabilien dieser Moralkrise der Bevölkerung zu untersuchen. Die Startbedingungen beim Institut für Markt- und Verbrauchsforschung (IfMF) schien besonders günstig, weil sie eine zuverlässige Feldarbeit, regelmäßige Trenderhebungen, Blitzumfragen in Ereignisnähe ebenso garantierte wie eine Politikberatung Einordnung der mitteldeutschen Angestellten, München, Mai 1958 und Alltagsleben der sowjetzonalen Bevölkerung, Alltagsverhaltern und politische Einflüsse, 1959. Siehe dazu Notizen von Hurwitz im Landesarchiv Berlin, Deposition Hurwitz (001, Notizkasten) Vgl. auch die Auswertungen von Infas-Erhebungen mit entsprechenden Variablen einschließlich der Analyse "Aspekte der Systemanpassung" von dem DDR-Forscher Ernst Richert. 14 Promotion 1963, Der heimliche Leser, siehe Fußnote 10. 15 Landesarchiv Berlin, Deposition Hurwitz. 16 Expectations of the Berliners as Criteria for their Morale, (Sommer 1960), 15 S. ZA-Information 56 111 des Senats auf der Basis eigener, schneller Auswertungen. Jedoch scheiterte diese Hoffnung an der Weigerung des für das Institut zuständigen Ordinarius, einen Senatsauftrag auszuführen. In einem Brief erklärte er, "grundsätzlich nicht in politische Ereignisse eingreifen" zu wollen, obwohl er aus dem Auftragsangebot wusste, dass "unsere Sorge der Sicherung der Moral der Berliner Bevölkerung während der gegenwärtigen und vielleicht kommenden Krisen gilt".17 Dennoch gaben wir die Hoffnung auf Kooperation mit dem IfMF nicht gleich auf. Zum einem wartete der Lehrstuhlinhaber auf eine auswärtige Berufung, zum anderen hatte Dr. Schreiber beste Aussichten auf Bewilligung seines Drittmittelantrages an die DFG zur Erforschung des Zusammenhangs zwischen wirtschaftlicher und politischer Moral in der Berliner Bevölkerung. Die Senatskanzlei war, auf jeden Fall bereit einen Ausweg zu finden. So konnte ich Überlegungen über die Gestaltung eines langfristigen Erhebungsprogramms anstellen, das sich mit der Fragestellung der politischen Moral der Bevölkerung in einem bedrohten Berlin befasste. Es war mir klar geworden, dass West-Berliner MoralHaltungen am besten mit solchen Rangordnungsskalen untersucht werden konnten, denen eine umfassende Fragenbatterie zu Grunde lag, u.a. weil "... one of the major problems will be to get behind responses given in conformity with the 'what-isexpected-of-a Berliner' role and reach genuine, personal and private judgements ..."18 5 Zusammenarbeit mit Infas Zugleich mussten wir nach einer Alternativlösung für unsere Pläne Ausschau halten. Das wenige Jahre zuvor gegründete SPD-nahe Institut für angewandte Sozialforschung (Infas) bot sich als Möglichkeit an. (Infas hatte bereits im Sommer 1960 eine Erhebung im Bundesgebiet für die Berliner Senatskanzlei durchgeführt.) Inzwischen hatte ich Frageformulierungen gesammelt, die über die Jahre in WestBerlin von den Amerikanern bzw. in deren Auftrag von DIVO19 angewendet worden waren und sich für Vergleiche eigneten. Einige exakte Trendanschlüsse mit breaks (Kreuztabellierung) reichten bis in die Blockadezeit zurück. Das galt auch 17 Die hiermit zusammenhängende Korrespondenz befindet sich im Landesarchiv Berlin, Deposition Hurwitz (2200 A). 18 Notes on Planning a Continuing Program of Morale Analysis with Opinion Surveys in Berlin. Part I, 30. Oktober 1960, 7 S.; Part II, December 1960, 9 S. Landesarchiv Berlin, Deposition Hurwitz (2200 A). 19 Deutsches Institut für Volksumfragen, Frankfurt 112 ZA-Information 56 für Perspektiv-Fragen des Allensbacher Instituts, die das IfMF regelmäßig benutzt hatte. Dr. Schreiber war in Allensbach ausgebildet worden, und die Gründer von Infas kannten sich bei DIVO gut aus. Die Sammlung von Trendfragen legte ich Egon Bahr mit Erläuterungen vor.20 Als Chef des Presse- und Informationsamtes der Senatskanzlei war er für Planung und Durchführung des Meinungsforschungsprogramms zuständig. Man entschied sich erstmals für ein Infas-Angebot, um im April/Mai 1961 eine gediegene Berlin-Umfrage durchführen zu lassen. Sie ist die erste Erhebung im wichtigsten Teil unseres Datenbestandes, eine zeitübergreifende Kumulation, bestehend aus 83 vergleichbaren Berlin-Erhebungen (ABCDE-Gesamtdatei); die Umfragen wurden zumeist im Senatsauftrag durchgeführt und reichen in der Gesamtdatei bis ins Jahr 1971. Insgesamt stehen hier Umfragedaten bis 1974 zur Verfügung. Zwei Monate nach Errichtung der Mauer ging eine zweite Trenderhebung mit situationsgerechten Ergänzungen ins Feld. Nach der ersten Berichterstattung in Berlin verbrachte ich zwei Wochen in Bad Godesberg, um in Tag- und Nacht-Arbeit an der Fachzählsortiermaschine beide Erhebungen gründlich auszuwerten, damit ich Brandt und Bahr zwischen den Jahren mündlich berichten konnte. Denn es war deutlich geworden, dass nach zweieinhalb Jahren Aushöhlung der konsensuellen Abwehrhaltungen der West-Berliner in einer nicht fassbaren, bis dato lediglich auf verbalen Drohungen beruhende Krise, der Mauerbau für große Teile der Bevölkerung eine Moral fordernde Zäsur darstellte. Aber während die allgemeine Abwehrhaltung gestärkt zu sein schien, zeigten abwanderungsfähige Gruppen, wenn sie (z.B. im Unterschied zu Beschäftigten im öffentlichen Dienst) nicht an Berlin gebunden waren, Erschütterungen, die in anderen Schichten selten oder nicht so deutlich geäußert wurden. Die Thesen, die ich dazu im Januar und Februar 1962 für den Regierenden Bürgermeister und auf dessen Wunsch für einige mit Berlin befreundete amerikanische und britische Opinion Leaders in englischer Sprache schrieb, behandelten, wie die Erwartungshaltungen und Forderungen der WestBerliner mitgeprägt waren durch die unterschiedlichen Funktionen und Leistungen ihrer wichtigsten "Bezugspersonen" bzw. "-kräfte": die Westmächte (als "Schutzmächte"), die Senatsführung (als Vertrauensobjekt angesichts des Charismas von Willy Brandt) und die Bundesregierung (als gefordertes Objekt und, wie sich herausstellte, als Sündenbock).21 20 Fragenkatalog: Vorschläge und Überlegungen, 10./11. März 1961, 14 S. Landesarchiv Berlin, Deposition Hurwitz (2200 A) 21 Siehe hierzu das Analyse-Modell in "Die politische Moral der Berliner nach dem 13.8.1961 und früher". Landesarchiv Berlin, Deposition Hurwitz (2200 B). Außerdem in der Berichtssamm- ZA-Information 56 113 Dieser Bericht in Englisch an Opinion Leaders war der Anfang der Berlin Briefings, vertraulicher Unterrichtungen, die ich unter Bahrs Anleitung von 1963 bis 1966/67 fortsetzen konnte.22 6 Berlin-Test Inzwischen hatte sich Dr. Schreiber selbständig gemacht, nachdem klar geworden war, dass der ihm vorgesetzte Lehrstuhlinhaber in Berlin bleiben würde. Dieser hatte ihm verboten, sein Drittmittelprojekt zur Erforschung des Zusammenhangs zwischen politischer und wirtschaftlicher Meinungsbildung in West-Berlin am Institut für Marktforschung der Freien Universität durchzuführen.23 So wurde trotz der guten Erfahrungen mit Infas bei der Erstellung unserer Fragenkataloge entschieden, Schreibers neues Unternehmen Berlin-Test zu beauftragen und ab April 1963 regelmäßige Standard- sowie Blitzumfragen durchführen zu lassen. Darüber hinaus wurde in den Befragungen, die Schreiber für seine eigenen wissenschaftlichen Vorhaben und als Marktforscher unternahm, neben den sowieso zu eigenen Zwecken wiederholten Trendfragen, Raum für einige Fragen des Senats reserviert, die auf Zuruf geschaltet werden konnten. Infas wurde zu dieser Zeit von der Senatskanzlei mit der Durchführung von Repräsentativumfragen im Bundesgebiet beauftragt. Auch in anderer Hinsicht hat Berlin-Test uns ungewöhnliche Möglichkeiten geboten: Wir erhielten ein außerordentlich sicheres Forschungsinstrument. Die wissenschaftskritische Forschung über die demoskopische Praxis, der sich Schreiber schon beim IfMF gewidmet hatte, setzte er mit Berlin-Test fort. Dabei ging es um die ständige Überprüfung der Feldarbeit und das strenge Festhalten an bewährten Erhebungsstandards. Dies begann mit der begrenzten Anzahl der Interviews pro Interviewer und deren Kontrolle durch Fangfragen und reichte bis zu Methoden einer ständigen Überprüfung der Festlegung und Verlässlichkeit von Quotenstichproben. Letztere geschah anhand von Merkmalen der Amts- und Kirchenstatistik. Indem lung enthalten: Aspects of Morale in Berlin - Before August 13th. Trends, Perspectives, Analyses. Spätherbst 1961; On Misunderstanding Berlin, January 1962; Morale in West Berlin after the Wall, April 1962. 22 Landesarchiv Berlin, Deposition Hurwitz (2035). 23 Hinweis: Schreibers Ergebnisberichte zu diesem Projekt, sowie zu Folgeprojekten, die er bis 1974 mit Forschungsmitteln des Senators für Wirtschaft durchführen konnte, befinden sich im Landesarchiv Berlin, Deposition Hurwitz (2281/2). Siehe: Abschlussberichte 1963/66, 102 S.; Abschlussbericht 1967/69, 64S.; Fortsetzung, 1970/72, 12 S.; Fortsetzung u. Abschluss 1973/74, 12+4 S. 114 ZA-Information 56 Schreiber die Quotenmerkmale miteinander verknüpfte, waren jedem Interviewer stärker als üblich die Hände gebunden. Die sofortige Überstellung der Lochkartensätze erlaubte es mir schließlich in kritischen Situationen (in besonderen Fällen sogar vorläufig, noch bevor die Stichprobe vollständig war), in Ereignisnähe auswerten und berichten zu können. Das geschah umso häufiger, als sich die Standard- und Blitzumfragen des Senats mit Schreibers eigenen Berlin-Test Erhebungen fast kontinuierlich abwechselten. So wurde zwischen März 1963 und Februar 1965 mit 15 Standarderhebungen, 5 Blitzumfragen und 12 weiteren Berlin-Test Omnibus-Umfragen eine Abfolge-Dichte erreicht, in der es möglich war, Ereigniswirkungen in den Zeitabständen: (a) unmittelbar danach, (b) etwas später und (c, d usw.) im "Nachhinein" zu verfolgen. Das erwies sich anhand von wichtigen Ereignissen und Entwicklungen als außerordentlich lehrreich, so nach Geschehnissen wie dem Scheitern des Treffens zwischen Brandt und Chruschtschow, das die große Koalition zwischen SPD und CDU in West-Berlin beendete, dem Besuch Kennedys im Juni 1963, nach dessen Ermordung am 22. November, bei der "Count Down"-Autobahn-Konfrontation im Oktober/November 1963, während der umstrittenen Passierscheinverhandlungen mit den nachfolgenden Passierscheinaktionen in den Jahren 1963 sowie 1964 und beim umstrittenen Verlauf des S-Bahn Boykotts. Im Übrigen wurde es für die Senatsführung immer wichtiger, die Verhandlungsbereitschaft der West-Berliner im Zeitverlauf zu messen und zu beeinflussen. Aufgrund dieser Erfahrung mussten wir uns Gedanken machen über kurz- und längerfristige Wirkungen, über kumulative Nachwirkungen von Ereignissen auf konsensuelle Einstellungsentwicklungen sowie über die Festigkeit, Anfälligkeit und Wandlungsfähigkeit solcher Einstellungen. Inzwischen hatte Infas im Anschluss an die beiden vorangegangenen Untersuchungen – vor und nach dem Mauerbau – eine weitere Erhebung in Berlin durchgeführt, und zwar im Oktober/ November 1962 – per Zufall vor und während der Kubakrise – diesmal ohne Auftrag, aber in der Hoffnung, das Umfrageprogramm des Senats in Berlin fortsetzen zu können. Ein Jahr später, anlässlich der ersten Passierscheinaktion im Dezember 1963, beauftragte der Senat Infas mit einer Untersuchung, die die entsprechende Erhebung von Berlin-Test ergänzen sollte. 7 Berater des Regierenden Bürgermeisters Als wissenschaftlicher Betreuer der beiden Untersuchungsreihen (für Berlin und Westdeutschland) erhielt ich Arbeitsräume der Innenverwaltung am Fehrbelliner Platz. Eine IBM-Fachzählsortiermaschine und ein Panzerschrank kamen als Ausstattung hinzu. Ich konnte eine Sekretärin und auch eine technische Hilfskraft ZA-Information 56 115 (Teilzeit) einstellen. Wir gewöhnten uns an einen Arbeitsrhythmus von 12 bis 14 Stunden, Wochenenden eingeschlossen. Für mein Auskommen konnte deshalb gesorgt werden, weil die Ford-Stiftung nach dem Mauerbau ein Förderungsprogramm für das geistige Leben in Berlin auf den Weg gebracht hatte, das den Verbleib von kreativen Ausländern in der Stadt sichern sollte. Ich erhielt einen Werkvertrag, um den Regierenden Bürgermeister zu beraten und den Stiftungsvorstand Shepard Stone über Entwicklungen in Berlin zu unterrichten. Für meine vertrauliche Berichterstattung an den Regierenden Bürgermeister wurden Regeln festgelegt. Neben Willy Brandt erhielt Egon Bahr als verantwortlicher Leiter des Presse- und Informationsamtes einen Bericht. Weitere Kopien gingen an den Chef der Senatskanzlei, Dietrich Spangenberg, in der Regel auch an den Bürgermeister Heinrich Albertz und an Klaus Schütz, den Senator für Bundesangelegenheiten. Dieser Verteilungsmodus wurde in Abstimmung mit Bahr und Spangenberg gewählt. Die Umfrageergebnisse sollten im Rathaus keine Rivalitäten nähren. Andere Senatoren wurden ermutigt, das Forschungsprogramm für ihre Belange in Anspruch zu nehmen. Infolgedessen wurden von 1963 bis 1967, dem Zeitraum, in dem ich Gestaltung und Koordination des Forschungsprogramms zu verantworten hatte, verschiedene Themen der Senatsressorts aufgenommen. Dazu gehörten: Polizei, Wirtschaftsförderung, Sparmaßnahmen, Ost-West-Handel, Freie Volksbühne, Volksschulen und verschiedene Aspekte der Schulpolitik (z.B. der Verzicht auf Samstag als Schultag). Als gravierende politische Dauerprobleme kamen vor allem die Belastungen für die Bevölkerung durch den S-Bahn-Boykott hinzu und später die Studentenrevolte als Provokation bzw. Prüfung der demokratischen Gesinnung (Solidarität, Toleranz/ Intoleranz) in der Bevölkerung. Natürlich galt es Reaktionen auf situationsbedingte Vorkommnisse und Senatskrisen kurzfristig zu erfassen: der Schahbesuch, ein Korruptionsskandal, der Rücktritt von Heinrich Albertz als Regierender Bürgermeister, die Aussichten der Parteien während der Wahlkämpfe und die Gefahren des Rechtsradikalismus. Das galt ebenfalls für Reaktionen auf Probleme der Bundesrepublik und der westlichen Verteidigungsgemeinschaft, z.B. die Konjunkturkrise von 1965 bis 1967 und der Streit um den Atomwaffensperrvertrag. 116 8 ZA-Information 56 Im Infas-Büro am Kurfürstendamm Der Senatsvertrag mit Berlin-Test wurde im Frühjahr 1965 nicht verlängert. Es schien opportun, Infas mit der Fortführung der Berliner Erhebungsreihe zu beauftragen. Nun sollte ich meine Betreuungs- und Auswertungstätigkeit für die Senatskanzlei als Angestellter von Infas fortsetzen und Berichte schreiben, die in Bad Godesberg fertig gestellt und nach einem Schlüssel verschickt wurden. Im übrigen lief die vertrauliche Berichterstattung an die Senatskanzlei weiter, ohne dass ich jemals mit Bad Godesberg Rücksprache zu nehmen hatte. Auch meine Sekretärin und mein Assistent, Volker Hauff, arbeiteten jetzt als Angestellte von Infas. Da ich inzwischen 39 Jahre alt und seit 1949 stets freiberuflich tätig gewesen war, bedeutete der Eintritt in das deutsche Versicherungssystem für mich eine große Erleichterung. Nachteile gab es jetzt im Arbeitsablauf: Infas richtete am Kurfürstendamm ein Büro ein. Aus Bad Godesberg wurden uns über Fernschreiber die Korrelationen übermittelt, die wir vorher anfordern mussten. Das war umständlich, und wir erhielten keine Kartensätze mehr von unseren Umfragen. Mit unserer Fachzählsortiermaschine konnten wir nur noch die Lochkarten aus der Berlin-Test-Zeit auswerten, um Trendvergleiche mit Breaks anzustellen. Von Frühjahr 1965 bis Frühjahr 1967, dem Zeitraum, in dem ich am Kurfürstendamm arbeitete, wurden in Berlin ebenso viele Umfragen von Infas durchgeführt wie in den vorangegangenen zwei Jahren von Berlin-Test. Von diesen 28 Erhebungen waren 15 Standardumfragen. Aber im Unterschied zu den streng kontrollierten Quotenumfragen von Berlin-Test basierten die regelmäßigen Standardumfragen von Infas auf Zufallsstichproben. Die Folge war, dass weit größere Zeiträume für die Feldarbeit benötigt wurden. Die Abstände zwischen den Umfragen vergrößerten sich. Berichterstattung in Ereignisnähe war anhand der Standardumfragen nicht mehr möglich. Andererseits erfassten die aus Einwohnerkarteien gezogenen Stichproben jetzt ca. 600 Befragte. So konnte Infas den Wünschen des Senats nach Berichterstattung in Ereignisnähe nicht entsprechen. Das machte Blitzumfragen erforderlich und Infas brachte 13 davon ins Feld. Was die Infas-Standardumfragen betrifft, so konnten Schreibers hohe Standards der Interviewer-Kontrolle nicht mehr erreicht werden. Dafür sollte ja das Verfahren der Zufallsstichprobe Sicherheit bieten. In den letzten Monaten meiner Tätigkeit im Büro am Kurfürstendamm gab es einen Grund zur Besorgnis: Bad Godesberg hatte zwei Personen zur Betreuung der Feldarbeit in Berlin angestellt, die ihren Interviewern allzu oft 20 bis 30 Befragungspersonen aufbürdeten. Das stellte eine Missachtung der erprobten Sicherheitskriterien für Interviewer dar. ZA-Information 56 117 Diese und andere Erfahrungen hatten meine Beziehung zur Institutsleitung in Bad Godesberg derart belastet, dass ich an Kündigung dachte und andere Wege sondierte, um dennoch meine wissenschaftliche Beratungstätigkeit für den Senat aufrechtzuerhalten. Dabei war der Senatsauftrag an Infas für die praktische Durchführung der Umfragen nicht in Frage zu stellen. Natürlich war es der Institutsleitung in Bad Godesberg nicht leicht gefallen, mich als einen Infas-Beauftragten hinzunehmen, der den Senat selbständig und intern beriet. Es folgten Schikanen, die meine Verantwortung für die Berliner Erhebungspraxis am Ende zwar beschnitten, jedoch meine vertrauliche Beratertätigkeit nicht beeinträchtigen konnten. Und nach wie vor schloss diese Beratung die Unabhängigkeit hinsichtlich Auswahl und Formulierung der Fragen ein. Ich blieb noch ein Jahr am Kurfürstendamm, suchte aber währenddessen nach einer neuen Beschäftigung. 9 Arbeit im ZI6 Eine solche bot sich an, als Richard Löwenthal, der aus England zurückgekehrt war um Ordinarius für Politische Wissenschaft an der Freie Universität zu werden. Bei Bleibeverhandlungen sah er die Möglichkeit, meine Tätigkeit für den Senat zu etablieren. Ich wurde bei ihm als Assistent und Akademischer Rat mit Sitz am Zentralinstitut für Sozialwissenschaftliche Forschung (ZI6) eingestellt. Bei Infas hatte ich weiterhin die Verantwortung für die Durchführung und Berichterstattung. Ich hatte nun auch Zeit, Policy-Science-Neuland für die Senatskanzlei zu erkunden. An ein Simulationsmodell für "Morale Responses" und Planspiele für Ost-West-Verhandlungen wurde gedacht. Nach der Bildung der Großen Koalition in Bonn und dem Abschied von Willy Brandt und Egon Bahr aus Berlin im Dezember 1966 lief vieles anders. Zwar setzte ich meine Beratertätigkeit für die Berliner Senatskanzlei und die Mitwirkung an der Gestaltung des Meinungsforschungsprogramms unter den Regierenden Bürgermeistern Heinrich Albertz (1966 bis 1967) und später unter Klaus Schütz (1967 bis 1977) bis in die 70er Jahre fort – allerdings ohne Zusammenarbeit mit Infas. Die Studentenrevolte veränderte dann die Bedingungen, unter denen ich am ZI6 und dem Otto-Suhr-Institut als Akademischer Rat und später als Professor arbeiten konnte. Da Richard Löwenthals Pläne, am ZI6 zu wirken, für ihn nicht mehr in Frage kamen, war ich ohne Fürsprecher dort, als das Gerücht umging, ich sei ein CIA-Agent, der bisher in der Berliner Senatskanzlei angesiedelt war, aber nun an der Freien Universität wirken sollte. Meine "Nebentätigkeit" für die Senatskanzlei war und blieb Jahre lang suspekt und wurde im ZI6 wiederholt beanstandet. Auch mein "Berlin-Projekt" blieb manchen Kollegen ein Dorn im Auge, bis unser 118 ZA-Information 56 Institutsvorsitzender, Theo Pirker, Anfang der 80er Jahre die Roh-Manuskripte der ersten drei der 1983/84 veröffentlichten Bände meiner Reihe "Demokratie und Antikommunismus in Berlin" las und beschützend empfahl. Am ZI6 wurde es mir dank Förderung der Senatskanzlei, der DFG und der VWStiftung möglich, die Voraussetzungen für die Erstellung der jetzt im Zentralarchiv zur Verfügung gestellten Sammlung zu schaffen. Diese Datensammlung kam auch meinen Lehrveranstaltungen am Otto-Suhr-Institut zugute. 10 Zeitreihen und Kontextinformationen aus der Zeit Die Idee zur Datensammlung begann damit, dass der ab 1967 für Meinungsforschung zuständige Beamte der Senatskanzlei, Heinz Fanselau, mit mir der Meinung war, dass die gesammelten, für Moral und Verhandlungsbereitschaft relevanten, Primärdaten und Berichtsmaterialien der seit 1945 durchgeführten Berliner Meinungsumfragen, in Zusammenhang mit unseren seit 1961 produzierten Primärdaten eine Grundlage für weiterreichende Projekte darstellen könnte. Er dachte an die Entwicklung von Simulationsmodellen: Einmal um auf der Basis von spieltheoretischen Annahmen Senatsangehörige auf Verhandlungen in Krisen- und Entspannungssituationen besser vorzubereiten, zum anderen um in solchen Situationen Reaktionen der Bevölkerung auf der Basis eines empirischen Simulationsmodells einschätzen zu können. So war mein Anliegen, als Berater und akademischer Forscher unter Hinzuziehung älterer Daten und weiterreichender Analysen mehr zu lernen und auch zu verwirklichen. Für die Entwicklung dieser Modelle sollte ich als Kenner West-Berliner Einstellungsentwicklungen die notwendigen deskriptiv-historischen Voraussetzungen leisten, während Lutz Erbring, der damals beim Institute for Social Research an der University of Michigan lehrte, von der Senatskanzlei über Infas beauftragt wurde, die statistischen und inhaltsanalytischen Voraussetzungen für das Modell zu erarbeiten. Da hierfür eine Verknüpfung zwischen Indikatoren für Einstellungsentwicklungen und Ereignissen erforderlich war, wurde meine Aufmerksamkeit auf die Möglichkeiten zur Erstellung von Zeitreihen mit Zeitungsnachrichten gelenkt, die so hervorgehoben waren, dass sie theoretisch für jeden Leser wahrnehmbar waren. Hieraus entstand im Berlin-Projekt das Vorhaben, dynamische Modelle der Zeitreihenanalyse zu entwickeln bzw. zu adaptieren. Für dieses Ziel reichten die damals gängigen statistischen Verfahren der Zeitreihenanalyse – Transferfunktionen waren noch unbekannt – nicht aus. Auch die von Infas in unregelmäßigen Abständen erhobenen Daten waren ein Problem. Um dieses zu ZA-Information 56 119 beheben, hat Lutz Erbring in Folge des Senatsauftrages ein sehr komplexes Modell entwickelt, insbesondere ein Verfahren, um "fehlende Werte" in den Zeitreihen aggregierter Einstellungsdaten zu schätzen ("fehlend" vor allem wegen der nicht regelmäßigen und oft langen zeitlichen Abstände zwischen den einzelnen Meinungsumfragen). Der nächste Schritt wäre gewesen, für das Simulationsmodell ein fiktives Szenario zu entwerfen. Das ist nicht geschehen, und es fragt sich, wie der Fall der Mauer wohl in einem Simulationsmodell ausgesehen hätte. Auch die Möglichkeiten des Berlin-Projektes stießen an ihre Grenzen. Der Projekt-Mitarbeiter Helmut Thome benutze inhaltsanalytisch ausgewertete Meldungen des Tagesspiegel 1963-64 und Daten der eher geeigneten, da regelmäßigen, Berlin-Test-Erhebungen aus dieser Zeit, um dynamische Modelle der Wirkung kontinuierlich registrierter (wahrnehmbarer) Ereignisse auf aggregierte Einstellungen zu entwickeln. Obwohl der theoretische Ansatz als Intention weiterhin beachtenswert bleibt und unserer Meinung nach ausgebaut werden sollte, ist das damals angewandte Verfahren, auch aus Sicht des Autors, noch nicht befriedigend – u. a. deshalb, weil a) die Zahl der Messzeitpunkte ("Beobachtungen") mit n=31 für multivariate Verfahren der Zeitreihenanalyse prinzipiell zu gering ist (die Schätzung der Modellparameter ist zu instabil), b) weil das Verfahren der "polynomial distributed lag regression", das damals eingesetzt wurde, zu wenig flexibel ist in der Vorgabe möglicher Verlaufsformen für die Wirkung von Ereignissen auf Einstellungen. Hier stehen heute flexiblere Verfahren, etwa Box/Jenkins-Transferfunktionsmodelle, zur Verfügung. Thome hat in einem späteren Versuch, gemeinsam mit Margret Rottleuthner-Lutter, diese flexibleren Verfahren eingesetzt, um den längerfristigen Verlauf der Wirkung eines einzelnen einschneidenden Ereignisses, des Chruschtschow-Ultimatums vom November 1958, auf die Entwicklung der Parteipräferenzen und das Niveau der symbolischen Unterstützungsmaßnahmen der Westmächte zu modellieren.24 Hierfür benutzten sie von den Projektmitarbeitern Andreas Büning und Monika Lindgens-Knoche erstellte langfristige Daten zwischen 1950 und 1963. In dieser Datei wurden Trendfragen vom Allensbacher Institut für Demoskopie als Berlinanteil der monatlichen bundesweiten Umfragen mit inhaltsanalytisch erfassten Indikatoren über die potenzielle Wahrnehmbarkeit25 des politischen Geschehens mit Bevölkerungs- und Wirtschaftsstatistiken verknüpft. Trotz hoher Stichproben- 24 Margret Rottleuthner-Lutter, Helmut Thome, Wirkung von Ereignissen auf kollektive Einstellungen: Ein Anwendungsbeispiel für Transferfunktionsmodelle nach Box und Jenkins. In: Zeitschrift für Sozialpsychologie, S. 118-138, 1983. 25 Vgl. Kap. 13 120 ZA-Information 56 fehler (die Stichproben der Meinungsumfragen hatten einen Umfang zwischen 40 und 80) konnten schlüssige Ergebnisse erzielt werden. Dieses Verfahren der "Interventionsanalyse" mit Hilfe von Transferfunktionsmodellen wäre sicherlich auch für weitere Analysen der Wirkung einschneidender Ereignisse einsetzbar, die in den Zeitraum der Gesamtdatei fallen. Dieses Modell zur Erfassung der unmittelbaren und kumulativen Wirkungen eines einschneidenden Ereignisses bleibt gleichwohl brauchbar. Die Datei bleibt aber auch geeignet, weil sie ohne komplexe Modellansprüche für Thematisierung und Deskriptionen konsultiert werden kann, z.B. hinsichtlich der Auswirkungen vom 17. Juni 1953, des Ungarn-Aufstands, des Mauerbaus und der Kuba-Krise. Trotz alledem erwiesen sich beide Vorhaben als maßgebend für meine langfristigen Forschungsabsichten, Buchplanungen sowie meine Lehrtätigkeit, und somit schließlich für das, was diese Datensammlung einem Benutzer primär- und sekundäranalytisch anbieten kann. Lutz Erbring hatte mir in Ann Arbor klar gemacht, was SPSS leisten konnte. Bis dahin waren wir für die Erstellung von drei-dimensionalen Kontingenztabellen auf ein Programm angewiesen, welches der Projektmitarbeiter Hajo Haas hatte schreiben lassen. Jetzt wurde SPSS, erstmalig in Berlin, an der Freien Universität installiert, wo Haas, ein Doktorand der Wirtschaftswissenschaft, am Rechenzentrum die ersten Kurse in SPSS als Lehrangebot des Berlin-Projekts durchführte, bis ich 1972 selbst soweit war, diese Aufgabe als Lehrangebot des Fachbereichs Politikwissenschaft zu übernehmen. Jahrelang geschah dies in Wochenend-Intensivkursen mit dem Angebot, anschließend an einer vierstündigen Übung mit Vorlesungscharakter teilzunehmen, die anspruchsvoll hieß: Die Logik der multivariaten Kausalanalyse für Sozialwissenschaftler.26 11 Umfang und Inhalt der Datensätze in der Datensammlung Dank meiner Nebentätigkeit als Berater und durch gezielte Zuwendungen der Senatskanzlei erhielt ich die Möglichkeit, Berichte und Lochkartensätze mit den Primärdaten aller relevanten Meinungsumfragen in Berlin zu besorgen, die vor Beginn des Erhebungsprogramms des Senats mit Infas und Berlin-Test durchgeführt worden waren. Insgesamt wurden so Primärdaten von sechs verschiedenen Instituten gesammelt. Wie die Berichtssammlung zeigt, fing es 1945 mit Erhebungen der amerikanischen Militärregierung an. Die Umfragen wurden dann zur Zeit der Hohen 26 Siehe die Lehr- und Übungsmaterialen, im Landesarchiv Berlin, Deposition Hurwitz. ZA-Information 56 121 Kommission von DIVO in amerikanischem Auftrag bis 1959 fortgeführt27. Besorgt wurden außerdem die Berlin-Anteile der monatlichen Bundesumfragen des Allensbacher Instituts für Demoskopie im Zeitraum 1950 bis 1963, Erhebungen des Instituts für Marktforschung der FU Berlin (IfMF) von 1953 bis 1968, Berlin-Test Umfragen aus den Jahren 1970 bis 1974 und die von EMNID im Auftrag der Berliner CDU zwischen 1960 und 1963 durchgeführten Erhebungen in Vorbereitung der Kommunalwahl von Februar 1963. Wie bereits erwähnt, haben alle diese Institute mit Ausnahme von EMNID Frageformulierungen verwendet, die über Berlin-Test und Infas in das Erhebungsprogramm des Senats Aufnahme fanden. "Wie es dazu kam", dass Trends mit gleichen Frageformulierungen zusammengestellt werden konnten, soll die folgende Abbildung verdeutlichen. Die Darstellung zeigt die Weiterverwendung der ursprünglich von der US Survey Branch auf der einen und von Allensbach der anderen Seite entwickelten Fragen. Die institutsübergreifende Weitergabe basierte auf den Kontakten zwischen den Institutsmitarbeitern bzw. auf der Arbeit der Mitarbeiter in den "nachfolgenden" Instituten. Abbildung Die Weitergabe der Frageformulierungen zwischen den Meinungsforschungsinstituten US Survey Branch Allensbach DIVO Institut für MarktABCDE-Gesamtdatei (83 Studien) forschung der FU Berlin (IfMF) Senatsumfragen Infas Infas 1961-62 Berlin-Test 1963-65 1965-69 Berlin-Test 1963-65 1965-71* Senatsumfragen seit Frühjahr 1969 * Hinzu kommen eigene Umfragen von Berlin-Test aus den Jahren 1972 und 1974 27 Vgl. die Sammlung der OMGUS- und HICOG-Berichte im Zentralarchiv. Berlin-Test 122 ZA-Information 56 Diese Meinungsumfragen habe ich nicht nur für Lehrveranstaltungen über Methodenlehre und Demokratisierungsprobleme im Nachkriegs-Deutschland, sondern auch für meine Buchplanung über die Berliner Nachkriegszeit verwendet. Die Idee war, eine zeitgeschichtliche Analyse der interaktiven Entwicklung von Einstellungen in einer Triade von Beziehungen zu verfolgen: nämlich zwischen der WestBerliner Bevölkerung, politisch engagierten Teilen dieser Bevölkerung (auch als Partei-Eliten) und den Besatzungsmächten, die Schutzmächte werden würden. Mit der Buchplanung im Auge waren wir im Berlin-Projekt und für meine Lehrveranstaltungen bemüht, die Entwicklung im Kalten Krieg und auf dem Weg zur Entspannungspolitik soweit wie möglich ereignisbezogen und über längere Zeiträume zu verfolgen. Da ich Wert darauf legte, Zeitgeschichtlern quantifizierende Analyse mit einem stochastischen Anspruch schmackhaft zu machen, sowie umgekehrt übertrieben behavioristisch orientierten Feldforschern – Soziologen, Politologen und Psychologen – Geschichte nahe zu bringen, bot es sich an, im Rahmen meiner Buchplanung, Darstellung und Analyse durch weitere Arten von quantifizierenden Erhebungen zu untermauern und zu erweitern. Das führte neben den oben erwähnten inhaltsanalytischen Daten zu den biographischen Daten von einfachen und führenden Mitgliedern der SPD, derjenigen Berliner Partei, die den Abwehrkampf und die Entspannungspolitik maßgeblich beeinflusst hat. 12 Weitere Inhalte der Datensammlung In dieser Datensammlung findet der Nutzer insgesamt vier Arten von Primärdaten sowie die dazu eingescannten Veröffentlichungen und Ergebnisse: Repräsentative Meinungsumfragen, biographische Daten, Inhaltsanalysen Berliner Tagezeitungen und Aggregatdaten über verschiedene Berliner Wahlen. Was die demoskopische Sammlung betrifft, so ist zu berücksichtigen, dass die Primärdaten (Lochkartensätze) für repräsentative Berlin-Erhebungen erst ab 1952 auffindbar waren. Umso wichtiger wurde es, die Ergebnisberichte zu Berlin-Umfragen amerikanischer Stellen zu finden. So konnte relevantes Berichtsmaterial eingescannt werden. Diese Berichte und Tabellen, stammen entweder von einer vormals von Forschern unbeachteten Berlin-Unit (bei der Militärregierung des Berlin-Sektors) oder aus den bekannten amerikanischen Berichtsreihen, den Stellen für Meinungsforschung bei der Information Control Division bzw. Information Services Division beim Hauptquartier des Office of Military Government (ICD/ISD, OMGUS), sowie von der Hohen Kommission und der Botschaft der Vereinigten Staaten. ZA-Information 56 123 Auf der Daten-CD als auch im Berliner Landesarchiv sind die Berichte von Infas, Berlin-Test, EMNID*, IfMF* und Allensbach* vorhanden, ebenso die Berichte und vertraulichen Auswertungen aus meiner Zeit der Beratungstätigkeit für die Berliner Senatskanzlei. Eine Reihe von Trendfragen können vom Benutzer selbst ausgewertet werden. Chroniken und zeitgeschichtliche Hintergrundlektüre werden als Zusatzinformation bereit gestellt. Zu den eingescannten Berichten und TabellenMaterialien zählen auch Auswertungen von Mitarbeitern des Berlin-Projekts und von Seminarteilnehmern. Wie bereits erwähnt, wurden auch biographische Daten gesammelt und die Voraussetzungen für eine Inhaltsanalyse Berliner Tageszeitungen geschaffen. Das geschah auch, um meiner Publikationsreihe Demokratie und Antikommunismus in Berlin nach 1945 eine quantitativ-analytische Dimension der Indikatorenfindung und der Argumentation zu geben. Diese Aufgaben wurden konzeptionell in einem Mitarbeiter-Seminar geplant und zum Teil auch ausgeführt und ausgewertet. So wurde methodisches Neuland erkundet. In der Sammlung sind Aufsätze zu lesen, in denen Mitarbeiter über Ergebnisse berichten. Auch die von unserer damaligen Studentischen Hilfskraft, Wolfram Schulz, aufbereiteten Aggregatdaten von Berliner Wahlergebnissen auf verschiedenen Ebenen (Bezirk, Ortsteil, Stimmbezirk) und zu verschiedenen Zeiten (1929 bis 1963) sind so entstanden.28 Entsprechend ihrer Bedeutung für den Abwehrkampf und die Erprobung entspannungspolitischer Schritte werden in sechs biographischen Dateien vor allem die Lebensdaten und die politischen und beruflichen Kariereverläufe von Berliner Sozialdemokraten, Mitgliedern und Funktionären festgehalten, um sie unter dem Gesichtspunkt der Sekundärsozialisation im Ablauf der Systeme zu untersuchen: im Kaiserreich, der Weimarer Republik, dem Drittem Reich, der Viermächte-Stadt und der Bundesrepublik. Zwecks Indikatorenfindung zum Wandel der machtpolitischen Verhältnisse und dem Einfluss der Besatzungsmächte in ihren Sektoren zwischen 1945 und 1949 wurde von der Parteizugehörigkeit sämtlicher Bezirksstadträte in allen 20 Rathäusern ausgegangen. Außerdem wurden die Daten der Kandidaten von KPD/SED und SPD bei den Kommunalwahlen 1929, 1933 und 1946 erfasst, sowie die Kandidaten von CDU und SPD bei den Kommunalwahlen von 1946 bis 1963. In zwei Dateien über SPD-Mitglieder und SPD-Funktionäre konnten wir aus Mitgliederunterlagen, selbstverfassten Lebensläufen, Entnazifizierungsfragebögen und * Nur im Landesarchiv. 28 Politische und Soziale Determinanten des Wahlverhaltens in Berlin von 1946 bis 1950, Diplomarbeit am Fachbereich Politische Wissenschaft der FU Berlin, Juli 1988. 124 ZA-Information 56 anderen Quellen die Detail-Informationen gewinnen, die erforderlich waren, um Karriereverläufe und Lebenserfahrungen im Kontext einer Sekundärsozialisation im Ablauf der Systeme differenziert untersuchen zu können. Um diese Fragestellung zeitlich weiter zu verfolgen, wurde eine dritte Datei erstellt, die aus selbstverfassten Lebensläufen von SPD-Kandidaten zu den Abgeordnetenhauswahlen von 1958, 1963 und 1967 in drei Bezirken besteht. Sie wurde ergänzt durch Amtsblätterdaten über Listenplatzentwicklung, Berufsänderungen und Wohnbezirkswechsel, ferner gegebenenfalls durch andere Quellen, wenn Angaben über die Zeiten vor 1933, das Dritte Reich und danach bis 1958 zu finden waren. Leider kamen wir nicht dazu, den Auswertungsmöglichkeiten annähernd gerecht zu werden. 13 Inhaltsanalytische Daten Gleiches gilt für vier Dateien, die inhaltsanalytische Daten enthalten. Artikel auf den Titelseiten Berliner Tageszeitungen sind unter einem speziellen Gesichtspunkt ausgewertet worden. Fokus war vor allem der Ost-West-Konflikt und die Entspannungspolitik. Neben dem semantischen Inhalt wurde jeweils die Wahrnehmbarkeit eines Artikels erfasst. In Form einer von uns entwickelten Rangordnungsskala wurde die Positionierung sowie die drucktechnische Beschaffenheit des Zeitungsbeitrags29, also die Augenfälligkeit, eingestuft. In zwei Dateien werden Zeitungen der Westsektoren und des Sowjetsektors verglichen. So können bei unterschiedlichem Erscheinungsbeginn und -turnus zwischen Oktober 1945 und November 1946 Der Tagespiegel (US lizenziert) und der Telegraf (britisch lizenziert und SPD nahestehend) sowohl miteinander als auch mit dem unter sowjetischer Kontrolle stehenden Volk (Parteiorgan des Zentralausschusses der SPD) und der Deutschen Volkszeitung (KPD) bzw. als deren Nachfolger dem Neuen Deutschland (SED) verglichen werden. Über den Indikator "Wahrnehmbarkeit" hinaus, ist dieser Vergleich indikativ für Unterschiede in der Öffentlichkeitspolitik der Besatzungsmächte vor und während des Berliner Fusionskampfes sowie danach bis zu den Wahlen im Oktober 1946. Die Datenreihe wurde fortgeführt mit einer Datei, die Vergleiche zwischen dem Tagespiegel, dem Telegraf und dem Neuen Deutschland30 ermöglicht, also eine Entwicklung, die 1947 mit lang anhaltenden Auseinandersetzungen zwischen den 29 Die Ausprägungen reichten von "Schlagzeile" (unterschiedlicher Prominenz) über "halb fett" bis zu "normal" gesetzten Texten. 30 bis März 1948 für Neues Deutschland und bis August 1949 (nach Beendigung der Luftbrücke) für den West-Berliner Tagesspiegel. ZA-Information 56 125 Selbstverwaltungsansprüchen der demokratischen Parteien und den ViermächteKontrollgremien, der Kommandantur und dem Kontrollrat begann und die im März 1948 im Ost-West Konflikt mündete. Der anschließende Zusammenbruch der Viermächteverwaltung, die Blockadezeit und die getrennte Staatengründung wurden nur im Tagesspiegel weiter verfolgt. Mit diesen Dateien können vielfältige Vergleiche angestellt werden. Im bildungsbürgerlichen Tagespiegel und dem sozialdemokratischen Sprachrohr Telegraf (bis Ende Oktober 1946) können die unterschiedlichen Entwicklungen im Stil der Ansprache bis hin zur engagierten Mobilisierung der Bevölkerung bis Ende 1946 untersucht werden. Danach kann der Prozess indirekt beleuchtet werden, in welchem Amerikaner das Gebot nach Eintracht der Siegermächte gegenüber den Deutschen allmählich überwanden. Ebenso kann der Frage nachgegangen werden, wie die aggressive Redaktionspolitik des Neuen Deutschland von der neuen Situation tangiert wurde, in der die Westmächte das Viermächte-Experiment nicht nur sehr allmählich, sondern in der Konfrontation endgültig aufgaben. Die beiden Dateien für die Zeit danach, 1950 bis 1963 und 1961bis 1965, – mit dem Kalten Krieg der 50er Jahre, dem Mauerbau als Höhepunkt des Ost-West-Konfliktes und den ersten entspannungspolitischen "kleinen Schritten" – beschränken sich auf Fragen der Wahrnehmbarkeit für die West-Berliner Bevölkerung anhand von Mitteilungen auf der ersten Seite des Tagespiegel. Die insgesamt 4099 Zeitungsausgaben von Januar 1950 bis Juni 1963 wurden mit Hilfe eines Codeplans erfasst, der kurz und handlich war. Hier wurde erstmals unsere sog. "Druck-Drohungs-Skala"31 eingeführt, ferner werden Themen wie Stützungsmaßnahmen des Westens (symbolisch, materiell), Spannungen zwischen Berlin und Bonn, aber auch zwischen den Trägern des Widerstandskonsenses in Berlin und schließlich die Darstellung von Entspannungsangeboten des Ostens behandelt. Weit ausführlicher wird das Geschehen der Zeiträume Januar bis Dezember 1961 und Januar 1963 bis Juni 1965 in der zweiten inhaltsanalytischen Datei (in 1059 Ausgaben) bearbeitet. Neben der vorgenannten Druck-Drohungs-Skala wurde die Skala zur Wahrnehmbarkeit von Entspannungsmeldungen erprobt. Anhand des sehr differenzierten Codeplanes sollte berücksichtigt werden: Die Erwägung von entspannungspolitischen Schritten im "Westen", hervorgehobene Hinweise auf die 31 Die Ordinalskala repräsentiert den semantischen Charakter des Zeitungsartikels zwischen verba- ler Drohung (unterschiedlicher Stärke) auf der einen Seite und manifester Haltung – bis hin zur militärischen Konfrontation – auf der anderen. 126 ZA-Information 56 Rollenentsprechung der Gegenparteien (d.h. Durchsetzung des Ostens/Stützung durch den Westen), Dissonanzen und Differenzen in den Lagern der Akteure, das Vorkommen von Feindbildern und das Bild der Westalliierten als Schutzmächte sowie wertende Hinweise auf die herkömmliche und eine neue Deutschland- und Berlinpolitik. 14 Pensionierung Nach meiner Pensionierung im Jahre 1988, nach dem Ende des Kalten Krieges und dem Beginn des steinigen Prozesses einer wirklichen Wiedervereinigung Deutschlands, stand ich – angesichts meiner im Laufe von Jahrzehnten gesammelten ungeheuren Fülle von Materialien aus der quantifizierenden Forschung über die politischen Haltungen von West-Berlinern in der Zwickmühle zwischen stalinistischer Bedrohungen, dem Ost-West-Konflikt und entspannungspolitischen Schritten – vor der Frage, ob künftige Generationen irgendetwas Interessantes oder Lehrreiches an dem finden würden, was mich ein Leben lang bewegt und angespornt hat. Ob etwa Sozialwissenschaftler diesen interdisziplinären Forschungsansatz irgendwie anregend finden würden, ob Historiker aufgefordert werden könnten, in ihre Arbeit quantifizierende Analysen und Indikatoren einzubeziehen, und ob andere Neugierige mit Blick auf die vermeintlichen Absurditäten dieser für Deutschland – Ost und West – und auch für Europa so wichtigen Stadt es überhaupt interessant, geschweige denn lehrreich finden könnten, wenn sie auf einfache und bequeme Weise, d.h. benutzerfreundlich, Zugriff auf meine Daten- und Materialsammlung haben. So entstand zusammen mit dem mit diesen Daten und Materialien seit inzwischen zwei Jahrzehnten bestens vertrauten Mitarbeiter, Hans-Berthold Hohmann, die Idee, die übliche Trennung zwischen der Aufbewahrung von Daten (Zentralarchiv Köln) und schriftlichen Materialien (Landesarchiv Berlin) unter Nutzung der rasanten technischen Entwicklung in Form einer DVD von dieser Sammlung aufzuheben. Die "Stiftung Deutsche Klassenlotterie Berlin" hat die Umsetzung dieser Idee ebenso gefördert wie die drei institutionellen Träger des Projekts: Zentralarchiv für Empirische Sozialforschung an der Universität zu Köln, das Landesarchiv Berlin und das Otto-Stammer-Zentrum der Freien Universität Berlin. Bei ihnen ist die Sammlung zunächst als DVD vorhanden, das Otto-Stammer-Zentrum ist dabei, eine InternetVersion zu erstellen. ZA-Information 56 127 The Mannheim Eurobarometer Trend File 1970 - 2002 Aktualisierung und Erweiterung der ZA-Studien-Nr. 3521 von Meinhard Moschner Die von der Europäischen Kommission seit 35 Jahren durchgeführten Eurobarometer stellen die Ressource für international vergleichende Forschung zu politischen Einstellungen und politischem Verhalten auf europäischer Ebene dar. Die Eurobarometer enthalten eine Reihe von Fragen, die über einen längeren Zeitraum wiederholt erhoben worden sind. Der kumulierte Datensatz dieser Trendfragen ist The Mannheim Eurobarometer Trend File. Er bietet für komparative und longitudinale Forschung eine erhebliche Erleichterung. Analysen über die 15 Mitgliedsländer der Europäischen Gemeinschaft und in der aktuellen Version über 86 Messzeitpunkte hinweg sind auf der Basis dieses Datensatzes möglich. Grundlage für die Auswahl und Aufbereitung der wichtigsten Trends durch das Mannheimer Zentrum für Europäische Sozialforschung (MZES) und das Zentrum für Umfragen, Methoden und Analysen (ZUMA) war die Datenbank des ehemaligen Zentrums für Europäische Umfrageanalysen und Studien (ZEUS). Die erste Ausgabe der Kumulation deckte den Zeitraum bis 1999 ab. Die vom Zentralarchiv überarbeitete und aktualisierte zweite Edition umfasst den Zeitraum von der ersten European Communities Study1 1970 bis zum Eurobarometer 57.2 vom Frühjahr 2002. Der File umfasst jetzt 146 Variablen und weit über eine Million Befragte. The Mannheim Eurobarometer Trend File basiert im Wesentlichen auf den Standardtrends der ersten Edition zu Einstellungen und Verhalten der Bevölkerung zu Europa, der europäischen Integration, zur Europäischen Union und ihren Institutionen. Daneben gibt es insbesondere die Variablen zu allgemeinen politischen Einstellungen, insbesondere ideologische Orientierungen und Wahlverhalten. Als demographische Merkmale sind Alter, Geschlecht, Bildung, Beruf oder Religionszugehörigkeit enthalten. Im technischen Teil finden sich Variablen zur Identifizierung der Sample und Wellen sowie die über den gesamten Zeitraum harmonisierten Gewichtungen. 1 Allgemein als Vorläuferstudie zu den später Eurobarometer genannten Studien angesehen. 128 ZA-Information 56 Letztere dienen der Angleichungen der Struktur der Zufallsstichproben an diejenige der abzubildenden Grundgesamtheit nach ausgewählten Merkmalen (Zellengewichtung) und dem Ausgleich unterschiedlicher Bevölkerungsanteile für Ost und Westdeutschland, Großbritannien und Nordirland sowie für Gesamteuropa. Aus den Standard-Eurobarometern sind diejenigen Fragen ausgewählt und als Trends in den File aufgenommen worden, die mindestens zu fünf Zeitpunkten in identischer Formulierung gestellt worden sind. Zulässige geringe Abweichungen in der Frageformulierung sind detailliert im Codebuch dokumentiert. Unterschiedliche Kodierungen bei prinzipiell vergleichbaren Antwortkategorien bzw. Skalen sind so standardisiert, dass gleiche Kategorien über alle betroffenen Wellen hinweg die gleiche Bedeutung haben. Für einige Variablen unterscheiden sich die Antwortkategorien in ihrer Bedeutung notwendigerweise nach Ländern, insbesondere bei den Fragen zu politischen Parteien (Wahlverhalten, Verbundenheit usw.). Sie wurden auf der Grundlage des aktualisierten, vom Zentrum für Europäische Umfrageanalysen und Studien (ZEUS) entwickelten Kodierungsschemas für politische Parteien nach „Familienzugehörigkeit“ (Sozialisten, Liberale, Konservative usw.) harmonisiert. Für die zweite Edition wurden die über Zeit unterschiedlich spezifizierten Berufskategorien ohne Informationsverlust in hierarchischer Kodierung standardisiert. Die Aktualisierung des Trendfiles erfolgte beim ZA durch Iris Leim und Meinhard Moschner. Die Produzenten der Ursprungskumulation, Hermann Schmitt (MZES) und Evi Scholz (ZUMA), waren beratend beteiligt bzw. unterstützten die Endkontrolle. Die Analysedatei sowie die ausführliche Codebuchdokumentation werden vom ZA bereitgestellt. Mehr Informationen unter: http://www.gesis.org/en/data_service/eurobarometer/standard_eb_trend/trendfile.htm ZA-Information 56 129 Consolidation of Democracy in Central and Eastern Europe 1990 - 2001: Cumulation of PCP Wave I and Wave II by Brigitte Hausstein The cumulative data set of the comparative study series “Post-Communist Publics Study” (PCP) is now available at ZA (Study No. 4054). The data are prepared for secondary analysis according to the archival standards and are available with the documentation (study description, questionnaires, and codebook). The cumulative data set offers favourable opportunities for cross-time comparison. The main goal of the study series is to analyze the current state of consolidation of the newly implemented democracies in the countries of Central and Eastern Europe. A key criterion for evaluating democratic consolidation is the emergence of a political culture which is congruent to the created democratic structures. After a decade of personal experience with the new political and economic systems, the most interesting question refers to the effects of this specific experience on the formation of the political culture. The cumulated data set comprises the data of wave 1 and 2 of the study series: 1. “The Post-communist Citizen 1990-1992”. This project was coordinated by László Bruszt (Central European University, Budapest) and János Simon (Institute for Political Science of the Hungarian Academy of Sciences, Budapest). The data have been collected in eleven Central and Eastern European countries including Eastern Germany. The data set has been distributed by the ZA under the ZA-study-No. 3218 (n = 12.635). 2. ”Consolidation of Democracy in Central and Eastern Europe 1998-2001: A Fifteen Country Study”. The research project was coordinated by Edeltraud Roller, Dieter Fuchs, Hans-Dieter Klingemann, Bernhard Wessels (Social Science Research Center Berlin, WZB), and János Simon (Hungarian Academy of Sciences, Budapest). The data set consists of representative population surveys (18 years and older) that have been conducted by national research 130 ZA-Information 56 teams in fourteen Central and Eastern European countries (including East Germany) between 1998 and 2001. Additionally, the survey has been carried out in West Germany. The data set has been distributed by ZA under the ZA-study-No. 3999 (n = 16.561). Table Number of respondents per country and wave ZA-Study No. 4054 Belarus Bulgaria Czech Republic Slovakia Estonia East Germany West Germany Hungary Latvia Lithuania Poland Romania Russia Slovenia Ukraine Krasnoyarsk Total Wave 1 1990-1992 1074 679 324 943 1087 1277 918 919 1234 686 1739 1485 12365 Wave 2 1998-2001 1000 1021 1004 1033 1000 1013 1022 1086 1099 1005 1369 1208 1500 1001 1200 16561 For ordering, please consult: http://www.gesis.org/en/data_service/eastern_europe/order/order-www.htm or contact: Brigitte Hausstein GESIS Service Agency Eastern Europe Schiffbauerdamm 19, 10117 Berlin E-mail: [email protected] Phone: +49 (0)30 233611314 Fax: +49 (0)30 233611330 ZA-Information 56 131 Lebenssituation, Sicherheit und Gesundheit von Frauen in Deutschland: Eine Kurzbeschreibung der Studie von Monika Schröttle 1 Die vom Bundesministerium für Familie, Senioren, Frauen und Jugend (BMFSFJ) in Auftrag gegebene Studie „Lebenssituation, Sicherheit und Gesundheit von Frauen in Deutschland“ ist die erste große deutsche Repräsentativuntersuchung zu den Gewalterfahrungen von Frauen in Deutschland. Sie wurde von 2002 bis 2004 unter der Leitung von Prof. Dr. Ursula Müller und Dr. Monika Schröttle am Zentrum für Interdisziplinäre Frauen- und Geschlechterforschung (IFF) der Universität Bielefeld und in Kooperation mit infas durchgeführt. Die Studie wurde von einem internationalen wissenschaftlichen Beirat begleitet. Ziel der Studie war, bestehende Dunkelfelder bestmöglich aufzudecken und Wissenslücken über das Ausmaß, die Formen und Ursachen von Gewalt gegen Frauen zu schließen. Die erhobenen Daten bilden darüber hinaus eine empirische Basis für die Ermittlung konkreter Handlungs- und Hilfebedarfe und für die Verbesserung von Maßnahmen und Strategien zum Abbau von Gewalt im Geschlechterverhältnis und zur Unterstützung gewaltbetroffener Frauen. Für die Hauptuntersuchung wurden auf der Basis einer repräsentativen Gemeindestichprobe 10.264 in Deutschland lebende Frauen im Alter von 16-85 Jahren umfassend zu ihren Gewalterfahrungen in unterschiedlichen Lebenskontexten, zu den Folgen von Gewalt, zur Inanspruchnahme von institutioneller Hilfe und Unterstützung sowie zu ihrem Sicherheitsgefühl und ihren Ängsten befragt (vgl. zu den Inhalten und der Methodik der Erhebung auch den Methodenbericht). Um zudem die beiden größten Migrantinnengruppen in Deutschland – türkische Migrantinnen und Aussiedlerinnen aus der ehemaligen UdSSR und Osteuropa – zu erfassen, wurden zusätzlich jeweils 250 Interviews in türkischer und russischer Sprache durchgeführt. 1 Dr. Monika Schröttle, Universität Bielefeld, [email protected] 132 ZA-Information 56 Die bundesweite Erhebung erfolgte durch infas von Februar bis Oktober 2003. Es handelte sich um standardisierte face-to-face-Interviews, die in den Haushalten der Befragten, wahlweise auch an anderen Orten, durchgeführt wurden, und die durch einen schriftlichen drop-off-Fragebogen zu Gewalt in Familien- und Paarbeziehungen ergänzt wurden. Die ca. 60-90-minütigen Interviews wurden allein und in Abwesenheit Dritter durchgeführt, um eine ruhige, ungestörte Interviewsituation zu gewährleisten. Es wurden ausschließlich weibliche Interviewerinnen eingesetzt, die für diese Aufgabe im Vorfeld durch infas und IFF spezifisch geschult und während der Feldphase intensiv begleitet wurden. Im Anschluss an das Interview erhielten die Befragten ein Informationsblatt mit regionalen Hilfemöglichkeiten für Frauen in Gewaltsituationen, sowie mit der Nummer einer Studien begleitenden Telefonhotline, die während der Feldzeit am Zentrum für Interdisziplinäre Frauen- und Geschlechterforschung der Universität Bielefeld für Befragte und Interviewerinnen eingerichtet wurde. Damit sollte möglichen negativen Folgen, die sich aus der Teilnahme an den Interviews für die Befragten ergeben können, entgegengewirkt werden. Die Erhebungsinstrumente zur Erfassung von Gewalt wurden aus international verwendeten Instrumenten der Gewaltforschung zusammengestellt und weiterentwickelt. Sie wurden so gewählt, dass sekundäranalytische Vergleiche mit anderen europäischen Prävalenzstudien möglich sind und bestehende Dunkelfelder bestmöglich aufgedeckt werden können. Zentrale Gewaltformen, die in der Studie erfasst wurden, sind: körperliche Gewalt, sexuelle Gewalt, sexuelle Belästigung und psychische Gewalt. Die Betroffenheit durch alle vier Gewaltformen wurde zunächst im mündlichen Befragungsteil abgefragt, und zwar jeweils anhand einer allgemeinen Einstiegsfrage zum Erleben dieser Gewalt seit dem 16. Lebensjahr, der eine spezifizierte Liste mit konkreten Gewalthandlungen folgte, anhand derer die Befragten mithilfe von Kennbuchstaben benennen konnten, ob diese Gewalthandlung seit dem Alter von 16 Jahren einmal, mehrmals oder nie erlebt wurde (die Einstiegsfragen und Itemlisten der abgefragten Gewalthandlungen finden sich im Anhang dieser Kurzbeschreibung). Dem folgten dann jeweils – falls eine der Handlungen erlebt wurde – weitere Nachfragen zur Häufigkeit erlebter Situationen, zum Täter-Opfer-Kontext, in dem die Gewalt stattfand, zu den Folgen der Gewalt und zu weiteren Details bezogen auf konkrete Gewaltsituationen. Darüber hinaus wurde körperliche, sexuelle und psychische Gewalt auch im schriftlichen Fragebogen erfasst – einmal bezogen auf Gewalt durch aktuelle und frühere Beziehungspartnerinnen und -partner, zum anderen bezogen auf Gewalt in Kindheit und Jugend der Befragten bis zum Alter von 16 Jahren. Durch diese Methodik der ZA-Information 56 133 zusätzlichen Abfrage sensibler Themenbereiche in einem schriftlichen Fragebogen, wie sie auch in anderen Untersuchungen für die Erfassung von häuslicher und von sexueller Gewalt bereits erfolgreich angewendet wurde2, konnte anhand des schriftlichen Fragebogens deutlich mehr Gewalt in Paarbeziehungen aufgedeckt werden als durch den mündlichen Fragebogen allein. Offenbar sind viele Befragte eher bereit, über Gewalt in Familien- und Paarbeziehungen im anonymer wirkenden Setting eines schriftlichen, auf die Problematik zugeschnittenen Fragebogens Auskunft zu geben als direkt im mündlichen Interview gegenüber einer dritten Person. Gewaltprävalenzen bezeichnen den Prozentsatz derer, die in einem bestimmten Zeitraum Opfer von Gewalt und Übergriffen geworden sind. Die für die Studie dokumentierten Prävalenzdaten zur Gewaltbetroffenheit von Frauen seit dem 16. Lebensjahr beziehen sich bei körperlicher und sexueller Gewalt auf alle Angaben aus dem mündlichen und schriftlichen Fragebogenteil. Die Prävalenzdaten zu sexueller Belästigung und zu psychischer Gewalt beziehen sich nur auf die Angaben im mündlichen Fragebogenteil. Eine Befragte galt als von einer Gewaltform betroffen, wenn sie in der Einstiegsfrage oder in der nachfolgenden Itemliste angab, mindestens eine der genannten Gewalthandlungen mindestens einmal in ihrem Erwachsenenleben erlebt zu haben; weitere Differenzierungen zur Schwere und Häufigkeit erlebter Gewaltsituationen wurden anhand der nachfolgenden Angaben zu erlebter Gewalt vorgenommen. Die Befunde der Untersuchung verweisen insgesamt auf hohe Gewaltbetroffenheiten in Deutschland. Demnach haben: 37% aller befragten Frauen körperliche Übergriffe seit dem 16. Lebensjahr erlebt, die von wütendem Wegschubsen und leichten Ohrfeigen ohne Verletzungsfolgen bis hin zu Treten, Verprügeln und Waffengewalt reichten. Etwa zwei Drittel dieser Frauen haben auch mittlere bis schwere Formen von körperlicher Gewalt erlebt, die mit Verletzungsfolgen, Angst vor ernsthafter/lebensgefährlicher Verletzung, Waffengewalt oder einer höheren Frequenz von Situationen einhergingen. 13% der befragten Frauen, also etwa jede siebte in Deutschland lebende Frau, hat sexuelle Gewalt seit dem 16. Lebensjahr erlitten. Dieser Anteil bezieht sich auf eine enge Definition strafrechtlich relevanter Formen von erzwungener sexueller Gewalt wie Vergewaltigung, versuchte Vergewaltigung und sexuelle Nötigung; bei breiteren Gewaltdefinitionen, die auch schwerere 2 Vgl. u.a. Wetzels/Pfeiffer (1995); Britisch Crime Survey (1996 und 2004). 134 ZA-Information 56 Formen von sexueller Belästigung einbeziehen, würde dieser Anteil auf bis zu 34% ansteigen. Unterschiedliche Formen sexueller Belästigung haben 58% der Befragten erlebt. Formen psychischer Gewalt, die von eingeschüchtert Werden oder aggressivem Anschreien über Verleumdungen, Drohungen und Demütigungen bis hin zu Psychoterror reichten, haben 42% der befragten Frauen benannt. Die Ergebnisse der Studie zeigen auf, dass Gewalt gegen Frauen überwiegend Gewalt durch männliche Beziehungspartner ist und überwiegend im häuslichen Bereich erlebt wird. Insgesamt rund 25% der Frauen haben körperliche oder sexuelle Übergriffe (oder beides) durch aktuelle oder frühere Beziehungspartner erlebt. Das in der Studie erhobene Gewaltausmaß bestätigt bisherige Schätzungen zum Ausmaß von Gewalt gegen Frauen in Deutschland. Im Vergleich zu den in anderen europäischen Untersuchungen gemessenen Werten liegt das Gewaltausmaß im mittleren bis oberen Bereich, wobei die Vergleichbarkeit der europäischen Prävalenzdaten und der Einfluss unterschiedlicher Methoden auf die Ergebnisse derzeit noch durch eine internationale Arbeitsgruppe zur Prävalenzforschung im Rahmen der EU-Coordination Action on Human Rights Violations (CAHRV) geprüft wird. Die Ergebnisse der Studie zeigen auf, dass alle erlebten Formen von Gewalt mit erheblichen gesundheitlichen, psychischen und psychosozialen Folgen verbunden sein können. Viele Frauen, die Gewalthandlungen erlebt haben, sprechen mit niemandem über das Ereignis; das gaben – je nach Schwere, Gewaltform und Kontext der Gewalt – etwa 40-50% der gewaltbetroffenen Frauen an. Wenn Dritte angesprochen werden, dann sind das am häufigsten FreundInnen und Personen aus dem engsten Familienkreis. Dies zeigt auf, wie wichtig die sozialen Umfelder der Betroffenen sind, wenn es um Hilfe und Unterstützung in Gewaltsituationen geht. Erst mit einigem Abstand werden dann Institutionen und Personen aus dem Hilfesystem, etwa ÄrztInnen, psychosoziale Hilfseinrichtungen und die Polizei als AnsprechpartnerInnen nach Gewaltsituationen in Anspruch genommen. Ärzte und Ärztinnen werden – je nach Formen und Kontexten der Gewalt – von etwa einem Drittel der Frauen, die Gewalt mit Verletzungsfolgen erlebt haben, eingeschaltet und bilden eine zentrale Berufsgruppe, die mit Opfern von Gewalt in Berührung kommen. Psychosoziale Hilfseinrichtungen und/oder die Polizei wurden – je ZA-Information 56 135 nach Schwere, Form und Kontext der Gewalt – von 13-29% der gewaltbetroffenen Frauen in Anspruch genommen. Die Studie verweist – auch wegen des hohen Ausmaßes unterschiedlich schwerer Formen von Gewalt gegen Frauen in Deutschland – auf einen erheblichen Hilfeund Unterstützungsbedarf für gewaltbetroffene Frauen, insbesondere auf die Notwendigkeit niedrigschwelliger Hilfe und Unterstützung, durch die betroffene Frauen frühzeitiger erreicht werden können. Spezifische, stärker frequentierte Berufsgruppen wie ÄrztInnen und PsychotherapeutInnen, aber auch die sozialen Umfelder der Betroffenen sind noch stärker als bisher in die Informations- und Öffentlichkeitsarbeit, und in die Entwicklung von Hilfe- und Präventionsstrategien einzubeziehen. Die Studie enthält reichhaltiges Datenmaterial, das in den nächsten Jahren noch weiter vertiefend und differenziert ausgewertet werden soll, insbesondere in Bezug auf unterschiedliche Gewaltbetroffenheiten und Hilfe-/Unterstützungsbedarfe, sowie die Frage nach gewaltfördernden bzw. -verringernden Bedingungen im Lebensverlauf. Auch sind vertiefende Auswertungen über die gesundheitlichen Folgen der Gewalt mit Blick auf verschiedene Bevölkerungsgruppen, sowie zu den gesamtgesellschaftlichen Kosten der Gewalt geplant. Publikation der Ergebnisse: Kurzfassung: BMFSFJ (Hrsg., 2004): Lebenssituation, Sicherheit und Gesundheit von Frauen in Deutschland. Eine repräsentative Untersuchung zu Gewalt gegen Frauen in Deutschland. Zusammenfassung zentraler Studienergebnisse. Berlin. (Erhältlich über [email protected], Tel.: 080/5329329, Download unter www.bmfsfj.de Stichwort → Forschungsnetz → Forschungsberichte) Ausführliche Dokumentation aller Studienergebnisse im Internet www.bmfsfj.de Stichwort → Forschungsnetz → Forschungsberichte unter: Ergebnisse der repräsentativen Hauptuntersuchung (Schröttle und Müller 2004) Ergebnisse der Teilpopulationen-Zusatzbefragung (I Asylbewerberinnen, II Prostituierte, III Frauen in Haft ) Ergebnisse der Gruppendiskussionen zum Unterstützungs- und Hilfebedarf aus der Sicht gewaltbetroffener Frauen (Glammeier, Müller u. Schröttle 2004) Methodenbericht (infas) Fragebogen (IFF/infas) 136 Projektteam am IFF: Projektleitung: Wissenschaftliche Mitarbeiterinnen: Sachbearbeitung: Studentische Hilfskraft: Projektteam bei infas: Projektleitung: MitarbeiterInnen: ZA-Information 56 Prof. Dr. Ursula Müller, Dr. Monika Schröttle Sandra Glammeier, Christa Oppenheimer Barbara Schulz Alexandra Münster Doris Hess, Dr. Angela Prussog-Wagner Karen Marwinski, Christine Fredebeul, Reiner Gilberg, Gerd Kästner Im Folgenden ein Auszug aus der Studienbeschreibung, die im Internet vollständig abrufbar ist. Er bezieht sich auf einen Teil der mündlichen Befragung3 und vermittelt einen Eindruck von der Detailliertheit mit der das Thema angegangen wird. Themen der Befragung: Angaben zur Person: bisheriger Lebensverlauf; Selbsteinschätzung; Sozialverhalten. Sicherheitsempfinden: Auf dem nächtlichen Heimweg, in öffentlichen Verkehrsmitteln und in Parkhäusern (Skalometer); Häufigkeit des Verweilens in solchen Situationen; Unsicherheitsempfinden als Grund für den Rückzug aus diesen Situationen; Angst vor körperlichen oder sexuellen Übergriffen durch Fremde, Bekannte, Familie/ Partner oder Kollegen; höheres Sicherheitsgefühl auf Frauenparkplätzen; Sicherheitsempfinden nachts alleine in der eigenen Wohnung; Maßnahmen zur Verstärkung des persönlichen Sicherheitsempfindens: mitgeführte Gegenstände zur Selbstverteidigung, mentale Vorbereitung, Selbstverteidigungskurs, Meiden von unsicheren Wegen, Ausweichen auf andere Straßenseite, Einschließen im Auto, Umsehen nach verdächtigen Personen, Taxinutzung und selbstbewusstes Auftreten. Opfererfahrung: gewaltsamer Überfall, Wohnungseinbruch oder Geiselnahme und Häufigkeit der Geschehnisse in den letzten fünf Jahren sowie 12 Monaten, TäterOpfer-Beziehung. Sexuelle Belästigung: Häufigkeit sowie Art und Weise eigener Erfahrungen; Vorkommnisse allgemein und in den letzten 12 Monaten (Skala: Telefonterror, Nachpfeifen, sexuelle Anspielungen, Obszönitäten, körperliche Berührung und Verfolgung); detaillierte Angaben zum Täter-Opfer-Kontext: Häufigkeit sexueller Belästigungen durch Fremde, Arbeitskollegen, Vertrauenspersonen, Freunde/Bekannte, 3 In der ZA-Studien-Nr. 4194 ist darüber hinaus die schriftliche Befragung mit vergleichbaren Befragungsinhalten archiviert. ZA-Information 56 137 Partner, Familienangehörige; Geschlecht und Alter der Personen; Häufigkeit des Gefühls ernsthafter Bedrohung. Psychische Gewalt, Skala: Abwertung, Einschüchterung, Ausgrenzung, Verleumdung und Psychoterror durch andere Personen; Vorkommnisse allgemein und in den letzten 12 Monaten; detaillierte Angaben zum Täter-Opfer-Kontext und zu den psychischen und physischen Folgen. Körperliche Gewalt: Häufigkeit körperlicher Angriffe seit dem 16. Lebensjahr und in den letzten 12 Monaten: (Skala der Angriffe in Form von Ohrfeigen, Schlägen, Würgen, Bedrohen oder Verletzen mit Messer bzw. Pistole und Morddrohung); Bekanntschaftsgrad, Geschlecht und Alter der Täter; Orte der Angriffe (in der Wohnung oder draußen sowie in Deutschland oder im Ausland); Befragte als Angreiferin; Art der Verletzungen; Angst vor lebensgefährlichen Verletzungen. Ergriffene Maßnahmen: medizinische Hilfe, Polizei eingeschaltet, Anzeigeverhalten; vermutete Gründe für Angriffe: Geschlecht, sozialer Status, ausländische Erscheinung oder Behinderung der Befragten; detaillierte Angaben über die als besonders belastend empfundene Tat bzw. Situation. Folgen des Angriffs: gesundheitliche und seelische Probleme (z.B. Depression, Rachegefühle, Suizidgedanken), Konsum von Alkohol, Drogen oder Medikamenten; langfristige Folgen; Beurteilung des Verbrechens; Einschaltung der Polizei durch die Befragte oder andere; Gründe für eine eventuelle Nichteinschaltung der Polizei: Angst vor Rache, Schutz des Täters, Schamgefühl; verstrichene Zeit bis zur Anzeige, Art der erwarteten Behandlung durch die Polizei, Reaktion der Polizei, Zufriedenheit mit dem Handeln der Polizei; Scheu vor Gerichtsverhandlung; Aufrechterhaltung oder Zurückziehen der Anzeige; Gründe für eine eventuelle Nichterstattung einer Anzeige; Gerichtsverhandlung: Strafgericht oder Zivilgericht, Auftritt der Befragten als Nebenklägerin, Dauer des Prozesses, Prozess abgeschlossen, Ausgang der Verhandlung, Zufriedenheit mit der Verhandlung, Probleme und Belastungen vor Gericht; Rat der Befragten an andere in ähnlicher Situation. Sexuelle Gewalt: Ungewollte sexuelle Handlungen seit dem Alter von 16 Jahren: Unwillen vorher deutlich gemacht, Häufigkeit der Handlungen in den letzten 12 Monaten, fünf Jahren, seit dem Alter von 16 Jahren, Art und Weise der sexuellen Handlungen; Bekanntschaftsgrad, Geschlecht und Alter der Täter; Orte der sexuellen Handlungen (in der Wohnung oder draußen sowie in Deutschland oder im Ausland); Art der Verletzungen; Angst vor lebensgefährlichen Verletzungen; ergriffene Maßnahmen: medizinische Hilfe, Anzeigeverhalten; Bekanntschaftsgrad, Geschlecht und Alter des Täters; detaillierte Angaben über die Tat bzw. Situation in diesem Bereich; Kenntnis und Inanspruchnahme von Hilfseinrichtungen. 138 ZA-Information 56 Japan zu Gast im Zentralarchiv von Wolfgang Jagodzinski Als ein Testfall für die Modernisierungstheorien wird der asiatische Raum in den nächsten Jahren noch an Bedeutung gewinnen. Dabei scheinen Konzepte wie Rationalisierung, Postmodernisierung, Säkularisierung oder Individualisierung, die wir im Westen zur Erklärung sozialen Wandels benutzen, auf asiatische Länder wie Japan nur eingeschränkt übertragbar. Auch mit der Messung von Werten tut man sich schwer. Beim ersten Anblick der zweidimensionalen Wertdiagramme von Ronald Inglehart stellt der deutsche Leser mit großer Verwunderung fest, dass Japan in unmittelbarer Nachbarschaft von Ostdeutschland liegt. Die Ostdeutschen sind den Japanern im Hinblick auf ihre Wertorientierungen ähnlicher als den Westdeutschen – wer hätte das gedacht! Auf den zweiten Blick, wenn wir nämlich die Inglehartschen Operationalisierungen und die Anordnung der geographischen Einheiten im Werteraum verstanden haben, beschleicht uns das Gefühl, dass diese Diagramme zentrale kulturelle Werte nur unzureichend erfassen. Dafür spricht auch, dass die in internationalen Umfragen gemessenen Werte konkretere Einstellungen und Verhaltensweisen in Japan kaum erklären. Wenn wir die Modernisierungsprozesse in dem Land besser verstehen wollen, dann bleibt kein anderer Weg, als in intensivere Kooperationen mit japanischen Sozialwissenschaftlern einzutreten. Bislang scheiterte das häufig an Sprachbarrieren1 wie auch daran, dass der Zugang zu japanischen Daten nicht einfach war. In beiden Punkten zeichnet sich in den letzten Jahren ein erfreulicher Wandel ab. Die Kommunikationsmöglichkeiten in englischer Sprache haben sich erheblich verbessert. Gleichzeitig sind in Japan Bestrebungen im Gange, der internationalen Scientific Community den Zugang zu japanischen Daten zu erleichtern, indem man Datendokumentationen in englischer Sprache erstellt und die Möglichkeit von Downloads im Internet anbietet. Besonders eindrucksvoll ist der Service, der in den vergangenen Jahren unter der Leitung von Professor Naoi, dem langjährigen Vorsitzenden der japanischen Gesellschaft für Soziologie, an der Universität Osaka entstanden ist, wo japanische Umfragen zur sozialen Mobilität und zur Informationsgesellschaft 1 Wobei zu betonen ist, dass der Anteil der japanischen Wissenschaftler, die deutsch sprechen, ungleich höher ist, als der Anteil der deutschen Wissenschaftler, die japanisch sprechen. ZA-Information 56 139 unter einem auch technisch anspruchsvollen System SRDQ (Social Research Database on Questionnaires) für empirische Analysen zur Verfügung stehen (http://srdq.hus.osaka-u.ac.jp). Über eine weitere Datenquelle, den japanischen General Social Survey (JGSS), wurde in der letzten Ausgabe dieser Zeitschrift berichtet. Ferner sind Bestrebungen im Gange, in Japan verschiedene Datenzentren aufzubauen und unter dem Dach eines Konsortiums zusammen zu schließen. Das ZA unterstützt diese Bemühungen. Es hat im Februar dieses Jahres eine kleine Gruppe von japanischen Wissenschaftlern nach Köln eingeladen, um mit ihnen die Möglichkeiten japanisch-deutscher bzw. europäisch-asiatischer Forschungskooperationen auszuloten. Dabei wurden am ersten Tag japanische Datensätze vorgestellt, die für Ländervergleiche besonders geeignet erscheinen. Am zweiten Tag wurden mit den japanischen Gästen infrastrukturelle Maßnahmen zur Förderung des Datenaustauschs und der Forschungskooperationen diskutiert. An dem Treffen nahmen, in der Reihenfolge ihrer Vorträge, auf japanischer Seite folgende Personen teil: Kazufumi Manabe, Kwansei Gakuin University Akira Kawabata, Osaka University Tsuyoshi Sugano, Nihon University Shunroku Yoshida, Takaoka National College Masato Yoneda, National Institute for Japanese Language Hiroshi Aramaki, NHK Broadcasting Culture Research Institute. Auf deutscher Seite waren neben Mitarbeitern des ZA auch Experten der international vergleichenden Forschung bei dem Treffen zugegen. Der Koordinator der Gruppe, Professor Manabe, berichtete am ersten Tag über die Organisation der Umfrageforschung in Japan. In den folgenden Beiträgen wurden die Möglichkeiten des SRDQ Systems vorgestellt und das Analysepotential der in Osaka archivierten Studien an konkreten empirischen Analysen aufgezeigt (Kawabata und Sugano). Professor Yoshida stellte die von japanischen Versicherungen finanzierten Japanese People's Values in Life Surveys vor. Diese Umfragen dokumentieren u. a. einen erheblichen Rückgang der Lebenszufriedenheit der japanischen Bevölkerung in der letzten Dekade. The International Census on Attitudes toward Languages könnte ein interessanter Datensatz für Personen sein, die sich ländervergleichend mit Einstellungen zu Fremdsprachen beschäftigen wollen (Yoneda). Um die Beschränkungen international-vergleichender Umfragen zu überwinden, entwickelt NHK zu bestimmten Themenkomplexen Zusatzmodule, die eine differenziertere Erfassung der fraglichen Einstellungen und Verhaltensweisen ermöglichen. Beispielsweise werden im Zusatzmodul zum Religionsmodul des 140 ZA-Information 56 ISSP (1998) spezifische religiöse Praktiken in Japan erhoben, die nicht Gegenstand der Hauptbefragung sind (Aramaki). Wie solche und weitere Umfragen künftig europäischen Sozialwissenschaftlern zugänglich gemacht werden, ist noch nicht abschließend geklärt. Verschiedene Modelle wurden diskutiert. Mitarbeiter des ZA zeigten den japanischen Gästen am zweiten Tag, welche Standards die im ZA archivierten Umfragen erfüllen müssen. Außerdem wurden wichtige Produkte und Entwicklungsprojekte des ZA vorgestellt. Im weiteren Verlauf des Symposiums wurden die Eckpunkte eines Kooperationsabkommens besprochen und konkrete Maßnahmen der Zusammenarbeit vereinbart. Eine solche Maßnahme ist die Veranstaltung von Data Confrontation Seminars im ZA, in denen wichtige international vergleichende Studien unter japanischer Federführung europäischen Sozialwissenschaftlern vorgestellt werden sollen. Die Professoren Inoguchi (AsiaBarometer) und Yoshino (East Asia Value Survey) haben ihr Kommen bereits zugesagt. Wir werden die Veranstaltungen rechtzeitig auf unserer Homepage ankündigen. Structural Equation (SEM) and Mixture Modelling (MM) Overview and Specialisations 35th Spring Seminar at the Zentralarchiv, March 6 - 24, 2006 First announcement The Spring Seminar is a training course for social scientists interested in advanced techniques of data analysis and in the application of these techniques to data. Participants must have a sound basic knowledge of statistics as well as experience in the handling of PCs and of working with statistical packages like SPSS. The Spring Seminar comprises lectures, exercises and practical work using personal computers. While in the lectures the logic of models and the corresponding analysis strategies will be explained, during the exercises and in the practical work the participants are given the opportunity to apply these methods to data. As in the past Spring Seminars, the focus will be on teaching multivariate analysis techniques. In ZA-Information 56 141 addition to the lectures, the participants will be provided with information about functions and services of the Zentralarchiv which is the German data archive for survey data. The seminar covers three modules of one week each, to some extent based upon one another. The courses can be booked either separately or as a block: For news and updates concerning the Spring Seminar, please refer to the following website: http://www.gesis.org/za 1. Week: March 6-10 Prof. Dr. Peter Schmidt with Dr. Eldad Davidov (Both: University of Gießen, Germany) Structural Equation Models: Theory, Applications and Extensions of the basic Model 2. Week: March 13-17 Prof. Dr. Joop Hox (Utrecht University, The Netherlands) Multi-Level Models in SEM 3. Week: March 20-24 Prof. Dr. Jan-Eric Gustafsson (Gothenburg University, Sweden) Mixture Models + SEM - Applications within Stream For questions please refer to: Zentralarchiv für Empirische Sozialforschung, Universität zu Köln Bachemer Str. 40, 50931 Köln Spring Seminar secretariat: Marianne Hurt, phone: +49-221-47694-101, e-mail: [email protected] Or: [email protected] Facsimile: +49-221-47694-904 Scientific coordinator: Maria Rohlinger, phone: +49-221-47694-45, e-mail: [email protected] 142 ZA-Information 56 Forschungsmethoden, Datenbankmanagement und Statistik in der Historischen Sozialforschung Basis- und Aufbaumodule des ZHSF-Methodenseminars Das Lehrangebot des ZHSF-Methodenseminars (seit 1980 auch bekannt als "ZHSFHerbstseminar") ist modular strukturiert, d.h. es besteht aus in sich geschlossenen Lehreinheiten, die thematisch aufeinander abgestimmt sind. Die Module des ZHSFMethodenseminars werden teils virtuell im Internet, teils vor Ort in Köln angeboten. Virtuell werden angeboten: das dreimonatige Basismodul "Forschungsmethoden" (einschließlich der Propädeutika der Vor-Ort-Basis-Module "Datenbankmanagement" und "Deskriptive Statistik") und das zweimonatige "Follow-Up-Seminar" zu den Basismodulen. Vor Ort in Köln werden angeboten: das zweitägige Einstiegsseminar zum virtuellen Basismodul, zwei viertägige Basismodule und zwei sechstägige Aufbaumodule. Die Basismodule vermitteln die Grundlagen der Methodik Historischer Sozialforschung (Forschungsmethoden, Datenbankmanagement und Deskriptive Statistik). Sie können ohne besondere Vorkenntnisse besucht werden. Die Aufbaumodule befassen sich mit der Theorie und Anwendung der multiplen Regression sowie verwandten Methoden des allgemeinen linearen Modells für metrische und diskrete abhängige Merkmale. Die Teilnahme an den Aufbaumodulen setzt Vorkenntnisse im Bereich der bivariaten Datenanalyse (bivariate Regression, einfache Varianzanalyse) und der Inferenzstatistik (Verteilungsmodelle, Grundlagen statistischer Hypothesentests) voraus. Termine: Basismodule Einstiegsseminar zum virtuellen Basismodul I: 29.04.-01.05.2005; vor Ort in Köln Basismodul I "Forschungsmethoden": Mai bis Juli 2005; virtuell im Internet Basismodul II "Datenbankmanagement": 30.07.-03.08.2005; vor Ort in Köln ZA-Information 56 143 Basismodul III "Deskriptive Statistik": 03.08.-07.08.2005; vor Ort in Köln Follow-Up-Seminar zu den Basismodulen: August-Oktober 2005; virtuell im Internet Aufbaumodule Aufbaumodul I: "Allgemeines Lineares Regressionsmodell/Submodelle": 21.08.-26.08.2005; vor Ort in Köln Aufbaumodul II: "Analyse diskreter abhängiger Merkmale": 29.08.-02.09.2005; vor Ort in Köln Gebühren: Repetitorium: € 50,- (Studenten und arbeitslose Teilnehmer: € 25,-). Basismodule: € 120,- für alle Basismodule (Studenten und arbeitslose Teilnehmer: € 60,-). € 50,- je Einzelmodul (Studenten und arbeitslose Teilnehmer: € 25,-). Aufbaumodule: € 120,- für beide Module inkl. Kursmaterialien (Studenten und arbeitslose Teilnehmer: € 60,-). € 75,- für ein Einzelmodul inkl. Kursmaterialien (Studenten und arbeitslose Teilnehmer: € 37). Anmeldeschluss: Basismodule: 15. April 2005; Aufbaumodule: 30. Juni 2005 Kontakt: ZHSF-Support, Liliencronstr. 6, 50931 Köln Tel. 0221 47694 -56, -35, -34 Fax 0221 47694 55 [email protected] und [email protected] Weitere Informationen zu den Seminaren und Anmeldeformulare finden sich auf dem Server des Zentralarchivs und auf dem ZHSF-Server unter http://www.gesis.org/Veranstaltungen/ http://zhsf.za.uni-koeln.de/ 144 ZA-Information 56 Erweiterungen im Datenangebot des Zentralarchivs Diese Aufstellung gibt eine Auswahl von Neuzugängen wider. Neben der Archivnummer und dem Studientitel sind die Primärforscher bzw. die Erhebungsinstitute und das Erhebungsjahr aufgeführt. Weitere Details zu den einzelnen Datensätzen sind in Form von Studienbeschreibungen über das Internet zugänglich: www.gesis.org/za Internationale Institutionen und Beziehungen 3204 Eurobarometer 52.0: 1999 (European Parliament Elections, the Single European Currency, and Financial Services) 3205 Eurobarometer 52.1: 1999 (Modern Biotechnology, Quality of Life, and Consumers’ Access to Justice) 3296 Eurobarometer 53: 2000 (Racism, Information Society, General Services, and Food Labeling) 3386 Eurobarometer 54.0: 2000 (The Euro, Financial Services, and Information Communication Technologies) 3387 Eurobarometer 54.1: 2000 (Building Europe and the European Union, The European Parliament, Public Safety, and Defence Policy) 3388 Eurobarometer 54.2: 2001 (Impact of New Technologies, Employment and Social Affairs, and Disabilities) 3389 Eurobarometer 54LAN: 2000 (Special Survey on Languages) 3506 Eurobarometer 55.0: 2001 (European Union Enlargement, the Euro, and Dialogue on Europe) 3507 Eurobarometer 55.1: 2001 (Globalization and Humanitarian Aid) 3508 Eurobarometer 55.1OVR: 2001 (Young Europeans) 3509 Eurobarometer 55.2: 2001 (Science and Technology, Agriculture, the Euro, and Internet Access) 3625 Eurobarometer 56.0: 2001 (Information and Communication Technologies, Financial Services, and Cultural Activities) 3626 Eurobarometer 56.1: 2001 (Social Exclusion and Modernization of Pension Systems) ZA-Information 56 145 3627 Eurobarometer 56.2: 2001 (Radio Active Waste, Demographic Issues, the Euro, and European Union Enlargement) 3635 Eurobarometer 56.3: 2002 (Getting Information on Europe and European Union Enlargement) 3638 Eurobarometer 57.0: 2002 (Agriculture, Energy, and Discrimination Issues) 3639 Eurobarometer 57.1: 2002 (European Union Enlargement, the European Parliament, and the Euro) 3640 Eurobarometer 57.2: 2002 (Health Issues, Cross-Border Purchases, and National Identities) 3641 Eurobarometer 57.2 OVR: 2002 (Attitudes and Opinions of Young People in the European Union on Drugs) 3692 Eurobarometer 58.0: 2002 (Services of General Interest, New Technologies, ICT, Health, Environment, and Public Safety) 3693 Eurobarometer 58.1: 2002 (The Euro, European Enlargement, and Financial Services) 3886 Eurobarometer 58.2: 2002 3903 Eurobarometer 59.0: 2003 (Lifelong Learning, Health, and Partners and Fertility) 3904 Eurobarometer 59.1: 2003 (The Euro and Parental Leave) 3905 Eurobarometer 59.2: 2003 3937 Eurobarometer 60.0: 2003 3938 Eurobarometer 60.1: 2003 (Citizenship and Sense of Belonging, Fraud, and the European Parliament) 3939 Eurobarometer 60.2: 2003 3940 Eurobarometer 60.3: 2003-2004 4056 Eurobarometer 61: 2004 (The European Union, Globalization, and the European Parliament - 30 Years of Eurobarometers) Europäische Kommission, Brüssel 3521 The Mannheim Eurobarometer Trend File 1970-2002 (ed. 2.00) MZES, Mannheim; ZUMA, Mannheim; ZA, Köln 146 ZA-Information 56 Eurobarometer für Mittel- und Osteuropa 3648 Central and Eastern Eurobarometer 1990-1997: Trends CEEB 1-8 3978 Candidate Countries Eurobarometer 2001 3979 Candidate Countries Eurobarometer 2002.2 3980 Candidate Countries Eurobarometer 2002.3 (Agriculture) 3981 Candidate Countries Eurobarometer 2002.3 (Science and Technology) 3982 Candidate Countries Eurobarometer 2003.1 (Youth in New Europe) 3983 Candidate Countries Eurobarometer 2003.2 3984 Candidate Countries Eurobarometer 2003.3 3986 Candidate Countries Eurobarometer 2003.4 Europäische Kommission, Brüssel Flash Eurobarometer 3191 Flash Eurobarometer 68: 1999 (EOS Managers 15) 3192 Flash Eurobarometer 69: 1999 (Dialogue with Citizens) 3193 Flash Eurobarometer 70: 1999 (EOS Managers 16) 3194 Flash Eurobarometer 71: 1999 (Town twinning Mayors/Responsibles) 3487 Flash Eurobarometer 78: 2000 (Multimedia Internet Services: Special Enterprises) 3600 Flash Eurobarometer 111: 2001 (Small and Medium Enterprises and the Euro 6) 3604 Flash Eurobarometer 115: 2001 (Euro Introduction Attitudes, Step 12 - Euro Zone) 3605 Flash Eurobarometer 115: 2001 (Euro Introduction Attitudes, Step 12 - NonEuro Zone) 3606 Flash Eurobarometer 116: 2001 (Special Target: E-Commerce) Europäische Kommission, Brüssel International Social Survey Programme (ISSP) 3190 International Social Survey Programme 1998: Religion II (ISSP 1998) 3390 International Social Survey Programme: Religion I/II (ISSP 1991 - 1998) ZA-Information 56 147 3430 International Social Survey Programme 1999: Social Inequality III (ISSP 1999) 3440 International Social Survey Programme 2000: Environment II (ISSP 2000) 3680 International Social Survey Programme 2001: Social Relations and Support Systems ('Social Networks II') (ISSP 2001) 3880 International Social Survey Programme 2002: Family and Gender Roles III (ISSP 2002) Studien aus Osteuropa 1. Bulgarien 3960 Die Bulgarische Sicherheitspolitik 1999 3961 Die Bulgarische Sicherheitspolitik 2000 3962 Die Bulgarische Sicherheitspolitik 2001 3963 Die öffentliche Wahrnehmung ethnischer Beziehungen in Bulgarien 2003 3964 Einstellung Jugendlicher zu Drogen und Drogengebrauch in Bulgarien 1998 Y. Yanakiev, Institute for Advanced Defence Research of the Bulgarian Ministry of Defence, Sofia 2. Polen 3358 The Transformation Process in Poland 1993 (Business Survey) H.P. Haarland, H.-J. Niessen, W. Franzen, W. Uellner, Forschungsstelle für empirische Sozialökonomik e. V., Köln 3946 Polish General Social Survey 1992-1999 B. Cichomski, Institute for Social Studies, University of Warsaw 3. Rumänien 3643 Quality of Life Diagnosis in Romania 1994 3644 Quality of Life Diagnosis in Romania 1995 3645 Quality of Life Diagnosis in Romania 1996 3646 Quality of Life Diagnosis in Romania 1997 3647 Quality of Life Diagnosis in Romania 1998 I. Marginean, Institute for Quality of Life Research, Romanian Academy, Bukarest 148 ZA-Information 56 4. Serbien 3893 Political and Social Attitudes in Serbia 2002 R. Domm, OSCE Mission to the Federal Republic of Yugoslavia, Belgrad 5. Slowenien 3215 Role of Government and Role of Slovenian Public Opinion 1989 N. Tos, u.a., Public Opinion Research Centre, Faculty of Social Science, University of Ljubljana 3216 Slovenian-Austrian Comparative Values Survey 1994 N. Tos, Public Opinion Research Centre, Faculty of Social Science University of Ljubljana, Slowenien; G. Ogris, Institute for Social Research and Analysis (SORA), Wien; M. Lay, E. Gehmacher, Institute for Empirical Social Research (IFES), Wien 3217 Slovenian Public Opinion Survey - Repeated questions from German Politbarometer 1990-1998 3527 Slovenian Public Opinion 1990 3528 Slovenian Public Opinion 1992: The Process of Democratisation 3529 Slovenian Public Opinion 1996: Comparative Study of Electoral Systems (CSES) 3530 Slovenian Public Opinion 1997: Slovenians‘ Attitudes on Integration in the European Union N. Tos, Public Opinion and Mass Communication Research Centre, University of Ljubliana 6. Tschechien und Slowakei 3360 The Transformation Process in the Czech and Slovak Republic 1994 (Business Survey) H.P. Haarland, H.-J. Niessen, W. Franzen, W. Uellner, Forschungsstelle für empirische Sozialökonomik e. V., Köln 3631 1996 Czech Pre-Election Survey (April 1996) 3632 1996 Czech Pre-Election Survey (May 1996) ZA-Information 56 149 3633 1996 Czech Post-Election Survey (June 1996) G. Toka, Central University Budapest 3888 Party Preferences Czech Republic 1996 (Trend) 3889 Party Preferences Czech Republic 1998 (Trend) 3890 Party Preferences Czech Republic 1999 (Trend) 3891 Party Preferences Czech Republic 2000 (Trend) 3892 Party Preferences Czech Republic 2001 (Trend) Institute for Public Opinion Research (IVVM), Prague 7. Ukraine 3965 Die Ukrainische Gesellschaft am Übergang zum 21. Jahrhundert 1998 3966 Die Ukrainische Gesellschaft am Übergang zum 21. Jahrhundert 1999 3967 Die Ukrainische Gesellschaft am Übergang zum 21. Jahrhundert 2000 V. Vorona, E. Golovakha, N. Panina, Institute of Sociology of Academy of Sciences of Ukraine 8. Ungarn 3370 The Transformation Process in Hungary 1995 (Business Survey) H.P. Haarland, H.-J. Niessen, W. Franzen, W. Uellner, Forschungsstelle für empirische Sozialökonomik e. V., Köln 9. Weißrussland 4053 Demokratische Einstellungen in Weißrussland 2002 L. Titarenko, Staatliche Universität Weißrussland, Abteilung Soziologie, Minsk 10. diverse 3218 Post communist Citizens I 1990-1992 - 11 Countries - First wave (= PCP I) (hierin enthalten: 3219 Post communist Citizens Eastern Germany 1992) 3999 Consolidation of Democracy in Central and Eastern Europe 1998-2001 (PCP II) 150 ZA-Information 56 4054 Consolidation of Democracy in Central and Eastern Europe 1990-2001: Kumulation PCP I und II D. Fuchs, u.a., Wissenschaftszentrum Berlin für Sozialforschung; sowie Forscher aus den teilnehmenden Ländern 3399 The Transformation Process in Hungary, Poland, in the Czech and Slovak Republic 1993-1995 (Population Survey) H.P. Haarland, H.-J. Niessen, W. Franzen, W. Uellner, Forschungsstelle für empirische Sozialökonomik, Köln 3299 Transition Barometer 1997 H. P. Haarland, H.-J. Niessen, W. Franzen, W. Uellner, Forschungsstelle für empirische Sozialökonomik, Köln 4046 Transatlantische Beziehungen IPOS, Institut für praxisorientierte Sozialforschung, Mannheim; W. Bürklin, Bundesverband deutscher Banken, Berlin Politische Einstellungen und Verhaltensweisen Wahlen 3861 Politische Einstellungen, politische Partizipation und Wählerverhalten im vereinigten Deutschland 2002 (= Bundestagswahlstudie 2002) J.W. Falter, Universität Mainz; O.W. Gabriel, Universität Stuttgart; H. Rattinger, Universität Bamberg 3272 Wahlstudie 1957 Institut für Demoskopie, Allensbach 3381 Landtagswahl in Baden-Württemberg 2001 3955 Landtagswahl in Bayern 2003 3894 Wahl zum Abgeordnetenhaus in Berlin 1999 3862 Wahl zum Abgeordnetenhaus in Berlin 2001 3895 Landtagswahl in Brandenburg 1999 3992 Landtagswahl in Brandenburg 2004 ZA-Information 56 3953 Bürgerschaftswahl in Bremen 2003 3863 Bürgerschaftswahl in Hamburg 2001 3990 Bürgerschaftswahl in Hamburg 2004 3866 Landtagswahl in Hessen 2003 3864 Landtagswahl in Mecklenburg-Vorpommern 2002 3867 Landtagswahl in Niedersachsen 2003 3436 Landtagswahl in Nordrhein-Westfalen 2000 3382 Landtagswahl in Rheinland-Pfalz 2001 3896 Landtagswahl im Saarland 1999 3993 Landtagswahl im Saarland 2004 3897 Landtagswahl in Sachsen 1999 3994 Landtagswahl in Sachsen 2004 3865 Landtagswahl in Sachsen-Anhalt 2002 3435 Landtagswahl in Schleswig-Holstein 2000 3898 Landtagswahl in Thüringen 1999 3991 Landtagswahl in Thüringen 2004 Forschungsgruppe Wahlen, Mannheim 3261 Politbarometer West 1999 3262 Politbarometer Ost 1999 3425 Politbarometer West 2000 3426 Politbarometer Ost 2000 3554 Politbarometer West 2001 3555 Politbarometer Ost 2001 3849 Politbarometer West 2002 3850 Politbarometer Ost 2002 Forschungsgruppe Wahlen, Mannheim 151 152 ZA-Information 56 3380 Forsa-Bus 1991 3300 Forsa-Bus 1992 3289 Forsa-Bus 1999 3486 Forsa-Bus 2000 3675 Forsa-Bus 2001 3909 Forsa-Bus 2002 4070 Forsa-Bus 2003 4192 Forsa-Bus 2004 FORSA, Berlin 3238 Europawahl 1999 3995 Europawahl 2004 3475 Volksabstimmung in Berlin und Brandenburg 1996 3954 Zur politischen Lage in Bayern 2003 3869 Zur politischen Lage in Berlin im Oktober 2001 4067 Zur politischen Lage in Brandenburg im September 2004 3868 Zur politischen Lage in Hamburg im September 2001 4100 Zur politischen Lage in Hamburg im Februar 2004 3872 Zur politischen Lage in Hessen im Januar 2003 3870 Zur politischen Lage in Mecklenburg-Vorpommern im August 2002 3871 Zur politischen Lage in Niedersachsen Januar 2003 4068 Zur politischen Lage im Saarland im August 2004 4069 Zur politischen Lage in Sachsen im September 2004 3998 Zur politischen Lage in Thüringen 2004 Forschungsgruppe Wahlen, Mannheim 4047 Das Amerikabild der Deutschen (Ost) 1991 4049 Das Amerikabild der Deutschen (Ost) 1993 4048 Das Amerikabild der Deutschen (West) 1991 4050 Das Amerikabild der Deutschen (West) 1993 IPOS, Institut für praxisorientierte Sozialforschung, Mannheim ZA-Information 56 153 3429 Kölner Lokalstudie zum politischen Informationsverhalten: Landtagswahl in NRW 1995 St. Kühnel, D. Ohr, Institut für Angewandte Sozialforschung, Universität zu Köln 3476 Politische Einstellungen in Berlin (November 1960) 3477 Politische Einstellungen in Berlin (Mai-Juni 1961) 3478 Politische Einstellungen in Berlin (Juni 1962) 3479 Politische Einstellungen in Berlin (Dezember 1962) 3480 Politische Einstellungen in Berlin (Januar 1963) 3481 Politische Einstellungen in Berlin (Kumulierter Datensatz: November 1960 Januar 1963) EMNID, Bielefeld Bundesverband deutscher Banken 3222 50 Jahre Bundesrepublik Deutschland 1999 3223 Die ‘Berliner Republik’ 1999 3874 Nach der Bundestagswahl 2002: Deutschland im Aufbruch? 3875 Nach der Bundestagswahl 2002: Das Regierungsprogramm 3384 Deutschland im Wandel 2000 IPOS, Institut für praxisorientierte Sozialforschung, Mannheim; W. Bürklin, Bundesverband deutscher Banken, Berlin Wirtschaftspolitik, wirtschaftliche Lage 3220 Deutschland Richtung geben 1998 3221 Deutschland nach dem Regierungswechsel 1998 3224 Wirtschaftsstandort Deutschland 2000 3383 Chancen der Globalisierung 2000 3873 Wirtschaftsstandort Deutschland 2002 4000 Wirtschaftsstandort Deutschland 2004 IPOS, Institut für praxisorientierte Sozialforschung, Mannheim; W. Bürklin, Bundesverband deutscher Banken, Berlin 154 ZA-Information 56 Staatliche Einnahmen 3265 Steuermoral und Steuermentalität der bundesdeutschen Bevölkerung und deren Einstellungen zur Steuerreform 1997 H.P. Haarland, H.-J. Niessen; Forschungsstelle für empirische Sozialökonomik, Köln Arbeit und Betrieb 3957 Geringfügige Beschäftigung und Nebenerwerbstätigkeiten 2001/2002 Infratest Sozialforschung, Forschungsteam Internationaler Arbeitsmarkt, Internationales Institut für empirische Sozialökonomie Beruf 3374 Berufliche Selbständigkeit in den neuen Bundesländern (Leipziger Gründerstudie) 1992-1995 S.H. Wilsdorf, Institut für Soziologie, Universität Leipzig; R. Ziegler, P. Preisendörfer, T. Hinz, Institut für Soziologie, Universität München BIBB/IAB-Studien 3348 IAB-Beschäftigtenstichprobe 1975-1997 – Regionalfile U. Blien, St. Bender, A. Haas, IAB-Institut für Arbeitsmarkt- und Berufsforschung der Bundesanstalt für Arbeit, Nürnberg; J. Möller, J. Ludsteck, Universität Regensburg 3379 Erwerb und Verwertung beruflicher Qualifikationen 1998/99 (Qualifikation und Berufsverlauf) R. Jansen, Bundesinstitut für Berufsbildung Bonn (BIBB); W. Dostal, Institut für Arbeitsmarkt- und Berufsforschung der Bundesanstalt für Arbeit, Nürnberg Konsumstruktur, Konsumverhalten 3653 Outfit 5 2001 SPIEGEL-Verlag, Hamburg; SINUS Sociovision, Heidelberg ZA-Information 56 155 Sparen, Geldanlagen, Vermögensbildung 3654 Alterssicherung in Deutschland 1986 (ASID ‘86) 3655 Alterssicherung in Deutschland 1992 (ASID ‘92) 3656 Alterssicherung in Deutschland 1995 (ASID ‘95) 3657 Alterssicherung in Deutschland 1999 (ASID ‘99) Bundesministerium für Arbeit und Sozialordnung, Bonn; Infratest Sozialforschung, München 3968 Bertelsmann Stiftung Vorsorgeerhebung 2002-2003 Bertelsmann Stiftung, Gütersloh; K. Kortmann, Th. Heien, Infratest München 3652 Soll und Haben 5 2000 SPIEGEL-Verlag, Hamburg; Manager Magazin, Hamburg; SINUS Sociovision, Heidelberg Gesellschaft, Kultur 3523 Ausländer in Deutschland 1997 3524 Ausländer in Deutschland 1998 3366 Ausländer in Deutschland 1999 - 1. Welle 3367 Ausländer in Deutschland 1999 - 2. Welle 3649 Ausländer in Deutschland 2000 - 1. Welle 3650 Ausländer in Deutschland 2000 - 2. Welle MARPLAN, Offenbach 3444 Erlebnisgesellschaft in Chemnitz 1996 D. Brock, G. Lechner, Technische Universität Chemnitz-Zwickau, Lehrstuhl für Soziologie II 3350 Freiwilligensurvey 1999 Bundesministerium für Familie, Senioren, Frauen und Jugend, Berlin; Infratest Burke Sozialforschung, München 156 ZA-Information 56 3522 International Social Justice Project 1991 und 1996 (ISJP 1991 und 1996) B. Wegener, Universität Heidelberg und Humboldt Universität Berlin; D. Mason, Butler University, Indianapolis; International Social Justice Project (ISJP) 3974 Labour Migration, Market Competition and Ethnocentrism: Guest workers in Israel and Germany 1996-1999 P. Schmidt, A. Heyder, Universität Gießen Lebensverlaufsstudie 3925 Ostdeutsche Lebensverläufe im Transformationsprozeß - Lebensverlaufsstudie LVOst Panel 1996-1997 3926 Ostdeutsche Lebensverläufe im Transformationsprozeß - Lebensverlaufsstudie LVOst 71 1996-1997 K.U. Mayer, Max-Planck-Institut für Bildungsforschung, Berlin 3927 Ausbildungs- und Berufsverläufe der Geburtskohorten 1964 und 1971 in Westdeutschland (LVWest 64/71) 1998-1999 K.U. Mayer, Max-Planck-Institut für Bildungsforschung, Berlin; G. Kleinhenz, Institut für Arbeitsmarkt- und Berufsforschung, IAB, Nürnberg 3398 Wohlfahrtssurvey 1998 W. Zapf, R. Habich, Wissenschaftszentrum Berlin; H.-H. Noll, ZUMA, Mannheim Gemeinde 3391 Bürgerumfrage Halle 1993 3392 Bürgerumfrage Halle 1994 3393 Bürgerumfrage Halle und Saalkreis 1995 3394 Bürgerumfrage Halle 1997 3395 Bürgerumfrage Halle 1999 3512 Soziale Vernetzung städtischer und ländlicher Bevölkerungen am Beispiel der Stadt Halle 2000 ZA-Information 56 157 3607 Bürgerumfrage Halle 2001 H. Sahner Institut für Soziologie der Martin-Luther-Universität, HalleWittenberg; Stadtverwaltung Halle/Saale 3462 Duisburger Bürgerumfrage (Frühjahr 1997) 3463 Duisburger Bürgerumfrage (Herbst 1997) 3464 Duisburger Bürgerumfrage (Frühjahr 1998) 3466 Duisburger Bürgerumfrage (Frühjahr 1999) Stadt Duisburg, Amt für Statistik, Stadtforschung und Europaangelegenheiten 3637 Eheschließungen in Euskirchen 1949-2000 J. Friedrichs, R. Kecskes, Chr. Wolf, Forschungsinstitut für Soziologie der Universität zu Köln 3378 Lebensstile, Wohnbedürfnisse und Mobilitätsbereitschaft 1996 F. Böltken, Bundesamt für Bauwesen und Raumordnung, Bonn; N. Schneider, A. Spellerberg, Wissenschaftszentrum Berlin für Sozialforschung, Berlin 3636 Sozialer Wandel einer Mittelstadt (Euskirchen-Studie 2001) J. Friedrichs, R. Kecskes, Chr. Wolf, Forschungsinstitut für Soziologie der Universität zu Köln Familie 3264 Alters-Survey 1996 F. Dittmann-Kohli, Forschungsgruppe Psychogerontologie, Universität Nijmegen (Niederlande); M. Kohli, Forschungsgruppe Altern und Lebenslauf (FALL), Freie Universität Berlin 3952 BdB-Jugendstudie 2003 (Erwachsene) 3951 BdB-Jugendstudie 2003: Wirtschaftsverständnis und Finanzkultur 4058 Deutschland vor der demographischen Herausforderung 2004 IPOS, Institut für praxisorientierte Sozialforschung, Mannheim; W. Bürklin, Bundesverband deutscher Banken, Berlin 158 ZA-Information 56 3400 Deutscher Family and Fertility Survey 1992 Bundesinstitut für Bevölkerungsforschung, Wiesbaden 3371 DJI-Ausländersurvey - Jugendliche 1996-1997 3372 DJI-Ausländersurvey - Kinder 1996-1997 3298 DJI-Jugendsurvey 1997 3608 DJI-Jugendsurvey 1992 und 1997 (Kumulierter Datensatz) 3609 DJI-Jugendsurvey 2000 Deutsches Jugendinstitut (DJI), München Familiensurvey 3211 Kinder in nichtehelichen Lebensgemeinschaften 1995 3212 Persönlichkeit und soziale Beziehungen 1995 3921 Stieffamilien in Deutschland - Übersicht, Lebenssituation, Perspektiven (Familiensurvey) 2000 3920 Wandel und Entwicklung familialer Lebensformen - 3. Welle (Familiensurvey) 2000 3210 Wandel und Entwicklung familialer Lebensformen (Kumulierter File 19881995) 3209 Wandel und Entwicklung familialer Lebensformen (Panel 1988-1994) Deutsches Jugendinstitut (DJI), München 3473 Frauenleben (Berufe im weiblichen Lebenslauf und sozialer Wandel) 1997 H. Krüger, C. Born, C. Erzberger, K. Bird, Sonderforschungsbereich 186 der Universität Bremen Freiburger Institut für angewandte Sozialwissenschaft 3446 Ältere Menschen in Offenburg 1997 R. Meßmer, N. Albert, Seniorenbüro Offenburg; FIFAS - Freiburger Institut für angewandte Sozialwissenschaft ZA-Information 56 159 3445 Pflege im sozialen Wandel 1996 Sozialministerium Baden-Württemberg; AOK Baden-Württemberg FIFAS, Freiburger Institut für angewandte Sozialwissenschaft, Freiburg 3447 Pflegekulturelle Orientierungen 1999 Evangelische Fachhochschule Freiburg; Institut für Soziologie der Universität Freiburg; FIFAS - Freiburger Institut für angewandte Sozialwissenschaft 3694 Jugend 2002 (14. Shell-Jugendstudie) K. Hurrelmann, Universität Bielefeld; Jugendwerk der Deutschen Shell, Hamburg 3431 Kindheit, Jugend und Erwachsenwerden 1991-1997 - Jugendlängsschnitt 1991-1995/96 3432 Kindheit, Jugend und Erwachsenwerden 1991-1997 - Junge-ErwachseneLängsschnitt 1991-1995/96 3433 Kindheit, Jugend und Erwachsenwerden 1991-1997 - Kinderlängsschnitt 1993-1997 3434 Kindheit, Jugend und Erwachsenwerden 1991-1997 - Querschnitt 1996 R.K. Silbereisen, Friedrich-Schiller-Universität Jena, Institut für Psychologie, Entwicklungspsychologie; L.A. Vaskovics, Otto-Friedrich-Universität Bamberg, Fakultät Sozial- und Wirtschaftswissenschaften, Soziologie; J. Zinnecker, Universität-Gesamthochschule Siegen, Erziehungswissenschaft, Sozialpädagogik 3188 Mannheimer Scheidungsstudie 1996 H. Esser, Lehrstuhl für Soziologie und Wissenschaftslehre, Universität Mannheim; Chr. Babka von Gostomski, J. Hartmann, Mannheimer Zentrum für europäische Sozialforschung (MZES), Mannheim 3266 Sexual- und Verhütungsverhalten 16- bis 24jähriger Jugendlicher und junger Erwachsener 1996 Bundeszentrale für gesundheitliche Aufklärung, Köln 160 ZA-Information 56 Universität, Forschung, Wissenschaft 3214 Rangliste der deutschen Universitäten 1999 H.-D. Daniel, Universität Kassel; DER SPIEGEL, Hamburg 3263 Studentischer Drogenkonsum 1995-1997 T. Baumgärtner, Institut für Soziologie, Universität Leipzig; K.-H. Reuband, V. Hüfken, Institut für Soziologie, Technische Universität Dresden; H. Renn, B. Antholz, Institut für Soziologie, Universität Hamburg 3443 Studentische Erwerbstätigkeit und Teilzeitstudium 1999 W. Nienhüser, C. Becker, M. Jans Fachbereich 5, Wirtschaftswissenschaften, Universität Gesamthochschule Essen 3511 Studiensituation und studentische Orientierungen 1997/98 T. Bargel, Arbeitsgruppe Hochschulforschung, Universität Konstanz 4154 Karrierewege von ProfessorInnen an Hochschulen in Deutschland 20022003 A. Zimmer, Universität Münster Religion und Weltanschauung 3385 Kirchenmitgliedschafts-Studie der EKD 1992 Evangelische Kirche Deutschland; GFM-GETAS, Hamburg Technik 3277 Umweltbewusstsein in Deutschland 1998 P. Preisendörfer, Institut für Soziologie, Universität Rostock; A Diekmann, Institut für Soziologie, Universität Bern 3278 Umweltbewusstsein in Deutschland 2000 U. Kuckartz, Institut für Erziehungswissenschaft, Philipps-Universität Marburg 3902 Umweltbewusstsein in Deutschland 2002 H. Grunenberg und U. Kuckartz, Institut für Erziehungswissenschaft, Philipps-Universität Marburg ZA-Information 56 161 Medizin 3505 Aids im öffentlichen Bewusstsein der Bundesrepublik Deutschland 1999 3428 Aids im öffentlichen Bewusstsein der Bundesrepublik Deutschland 2000 3699 Aids im öffentlichen Bewusstsein der Bundesrepublik Deutschland 2001 G. Christiansen, J. Töppich, Bundeszentrale für gesundheitliche Aufklärung, Köln 3201 Die Drogenaffinität Jugendlicher in der Bundesrepublik Deutschland 1993/1994 3510 Die Drogenaffinität Jugendlicher in der Bundesrepublik Deutschland 2001 Bundeszentrale für gesundheitliche Aufklärung, Köln; Institut für Jugendforschung (IJF), München 3470 Gebrauch psychoaktiver Substanzen bei Erwachsenen in Deutschland 1997 (Konsum und Mißbrauch von illegalen Drogen, alkoholischen Getränken, Medikamenten und Tabakwaren) IFT, Institut für Therapieforschung, München 4055 Soziale Ungleichheit, Krankheit und Gesundheit (SUKUG) 1999-2000 C. Wolf, Institut für Angewandte Sozialforschung, Universität zu Köln Freizeit 3442 Außenrepräsentanz von Museen 1999 G. Wersig, P. Schuck-Wersig, Institut für Publizistik- und Kommunikationswissenschaft Freie Universität Berlin 3349 Reiseanalyse 1998 Forschungsgemeinschaft Urlaub und Reisen, Hamburg 162 ZA-Information 56 Die Nutzung der ALLBUS-Daten in Publikationen der Jahre 1980 - 2004 Die Allgemeine Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS) dient der Erhebung aktueller Daten über Einstellungen, Verhaltensweisen und Sozialstruktur der Bevölkerung in der Bundesrepublik Deutschland. Seit 1980 wird alle zwei Jahre ein repräsentativer Querschnitt der Bevölkerung mit einem teils stetigen, teils variablen Fragenprogramm befragt. Der ALLBUS ist ein Infrastrukturprojekt, insbesondere für die deutsche Sozialwissenschaft. Deshalb ist es wichtig, Informationen über die Nutzung und den Erfolg des ALLBUS-Programms der Profession bereitzustellen. Hierfür kann einerseits die Nachfrage bzw. die Weitergabe der Daten bzw. Studienmaterialien (siehe Terwey 2003, KVI 2001: 187, Klein 2002: 119), andererseits aber auch die Nutzung der ALLBUS-Daten in Publikationen (siehe auch Terwey 1998, Terwey 2003, Koch und Wasmer 2004) analysiert werden. Im Folgenden soll letzteres näher betrachtet werden. Aufschluss über die Nutzung in Publikationen bietet die ALLBUSBibliographie. Diese dokumentiert Arbeiten mit ALLBUS-Daten, die in Büchern oder Fachzeitschriften veröffentlicht sind oder uns als „graue Literatur“ (in Form von Arbeitsberichten, Diplom- oder Magisterarbeiten usw.) vorliegen.1 Als ein Indikator soll zunächst die Häufigkeit der Verwendung von ALLBUS-Daten in Publikationen betrachtet werden. In der aktuellen Fassung der ALLBUSBibliographie (Stand: 31.12.2004) sind insgesamt 1266 wissenschaftliche Arbeiten verzeichnet2 (vgl. Abbildung 1), wobei allerdings von einer nicht unbeträchtlichen Dunkelziffer auszugehen ist, da bedauerlicherweise die AutorInnen ihre Veröffentlichungen unter Verwendung von ALLBUS-Daten nur in Ausnahmefällen unaufgefordert an das Zentralarchiv bzw. an ZUMA melden.3 Der Abbildung ist weiter zu 1 Die ALLBUS-Bibliographie kann in der jeweils aktuellen Fassung von unserer Homepage abge- rufen werden (http://www.zuma-mannheim.de/data/allbus/biblio.htm). Darüber hinaus bieten wir eine Online-Recherche in der aktuellen Version der Bibliographie (http://www.zuma-mannheim. de/data/allbus/bibrech.htm) an. 2 An dieser Stelle wird eine geringere Fallzahl als in Terwey (2003) berichtet, da wir nur Einträge auswerten, für die die in diesem Beitrag benötigten Informationen vorliegen. 3 Die überwiegende Mehrzahl der Einträge in der ALLBUS-Bibliographie wird vom Zentralarchiv bzw. der ALLBUS-Abteilung bei ZUMA durch Recherchen in Datenbanken, Zeitschriften, Sammelbänden, etc. ermittelt. ZA-Information 56 163 entnehmen, dass die Zahl der Veröffentlichungen mit ALLBUS-Daten über die Zeit stark zugenommen hat. Auch die Anzahl der Beiträge pro Jahr nimmt zu. Für die Jahrgänge ab 2000 ist zwar bislang eine leicht abnehmende Tendenz zu verzeichnen, diese ist aber dem Verzug bei der Recherche bzw. bei der Bereitstellung der Arbeiten geschuldet.4 Abbildung 1 Kumulierte Anzahl der in der ALLBUS-Bibliographie dokumentierten Veröffentlichungen mit ALLBUS-Daten, getrennt nach Publikationsform und Erscheinungsjahr 1400 1200 1000 M onographie Buchbeitrag 800 Fachzeitschrift (Arbeits-)Bericht 600 Qualifikationsarbeit Vortrag 400 200 04 20 20 02 00 20 98 19 96 19 94 19 92 19 90 19 88 19 19 86 84 19 82 19 19 80 0 Unterscheidet man die Einträge nach Publikationsform, so ist zu konstatieren, dass die meisten Beiträge in Fachzeitschriften erschienen sind (415), am zweithäufigsten handelt es sich bei den Einträgen um Beiträge in (Fach-)Büchern (403). Insgesamt machen die Artikel in den Fachzeitschriften und die Buchbeiträge ca. 65% der Einträge aus. Weniger häufig wird der ALLBUS dagegen in Monographien und Arbeitsberichten verwendet. Wir gehen aber davon aus, dass gerade bei diesen Publikationsformen die Dunkelziffer besonders hoch ist. Der Abbildung ist auch die wichtige Rolle des ALLBUS für Lehre und Studium zu entnehmen. Mehr als 102 Qualifika- 4 Ein Beispiel soll die Größenordnung dieser Verzögerung verdeutlichen: Während in der 16. Fas- sung der ALLBUS-Bibliographie (Stand 1.6.2000) für den Zeitraum 1980 bis 1998 insgesamt 720 Publikationen vorlagen, sind dies für den gleichen Zeitraum in der 20. Fassung (Stand 31.12.2004) mit 799 deutlich mehr Einträge. 164 ZA-Information 56 tionsarbeiten sind in der aktuellen ALLBUS-Bibliographie (Stand 31.12. 2004) dokumentiert.5 Betrachtet man die drei wichtigsten „reviewed journals“ der deutschen Soziologie (vgl. Lüschen 1979, Pötschke und Simonson 2003: 78) – die Kölner Zeitschrift für Soziologie und Sozialpsychologie, die Soziale Welt und die Zeitschrift für Soziologie – näher, so ergibt sich folgendes Bild (siehe Tabelle 1). Tabelle 1 Anzahl der empirischen Beiträge und Anzahl der Beiträge mit ALLBUSDaten in der Kölner Zeitschrift für Soziologie und Sozialpsychologie, der Sozialen Welt und der Zeitschrift für Soziologie der Jahre 2000-2004 2000 Anzahl Beiträge, in denen Daten verwendet wurden 40 Beiträge mit ALLBUSDaten 6 2001 39 6 2002 35 4 2003 37 8 2004 44 4 Summe 195 28 Jahrgang In den Jahrgängen 2000 bis 2004 sind in den drei Zeitschriften insgesamt 28 Beiträge erschienen, die unter Verwendung von ALLBUS-Daten entstanden sind. Von uns wurde dabei jeder Beitrag gezählt, aus dem ersichtlich ist, dass Daten des ALLBUS ausgewertet wurden. Dabei variierte selbstverständlich die „Nutzungsintensität“ der Daten. Auf der einen Seite gibt es Beiträge, in denen die Daten die zentrale Grundlage des Beitrags bilden bzw. in denen eine große Anzahl an Variablen untersucht wird. Auf der anderen Seite werden in manchen Beiträgen die Daten lediglich für eine Häufigkeitsauszählung verwendet.6 Nach unseren Auszählungen der drei 5 Auch in Methoden- und Statistiklehrbüchern (vgl. z.B. Kühnel und Krebs 2001; Wittenberg und Cramer 2000; Gehring und Weins 2000) findet der ALLBUS Verwendung. Die Bedeutung für die Lehre zeigte sich auch bei einer Internetrecherche im Jahr 2003. Es wurden für das Wintersemester 2002 und das Sommersemester 2003 insgesamt 71 Methoden- und Statistikveranstaltungen an Universitäten und Fachhochschulen im Internet recherchiert, in denen der ALLBUS verwendet wurde. 6 An dieser Stelle sei angeführt, dass wir bei unserer Auszählung auf ein anderes Ergebnis kom- men als Pötschke und Simonson (vgl. Pötschke und Simonson 2003: 88, Tabelle 7). Dort wurden für die Jahrgänge 2000 und 2001 insgesamt 4 Arbeiten mit ALLBUS-Daten ausgewiesen. In unseren Auszählungen kommen wir auf insgesamt 12 Beiträge (siehe Tabelle 1). Vermutlich ZA-Information 56 165 deutschsprachigen Fachzeitschriften sind die ALLBUS-Daten neben denen des SOEP diejenigen, die mit Abstand am häufigsten in Beiträgen dieser Fachzeitschriften genutzt werden. Was die Inhalte angeht, spiegelt sich in den Veröffentlichungen die ganze Bandbreite des ALLBUS-Fragenprogramms wider. Ein Schwerpunkt ist bei Untersuchungen zum Wandel von Einstellungen und Werten zu erkennen. Auch andere Variablen des ALLBUS, wie Verhaltensindikatoren oder sozialstrukturelle Merkmale, finden in den Veröffentlichungen Verwendung. In Querschnittsanalysen sind der ALLBUS 1991 (Sonderstudie zur deutschen Wiedervereinigung) und der ALLBUS 1996 (Thema: Einstellungen gegenüber ethnischen Gruppen in Deutschland) am häufigsten verwendet worden. Der ALLBUS wird zudem nicht nur zur inhaltlichen Forschung genutzt, sondern auch in der methodischen Forschung. Ein Hauptzweck des ALLBUS ist die Nutzung für zeitvergleichende Analysen. Als quantitativen Indikator für die Auswertung von ALLBUS-Zeitreihen ziehen wir die Häufigkeit heran, mit der der kumulierte ALLBUS bzw. zwei oder mehr einzelne ALLBUS-Erhebungen in den Publikationen der ALLBUS-Bibliographie verwendet wurden.7 Abbildung 2 zeigt, dass in den Anfangsjahren des ALLBUS nur eine kleine Minderheit der Veröffentlichungen auf zwei oder mehr Einzeldatensätze zurückgreift (der erste kumulierte Datensatz mit den Daten der Erhebungen 1980, 1982 und 1984 wurde vom Zentralarchiv 1985 erstellt). Seit den 90er Jahren nimmt die Anzahl der Arbeiten, die mehr als einen Datensatz verwenden, und damit vermutlich auch der Anteil der längsschnittlichen Auswertungen sehr stark zu. spielen unterschiedliche Kriterien bei der Einschätzung der Verwendung von Daten eine Rolle für diese Differenz. 7 Selbstverständlich kann auch der kumulierte ALLBUS im Querschnitt ausgewertet werden, in- dem z.B. die gepoolten Daten zur Analyse kleiner Subgruppen verwendet werden. Ebenso ist es möglich, dass zwei Einzeldatensätze genutzt werden, weil die interessierenden Fragen jeweils nur in einem Datensatz enthalten sind. Der verwendete Indikator stellt damit eine obere Grenze für die Nutzung ALLBUS-interner Zeitreihen dar. Die Durchsicht der 88 Artikel aus den Jahren 2000 bis 2002, in denen entweder der kumulierte ALLBUS oder zwei oder mehr Einzeldatensätze verwendet wurden, ergab, dass bei den so abgegrenzten Publikationen die zeitvergleichenden Analysen tatsächlich weit überwiegen: 66 (75%) der 88 Publikationen haben mit den ALLBUSDaten längsschnittliche Fragestellungen bearbeitet. Andererseits wird der ALLBUS unter Umständen auch, wenn nur auf einen Datensatz zurückgegriffen wird, für zeitvergleichende Analysen verwendet, nämlich dann wenn der ALLBUS mit anderen Studien zusammen analysiert wird. 166 ZA-Information 56 Abbildung 2 Kumulierte Anzahl Beiträge in der ALLBUS-Bibliographie, getrennt nach der Anzahl der verwendeten ALLBUSDatensätze und dem Erscheinungsjahr 700 600 500 400 1 Datensatz 2 od. mehr Datensätze 300 200 100 20 04 20 02 20 00 19 98 19 96 19 94 19 92 19 90 19 88 19 86 19 84 19 82 19 80 0 Fazit Die ALLBUS-Daten finden breite Verwendung in Publikationen, und dies mit steigender Tendenz pro Jahr. Bezüglich der Anzahl der Publikationen in den hier zentral ausgezählten Fachzeitschriften können wir festhalten, dass der ALLBUS im Untersuchungszeitraum der am häufigsten genutzte Datensatz ist. In jedem ca. siebten Beitrag, in dem Daten verwendet wurden, sind Daten des ALLBUS ausgewertet worden. Im Hinblick auf das zentrale Anliegen des ALLBUS, sozialen Wandel zu erfassen und zu erforschen, ist aus den Publikationen ersichtlich, dass der Anteil der Arbeiten, die zumindest Daten aus zwei Erhebungsjahren verwenden, derzeit bei ca. 60% (Koch und Wasmer 2004: 23) liegt. ZA-Information 56 167 Zuletzt noch eine Bitte: Die ALLBUS-Bibliographie kann nur vollständig und aktuell bleiben, wenn alle Datennutzer/innen uns Kopien ihrer Veröffentlichungen zusenden. Wir bitten daher alle Nutzer, uns von jeder Forschungsarbeit, in der ALLBUS-Daten verwendet wurden, ein Belegexemplar zu überlassen oder uns zumindest in Kenntnis zu setzen. Durch die Aufnahme der Arbeit wird dazu beigetragen, dass die ALLBUSBibliographie eine interessante und vielfältige Recherchequelle bleibt, zum anderen stellt eine umfassende Dokumentation der Nutzung des ALLBUS auch eine wichtige Legitimationsbasis für die längerfristige Fortführung des Programms dar. Michael Blohm Zentrum für Umfragen, Methoden und Analysen, ZUMA Postfach 12 21 55 D-68072 Mannheim E-mail: [email protected] Literatur Gehring, Uwe W. und Cornelia Weins 2000: Grundkurs Statistik für Politologen. 2. Klein, Markus 2002: Das Zentralarchiv für Empirische Sozialforschung im Urteil von Soziologieprofessorinnen und –professoren aus Deutschland, Österreich und der Schweiz, in: ZA-Information 50: 103-129. KVI (Hg.; Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik) 2001: Wege zu einer besseren informationellen Infrastruktur, Baden-Baden: Nomos. Koch, Achim und Martina Wasmer 2004: Der ALLBUS als Instrument zur Untersuchung sozialen Wandels: Eine Zwischenbilanz nach 20 Jahren. In: Schmitt-Beck, Rüdiger, Wasmer, Martina und Koch Achim (Hrsg.:) Sozialer und politischer Wandel in Deutschland. Analysen mit ALLBUS-Daten aus zwei Jahrzehnten Kühnel, Steffen-M. und Dagmar Krebs 2001: Statistik für die Sozialwissenschaften. Grundlagen, Methoden, Anwendungen, Reinbeck bei Hamburg: Rowohlt. Lüschen, Günther 1979: Die Entwicklung der deutschen Soziologie in ihrem Fachschrifttum, in: Lüschen, Günther (Hg.): Deutsche Soziologie seit 1945. Entwicklungsrichtungen und Praxisbezug. (Sonderheft 21 der Kölner Zeitschrift für Soziologie und Sozialpsychologie) Opladen: Westdeutscher Verlag: 169-192. Pötschke, Manuela und Julia Simonson 2003: Konträr und ungenügend? Ansprüche an Inhalt und Qualität einer sozialwissenschaftlichen Methodenausbildung, ZA-Information 52: 72-92. Terwey, Michael 2003: Zum aktuellen Wandel im Zugriff auf ALLBUS-Materialien und zur ALLBUSNutzung in Publikationen, in: ZA-Information 53: 195-202. Terwey, Michael 1998: Analysen zur Verbreitung von ALLBUS, in: ZA-Information 42: 44-52. Wittenberg, Reinhard und Hans Cramer 2000: Datenanalyse mit SPSS für Windows. Handbuch für computerunterstützte Datenanalyse Band 9, Stuttgart: Lucius und Lucius. 168 ZA-Information 56 Die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder von Sylvia Zühlke, Markus Zwick, Sebastian Scharnhorst und Thomas Wende 1 Zusammenfassung In den letzten Jahren wurde in Deutschland intensiv über den Zugang der Wissenschaft zu den Mikrodaten der amtlichen Statistik diskutiert. Durch die „Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik“ (KVI) wurden dafür im Auftrag des Bundesministeriums für Bildung und Forschung verschiedene Vorschläge zur Verbesserung der Wechselwirkungen zwischen Wissenschaft und Statistik erarbeitet. Eine der zentralen institutionellen Empfehlungen dieser Kommission bestand in der möglichst raschen Einrichtung von Forschungsdatenzentren bei den öffentlichen Datenproduzenten. Diese Empfehlung wurde von der amtlichen Statistik aufgegriffen. Im Jahr 2001 hat das Statistische Bundesamt ein solches Forschungsdatenzentrum etabliert. Ein weiteres Forschungsdatenzentrum der Statistischen Landesämter wurde im März 2002 als gemeinsame Einrichtung aller Statistischen Landesämter mit 16 regionalen Standorten eingerichtet. Mit diesen Forschungsdatenzentren intensiviert die deutsche amtliche Statistik ihre bisherigen Bemühungen, Mikrodaten der amtlichen Statistik für wissenschaftliche Analysen zugänglich zu machen. Wesentliche Aufgabe der Forschungsdatenzentren ist es, die Dateninfrastruktur zu verbessern sowie den Zugang der Wissenschaft zu den Mikrodaten der amtlichen Statistik durch die Einrichtung mehrerer Zugangswege zu erleichtern. 1 Dr. Sylvia Zühlke und Sebastian Scharnhorst, Dipl.-Sozialwirt, sind in der Geschäftsstelle des Forschungsdatenzentrums der Statistischen Landesämter tätig, die im Landesamt für Datenverarbeitung und Statistik Nordrhein-Westfalen angesiedelt ist. Markus Zwick, Dipl.-Volkswirt und Thomas Wende, Dipl.-Soziologe, sind Mitarbeiter im Forschungsdatenzentrum des Statistischen Bundesamtes, www.forschungsdatenzentrum.de. Dieser Beitrag ist eine aktualisierte Fassung des erstmals in: Wirtschaft und Statistik 10/2003, S. 906 - 911, Statistisches Bundesamt, Wiesbaden veröffentlichten Artikels. ZA-Information 56 169 Abstract In Germany, an intensive discussion has been going on over the last few years on granting the scientific community access to microdata of official statistics. Commissioned by the Federal Ministry of Education and Science, the Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik (KVI - Commission to improve the informational infrastructure by co-operation of the scientific community and official statistics) developed several proposals on how to improve the interaction between the scientific community and official statistics (cf. Kommission zur Verbesserung der informationellen Infrastruktur 2000). One of the central institutional recommendations of that Commission was that research data centres be set up as soon as possible at the location of data producers. That recommendation has been taken up by official statistics. In 2001, the Federal Statistical Office established such a research data centre. Another research data centre of the statistical offices of the Länder was set up in March 2002 as a joint facility of all statistical offices of the Länder with 16 regional locations. By establishing the research data centres, German official statistics has been intensifying its efforts to make official statistical micro-data accessible for scientific analyses. The major goal of the research data centres of the Federal Statistical Office and the statistical offices of the Länder is to facilitate access to microdata of official statistics for the scientific community by establishing various ways of data use. A major prerequisite for achieving that goal is a fundamental improvement of the data infra-structure by setting up a system (centralised in terms of subject-matter) of data maintenance for selected statistics and by establishing a metadata information system. 1 Einleitung Die Komplexität des wirtschaftlichen und sozialen Wandels sowie die Fortschritte in Wissenschaft und Informationstechnik haben den Datenbedarf moderner Gesellschaften grundlegend verändert. Die zur Analyse und Gestaltung moderner Gesellschaften erforderlichen Daten müssen insbesondere Informationen über Teilgruppen der Gesellschaft liefern sowie Analysen des wirtschaftlichen und sozialen Wandels auf der Basis von Längsschnittdaten erlauben. Aufgrund des geänderten Informationsbedarfs ist die Veröffentlichung von Ergebnissen in Form von Tabellen heute nicht mehr ausreichend. Vielmehr entspricht es den methodischen und inhaltlichen Erfordernissen, statistische Daten entsprechend dem wissenschaftlichen Datenbedarf bereitzustellen. Dazu gehört auch, Zugangsmöglichkeiten zu anonymisierten und nicht anonymisierten Mikrodaten zu schaffen, mit denen differenziertere Analysen durchgeführt werden können. 170 ZA-Information 56 Vor diesem Hintergrund wurde in den letzten Jahren in Deutschland intensiv über den Zugang der Wissenschaft zu den Mikrodaten der amtlichen Statistik diskutiert. Durch die „Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik“ (KVI) wurden dafür im Auftrag des Bundesministeriums für Bildung und Forschung verschiedene Vorschläge zur Verbesserung der Wechselwirkungen zwischen Wissenschaft und Statistik erarbeitet.2 Eine der zentralen institutionellen Empfehlungen dieser Kommission bestand in der möglichst raschen Einrichtung von Forschungsdatenzentren bei den öffentlichen Datenproduzenten. Diese Empfehlung wurde von der amtlichen Statistik aufgegriffen. Im Jahr 2001 hat das Statistische Bundesamt ein solches Forschungsdatenzentrum etabliert. Ein weiteres Forschungsdatenzentrum der Statistischen Landesämter wurde im März 2002 als gemeinsame Einrichtung aller Statistischen Landesämter mit 16 regionalen Standorten eingerichtet. Mit diesen Forschungsdatenzentren intensiviert die deutsche amtliche Statistik ihre bisherigen Bemühungen, Mikrodaten der amtlichen Statistik für wissenschaftliche Analysen zugänglich zu machen. Ziel dieses Aufsatzes ist es, die neuen Formen und Wege der Nutzung amtlicher Mikrodaten, die sich aus der Einrichtung der Forschungsdatenzentren ergeben haben, vorzustellen. Hierfür folgt zunächst ein Überblick über die Entwicklung der Rahmenbedingungen für die Nutzung von Mikrodaten der amtlichen Statistik in Deutschland. Anschließend werden die Ziele und Aufgaben der Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder beschrieben sowie die unterschiedlichen Möglichkeiten der Datennutzung präsentiert, die mit den Forschungsdatenzentren angeboten werden. 2 Die Nutzung von Mikrodaten der amtlichen Statistik in Deutschland Die Nutzung von Mikrodaten der amtlichen Statistik durch die Wissenschaft wurde in Deutschland sehr stark von der Entwicklung des Gesetzes über die Statistik für Bundeszwecke (Bundesstatistikgesetz – BStatG) beeinflusst, das 1953 verabschiedet und in den Jahren 1980 und 1987 novelliert wurde. Bei der Entstehung des Bundesstatistikgesetzes wurde die Übermittlung von Mikrodaten an die Wissenschaft kaum diskutiert, so dass in der Gesetzesfassung von 1953 2 Siehe Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik (Hrsg.): Wege zu einer besseren informationellen Infrastruktur, Baden-Baden 2001. ZA-Information 56 171 hierzu noch keine explizite Regelung enthalten war. Aufgrund der fehlenden Möglichkeiten, umfangreiche Mikrodaten zu verarbeiten, war die Nachfrage nach Mikrodaten in den fünfziger, sechziger und frühen siebziger Jahren des letzten Jahrhunderts relativ gering. Sofern die Übermittlung von Einzelangaben nicht explizit in anderen Gesetzen geregelt war, wurden nur für wenige Projekte formal anonymisierte Mikrodaten3 zur Verfügung gestellt. So wurden amtliche Mikrodaten seitens der Wissenschaft erstmals in dem Projekt „Sozialpolitisches Entscheidungs- und Indikatorensystem für die Bundesrepublik Deutschland (SPES)“ analysiert, das 1972 bis 1978 durchgeführt wurde.4 Für dieses Projekt stellte die amtliche Statistik formal anonymisierte Mikrodaten des Mikrozensus und der Einkommens- und Verbrauchsstichprobe zur Verfügung. Für das gleiche Projekt wurde auch eine Stichprobe der Volkszählung 1970 (VZ70) auf der Grundlage des Volkszählungsgesetzes bereitgestellt. Als die Nachfrage nach Mikrodaten mit der Fortentwicklung der Informationstechnik schnell anstieg, wurden die allgemeinen Regelungen des im Jahr 1977 verabschiedeten Bundesdatenschutzgesetzes über die Datenübermittlung mit der Novellierung des BStatG im Jahr 1980 für den speziellen Bereich der Statistik konkretisiert und präzisiert. Der Kreis möglicher Empfänger von Einzelangaben wurde dabei an die Bestimmungen des Strafgesetzbuches über die Strafbarkeit bei Verletzung von Privatgeheimnissen angepasst. Mit der Einführung der so genannten Weiterleitungsvorschrift des § 11 Abs. 5 BStatG 1980 wurde die Absicht verfolgt, den Zugang zu den amtlichen Mikrodaten allgemein zu regeln. Diese Vorschrift sah die Weitergabe von Mikrodaten in absolut anonymisierter Form an die Nutzer vor. Bei Anwendung dieser Möglichkeit innerhalb konkreter Projekte zeigte sich allerdings, dass die Anforderungen an ein solchermaßen absolut anonymisiertes Datenmaterial so restriktiv waren, dass es in der Folgezeit nur noch zu wenigen Datennutzungen kam. Aufgrund der gesetzlichen Vorgaben des BStatG konnten für nachfolgende Projekte wie „Vergleichende Analysen der Sozialstruktur mit Massendaten“ (VASMA) oder für den Sonderforschungsbereich 3 „Mikroanalytische Grundlagen der Gesellschaftspolitik“ der Deutschen Forschungsgemeinschaft nur noch 3 Formal anonymisiert bedeutet, dass aus dem Originaldatenmaterial direkte Identifikatoren wie etwa Name, Anschrift oder Sozialversicherungsnummer gelöscht wurden, es aber darüber hinaus unverändert ist. 4 Siehe: Krupp, H.-J.: Sozialpolitisches Entscheidungs- und Indikatorensystem für die Bundesrepublik Deutschland, Allgemeines Statistisches Archiv, Band 57, 1973, S. 380 ff. 172 ZA-Information 56 absolut anonymisierte Mikrodaten zu relativ hohen Kosten zur Verfügung gestellt werden.5 Sowohl die informationelle Selbstbestimmung als auch die Wissenschaftsfreiheit sind als Grundrechte im Grundgesetz verankert. Damit ist der Gesetzgeber aufgerufen, für einen angemessenen Ausgleich dieser Grundrechte Sorge zu tragen. Bei der Novellierung des Bundesstatistikgesetzes im Jahr 1987, mit der das Recht der amtlichen Statistik an die Anforderungen des Volkszählungsurteils von 19836 angepasst werden sollte, wurde dem Rechnung getragen, als nunmehr der Wissenschaft auch Daten übermittelt werden konnten, die eine Deanonymisierung zwar nicht mit Sicherheit ausschließen, aber Betroffenen nur zugeordnet werden können, wenn der Datenempfänger einen unverhältnismäßig großen Aufwand an Zeit, Kosten und Arbeitskraft erbringen musste. Die Einführung des Begriffs der faktischen Anonymität für die Weitergabe von Mikrodaten an die Wissenschaft erlaubte es nun, im Rahmen des so genannten Wissenschaftsprivilegs unter bestimmten Voraussetzungen Mikrodaten an die Wissenschaft zu liefern, die ein Restrisiko der Deanonymisierung aufwiesen. In der Folgezeit konkretisierten verschiedene Projekte die Ausgestaltung faktisch anonymisierter Mikrodatensätze. Insbesondere die Ergebnisse des Projektes „Die faktische Anonymisierung von Mikrodaten“ erlaubten es, ab Mitte der neunziger Jahre des letzten Jahrhunderts erste standardisierte faktisch anonymisierte Mikrodatensätze für den Bereich der Haushalts- und Personenerhebungen zur Verfügung zu stellen.7 Während hierdurch und durch weitere Aktivitäten außerhalb der amtlichen Statistik8 insbesondere für sozialwissenschaftliche Fragestellungen eine neue Datenbasis geschaffen wurde, konnten im Bereich der Wirtschaftswissenschaften aufgrund der größeren Schwierigkeiten bei der Anonymisierung von Betriebs- und Unternehmensdaten zunächst keine vergleichbaren Fortschritte erzielt werden. Der fehlende Datenzugang, insbesondere zu den Unternehmens- und Betriebsdaten, wurde seitens 5 Zu den Projekten siehe Hauser, R. (Hrsg.): „Mikroanalytische Grundlagen der Gesellschaftspolitik: Ergebnisse aus dem gleichnamigen Sonderforschungsbereich“, Band 1 und 2, Berlin 1994. Die Ergebnisse des Projektes VASMA sind unter http://www.gesis.org/Dauerbeobachtung/Mikrodaten/Daten/brd/literatur.pdf dokumentiert. 6 BVerfGE 65, 1. 7 Siehe hierzu insbesondere Müller, W.; Blien, U.; Knoche, P.; Wirth, H. u. a.: Die faktische Anonymität von Mikrodaten, Band 19 der Schriftenreihe „Forum der Bundesstatistik“, Statistisches Bundesamt (Hrsg.), Wiesbaden 1991. 8 Außerhalb der amtlichen Statistik haben sich insbesondere mit dem Sozio-oekonomischen Panel (SOEP) und der „Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS)“ Erhebungen etabliert, die regelmäßig durchgeführt werden und für wissenschaftliche Analysezwecke zur Verfügung stehen. ZA-Information 56 173 der Wissenschaft in dem Memorandum „Erfolgsbedingungen empirischer Wirtschaftsforschung und empirisch gestützter wirtschafts- und sozialpolitischer Beratung“9 aufgegriffen. Hierin wurde gefordert, den Zugang zu schwer anonymisierbaren Mikrodaten innerhalb der Räumlichkeiten der Datenproduzenten zu ermöglichen. Die Diskussion über den Mikrodatenzugang der Wissenschaft gewann mit dem Memorandum sowie dem Symposium „Kooperation zwischen Wissenschaft und amtlicher Statistik – Praxis und Perspektiven“10 im Jahr 1999 eine neue Dynamik, die auch von der Politik aufgegriffen wurde. In der Folge erarbeitete die „Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik“ (KVI) eine Reihe von Empfehlungen zur Verbesserung der Kooperation von Wissenschaft und Statistik. Diese reichen von der Mitwirkung der Datennutzer bei der Aufstellung der Erhebungsund Aufbereitungsprogramme über die Perspektiven einer modernen Aus- und Weiterbildung in der Statistik bis zu den verschiedenen Möglichkeiten für den Zugang der Wissenschaft zu den Mikrodaten der öffentlichen Datenproduzenten. Eine wesentliche institutionelle Forderung bezieht sich auf die Einrichtung von Forschungsdatenzentren bei den Datenproduzenten und auf die Einrichtung von Servicezentren. Derzeit werden die Empfehlungen der Kommission zur Verbesserung der informationellen Infrastruktur vom Rat für Sozial- und Wirtschaftsdaten umgesetzt. Eine Reihe von Forschungsdatenzentren und Servicezentren konnten ihre Arbeit bereits aufnehmen.11 Hierzu zählen auch die beiden Forschungsdatenzentren der amtlichen Statistik. Zwar sind diese zwei voneinander unabhängige Einrichtungen, gleichwohl stimmen sie ihre Arbeit eng untereinander ab, um der Wissenschaft ein nutzungsgerechtes Angebot für einen verbesserten Datenzugang zu unterbreiten. Den Empfehlungen der KVI folgend, nach denen die Einrichtung einer leistungsfähigen Dateninfrastruktur eine Aufgabe der Forschungsförderung ist, haben sowohl das Statistische Bundesamt als auch die Statistischen Landesämter für ihr Projekt einen Förderantrag 9 Siehe Hauser, R.; Wagner, G.; Zimmermann, K.-F.: Erfolgsbedingungen empirischer Wirtschaftsforschung und empirisch gestützter wirtschafts- und sozialpolitischer Beratung: Ein Memorandum, Allgemeines Statistisches Archiv, Band 82, 1998, S. 369 ff. 10 Die Ergebnisse des Symposiums sind dokumentiert in Müller, W.; Schimpl-Neimanns, B.; Krupp, H.-J.; Wiegert, R. u. a.: Kooperation zwischen Wissenschaft und amtlicher Statistik – Praxis und Perspektiven, Band 34 der Schriftenreihe „Forum der Bundesstatistik“, Statistisches Bundesamt (Hrsg.), Wiesbaden 1999. 11 Für einen Überblick siehe Lüttinger, P.; Schimpl-Neimanns, B.; Wirth, H. und Papastefanou, G.: Mikrodaten (German Microdata Lab): Das Servicezentrum für amtliche Mikrodaten bei ZUMA, ZUMA Nachrichten Nr. 52, 2003, S. 153 ff. 174 ZA-Information 56 beim Bundesministerium für Bildung und Forschung gestellt. Mit Hilfe dieser Mittel soll die Infrastruktur für ein umfangreiches Dienstleistungs- und Datenangebot geschaffen werden. 3 Ziele und Aufgaben der Forschungsdatenzentren Das wesentliche Ziel der Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder besteht darin, den Zugang der Wissenschaft zu den Mikrodaten der amtlichen Statistik durch die Einrichtung unterschiedlicher Datennutzungswege zu erleichtern. Eine wesentliche Voraussetzung für die Erreichung dieses Ziels besteht in der grundsätzlichen Verbesserung der Dateninfrastruktur durch den Aufbau einer fachlich zentralisierten Datenhaltung für ausgewählte Statistiken und durch die Einrichtung eines Metadateninformationssystems. In Deutschland wird der überwiegende Teil der Statistiken dezentral in den Statistischen Landesämtern durchgeführt, so dass dort über 90 % aller Mikrodaten der amtlichen Statistik erhoben, aufbereitet und gespeichert werden. Da sich wissenschaftliche Analysen in der Regel jedoch auf mehrere Bundesländer oder das gesamte Bundesgebiet beziehen, bauen die Statistischen Landesämter eine fachlich zentralisierte Datenhaltung auf. Hierdurch wird es möglich, die Mikrodaten der amtlichen Statistik länderübergreifend an allen regionalen Standorten der Forschungsdatenzentren zu nutzen. Damit wissenschaftliche Nutzer die Mikrodaten der amtlichen Statistik analysieren und interpretieren können, benötigen sie zudem umfassende Informationen über die Datensätze sowie über die Erhebung, die Aufbereitung und die Qualität der Daten. Hierfür werden die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder ein internetbasiertes Metadateninformationssystem entwickeln, in dem sich die Nutzer über die Erhebungen der amtlichen Statistik informieren können. 4 Datennutzungswege Um der Wissenschaft den Zugang zum gesamten Informationspotenzial der amtlichen Statistik zu öffnen, haben die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder unterschiedliche Zugangswege zur Nutzung ihrer Mikrodaten eingerichtet. Damit werden den Nutzern zusätzliche und weitergehende Möglichkeiten zur Analyse von Mikrodaten der amtlichen Statistik eröffnet, als dies bislang möglich war. ZA-Information 56 175 Ansatzpunkt dieser zusätzlichen Nutzungswege ist es, die Vermeidung einer Reidentifikation der Auskunftgebenden nicht mehr allein durch Veränderungen im Datenmaterial sicherzustellen, sondern auch durch die Regulierung des Datenzugriffs. Die einzelnen Nutzungswege resultieren daher aus verschiedenen Kombinationen von Datenanonymisierung und Zugriffsregulierung. 4.1 Absolut anonymisierte Mikrodatensätze Absolut anonymisierte Daten werden durch Aggregation oder durch die Entfernung einzelner Merkmale so weit verändert, dass eine Identifizierung der Auskunftgebenden nach menschlichem Ermessen unmöglich gemacht wird. Die amtliche Statistik bietet absolut anonymisierte Mikrodaten in Form so genannter Public Use Files (PUF) an. Diese können allen interessierten Personen zur Verfügung gestellt werden. Bislang wurden solche Datensätze für die Sozialhilfestatistik sowie für die Zeitbudgeterhebung erstellt. Die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder arbeiten verstärkt an einer Ausweitung dieses Angebotes. Eine weitere Hauptzielrichtung der Public Use Files liegt im Bereich der Hochschullehre. Die Forschungsdatenzentren entwickeln derzeit so genannte Campus-Files, die an Hochschulen zu Lehrzwecken eingesetzt werden können. Diese Datensätze sollen Studentinnen und Studenten schon frühzeitig die Möglichkeit bieten, die Besonderheiten der Analyse von amtlichen Mikrodaten kennen zu lernen. Erste Campusfiles liegen für den Mikrozensus, die Sozialhilfestatistik und die Kostenstrukturerhebung vor. 4.2 Faktisch anonymisierte Mikrodatensätze Eine absolute Datenanonymisierung birgt den Nachteil, dass damit auch ein erheblicher Teil der statistischen Information verloren geht. Dagegen werden Mikrodaten als faktisch anonym bezeichnet, wenn die Deanonymisierung zwar nicht gänzlich ausgeschlossen werden kann, die Angaben jedoch nur mit einem unverhältnismäßig hohen Aufwand an Zeit, Kosten und Arbeitskraft dem jeweiligen Merkmalsträger zugeordnet werden können.12 Nach Maßgabe des Bundesstatistikgesetzes können faktisch anonymisierte Daten allerdings nur wissenschaftlichen Einrichtungen und nur zur Durchführung wissenschaftlicher Vorhaben zugänglich gemacht werden. 12 Diese Regelung geht zurück auf den § 16 Abs. 6 BStatG. 176 ZA-Information 56 Die Hauptzielrichtung der faktischen Anonymisierung besteht darin, durch behutsame Informationsreduktion und Informationsveränderungen die Zuordnungsmöglichkeiten von Merkmalsausprägungen zu den entsprechenden Merkmalsträgern zu verringern, dabei jedoch den statistischen Informationsgehalt zu schonen. Hierfür müssen für jede einzelne Erhebung der Aufwand und der Nutzen einer Deanonymisierung analysiert werden. Dabei können unterschiedliche Anonymisierungsverfahren zur Anwendung kommen.13 Faktische Anonymität resultiert allerdings nicht allein aus dem realen Informationsgehalt der Daten, sondern auch aus den bestehenden Möglichkeiten zur Deanonymisierung. Wann ein Mikrodatensatz als faktisch anonym bezeichnet werden kann, hängt daher insbesondere davon ab, unter welchen Rahmenbedingungen die Daten verarbeitet werden. So ist von entscheidender Bedeutung, welches Zusatzwissen vorliegt und wo die Datennutzung stattfindet. Abhängig davon, ob die Mikrodaten extern oder in den statistischen Ämtern genutzt werden, kann die faktische Anonymität mit mehr oder minder starken Informationseinbußen erreicht werden. Ein immer wieder deutlich vorgetragener Wunsch der Wissenschaft ist es, Mikrodaten in anonymisierter Form am eigenen Arbeitsplatz zu nutzen. Die faktische Anonymisierung der Mikrodaten ermöglicht diese Übermittlung nicht vollständig anonymisierter Mikrodaten zur externen (Off-Site-)Nutzung in wissenschaftlichen Einrichtungen. Da jedoch allein durch die Herausgabe dieser Daten ein höheres Deanonymisierungsrisiko besteht als bei der Nutzung in einem statistischen Amt, ist die Datenanonymisierung relativ stark ausgeprägt. Die für diese Nutzungsform erzeugten Datensätze werden als Scientific Use Files (SUF) bezeichnet. Die amtliche Statistik bietet im Bereich der personenbezogenen Daten mit dem Mikrozensus, der Einkommens- und Verbrauchsstichprobe, der Zeitbudgeterhebung sowie der Lohn- und Einkommensteuerstatistik bereits ein breites Datenspektrum als Scientific Use Files an. Im Rahmen des Projektes „Faktische Anonymisierung wirtschaftsstatistischer Einzeldaten“ sind darüber hinaus erste Scientific Use Files für wirtschaftsstatistische Einzeldaten entwickelt worden, und zwar für die Einzelhandelsstatistik, die Umsatzsteuerstatistik sowie die Kostenstrukturerhebung.14 13 Ein Überblick über Anonymisierungsmethoden ist zu finden in: Köhler, S.: Anonymisierung von Mikrodaten in der Bundesrepublik und ihre Nutzung – Ein Überblick in Band 31 der Schriftenreihe Forum der Bundesstatistik, Statistisches Bundesamt (Hrsg.), 1999, S. 133 ff. 14 Siehe hierzu Sturm, R.: Wirtschaftsstatistische Einzeldaten für die Wissenschaft. In: WiSta 2/ 2002, S. 101 ff, Lenz, R.; Vorgrimler, Dr. und Rosemann, M.: Ein Scientific-Use-File der Kostenstrukturerhebung im Verarbeitenden Gewerbe in WiSta 2/2005, S. 91ff., Scheffler, M.: Ein Scientific-Use-File der Einzelhandelsstatistik 1999 in WiSta 3/2005, S.197ff., Vorgrimler, Dr.; ZA-Information 56 177 Die Forschungsdatenzentren des Bundes und der Länder sind bestrebt, das Angebot an Scientific Use Files sukzessive zu erweitern. So laufen zurzeit Projekte zur Anonymisierung der Gehalts- und Lohnstrukturerhebung sowie der Diagnosestatistik. 4.3 Projektbezogene faktische Anonymisierung zur On-Site-Nutzung Bei geringer Nachfrage nach einzelnen Statistiken und bei schwer zu anonymisierenden Mikrodaten wird es in vielen Fällen nicht sinnvoll sein, in einem aufwändigen Verfahren standardisierte Scientific Use Files zu erstellen. Hier ist eine projektbezogene Anonymisierung der Daten sinnvoller. Dies hat den praktischen Vorteil, dass dabei nicht die gesamten Ergebnisse einer Statistik anonymisiert werden, sondern lediglich die daraus benötigten Merkmale. Die projektbezogene Anonymisierung erzeugt ebenfalls eine faktische Datenanonymität. Diese Daten können jedoch nur in den Räumlichkeiten der Forschungsdatenzentren des Bundes und der Länder an so genannten Gastwissenschaftlerarbeitsplätzen ausgewertet werden. Da die Mikrodaten dabei in den Räumlichkeiten der amtlichen Statistik verbleiben und kaum mit Zusatzinformationen kombiniert werden können, hat diese Nutzungsform einen weiteren wesentlichen Vorteil: Faktische Anonymität wird hier bereits bei wesentlich geringeren Veränderungen im Datenmaterial erreicht als bei der Erstellung von Scientific Use Files für die Off-Site-Nutzung und folglich verbleiben mehr Informationen im Datenmaterial. Um die Attraktivität dieser so genannten On-Site-Nutzung von Mikrodaten zusätzlich zu erhöhen und die regionale Erreichbarkeit dieser Nutzungsform zu gewährleisten, haben die Forschungsdatenzentren Gastwissenschaftlerarbeitsplätze in allen 19 regionalen Standorten eingerichtet. An diesen Arbeitsplätzen können die Daten mit gängigen statistischen Analyseprogrammen (SAS, SPSS, teilweise STATA) ausgewertet werden. Dittrich, S.; Lenz, R. und Rosemann M.: Ein Scientific-Use-File der Umsatzsteuerstatistik 2000 in WiSta 3/2005, S. 201ff. 178 ZA-Information 56 4.4 Nutzung amtlicher Mikrodaten durch kontrollierte Datenfernverarbeitung Die Datennutzung via Datenfernverarbeitung ist eine relativ neue Entwicklung, deren Bedeutung in der Zukunft zunehmen wird.15 Mit diesem Verfahren ist es der Wissenschaft möglich, das Informationspotenzial von nur formal anonymisiertem Mikrodatenmaterial zu nutzen, ohne jedoch selbst direkten Zugriff auf diese Daten zu haben. Die Wissenschaftler entwickeln dabei Auswertungsprogramme (SyntaxSkripte), die dann von den Mitarbeitern der Forschungsdatenzentren an den Originaldaten angewendet werden. Diese Datendienstleistung wird zurzeit in den Programmen SPSS, SAS und STATA angeboten. Die Datenfernverarbeitung ist im Gegensatz zu den Scientific Use Files nicht auf einen bestimmten Personenkreis beschränkt und bietet daher auch für ausländische Wissenschaftler und für den nichtwissenschaftlichen Interessentenkreis eine Möglichkeit, Mikrodaten der amtlichen Statistik zu nutzen. Zur praktikablen Anwendung der Datenfernverarbeitung stellen die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder Datenstrukturfiles zur Verfügung, die es den Nutzern ermöglichen, ihre Auswertungsprogramme auf die Struktur der Originaldaten abzustimmen. Diese Datenstrukturfiles geben die Datenstruktur des originären Datensatzes wieder, ohne inhaltliche Informationen zu transportieren. Das Material ist also in der Merkmalsstruktur, Anzahl der Satzstellen und Datensatzlänge identisch mit dem Originalmaterial. Durch ein technisches Verfahren sind die Daten aber so verfälscht, dass nur noch synthetische inhaltsleere Datensätze zur Verfügung stehen. Zurzeit stehen solche Datenstrukturfiles für die Mikrodaten des Mikrozensus, der Gehalts- und Lohnstrukturerhebung und der Lohnund Einkommensteuerstatistik zur Verfügung. Derzeit ist die Datenfernverarbeitung ein relativ arbeitsaufwändiges Verfahren, da die Programmsyntax vorab auf Deanonymisierungsstrategien und der Datenoutput anschließend auf Geheimhaltungsfälle überprüft werden müssen. Bislang werden diese Schritte noch manuell durchgeführt. Zwar liegen mittlerweile auch erste automatisierte Verfahren für diese Prüfungen vor, jedoch ist auch mit diesen Lösungsansätzen derzeit noch keine vollständige Automatisierung der Datenfernverarbeitung möglich. 15 Erste Erfahrungen wurden hier im Bereich der Steuerstatistiken gesammelt. Siehe hierzu Zwick, M.: Steuerstatistische Einzeldaten und ihre Auswertungsmöglichkeiten für die Wissenschaft. Allgemeines Statistisches Archiv, Band 83, 1999, S. 248 ff. ZA-Information 56 179 Ein wesentliches Ziel der Forschungsdatenzentren besteht daher darin, Verfahren zu entwickeln, die eine stärkere Automatisierung der Datenfernverarbeitung erlauben. Ansatzpunkte hierfür bieten insbesondere die LIS/LES-Datenbank sowie das in Dänemark praktizierte Verfahren einer Online-Datenverarbeitung.16 Die LIS/LESDatenbank erlaubt den direkten Datenzugriff auf die Mikrodaten der Luxembourg Income Study/Luxembourg Employment Study über das Internet.17 Über die Angabe eines projektbezogenen Passworts können durch die Übermittlung von SAS-, SPSSoder STATA-Files automatisch Datenauswertungen gestartet werden. LIS/LES ist so ausgestaltet, dass auch eine begrenzte Syntax- und Ergebnisüberprüfung erfolgt. Das dänische Modell sieht hingegen vor, dass Wissenschaftler direkt von ihrem Arbeitsplatz aus auf einen Server zugreifen können, der vom statistischen Amt für Forschungszwecke eingerichtet und gepflegt wird.18 Die Wissenschaftler erhalten hierzu Zugriff auf ein Verzeichnis, in dem nur die Daten abgelegt sind, die sie für ihr Forschungsvorhaben benötigen. Die Daten können von den Wissenschaftlern in ein für sie angelegtes Arbeitsverzeichnis kopiert werden; von dort werden auch die Analysen durchgeführt. Die Ergebnisse werden automatisch per E-Mail versendet. Der gesamte Prozess der Datenverarbeitung kann von dem statistischen Amt jederzeit daraufhin überprüft werden, ob die vertraglich vereinbarten Regeln eingehalten werden. Mit den Gastwissenschaftlerarbeitsplätzen und der Datenfernverarbeitung stehen der Wissenschaft, neben den Scientific Use Files, zwei weitere Möglichkeiten für den Zugang zu Mikrodaten der amtlichen Statistik offen. Diese können auch miteinander kombiniert werden. Unabhängig davon, welche Möglichkeit des Datenzugangs gewählt wird, unterliegt die Datenbereitstellung, abgesehen von den Public Use Files, allerdings einer Zweckbindung. Dies bedeutet, dass die Mikrodaten nicht für allgemeine Forschungszwecke zur Verfügung gestellt werden können, sondern nur für ein definiertes und zeitlich begrenztes Forschungsvorhaben. 16 Darüber hinaus bietet das Programm τ-ARGUS die Möglichkeit, Ergebnisse, die in Form von Tabellen vorliegen, maschinell geheim zu halten. Das Programm wurde vom Statistischen Zentralamt der Niederlande für Eurostat entwickelt und für die tabellenübergreifende Geheimhaltung vom Landesamt für Datenverarbeitung und Statistik Nordrhein-Westfalen erweitert. Es wird zurzeit in Deutschland ausführlich getestet. 17 Siehe hierzu ausführlich Smeeding, T. M.; Jesuit, D. K und Alkemade, P.: The LIS/LES Project Databank: Introduction and Overview. In: Schmollers Jahrbuch, Zeitschrift für Wirtschafts- und Sozialwissenschaften, 122. Jg., Heft 3, 2002, S. 497 ff 18 Das Modell wird in dem Bericht Access to Microdata beschrieben, der vom Statistischen Amt Schwedens 2003 herausgegeben wurde. 180 5 ZA-Information 56 Sonderaufbereitungen Neben den dargestellten Datennutzungswegen besteht für alle Nutzergruppen weiterhin die Möglichkeit, gegen Entgelt Sonderaufbereitungen in Auftrag zu geben. Hierbei handelt es sich um Datenauswertungen, die auf den speziellen Informationsbedarf eines bestimmten Nutzers zugeschnitten sind und nicht oder nur unzureichend mit den sonstigen Datennutzungswegen umgesetzt werden können. Im Gegensatz zur kontrollierten Datenfernverarbeitung werden die AuswertungsProgramme nicht von den Nutzern, sondern von der amtlichen Statistik erstellt. Hierzu wird der Datenbedarf im Dialog zwischen amtlicher Statistik und Nutzer soweit konkretisiert, dass ein Auswertungsprogramm erstellt werden kann. Anschließend wird das formal anonymisierte Datenmaterial mit Hilfe des entwickelten Programms in den statistischen Ämtern ausgewertet. Die Ergebnisse werden nach einer Geheimhaltungsprüfung an die Nutzer übermittelt. Die Nutzer haben hierbei keinerlei direkten Kontakt mit den Mikrodaten. 6 Datenbedarf der Wissenschaft und Nutzungspräferenzen Die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder streben an, ihr Dienstleistungsangebot dem wissenschaftlichen Bedarf entsprechend weiterzuentwickeln und befragen daher regelmäßig potenzielle Nutzer nach ihren Präferenzen. Um den konkreten Datenbedarf der Wissenschaft bei der Entwicklung des Dienstleistungsangebotes zu berücksichtigen, hat das Forschungsdatenzentrum der Statistischen Landesämter im Sommer 2002 eine Nutzerbefragung durchgeführt.19 Ziel der Umfrage war es, die potenziellen Nutzerinnen und Nutzer des künftigen Datenangebotes der Forschungsdatenzentren anzusprechen und ihren konkreten Datenbedarf zu ermitteln. Dabei konnten sich die Befragten auch zu den unterschiedlichen Nutzungsmöglichkeiten, den von ihnen eingesetzten Analyseprogrammen und ihrem Interesse an geplanten Veranstaltungen der beiden Forschungsdatenzentren äußern. Von den 700 befragten Wissenschaftlern gaben immerhin knapp 600 an, dass sie im Rahmen ihrer wissenschaftlichen Tätigkeit Mikrodaten nutzen oder zukünftig benötigen werden. Insgesamt weisen die Ergebnisse der Nutzerbefragung somit auf ein großes Interesse der Wissenschaft an der Nutzung von Mikrodaten der amtlichen Statistik hin. Da der in der Umfrage angegebene Datenbedarf fachlich sehr breit 19 Siehe hierzu ausführlich Zühlke, S. und Hetke, U.: Datenbedarf und Datenzugang: Ergebnisse der ersten Nutzerbefragung des Forschungsdatenzentrums der Statistischen Landesämter. In: Allgemeines Statistisches Archiv, Band 87, 2003, S. 321 ff. (erscheint demnächst). ZA-Information 56 181 gestreut ist, werden sich die Forschungsdatenzentren nicht auf die Bereitstellung einzelner weniger Statistiken konzentrieren können, sondern müssen mittelfristig ein breites Datenangebot bereithalten. Bezüglich der angebotenen Datennutzungswege weist die Befragung auf eine eindeutige Präferenz für die Nutzung von faktisch und absolut anonymisierten Daten am eigenen Arbeitsplatz hin, während die Arbeit an den Gastwissenschaftlerarbeitsplätzen und die kontrollierte Datenfernverarbeitung zum Befragungszeitpunkt kaum auf das Interesse der Wissenschaft stießen. Es wird jedoch nicht möglich sein, alle relevanten Erhebungen der amtlichen Statistik als anonymisierte Datensätze anzubieten. Die Forschungsdatenzentren planen daher, die Attraktivität der alternativen Nutzungswege durch deren nutzungsgerechte Ausgestaltung deutlich zu steigern. Insbesondere die Einrichtung von Gastwissenschaftlerarbeitsplätzen in allen regionalen Standorten der Forschungsdatenzentren verbessert die regionale Erreichbarkeit des Dienstleistungsangebots der amtlichen Statistik deutlich, so dass der Zugang zu den Mikrodaten wesentlich erleichtert wird. 7 Ausblick Durch die beschriebene Weiterentwicklung der Dateninfrastruktur und die Einrichtung unterschiedlicher Datennutzungswege wird die Mikrodatenbasis für wissenschaftliche Analysezwecke entscheidend verbessert. Die Diskussion um den Zugang der Wissenschaft zu dem Informationspotenzial der öffentlichen Datenproduzenten ist jedoch mit der Einrichtung von Forschungsdatenzentren bei den unterschiedlichen öffentlichen Datenproduzenten nicht abgeschlossen. Zukünftige Fragen des Datenzugangs betreffen neben grundsätzlichen Regelungen insbesondere auch die Bereitstellung international vergleichbarer Mikrodaten. Die Diskussion um eine grundsätzliche Regelung des Datenzugangs wird vom Rat für Sozial- und Wirtschaftsdaten unter dem Begriff des „Forschungsdatengeheimnisses“ geführt. Der Vorschlag des Rates sieht vor, dass Wissenschaftlerinnen und Wissenschaftler den Mitarbeiterinnen und Mitarbeitern der Datenproduzenten gleich gestellt werden und somit weitergehende Rechte zur Nutzung der Mikrodaten als bisher erhalten sollen. Gleichzeitig sollen ein Zeugnisverweigerungsrecht sowie ein Beschlagnahmeverbot den unbefugten Zugriff Dritter auf die bei den Wissenschaftlern gespeicherten Mikrodaten verhindern. 182 ZA-Information 56 Ein wesentliches Problem, Mikrodaten für die international vergleichende wissenschaftliche Forschung zu nutzen, besteht darin, dass in den einzelnen Ländern der Mikrodatenzugang sehr unterschiedlich geregelt ist.20 Dadurch ist die Heranziehung verschiedener nationaler Mikrodaten für die Wissenschaft mit einem recht hohen Aufwand verbunden. Erste Ansätze, den Datenzugang zu den Erhebungen der Europäischen Union zu vereinheitlichen, wurden mit den Verordnungen Nr. 322/97 und darauf aufbauend 831/2002 für Gemeinschaftsstatistiken unternommen.21 Mit diesen Verordnungen wird die länderübergreifende Bereitstellung von Mikrodaten der Arbeitskräftestichprobe, des Europäischen Haushaltspanels, der Erhebung über die berufliche Weiterbildung und der Innovationserhebung der Gemeinschaft angestrebt. Die Umsetzung dieser Verordnungen wird jedoch zurzeit dadurch erschwert, dass die dort vorgesehenen Regelungen teilweise noch den nationalen Regelungen in den Ländern der Europäischen Union widersprechen. Aufgrund der dargestellten Entwicklungen ist davon auszugehen, dass sich die Datenzugangsmöglichkeiten der Wissenschaft auch zukünftig weiterentwickeln werden. Die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder werden sich an diesem Prozess durch eigene Ausgestaltungsvorschläge weiterhin intensiv beteiligen. 20 Eine Darstellung der verschiedenen nationalen Ansätze zum Datenzugang findet sich in den Tagungsbeiträgen zum internationalen Workshop on Microdata vom 21./22. August 2003 unter http://www.micro2122.scb.se. 21 Verordnung (EG) Nr. 831/2002 der Kommission vom 17. Mai 2002 zur Durchführung der Verordnung (EG) Nr. 322/97 des Rates über die Gemeinschaftsstatistiken – Regelung des Zugangs zu vertraulichen Daten für wissenschaftliche Zwecke (Amtsbl. der EG Nr. L 133 vom 18. Mai 2002, S. 7 ff.). ZA-Information 56 183 European Mothers in Science - EMIS by Ingvill C. Mochmann EMIS is an interdisciplinary network for all female academics who want to pursue both scientific interests and have children. Main goals are: • increase the proportion of female academics with children in all positions at universities or research institutions • encourage female academics to pursue both family life and academic career • increase knowledge among employers about the positive qualities of academic mothers 1 Introduction Most children are born scientists. From early years on they are eager to understand and explore the world and its peculiarities: why doesn’t it snow in the summer? Why do I have to brush my teeth? How can Grandpa be in heaven when we buried him in the ground? These questions and a million similar ones are known to all parents who try to answer them more or less accurately. From a scientific point of view answering such questions in a correct way can be a real challenge as facts, paradigms or concepts do not exist in the heads of the children yet. In daily life mothers are often those left to discuss and answer these questions. In academic life discussing and answering questions are mainly left to male academics. The proportion of female academics becomes less and less the higher the positions get, although in the meantime many European countries have more female then male graduates. Looking at the proportion of mothers in science the situation is even more dramatic, in Germany for example, 40% of female academics are childless. A part of this development might be explained by individual preferences, but there is no doubt that many women who want to have children leave academic life because they consider an academic career and family life incompatible. Those wishing to pursue academic life decide against family life from the beginning or postpone the decision until it is too late. 184 ZA-Information 56 We want female academics to have a real chance to decide whether they want to become mothers or not without having to risk their academic career or neglect their scientific interests. 2 Aims of EMIS Emphasise the following aspects and many more: Most women who are interested in research don’t lose this interest just because they become mothers. Ideas, theories, solutions to problems keep running though their heads even if they feed their children, are at the playground or empty the dishwasher. Furthermore, being a mother often exposes you to situations and people you otherwise would not have been exposed to and which can open up for new thoughts. Being a scientist is a mentality, not just a job! Mothers in general are said to be highly efficient, organised and multi-tasking. Academic mothers are in addition capable of using vacant minutes to concentrate on producing scientific papers and theses or reading academic journals even if children are running around. Quantity of achieved academic output should be weighted in relation to family responsibilities! For about 15 out of 40 years of a female academic’s life children and family have to be on the top priority position, depending of course on the number of children. During this phase mothers are dependent • on clear arrangements and time schedules from the employers’ side, • on acceptance from the employer to concentrate on few tasks – mainly such relevant to their academic career – and reduce travel and conference activities to those relevant for these tasks, • on being treated as equal colleague and receive positive feedback and promotion from employers on achievements even if they become mothers and even if they work part-time. Becoming a mother does not imply becoming incompetent! ZA-Information 56 3 185 Who can become member? • Mothers in academic positions at universities or research institutions, both in science and administration • Female students, PhD-candidates, researchers etc. who would like to acquire knowledge on how to combine academic life and children • Women and men, with or without own children, in higher academic positions who would like to support female academics who want to combine science and family life. Although EMIS mainly aims at improving the position of academic mothers in research, female academics in administrative positions are often in similar difficult situations. As a change of mentality within the university system is also dependent on the mentality of administrative staff, we highly encourage academic mothers in administrative positions to join this network. 4 Future plans The first task of this network is to collect suggestions, ideas and problems from mothers in all scientific disciplines. Based on these, guidelines should be established for politics and employers. Send these to the author. Another important task would be to organise meetings at a regular basis in order to exchange experiences and intensify the network. 5 Contact If you are interested in participating or have any questions or comments, please contact: Dr. Ingvill C. Mochmann, ZA-EUROLAB Coordinator Zentralarchiv für Empirische Sozialforschung, Universität zu Köln Bachemer Str. 40, D-50931 Köln [email protected] http://www.mothersinscience.org 186 ZA-Information 56 Internationales Forschungsprojekt über die Diskriminierung und Chancengleichheit von Kriegskindern 1 von Stein Ugelvik Larsen2 und Ingvill C. Mochmann Zusätzlich zu den militärischen Konsequenzen, haben Kriege meist auch für die zivile Bevölkerung große Folgen. Folgen, die insbesondere verschwiegen werden, wenn sie daraus entstehen, dass zum Feind ein näherer persönlicher Kontakt bestand. Zwischen 1939 und 1945 wurden hunderttausende von Kindern in Europa geboren, deren Väter deutsche Soldaten sind. Die Anzahl ist unsicher; viele Frauen verschwiegen ihre Schwangerschaft oder den Kindesvater aus Angst vor Rache und Repressalien aus der Gemeinde. Geschätzt wurden zwischen 10.000 und 12.000 Kinder deutscher Soldaten in Norwegen, 6.000 in Dänemark, 40.000 in Belgien, 50.000 in den Niederlanden, 800 auf Jersey und bis zu 200.000 in Frankreich. Auch in Russland und Osteuropäischen Ländern wurden Kriegskinder geboren. Wenig ist über die Schicksale der Mütter und ihrer Kinder bekannt. Während in der Öffentlichkeit in den ersten Nachkriegsjahren die Mütter verpönt und ihre Kinder bestenfalls ignoriert wurden, herrscht seit den 1950er Jahren weitestgehend Schweigen. Neuerdings steht dieses Thema wieder auf der öffentlichen Agenda und auch die Forschung widmet sich zunehmend der Frage, was aus den Kriegskindern geworden ist (vgl. Larsen 1997, Øland 2001, Olsen 2002, Picaper 2003, Borgersrud 2004, Drolshagen 2004, Ellingsen 2004). Neben Monographien, Erzählungen und Zeitungsberichten gibt es auch Fotoausstellungen zu den Schicksalen von Kriegskindern. Akten u. a. vom norwegischen „Riksarkiv“ (Reichsarchiv) geben eine Vorstellung über das Leben der Frauen, die sich auf deutschen Soldaten eingelassen haben, und deren Kinder (Olsen 2002). Um systematische und umfangreichere Informationen über die Lebensverläufe norwegischer Kriegskinder zu bekommen, wurde 1997 eine Studie in Kooperation mit dem in 1986 gegründeten norwegischen Kriegskindverbund durchgeführt. Inzwischen ist 1 In diesem Forschungsprojekt werden als Kriegskinder, Kinder bezeichnet, die aus einer Bezie- hung zwischen einen ausländischen Soldaten, sei es von feindlichen-, alliierten- oder Friedenstruppen, und einer einheimischen Frau entstanden sind. 2 Stein Ugelvik Larsen ist Leiter des Forschungsprojektes und Professor am Institut für Vergleichende Politikwissenschaften, Universität Bergen, Norwegen ([email protected]). ZA-Information 56 187 die Untersuchung auf Kriegskinder in Dänemark und Niederlanden ausgeweitet worden. Die Umfrage wurde unter den 650 Mitgliedern des norwegischen Kriegskindverbundes (NKBF) in 1997 und knapp 400 Mitgliedern des dänischen Kriegskindverbundes (DKBF) in 2003 durchgeführt. Zusätzlich wurden ca. 50 niederländische Kriegskinder befragt. Mit 250 Fragen ist der Fragebogen sehr umfassend und beinhaltet Themen wie Sozialstruktur, Gesundheit, Wohnorte, Jugend- und Erwachsenleben, Identität, Fragen zur Mutter und zum biologischen Vater, Fragen zur eigenen Familie, sozialer Integration und Identität als Kriegskind. Die Antwortquote lag in Norwegen und Dänemark bei ca. 50%. Die Auswahl ist nicht repräsentativ für die Gruppe der Kriegskinder insgesamt, da sie sich hauptsächlich auf Mitglieder der Verbände bezieht und zu wenig über die Grundgesamtheit der Kriegskinder bekannt ist. Auch die Anzahl der Frauen in der Auswahl ist größer als die der Männer, in Norwegen 218 Frauen und 108 Männer und in Dänemark 129 Frauen und 85 Männer. Trotzdem kann davon ausgegangen werden, dass diese Daten aufgrund ihrer komparativen Orientierung, strukturierten und teilweise standardisierten Frageform, eher Ähnlichkeiten und Unterschiede zwischen Kriegskindern wiedergeben können, als Monographien und Einzelinterviews, die bis jetzt in diesem Forschungsbereich meist angewandt worden sind. Erste Ergebnisse der Untersuchung zeigen u.a. wie wichtig es für die Kriegskinder ist, die eigene biologische Identität zu kennen (Mochmann und Larsen 2005). Weitere Ergebnisse aus der Untersuchung sind in Bearbeitung. Obwohl sich die Wissenschaft zunehmend mit diesem Thema beschäftigt, sind zahlreiche Aspekte unberücksichtigt und in vielen Ländern wird dieses Thema immer noch tabuisiert. Auch wenn die direkt Betroffenen schon 60 Jahre oder älter und viele gar nicht mehr am Leben sind, kann die Forschung dazu beitragen, dass Gesellschaften in Zukunft mit dieser Problematik besser umgehen. Solange es Kriege gibt, werden auch Kriegskinder geboren, man denke nur an z.B. Korea, Vietnam, Balkan und Ruanda (vgl. War and Children Identity Project, Report 1, 2 und 3). Literatur Borgersrud, Lars: Staten og krigsbarna. En historisk undersøkelse av statsmyndigheternes behandling av krigsbarna i de første etterkrigsårene, Oslo, 2004. Drolshagen, Ebba D.: Wehrmachtskinder. Auf der Suche nach dem nie gekannten Vater, München, 2005. Ellingsen, Dag, Krigsbarns levekår. En registerbasert undersøkelse. Statistics Norway, Rapport Nr. 2004/19, Oslo, 2004. Larsen, Stein Ugelvik (Hrsg.) I krigens kjølevann, Oslo, 1999. Mochmann, Ingvill C. und Stein Ugelvik Larsen: Kriegskinder in Europa. In: Aus Politik und Zeitgeschichte, Nr. 18-19/2005, S. 34-38. Olsen, Kåre: Vater: Deutscher. Das Schicksal der norwegischen Lebensbornkinder und ihrer Mütter von 1940 bis heute, Frankfurt/M. 2002. Picaper, Jean-Paul und Ludwig Norz, Enfant maudit, Paris 2004 Øland, Arne: Horeunger og helligdage – tyskerbørns beretninger, Kopenhagen, 2001. War and Children Identity Project (WCIP): The War Children of the World Report, Report 1, 2 und 3 Bergen, 2002, 2003, 2004, http://www.warandchildren.org. 188 ZA-Information 56 Buchhinweise Baur, Nina; Fromm, Sabine (Hrsg.): Datenanalyse mit SPSS für Fortgeschrittene: Ein Arbeitsbuch. Verlag für Sozialwissenschaften: Wiesbaden, 2004; EUR 24,90 ISBN 3-531-14163-5 von Thomas Müller-Schneider1 Das von Nina Baur und Sabine Fromm herausgegebene Lehrbuch wendet sich an „fortgeschrittene Anfänger“ der sozialwissenschaftlichen Datenanalyse, die zwar über erste Kenntnisse in Methodenlehre, Statistik, Wissenschaftstheorie und im Umgang mit SPSS verfügen, aber noch kaum Erfahrung mit der eigenständigen Umsetzung von Forschungsfragen in statistische Konzepte und deren Bearbeitung mit SPSS haben. Diesem Publikum möchte das Buch – ausgehend von konkreten Fragestellungen und Forschungsproblemen – einen leicht verständlichen Einstieg in die Praxis der sozialwissenschaftliche Datenanalyse bieten. Behandelt werden vor allem typische Probleme des Datenmanagements sowie grundlegende Auswertungsstrategien der uni-, bi- und multivariaten Statistik einschließlich damit verbundener methodischer Probleme. Im ersten Teil des Buches geht es um wichtige Schritte im Forschungsprozess, die der eigentlichen Datenanalyse unmittelbar vorausgehen bzw. ihr nachgelagert sind. Sehr intensiv und präzise werden in mehreren Kapiteln Datenerfassung („Wie kommen die Daten in den Datensatz?“), Zusammenführung von Datensätzen (auch 1 Dr. Thomas Müller-Schneider ist Professor für Soziologie an der Universität Koblenz-Landau, Campus Landau, Institut für Sozialwissenschaften, Abteilung Soziologie, Thomas-Nast-Str. 44, 76829 Landau. ZA-Information 56 189 verschiedener Analyseebenen), Techniken der Plausibilitätskontrolle, Fehlerdiagnose und Datenbereinigung sowie die Konstruktion neuer Variablen (u.a. komplexe Typenvariablen) behandelt. Zwei anschließende Kapitel widmen sich der Gestaltung von Tabellen und Grafiken mit SPSS sowie der Präsentation statistischer Ergebnisse. Hervorzuheben ist ein weiteres Kapitel, das auf nützliche Software aus verschiedenen Anwendungsbereichen und insbesondere auf immer wichtiger werdende Fundstellen für sekundäranalytisch auswertbare Datensätze hinweist. Im Mittelpunkt des zweiten Teils steht dann die Umsetzung statistischer Konzepte in SPSS. Das Themenspektrum der einzelnen Kapitel umfasst das Informationspotenzial eindimensionaler Häufigkeitsverteilungen, die Auswertung von Kreuztabellen bzw. Kontingenzanalyse, umfangreiche und wichtige Erläuterungen zum Ordinalskalenproblem, die Drittvariablenkontrolle für bivariate Beziehungen (Partialzusammenhänge), die Faktorenanalyse (auch klassische Testtheorie) und die multiple Regressionsanalyse. Das Grundkonzept des Buchs besteht darin, forschungspraktisch relevantes Wissen, das in anderen Lehrbüchern häufig viel zu kurz kommt, auf ineinander greifenden und sich ergänzenden Wegen zu vermitteln. Die behandelten Inhalte werden anhand „realer“ Datensätze verschiedener an der Universität Bamberg durchgeführten Lehrforschungsprojekte (z.B. „Lebensläufe im Wandel. Vergleich dreier Geburtskohorten hinsichtlich Ausbildung, Familienverlauf, Freizeit, Einstellungen) eingehend erarbeitet und veranschaulicht. Durchgehend werden die verwendete SPSS-Syntax und die dazugehörige SPSS-Ausgabe dokumentiert und vor dem Hintergrund der jeweiligen Problemstellung erläutert. Die analysierten Datensätze finden sich auf einer beiliegenden CD-ROM, so dass die betreffenden Prozeduren und Ergebnisse in „Eigenregie“ auch unmittelbar nachvollzogen werden können. Die CD-Rom enthält auch eine umfangreiche – und im Lehrbetrieb bereits erfolgreich eingesetzte – Aufgabensammlung, die genau auf die Lehrinhalte abgestimmt ist. Ausführliche Musterlösungen bieten zudem eine effektive Lernkontrolle. Das vorgelegte Buch ist ein gelungenes Beispiel einer noch viel zu wenig verbreiteten Gattung von Lehrbüchern der Datenanalyse, der es darauf ankommt den primär an statistischen Kriterien ausgerichteten Denkhorizont zu überwinden und die zu vermittelnden Verfahren sowohl in den forschungspraktischen als auch in den methodologischen Kontext der Sozialwissenschaften einzubetten. Diese Einbettung wird beispielsweise bei der Behandlung der Faktorenanalyse sichtbar. Methodologisch wird sie auf die Erkennung von Dispositionsvariablen bezogen, die aber nur scheinbar – weil vom Verfahren erzwungen – statistisch unabhängig sind. Um die einzelnen Dimensionen bestmöglich zu messen und die „natürlichen“ Korrelationsverhältnisse wiederzugeben, wird ein besserer Weg als die oblique Rotation 190 ZA-Information 56 vorgeschlagen, nämlich die eindimensionale Erfassung der Faktoren nach der klassischen Testtheorie (Reliability). Seinen besonderen Stellenwert erhält das Lehrbuch auch durch das didaktische Prinzip des „learning by doing“, das in den sehr guten Begleitmaterialien schrittweise angelegt und für Lernende kontrollierbar ist. Das Buch eignet sich nicht nur zum Selbststudium, sondern kann auch als wertvolle Arbeitshilfe für Dozierende entsprechender Methoden- bzw. Analysekurse verwendet werden. Bei einer aktualisierten Neuauflage wäre an eine Erweiterung um solche multivariate Analyseverfahren zu denken, die – wie z.B. die logistische Regression – immer stärker in die alltägliche sozialwissenschaftliche Forschungspraxis vordringen. Stascheit, Ulrich; Winkler, Ute: Leitfaden für Arbeitslose: Der Rechtsratgeber zum SGB III 22. Auflage, Stand: 1.1.2005. Fachhochschulverlag: Frankfurt am Main 2005. EUR 11,ISBN: 3-936065-35-7, 592 S. von Wolfgang Hübner TuWas ist ein Arbeitslosenprojekt am Fachbereich Sozialarbeit der Fachhochschule Frankfurt. Unter der Leitung von Ulrich Stascheit 2 und Ute Winkler 3 erschien nunmehr die mittlerweile 22. (der jährlich aktualisierten) Auflage dieses Ratgebers. Der „Leitfaden für Arbeitslose“ versteht sich als Hilfsmittel für Arbeitslose, Ratsuchende sowie Ratgebende, die aktuelle Informationen und Gesetzesgrundlagen suchen. Aus dem Inhalt: Worauf muss man achten, wenn man arbeitslos wird? Hilfe bei Arbeitssuche und bei Arbeitsaufnahme; Wer bekommt Arbeitslosengeld? 2 Professor für Arbeitslosenrecht an der Fachhochschule Frankfurt am Main, FB Sozialarbeit mit den Schwerpunkten: Arbeitslosenrecht, Arbeitsrecht, insbesondere kirchliches Arbeitsrecht, und Geschichte der Wohltätigkeit. 3 Amtierende Präsidentin des Landessozialgerichts Sachsen-Anhalt. ZA-Information 56 191 Höhe des Arbeitslosengeldes und Anrechnung von Nebeneinkommen; Zumutbarkeit; Dauer des Arbeitslosengeldes; Beschäftigung von Ausländern; Sperrzeiten; Ruhen von Leistungen; Kurzarbeitergeld; Insolvenzgeld; Fördermöglichkeiten und Berufsausbildungsbeihilfen; Teilnahme behinderter Menschen am Arbeitsleben; Maßnahmen zur Schaffung und Erhaltung von Arbeitsplätzen; Existenzgründungshilfen; Mittel aus dem Europäischen Sozialfonds; Sozialversicherung; Widerspruch und Klage; Musterbriefe. Ein Stichwortverzeichnis ermöglicht den gezielten Zugriff auf die Themen. Erstmals gibt es auch ein Kapitel ,,Beschäftigung von Ausländern“, in dem die Auswirkungen des neuen „Aufenthaltsgesetzes“ auf Arbeitserlaubnisse und das Recht auf Leistungsbezug dargestellt sind. Da die Arbeitslosenhilfe seit Jahresbeginn in der bisherigen Form nicht mehr existiert, sondern im Rahmen der umfangreichen Hartz IV-Gesetzgebung mit dem AlG II verschmolzen wurde, ist auch das Kapitel zur Arbeitslosenhilfe ersatzlos gestrichen worden. Das Arbeitslosenprojekt TuWas hat daher einen zweiten Reader, den „Leitfaden zum Arbeitslosengeld II: Der Rechtsratgeber zum SGB II“ veröffentlicht, der sich ganz dieser Neuregelung widmet. Die komplizierte Materie wird anschaulich und leicht nachvollziehbar dargelegt. Beispiele mit Urteilen und entsprechenden Paragrafenhinweisen machen das Buch zu einem wertvollen Ratgeber für Laien. Die Preisgestaltung ist ausgesprochen moderat, besonders wenn man den Umfang, den zweifarbigen Druck und vergleichbare Veröffentlichungen in Betracht zieht. Der Band kostet (einschließlich Versandkosten) 11,- Euro und ist zu beziehen über: Fachhochschulverlag Der Verlag für angewandte Wissenschaften Kleiststr. 31, 60389 Frankfurt Tel.: 0 69 15 33-28 20 Fax: 0 69 15 33-28 40 [email protected] www.fhverlag.de 192 ZA-Information 56 ADM Arbeitskreis Deutscher Markt- und Sozialforschungsinstitute e.V. (Hrsg.): Nonresponse und Stichprobenqualität: Ausschöpfung in Umfragen der Markt- und Sozialforschung. Verlagsgruppe Deutscher Fachverlag, 60264 Frankfurt am Main, 2004. EUR 25,- ISBN – 3-87150-897-7 Die Ausschöpfungsquoten von Umfragen, die auf repräsentativen Zufallsstichproben basieren, sind in den vergangenen Jahren kontinuierlich gesunken oder stagnieren auf einem unbefriedigenden Niveau. Gibt es Chancen, den Trend umzukehren? Wo liegen die Ursachen für diesen Trend, wie kann die empirische Forschung reagieren, welche Lösungsmöglichkeiten bieten sich an? Wie ist die Qualität einer realisierten Stichprobe zu bewerten? Ist es ausreichend, die Ausschöpfungsquote allein als Maßstab heranzuziehen? Aus dem Inhalt: Zur Ausschöpfung bei Umfragen der Markt- und Sozialforschung; Trends in den non-response-rates; Teilnahmebereitschaft von Befragten; Forschungskonzepte; die Qualität realisierter Zufallsstichproben; zur Stichprobenqualität in Online-Befragungen; Potentiale und Probleme bei Access Panels. Die Analyse der deutschen Situation im Bereich der Ausschöpfungsquoten wird in Vergleich mit anderen Ländern gestellt. Es wird deutlich, dass ein solcher Vergleich nicht trivial ist. Die Variabilität der methodischen Basis, so z.B. unterschiedliche Feldstrategien, das Survey-Klima und die Einstellung zu Umfragen machen einen Vergleich über die Ländergrenzen hinweg schwierig. Ausführlich beschrieben wird "Dillmann’s Tailored Design" Methode. Uwe Engel (Universität Bremen) und seine Mitarbeiterinnen haben eine umfassende Zusammenstellung der Parameter erarbeitet, die sich auf die Höhe der Ausschöpfungsquoten bei Umfragen auswirken. Ein umfangreiches Literaturverzeichnis reflektiert den aktuellen Stand der Forschung. Das Buch besteht aus zwei im Layout unterschiedlich gestalteten Teilen, die nicht gänzlich aufeinander abgestimmt sind. Etwas Sorgfalt bei der Satzlegung des Buches hätte man sich gewünscht. Bezug über: Horizont Productions, Verlagsgruppe Deutscher Fachverlag Hans H. Kopsch E-Mail: [email protected], Telefon 069-75 95 28 41