K2 - DepositOnce
Transcrição
K2 - DepositOnce
„Linguistische Untersuchungen über Qualitätsveränderungen bei britischen Qualitätszeitungen seit Aufkommen des Internet und infolge des 11. September“ vorgelegt von Magister Artium Roland Scheller aus Kiel von der Fakultät I - Geisteswissenschaften der Technischen Universität Berlin zur Erlangung des akademischen Grades Doktor der Philosophie - Dr. phil. genehmigte Dissertation Promotionsausschuss: Vorsitzender: Prof. Dr. Eberhard Knobloch Berichter: Prof. Dr. em. Friedrich Braun Berichter: Prof. Dr. Peter Erdmann Tag der wissenschaftlichen Aussprache: 20.02.2007 Berlin 2007 D 83 Abstract: Has the language used in British quality newspapers, i.e. “The Times”, “The Guardian” and “The Independent”, changed between 1990 and 2001 as a result of the rise of the internet and later on as a reaction to 9/11? To answer these questions three text corpora were collected in order to conduct a diachronic corpus analysis: one from 1990 (two million words) and two from 2001 (one million words each). One corpus from 2001 contains only articles that appeared before 9/11, the other only articles that appeared afterwards. The analysed fields are “News“, “World News“ and “Politics“. This method and ‘corpus constellation’ is used first in order to analyse the special nature of press language and second, to analyse lexical changes over a period of ten years. The results show that the “type token ratio” and the average sentence length has decreased since 1990, whereas the length of the articles has increased. The number of pronouns has also increased in 2001 compared to 1990. Furthermore, a dramatic change in the use of terms such as >ARAB<, >ISLAM< and >MUSLIM< can be measured as a direct result of the terrorist attacks of 9/11. The conclusion of this investigation is that newspaper language is dependent on those great political topics that appear during the survey period and that technical changes within newspaper houses may cause changes in the newspapers themselves as well as their articles. While in 1990 forms such as >MR<, >AGED< and >PER CENT< were used more frequently, after 9/11 changes in lexical use appeared, among them the application of terms like >ISLAMIC< in the context of >TERROR<, terms that indicate a new concept of enemy. 2 Abstract: Hat die Sprache in den britischen Qualitätszeitungen „The Times“, „The Guardian“ und „The Independent“ zwischen 1990 und 2001 aufgrund des Aufkommens des Internet und infolge des 11. September eine Veränderung durchlaufen? Um diese Fragen zu beantworten, wurden drei Text-Korpora erstellt, um eine diachrone Korpusanalyse durchzuführen: eins von 1990 (zwei Millionen Worte) und zwei von 2001 (mit je einer Million Worten). Das eine Korpus von 2001 beinhaltet ausschließlich Artikel, die vor dem Ereignis 11. September, das andere ausschließlich Artikel, die danach erschienen sind. Die analysierten Themenfelder sind „News“, „World News“ und „Politics“. Diese Textkorpora wurden mit Hilfe korpuslinguistischer Methoden analysiert. Dieses Verfahren bzw. die „Korpuskonstellation“ wurde gewählt, erstens, um die Besonderheiten von Zeitungssprache zu analysieren, zweitens, um lexikalische Veränderungen über eine Zeitdauer von zehn Jahren zu untersuchen. Die Ergebnisse zeigen, dass sich seit 1990 die Type-Token Relation und durchschnittliche Satzlänge verringert haben, während sich die Artikellänge vergrößert hat. Die Anzahl der Pronomina vergrößerte sich ebenfalls 2001 im Vergleich zu 1990. Des Weiteren wurde eine dramatische Veränderung in der Verwendung von Begriffen wie >ARAB<, >ISLAM< und >MUSLIM< festgestellt, die in einem engen Zusammenhang mit den Terrorangriffen vom 11. September stehen. Die Schlussfolgerung dieser Untersuchung ist, dass Zeitungssprache von den großen politischen Themen abhängig ist, die sich während des Erhebungszeitraumes ereigneten, und dass technische Veränderungen innerhalb der Zeitungshäuser Veränderungen an den Zeitungen und deren Artikel herbeiführen können. Während 1990 Formen wie >MR<, >AGED< und >PER CENT< häufiger verwendet wurden, kam es nach 9/11 zu Gebräuchlichkeitsveränderungen einiger Begriffe, dazu zählt die Verwendung von Begriffen wie >ISLAMIC< im Kontext von >TERROR<, die auf ein neues Feindbild hinweisen. 3 1. EINLEITUNG S. 9 2. KAPITEL: Die Eigenschaften der Korpuslinguistik S.14 2.1 Die Vorteile bei der Verwendung von Korpora 2.2 Die Korpuslinguistik in Analogie zu kognitiven Fähigkeiten S.14 S.16 3. KAPITEL: Korpuslinguistik als Sprachanalysemethode S.20 3.1 Ein Beispiel für eine populäre Korpusanalyse: Das Wendekorpus 3.2 Kommunikative Grundlagen der Korpuslinguistik 3.3 Textanalyse und Textkorpora 3.4 Die medienspezifischen Charakteristika einer Zeitung 3.5 Wahrheitswerte von Sätzen und Texten 3.6 Pressesprache und Registeranalyse 3.7 Ereignisorientierte Veränderungen von Sprache 3.8 Die Grenzen der Korpuslinguistik S.21 S.23 S.26 S.26 S.28 S.29 S.34 S.35 4. KAPITEL: Die Strukturierung der Korpora und die technischen Hindernisse S.36 4. 1 Die Funktionsweise von Wordsmith 4. 2 Die Korpusprotokolle 4. 3 Das Korpusdesign 4. 4 Überarbeitung des Korpusdesigns 4. 5 Sortieren der Unterkorpora 4. 6 Entstehungsprozess und Textformatierungsprobleme 4. 7 Metatext als relevante Fehlergröße 4. 8 Layout-Redundanz 4. 9 Die Zusammenstellung der Subkorpora 4.10 Veränderungen in den Themenfeld-Bezeichnungen 4.11 Anzahl der Artikel pro Subkorpus S.37 S.40 S.42 S.49 S.50 S.51 S.54 S.56 S.57 S.67 S.68 4 5. KAPITEL: Der 11. September als Ausgangspunkt für Veränderungen in Sprache, Medien und Gesellschaft S. 72 5. 1 Das Ereignis 11. September 5. 2 Die Medienreaktionen auf die Terroranschläge vom 11.9.2001 5. 3 Medienwissenschaftliche Betrachtung des 11.September 5. 4 Das Dilemma der Medien im Zusammenhang mit dem 11. September 5. 5 Der 11. September als Auslösefaktor für Spekulationen 5. 6 Kontextuelle und lexikalische Wahrscheinlichkeit 5. 7 Der 11. September als Agenda-Setting-Prozess 5. 8 Der Nachrichtenfaktor des 11.September 5. 9 Qualitätskriterien für Informationsjournalismus 5.10 Die Nachrichtenwert-Theorie 5.11 Der 11. September als Schlüsselereignis 5.12 Das Textkorpus mit Artikeln erschienen nach dem 11. September S. 73 S. 76 S. 77 S. S. S. S. S. S. S. S. 78 80 82 84 86 87 88 89 S. 90 6. KAPITEL: Auswertung der Analysedaten S. 91 6.1 Die von Wordsmith gewonnenen Basisdaten S. 91 6.1.1 Die Auswertung der Korpusstatistiken 6.1.2 Die Type-Token Relation (TTR) 6.1.3 Die Häufigkeitslisten 6.1.4 Die alphabetischen Listen und Hapax Legomena S. S. S. S. 6.2 Grammatikalische Untersuchungen S.101 6.2.1 Effects of scepticism and doubt 6.2.2 Degree of probability 6.2.3 Naming als Indikator für Boulevardisierung S.101 S.102 S.104 6.3 Untersuchungen an der Syntax S.108 5 91 93 95 99 6.3.1 Vergleich der durchschnittlichen Satzlängen in den Untersuchungszeiträumen 6.3.2 Ausgewählte Konkordanzen 6.3.2.1 Die Konkordanzliste zu >ISLAM< in K1 6.3.2.2 Die Konkordanzliste zu >ISLAM< in K2 6.3.2.3 Die Konkordanzliste zu >ISLAM< in K3 6.3.2.4 Die Konkordanzen zu >ARABIC< 6.3.2.5 Konkordanzen mit dem Kontextwort [>TERROR<] 6.3.3 Die häufigsten Kollokationen von >MUSLIM<, >ISLAMIC< und >ARAB< 6.3.3.1 Linksseitige Kollokationen zu >ARAB< 6.3.3.2 Rechtsseitige Kollokationen zu >ARAB< 6.3.3.3 Linksseitige Kollokationen zu >MUSLIM< 6.3.3.4 Rechtsseitige Kollokationen zu >MUSLIM< 6.3.3.5 Linksseitige Kollokationen zu >ISLAMIC< 6.3.3.6 Rechtsseitige Kollokationen zu >ISLAMIC< 6.3.3.7 Gebräuchlichkeitsveränderungen S.108 S.116 S.117 S.121 S.122 S.123 S.126 S.129 S.130 S.132 S.133 S.134 S.136 S.137 S.139 6.4 Untersuchungen an der Lexik S.141 6.4.1 6.4.2 6.4.3 6.4.3.1 Das Problem der Synonymie Lexikalische Dichte und Funktionswörter Die Funktion Keywords Die Keyword-Liste von K1 mit K2 als Referenzkorpus Die Keyword-Liste von K2 mit K1 als Referenzkorpus Die Keyword-Liste von K2 mit K3 als Referenzkorpus Die Keyword-Liste von K3 mit K2 als Referenzkorpus Die Keyword-Liste von (K1 + K2) mit K3 als Referenzkorpus Die Keyword-Liste von K3 mit (K1 + K2) als Referenzkorpus S.141 S.142 S.145 6.4.3.2 6.4.3.3 6.4.3.4 6.4.3.5 6.4.3.6 6.4.4 Weitere Schlüsselwörter im Zusammenhang mit dem 11. September 2001 6 S.146 S.150 S.153 S.156 S.159 S.162 S.166 6.4.4.1 Times.2001.danach mit K2 als Referenzkorpus 6.4.4.2 Guardian.2001.danach mit K2 als Referenzkorpus 6.4.4.3 Independent.2001.danach mit K2 als Referenzkorp. 6.4.5 Analyse ausgewählter Wortgruppen 6.4.5.1 Die Wortgruppe „Arabisch” 6.4.5.2 Die Wortgruppe „Islamische Welt“ 6.4.5.3 Die Wortgruppe „Terror“ 6.4.5.4 Die Wortgruppe „Gewalt“ 6.4.5.5 Die Wortgruppe „Al-Qaida“ in den Subkorpora von K1 6.5 S.183 Morphologische Analysen: Ausgewählte Komposita S.186 6.5.1 Das Problem der Erkennung von Komposita und Homonymie 6.5.2 Analyse ausgewählter Komposita 6.5.2.1 Komposita mit Bestandteilen aus den Wortgruppen „Arabisch“ und Islamische Welt“ 6.5.2.2 Komposita mit Bestandteilen aus der Wortgruppe „Terror“ 6.6 S.166 S.170 S.173 S.177 S.178 S.179 S.180 S.182 S.186 S.188 S.189 S.192 Weitere Analysedaten S.194 6.6.1 Das Zipfsche Gesetz 6.6.2 Die Entropie der Typen S.194 S.198 7. KAPITEL: Schlussbetrachtung (Zusammenfassung, Kritik und Ausblick) S.199 7.1 Zusammenfassung der Ergebnisse 7.1.1 Gründe für die Veränderungen des Wortschatzes 7.1.2 Sprachliche Veränderungen durch die Internet-Einführung 7.1.3 Emotionsneutrale Datenauswertung durch den Rechner 7.1.4 Der Umgang mit dem Thema Terror 7.1.5 Halo-Effect und Primacy-Recency-Effect 7 S.200 S.201 S.202 S.204 S.204 S.206 7.2 Korpuslinguistische Methoden kritisch betrachtet 7.2.1 Schlüsselwort ungleich Inhalt 7.2.2 Wie sinnvoll ist der Einsatz der Korpuslinguistik? 7.3 8. S.206 S.207 S.209 Rückschlüsse auf die Qualität von Texten mittels quantitativer Analysen S.210 LITERATURLISTE S.212 8 1. EINLEITUNG In dieser Dissertation werden drei Presse-Korpora mit dem Ziel analysiert, die sprachlichen Veränderungen in den britischen Qualitätszeitungen „The Times“, „The Independent“ und „The Guardian“ zwischen 1990 und 2001, und die Veränderungen im Zusammenhang mit den Terroranschlägen vom 11. September 2001 zu untersuchen. Aus diesem Grunde wurden zwei Presse-Korpora von 2001 erstellt, sowie ein Presse-Korpus von 1990, das als Vergleichskorpus dient. Das eine Textkorpus von 2001 enthält ausschließlich Artikel, die vor dem 11. September erschienen sind (K2 genannt), das andere hingegen Artikel, die nach der Katastrophe in New York in den Zeitungen zu lesen waren (K1). Diese beiden Korpora von 2001 enthalten Zeitungsartikel von je einer Million Worten. Darunter sind in jedem der beiden Korpora 500 000 Wörter aus „The Times“, 250 000 aus „The Guardian“ und noch einmal 250 000 aus „The Independent“. Das Korpus von 1990, K3 genannt, besteht aus insgesamt 2 Millionen Worten, davon sind eine Million aus „The Times“, 500 000 Wörter aus „The Guardian“ und noch einmal 500 000 Wörter aus „The Independent“. Die drei Presse-Korpora K1, K2 und K3 wurden miteinander verglichen. Diverse weitere Korpuskonstellationen wurden vergleichbar gemacht, indem K1 und K2 zu einem gemeinsamen Korpus zusammengefügt wurden. Zusätzlich konnten die dreimal drei Subkorpora, die K1, K2 und K3 konstituieren, ggf. miteinander verglichen werden, um weitere Ergebnisse zu gewinnen. Die Software, die dabei zur Verfügung stand war Wordsmith 2.0 und später Wordsmith 3.0. Die für die Erstellung der Korpora herangezogenen Quellen sind soweit verfügbar den CD-Roms der drei oben genannten Qualitätszeitungen entnommen, aber auch deren Online-Zeitungen von 2001 und der Electronic Database des British Council. Da die Presse-Korpora verschiedene Zeitphasen repräsentieren, ist die vorliegende Korpusanalyse eine Longitudinalanalyse (Jarren, Bonfadelli 2001, S.507). Wegen einer klaren Eingrenzung des Registers sind die verwendeten Zeitungsartikel ausschließlich Themenfeldern wie Politics, News und 9 Foreign News entnommen, die von der Bezeichnung her von Zeitung zu Zeitung variierten. Diese Dissertation umfasst insbesondere die Erläuterung des Designs der Korpora, das Beschreiben der Korpusquellen, die Funktionsweise des verwendeten Analyseprogramms und die Analyse der sodann gewonnenen Wort- und Konkordanzlisten. Die zentralen Fragestellungen der Arbeit lauten: Wie hat sich die Sprache in den Printmedien verändert? Üben das Internet und die Online-Zeitungen einen erkennbaren Einfluss aus? War der 11.September tatsächlich ein dermaßen gravierendes Ereignis, dass sogar der Sprachgebrauch beeinflusst wurde? Diese Fragen können aufgrund der Auswahl der Textquellen nur für die Zeitungssprache in Großbritannien beantwortet werden. Grundsätzlich ist das Heranziehen von Computern zur Textanalyse nur bei bestimmten Fragestellungen effektiv. Das ist der Fall, wenn besonders große Textmengen zu analysieren sind. Einschränkend muss an dieser Stelle gesagt werden, dass ein Analyseprogramm, hermeneutische Detailfragen betreffend, nicht das zu bewerkstelligen vermag, was ein einzelner, adäquat geschulter Mensch durchzuführen im Stande ist. Der Mensch kann, was Textanalysen betrifft, beim derzeitigen Stand der Technik den Computer fast ausschließlich für rein statistische Vorgänge verwenden, wie dem Auszählen von Wortklassen, Bestimmen von durchschnittlicher Satz- oder Wortlänge, Wörterzählen, Type-Token-Analyse, Erstellen von alphabetischen Wortlisten, Frequenzlisten und Differenzmengen. Die Ausnahmen zu den rein statistischen Funktionen stellen die Konkordanzen und Kollokationen zu einem festgelegten Wort oder String dar. M.A.K. Halliday spricht in diesem Zusammenhang von Low–Level Analysis. Eine Korpusanalyse ist deshalb keine Textanalyse im herkömmlichen Sinne. Die per Hand ausgeführte Analyse wird in der Funktionalen Grammatik als High-Level Analysis bezeichnet (Halliday 2004, S.49). Dennoch kann man Computer ausgewählte Teilaufgaben der qualitativen Analyse von Texten übernehmen lassen, wenn wir nach Textstellen und Kollokationen von Bildspendern für Metaphern oder anderen Schlüsselwörtern suchen. Eine erfolgreich durchgeführte Korpusanalyse stellt eine ausgezeichnete Hilfe beim Aufspüren von Details dar, die der Leser 10 unter Umständen übersieht. Das sind zumeist statistische Kennwerte bezogen auf Lexik, Syntax, Wortbildung und Grammatik. Was die Medienberichterstattung des Jahres 2001 anbetrifft, so ist der 11.9.2001 ein einschneidendes Ereignis gewesen, dass ungeahnte Veränderungen nach sich gezogen hat wie die Anti-Terror-Allianz, weltweite Sicherheitsmaßnahmen, Islamismus-Debatte und den Kriegszustand in Afghanistan und Irak. Hierzu liefert der Vergleich der beiden Korpora von 2001 Ergebnisse. Analog dazu fand in den 90er Jahren ein technischer Umbruch statt, darüber vermag das Vergleichskorpus von 1990 Aufschluss geben. Das Internet, laut „Time-Magazine“ seit 1991 für die Öffentlichkeit nutzbar, hat sich während der 90er Jahre weltweit etabliert und ist zu einem anerkannten Kommunikationsmedium geworden. Die Veränderungen sind auf allen gesellschaftlichen Ebenen spürbar. Die von dem Textanalyseprogramm Wordsmith produzierten Korpusstatistiken, Frequenzlisten und Differenzmengen etc. lassen Urteile über die gravierendsten Unterschiede der Presse-Korpora zu. Ebenso konnten neue Tendenzen bei der Verwendung von Sprache in den Printmedien im Zusammenhang mit dem 11. September aufgefunden werden. Die Begriffe, die sprachliche Veränderungen ausgelöst durch Großereignisse, beschreiben helfen, sind lexikalische und kontextuelle Wahrscheinlichkeit. Ein weiterer Schwerpunkt dieser Arbeit lag in der Untersuchung, ob die verwendete politische Sprache 1990 eventuell eine andere war, als 2001, wobei auch hier wieder zwischen der Zeitungsberichterstattung vor und nach dem 11. September differenziert wird. Deshalb wurden Begriffe zu Wortgruppen wie Islamische Welt, Arabisch, Terror, Al-Qaeda und Gewalt zusammengefasst. In weiteren Analyseschritten wurde der Fragestellung nachgegangen, ob sich der benutzte Wortschatz in den untersuchten Medien zwischen 1990 und 2001 quantitativ verändert hat, was durch die von Wordsmith erstellte Type-Token Relation überprüft wurde, durch Aussagen im Rahmen des Zipfschen Gesetzes, sowie durch die Veränderungen bei den durchschnittlichen Satzlängen. Des Weiteren wurden Kompositabildung, Konkordanzen und Kollokationen zu Schlüsselwörtern untersucht, die ergänzend anhand von Kernsätzen plastisch dargestellt wurden. 11 Pressesprache wird als eigenständiges Sprachregister vorgestellt, es wird diskutiert, wie repräsentativ diese drei Presse-Korpora für die gesamte englische Sprache sind. Eventuelle Veränderungen der britischen Presse, speziell der Qualitätspresse, manifestieren sich nicht ausschließlich am Sprachgebrauch. Diese zeigen sich auch bei der Themenwahl und beim neuen Textdesign. Doch diese beiden Punkte werden nur am Rande angesprochen. Was die Darbietung der gewonnenen Daten anbetrifft, werden von vornherein drei Formen von Statistiken unterschieden: Statistiken, die in Form von Protokollen bei der Entnahme der Zeitungsartikel aus den Korpusquellen entstanden sind: sie dienten der Orientierung, um zu gewährleisten, dass bei der Datenerhebung der Faden nicht verloren ging. Diese Protokolle bilden die Basis für die zweite Form von Statistik, die beschreibt, wie viele Artikel pro Zeitung, Themenfeld und Erscheinungstag verwendet wurden. Auch diese zweite Statistik ist von Hand erstellt worden. Es wurden Aufschlüsse darüber gewonnen, ob sich die Artikel generell verkürzt haben. Die dritte Form von Statistik ist die von Wordsmith erzeugte Korpusstatistik, die in Typen und Token differenziert und die verschiedenen Wortlisten erstellt. Ohne Computer wäre das Erstellen dieser Listen nicht möglich gewesen. Neben den bereits angesprochenen thematischen und strukturellen Veränderungen lassen sich noch weitere Parameter wie Personalisierung der Berichterstattung anhand der Verwendung von Namen und Pronomina erkunden, dies unter dem Aspekt einer zu untersuchenden „Boulevardisierung“. Doch Veränderungen lassen sich vor allem mit Hilfe der erstellten Wortlisten ausfindig machen, indem überprüft wird, ob bestimmte Begriffe oder Wortgruppen und damit Sachthemen in den drei Untersuchungszeiträumen gleichermaßen thematisiert sind. Es wird der Frage nachgegangen, inwieweit die Berichterstattung über den 11. September eventuell andere Themen temporär verdrängt haben könnte, Stichwort „Agenda-Setting“, und es wird dargelegt, dass der 11.September das schwerwiegendste politische Ereignis war, das letztendlich auch zu einem Dilemma der Medien wurde. 12 Anhand ausgewählter Einzelfälle wurde überprüft, ob sich für Schlüsselwörter die Häufigkeiten und der Gebrauchskontext zwischen 1990 und 2001, aber auch im Hinblick auf den 9/11, verändert haben. Es wird thematisiert, inwieweit die Korpuslinguistik zu Fragestellungen aus dem Grenzbereich Sprachund Medienwissenschaft Methoden zur Verfügung stellen kann, ob es nicht teilweise zu wenig ist, sich auf Sprache zu konzentrieren, während weitere Codes zur Verfügung stehen wie z.B. Pressefotos. Die Vor- und Nachteile der Korpuslinguistik werden diskutiert, hierzu zählt die Tatsache, dass ein Text zunächst zu einem bloßen Datensatz reduziert wird, um dennoch Werturteile zu treffen, aber auch dass übergroße und emotional belastende Textmengen teilweise nicht mehr von einem einzigen Menschen adäquat durchgearbeitet werden können. Die folgende Flow-Chart lässt sich als verlässliche Orientierungsgrundlage verwenden: Formulierung der wissenschaftlichen Fragestellung ↓ Festlegung des Designs ↓ Erstellung der Hauptkorpora ↓ Suchen eines adäquaten Vergleichskorpus ↓ Durchführung der Korpusanalyse mit geeignetem Analyseprogramm ↓ Aufbereitung und Auswertung der Ergebnisse ↓ Zusammenfassung der Ergebnisse/ Schlussfolgerung Abb.1: Flow-Chart Korpusanalyse 13 2. KAPITEL: Die Eigenschaften der Korpuslinguistik In der Sprachwissenschaft verstehen wir unter einem Korpus eine Sammlung von geschriebenen Texten oder transkribierter Rede, die als Grundlage für eine Untersuchung mit Hilfe des Computers verwendet werden kann (Kennedy 1998, S.3 ff). Die Elemente eines Korpus gehören in ihrer Gesamtheit bestimmten Kategorien an, die im Korpusdesign von vornherein festgelegt sind. Es handelt sich um eine mehr oder weniger zusammenhängende oder kohärente Textsammlung, wie beispielsweise ein Korpus bestehend aus Zeitungsartikeln zu einem bestimmten Thema. So kann eine Sammlung von Artikeln zu einem bestimmten politischen Ereignis ein Korpus ergeben, wie etwa Artikel ausschließlich über den Nürnberger Kriegsverbrecherprozess (Radlmaier 2001). Textkorpora könnten, was eine Kategorisierung im Bereich der Literatur oder Textlinguistik betrifft, gattungsspezifisch als maschinenlesbarer Text, Input-Text oder „recycelter Text“ bezeichnet werden. Es kommt ganz darauf an, wofür das Konstrukt verwendet werden soll. Es gibt vor allem in der Linguistik diverse Fragestellungen, bei denen Korpusanalysen heutzutage unumgänglich sind. Grundsätzlich können Korpora auch andere Daten als Textdaten enthalten, wie z.B. Codes, Tagging- und Wortschatzinformationen etc. 2.1 Die Vorteile bei der Verwendung von Korpora Im Rahmen dieser Arbeit verstehen wir unter einem Textkorpus einen maschinenlesbaren Text, der von einem Analyseprogramm auf die einzelnen Bestandteile hin untersucht werden kann. Sinnvollerweise ist es ein Text, der sehr groß ist und nicht von einer Person in kurzer Zeit effektiver bearbeitet werden kann.1 Alle anderen Korpora mit nur 1 Korpora können durchaus eine enorme Größe erlangen, das ist der Fall, wenn eine ganze Sprache in einem Korpus erfasst werden soll. Dieses kann sinnvoll sein, wenn wir eine Sprache als Ganzes analysieren wollen, um hinter ihre Gesetzmäßigkeiten zu gelangen. Ein solches Korpus ist beispielsweise das "British National Corpus (BNC)", das aus etwa 100 Mio. Wörtern besteht (Kennedy 1998, S.12). Letztendlich stellt ein Wörterbuch auch ein Korpus dar, ob es nun als Buch, als CD-Rom oder als Datensatz im Internet vorliegt. Wörterbücher werden heutzutage zumeist durch Korpusanalysen erstellt. Das Longman Dictionary of Contemporary English beispielsweise versieht wichtige Wörter im laufenden Text mit kleinen Statistiken, die mit Prozentzahlen über 14 wenig Textinhalt gelten deshalb als Probe- oder Testkorpora. Es wird weiter unterschieden in Sample Corpora, Monitorkorpora, Zeitungskorpora, Dialogstrukturenkorpora, Handbuchkorpora, Grammatikkorpora und Vergleichskorpora (Lehr 1996, S.63-69). Korpora können nach Orten benannt sein, das sind zumeist die Erstellungsorte oder die Institute, die bei der Erstellung federführend agieren und kooperieren, wie etwa das Mannheimer Korpus 1 und 2, das Nijmwegen Korpus, das Lancaster-Oslo-Bergen Korpus etc. Ebenso existieren diverse Korpora, die nach Schriftstellern bzw. Philosophen benannt wurde, da darin ausschließlich deren Texte enthalten sind. So gibt es das Goethe Korpus, das Thomas-MannKorpus, das Marx-Korpus. Ferner können Korpora nach ihren Designern benannt sein (BrownKorpus), und es können untersuchte Zeitphasen als Namensgeber fungieren, z.B. das Wendekorpus, das die Berichterstattung unmittelbar vor und nach der deutschen Wiedervereinigung 1989 widerspiegelt (siehe Punkt 3.1). Schließlich kann der Korpusbegriff von Wissensgebiet zu Wissensgebiet variieren. In der Geschichtswissenschaft ist es möglich, eine ganze Ideologie als Korpus zu bezeichnen. Im Zusammenhang mit der Sprache der Nationalsozialisten ist vom „Korpus des antijüdischen Denkens“ die Rede (Goldhagen 2000, S.107). Heutzutage basieren große Grammatiken wie „A comprehensive Grammar of the English Language“ von Greenbaum und Quirk (2004) auf umfangreichen Korpusanalysen. Es sind gerade die systematischen Korpusanalysen, die in der Lage sind, vermutete Regularitäten einer Sprache aufzuzeigen, die die ausgewogene Erstellung von modernen Grammatiken erst ermöglichen (Chomsky 1995, S. 35). Es gibt eine ganze Reihe von Analysen an Presse-Korpora, die ausgewählte Facetten von Zeitungssprache fokussieren (z.B. markers of attribution, Murphy 2005, ICAME-Journal 29, S.131-150). Verwiesen sei hier auch auf eine synchrone Korpusanalyse von deutschen und englischen Leitartikeln bezüglich der Verwendung von Konditionalität (Klein 1994, S.185 ff.). unterschiedliche Bedeutungen und Verwendungen Aufschluss geben, die auf dem BNC und dem Longman Lancaster Corpus basieren. 15 Eine weitere interessante Analyse ist die Untersuchung von Westin und Geisler (2002, ICAME-Journal No. 26, S.133-152), die bei Editorials britischer Qualitätszeitungen während des 20. Jahrhunderts eine Zunahme der Argumentativität bei gleichzeitiger Abnahme der Narrativität festgestellt hat. Ferner können an Printmedien synchrone Sprachanalysen durchgeführt werden, das ist der Fall, wenn unterschiedliche Zeitungen eines Erscheinungstages miteinander verglichen werden. 2.2 Die Korpuslinguistik in Analogie zu kognitiven Fähigkeiten Noam Chomsky hebt hervor, dass bei uns Menschen gerade die Begrenztheit des Gedächtnisses, Zerstreutheit und Verwirrung, die Verschiebung der Absicht im Verlauf des Sprechens sehr typisch sind (Chomsky 1995, S. 18). Diese Eigenschaften hat ein Computer nicht. Der Computer muss sich auf die Funktionen des Analyseprogrammes beschränken. Ferner sind ihm Restriktionen durch das Textverarbeitungsprogramm und den im Rechner verwendeten Mikroprozessor auferlegt. Auch die durch eine Analyse gewonnenen Daten vermag der Computer nicht selbständig auszuwerten. Die Auswertung muss eine entsprechend geschulte Person durchführen. Die Software steuert lediglich die besagten Frequenzlisten, Textstatistiken und Konkordanzlisten bei, eine sinnvolle Analyse ist erst abgeschlossen, wenn eine Hypothese angenommen oder verworfen wurde. Eine solche Hypothese kann beispielsweise sein, dass in einem bestimmten Zeitraum der in Qualitätszeitungen verwendete Wortschatz geschrumpft ist. Der Computer ist bei der Korpusanalyse bloße Rechenmaschine, deren Vorteil darin besteht, besonders große Datenmengen zu analysieren, für deren Durchzählen ein einzelner Mensch u.U. Monate oder Jahre benötigt, ohne dabei die Zähl- und Rechenfehler zu berücksichtigen. Der Computer vollzieht dieses gefühlsneutral. Doch im Mittelpunkt steht immer der Mensch, der seine Arbeit an einem Korpus mit einer bestimmten Fragestellung verknüpft. Der Computer ist lediglich sein Werkzeug. Gemäß der „Computermetapher“ wird von einigen Wissenschaftlern das menschliche Gehirn als biologische Maschine oder Computer 16 aufgefasst, dessen Gedächtnis ein Riesenspeicher ist (Schmidt 1991, S.219). Umgekehrt lässt sich der Computer in seiner Funktion als Datenspeicher auch als ein systematisches Gedächtnis begreifen. Wenn wir diese Theorie logisch weiterführen, so ist das, was in der Psychologie als geistige Handlung bezeichnet wird (Galperin 1969, S. 249 ff.) nichts anderes, als ein vom Computer ausgeführter Rechenprozess. An anderer Stelle ist in der Psychologie vom selbständigen Planen und Ausführen von Konzepten als typisch menschlicher Eigenschaft die Rede (Vygotsky 1962, S. 82 ff.). Es lässt sich darüber streiten wie weit sich Computer dieser Eigenschaft schon angenähert haben. Auf der anderen Seite behandelt laut Searle ein Computer eingegebene Daten immer nur syntaktisch, nicht aber semantisch (1990, Spektrum der Wissenschaft, S.40 ff.). Die geistige Handlung beim Menschen, die dem Rechenprozess bei der Korpuslinguistik gleichgesetzt werden soll, ist unter anderem ein gewisses Sprachverständnis oder sprachliches Wissen, das in der Lage ist, Sprache zu kategorisieren, egal ob es sich um geschriebene Sprache (Zeitungstext, Krimi, Gesetzestext,...) oder gesprochene Sprache handelt (Slang, Dialekt, Fachjargon,...). Der Computer manipuliert letztendlich nur die Symbole. Das bietet jedoch keine Gewähr dafür, dass die Bedeutung der Symbole verstanden wird. Diesen Sachverhalt bezeichnet Searle als das „Chinesische Zimmer“ (Searle 1990, S. 40 ff.), ein Gedankenexperiment, bei dem ein Mensch in einem geschlossenen Raum Zettel mit Geschichten in chinesischer Notation zugestellt bekommt, die er ohne Kenntnisse der Fremdsprache bearbeiten soll. Trotz der Theorie der Computermetapher sind die Unterschiede in den Funktionsweisen von menschlichem Gehirn und einem Computer offensichtlich (Rechengeschwindigkeit, soziales Gedächtnis, mechanistisches Handeln, materielle Basis, Form, etc.). Ohne Zweifel erhält ein Mensch durch diese neue Methodik einen ganz anderen Blickwinkel auf sprachliche Fragestellungen im Zusammenhang mit Soziologie, Psychologie und Politologie wie Legasthenie, Szenesprache, Analyse von Politikerreden, etc. Zusätzlich trägt die Korpuslinguistik zu einer Entwicklung der wissenschaftlichen Betrachtungsweise bei, und wir müssen Sorge tragen, dass deren Möglichkeiten nicht negativ ausgenutzt werden. Das gilt z.B. für die 17 systematische Erforschung menschlicher Schwächen in Verkaufsgesprächen, korpusbasierte Lügendetektoren und Stigmatisierungen auf Grund von korpuslinguistischen Befunden. Der Computer ist letztendlich nur ein Medium, auch wenn in einem ganz anderen Sinn als ein Buch oder eine Zeitung. Dass der Computer dem menschlichen Gehirn gleichkommt, ist nur eine Idealvorstellung. Während Computer in einigen Bereichen, was die Rechenleistung anbetrifft, den Menschen weit übertreffen, sind sie in anderen Bereichen unterlegen, gerade was hermeneutische Fragen anbetrifft. Der Rechner erstellt bei der Korpuslinguistik nur Textstatistiken, Kollokationen und Vergleichslisten, und dieses in relativ großem Umfang und in Sekundenschnelle. Doch letztendlich geht es um das Verstehen von Texten, und das Treffen von klaren Aussagen. Ein Computer wird jedoch einen Text nie verstehen können, auch wenn er Daten liefert, die zum Verstehen beitragen können. Dennoch ist der Prozess bei der Korpuslinguistik dem geistigen Handeln des menschlichen Gehirns nachempfunden, denn sie zählt, kategorisiert, sortiert, listet auf, ordnet und errechnet mathematische Werte, dies auf der Basis geistiger Grundoperationen, die der Logik und der Mathematik entlehnt sind. Das geistige Repertoire des Gehirns liefert den Grundstock für das, was die Programmierer dem Rechner beibringen wollen. Doch anders als beim Menschen stehen beim Computer nicht Körper und Gehirn in Einklang, was die physische Grundvoraussetzung für sinnvolle Lernprozesse ist. Der Mensch kann mit ausreichend Hintergrundwissen sofort kategorisieren, ob es sich um amerikanisches Englisch handelt, ein Fachgespräch von Computerfreaks oder um eine Kirchenpredigt. Der Computer hingegen kann Wort- und Keynesslisten erstellen, die bei richtiger Auswertung zu demselben Ergebnis führen können. Ein sehr gravierender Unterschied zu Gunsten des Computers ist die Datenmenge, die es zu kategorisieren gilt. Die von einem Menschen vorgenommene Kategorisierung geschieht durch Verstand und Beurteilung. Dabei wird das im Gedächtnis verankerte Kontextwissen zu Rate gezogen. Ein Mensch kann lediglich Stichproben nehmen, wenn er große Text- oder Literaturmengen untersucht, es sei denn, dass er ein Textmedium über Jahre nutzt wie den allmorgendlichen „Tagesspiegel“ oder den Lieblingsautor Stephen King. Wenn der Rezipient diese Textmengen beurteilt, fällt er 18 andere Schlüsse als ein Computer, erkennt, die Zeitung ist konservativ geworden oder ein Krimi-Autor langatmig. Der Computer kann nur den Weg über eine lexikalische Analyse gehen und Sprach- oder Textmuster vergleichen, wenn durch ihn Texte kategorisiert werden sollen. Nur wenn für den Texttyp Kirchenpredigt auch ein Textmuster oder eine Wortliste für Kirchenpredigten als Vergleichswert bereitsteht, so kann der Computer das Urteil fällen, ob es sich bei dem Input-Text tatsächlich um diese Textform handelt oder nicht, sofern er dafür programmiert ist (siehe 3.6). Das menschliche Gedächtnis ist durch seine Lernfähigkeit flexibel, der Computer muss immer jeweils neu programmiert werden, ist also vom Programmierer oder der intelligenten Software abhängig. Ein Mensch kann vergessen, ein Computer auf der anderen Seite nicht. Bei ihm spielen andere mehr oder weniger folgenreiche Einflüsse eine Rolle wie Viren oder Computerabstürze. Bei der Computermetapher kann man jedoch einwenden, dass diese Theorie zu mechanistisch ist, dass es zu bracchial ist, das Gehirn und den menschlichen Geist mit einem Computer gleichzusetzen und alle anderen nur dem Menschen vorbehaltenen Domänen einfach zu ignorieren. Die vom Menschen kategorisierten Daten liegen nicht explizit in einer Datei gespeichert vor, sondern unterliegen den Schwächen des menschlichen Geistes wie Irrtümern, Missverständnissen, Täuschungen und Aberglaube. Der Computer ist hingegen rational-exakt, nicht aber kritisch. Auch in der Psychologie ist vom Gedächtnis als Speicher die Rede. Es wird sogar noch weiter differenziert in gesellschaftlichen und (ontogenetischen) individuellen Speicher und (phylogenetisches) „Artgedächtnis“ (Holzkamp 1985, S.128). Ein Mensch kann durch das Erinnern, Assoziieren und Transferieren auf diesen Speicher zurückgreifen. In der Korpuslinguistik wäre das verwendete Korpus als Speicher zu begreifen, im Kontext dieser Dissertation als Speicher von 10 219 Zeitungsartikeln. Doch der Zugriff läuft nicht über Gedächtnismuster wie beim Menschen (Schmidt 1991, S.22), sondern über die Suchfunktion und die Konkordanzlisten. Wie diese Dissertation zeigt, ist die Analysesoftware in der Lage, die Textkorpora als Speicherinhalt statistisch zu „durchpflügen“. Bei den Menschen hingegen haftet eher die Qualität als die Quantität, aber 19 auch die Art und Weise und die Relevanz. Für den Rechner zählt ausschließlich die Quantität, was die Auszähllisten anbelangt. Die anderen drei Grice’schen Maximen Qualität, Art und Weise, Relevanz (Grice 1991, S.26 ff.) bleiben ihm in der uns bekannten Form verschlossen. Das Gedächtnis des menschlichen Gehirns als emotions- und situationsabhängiger Speicher ist sehr umfassend: haptisches, Namens-, visuelles, akustisches, episodisches Textgedächtnis, etc. (Vester 1976, S.153/54, Kintsch und van Dijk 1983). Es ist damit in der Natur ein einzigartiges Konstrukt, das nicht annähernd in seiner Harmonie von der Technik nachgebildet werden kann. Die Komplexität des menschlichen Gedächtnisses ist adäquat durch das Modell von Atkinson und Shiffrin beschrieben (Baddeley 2003, S.44). Hier gibt es eine Unterteilung in Sensory Register, Short-term Store und Long-term Store. Auf Computer lassen sich diese Feinheiten nicht wirklich übertragen. Es müssen also stets beide Seiten betrachtet werden: die Korpuslinguistik vermag auf der einen Seite Leistungen zu vollbringen, zu denen ein Mensch nicht ohne beträchtlichen Aufwand in der Lage ist. Auf der anderen Seite entbehrt die Korpuslinguistik der mühsam erlernten Verstehensleistung des menschlichen Verstandes. 3. KAPITEL: Korpuslinguistik als Sprachanalysemethode Als Einstieg in dieses dritte Kapitel dient ein Beispiel für eine populäre Korpusanalyse in Deutschland. Es handelt sich dabei um das so genannte Wendekorpus. Die Korpuslinguistik wird ferner mit der klassischen Kommunikationstheorie umrissen und die Textualitätskriterien werden auf sie angewendet. Auch die medienspezifischen Charakteristika einer Zeitung, Wahrheitswerte und die zunehmende Erweiterung des Computerwortschatzes sind Bestandteil dieses Kapitels. Wir lernen die Korpuslinguistik als Sprachanalysemethode kennen und den Begriff des sprachlichen Registers. 20 3.1 Ein Beispiel für eine populäre Korpusanalyse: Das Wendekorpus Die wohl populärste korpuslinguistische Untersuchung im deutschsprachigen Raum ist das so genannte Wendekorpus. Mithilfe dreier Korpora, dem Wendekorpus DDR (WKD), dem Wendekorpus Bundesrepublik (WKB) und einem Vergleichskorpus, wurden aus Zeitungstexten die Schlüsselwörter der Wendezeit extrahiert. Das durch diese Korpusanalyse erstellte Wörter-Buch (SCHLÜSSELWÖRTER DER WENDEZEIT, Wörter-Buch zum öffentlichen Sprachgebrauch 1989/90) enthält die wichtigsten Elemente des öffentlichen Sprachgebrauchs in der DDR und in der Bundesrepublik Deutschland von Mitte 1989 bis Ende 1990 bezüglich der Wendethematik. Analysiert wurden Texte aus dem Bereich der öffentlich-politischen Kommunikation, dazu gehören Auszüge aus verschriftlichten Redebeiträgen der Tagungen der Volkskammer und der Sitzungen des Bundestages, öffentliche Reden, Demosprüche, (Leit)artikel, Kommentare, Interviews aus Zeitungen und Zeitschriften, Flugblätter, Aufrufe und Wahlprogramme (s.u.). Es wird in drei Hauptphasen unterteilt: die Vorwendezeit, die Wende und die Nachwendezeit. Für diese Phasen werden noch weitere Unterscheidungen getroffen. Das Projekt wurde von der so genannten „Gesamtdeutschen Korpusinitiative“ initiiert. Dieses Korpusprojekt ist vom Institut für deutsche Sprache in Zusammenhang mit dem damals noch existierenden Zentralinstitut für Sprachwissenschaft der Akademie der Wissenschaften in Ost-Berlin angeregt worden. Durch dieses Projekt entstand ein maschinell gespeichertes Korpus im Umfang von etwa vier Millionen Wortformen. Die verwendeten Themenkreise waren „politischer Umbruch in der DDR“ und „Annäherung und Vereinigung der beiden deutschen Staaten“. Das so entstandene Wendekorpus, kurz WK, ergänzt die bereits seit Mitte der 60er angelegten Textkorpora zur deutschen Gegenwartssprache. Das Wendekorpus DDR (WKD) enthält 1632 Texte aus der DDR bzw. aus den neuen Bundesländern mit insgesamt rund 1,5 Millionen Wortformen. Als Quellen wurden herangezogen Aufrufe, Flugblätter, öffentliche Erklärungen von Bürgerbewegungen und Parteien, Wahlkampfmaterialien, verschriftlichte Demosprüche, Reden, 21 Protokolle von Volkskammertagungen. 50 % der Texte des WKD machen Texte aus Tages- und Wochenzeitungen aus (z.B. „Berliner Zeitung“, „Neues Deutschland“, „Junge Welt“, „Leipziger Andere Zeitung“, „Wochenpost“). Das Wendekorpus BRD (WKB) enthält 1755 Texte aus der Bundesrepublik bzw. aus den alten Bundesländern mit zusammen rund 1,8 Millionen Wortformen. Die Quellen für das WKB waren zu 80 % Tages-, Wochenzeitungen und Zeitschriften. Dazu zählten z.B. „Frankfurter Rundschau“, „Rheinischer Merkur“, „Mannheimer Morgen“, „Der Spiegel“, „Die Zeit“, „Stern“. Hinzu kamen verschriftlichte Politikerreden und Protokolle von Sitzungen des Bundestages. Für die lexikologische Untersuchung wurde das Rechnersystem COSMAS verwendet. Durch die Korpusanalyse wurden diverse Schlüsselwörter dieser Zeitperiode extrahiert. Es wurden beispielsweise Begriffe wie >WENDE<, >REVOLUTION<, >UMWÄLZUNG<, >UMBRUCH<, >UMSTURZ<, >VERÄNDERUNG<, >WANDLUNG<, >ERNEUERUNG< und >REFORM< als unterschiedliche „Bezeichnungen für die politischen Ereignisse des Herbstes 1989 in der DDR und für damit zusammenhängende gesellschaftliche Veränderungen“ aufgeführt. Hinzu kommen Belege mit Quellenangabe und Datum, so dass der Leser erkennen kann, in welchen Phasen welche Begriffe verwendet wurden. Für jedes analysierte und mit Textstellen belegte Wort werden zusätzlich die Definitionen aus dem „Wörterbuch der deutschen Gegenwartssprache (HDG)“ und dem „Duden. Deutsches Universalwörterbuch (DUW)“ gegenübergestellt. Eine wichtige Rolle spielte bei der Analyse ein Vergleichskorpus, dass speziell für diesen Zweck zusammengestellt wurde. Darin sind mehrere der im Institut für deutsche Sprache vorhandenen gegenwartssprachlichen Korpora mit insgesamt 20 Millionen Wortformen enthalten. Dazu gehören die Mannheimer Korpora 1 und 2, das Bonner Zeitungskorpus, vier Handbuchkorpora, das Limas Korpus, das Thomas Mann Korpus und das GrammatikKorpus 1. An dieser Stelle soll nicht unerwähnt bleiben, dass es noch ein weiteres „Wende“-Korpus bzw. ein Berliner „Wende“-Korpus gibt: Es besteht aus Interviews mit 39 Informanten aus dem Ostteil und 38 22 Informanten aus dem Westteil Berlins. In dieser Analyse wurde der Gebrauch der Modalpartikel >EBEN< und >HALT< untersucht. Fazit ist u.a., dass die Verwendung des Modalpartikels >HALT< mit Prestige versehen ist: >HALT< gilt bei den Ostberlinern als markiert, d.h. typisch westdeutsch. Dessen Verwendung resultiere jedoch bei den Ostberlinern in Schuldgefühlen, die Solidarität mit der eigenen Gruppe zu verletzen. >EBEN< hingegen wurde stets stärker in Ostberlin verwendet (Dittmar 2000, S.1999 ff.). 3.2 Kommunikative Grundlagen der Korpuslinguistik Zeitungstexte stehen in einem bestimmten Kommunikationszusammenhang. Printmedien sind in der Regel immer für Massenkommunikation ausgerichtet (Noelle-Neumann 2002, S.155). Das ist nur noch eingeschränkt gültig, wenn Zeitungen nicht mehr aktuell oder ausschließlich in Archiven zu finden sind. Diese Archive können auf der einen Seite aus OriginalZeitungsausgaben bestehen, oder virtuelle Datenspeicher wie Zeitungs-CD-Roms, Online-Archive oder begrenzt zugängliche Dateien wie die Electronic Database des „British Council“ (s.u.) sein. In Archiven nehmen Zeitungen und Zeitungsartikel im Rahmen von Recherchen an einem Kommunikationsprozess teil, die Archive können besichtigt werden, real oder virtuell. Genauso, wie Printmedien eine besondere Form der Kommunikation zwischen Autor und Leser darstellen, lässt sich bei der Korpuslinguistik eine Kommunikation zwischen den Schreibern der Artikel bzw. der zu Grunde liegenden Texte auf der einen Seite und den Rezipienten der Auswertung der Korpusanalyse auf der anderen Seite feststellen. Dieser spezielle kommunikative Effekt war den Redakteuren zur Zeit der Erstellung der Texte nicht bewusst. Eine besondere Rolle spielt dabei der Korpusdesigner. Die Bestandteile von Presse-Korpora hatten ursprünglich die Funktion, die Leser zu informieren, zu unterhalten, zu beeinflussen, etc. Der Korpusdesigner gibt diesen ursprünglich hochaktuellen Artikeln nachträglich eine neue Funktion, indem er die Texte nach vorher festgelegten Kriterien neu ordnet und die bisherige Kohärenz 23 der Korpusquellen aufbricht. In den Auswertungen der Analyseergebnisse sucht er unter einer nun ganz anderen, neuen Fragestellung nach verwertbaren Gesetzmäßigkeiten. Der Korpusdesigner fungiert damit als „Resteverwerter“, „Nachlassverwalter“ oder „Textrecycler“. Er nimmt die nicht mehr aktuellen Zeitungsartikel, ordnet ihnen eine neue, mehr statistische Funktion zu, indem er sie zum Bestandteil des Korpus macht. Im nächsten Schritt sucht der Designer in den Zeitungstexten mit statistischen Methoden nach Informationen, die von einer anderen Qualität sind, die zum Zeitpunkt der Entstehung der vormals aktuellen Texte noch unerheblich waren und gar nicht in Betracht gezogen wurden. Erst aus einer zeitlichen Distanz und in Verbindung mit zielgerichtet arrangierten Vergleichskorpora erhalten die ausgewählten Zeitungstexte eine neue Bedeutung. Die neue kommunikative Funktion besteht darin, Zeitungsartikel aus einer Distanz zu betrachten. Jetzt zählen nicht mehr die medienspezifischen Charakteristika einer Zeitung wie Publizität, Aktualität, Periodizität, Universalität, uneingeschränkte Verfügbarkeit und Fixierung in Schrift und Druck (Faulstich 2004, S. 485), sondern andere Parameter, die etwas über die zeitliche Epoche, Zeitphase oder Periode aussagen. Diese Parameter stehen in dieser Untersuchung in Verbindung mit journalistischem Fachvokabular, zeitspezifischer Sprache oder historisch terminierten politischen Begriffen, z.B. >GLASNOST<, >POLL TAX< oder >GROUND ZERO<. Die Sprache in tagesaktuellen Quellen, bzw. Quellen vom Vortag, wird zu einer überholten Sprache. Die Bewertung ist distanzierter und gefühlsneutraler. Die zunächst neue Zeitung wird mehr und mehr zu einer Konserve, wenn neue Ereignisse die Schlagzeilen von gestern überholen, auch wenn der Informationsgehalt rein mathematisch derselbe bleibt. Wir können auf Korpusanalysen also das klassische Kommunikationsmodell von Shannon und Weaver beziehen. In diesem Modell wird von einem Sender, einer Nachricht und einem Empfänger ausgegangen (Shannon/ Weaver 1976, S. 43/44). Bei einer herkömmlichen Zeitung besteht der Sender aus den Textproduzenten, also in erster Linie dem Redakteur, der einen Artikel verfasst hat. Die Nachricht ist der Inhalt des Zeitungsartikels und der Empfänger ist der Leser. Ein Feedback, das in diesem klassischen 24 Kommunikationsmodell nicht berücksichtigt wurde, kann in Form von Leserbriefen, Emails oder Anrufen bei der Redaktion gegeben werden. Im Rahmen der Korpuslinguistik stellt sich dieser Prozess anders dar: Obwohl die einzelnen Zeitungsartikel, die Bestandteil des Korpus sind, jeweils auch Verfasser haben, fungieren diese nur sekundär als Sender. Sie sind in der Masse der Artikel bedeutungslos geworden. Fortan ist der Korpusdesigner verantwortlich für die Auswahl der Texte. Wer die Artikel verfasst hat, spielt jetzt kaum eine Rolle, oder ist im Extremfall nicht mehr nachzuprüfen, wenn keine Korpusprotokolle existieren. Die transportierte Nachricht ist jetzt nicht mehr das Ausschlaggebende, sondern der statistische Beitrag zur Gesamtanalyse. Es sind nicht mehr der Redakteur und die Zeitung verantwortlich für die geschriebenen Inhalte, sondern der Korpusdesigner für die Einhaltung der Regeln des Korpusdesigns und die ordnungsgemäße Durchführung und Auswertung der Analyse. Die neue Botschaft der Texte ergibt sich erst aus dem Vergleich zweier Korpora und der anschließenden statistischen Auswertung. Der Empfänger ist nicht mehr der Zeitungsleser, sondern derjenige, der die Schlussanalyse vorgelegt bekommt. SENDER (Korpusdesigner) → NACHRICHT (Auswertung d. Korpusanalyse) → EMPFÄNGER ( Rezipienten der Auswertung) Abb. 2: Die Korpuslinguistik in Verbindung mit dem Kommunikationsmodell von Shannon und Weaver (stark vereinfacht) Bezogen auf den 11. September als Schlüsselereignis bedeutet das im Rahmen einer korpuslinguistischen Betrachtung, dass eine große Menge an Artikeln über dieses Ereignis zusammengetragen wurde, um diese als Ganzes zu interpretieren, unabhängig vom ursprünglich intendierten tagesaktuellen Zweck dieser Artikel. Die Botschaft, die wir daraus gewinnen, ist nicht mehr die Einzelnachricht, sondern der Tenor einer größeren Menge an Artikeln zu diesem Thema. Dieser Tenor ist unabhängig betrachtet vom unmittelbaren Geschehen des Vortages und den einzelnen Stellungnahmen der Redakteure. Der 25 Empfänger erhält als Botschaft eine Synthese der journalistischen Arbeit nach dem 11. September, die besagen kann, dass Terrorismus, ob gewollt oder ungewollt, in einen Zusammenhang mit der islamischen Religion gestellt wurde. 3.3 Textanalyse und Textkorpora Wenn wir diskutieren, was ein Textkorpus ist, lässt es sich nicht vermeiden, eine moderne Form der Textanalyse anzusprechen. Deshalb sei hier kurz das Konzept der Textualitätskriterien vorgestellt. Laut De Beaugrande/ Dressler (1981, S. 20/21) gelten Kohäsion, Kohärenz, Intentionalität bzw. Akzeptabilität, Informativität, Situationalität und Intertextualität als die sechs Textualitätskriterien. Im Folgenden soll kurz das Kriterium der Kohärenz in Bezug auf die Verwendung von Textkorpora skizziert werden. Die bisher bestehende Kohärenz von Zeitungsartikeln in den jeweiligen Zeitungsausgaben beispielsweise ist in der neuen Form, dem Textkorpus, nicht mehr existent. Zwar gibt es Kohärenz nach wie vor innerhalb des im Korpus plazierten Ursprungstextes, jedoch ist die Form der vormaligen Gesamtzeitung aufgehoben, deren Artikel gebunden an Themenfelder vorliegen und die teilweise innerhalb derselben und über mehrere Ausgaben hinweg systematisch miteinander verknüpft sind, wie etwa durch >SIEHE AUCH KOMMENTAR S.12<, >WIR BERICHTETEN<, >GEGENDARSTELLUNG<, >IN DER MORGIGEN AUSGABE<. In einem Textkorpus machen jetzt die Vorgaben des Korpusdesigns die Kohärenz aus. Die Kohärenz der in einem Korpus abgelegten Zeitungsartikel besteht beispielsweise in einer zeitlichen, thematischen und typologischen Zuordnung. 3.4 Die medienspezifischen Charakteristika einer Zeitung Ein Korpus, das ausschließlich aus Zeitungstexten zusammengesetzt ist, enthält alle inhaltlichen Informationen der Ursprungstexte, jedoch 26 haben diese in der neuen Form eine andere Funktion. Das gilt insbesondere für die medienspezifischen Charakteristika einer Zeitung: allgemeine Zugänglichkeit (Publizität), Zeitnähe (Aktualität), regelmäßiges Erscheinen (Periodizität), inhaltliche Vielfalt (Universalität), die freie Verfügbarkeit nach Ort, Zeit, das Lesetempo (Disponibilität) und schließlich die Fixierung in Schrift und Druck (Faulstich 2004, S.485). Hinsichtlich der Publizität von Zeitungstexten in einem Korpus ist festzustellen, dass diese gänzlich anders zugänglich sind: Das Korpus als Textdatei soll vom Rechner geöffnet, durch das Analyseprogramm geschickt und bei Bedarf in Form von Listen und Statistiken ausgedruckt werden. Wenn das Korpus eine große Zeitspanne abdeckt oder das Erscheinen der Originalausgaben weit zurückliegt, verlieren die Texte mehr und mehr an Aktualität. Das Merkmal regelmäßiges Erscheinen (Periodizität) ist in einem Korpus irrelevant, denn unter Umständen sind die Ausgaben über Wochen, Monate oder sogar Jahre hinweg zusammengefasst. Der Erscheinungstag spielt im Korpus nur eine untergeordnete Rolle, ist ggfs. als Metatext vermerkt. Auch die inhaltliche Vielfalt (Universalität) ist aufgebrochen, da bei der Erstellung des Korpus’ die benötigten Zeitungstexte unter Umständen selektiv ausgewählt wurden. Ein Presse-Korpus ist zumeist einem Thema oder Genre wie Politik, Wirtschaft oder Sport zugeordnet, was Konsequenzen für die Klassifizierung des Registers hat (siehe 3.6). Der fünfte Punkt, die Disponibilität, relativiert sich, denn ein Korpus stellt ein ganz anderes Medium dar als zuvor die einzelnen Zeitungsausgaben. Es dient nur noch der technischen Weiterverarbeitung, bzw. der statistischen Auswertung. Nicht die einzelnen Informationen sind ausschlaggebend, sondern die statistische Gesamtaussage im Vergleich zu anderen Textkorpora. Statt der medienspezifischen Charakteristika einer Zeitung spielt in der Korpuslinguistik die Betrachtung von Korpus bzw. Korpusdesign eine ausschlaggebende Rolle. Unerlässlich sind die Punkte Korpusgröße, Repräsentativität, Diversität, Korpusbestandteile, Korpusquelle, Synchronität oder Diachronität und Korpusfunktion (siehe Punkt 4.3). 27 Einschränkend muss hier gesagt werden, dass je nach Zweck des Korpus ein medienspezifisches Charakteristikum in einem Korpus wieder an Bedeutung hinzugewinnen kann, wenn beispielsweise die Aktualität auch später ungebrochen ist. Das ist beispielsweise der Fall, wenn bestimmte Ereignisse von der Öffentlichkeit nicht richtig verarbeitet wurden. Deshalb lässt sich behaupten, dass Artikel über den 11. September 2001 auch Jahre später immer noch eine hohe Aktualität besitzen können. 3.5 Wahrheitswerte von Sätzen und Texten Ob eine Nachrichten oder ein Texte wahr oder fiktiv ist, ob sie von einem Menschen oder sogar von einem Computer erstellt wurden, ist durch eine Korpusanalyse nicht ohne weiteres zu klären. Der Rechner ist zwar in der Lage, lexikalische, grammatikalische und orthografische Strukturen zu überprüfen, aber ob die Texte der Wahrheit entsprechen oder erfunden sind, lässt sich nicht mit statistischen Textanalysen und Kollokationslisten beurteilen. Die einzige Möglichkeit, die sich hier ergibt, ist das Taggen eines Textes gemäß der Wahrheitswerte bzw. Aussagenlogik (Schwarz, Chur 1993, S.129 ff.). Wer einen Text taggt, muss in der Lage sein zu beurteilen, ob die einzelnen Aussagen, die innerhalb eines Textes oder Satzes getroffen werden, wahr oder falsch sind. Ein Computer kann dieses nicht beurteilen. Ob ein Text maschinell erstellt wurde (Textgenerierungsprogramm, Textzusammenfassung, Übersetzung), lässt sich nur feststellen, wenn entsprechende Voruntersuchungen getätigt wurden und für jedes Programm ein statistisch verifizierter linguistischer Fingerabdruck erstellt wurde. Dieser lässt sich höchstwahrscheinlich haargenau herstellen, denn solche Textgenerierungsprogramme funktionieren nach allgemeingültigen Prinzipien, die von Programmierern entworfen wurden. Textgenerierungsprogramme sollen mit einem vorgefertigten Wortschatz und Syntaxschablonen auskommen und machen typische Fehler, die ein Mensch nicht machen würde. Genauso sind in Zeitungstexten sehr viel mehr Flüchtigkeitsfehler zu finden als in 28 einem Roman. In Bedienungsanleitungen, die übersetzt wurden, gibt es häufiger Fehler in der Wortwahl und im Ausdruck. Nur wer ausreichendes Kontextwissen hat und die Hintergründe von beschriebenen Ereignissen kennt, wer über Beweise verfügt, oder wer Augenzeuge war und einen Tathergang exakt erinnert, kann den Wahrheitsgehalt eines beschriebenes Ereignisses beurteilen. Überlässt man dem Rechner diese Entscheidung, so öffnet man dem Irrtum Tor und Tür. Es sei in diesem Zusammenhang auch auf das Ausfindigmachen von Plagiaten erinnert. Dabei wird überprüft, ob im Streitfall ein Text oder einzelne Textpassagen tatsächlich dem verantwortlichen Autor zugesprochen werden können, oder einer anderen Person. 3.6 Pressesprache und Registeranalyse Sprachliche Register (Thompson 2004, S.40; Halliday 2004, S.525; Spolsky 1998, S.33-35) sind nicht zu verwechseln mit Sprachdomänen (domains of language use, Romaine 1989, S.29-31). Während sich sprachliche Register als Sprachverwendung in Textsorten oder –themen sowohl bei gesprochener als auch geschriebener Sprache beschreiben lassen (Sprache des Journalismus, juristische Fachsprache, Jugendsprache, etc.), so bezieht sich der Begriff sprachliche Domäne auf die Orte, an denen bestimmte Formen der Sprache verwendet werden (Religionsgemeinschaft, Peer-Group, Familie, etc). Ein Textproduzent oder Autor fällt die Entscheidung, welche Wortwahl er trifft, um einen Sachverhalt darzustellen. Diese Begriffe sind maßgeblich von der beschriebenen Sache abhängig, von dem Fachvokabular, auch wenn dort jede Menge an Variationen möglich ist. Es kommt dabei auf den Sozialisationsweg an, denn ein Naturwissenschaftler beschreibt u.U. denselben Sachverhalt anders als ein Geisteswissenschaftler oder ein Experte auf dem interessierenden Themengebiet. Ein Techniker benutzt mehr technische Ausdrücke, während ein Geisteswissenschaftler mehr ästhetische Begriffe verwendet. Ebenso unterscheidet sich die Schreibweise von Journalisten, die bei einer Qualitätszeitung arbeiten, von denen, die für 29 die Boulevardpresse schreiben, obwohl sie über ein und dasselbe Thema berichten. Ein Presse-Korpus kann nur unter starken Einschränkungen für die Charakterisierung von Gemeinsprache herangezogen werden. Rückschlüsse auf andere sprachliche Register sind nur bedingt möglich, selbst wenn sich gewisse Tendenzen übertragen lassen, wie die Tatsache, dass Sprache zunehmend zu Redundanz neigt. Wer jedoch eine allgemeingültige Korpusanalyse Erfolg versprechend durchführen will, d.h. eine Analyse, die Rückschlüsse auf Gemeinsprache zulässt, dem wird empfohlen, das Korpus registerübergreifend zu konstituieren (Biber 1994, S.186 ff). Es existieren diverse Versuche, mit Hilfe von Korpusanalysen sprachliche Register zu definieren und exakte Zuordnungen zu treffen (automated prediction of registers, Biber 1994, S.193). Biber schlägt fünf Dimensionen zur Klassifizierung von Registern vor (narrative versus non-narrative, involved vs. informal production, elaborated vs. situation dependent, overt expression of argumentation, impersonal vs. non-impersonal style). Demnach lässt sich jeder Text anhand des verwendeten Wortschatzes mit Hilfe dieser Dimensionen genau klassifizieren, ob gesprochene oder geschriebene Sprache, ob schöngeistige Literatur oder Presseberichterstattung vorliegt (Biber 1998, S. 133ff.). Zeitungsartikel bestehen aufgrund der Verwendung von Reden, Zitaten und Interviews von Politikern, Sportlern, Prominenten etc. nicht nur aus geschriebener Sprache, sondern auch aus gesprochener: Was Pressesprache ausmacht, ist nicht nur das Fachvokabular des jeweiligen Themenfeldes, sondern auch das Verwenden von Zitaten (Quoting) und das Berichten (Reporting) (Halliday 2004, S. 462). In vielen Fällen wird das Quoting in Anführungszeichen gestellt und durch ein Komma vom Nebensatz abgetrennt, in dem Reporting stattfindet. Bei der englischen Zeitungsberichterstattung ist häufig das Reporting dem Quoting vorangestellt, um das Geschehene besser widerzuspiegeln und plastisch darzustellen. Dementsprechend findet sich das Quoting im Hauptsatz (main clause) und das Reporting im Nebensatz (’verbal’ clause). In der funktionalen Grammatik haben sich dafür die Begriffe projecting clause (’verbal’ process clause) und projected clause (das, was gesagt wurde) eingebürgert (Halliday 2004, S.445). 30 Was sich im Zuge des 11. September häufig feststellen lässt, ist die Tatsache, dass Politikerreden als vollständige Artikel in Zeitungen erscheinen und später nicht differenziert werden kann, ob es sich um eine Rede handelt oder um einen Gastkolumnisten. Diese Texte wirken wie Appelle an die Bevölkerung (z.B. Jack Straw in The Guardian, am 26.10.2001, s.u.). Zeitungsartikel sind nach bestimmten Grundprinzipien aufgebaut, Stichwort: die sechs journalistische W-Fragen Wer? Wie? Was? Wann? Wo? Warum? (Hruska 1999, S. 35 ff). Jedoch gibt es keinen 100-prozentig exakten Bauplan, der von jedermann eingehalten werden kann. Die Differenzen bei der Berichterstattung verschiedener Zeitungen resultieren aus der Hinwendung zu unterschiedlichen Zielgruppen, deren Weltbildern und politischer Gesinnung, aber auch aus den Vorgaben des Chefredakteurs. Eine weitere Größe ist die lexiko-grammatikalische Ausdrucksweise des Verfassers (Biber 1998, S. 84), dessen momentane Stimmung, die Haltung zu einem Thema, aber auch externe Faktoren wie das persönliche Umfeld, das ihn u.U. beeinflussen kann. Es ist anzunehmen, dass eine monarchistisch orientierte Zeitung wie „The Daily Telegraph“ mit Themen die Regentschaft betreffend anders umgeht als eine linksorientierte Zeitung wie „The Guardian“. Umgekehrt gewichtet eine Zeitung wie „The Guardian“ Themen, die die Arbeiterschaft betreffen, anders als die konservative „The Times“. Diese Behauptung könnte durch eine Korpusanalyse verifiziert werden. Es lässt sich in drei Aspekte der Sprachverwendung innerhalb von Zeitungshäusern differenzieren: zunächst der vertikalen Ausdrucksweise innerhalb eines Zeitungshauses in Form von Richtlinien, Sprachregelungen, Redaktionsanweisungen, dann das lexiko-grammatikalische Wissen der einzelnen Autoren, als drittes der Tenor eines Artikels, also der sozialen Distanz, die zwischen dem Autor eines Artikels (speaker) und den Lesern (addressee) herrscht (contextual variables of tenor: status, formality and politeness, Halliday 2004, S.631). Die lexiko-grammatikalische Ausdrucksweise ist abhängig vom Sozialisationsprozess des Autors, der seinen Schreibstil und sein Sprachprofil aus dem Umfeld erworben hat, also in den verschiedenen 31 Sprachdomänen wie Familie, Schule, Universität, Journalistenschule, Freundeskreis und zu guter Letzt vom Redakteur, der ihn in einer Zeitung ausbildete. Doch in der Masse der Zeitungsschreiber verschwimmt der Stil eines einzelnen Journalisten in der Korpusanalyse (Halo-Effekte: Der Gesamteindruck oder eine hervorstechende Eigenschaft einer Person beeinflusst die Beobachtung und Beurteilung anderer Merkmale, Trautner 1997, S.439). Sein Artikel wird jetzt lediglich mitanalysiert, der z.T. informativästhetische Wert, den der Leser bei gutem Journalismus zu schätzen weiß, findet keine Berücksichtigung mehr. Der Stil des Einzelnen hat in der Korpuslinguistik erst einen Wert, wenn von dieser Person hinreichend Material vorliegt. Nur die Masse an Texten zählt und kann ein aussagekräftiges Ergebnis herbeiführen. Im Folgenden sind Wortpaare aufgeführt, die von einer unterschiedlichen Sozialisation der Sprecher oder Schreiber zeugen und damit von einer unterschiedlichen lexiko-grammatikalischen Ausdrucksweise: >MEHRWERT< >PRODUKTIONSMITTEL< >SOZIALISATION< >KAPITAL< >E-KAPITALISMUS< >REVOLUTION< >BASIS< >VOLK< >RESTRIKTIV< >MUSLIMISCH< >ÜBERWACHUNG< >FREIHEITSKÄMPFER< vs. vs. vs. vs. vs. vs. vs. vs. vs. vs. vs. vs. >KONZERNGEWINN< >MASCHINEN< >ERZIEHUNG< >GUTHABEN< >NEW ECONOMY< >UMBRUCH< (siehe 3.1) >GRUNDLAGE< >BEVÖLKERUNG< >AUTORITÄR< >ISLAMISCH< >KONTROLLE< >TERRORIST< Abb. 3: Synonyme Wortpaare aus unterschiedlichen Registern (eigene Beispiele) Die Ausdrucksweise einzelner Autoren wird dadurch aufgehoben, dass eine große Menge an Zeitungsartikeln dreier unterschiedlicher Zeitungen analysiert wird. Dieser Halo-Effect muss aus Gründen des Aufwandes in dieser Dissertation unberücksichtigt bleiben. Es kann 32 nicht für jeden einzelnen Autor eine separate Analyse durchgeführt werden. Interessant wäre ferner die Fragestellung, ob für 1990 mehr tätige Journalisten zu verzeichnen sind als für 2001, was etwaige Veränderungen der Type-Token Relation erklären könnte. Für die Analyse von journalistischer Sprache sind auch andere Korpuskonstellationen denkbar als die in dieser Dissertation vorliegende. So ließen sich Zeitungen nach Up-Market-, MiddleMarket- und Down-Market-Newspapers klassifizieren. Für dies Klassifizierungsschema wurde von Jucker 1992 eine Querschnittsanalyse durchgeführt (nach Stubbs 1996, S.16 ff.), die als Ergebnis lieferte, dass in den 43 000 Nominalphrasen der 371 analysierten Zeitungsartikel bei Up-Market-Newspapers deutlich mehr Modifiers verwendet wurden als bei Down-Market-Papers, zweitens, dass Nominalphrasen-Appositionen in der Lage sind, diese drei Zeitungstypen zu klassifizieren, und drittens, dass Down-MarketNewspapers ständig die Determiner >A< und >THE< in den NPAppositionen weglassen. Es soll an dieser Stelle vorweggenommen werden, dass der Beruf des Journalisten durch die Einführung des Internet gravierende Veränderungen durchlaufen hat, die Arbeitsgrundlage dieser Berufssparte hat sich durch dieses neue Informationsbeschaffungsinstrument enorm erweitert. Technische Kenntnisse sind fortan zunehmend gefragt, es ist ein Umbruch in diesem Berufsstand zu verzeichnen. Neben den veränderten Arbeitsbedingungen hat sich auch die journalistische Kompetenz verändert. Die Anforderungen an den Journalismus sind wegen der z.T. parallelen Aufbereitung der Nachrichten für Print- und OnlineAusgaben gestiegen, und das bei immer knapperen Zeitbudgets (Mast, Popp, Theilmann 1997, S.53ff.). Es konnten sich neue Formen des Textdesigns etablieren (siehe 4.10). Der Sozialphilosoph Habermas gibt in diesem Zusammenhang zu bedenken, dass eben die Mittel uneingeschränkter Kommunikation die Entwicklung kritischer, vernünftiger Argumentation einschränken und in ihrer Wirksamkeit blockieren (Habermas 1982, S.11/12). 33 3.7 Ereignisorientierte Veränderungen von Sprache Es kommt in der Geschichte regelmäßig zu gravierenden nationalen und weltpolitischen Ereignissen, die in der Lage sind, Einfluss auf die Sprachverwendung in einem Staat, Kulturkreis oder Sprachraum zu nehmen. Zu diesen Ereignissen gehören die Französische Revolution, die Machtergreifung der Nationalsozialisten, das Ende des Dritten Reiches, die Kulturrevolution in China, die Reformen Atatürks in der Türkei und der Fall des Eisernen Vorhangs. Im Zuge des Falls der Berliner Mauer und der deutschen Wiedervereinigung fiel offiziell im Bereich der ehemaligen DDR der Fachwortschatz des historischen Materialismus weg, der zuvor die Sprache in den Medien und im politischen Diskurs entscheidend prägte. Stattdessen wurde nach einer gewissen Übergangsperiode der politische Wortschatz der alten Bundesländer adaptiert (siehe 3.1). Nach der weltweiten Einführung des Internet in der uns heute bekannten Form 1991, kam es zu unzähligen sprachlichen Neuerungen, verwiesen sei hier auf die technischen Fachbegriffe des „World Wide Web“, die sprachlichen Besonderheiten des „Chat“ und der Email-Kommunikation, sowie der Fachwortschatz der Informatik. Ein Internet-User benötigt das Fachvokabular der Internet-Nutzung wie >BROWSEN<, >NAVIGIEREN<, >SURFEN<, >WEBDESIGN<, >CACHE<, >COOKIES<, >SPAM FILTER<, >IP-ADRESSE<, >JUNKMAIL< u.v.m. Durch die technischen Neuerungen in den Neunziger Jahren sind Tausende von Begriffen neu ins Lexikon aufgenommen worden, die uns helfen sollen, die neue Technik zu verwenden, zu beschreiben und darüber zu diskutieren. Ferner ist eine Unzahl an neuen Berufen entstanden (>WEB-DESIGNER<, >NETZWERK-SPEZIALIST<, >ONLINE-REDAKTEUR<, etc.). Der Anteil des Computerwortschatzes an der Gemeinsprache in Deutschland hat sich vom Stand Null in den vierziger Jahren auf einen Level erhöht, der bereits 1991 einen Anteil von schätzungsweise zwei Promille erzielte, ausgehend von den Lemmata im Universalwörterbuch (Wichter 1991, S.56, S.127). Diese Tendenz kann sich nach der weitflächigen Einführung des Internet nur weiter verstärkt haben. Das dritte Beispiel, das hier aufgeführt werden soll, sind die sprachlichen Veränderungen, die durch die Terroranschläge vom 11. 34 September 2001 herbeigeführt wurden. Dieser neu etablierte Wortschatz ist geprägt von Sicherheitsthemen, Krisenmanagement und Generalabrechnungen. Auch hier stehen neue Begriffe im Mittelpunkt: >SLEEPER<, >AL-QAIDA<, >AXIS OF EVIL<, >BIOTERRORISM<, >DIRTY BOMB<, >GROUND ZERO<, etc. (siehe Kapitel 5.). Die Nachrichtenagenda wurde auf den Kopf gestellt. Der Laissez-faire-Journalismus wurde ersetzt durch einen Journalismus der Stärke, Kompromisslosigkeit und Loyalität gegenüber den USA. 3.8 Die Grenzen der Korpuslinguistik In der Regel verführt der Computer dazu, ihn auf alles Mögliche anzuwenden, selbst wenn diese Bezugssysteme unausgegoren sind. Problematisch wird dieses nur, wenn daraus Fehlschlüsse gezogen werden, beispielsweise wenn die Sprache von Tacitus, Sallust oder Cicero stellvertretend für die gesamte Epoche als Standard betrachtet wird. So sprechen die amerikanischen Linguisten McEnery und Wilson (2001, S.108) von den drei Irrtümern der historischen Korpuslinguistik: “philologist’s dilemma“, “god’s truth fallacy“ und “mystery of vanishing reliability“. Das „philologist’s dilemma“ liegt vor, wenn die Texte nicht mehr in ihrem Kontext studiert werden können, wenn der Computer nur noch das vorliegende Korpus analysiert und die Quelltexte, Zusatzinformation wie Abbildungen, Literaturhinweise, Fußnoten Schlagzeilengröße, Fettgedrucktes und Bildunterschriften unberücksichtigt lässt. So wird auch die so genannte Pressephonologie (Tench 1990), zumeist ein Schlagzeilenphänomen, unberücksichtigt gelassen. Riesige Schlagzeilen stehen in einem Korpus gleichrangig mit den anderen Bestandteilen, obwohl diese auf den Leser einen besonderen Effekt haben sollen und deshalb eine andere Funktion als der restliche Artikel besitzen. Dieser Beurteilungsgrundsatz sollte bei einer Korpusanalyse berücksichtigt werden. Das Phänomen „god’s truth fallacy“ liegt vor, wenn falsche Rückschlüsse auf eine ganze Epoche gezogen werden. Es sind aus der Antike nur wenige Quellen erhalten, darunter häufig Texte von 35 Geschichtsschreibern, Dichtern und Politikern. Wenn ein Computerprogramm deren Wortschatz und typische grammatische Strukturen ermittelt, so sind diese Erkenntnisse nur auf die Register dieser Personen zu beziehen und nicht auf die von der damaligen Bevölkerung verwendete Sprache. Wenn in einer Analyse festgestellt wird, wie häufig bei Cicero das Gerundium Verwendung findet, darf man dieses nicht für alle sprachlichen Handlungen im gesamten damaligen römischen Reich verallgemeinern. Das heißt für eine Analyse von Presse-Korpora, dass die Ergebnisse nicht auf den gesamten Sprachgebrauch transferiert werden dürfen, auch wenn der Effekt von Medien auf die Bevölkerung nicht unterschätzt werden darf. Das so genannte „mystery of vanishing reliability“ besagt, dass es problematisch ist, wenn innerhalb eines Korpus zu viele Punkte fokussiert werden, da dadurch der Blick fürs Wesentliche verloren geht. Das ist beispielsweise der Fall, wenn in einem getaggten Korpus zu viele Elemente kodiert wurden. Es führte regelrecht in ein Chaos innerhalb eines Korpus Themenfeldzugehörigkeit, soziolinguistische und grammatikalische Variablen gleichzeitig zu kodieren. Es sollte nur ein Bereich fokussiert werden, um zu gewährleisten, dass die Quintessenz herausgefiltert wird. Zu diesem Punkt ist zu bemerken, dass eine Korpusanalyse Unmengen an Daten produziert. Davon kann alles in die Beurteilung einfließen, das für eine nüchterne Bewertung brauchbar ist. Die Kunst sollte darin bestehen, die wichtigsten Ergebnisse herauszufiltern und die gewonnenen Daten in einer akzeptablen Form zu präsentieren. 4. KAPITEL: Die Strukturierung der Korpora und die technischen Hindernisse Das folgende Kapitel soll die Funktionsweise der verwendeten Analysesoftware „Wordsmith“ beschreiben und die Probleme, die auf dem Weg dieser Arbeit in verschiedenen Bereichen zum Tragen kamen. Es wird die Vielzahl von Arbeitsschritten deutlich werden, die zu einer umfassenden computergestützten Textanalyse führt. Wir lernen etwas über die Entstehungsgeschichte der verwendeten 36 Textkorpora, die eigens für diese Analyse aus Zeitungsartikeln aus „The Times“, „The Guardian“ und des „The Independent“ erstellt worden sind. Die genaue Zusammensetzung der Korpora ist in Tabellen dargestellt. Des Weiteren werden die Auswirkungen von gravierenden medienrelevanten Ereignissen wie 9/11 auf die Sprachverwendung in die Diskussion eingebracht. 4.1 Die Funktionsweise von Wordsmith Bei der für diese Korpusanalyse verwendeten Software „Wordsmith“ handelt es sich um die Version 2.0 von Mike Scott & Oxford University Press, eine weit verbreitete Analysesoftware. Vergleichbare Programme sind Word-Cruncher, MonoConc oder Sara, die jeweils unterschiedliche Schwerpunkte in ihren Funktionen vorweisen können. Die Funktionen von Wordsmith sind ausführlich im dazugehörigen Handbuch beschrieben (Scott 1998). Diese Software besteht aus drei Tools: „Wordlist“, „Concord“ und „Keywords“. Diese Tools beinhalten diverse Unterfunktionen. Wird das Tool „Wordlist“ auf ein Korpus angewendet, so werden stets automatisch drei Listen erzeugt: erstens, die alphabetische Wortliste, zweitens, die Häufigkeitsliste, die aus denselben Daten besteht, wie die alphabetische Liste, nur dass diese nach Häufigkeiten, also Anzahl der Token pro Type, geordnet ist. Als drittes wird eine Liste erzeugt, die eine kleine Statistik mit den wichtigsten Korpusdaten enthält. Diese besteht u.a. aus Anzahl der Wörter, Anzahl der Sätze, durchschnittlicher Satzlänge und Type-Token Relation. Das Programm arbeitet auf rein mathematischer Basis. Ein Zeiger läuft den Text, der sich als Zeichenkette oder als String begreifen lässt, von Anfang bis Ende durch, zählt die Wörter so aus, dass für jede Type eine Kategorie eröffnet wird, in der die Anzahl der Token auf der einen Seite als natürliche Zahl und auf der anderen als Prozentzahl festgehalten wird. Ein wichtiger Bestandteil der Korpusstatistik ist die so genannte TypeToken-Analyse, bei der die Type-Token Relation (TTR), die im 37 betrachteten Korpus vorliegt, ermittelt wird. Diese ergibt sich aus der Anzahl der Token eines Textes, also der Anzahl aller Elemente in Form von Wörtern und der Anzahl der verschiedenen Wörter, die Typen genannt werden. Für die Type-Token Relation erhalten wir eine Prozentzahl, die besagt, wie viel Prozent aller Token zugleich auch Typen sind (Anzahl der Typen dividiert durch Anzahl der Token, Ergebnis multipliziert mit 100, Hansen/ Teich 1999, S.311-322). Diese Relation ist nicht zuletzt aus dem Grund sehr wichtig, da sie ein Urteil darüber zulässt, wie umfangreich der Wortschatz eines analysierten Textes oder Korpus ist, also wie viele unterschiedliche Wörter in einem Text oder einer Textsammlung vorkommen. Bei der Analyse sind die einzelnen Wörter grundsätzlich nicht „case sensitive“, d.h. es spielt keine Rolle, ob die Wörter groß oder klein geschrieben sind. Jedoch lässt sich dieses mit Feineinstellungen der Software ändern. Im Rahmen der Statistik des Tools „Wordlist“ wird zusätzlich die durchschnittliche Wortlänge bestimmt, die Anzahl der Sätze und die durchschnittliche Satzlänge in Anzahl der Wörter. Ferner wird die Größe des Korpus in Bytes angegeben. Eine weitere Funktion ist das Auflisten der Wörter nach Anzahl der in ihnen enthaltenen Buchstaben: die Anzahl der Wörter bestehend aus einem Buchstaben (1-letter-words) bis hin zur Kategorie 14(+)letter-words, also die Anzahl der Wörter, die sich aus 14 und mehr Buchstaben zusammensetzen. Ein gravierender Nachteil bei diesen Listen ist die Tatsache, dass Wörter, die aus mehr als zehn oder elf Buchstaben bestehen, nicht vollständig in den Listen erfasst werden können. Deshalb werden entweder die ersten oder die letzten oder die ersten und die letzten Buchstaben abgeschnitten, was in einigen wenigen Fällen Schwierigkeiten bei der Auswertung verursacht. Das Tool „Concord“ listet alle Belegstellen (Konkordanzen) des eingegebenen Wortes, Kompositums bzw. der Wortkette auf, versehen mit ihren Kollokationen. Wordsmith gilt neben CobuildDirect, Lexa, TACT und Hua Xia als eins der wichtigsten KonkordanzTools (Oakes 2003, S.193-195). Die Auflistung kann nach links- und rechtsseitigen Kollokationen sortiert werden. Unter Kollokation verstehen wir die Wortumgebung eines markierten Wortes (Sinclair 1991, S.170). Diese ermöglichten eine weitere Differenzierung und 38 helfen beispielsweise auftretende semantische Formen wie Homonyme (Lyons 1985, S.35) zu bestimmen. Zu kritisieren ist dabei, dass in den Konkordanzlisten nicht der gesamte Satz aufgeführt werden kann, sondern nur ein kleiner Ausschnitt, teilweise auch das Ende des vorhergehenden Satzes oder der Anfang des folgenden. Eine Differenzierung zwischen den semantischen Relationen kann das Programm nicht eigenständig durchführen, auch wenn der gefundene Kontext darüber Aufschluss geben kann. Textorientierte Computersoftware wie Rechtschreib-, Übersetzungsoder Suchprogramme sind heutzutage nur bedingt in der Lage, diese Unterscheidungen eindeutig vorzunehmen (siehe Punkt 6.5.1), es sei denn, dass wir auch die Wortumgebungen (context word) eingeben, die die Bedeutung im Kontext genau definieren helfen. Es kommt ferner darauf an, ob wir eine semantische oder morphologische Fragestellung verfolgen. Auch die Verfahrensweise, dass ganze Wortstrings eingegeben werden, kann zum Ausschluss wichtiger Textstellen aus der Konkordanzliste führen, da hierbei zumeist nicht die unterschiedlichen Ableitungen der Grundform, des Lemmas, mitberücksichtigt werden können. Es ist stets eine genaue Überprüfung der vom Computer produzierten Kollokationslisten erforderlich, ob auch Belegstellen für homonyme und polyseme Wörter aufgelistet wurden.2 Tool Nummer drei „Keywords“ ermöglicht es, ein ausgewähltes Korpus mit einem Referenzkorpus zu vergleichen. Dafür müssen zwei zuvor erstellte Wortlisten abgespeichert werden. „Keywords“ listet die Schlüsselwörter auf und versieht sie mit einem Keyness-Wert. Bei der Anwendung dieses Tools ist ausschlaggebend, welches Korpus Basiskorpus (bzw. Ausgangskorpus) ist und welches Referenzkorpus. Aus dem Basiskorpus werden die Schlüsselwörter extrahiert, also die Wörter, die signifikant häufiger im Basiskorpus vorkommen, als im Referenzkorpus. Die Konstellation kann später vertauscht werden. Somit sind bei drei Korpora (K1, K2 und K3) insgesamt sechs Keyness-Analysen möglich. Wir können sagen, dass die Funktion „Keywords“ die Wörter aus dem Basiskorpus extrahiert, die im Referenzkorpus aus irgendwelchen zu überprüfenden Gründen nicht oder seltener vorhanden sind. 2 Nerlich et. al (2003, S.4) grenzen Polysemie und Homonymie folgendermaßen voneinander ab: während es für homonyme Wörter wie (financial) bank und (river) bank zwei lexikalische Einträge gibt (lexical entries), ist es für polyseme Wörter nur ein Eintrag (z.B. nose, ’facial organ’, ’sense of smell’, ’attribute of a wine’). 39 Entweder existierten sie in dem vom Korpus erfassten Zeitraum noch nicht, sind mittlerweile schon wieder aus der Mode gekommen oder ihr Gebrauch ist nicht mehr zeitgemäß, stigmatisiert oder vergessen. Gleichzeitig werden die Worte aufgelistet, die im Referenzkorpus sehr viel seltener vorkommen. Die Wörter mit der prozentual höchsten Abweichung stehen ganz oben. Der Keyness-Wert ergibt sich mathematisch aus Anwendung von χ²-Tests und Log-LikelyhoodMethode auf die beiden Frequenzwerte und Prozentwerte des zu analysierenden Korpus und des Referenzkorpus (Oakes 2003, S.38, S.189). Die maximale Länge dieser Listen beträgt 500 Einträge. Es lassen sich Grenzwerte in Prozent festlegen, so dass speziell die Wörter extrahiert werden, die außerhalb oder innerhalb dieser Grenzen liegen, also mindestens die gewünschte vorher festgelegte Häufigkeitsdifferenz zum Auftreten im Vergleichskorpus ergeben. So können wir gezielt die Wörter vergleichen, die eine Häufigkeit zwischen 0,5 % und 0,75 % in den Textkorpora haben. Das kann u.U. wichtig sein, wenn beispielsweise zwei scheinbar identische Korpora miteinander verglichen werden sollen. Besonders der Vergleich von Worthäufigkeiten und deren anschauliche Darstellung in Listenform stellt ein ausgezeichnetes Arbeitsinstrument dar. 4.2 Die Korpusprotokolle Zu jedem Textkorpus wurden während der Erstellung die wichtigsten Begleitinformationen in einem Korpusprotokoll festgehalten. Dieses Vorgehen war aus den folgenden Gründen unerlässlich: Die Protokolle sind zum einen die Basis für die spätere Statistik, zum anderen gelten sie als Anhaltspunkt, wie weit die Korpuserstellung fortgeschritten ist. Zunächst wurden sechs Korpusprotokolle erstellt. Darin sind die Indizes der Korpora aufgeführt (Times.1990, Independent.1990, Guardian.1990, Times.2001, Independent.2001, Guardian.2001), das Datum der erfassten Zeitungsausgabe, das erfasste Themenfeld, Anzahl der Artikel pro Publikationstag und Themenfeld und die ersten drei Wörter der ersten und letzten Schlagzeile pro Themenfeld und 40 Tag. Die Protokollerstellung ist akribisch durchgehalten worden, um gegebenenfalls bei einer Unterbrechung der Arbeit am Korpus sofort den bisher erreichten Punkt wieder zu finden. Nachdem aus Designgründen, d.h. wegen einer besseren Auswertung von Texten im Zusammenhang mit dem 11. September 2001, die Korpusgrenzen noch einmal verändert wurden, mussten weitere Texte gesammelt werden. Zwecks besserer Unterscheidung erhielten die Subkorpora eigene Bezeichnungen (Times.2001.danach, Independent.2001.danach, Guardian.2001.danach, siehe 4.6). Die Subkorpora mit Artikeln bis einschließlich dem 11. September erhielten das Kürzel 2001.davor.3 Die Korpusprotokolle beinhalten Randnotizen, die bestimmte Auffälligkeiten festhalten, die während der Korpuserstellung bemerkt wurden, in erster Linie Themenhäufungen infolge von politischen Ereignissen (z.B. >POLL TAX DEMONSTRATION<, >LITHUANIA<, >GERMAN REUNIFICATION<, etc.). Diese Vorgehensweise sollte bei der späteren Datenauswertung hilfreich sein. Die Anzahl der bisher gesammelten Artikel wurde festgehalten, um kalkulieren zu können, wie viele Artikel für das derzeit bearbeitete Unterkorpus noch benötigt werden. Ferner konnte vorab berechnet werden, wie viel Zeit auf die weitere Korpusarbeit zu verwenden war. Aus diesen Protokollen wurden schließlich die eigenen Korpusstatistiken erstellt (siehe Punkt 4.9), die nicht zu verwechseln sind mit den Korpusstatistiken, die von Wordsmith erstellt wurden. Letztendlich wurden nur das Datum, Zeitung und Zeitraum, Themenfeld und die Anzahl der Artikel pro Themenfeld in diese Statistiken übernommen. Die Protokolle gelten deshalb als eine unverzichtbare Orientierungsgrundlage, als auch später die Korpora noch einmal überarbeitet wurden, um beispielsweise die textlichen Metainformationen zu tilgen, Sichwort: Post-Editing und Stripping (siehe 4.7). Außerdem bieten sie wichtige Anhaltspunkte, wenn die Korpora für andere Zwecke oder Projekte weiterverwendet oder Teile extrahiert werden sollen. Das Protokoll ist insofern unerlässlich. 3 Der 11. September fiel direkt in die Phase der Korpuserstellung. 41 4.3 Das Korpusdesign Die erfolgreiche Durchführung einer Korpusanalyse ist abhängig vom Erstellen bzw. Designen des Textkorpus oder der Textkorpora nach wissenschaftlichen Kriterien. Wenn stichhaltige Ergebnisse erzielt werden sollen, müssen mindestens zwei Korpora miteinander verglichen werden. Diese Korpora sollten einer einheitlichen Thematik zugeordnet werden. Als Kategorien könnten zu Grunde gelegt sein: Texte aus Qualitätszeitungen, Zeitungstyp, Texte aus der Rubrik Politik, etc. Diese Baupläne müssen für alle verwendeten Korpora gleichermaßen „wie ein Kochrezept“ gelten. Doch es müssen unterscheidende Variablen wie Zeitungsjahrgang oder Zeitungstyp festgelegt werden, je nachdem, ob eine diachrone oder synchrone Analyse durchgeführt werden soll. Das Design darf die Ergebnisse der Analyse auf keinen Fall zu manipulieren versuchen. Es müssen die Gesetze der Statistik angewendet werden, da es sich bei einem Textkorpus um eine Stichprobe der Gemeinsprache handelt. In der Statistik wird differenziert in Zufallsstichproben, Klumpenstichproben und geschichtete Stichproben (Bortz 2005, S.8689). Bei den für die vorliegende Analyse verwendeten Zeitungstexten handelt es sich um Zufallstichproben, da jeweils aus der Masse aller Zeitungsartikel bestimmte Artikel herausgegriffen wurden. Dies geschah nicht systematisch, auch wenn teilweise aufeinander folgende Ausgaben verwendet wurden (siehe Punkt 4.9). Ein Textkorpus ist immer nur ein Ausschnitt einer umfangreichen Textmenge. Zunächst muss die Größe des zu erstellenden Korpus festgelegt werden. Als Faustregel gilt, dass das Korpus so umfangreich sein muss, dass es statistisch verwertbare Ergebnisse liefert. Dieses ist stets vom Untersuchungsgegenstand abhängig und wie viel Textmaterial dazu vorhanden ist. Eine optimale Stichprobengröße gibt es deshalb nicht. Jedoch haben Untersuchungen gezeigt, dass eine Korpusgröße von 20 000 Wörtern ausreichend groß sein kann, um statistisch verlässliche Ergebnisse über Häufigkeiten zu erlangen, es sei denn, dass der Forschungsgegenstand zu komplex ist (De Haan 1992, S.3 ff.). Da im vorliegenden Fall qualitative Veränderungen von Zeitungssprache, speziell bei britischen Qualitätszeitungen analysiert 42 werden sollen, sind umfangreichere Korpusgrößen veranschlagt worden. Dabei haben zwei Parameter die Entstehung der insgesamt drei Hauptkorpora beeinflusst: das ist zum einen die Einführung des Internet, und zum anderen der 11. September 2001. Generell muss die Gesamtzahl der Wörter, Artikel oder Zeitungsausgaben so repräsentativ sein, dass exakte Rückschlüsse auf den Sprachgebrauch in dem analysierten Medium, die Wortwahl, den Stil und die Ausdrucksweise gezogen werden können, aber auch auf Rechtschreibfehler, sofern dieses thematisiert wurde. Erst eine ausreichende Menge von analysierten Presse-Texten lässt ein adäquates Urteil über den Sprachgebrauch einer Zeitung zu, der mal verallgemeinernd, mal einzelfallbezogen, mal zusammenfassend, mal reißerisch, mal objektiv und mal detailliert sein kann. Biber geht in „Corpus Linguistics“ (1998, S.148) von sechs Determinierungsmöglichkeiten für Textkorpora aus: Korpusgröße, Repräsentativität, Diversität, Korpusbestandteile, Korpusquelle und synchrones vs. asynchrones Korpus. Mit dem Thema Korpusgröße haben sich bereits diverse Linguisten auseinandergesetzt (Armstrong 1994; Kennedy 1998, S.66; Sinclair 1991, S.18/19). Es zeigt sich, dass es stark divergierende Meinungen dazu gibt. Die Tendenz geht dahin, dass immer größere Korpora verwendet werden. Diese Entwicklung geht Hand in Hand mit dem Fortschritt auf dem Computersektor. Im Rahmen der hier vorliegenden Arbeit wurde vorab eine Korpusgröße festgelegt, die ausreichen sollte, um als sinnvolle Stichprobe zu gelten. In der Korpuslinguistik ist es üblich, runde Zahlen für die Anzahl der Wörter festzulegen (British National Corpus (BNC): 100 Millionen). Deshalb wurde für diese Untersuchung entschieden, drei Korpora mit insgesamt 4 Millionen Wörtern zusammenzustellen, die sich jeweils aus drei Unterkorpora zusammensetzen. Diese Korpusgröße ist ausreichend, um als sinnvoll verwertbare Stichprobe zu gelten. Als Orientierungsmarke sei angeführt, dass das vollständige LondonLund-Corpus of Spoken Englisch aus 100 Texten mit insgesamt 500 000 Wörtern gesprochener englischer Sprache besteht (Svartvik 1990, S.14). Für die Untersuchung ist es wichtig, dass ein ausreichender Zeitraum zwischen den beiden Korpora K3 (1990) und K2 (2001 vor dem 11.9.) liegt, um sprachliche Veränderungen, verursacht durch die 43 Einführung des Internet, ergründen zu können. Dabei wurden rund zehn Jahre Differenz als ausreichend erachtet. Durch das dritte Korpus, ein Vergleichskorpus, das aus nach dem 11.September erschienenen Zeitungsartikeln besteht, kann diesen sprachlichen Veränderungen noch eine weitere Vergleichskomponente zugeordnet werden. Die Entscheidung für die Größe der Korpora hatte zunächst nur praktische Gründe, um ein Limit festzusetzen, das gegebenenfalls später noch einmal korrigiert werden könnte, nachdem ein erster Einblick in die Materie genommen wurde. Ferner musste die Korpuserstellung stetig vorangebracht werden, da bei der Korpuslinguistik das Zusammentragen der Texte u.U. das größte Problem darstellen kann. Gerade im Laufe der Korpuserstellung gewinnt der Designer ständig neue Erkenntnisse über die Korpusquellen. Ein Korpus kann aber auch zu groß sein: es sind Grenzen durch die Speicherkapazität und Funktionalität der Rechner gesetzt, das Korpus muss vom Analyseprogramm eingelesen werden können, der Zeitund Kostenfaktor ist zu berücksichtigen. Das Alphabet und die verwendeten Zeichen müssen für die Software lesbar sein. Der Aufwand bei der Erstellung darf nicht zu groß werden. Wir können den folgenden Leitsatz der Arbeitspsychologie darauf beziehen: Effektivität ist das Verhältnis von Aufwand zu Ergebnis (Hacker 2005, S.107). Ferner war dieses Prozedere außerordentlich wichtig, da zu diesem Zeitpunkt noch keine statistischen Daten über die Korpusquellen in Form der Online-Zeitungen, der Zeitungs-CD-Roms und der Electronic Database des „British Council“ vorlagen. Erst die aktive Arbeit mit diesen Quellen ergab neue Erkenntnisse über die Einteilung und Stärke der Themenkreise und die Anzahl der tagtäglich erscheinenden Artikel. Dennoch wurden Vorannahmen getätigt, indem originale Printausgaben überschlägig durchgezählt wurden. Die dadurch gewonnenen Zahlen waren nur bedingt verallgemeinerbar, da Gesamtseitenzahl, Artikelzahl pro Seite, Themenfeld und die Themenfeldeinteilung selbst sich als stark veränderbar herausstellten, zumal Großereignisse einen nicht zu vernachlässigenden Einfluss auf die Zeitungsprodukte Printausgabe, Online-Zeitung und CD-Rom nehmen können. 44 Das ideale Korpus wäre jenes, das tatsächlich alle Artikel eines Jahrgangs einer Zeitung enthält. Doch dafür wäre der Aufwand zu hoch. Stattdessen bietet es sich an, eine geeignete Stichprobe aus allen erschienenen Artikeln einer Zeitung in einem einzigen Jahr nach statistischen Kriterien auszuwählen, also in Form einer Zufallsstichprobe. Aus praktischen Gründen habe ich mich für die drei Qualitätszeitungen „The Times“, „The Guardian“ und „The Independent“ als Grundbestandteile entschieden, da diese zu den wenigen englischen Qualitätszeitungen gehören, die für 1990 auf CDRom erhältlich waren. Optional hätten „The Daily Telegraph“ oder das Nachrichtenmagazin „The Economist“ verwendet werden können. Im Hinblick auf den Punkt Korpusrepräsentativität werden Überlegungen unternommen, inwieweit die zusammengestellten Texte für die Gesamtheit des zu untersuchenden Spektrums der Sprache repräsentativ bzw. ob sie aussagekräftig für ein ganzes Jahr sind: Kann die Stichprobe für die Gesamtheit an Texten platz-, zeit- und arbeitssparend verwendet werden? Können die gewonnenen Korpusdaten verallgemeinert werden? Von einem lexikalischen und grammatikalischen Standpunkt her gesehen, kann Zeitungssprache als repräsentativ für die gesamte englische Sprache gelten. Doch wir können mit aus Zeitungsartikeln bestehenden Korpora keine Rückschlüsse auf andere sprachliche Register ziehen, denn dafür sind die Korpora nicht erstellt. Wir können nicht anhand von Zeitungssprache gesprochene Sprache bewerten, es sei denn, dass wir ein Vergleichskorpus mit gesprochener Sprache heranziehen. Der nächste zu berücksichtigende Punkt ist die Diversität des Korpus. Dieser Faktor beschreibt, welches Spektrum der Sprache im Korpus widergespiegelt wird. Dazu gehören Parameter wie verwendete Zeitungen, Erscheinungszeitraum, die verschiedenen Themenkreise, und ob gesprochene oder geschriebene Sprache verwendet wurde.4 Die Texte, die Eingang in das Korpus finden, werden genau definiert. Man spricht von einem ausgeglichenen Korpus (balanced corpus), wenn unterschiedliche Texttypen enthalten sind (Kennedy 1998, 4 Das Korpus K1 ist nicht zuletzt deshalb eine Ausnahme, weil infolge von 9/11 ungewöhnlich viele Politikerreden und Zitate wiedergegeben sind: das ist in den anderen Korpora in der Intensität nicht der Fall. 45 S.22). Reine Presse-Korpora sind jedoch vergleichsweise einseitig, auch wenn es innerhalb einer Zeitung unterschiedliche Textsorten gibt (Kommentar, Interview, Reportage, Orientierungstexte, Leitartikel u.v.m.). Beim Korpusdesign kann in „hard news“ und „soft news“ unterschieden werden (Semino, Short 2004, S.20). In dieser Dissertation wurden beide Nachrichten-Typen berücksichtigt. Wenn zwei oder mehr Korpora miteinander verglichen werden, ist es wichtig, dass deren Bestandteile dieselben Themenfelder oder Rubriken abdecken. Wenn jedoch eine Zeitung innerhalb eines Untersuchungszeitraumes die Bezeichnung für die Rubriken bzw. Themenfelder ändert, so wie es in den 90er Jahren auch bei „The Guardian“ geschehen ist, so muss ich mir die Themenfelder aussuchen, die mit denen des Vergleichskorpus übereinstimmen. Textkorpora sind deshalb vergleichbar, weil sie dieselben Grundkategorien enthalten wie Texttyp, dieselbe Sprache, identisches Speicherformat, proportionale Textmengen, vergleichbare Quellen, etc. Korpusbestandteile sollten jene Elemente sein, die in einzelnen ausgewählten Medien und deren unterschiedlichen Ausgaben erschienen sind und laut Definition in das Korpus hineinpassten. Aus der Masse der 10 219 Artikel entfallen auf K1 2211 Artikel, K2 enthält 2398 Artikel, und K3 5610 (siehe 4.12). Die Determinierungsmöglichkeit Korpusquelle gibt nicht nur Aufschluss darüber, welche Herkunftsmedien herangezogen wurden. Relevant ist auch die Erscheinungszeit, Medientyp, Autor und Bezugsquelle. Das sind in dieser Analyse die Zeitungsausgaben von „The Times“, „The Guardian“ und „The Independent“ der Jahre 1990 und 2001, jedoch sind die Speichermedien Online- oder CDRom-Ausgaben und die Electronic Database. Die genaue Aufschlüsselung erfolgt in Kap. 4.6. Letztendlich entscheidet die Vorgabe des Korpusdesigns und die Arbeitshypothese, welche Quellen zu verwenden sind. Das Material muss gesichtet und auf Brauchbarkeit überprüft werden. Wenn wir die Printausgaben einer Zeitung vergleichen wollen, ist es sehr viel einfacher, die Texte von einer CD-Rom, aus einer OnlineZeitung oder der Electronic Database in ein Textdokument zu kopieren. Allerdings muss dabei gewährleistet sein, dass die maschinell gespeicherten Artikel mit denen der Printversion identisch 46 sind. Das sollte stichprobenhaft überprüft werden und ist im Rahmen dieser Dissertation geschehen. Die verwendeten Online-Zeitungen sind vergleichsweise spät ins Leben gerufen worden. Nach Auskunft der Online-Redaktionen ist „The Times“ seit dem 1. Januar 1996 online, „The Guardian“ seit Januar 1999 und „The Independent“ seit Mitte 1999. Online-Zeitungen lassen sich unterschiedlichen Gestaltungsprinzipien zuordnen (Bucher 1998, S. 95 ff, Bucher 1999, S. 16-20): Strukturvariante, Sparvariante, Boulevardvariante, Listenvariante, Schalttafel, Ressortvariante, Schaufenstervariante und verschiedene Kombinationsformen. Die drei für die Korpusgestaltung verwendeten Online-Zeitungen stellen eine Kombination aus Ressort- und Listenvariante dar, wirken jedoch wegen der vielen Fotos, Hyperlinks und Orientierungstexte wie Boulevardvarianten. Für 1990 wären in allen drei Fällen CD-Roms erhältlich. Die als dritte Quelle verwendete „Electronic Database“ des „British Council“ ist erst seit 2003 im Netz zu finden. Das letzte Kriterium, das Biber als Grunddeterminante des Korpusdesigns nennt, ist die Unterteilung in „synchrones vs. asynchrones Korpus“. Bei einer synchronen Korpusanalyse müssen die zu vergleichenden Korpora dieselbe Zeitspanne abdecken. Auf diese Art und Weise ließe sich überprüfen, in welcher sprachlichen Form (register) unterschiedliche Zeitungen während desselben Zeitraumes berichten und welcher Tenor verwendet wird. Der Korpus-Vergleich dieser Dissertation ist eine diachrone Sprachanalyse bzw. Längsschnitt oder Longitudinalanlyse. Der Zeitraum, der zwischen den ersten beiden Korpora liegt (K3 zu K2), beträgt rund 10 Jahre. Die Zeitphase, die zwischen K1 und K2 liegt, ist jedoch lediglich die Phase zwischen der Veröffentlichung der Ausgaben am frühen Morgen des 11. September GMT und dem Folgetag. Im Gegensatz zu Biber nennt Tognini-Bonelli die Design-Kriterien „authenticity, representativeness und sampling“ (2001, S.55-62). Die drei von mir erstellten Presse-Korpora haben einzig die Funktion, die sprachlichen Veränderungen zwischen 1990 und 2001, und speziell verursacht durch den Anschlag auf das World Trade Center, 47 analysieren zu helfen. Damit wird der Primacy-Recency Effect (siehe 5.12) zum Design-Kriterium. Was die Bestandteile der Korpora anbetrifft, habe ich mich aus praktischen Gründen für „The Times“, „The Independent“ und „The Guardian“ entschieden: Die Quellen waren am besten verfügbar. Das Korpus von 1990 besteht zu 1 Million Wörter aus „The Times“, 500 000 Wörter aus „The Guardian“ und 500 000 Wörter aus „The Independent“. Die beiden Korpora von 2001 bestehen jeweils zu 500 000 Wörtern aus „The Times“, zu 250 000 Wörtern aus dem „The Guardian“ und noch einmal zu 250 000 Wörtern aus dem „The Independent“, so dass sich folgende KorpusNormung ergibt: 50 % an Text aus der „The Times“ und jeweils 25 % aus „The Guardian“ und „The Independent“. Der Boulevardpresse zuzuordnende Blätter wie „The Mirror“, „The Daily Star“, „The Sun“, „The Express“ sowie „The Daily Mail“ wurden gemäß Fragestellung der Dissertation außer Acht gelassen. „The Daily Telegraph“ stand für 1990 nicht als CD-Rom in Berlin zur Verfügung, existiert jedoch für dieses Jahr. Es erleichterte die Arbeit, dass ich bei dem Korpus von 2001 die Artikel zum größten Teil direkt aus den Online-Zeitungen herauskopieren konnte. Bei dem Jahrgang 1990 konnte ich auf CDRoms zurückgreifen. Es fällt auf, dass das Korpus von 1990 doppelt so groß ist wie jedes einzelne von 2001. Das wurde festgelegt, damit die beiden Korpora von 2001 später zu einem 2-Millionen-Wort-Korpus zusammengefasst werden konnten, das sich besser mit dem Korpus von 1990 vergleichen ließ. Ferner fällt auf, dass „The Times“ doppelt so stark vertreten ist wie die anderen beiden Zeitungen. Dieses ist gerechtfertigt, da „The Times“ eine deutlich stärkere Auflagenzahl aufweist als die beiden anderen verwendeten Zeitungen (Auflagenzahl Juli-Dez. 1997: The Times 792 151, The Guardian: 403 999, The Independent: 260 223; Quelle: Audit Bureau of Circulations). Hauptmotiv war jedoch, dass ein aussagefähiges Korpusmodell geschaffen werden sollte. Weitere Parameter wie Schichtzugehörigkeit der Leser, Parteinahme und Boulevardisierungsgrad konnten nicht oder nur am Rande berücksichtigt werden. Um die Korpora von 2001 nach der Tilgung des Metatextes (siehe Punkt 4.7) und der Überarbeitung der Korpusgrenzen wegen des 11. 48 September (Punkt 4.4.) wieder aufzufüllen, wurden mittlerweile für 2001 verfügbare CD-Roms und die 2003 installierte „Electronic Database“ verwendet. 4.4 Überarbeitung des Korpusdesigns Ursprünglich sollten nur zwei Korpora für diese Dissertation erstellt werden, das eine für 1990 und das andere für 2001. Trotz des 11. September wurde das ursprünglich geplante Eine-Million-WortKorpus von 2001 fertig gestellt. Von den darin enthaltenen Wörtern wurden genau 19,01 % der Zeitungsartikel bis einschließlich dem 11.9.01 und 80,99 % danach geschrieben. Wäre dieses Korpus beibehalten worden, hätte der Primacy-Recency-Effect (siehe Kapitel 5.12) nicht berücksichtigt werden können. Spätere Beobachtungen wären beeinflusst durch frühere Beobachtungen interpretiert worden, d.h., etwaige Veränderungen hervorgerufen durch den 11. September wären durch die Ruhephase in der Zeit davor in den Korpusdaten aufgehoben worden. Das Gewicht von Schlüsselwörtern und anderen Korpus-Daten hätte sich deutlich abgeschwächt. Eine Korpusgrenze direkt auf dem 11. September hingegen ermöglichte sehr viel differenziertere Urteile. Doch der 11. September hatte dermaßen gravierende Auswirkungen auf die Weltpolitik, dass die Fragestellung der Dissertation dahingehend geändert wurde, dass nicht nur ein Korpusvergleich zwischen 1990 und 2001 vorgenommen werden konnte, sondern auch eine Untersuchung über Auswirkungen des 11. September auf die Pressesprache in Großbritannien. Zusätzlich kam die Tatsache zum Tragen, dass bereits im Korpus von 1990 ein Konflikt mit einem arabischen Staat auf der Zeitungsagenda stand: die Kuwait-Krise, die sich maßgeblich in der Berichterstattung widerspiegelte. Es konnte deshalb besser verglichen werden, wie 1990 im Vergleich zu 2001 in der Presse mit den Krisen im arabischen Raum5 umgegangen wurde. 5 In dieser Dissertation wird der Begriff „Arabischer Raum“ bevorzugt, da selbst in den Ländern, in denen trotz islamischer Religion andere Amtssprachen gesprochen werden als Arabisch, trotzdem Standardarabisch die Sprache der Koranschulen ist (siehe: Crystal 1997, S. 318). 49 Das bisherige Korpus als Textdokument wurde ab dem Erscheinungstag der Ursprungsartikel am 12.9.2001 in zwei ungleiche Teile geteilt, das einen enthielt 19,01 % des bisherigen Korpus, das andere 80,99 %. Beide neu zu gestaltenden Korpora sollten je 1 000 000 Wörter beinhalten. Da aber die aktuellen Online-Zeitungen im Netz nicht mehr verfügbar waren, mussten Zeitungs-CD-Roms und die Electronic Database herangezogen werden. Deshalb wurde das Korpus „2001.davor“ (K2) soweit verfügbar mit Artikeln aus CD-Roms und mit Artikeln aus der Electronic Database des British Council aufgefüllt, bis die eine Million Wortgrenze erreicht war (siehe Punkt 4.9 Zusammenstellung der Subkorpora). Dafür mussten Zeitungsartikel mit rund 800 000 Wörtern gesammelt werden. Die 80,99 Prozentanteile des Ursprungskorpus, die nach dem 11. September erschienen sind, wurden für „2001.danach“ (K1) ebenso auf 1 000 000 aufgefüllt, obwohl hierfür lediglich etwa 200 000 neue Wörter erforderlich waren. Die Artikel stammen aus der Electronic Database des British Council. In beiden Fällen wurden die Größenverhältnisse beibehalten, d.h. je 500 000 Wörter aus „The Times“ und je 250 000 für beide Korpora aus „The Guardian“ und „The Independent“. Es wurde eine weitere Arbeitshypothese aufgestellt, die besagt, dass das Ereignis 11. September die Zeitungssprache nachhaltig verändert hat. Das zweite Korpus von 1990 soll in einer zweiten Betrachtungsweise lediglich als Vergleichskorpus dienen, während die beiden Korpora „vor“ und „nach dem 11. September“ als zwei separate Hauptkorpora betrachtet werden. Dennoch wurde die ursprüngliche Überlegung, dass sprachliche Veränderungen durch die Einführung des Internet bewirkt wurden, nicht außer Acht gelassen, auch wenn diese Frage wegen der überwältigenden Auswirkungen von 9/11 immer stärker in den Hintergrund treten musste. 4.5 Sortieren der Unterkorpora Nachdem die einzelnen neun Unterkorpora bzw. Korpussegmente erstellt waren, mussten diese wie die Einzelteile eines Mosaiks zu drei 50 Hauptkorpora K1, K2 und K3 zusammengefügt werden. Das Gleiche geschah bei der Erstellung des Superkorpus, in dem die drei Hauptkorpora ein Textdokument konstituieren. Auch wenn bei den Hauptanalysen alle Texte „in einen Topf“ geworfen werden, ist es wichtig, die chronologische Reihenfolge der Zeitungsartikel einzuhalten, ebenso die im Protokoll manifestierte Themenkreiseinteilung wie Politics, Overseas News oder UK News, etc. (siehe 4.9 und 4.10), um gegebenenfalls zwecks Überprüfungen oder bei Unstimmigkeiten in den später erstellten Listen die betreffende Stelle im Korpuskontext noch einmal aufrufen zu können. Die Sortierung der Unterkorpora ergibt sich automatisch aus dem vorher festgelegten Korpusdesign und den chronologisch geordneten Protokollen. Wenn die Teilkorpora von Metatext befreit sind, müssen sie gegebenenfalls noch auf ihr Soll-Maß gebracht werden. Dieses Auffüllen geschah, indem sie durch weitere Texte auf die vom Design geforderte Soll-Größe gebracht wurden (s.u.). 4.6 Entstehungsprozess und Textformatierungsprobleme Bei der Erstellung der Korpora kam es immer wieder zu Formatierungsproblemen der Word-Dokumente, deren Quelltexte unterschiedlichen Datenträgern entnommen wurden. Die Datenträger, die verwendet wurden, waren erstens Online-Zeitungen von 2001. Diese existierten 1990 noch nicht, konnten folglich für das Korpus von 1990 nicht verwendet werden. Zweitens, die „Electronic Database“ des „British Council“ in Berlin, die ebenfalls 1990 noch nicht existierte, und schließlich die unterschiedlichen CD-Roms sowohl von 1990 als auch von 2001, die zum Teil unterschiedliche Texteditoren verwenden. Als die Korpusarbeit 2001 gestartet wurde, existierten die CD-Roms mit dem Gesamtjahrgang der drei verwendeten Zeitungen von 2001 noch nicht. Um brauchbare Korpora zu erstellen und einen vernünftigen Zeitrahmen zu wahren, musste auf verschiedene Speichertypen zurückgegriffen werden: die CD-Roms als klassische Konserve, die Online-Zeitungen (bei denen man heute nicht weiß, wie lange die Artikel im Internet stehen, wie und ob sie archiviert 51 werden), und schließlich die erst seit 2003 verfügbare OnlineDatenbank des „British Council“, die nur für Mitglieder und Besucher des „British Council“ zugänglich ist. Ferner entstand das Problem, dass die Texte beim Kopieren in die Word-Dokumente einen unterschiedlichen Schriftgrad und Schrifttyp besaßen, dass die Absätze, sofern vorhanden, unterschiedlich arrangiert waren. Außerdem war die Zeilenlänge nicht immer einheitlich. Diese Tatsache hatte Konsequenzen bei der Erstellung der Konkordanzlisten, da bei verkürzten Zeilen, die nur aus drei, vier oder fünf Wörtern bestehen, nicht die volle Zeilenlänge übertragen wurde. Schließlich sind mehrere der Unterkorpora deshalb Mischkorpora, weil unterschiedliche Speichermedien als Quellen verwendet wurden, auch wenn das keinen oder nur einen geringen Effekt auf den Inhalt hatte6. Quelle prozentualer Anteil The Times online 15,25 The Independent online 6,25 The Guardian online 6,25 The Guardian-CD-Rom 1990 12,5 The Guardian CD-Rom 2001 6,25 The Independent-CD-Rom 1990 12,5 The Times-CD-Rom 1990 25 Electronic Database The Times 9,75 Electronic Database The Independent 6,25 Summe 100,0 % % % % % % % % % % Anzahl der Artikel 1917 466 491 1212 555 1434 2964 547 633 10219 Tab. 1: Verwendete Speichermedien bzw. Quelldateien und deren prozentualer Anteil an der Menge aller verwendeter Artikel. 6 Im Subkorpus Independent.2001.danach sind aus diesem Grunde ca. 5 – 10 Artikel doppelt enthalten. Das liegt vermutlich daran, dass sie innerhalb der Online-Zeitung in unterschiedlichen Themenfeldern aufgeführt waren, bzw. unterschiedliche Datumsangaben vorlagen. An einigen wenigen Stellen sind ferner Rückstände von Metatext vorhanden. Designfehler sind fast nicht zu vermeiden. Diese Fehlergröße wurde als nicht gravierend hingenommen. 52 Onl.-Times 6,25 9,75 Onl.-Independent 15,25 Onl.-Guardian 6,25 Guard.-CD-R 1990 6,25 Guardian CD-R 2001 25 12,5 12,5 Indep.-CD-R 1990 6,25 Times-CD-R 1990 Electr. Database Times Electr. Database Indep. Grafik 1: Die für die Korpora verwendeten Korpusquellen (Angaben in Prozent) Die dritte Form der hier verwendeten Speichermedien, die „Electronic Database“ des „British Council“, ist ein OnlineTextarchiv, in dem die Zeitungsartikel von den CD-Roms der großen britischen Zeitungen zur Verfügung gestellt sind, die über ein spezielles Eingabefeld abgerufen werden können. Das hat zur Konsequenz, dass die Artikel unter anderen Themenfeldern eingeordnet sind, als auf den CD-Roms. Eine stichprobenhafte Überprüfung ergab, dass diese Artikel mit denen im Printprodukt und auf CD-Rom übereinstimmen.7 Des Weiteren sind zwar die Editorfenster der CD-Roms aller verfügbaren Qualitätszeitungen 1990 noch dieselben, doch die längeren Artikel passen nicht auf eine Editorseite. 2001 wurden bereits andere Editoren verwendet, die jedoch keine einheitlichen Konstrukte sind, sondern von Zeitung zu Zeitung variieren. 7 Laut Rademann 1998 (ICAME-Journal Nr. 22, S. 49-71) sind 97 % der Texte und 65 % der Fotos der Printausgaben auch in den Online-Zeitungen enthalten. 53 4.7 Metatext als relevante Fehlergröße Maschinell abgespeicherte Quelltexte auf CD-Rom, in Emails oder in Online-Zeitungen o.Ä. können unter Umständen so genannte Headerinformationen, Struktur- oder Metainformationen enthalten (Carstensen et al. 2001, S.371). Diese Informationen sind entweder nicht für den menschlichen Leser gedacht, oder dienen der datentechnischen Klassifizierung von Texten und damit der Orientierung des Lesers. Der ursprünglich in den drei Hauptkorpora enthaltene Metatext, schätzungsweise 150 000 Wörter, stellte eine nicht zu unterschätzende Fehlergröße dar, die eine statistische Auswertung der Korpora unnötig verzerrt hätte. Deshalb wurden die Textsammlungen nachträglich von Metatext befreit und mit rund 600 Artikeln neu aufgefüllt, um das festgelegte Limit von zwei mal zwei Millionen Wörtern wiederherzustellen. Auch hier wurde wieder auf die Zeitungs-CDRoms und die Electronic Database zurüchgegriffen. Metatext ist sowohl auf den als Quelltext verwendeten CD-Roms von 1990 und 2001 als auch bei den Online-Zeitungen von 2001 und der „Electronic Database“ vorhanden. Er war in jedem der insgesamt 10 219 verwendeten Zeitungsartikel sowohl am Anfang als eine Art Kopftext zu finden, der eine Klassifizierung für eine spätere Verwendung oder datentechnische Verarbeitung darstellt. Bei einer großen Anzahl von Artikeln war zusätzlich Metatext am Ende als Schlussinformation enthalten. SOURCE: The Guardian DATE: 03 January 1990 HOME PAGE 2 1/2 Rating expert's gut rejection Dennis Barker Bsp. 1: Metatext am Anfang eines Artikels, in den die Schlagzeile eingebettet ist (aus: The Guardian CD-Rom von 1990) 54 Source: The Times (London, England), July 13, 2001 p14. Title: Pentagon to break arms pact in months.(Home news) Electronic Collection: CJ76523905 RN: CJ76523905 Full Text COPYRIGHT 2001 The Times Byline: Michael Evans Defence Editor and Ben Macintyre in Washington Bsp. 2: Metatext eines Zeitungsartikels aus der „electronic database“ des British Council Die Wortlisten wären unter einer Miteinbeziehung des Metatextes stark verzerrt gewesen, da Begriffe wie >SOURCE<, >DATE<, >NEWS<, >PAGE<, >FOREIGN<, >THE INDEPENDENT<, >THE GUARDIAN<, >THE TIMES<, >HOME<, >UK<, >AUTHOR<, >PHOTOGRAPH<, >OMITTED<, >PRESS<, >IN<, >PARIS<, >KABUL<, >AMMAN<, >JERUSALEM<, >WASHINGTON<, >CORRESPONDENT<, >MONDAY<, >TUESDAY<, >NOVEMBER<, >AUG<, >IND<, >1990<, >2001<, >CD-ROM<, >EDITOR<, >HEALTH<, >REUTERS<, >UPDATE<, >FIRST<, >SECOND<, >MAP<, >FORECAST<, >EDITION<, >TITLE<, u.v.m. z.T. Ränge unter den 100 wichtigsten Wörtern belegt hätten. Die Häufigkeit anderer Typen wäre demgegenüber unterbewertet gewesen. Die durch den Metatext erzeugte Fehlergröße hätte sich nachträglich mathematisch berechnen lassen, d.h. wir hätten mit der Fehlergröße arbeiten können. Es ließe sich ein Faktor berechnen, der besagt, wie hoch die tatsächliche Verzerrung der Korpora durch Metatext ist. Eine weitere Alternative wäre gewesen, alle zunächst mitgespeicherten Metatexte in ein separates Extrakorpus oder sogar unterteilt in Metatextkorpus 1990 und 2001 usw. abzuspeichern. Tatsächlich sind die drei Korpora in zwei Versionen auf CD-Rom abgespeichert worden, einmal mit Metatext und einmal ohne. Im letzteren Fall wurden die Korpora wie erwähnt noch einmal aufgestockt. Zusätzlich für die Korpora mit Metatext eine Frequenzanalyse durchzuführen und auszuwerten hätte den Rahmen gesprengt, hätte zu dem Ziel dieser Dissertation, die sprachlichen 55 Veränderungen zu erkunden, nicht beitragen können, lediglich zum Untersuchen der Fehlergröße Metatext. Das Wesentliche ist freilich nicht der für die maschinelle Speicherung und Archivierung von Programmierern zur Orientierung eingefügte Metatext, sondern der tatsächlich in der Printausgabe erschienene Text. Nur an den Pressetexten lassen sich sprachliche Veränderungen adäquat überprüfen. 4.8 Layout-Redundanz Wenn wir Zeitungstexte zum Bestandteil unserer Korpora machen, so kommen diverse typografische Elemente der Printprodukte, der online- und cd-rom-basierten Zeitungstexte in den erstellten Korpora nicht mehr zur Geltung, da sie bei einer rein textuellen Analyse redundant sind. Sie können nicht vom Analyseprogramm registriert werden. Darunter fallen Elemente wie Layout, Textdesign und Formatierung. Dazu zählen ferner Äußerlichkeiten wie Fett-, Kursivdruck und Unterstreichungen, Schriftgrad, Schlagzeilen in ihren unterschiedlichen Ausformungen, Hyperlinks, Schrifttyp, Spalten- und Zeilenarrangement, Seitenaufteilung etc. Dasselbe gilt für Fotos und deren Bildunterschriften. Die Verwertung von CD-Rom und Online-Texten für eine Verwendung in Textkorpora nennt sich Post-Editing und Stripping (Rademann 1998, S. 49-71). Folglich sind alle Elemente, die die Aufmachung von Zeitungen ansprechend und attraktiv erscheinen lassen, ob im Internet oder auf Papier, im Rahmen einer Korpusanalyse überflüssig und tragen nicht zu den softwaregestützten Ergebnissen bei. Bei Korpusanalysen wird nur der rohe Text analysiert. Wenn innerhalb eines Zeichensystems verschiedene Codes verwendet werden, sprechen wir von Multicodalität (Dölling 2001, S.35 ff). Im Gegensatz zu den Ursprungstexten, die von den Codes Zeitungstext, Pressefotografien, Überschriften, Textdesign etc. geprägt sind, sind Textkorpora von diesen Formen befreit, ebenso von Phänomenen wie Bildüberlegenheit und Suggestivwirkung von Überschriften (Bignell 1997, S.96 ff). Diese Tatsache ist vom Korpusdesigner während der 56 Erstellung der Korpora zu berücksichtigen. Abgesehen von dem zu Grunde liegenden, nicht sichtbaren ASCII-Code, haben wir es innerhalb von Textkorpora, die unter dem Format „nur Text + Zeilenwechsel“ gespeichert sind, mit einem einzigen Code zu tun, der englischen Schriftsprache. Die für das Medium Internet so typische neue Schriftformen des Hypertextes (Storrer 1999, S.33-62), aber auch die Layout- bzw. Textdesignformen auf den Zeitungs-Webpages wie Übersichtstexte, Orientierungstexte und Infoleisten, etc. (Bucher 1998, S.77 ff.), sind im Rahmen von Korpusanalysen irrelevant. Diese Gestaltungselemente von Webpages, aber auch die von Editoren bei Zeitungs-CD-Roms und Online-Datenbanken, spielen bei der letztendlichen Korpusanalyse deshalb keine Rolle, weil sie von der Korpusanalysesoftware nicht erfasst werden können. Dennoch zählen diese Textmerkmale visuell zu den Hauptveränderungen in der Medienlandschaft der 90er Jahre, sowohl im Internet und als Reflex darauf in den Printmedien. 4.9 Die Zusammenstellung der Subkorpora Jedes der drei Korpora (K1, K2 und K3) setzt sich aus drei Unterkorpora zusammen. In Anlehnung an Sinclair (1998, S.115 ff.) wird der Begriff Subkorpus als Klassifizierungsgröße verwendet. Im Folgenden sind die Bestandteile dieser dreimal drei Subkorpora in Tabellenform dargestellt. Die Parameter für die Auswahl dieser Bestandteile sind Anzahl der Artikel pro Erscheinungstag und Anzahl der Artikel pro Themenfeld. Dabei stand gemäß den Vorgaben des Korpusdesigns das Themenfeld Politik zur Disposition, das je nach betrachteter Zeitung in weitere Teilbereiche unterteilt ist. Die Subkorpora sind in eine chronologische Reihenfolge gebracht, was deren Erscheinungszeitraum anbetrifft. Überschneidungen gab es dabei nicht. Die erste Tabelle beschreibt das jüngste Korpus, die letzte das älteste. Zunächst K1: Das erste hier aufgeführte und damit jüngste Subkorpus ist Independent.2001.danach. Die Quelle für dieses Korpus, der 57 Independent-Online hat die Themenfeldeinteilung UK und World. Dieses Subkorpus beinhaltet 466 Zeitungsartikel mit insgesamt 250 292 Worten8. Anzahl der Artikel pro Themenfeld UK World Zeilensumme Datum 26.11.2001 29.11.2001 30.11.2001 01.12.2001 03.12.2001 04.12.2001 06.12.2001 07.12.2001 08.12.2001 10.12.2001 11.12.2001 Spaltensumme 48 34 40 54 29 10 27 34 3 279 5 47 25 23 25 13 19 8 22 187 53 34 40 101 25 52 35 13 46 42 25 466 Tab. 2.: Subkorpus Independent.2001.danach, Bestandteil von Korpus K1, Korpusquelle: Online-Zeitung von The Independent, (www.independent.co.uk) Zwei der Hauptereignisse innerhalb der Berichterstattung von The Independent waren der erste menschliche Klon und der Krieg in Afghanistan. The Guardian-Online hat, was die Rubrik Politik anbetrifft, folgende Themenfeldeinteilung: UK News, Politics und International. Das spiegelt sich im Subkorpus Guardian.2001.danach wider. Dieses Subkorpus beinhaltet 250 241 Wörter aus 491 Artikeln. Die Artikel verteilen sich wie folgt: 8 Die Gesamtzahlen basieren auf der Microsoft Word Zählung, die nach der Fertigstellung der Korpora erhoben wurde. 58 Anzahl der Artikel pro Themenfeld UK News Politics International Zeilensumme 25.10.2001 26.10.2001 27.10.2001 29.10.2001 30.10.2001 31.10.2001 01.11.2001 02.11.2001 05.11.2001 06.11.2001 07.11.2001 08.11.2001 09.11.2001 24 8 22 15 20 23 21 22 23 18 15 20 27 3 18 12 6 9 17 1 11 4 6 2 8 24 22 10 14 8 22 10 24 2 - 27 34 22 51 48 42 52 30 46 39 43 28 29 Spaltensumme 258 89 144 491 Datum Tab. 3.: Subkorpus Guardian.2001.danach, Bestandteil von Korpus K1, Korpusquelle: Online-Zeitung von The Guardian (www.guardian.co.uk) Ein Schwerpunkt der Berichterstattung dieses Subkorpus lag auf der Flächenbombardierung Afghanistans, die bereits am 7.10.2001 begann. Das Subkorpus Times.2001.danach ist zwei verschiedenen Quellen entnommen, nämlich der Online-Times und der Electronic Database des British Council. Es besteht aus exakt 500 018 Wörtern aus 1254 verschiedenen Zeitungsartikeln. Die Online-Times setzt sich aus diversen Themenfeldern zusammen: Politics, World News und einem Feld Homepage, dem ausschließlich Artikel entnommen wurden, wenn sie etwas mit dem Themenfeld Politik zu tun hatten. Artikel aus den Bereichen Sport, Kultur und Wirtschaft blieben unberücksichtigt. Die Online-Times ist so aufgebaut, dass alle in der Printversion erschienenen Artikel über die Auswahl „Newspaper Edition“ ausgewählt werden können. Die Artikel aus der Electronic Database sind mit denen in der Printausgabe identisch. 59 Anzahl der Artikel pro Themenfeld Politics World News British News Homepage Datum 12.09.2001 14.09.2001 15.09.2001 18.09.2001 19.09.2001 20.09.2001 21.09.2001 22.09.2001 24.09.2001 25.09.2001 26.09.2001 27.09.2001 28.09.2001 29.09.2001 01.10.2001 02.10.2001 04.10.2001 06.10.2001 08.10.2001 10.10.2001 12.10.2001 13.10.2001 15.10.2001 5 8 4 5 7 10 5 6 - 16.10.2001 17.10.2001 18.10.2001 19.10.2001 20.10.2001 22.10.2001 23.10.2001 24.10.2001 Spaltensumme Zeilensumme War on Terror 20 21 18 21 22 19 20 15 16 20 13 23 17 16 11 21 16 19 18 25 Home News 43 43 48 43 39 33 51 45 19 9 9 17 13 18 20 16 17 11 12 7 11 8 - 41 40 6 20 21 23 21 30 23 39 24 25 37 26 41 37 36 35 39 38 32 29 44 41 40 6 - 4 2 1 5 Overseas News 24 22 23 25 32 28 24 24 - - 67 65 71 68 71 61 75 69 50 214 716 187 87 1254 Tab. 4.: Subkorpus Times.2001.danach, Bestandteil von Korpus K2, Korpusquellen: Online-Zeitung der Times, (www.thetimes.co.uk), ab 16.10.2001 Electronic Database des British Council Die Hauptereignisse in diesem Subkorpus sind der 11. September, der War on Terror, erste Stellungnahmen von Politikern und der Beginn der Bombardierung Afghanistans. Das besondere an der Themenkreisaufteilung ist die Tatsache, dass ab dem 12.10.2001 ein neues Themenfeld eingefügt worden ist (War on Terror). Artikel aus den Feldern World News, Homepage und War on Terror wurden nur übernommen, wenn sie nicht bereits in den 60 Kategorien Politics und British News erschienen waren und vice versa. Bei der nachträglichen Auffüllung konnten nur Artikeln aus der Electronic Database verwendet werden, da die CD-Rom nicht verfügbar war. Diese hat wiederum eine andere Themenfeldaufteilung: Overseas News und Home News. Die drei folgenden Tabellen beschreiben die Zusammensetzung von K2, erneut in chronologischer Reihenfolge. Als erstes sei hier das Subkorpus Times.2001.davor dargestellt. Die darin enthaltenen Artikel wurden ausschließlich der Online-Times entnommen. Die verwendeten Themenfelder sind Politics und British News. Es enthält 1210 Artikel mit insgesamt 500 171 Wörtern. Anzahl der Artikel pro Themenfeld Datum 02.08.2001 03.08.2001 04.08.2001 06.09.2001 07.08.2001 08.08.2001 10.08.2001 11.08.2001 13.08.2001 14.08.2001 15.08.2001 16.08.2001 17.08.2001 18.08.2001 20.08.2001 21.08.2001 22.08.2001 24.08.2001 25.08.2001 27.08.2001 28.08.2001 29.08.2001 30.08.2001 31.08.2001 01.09.2001 03.09.2001 04.09.2001 05.09.2001 08.09.2001 10.09.2001 11.09.2001 Spaltensumme Politics 2 4 2 2 4 5 1 6 7 5 6 4 6 4 3 5 2 3 5 6 3 8 5 7 British News 10 35 43 51 39 39 41 36 34 35 34 38 34 36 30 39 38 35 29 34 32 32 32 39 43 25 41 38 41 34 38 Zeilensumme 10 35 43 51 39 39 43 40 36 37 38 43 35 42 37 44 44 39 35 34 36 35 37 41 46 30 47 41 49 39 45 105 1105 1210 - Tab. 5.: Subkorpus Times.2001.davor, Bestandteil von Korpus K2, Korpusquelle: Online-Zeitung der Times, (www.thetimes.co.uk) 61 Die Hauptereignisse in diesem Subkorpus waren der 101. Geburtstag von Queen Mother und ihr späterer Tod. Für die nachträgliche Auffüllung des Subkorpus Independent.2001.davor war eine CD-Rom verfügbar. Deshalb sind die Themenfelder der CD-Rom maßgeblich. Es liegt hier wiederum eine Einteilung in Title Page, News und Foreign News vor. Es wurden erneut nur Artikel aus dem Themenfeld Titlepage verwendet, wenn sie etwas mit dem Thema Politik zu tun hatten. Insgesamt wurden 633 Artikel eingebaut, die 250 145 Wörter beinhalten. Anzahl der Artikel pro Themenfeld Title Page News Foreign News Zeilensumme Datum 02.07.2001 03.07.2001 04.07.2001 05.07.2001 06.07.2001 07.07.2001 09.07.2001 10.07.2001 11.07.2001 13.07.2001 5 1 4 8 4 3 4 6 6 6 39 47 41 56 42 35 30 44 50 29 11 26 20 29 14 21 17 19 16 - 55 74 65 93 60 59 51 69 72 35 Spaltensumme 47 413 173 633 Tab. 6.: Subkorpus Independent.2001.davor, Bestandteil von Korpus K2, Korpusquelle: Electronic Database Eines der Hauptthemen in diesem Subkorpus war der Prozess um ehemaligen serbischen Diktator Milošević. Für die nachträgliche Erstellung von Guardian.2001.davor konnte eine CD-Rom verwendet werden. Die Online Zeitungen waren für diese Zeitphase nicht mehr verfügbar. In der folgenden Tabelle ist die auf dieser CD-Rom getroffene Einteilung in Home News und Overseas News übernommen. Insgesamt beinhaltet dieses Subkorpus 555 Artikel mit 250 104 Wörtern. 62 Anzahl der Artikel pro Themenfeld Datum 01.06.2001 02.06.2001 04.06.2001 05.06.2001 06.06.2001 07.06.2001 08.06.2001 09.06.2001 Home News 65 53 54 56 62 65 76 44 Overseas News 14 11 8 12 10 13 12 - Zeilensumme 79 64 62 68 72 78 88 44 Spaltensumme 475 80 555 Tab. 7.: Subkorpus Guardian.2001.davor, Bestandteil von Korpus K2, Korpusquelle: CD-Rom des Guardian 2001 In diesem Subkorpus war eins der Haupthemen die Unterhauswahl in Großbritannien. In den folgenden Tabellen sind die Bestandteile der drei Subkorpora von K3 aufgeführt. Von der Anzahl der Wörter insgesamt ist K3 so groß wie K1 und K2 zusammen, jedoch nicht von der Anzahl der Artikel (siehe Punkt 4.11). Das unten beschriebene Subkorpus Independent.1990 enthält 1434 Artikel bestehend aus 500 011 Wörtern. Die Artikel sind der Independent-CD-Rom von 1990 entnommen. In das Range dieses Subkorpus fällt als Hauptereignis die Invasion Kuwaits durch den Irak. 63 Anzahl der Artikel pro Themenfeld Title Page Home News Page Foreign News Page Editorial Page Zeilensumme 01.08.1990 02.08.1990 03.08.1990 04.08.1990 06.08.1990 07.08.1990 08.08.1990 09.08.1990 10.08.1990 11.08.1990 13.08.1990 14.08.1990 15.08.1990 16.08.1990 17.08.1990 18.08.1990 20.08.1990 21.08.1990 3 8 5 4 6 5 4 7 4 5 4 4 4 4 5 3 47 44 37 37 24 43 29 35 32 31 29 34 36 34 30 32 54 33 35 30 35 51 39 32 41 38 37 45 48 46 55 41 45 57 23 - 5 1 2 3 3 3 1 2 - 90 75 82 93 70 84 78 77 77 80 82 84 97 79 79 94 77 36 Spaltensumme 75 641 698 20 1434 Datum Tab. 8.: Korpus Independent.1990, Bestandteil von Korpus K3, Korpusquelle: The Independent CD-Rom 1990 Die vorhandenen Themenfelder sind Title Page, Home News Page, Foreign News Page und Editorial Page. Die Artikel wurden nur in den Fällen den Themenfeldern Title Page und Editorial Page entnommen, wenn diese dem Bereich Politik zugeordnet werden konnten. Das achte Subkorpus und damit das „achtälteste“ ist Times.1990. Darin enthalten sind genau 2964 Artikel mit 1 000 001 Wörtern. Es ist das größte aller neun Subkorpora. 64 Anzahl der Artikel pro Themenfeld Datum 02.04.1990 03.04.1990 04.04.1990 05.04.1990 06.04.1990 07.04.1990 09.04.1990 10.04.1990 11.04.1990 12.04.1990 13.04.1990 14.04.1990 16.04.1990 17.04.1990 18.04.1990 19.04.1990 20.04.1990 21.04.1990 23.04.1990 24.04.1990 25.04.1990 26.04.1990 27.04.1990 28.04.1990 30.04.1990 01.05.1990 02.05.1990 03.05.1990 04.05.1990 05.05.1990 07.05.1990 08.05.1990 09.05.1990 10.05.1990 11.05.1990 12.05.1990 14.05.1990 15.05.1990 16.05.1990 17.05.1990 18.05.1990 19.05.1990 Spaltensumme Home News 36 37 52 53 68 40 41 35 48 43 44 40 47 31 40 39 48 48 29 46 38 38 58 52 36 47 48 40 53 46 41 46 58 45 46 39 41 42 55 50 52 12 Foreign News 31 27 28 30 29 24 28 34 32 23 24 21 22 31 34 30 26 26 29 27 31 25 32 28 32 32 32 32 32 29 28 30 27 26 23 33 25 36 7 20 - Zeilensumme 36 68 79 81 98 69 65 63 82 75 67 64 68 53 71 73 78 74 55 75 65 69 83 84 64 79 80 72 85 78 70 74 88 72 72 62 74 67 91 57 72 12 1848 1116 2964 Tab. 9.: Subkorpus Times.1990, Bestandteil von Korpus K3, Korpusquelle: The Times CD-Rom 1990 Die Artikel stammen aus der Times-CD-Rom von 1990, die darin implementierten Themenfelder sind Home News und Foreign News. 65 In diesen Untersuchungszeitraum fallen die Unabhängigkeitsbestrebungen im Baltikum. Abschließend ist hier die Verteilung der 1212 Artikel im Subkorpus Guardian.1990 aufgelistet. Es beinhaltet 500 248 Wörter. Die Artikel entstammen der The Guardian CD-Rom von 1990, auf der die Themenkreise Home News, Foreign News und City News implementiert sind. Anzahl der Artikel pro Themenfeld Home News Foreign News City News Zeilensumme 30 26 30 34 40 32 3 28 37 39 33 47 41 6 37 54 51 36 29 23 13 18 39 16 16 15 10 18 30 15 13 16 20 7 9 29 18 26 26 11 19 27 34 15 17 27 31 21 66 58 72 70 105 74 3 55 71 76 85 92 41 6 69 94 98 77 604 291 317 1212 Datum 01.01.1990 02.01.1990 03.01.1990 04.01.1990 05.01.1990 06.01.1990 07.01.1990 08.01.1990 09.01.1990 10.01.1990 11.01.1990 12.01.1990 13.01.1990 14.01.1990 15.01.1990 16.01.1990 17.01.1990 18.01.1990 Spaltensumme Tab. 10.: Subkorpus Guardian.1990, Bestandteil von Korpus K3, Korpusquelle: The Guardian CD-Rom 1990 Viele Artikel in diesem Subkorpus berichten über die Proteste im Zuge der Einführung der Poll Tax in Großbritannien. Die Tatsache, dass unterschiedliche Datenträger verwendet werden mussten, zeugt von dem Umbruch und den damit verbundenen Schwierigkeiten in der Computerindustrie. Während 1990 ausschließlich CD-Roms als Datenspeicher für die Öffentlichkeit zur Verfügung standen, waren 2001 parallel dazu bereits OnlineZeitungen erhältlich, und ab 2003 die Electronic Database, der rückwirkend Artikel entnommen werden konnten. Erschwerend kam bei der Erstellung hinzu, dass Online-Zeitungen zumeist am Folgetag nicht mehr aufrufbar waren oder nur noch partiell. 66 4.10 Veränderungen in den Themenfeld-Bezeichnungen Die für diese Korpusanalyse zusammengetragenen Presse-Texte sollen primär das Themengebiet Politik abdecken. Darunter wird sowohl die landes- als auch die internationale Politik gefasst. Werfen wir einen näheren Blick auf die Quellen der für die drei Hauptkorpora (K1, K2, K3) verwendeten Zeitungstexte, so stellen wir fest, dass es in den Bezeichnungen für die Themenfelder der herangezogenen Medien zu Veränderungen gekommen ist. Die Themenfelder variieren sowohl von Zeitung zu Zeitung, als auch in den jeweiligen Erhebungszeiträumen und innerhalb der verschiedenen Speichermedien. Die klassische Genreeinteilung in Politik, Wirtschaft, Kultur, Sport und Lokales, wie wir sie von deutschen Tageszeitungen kennen (Faulstich 2004, S.486), ist in den britischen Qualitätszeitungen nicht vorzufinden, obwohl es gewisse Ähnlichkeiten gibt. Deshalb wird der Begriff Themenfeld bzw. -kreis gegenüber dem des Genres bevorzugt. Zeitung The Times The Independent The Guardian Title Page, Editorial Page, Home News Page, Foreign News Page Quelle: CD-Rom Home News, Foreign News, City News Quelle: CD-Rom Korpus K3 (von 01.01.1990 bis 21.08.1990) Home News, Foreign News Quelle: CD-Rom K2 (von 1.6.2001 bis 11.9.2001) K1 (von 12.09.2001 bis 11.12.2001) Politics, Title Page, News, Home News, British News Foreign News Overseas News Quelle: Online-Zeitung Quelle: Electronic Database Quelle: CD-Rom Politics, Homepage, UK, World News, World British News, War on Terror Quelle: Online-Zeitung Quelle: Online-Zeitung und Electronic Database UK News, Politics, International Quelle: Online-Zeitung Tab. 11: Die für die Korpusanalyse verwendeten Themenfelder Die Tabelle listet die unterschiedlichen in den Ursprungsmedien verwendeten Themenfeldbezeichnungen auf. Die Veränderungen in 67 den Bezeichnungen sind darauf zurückzuführen, dass Zeitungen im Laufe der Zeit ihre Aufmachung verändern. Das vollzieht sich nicht nur in punkto Textdesign, Infografiken, Bildqualität, Layout, Werbung und Format, sondern auch in den Bereichen Artikellänge und Themenfeldeinteilung. Auch Printmedien müssen sich dem Zeitgeist anpassen, maßgeschneiderte Textverarbeitungsprogramme und andere redaktionelle Software halten Einzug in den Redaktionen. Die technischen Veränderungen in Zeitungsverlagen und Redaktionen sind in Deutschland bis in die Regionalpresse spürbar (Lilienthal 1998, S.110). Das äußere Erscheinungsbild von Zeitungen und anderen Printmedien wurde in den letzten Jahren entscheidend von neuen Formen des Textdesigns geprägt (Bucher 1998, S.66), aber auch von farbenprächtigen, suggestiv wirkenden und mit vielen Berichten über Prominente ausgestatteten Hochglanzmagazinen. Die Online-Zeitung als Hypertext wirkt zurück auf das ursprüngliche Printprodukt: Printmedien entwickeln zunehmend hypertextuelle Strukturen (Delinearisierung der Zeitung, Bucher 1999, S.12). Viele Entwicklungen sind als Reflex auf neue Produktions-, Speicher- und Publikationsverfahren zu begreifen, genannt seien hier nur die computerbasierten Layoutprogramme, die Nachbearbeitung von Fotografien und die parallele Aufbereitung von Artikeln für Print- und Online-Ausgaben, was zu einer Etablierung neuer Texttypen wie Orientierungstext, Ankündigungstext und Promo-Box bzw. Infokasten geführt hat. 4.11 Anzahl der Artikel pro Subkorpus Was Veränderungen bei der Anzahl der Artikel in britischen Zeitungen anbetrifft, existiert bereits eine Untersuchung über die The Guardian-CD-Roms von 1990 bis 1996 (Fischer 1998, S.72-80). In der Analyse wurde u.a. festgestellt, dass die Anzahl aller Artikel aus allen Themenbereichen zusammen auf der CD-Rom von 1990 genau 47 308 Artikel beträgt. Bis zu der CD-Rom für das Jahr 1996 (57 854 Artikel) ist ein Anstieg von rund 10 000 Artikeln oder 22 % zu verzeichnen. Die Online-Zeitung von The Guardian existiert jedoch 68 erst seit Januar 1999. Der Prozess der massiven Veränderungen der Werte wie Artikellänge und Wortmenge hat folglich schon vor der Freischaltung der Online-Version von The Guardian eingesetzt. Ähnlich verhält es sich mit den Wortzählungen. Die totale Anzahl an Wörtern pro Jahr stieg von 1990 bis 1996 laut Fischer um 25 %. Die durchschnittliche Anzahl an Wörtern pro Artikel stieg nur unwesentlich bei einem deutlichen Anstieg der Anzahl der Artikel. Im Folgenden sind die Befunde für den Vergleich die Artikelmengen und -längen in den neun Subkorpora dieser Dissertation dargestellt. Aufgrund der unterschiedlichen verwendeten Speichermedien kann diese Analyse lediglich Tendenzen widerspiegeln. Anzahl Artikel K1 Independent.2001.danach Guardian.2001.danach Times.2001.danach K2 Times.2001.davor Independent.2001.davor Guardian.2001.davor K3 Independent.1990 Times.1990 Guardian.1990 ∑ der Anzahl der Wörter Wörter/ Artikel im Durchschnitt 466 491 1254 248281 243808 494344 532,79 496,55 394,21 1210 633 555 501090 247276 246699 414,12 390,64 444,50 1434 2964 1212 498852 1007262 500577 347,87 339,83 413,02 10219 3988189 Tab. 12.: Anzahl der Artikel und Wörter/ Artikel Subkorpora9 in den Zur besseren Veranschaulichung sind die Werte aus Tabelle 12 im Folgenden als Balkendiagramme dargestellt: 9 Weshalb Wordsmith für die Hauptkorpora und die Summe der Subkorpora unterschiedliche Zählungen vornimmt, ist fraglich. 69 nd en t.2 G ua 00 rd 1. ia da n. na 20 ch Ti 0 1. m da es na .2 00 ch 1. Ti da m In es de na .2 pe ch 0 01 nd .d en av t.2 G or ua 00 rd 1 .d ia n. av 20 or In 0 de 1. da pe vo nd r en t.1 99 Ti 0 m es G .1 ua 99 rd 0 ia n. 19 90 In de pe N Artikel 70 Subkorpus Grafik 3: Anzahl der Artikel in den Subkorpora Guardian.1990 Times.1990 Independent.1990 Guardian.2001.dav or Independent.2001. davor Times.2001.davor Times.2001.danac h Guardian.2001.dan ach Independent.2001. danach Anzahl der Wörter Anzahl der Wörter in den Subkorpora 1200000 1000000 800000 600000 400000 200000 0 Subkorpus Grafik 2: Anzahl der Wörter in den Subkorpora In Grafik 2 sticht deutlich der Wert von Times.1990 hervor (1 007 262 Wörter). Anzahl der Artikel 3500 3000 2500 2000 1500 1000 500 0 Grafik 3 zeigt, dass Times.1990 die größte Anzahl an Artikeln enthält, gleichzeitig aber die kürzesten Artikel (s.u. Grafik 4). Die geringste Anzahl hingegen erreicht das Subkorpus Independent.2001.danach, das wiederum die insgesamt längsten Artikel enthält. 600 500 400 300 200 100 0 In de pe nd en t.2 G ua 00 rd 1. ia da n. na 20 ch Ti 0 1 m .d es an .2 ac 00 h 1. Ti da m In es na de .2 ch pe 0 01 nd .d en av t.2 G or ua 00 rd 1 .d ia av n. 20 or In 0 1. de da pe vo nd r en t.1 99 Ti 0 m es G .1 ua 99 rd 0 ia n. 19 90 N Artikel Wörter/ Artikel im Durchschnitt Subkorpus Grafik 4: Durchschnittliche Artikellänge in den Subkorpora Die Grafik verdeutlicht noch einmal, dass sich die längsten Artikel in den Subkorpora Independent.2001.danach und Guardian.2001.danach befinden. Die kürzesten Artikel finden wir hingegen in Times.1990 (1 007 262 Wörter, 2964 Artikel, 339,83 Wörter pro Artikel) und Independent.1990 (498 852 Wörter, 1434 Artikel, im Durchschnitt 347,87 Wörter pro Artikel). Im Subkorpus Guardian.1990 befinden sich bei einer Anzahl von 500 577 Wörtern 1212 Artikel. Das sind im Durchschnitt 413,02 Wörter pro Artikel. Es ist eine deutliche Tendenz zu längeren Artikeln von 1990 bis 2001 zu verzeichnen. Für die drei Subkorpora von 2001.davor (K2) erhalten wir für Guardian.2001.davor 555 Artikel bei 246 699 Wörtern insgesamt. Das sind 444,50 Wörter pro Artikel im Durchschnitt. Zugleich ist das der höchste Durchschnittswert von K2. Independent.2001.davor beinhaltet 633 Artikel bei 247 276 Wörtern. Das sind 390,64 Wörter pro Artikel im Durchschnitt. Independent.2001.davor beinhaltet 71 folglich die kürzesten Artikel in K2. Einen Mittelwert nimmt Times.2001.davor ein. Die insgesamt 501 090 Wörtern sind auf 1210 Artikel verteilt, das sind im Durchschnitt 414,12 Wörter pro Artikel. Im jüngsten Korpus K1 ragt der Wert von Times.2001.danach heraus (494 344 Wörter, 1254 Artikel, im Durchschnitt nur 344,21 Wörter pro Artikel). Den mittleren Wert nimmt Guardian.2001.danach ein. Bei 243 808 Wörtern sind das 491 Artikel und im Durchschnitt 496,55 Wörter. Das ist der zweitgrößte Wert aller neun Subkorpora. Die längsten Artikel in dieser Untersuchung enthält Independent.2001.danach. Es ist zugleich das jüngste aller Korpora. Es beinhaltet bei 248 281 Wörtern 466 Artikel. Im Durchschnitt sind das 532,79 Wörter. Deshalb können wir des Weiteren schlussfolgern, dass sich die Artikellänge en gros auch durch den Einfluss des 11. September vergrößert hat. Jedoch stellt die Times dabei eine Ausnahme dar. Die Zahlen zeigen ferner, dass nach der Einführung des Internet und neuer Formen des Textdesigns die Zeitungsartikel länger geworden sind. Die von Fischer (1998) festgehaltene Tendenz (s.o.) lässt sich nur bedingt an dem hier gewählten Korpusdesign bestätigen. Die Anzahl der Artikel in den Subkorpora ist nicht gleichzusetzen mit der Gesamtzahl der auf Zeitungs-CD-Rom erhältlichen Artikel eines Jahrgangs.10 5. KAPITEL: Der 11. September als Ausgangspunkt für Veränderungen in Sprache, Medien und Gesellschaft Dieses 5. Kapitel greift das globale Hauptereignis des Jahres 2001 auf, die Terroranschläge in den USA. Doch wie vermitteln die Medien die Katastrophe und ihre Folgen? Was sind die Hintergründe und was leisten die Medien zur Aufklärung und Deeskalation, oder tragen sie sogar zur Eskalation bei? Verschiedene publizistische Theorien werden herangezogen, um diese Fragen zu beantworten, ergänzt durch die Ergebnisse der Korpusanalyse. 10 Eine Zählung aller Artikel auf den Ursprungs-CD-Roms von 1990 und 2001 wurde im Rahmen der hier vorliegenden Dissertation nicht vorgenommen. 72 Das Ereignis und die Folgen sind ausschließlich im Textkorpus K1 reflektiert. Die Auswertung der Korpusanalysen erfolgt im sechsten Kapitel. Zuvor wird das folgende fünfte Kapitel die Vorarbeit zum medientheoretischen Verständnis leisten und die Brisanz der Medienberichterstattung andeuten. 5.1 Das Ereignis 11. September Am 11.9.2001 flogen zwei Passagierflugzeuge mit einem zeitlichen Abstand von 18 Minuten in die beiden Türme des „World Trade Centers“ in New York an der Lower East Side Manhattan. Der Einschlag der Maschinen bewirkte, dass die beiden Türme nacheinander in sich zusammenbrachen. Parallel dazu schlug eine weitere Passagiermaschine ins Pentagon ein. Dieses Ereignis ging später als größter Terroranschlag aller Zeiten in die Geschichte ein. Bei dieser Katastrophe kamen 2981 Menschen ums Leben (Time, 10. April 2006, S.45), Millionen von Augenzeugen wurden stark traumatisiert. Weltweit brach Trauer und Empörung über diese schreckliche generalstabsmäßig durchgeführte Terroraktion aus. Die Welt stürzte in eine seelische Krise (Todd 2002, S.17). Als Folge kam es zu verschärften Maßnahmen in der Sicherheitspolitik und als sekundärer Reaktion zu ersten Kriegshandlungen gegen das angeblich mitverantwortliche Talibanregime in Afghanistan. Die Reaktionen der USA auf diesen wohl fürchterlichsten Terroranschlag aller Zeiten wurde weltweit mit gemischten Gefühlen aufgenommen. Als mutmaßlicher Drahtzieher dieses Anschlages stellte sich später der islamische Radikale Osama Bin Laden heraus. Selten hat ein einzelnes Ereignis derart immense Auswirkungen auf die Berichterstattung in den Medien gehabt wie das des 11. September. Grundsätzlich muss gesagt werden, dass die Berichterstattung in Zeitungen maßgeblich von den unterschiedlichen Ereignissen abhängig ist. So waren einige relevante Ereignisse 1990 der Panamakrieg, die deutsche Wiedervereinigung, die Poll Tax Demonstrationen in Großbritannien und die Kuwait-Krise. Themen sind selten so gravierend, dass sie der täglichen Berichterstattung in bedeutendem Maße eine neue Prägung geben. 2001 gab es eine ganze Menge an herausragenden Begebenheiten, doch keines hatte so 73 umwälzende Effekte wie die großen Terroranschläge. Sie standen als „hard news“ massiv im Mittelpunkt und verdrängten viele unerhebliche Geschehnisse bzw. „soft news.“ Es wurde seitenweise über den Terrorakt berichtet und nicht nur in ein bis drei Artikeln, wie es sonst bei gewöhnlichen politischen Ereignissen der Fall ist. Je relevanter das Ereignis, je größer das öffentliche Interesse, desto größer auch die Reaktion der Medien. Es sind sonst nur Kriege wie Vietnamkrieg, Golfkrieg oder Balkankriege, aber auf der anderen Seite auch die Reaktorkatastrophe von Tschernobyl, die besonders breit gefächerte Berichterstattungen bewirkten und die sehr lange in den Medien präsent waren. So heißt es beispielsweise in Stscherbacks Protokollen zu Tschernobyl: „Es waren dafür keine Lösungen, keine technischen Mittel vorgesehen. …Wir hatten für solch eine Situation keinen Verhaltensalgorithmus“ (Stscherbak 1988, S.168 u. S.169). Dieses Urteil lässt sich gleichermaßen auf die Katastrophe von New York beziehen. Der 11. September hat mittlerweile massive gesellschaftliche Veränderungen nach sich gezogen wie die Islamismus-Diskussion, restriktivere Sicherheitsgesetze oder die internationale Kooperation in der Terrorismusbekämpfung. 9/11 ist nachhaltig im Korpus von 2001 reflektiert. Die Artikel darüber sind so zahlreich, dass sie in den Statistiken einen signifikanten Einfluss hinterlassen. Der 11. September gehört zu den verheerenden Resultaten des Terrorismus, der mit Regelmäßigkeit um sich greift, auch wenn dieser Terroranschlag der bisher größte war. Die Zeitungsreaktionen zeigen, wie stark ein einzelnes Ereignis die Agenda von Zeitungen vollständig verändern kann. Dieses verheerende Ereignis hatte sogar Auswirkungen auf das Textdesign und die Themenfeldaufteilung: In der Phase direkt danach war in der Times, sowohl online als auch bei der Printversion, die Hauptüberschrift „Terror in America“ zu finden. Ab dem 12.10.2001 installierte „The Times“ ein Themenfeld mit der Bezeichnung „War on Terror“. Die Online-Zeitungen waren jetzt nicht mehr so übersichtlich wie zuvor. Es erschienen fortan wichtige Artikel zu diesem Thema, sowohl unter ”World News”, auf der ”Homepage” als auch unter 74 den besagten Sondersparten, die sich ganz dem „War on Terror“ widmeten. Die Berichterstattung und damit die Aktualisierung der Pages verlief z.T. chaotisch, da sich die Ereignisse überschlugen. Einige Artikel enthielten eine besonders dramatische Berichterstattung und die traumatischen Momente wurden wieder und wieder beschrieben. Was die Korpusarbeit anbetrifft, versuchte ich bis einschließlich 8.10.2001 die bisherigen Themenfeld- und Korpuseinteilung beizubehalten, hatte aber den Eindruck, auf diese neuen Themenfelder reagieren zu müssen, sie einfließen zu lassen, da sonst der statistische Wert des Korpus verfälscht worden wäre (Primacy-Recency-Effect). Es sind insgesamt 87 Artikel des Themenkreises „War on Terror“ mit in das entsprechende Korpus eingeflossen. Doch dieses spielt eine untergeordnete Rolle, da seit dem 12.9.2001, dem Tag nach den Anschlägen, eine Großzahl an Zeitungsartikel in Verbindung mit dem 11. September standen, wenn auch nicht offensichtlich. Der Anschlag war ein Vorfall, der nicht nur das Sicherheitsempfinden und die Gefühle der Menschen verändert hat, sondern auch die Berichterstattung. Nicht nur die Rhetorik der zitierten Politiker wirkt wie ein „notwendiges Beruhigungsmittel für eine traumatisierte Nation“ (Townshend 2002, S.118). Der Schock saß tief, die Sprache in den Medien stand ständig unter dem Eindruck dieser Katastrophe. Es herrschte die Sprache des Krisenmanagements und des Mitgefühls, aber auch die der strategischen Reaktion und der Ursachenforschung.Der Terroranschlag auf das World Trade Center und das Pentagon-Gebäude ist ein gutes Beispiel dafür, wie die Nachrichtenagenda durcheinander gebracht werden kann und dem Journalismus eine andere Rolle zugewiesen wird. Wir können in diesem Zusammenhang von einem Verlautbarungsjournalismus sprechen, denn es wurden unzählige Politikerreden und Stellungnahmen zum weiteren Prozedere wiedergegeben. Der 11. September 2001 kann als ein physikalisches Ereignis begriffen werden, das ein Vorher und ein Nachher hat, ebenso wie der Mauerfall am 9. November 1989 oder die Schüsse von Sarajevo 1914 als Symbol des Ausbruchs des 1.Weltkrieges. Wir können in diesem Zusammenhang auch von einer Reihe von so genannten motivationalen Ketten sprechen (Dittmar 2000, S. 203), die als Auslösefaktoren für ein Ereignis gelten (Hegemonie der USA, 75 Unterdrückung der Palästinenser im Nahen Osten, Streit ums Erdöl, Aufbegehren des islamischen Fundamentalismus), equivalent zu Kausalketten, die durch ein solches Ereignis ausgelöst werden können (Gründung einer internationalen Allianz, Bombardierung Afghanistans, Kriegserklärung an den Irak). Einzig das physikalische Ereignis von 9/11 war es, das eine sprachliche Veränderung zu bewirken vermochte, wie sie in dieser Dissertation untersucht wird. Es löste die besagte Kausalkette aus, zu der auch die permanente Präsenz der Kampfhandlungen in den Medien zählt. Wir können von einer Übergangsphase sprechen zwischen Vorher und Nachher, dem Umbruchkern als temporalem Intervall, ein Begriff, der anderenorts im Zusammenhang mit der Zeit zwischen Maueröffnung und politischer Wiedervereinigung Verwendung fand (Dittmar 2000, S.199 ff). Das ist im Kontext von 9/11 die Zeit des Chaos zwischen dem Einschlagen des ersten Passagierflugzeuges und der Manifestierung des Traumas in den Wochen danach bis zu ersten breit organisierten Gegen- und Katastrophenmaßnahmen. Das Trauma dieses „Megaterrorismus“ (Müller 2001, S.88) hat, wie wir heute alle wissen, die Welt verändert. Endpunkt dieser Übergangsphase war der Kriegsbeginn in Afghanistan. Die Datenauswahl und speziell die Entscheidung für die Korpusgrenzen vollzieht in gewisser Weise die Effekte des 11. September nach, bzw. die abrupte Veränderung der 11 Zeitungsberichterstattung infolge der Geschehnisse. 5.2 Die Medienreaktionen auf die Terroranschläge vom 11.9.2001 Die Ereignisse wurden mit weltweiter Empörung aufgenommen. Die grauenvollen Bilder waren allgegenwärtig: in der Presse, im Internet und im Fernsehen. Es handelte sich um ein dermaßen einschneidendes Ereignis, dass alle anderen Themen verdrängt wurden oder unwichtig erschienen, so auch die Meldung vom ersten geklonten menschlichen Embryo (First clone of a human embryo created, The Independent, 26.11.2001). 11 In der Zwischenzeit kam es zu weiteren schwerwiegenden Terroranschlägen in westlichen Metropolen, am 11.03.2004 in Madrid und am 07.07.2005 in London. 76 Während durch das Internet im Laufe der 90er allmählich das neue Millennium eingeleitet wurde, trat durch die Katastrophe des 11. September eine deutliche Ernüchterung ein. Nach dem 11. September standen die neuen, mit Online-Zugängen ausgestatteten High-TechRedaktionen zum ersten Mal vor einer Zerreißprobe. Die Medien schienen überfordert zu sein, da alle, was die Täter anbetraf, lange im Dunkeln tappten. Es begann eine überhastete Suche nach Antworten (Beuthner 2003, S.137). Mit der weltweiten Empörung und dem ausgelösten Trauma kam die Trauer um die Opfer der Terroranschläge. Über Monate gab es kein anderes Thema, das berichtenswerter erschien. Auch in der Medienbranche war niemand auf eine dermaßen verheerende Katastrophe eingestellt, so dass teils mehr Verwirrung gestiftet wurde als Aufklärung geschaffen (Jelloun 2001, S.71/72). Presseerklärungen über mögliche Drahtzieher wurden scheinbar kritiklos übernommen. Die Stimmen, die Zurückhaltung forderten, fanden wenig Gehör, denn allerorts wurde Loyalität gegenüber den USA gefordert. 5.3 Medienwissenschaftliche Betrachtung des 11.September Wenn wir den 11. September aus einer medienwissenschaftlichen Sicht betrachten, so müssen wir annehmen, dass für diese spezielle Form der Darstellung von Gewalt - und der 11. September ist schließlich nichts anderes als ein Akt der Gewalt - das Gleiche gilt, wie für andere Gewaltdarstellungen in Fernsehen, Kino, Zeitungen, etc. Primär ist hierbei festzuhalten, dass die nahezu voyeuristische Darstellung von Gewalt inklusive vieler Wiederholungen aus unterschiedlichen Perspektiven in vielen aufeinander folgenden Sequenzen, Sendungen oder Ausgaben eine Verrohung der Zuschauer, aber auch der beteiligten Medienakteure zur Folge haben kann, und das trotz Trauer und Betroffenheit. Es ist deshalb nicht auszuschließen, dass diese Melange zu einer Übereifrigkeit bei der Berichterstattung beigetragen haben könnte (Schneider 2001, S.80 ff.). Die Zuschauer, Zuhörer und Leser erkennen nicht, dass durch das wiederholte Zeigen von grausamen Bildern Angst erzeugt wird, ohne die Ursachen zu klären. Die Medien können die Ursachen nur am Rande bekämpfen, weil dies in den Aufgabenbereich von Politikern 77 im öffentlichen, von Psychotherapeuten im privaten Bereich gehört. Doch bei den Verbindungen der Presse zur Politik heutzutage (Stichwort: Murdoch, Kirch, Springer), müssen Journalisten teilweise auf der Hut sein, bei der Ursachenforschung als zu kritisch zu erscheinen, was sie im Extremfall den Arbeitsplatz kosten kann. Es dringt nicht an die Öffentlichkeit, inwieweit Journalisten und andere Medienschaffende muslimischer Herkunft eventuellen Restriktionen unterworfen sind, denn der Islam ist auch in der westlichen Welt überall vertreten. Die Medienvielfalt erfährt eine Determiniertheit. Die freie Presse unterläuft der Gefahr, sich aus Partei- und Regierungskreisen bevormunden zu lassen. Der Krisenjournalismus (Neverla 2003, S.158ff.) wird zu einem Protokoll- und Verlautbarungsjournalismus (Kunczik, Zipfel 2001, S.169). Jedoch muss ein objektiver Betrachter zugeben, dass sich die Presse schon lange vor dem 11. September 2001 stark verändert hat, was zum Teil auf die Einführung des Internet, von Online-Zeitungen und neuen Formen des Textdesigns zurückzuführen ist. Das waren jedoch lediglich strukturelle Veränderungen, die vorrangig Textdesign, Farbgestaltung und Recherchemethoden betrafen. Einschneidende politisch-restriktive Veränderungen scheinen sich jedoch erst im Zuge des 11. September durchzusetzen, was besonders die Kündigungen von kritischen und damit vermeidlich illoyalen Journalisten beweisen (Berliner Zeitung, 1.11.2001). 5.4 Das Dilemma der Medien im Zusammenhang mit dem 11. September Die Tragik der Ereignisse des 11. September steht außer Frage. Wir können in Anbetracht der Bilder nicht von Hoch- oder Herunterspielen von Ereignissen sprechen. Eine solche Katastrophe hat zwangsläufig eine ständige Medienpräsenz zur Folge, in welcher Form auch immer. Dass es bei der Berichterstattung zu Fehlern kam, war unvermeidbar. Die sprachlich-journalistische Berichterstattung fand jetzt unter ganz anderen Voraussetzungen statt, es gab kein „Business-as-usual“ mehr. Das gewohnte Verhältnis von Sprache und Bildern hatte das Gleichgewicht verloren. Normalerweise ist jedes wichtige 78 Medienereignis mit Bildern illustriert und einem ergiebigen Text versehen. Doch was den 11. September anbetrifft, sehen wir wochenlang immer wieder das gleiche Szenario: Die einschlagenden Flugzeuge, die brennenden WTC-Türme, den Trümmerhaufen, Fahndungsfotos und das ausgelöste Chaos bestehend aus Helfern bei der Arbeit, Menschen auf der Suche nach Angehörigen und andere trauernde Menschen. Der so genannte „photographische Schock“ (Barthes 1989, S.41) ist groß12. Die Bilder graben sich meditativ in das Gedächtnis vieler konsternierter Menschen ein und werden damit zum Trauma (“TV viewers may suffer trauma; Terror in America.“ The Times, 19. September 2001). Es kommt zu einer Flut von Artikeln über das Ereignis und die Begleitumstände, die immer wieder die Bilder der Katastrophe und der Stunden danach evozieren. Doch die Zeitungen besaßen kein Krisenmanagement oder Beraterteams, die darauf vorbereitet waren. Es zeigt sich, dass Journalisten eben keine Psychotherapeuten sind. Stattdessen wirkt in den Medien ein journalistisches Trauma (Beuthner 2003, S.138), dass das Unbehagen nur verstärkt. Aus Angst vor den Konsequenzen wird nicht über die politischen Beweggründe von Terroristen gesprochen, für die der Staat USA die Personifikation des Bösen ist. Es mutet nahezu absurd an, dass der Gegenpol ebenso argumentiert, es ist von der „Achse des Bösen“ die Rede (Todd 2002, S.13). Diese Tatsache wird nirgends diskutiert, niemand fragt, wofür die Negativbezeichnung „Das Böse“ steht, ob für eine Religionsform, ein martialisches Rechtssystem, finanzielle Ausbeutung, Weltherrschaft oder Unterdrückung des schwachen Geschlechts. Diese Tatsache, dass die Leute sich gegenseitig als das Böse bezeichnen, ist wohl die Crux der politischen Berichterstattung, denn dieser kritische Zustand fordert zur Selbstreflexion und –kritik auf, die jedoch auf beiden Seiten ausbleibt. Erschwerend kommt bei der Berichterstattung hinzu, dass es eine Tendenz gibt, Begriffe wie >ARAB<, >MUSLIM<, >FANATIC< oder >TERRORIST< als austauschbar bzw. synonym zu betrachten (Soueif 2001, S.60). Dass jedoch die Mörder vom 11. September von der islamischen Welt nicht als wahre Muslime verstanden werden (Jelloun 2001, S.70 ff.), wird in den Medienberichten nicht ausreichend berücksichtigt. 12 Der „photographische Schock“ kann bei einer Korpusanalyse von Zeitungstexten nicht analysiert werden, auch wenn Texte und Bilder in einem gewissen Abhängigkeitsverhältnis stehen. 79 5.5 Der 11. September als Auslösefaktor für Spekulationen Dieser unbegreifliche Terroranschlag am 11. September 2001 erzeugte viel Spielraum für Mutmaßungen, Verschwörungstheorien und Mythenbildung. Das Trauma war und ist selbst bei den Journalisten so stark, dass es bei der folgenden Berichterstattung permanent gegenwärtig zu sein scheint. Die Zeitungen hielten sich nicht zurück, wenn es darum ging, eventuelle Drahtzieher der Anschläge zu benennen und aufzuspüren. Die Printmedien waren in der Folgezeit des 11. September übersät mit Spekulationen, auch die kühnsten wurden in den als loyal geltenden Qualitätszeitungen nicht ausgespart. Wir erfahren von mutmaßlichen internationalen Terrornetzwerken, in die sogar ordentliche Staatschefs und Regierungen verstrickt sein sollen. Es ist von aufzudeckenden Terrorzellen die Rede, doch die meisten Spuren erweisen sich als irreführend. Ursachenforschung für diese Tat findet in der Hektik der Ereignisse noch nicht statt. Parallel dazu werden neue Feindbilder konstruiert, die von Osama Bin Laden, Saddam Hussein und der Al-Qaida verkörpert werden (Kleinsteuber 2003, S.218). Journalisten haben stets eine Wahrheits- und Sorgfaltspflicht gegenüber der Bevölkerung (Hruska 1999, S.18/19). Wenn jedoch die Journalisten der Wahrheit nicht auf den Grund gehen können, weil eine sorgfältige Recherche verhindert wird, muss das Publikum darüber in Kenntnis gesetzt werden. Es muss deutlich gemacht werden, dass die übermittelten Wahrheiten nur Teilwahrheiten sein können, vielleicht sogar unwahr. Der Golfkrieg von 1991 ist als Beispiel dafür in die Geschichte eingegangen, dass „Zensur und gelenkte Nachrichten die Presse in Ohnmacht versetzen“ können (Hruska 1999, S.19). Deshalb stellt sich die Frage, weshalb die Terrororganisation Al-Qaida weltweit erst am 20.09.2001 zum ersten Mal in der Zeitungsberichterstattung namentlich genannt wurde. Es drängt sich der Verdacht auf, dass es diese Organisation entweder bis dato gar nicht gab, oder dass deren Existenz zuvor verschwiegen wurde. Beides verstößt gegen Pressegrundsätze, denn Information hat im Rahmen der Wahrheits- und Sorgfaltspflicht der Presse Vorrang. Das Desaster von New York wird damit zu einem Desaster der Medien, denn auch Journalisten sind nur Menschen, die genauso 80 traumatisiert und fassungslos sein können wie die übrige USamerikanische Bevölkerung und die Weltöffentlichkeit. Die Journalisten versuchen jetzt das, was sie nicht können: bei der Aufklärung der Anschläge entscheidend behilflich zu sein, die Journalisten avancieren zu Terror- und Islam-Experten ohne fundiertes Hintergrundwissen und sorgen dadurch eher für Verwirrung als für Aufklärung (Schneider 2001, S.80 ff). Die Leser sehen sich mit einer Mixtur aus Panik und Desinformation konfrontiert. Statt genauer Statistiken und Fakten hören wir von angeblichen Börsendeals im Zusammenhang mit dem 11. September, angeblicher Beteiligung von Geheimdiensten, islamischen Machthabern und Spendensammlern. Es wird über Monate ungewollt Panik erzeugt und Angst geschürt durch Berichte über mögliche neue Terrorziele und Terrorwaffen wie Anthrax, Kofferbomben oder die „Dirty Bomb“. Die Journalisten, die sonst bei der alltäglichen Berichterstattung das Geschehen vom Vortag für die Leserschaft aufzubereiten haben, kommen auch Monate, sogar Jahre später immer wieder auf das traumatische Ereignis zurück, wir erfahren - vermutlich politisch gefilterte - Fakten und Spekulationen über Täter, Mitwisser und Gehilfen. Trotz der Unklarheiten gibt es eine Fülle von Publikationen, die versuchen, Licht in das Dunkel zu bringen, auch wenn diese lediglich auf Mutmaßungen basieren. Letztendlich ist in vielen Artikeln die Trennung zwischen Nachricht, Kommentar und Spekulation aufgehoben, und das aus blindem Eifer heraus, neue Details aufzuzeigen. Die folgende Textstelle stammt aus dem Korpus Independent.2001.danach. Sie ist sehr bezeichnend für die Berichterstattung nach 9/11: “War without end ...Phase one is almost over. Now the US has its sights set beyond the Taliban - America's blood is up. And they're not stopping at Kabul.” (The Independent, 02.12.2001, World). Dieses ist ein Beleg für den harscher werdenden Ton, der sich in der Berichterstattung nach dem 11. September etablierte. Wir müssen bedenken, dass es sich hierbei nicht um einen Kommentar handelt, sondern um einen Artikel aus dem Themenfeld „World“. 81 Für den neuen vehementen Ton in den Medien gibt es weitere Beispiele (s.u.). Die Sprache verhärtet sich, ohne dass bedacht wird, dass sich Angst und Unsicherheit durch dieses politische und journalistische Fehlverhalten unbeabsichtigt weiter verstärken. Psychologische Hilfestellung, wie mit der permanenten Angst vor neuen Terroranschlägen umzugehen ist, scheint gänzlich zu fehlen. Die schreckliche Tat soll möglichst schnell gesühnt werden, selbst Kriegsdrohungen und Kriegserklärungen durch die amerikanische und englische Regierung werden unreflektiert mitgetragen. 5.6 Kontextuelle und lexikalische Wahrscheinlichkeit Ein Ereignis wie der 11.September erzeugt eine gewisse lexikalische Wahrscheinlichkeit. Je schwerwiegender, berichtenswerter oder effektvoller ein Ereignis ist (Tschernobyl, Maueröffnung, Gewinn der Weltmeisterschaft im Fußball,...), desto größer die Wahrscheinlichkeit, dass dieser Kontext über einen längeren Zeitraum beibehalten wird, weitere Artikel auf der Erstbeschreibung des Ereignisses aufbauen, wie sich ausbreitende Wellen, die erst mit einem bestimmten Abstand vom Ursprung abebben. Dabei wird eine bestimmte lexikalische Wahrscheinlichkeit erzeugt (Armstrong 1994, S.8 ff), die besagt, dass die Schlüsselbegriffe, die mit diesem Ereignis einhergehen, häufiger verwendet werden als in Vergleichszeiträumen (>TERROR ATTACK<, >TERRORISM<, >EXPLOSION<, >WORLD TRADE CENTER<, >ISLAMIC<, >CRISIS<, >NEW YORK<, >GROUND ZERO<, >HIJACKER<,...). Die ausgelöste Ereigniskette bewirkt deshalb eine sprachliche Kontextverschiebung: 82 Terroranschläge am 11.9.2001 ↓ Trauer und Trauma ↓ Diskussionen/ Debatten ↓ Solidarisierung mit den USA ↓ Erste politische Entscheidungen ↓ Streit ↓ Drohung ↓ Reaktionen und Handlungen (Bombardierung Afghanistans) ↓ Krieg gegen den Irak ↓ ? Abb. 4: Flow-Chart Ereigniskette nach dem 11.9.2001 In der Zeit bis zum Verschwinden eines schwerwiegenden Ereignisses aus der täglichen Berichterstattung, werden Mutmaßungen über Täter angestellt, erste politische Entscheidungen getroffen, es kommt zu Katastrophenschutzmaßnahmen, internationalen Reaktionen und ersten militärischen Gegenmaßnahmen, während das Hauptereignis traumatisch nachhallt. Das Thema muss zwangsläufig wiederholt aufgegriffen werden, wenn auch nur in einem Nebensatz oder sobald neue Erkenntnisse über die Ursachen, neue Theorien oder neue Aussagen darüber vorliegen. 83 Nachfolgende Terroraktionen werden jetzt anders bewertet, die Bedrohung durch den Terrorismus wird sehr viel ernster genommen. Der Begriff Terrorismus ist schon ein Indiz dafür, dass sich Täterschaft nicht an konkreten Personen ausmachen lässt. Ferner beinhaltet dieser Terminus Vermutungen über Netzwerke und Handlanger. Das Gespenst eines globalen Terrornetzwerkes kommt auf, eine Tatsache, die sich sprachlich widerspiegelt. Nehmen wir die Pressesprache vor dem 11. September als Soll-Wert, was Nüchternheit, Geradlinigkeit, Ruhe und Vernunft anbetrifft, so sollte dieser Wert irgendwann wieder erreicht sein, vorausgesetzt, dass nicht alles aus dem Gefüge gerät. Normalerweise werden die mit einem Ereignis verbundenen Schlüsselwörter mit einem wachsenden Abstand zum Hauptereignis immer seltener verwendet, bis sich der „sprachliche Soll-Zustand des Alltags“ wieder eingestellt hat. Ein diametral entgegengesetztes Beispiel wäre das Erringen des Weltmeistertitels im Fußball, der immer nationale Euphorie auslöst, die in der Sportberichterstattung, speziell in den Fußballberichten, lange erhalten bleiben kann. Die Kontextuelle Wahrscheinlichkeit, dass ein Ereignis in der Presse wieder und wieder aufgegriffen wird, steigt mit der Wichtigkeit bestimmter Wörter und Wortgruppen, die als Schlüsselbegriffe der aktuellen Thematik gelten (siehe Punkt 6.4). Die Ereigniskette, die zunehmend zur Eskalation geführt hat, geht einher mit einer Entwicklung von Sprache und Gewalt in einem reziproken Verhältnis, das eine Zäsur fast verunmöglicht. 5.7 Der 11. September als Agenda-Setting-Prozess Die Ereignisse des 11. September haben in der unmittelbaren Folgezeit von der Quantität der Berichterstattung her einen Umfang eingenommen, der in Anbetracht der Grausamkeit des Ereignisses als angemessen bezeichnet werden muss. Doch ob die Presse-Texte den richtigen Tenor besaßen, ist fraglich, denn in der Nachfolgezeit sind zwei Kriege in Asien (Afghanistan, Irak) geführt worden, weil Regierungen in einen Zusammenhang mit den Terroristen des 11. September gebracht worden sind. Ergo hat der 11.9., erstens, maßgeblich das Agenda-Setting bestimmt (Agenda-Setting-Effect). Zweitens wurde die Vorreiterrolle der USA und Großbritanniens in 84 der internationalen Terrorismus-Bekämpfung konstatiert (PrimingEffect). Drittens wurde eine radikale Methode der Konfliktlösung in Form von Flächenbombardierungen (Afghanistan) , Internierungen (Guantanamo Bay), Invasion (Irak) und Folter (Abu Ghureib) einer diplomatischen Lösung vorgezogen (Framing-Effect), wohl auch aus einer gewissen Ohnmacht heraus in Anbetracht des Horrorszenarios. Dieses Handlungsschema der Medien ist bereits für den ersten Golfkrieg 1990/91 festzustellen (Kunczik, Zipfel, 2001, S.371). Eine weitere Betrachtungsweise der Agenda-Setting-Theorie ist die Tatsache, dass die Rezipienten die Medien-Agenda als soziale Wirklichkeit sehen (Jarren, Bonfadelli 2001, S.360/61). Dazu gehört die permanente, massive Angst in allen Teilen der Gesellschaft vor weiteren Anschlägen. Was in New York am 11. September 2001 passierte, könnte plötzlich in London, Chicago oder Berlin passieren. Viele, die in einem Hochhaus arbeiten, malten sich das Horrorszenario von New York noch einmal aus. Dieses Beispiel ist symptomatisch für die Angst, die durch den 11. September ausgelöst wurde. Der 11. September hat deshalb einen >>Backlash<< (negative Rückwirkung) auf die gesamte westliche Zivilisation. Die in den Medien erforderliche Auseinandersetzung mit der islamischen bzw. arabischen Welt zeugte ferner von einem kulturellen >>Lag<<, was das Wissen über diese Staaten, Kulturen und Sprachen anbetrifft, denn es zeigte sich, dass es allerorts an Islamwissenschaftlern fehlte (>>Knowledgegap<<, Kunczik, Zipfel, 2001, S. 384 ff.). Eine weitere Begleiterscheinung ist, dass der durch den 11. September ausgelöste Schockzustand bewirkt hat, dass die alte Nachrichtenagenda, die zuvor im Gleichgewicht war, zurückgedrängt wurde. Der 11. September und seine Folgen überdeckten andere Themen aus der Berichterstattung, die aufgrund ihrer permanenten Wichtigkeit normalerweise einer ständigen Präsenz in den Nachrichten bedurften (Kunczik, Zipfel, 2001). Sie mussten letztendlich dem Hauptereignis weichen, das nahezu eine Sogwirkung erzeugte. Auf der anderen Seite wurden Themen bevorzugt, da sie mit in den Strudel hineingerissen wurden, insbesondere die Berichterstattung über aggressive islamische Staaten (Pakistan, Afghanistan, Irak, etc.), internationale Außenpolitik und Katastrophenschutz. 85 Die Verdrängung anderer immens wichtiger Nachrichten ist als problematisch zu erachten, da vieles in Vergessenheit geriet. Der 11. September fiel in eine Phase, als dringliche Themen auf der Tagesordnung standen, beispielsweise die Nachverhandlungen zum Kyoto-Protokoll. Diverse Ereignisketten sind drastisch unterbrochen worden und auf unbestimmte Zeit aufgeschoben. Es ist fraglich, wann gerade im Bereich von Umweltschutzabkommen, Abrüstung, Migration und Bekämpfung von Hunger und Aids erneut zu einer sinnvollen Diskussion angesetzt werden kann. Die Verdrängung anderer Themenkomplexe spielt generell immer eine Rolle, wenn Ereignisse wie Kriege, Revolutionen und Katastrophen das Weltgefüge aus der Bahn werfen. 5.8 Der Nachrichtenfaktor des 11.September In der Publizistik existiert das Modell der Nachrichtenfaktoren, das definiert, was die Voraussetzungen sein können, dass ein Ereignis in die Medien Einzug hält. Diese Faktoren spielen im Zusammenhang mit dem 11.September nur noch eine untergeordnete Rolle, da eine Kettenreaktion ausgelöst wurde, ähnlich wie im Krieg, der jetzt mittlerweile auch dem 11. September gefolgt ist. Nachrichtenfaktoren wie Frequenz, Schwellenfaktor, Eindeutigkeit, Bedeutsamkeit, Konsonanz, Kontinuität, Überraschung, Variation, Bezug zu Elite-Nationen, Bezug zu Elite-Personen, Personalisierung und Negativismus (Kunczik, Zipfel 2001, S.248) scheinen in Anbetracht des schockierenden Ausmaßes des Terrorangriffes ad absurdum geführt zu sein. Neue Nachrichtenfaktoren könnten auch Trauma, Verzweiflung und Chaos heißen. Doch selbst die Schwere des Ereignisses vermag es nicht, die allgegenwärtige Produktwerbung, den Sexismus und die Demontage von in Ungnade gefallenen Prominenten nur für eine kurze Trauerphase aus den Medien zu verbannen. Die Empörung verstärkt sich durch das taktlose Verhalten der Medien, die dadurch mit in den Abgrund der ideologischen Krise hineingerissen werden. 86 5.9 Qualitätskriterien für Informationsjournalismus In der Publizistikwissenschaft ist ferner von den Qualitätskriterien für Informationsjournalismus die Rede (Jarren/ Bonfadelli 2001, S.276). Zu diesen zählen Kriterien wie Richtigkeit, Vielfalt, Relevanz, Vermittlung, Professionalität, Akzeptanz, Neuigkeit, Aktualität, Originalität, Unabhängigkeit, Fairness, Transparenz, Verständlichkeit, Interaktivität etc. Diese Kriterien sind untereinander verkettet (fehlende Vielfalt – fehlende Transparenz – fehlende Professionalität etc.). Viele dieser Beurteilungsgrößen sind infolge des 11. September beeinträchtigt worden. Das belegt das Durcheinander in der Presse, das den ersten Katastrophenbildern folgte. Die Korpuslinguistik ist nur schwerlich in der Lage, diese Kriterien gezielt zu überprüfen (s.u.). Dieses kann nur der kritische Leser für sich selbst vornehmen. Was das Kriterium der Richtigkeit anbetrifft, so ist zu betonen, dass viele Spekulationen getätigt wurden, ohne diese einer Prüfung zu unterziehen (z.B.: „Osama Bin Laden hält sich im Sudan auf“). Die Vielfalt wurde deshalb beeinträchtigt, da fortan ein Thema vorrangig gegenüber den meisten anderen Themen behandelt wurde (Was wurde aus den Nachverhandlungen zum KyotoProtokoll?). Die Vermittlung entsprach einer ausufernden Krisenberichterstattung mit zum Teil fehlender Transparenz (z.B. fraglich: Weshalb hatte der Staat Afghanistan eine Mitschuld?). Die Professionalität hatte zu leiden, da es an Islam- und TerrorismusExperten mangelte (z.B. fraglich: Warum erhielt das Wort Terrorist so häufig das Attribut islamisch?). Auch die Unabhängigkeit schien nicht mehr gewährleistet, da kaum kritische Stimmen über die Reaktionen der USA zu vernehmen waren, es wurden sogar Entlassungen von Journalisten bekannt, die den Leitlinien der Zeitungen nicht mehr entsprachen (Berliner Zeitung 1.11.2001). In diesem Zusammenhang ist vom „neuen Patriotismus“ in den USA die Rede. Diese Tatsachen wären als Qualitätseinbußen zu verstehen, ja sogar als autokratische Veränderungen in den Zeitungshäusern, wenn wir das durch den Terroranschlag verursachte Trauma und die Depressionen außer Acht ließen. Auch das Kriterium der Fairness schien über den Haufen geworfen zu sein, da diverse Personen, Gruppierungen, sogar ganze Staaten mit den Terroristen des 11. September undifferenziert über einen Kamm geschert wurden. 87 Wie ein ständig wiederkehrender Albtraum wurden die traumatischen Bilder und der vermeidliche Tathergang ständig wiederholt. Die nüchterne Berichterstattung wurde verdrängt, die Katastrophe mutierte durch die Zurschaustellung der Bilder zur Sensation, die erst von der Kriegsberichterstattung über die Bombardierung Afghanistans und später den Einmarsch in den Irak abgelöst wurde. In diesem Zusammenhang darf nicht verschwiegen werden, dass Fachleute infolge des 11. September die Presse- und Meinungsfreiheit im Kern als bedroht sahen (Krotz 2003, S.312). Das ist eine Situation, in der Bewertungsmaßstäbe wie Qualitätskriterien generell ad absurdum geführt werden. Es bleibt in Bezug auf die Korpuslinguistik festzuhalten, dass sich diese Qualitätskriterien nicht über Wortlisten und Textstatistiken überprüfen lassen, wenn überhaupt, können ausgewählte Konkordanzen (siehe 6.3.2) oder Keyword-Analysen (siehe 6.4.3) belegen, dass es in Zeitungsartikeln an Professionalität, Fairness, Vielfalt und Transparenz mangelt. Zeigt beispielsweise eine KeywordAnalyse, dass die Themenvielfalt gegenüber einem Vergleichskorpus stark eingeschränkt ist, zählt das als Anhaltspunkt dafür, dass Qualitätskriterien nicht eingehalten wurden. In diesem Zusammenhang zeigen sich viele Missverhältnisse erst, wenn Detailanalysen ausgewählter Zeitungsartikel oder ganzer Zeitungsausgaben per Hand durchgeführt werden. 5.10 Die Nachrichtenwert-Theorie Die Nachrichtenwert-Theorie gibt Aufschluss über die Faktoren der Nachrichtenselektion. Sie besteht im Wesentlichen aus fünf Elementen: Ablauf, Anlass, Modalität, Folgen und Akteure. Dabei gilt der Leitspruch, dass je mehr Faktoren auf ein Ereignis zutreffen, desto größer die Wahrscheinlichkeit wird, dass es zu einer Nachricht wird (Jarren, Bonfadelli 2001, S.273). Dazu zählt das Prinzip der Additivität und der Komplementarität. In Bezug auf den 11. September ist festzuhalten, dass alle fünf Faktoren in Millionen von Artikeln, Berichten, Reportagen, Kommentaren und Essays aufgegriffen wurden. Ganze Bücher wurden über den angeblichen Ablauf geschrieben, über den Anlass wurde bekanntlich viel spekuliert. Die Modalität des Ereignisses kann mit 88 den Begriffen Drama, Regelwidrigkeit und Konflikt umrissen werden. Die Folgen bestehend aus Negativität und Schaden beschäftigen die Medien heute noch und werden es auch weiterhin tun. Selbst die Akteure, der fünfte Faktor dieser Nachrichtenwert-Theorie, finden immer wieder Medienpräsenz, egal ob diese leben oder bereits tot sind, ob es wirkliche Hintermänner sind oder eigens aufgebaute Feindbilder. Schließlich avancieren Politiker wie Bush, Rumsfeld und Blair selbst zu Akteuren, die von Kritikern mitunter als Kriegstreiber bezeichnet werden. Wenn es möglich wäre, dem 11. September als Nachricht einen mathematischen Wert zuzuordnen, so müsste dieser ein Maximum erreichen, das vergleichbar mit einem Bodediagramm fortwährend andauert. Diese Tatsache spiegelt sich auch in der Auswertung dieser Dissertation wieder, wenn es darum geht, die Häufigkeiten von Begriffen zu vergleichen, die nach dem 11. September eine stärkere Verwendung fanden (>TERROR<, >ISLAMIC<, >ANTHRAX<, etc.). Es lässt sich bereits jetzt absehen, dass kein Ereignis seit dem Ende des 2. Weltkrieges einen so großen Nachrichtenwert besaß wie die Katastrophe in New York, vielleicht mit Ausnahme der Maueröffnung in Berlin am 9.11.1989. Auf der anderen Seite haben Katastrophen, die eine sehr lange physikalische und biologische Nachwirkung erzeugten wie die großen Reaktorkatastrophen (Tschernobyl, Harrisburg, Sellafield), im Vergleich zum 11. September verhältnismäßig schnell ihren Nachrichtenwert verloren. 5.11 Der 11. September als Schlüsselereignis Schwere Verbrechen, Unfälle und Katastrophen können im Medientenor zu Schlüsselereignissen avancieren (Kunczik, Zipfel 2001, S.259). Das trifft für den 11. September ganz eindeutig zu, mehr noch als für die meisten anderen Ereignisse der letzten Jahre und Jahrzehnte. Schlüsselereignisse vermögen das Auswahlverhalten der Journalisten zu verändern. Das zeigt sich darin, dass zumindest kurzfristig, oder wie im Zusammenhang mit Nine-Eleven sogar längerfristig, über zusammenhängende Themen bevorzugt berichtet wird, was regelrechte Beitragswellen zur Folge haben kann. Dieses ist für den 11. September uneingeschränkt zu beobachten. Beitragswellen können laut Kunczik, Zipfel beim Rezipienten einen 89 nicht der Realität entsprechenden Eindruck von der Häufung bestimmter Ereignisse vermitteln, in diesem Fall von Terroranschlägen, die es trotz des unwidersprochen katastrophalen Ausmaßes des 11. September in der unmittelbaren Folgezeit nicht gegeben hat. Eine kritische Auseinandersetzung mit den Themen Islam, Globalisierung und Vorherrscherrolle der USA unterblieb hingegen. Andererseits ist zu vermerken, dass eine kritische Auseinandersetzung mit den Wurzeln von Religionsfanatismus weitestgehend unterbleibt, zu denen beispielsweise die Prügelstrafe in den Beduinenschulen gehört (Elbedour et al. 1997, S.2001-215). Andererseits entsteht beim wiederholten Deklarieren von Terroristen und Terrorverdächtigen als muslimisch und islamisch die Gefahr, dass gesellschaftliche Prozesse ausgelöst werden, die nicht mehr kalkulierbar sind. Es wird das Medienimage erzeugt, dass Muslime mit Terroristen gleichsetzt. Diese Form der Berichterstattung birgt deshalb die Gefahr, dass sie eine Situation heraufbeschwört, vor der sie warnen wollte. Muslime, die ihre Religion diskriminiert und bedroht sehen, laufen Gefahr, selbst Torheiten zu begehen, sei es aus Verwirrung oder um sich für das an ihrer Religion begangene Unrecht zu rächen. Der so genannte „islamische Terror“, der ursprünglich der Terror einer kriminellen Minderheiten war, wird dadurch zu einer Self-FulfillingProphecy (Kunczik, Zipfel, S.235). 5.12 Das Textkorpus mit Artikeln erschienen nach 9/11 Das Korpus K1 enthält ausschließlich Artikel, die nach dem 11. September in dem Zeitraum vom 12.9.2001 bis zum 11.12.2001 erschienen sind. Presse-Korpora, die sich ein und demselben Thema widmen wie beispielsweise dem Tod von Prinzessin Diana, werden in der Linguistik als thematische Korpora bezeichnet (Rademann 1998, S. 49-71). Wir können das Korpus K1 deshalb als thematisches Korpus bezeichnen, da es ausschließlich Zeitungsartikel enthält, die nach 9/11 erschienen sind. Zwar handeln nicht alle Artikel direkt von den traumatischen Ereignissen in New York, jedoch sind die Zeitungsredaktionen von den Nachwirkungen der lang anhaltenden Krise beeinflusst gewesen. Aufgrund dieser Korpuskonstellation können wir auch von einer Simulation der sprachlichen 90 Veränderungen nach dem 11. September sprechen, oder besser von einem messbaren Vorher-Nachher-Effekt (Primacy-Recency-Effect, Trautner 1997, S.439), in dem die vor 9/11 erschienen Artikel mit den danach publizierten und geschriebenen verglichen werden können. In Anlehnung an Kennedy können wir von einem Pilot Corpus oder Snapshot sprechen (Kennedy 1998, S.60 u. 69). 6. KAPITEL: Auswertung der Analysedaten In diesem sechsten Kapitel sind die an den Korpora vorgenommenen Hauptanalysen dargelegt. Zunächst werden hier die Basisdaten aufgezeigt, in den weiteren Unterkapiteln Veränderungen an Grammatik, Syntax, Lexik und Morphologie diskutiert. 6.1 Die von Wordsmith gewonnenen Basisdaten Die Korpusanalyse mit dem Programm „Wordsmith“ lieferte eine Fülle an Ergebnissen, die im Folgenden dargelegt sind. Zum einen haben wir die drei Korpusstatistiken von K1, K2 und K3. Zweitens die alphabetisch geordneten Frequenzlisten, weiter die nach Prozentzahlen geordneten Frequenzlisten, viertens die automatisch erstellten Vergleichslisten (Keyness) und schließlich, fünftens, die Konkordanzlisten ausgewählter Begriffe. 6.1.1 Die Auswertung der Korpusstatistiken Zum Erstellen der Korpusstatistiken wurde das Wordsmith-Tool „Wordlist“ verwendet. Grundsätzlich ist zu betonen, dass eine Korpusanalyse dreier Textkorpora mit insgesamt mehr als vier Millionen Wörtern eine dermaßen umfangreiche Datenmenge liefert (z.B. Wortliste von Korpus K1, nach prozentualer Häufigkeit geordnet, enthält 35 307 Zeilen mit je bis zu vier Einträgen), dass eine Fokussierung auf die wichtigsten Aussagen bei der Auswertung erforderlich wird, um den Rahmen der Korpusanalyse nicht zu sprengen. Um die Essenz der Wortlisten herauszufiltern, können die 91 obersten Einträge zunächst vernachlässigt werden, bei denen es sich zumeist um bloße Funktionswörter wie Artikel, Präpositionen und Hilfsverben handelt (siehe 6.1.3). Ebenso können die unteren Einträge vernachlässigt werden, denn die Wörter kommen im Korpus zu selten vor und sind größtenteils Hapax Legomena (siehe Tab. 15). Die drei Korpusstatistiken sind hier in einer Tabelle zusammengefasst: Text File Bytes Tokens Types Type/Token Ratio Standardised Type/Token Ave. Word Length Sentences Sent.length Sd. Sent. Length Paragraphs Para. Length Sd. Para. Length Headings Heading length Sd. Heading length 1-letter words 2-letter words 3-letter words 4-letter words 5-letter words 6-letter words 7-letter words 8-letter words 9-letter words 10-letter words 11-letter words 12-letter words 13-letter words 14(+)-letter words OVERALL K1.TXT K2.TXT K3.TXT 25.312.808 4.041.309 68.428 1,69 47,61 4,81 116.096 29,03 26,93 139.941 28,88 109,75 0 6.261.170 1.010.191 35.307 3,5 47,58 4,79 33.981 22,34 13,59 34.133 29,6 102,94 0 6.243.089 1.010.073 36.467 3,61 47,5 4,76 38.751 21,85 11,43 40.503 24,94 81,69 0 12.808.549 2.021.045 48.738 2,41 47,69 4,87 43.364 40,69 38,25 65.305 30,95 126,96 0 113.646 681.119 782.948 626.286 440.763 369.581 347.467 252.913 194.159 114.093 60.228 32.118 16.921 6.345 28.128 170.671 196.963 158.947 111.625 91.246 87.498 62.798 47.333 26.777 14.786 7.387 3.928 1.494 30.405 167.903 198.517 163.901 112.690 93.280 84.231 61.420 43.944 26.607 14.084 7.147 3.838 1.446 55.113 342.545 387.468 303.438 216.448 185.055 175.738 128.695 102.882 60.709 31.358 17.584 9.155 3.405 Tab. 13: Zusammenfassung der drei von Wordsmith erstellten Korpusstatistiken (sd. = standardised). Zunächst ist für jedes Korpus die Anzahl der Bytes genannt. Daraus ließen sich die Wortgrößen in Bytes und Bits errechnen, doch da Wordsmith dieses nicht vornimmt und es für unsere 92 Betrachtungsweise irrelevant ist, soll diese Möglichkeit hier lediglich angesprochen und nicht weiter ausgeführt werden. Wie wir den Listen entnehmen können, enthält K1 1 010 191 Token, K2 1 010 073 und K3 2 021 045. Das sind leichte Diskrepanzen im Vergleich zu den Zählungen des Textverarbeitungsprogramms Microsoft Word (Version 2000). Für K1 ermittelt „Word 2000“ 1 000 789 Wörter, für K2 1 001 211 Wörter und für K3 2 000 131 Wörter. Diese Unterschiede sind damit zu begründen, dass Wordsmith und Microsoft Word unterschiedliche Satz- und Wortgrenzenerkennung durchführen (siehe Punkt 6.3.1). Wenn wir die durchschnittliche Anzahl der Wörter pro Satz für jedes der drei Korpora miteinander vergleichen, so stellen wir fest, dass es zu einer frappierenden Veränderung zwischen 1990 und 2001 gekommen ist. Dieses Phänomen ist unter Punkt 6.3 (Untersuchungen an der Syntax) näher beschrieben. Weitere Punkte der Tabelle sind Anzahl der Paragrafen, die Paragrafengröße und die standardisierte Paragrafengröße. Doch diese Werte sind nicht zuverlässig, da die Zeitungsartikel in ihren elektronischen Ursprungsmedien nicht immer einheitlich in Paragrafen unterteilt sind. Für die drei Größen Schlagzeilenzahl, -länge und standardisierte Schlagzeilenlänge sind keine Werte von Wordsmith errechnet worden. Ob die Unterfunktion funktioniert, wurde nicht nachvollziehbar. 6.1.2 Die Type-Token Relation (TTR) Wenn wir alle Wörter eines Textkorpus zählen, unabhängig davon, ob diese mehrfach vorkommen und deshalb mehrfach gezählt werden, so ermitteln wir die Anzahl aller Token. Ein Text, bestehend aus 1000 Wörtern, hat folglich 1000 Token. Zählen wir die Wiederholung eines Wortes in derselben Schriftweise nicht mit, auch ungeachtet der Großund Kleinschreibung, jedoch ohne orthografische Fehler, so erhalten wir die Kategorien verschiedener Wörter. Für diese Kategorien verwenden wir die Bezeichnung Typen. Die TTR ist ein mathematischer Wert, der beschreibt, wie hoch der prozentuale Anteil der Typen an der Gesamtzahl der Wörter bzw. Token ist. Hat ein Text bestehend aus 1000 Wörtern 250 verschiedene Wörter, ergibt sich eine TTR von 25 %. Laut Hansen/ Teich (1999, S. 93 312) lässt sich anhand der Type-Token Relation die Komplexität eines Textes bewerten. Typen Token . 100 = TTR Formel für die Type-Token Relation (TTR), Hansen/ Teich, S.312 (Laut Lewandowski 1990, S.1200: Quotient aus der Anzahl der verschiedenen Wörter und der Gesamtzahl der Wörter in einem Text bzw. einer Sprachprobe) Die TTR erlaubt Aussagen über den individuellen Wortschatz und die sprachliche Kreativität. Ferner ist ein Zusammenhang zwischen der messbaren Intelligenz des Verfassers und seinem TTR-Wert nachweisbar (Lewandowski 1990,S. 1200). Wir können jetzt die Type-Token Relation der drei Textkorpora K1, K2, und K3 miteinander vergleichen (siehe Tab. 13). Für K3 (1990) ergibt sich ein Wert von 2,41 %. Das heißt, dass 2,41 % der enthaltenen Wörter Typen sind. Für K2 (2001 vor dem 11.9.) ermitteln wir einen Wert von 3,61 %. Für K1 (2001 nach dem 11.9.) erhalten wir 3,50 %. Wir lernen daraus, dass zum einen bei einer zunehmenden Korpusgröße die Type-Token Relation geringer wird. Auf der anderen Seite erkennen wir, dass zwischen K2 und K1 bei gleicher Korpusgröße eine andere Zahl entsteht, die Type-Token Relation von K2 zu K1 hat sich geringfügig um 0,11 Prozentpunkte verringert. Wir können die Werte von K1, K2 und K3 vergleichbar machen, obwohl K3 so viele Token beinhaltet, wie K1 und K2 zusammen, indem wir die standardisierte Type-Token Relation betrachten. Bei diesem Wert wird ein Korpus in Intervalle von 1000 Wörtern unterteilt, für jedes Intervall wird die Type-Token Relation erstellt, aus diesen Werten wird schließlich ein Mittelwert berechnet. Für K1 (2001 nach dem 11.9.) erhalten wir 47,58 %, für K2 (2001 vor dem 11.9.) 47,50 % und für K3 (1990) 47,69 %. Daraus schließen wir, dass sich die durchschnittliche Type-Token Relation bei Intervallen von 1000 Worten von 1990 bis zu dem Zeitraum 2001 vor dem 11.9. zunächst um 0,19 Prozentpunkte reduziert hat. Nach dem 11.9. stieg diese Relation jedoch wieder um 0,08 Prozentpunkte an. Also wurde 94 der Trend zur Redundanz kurzfristig umgekehrt, indem wieder mehr verschiedene Wörter verwendet wurden. Die Anzahl der Token in K1 und K2 ist nahezu gleich (s.o.). Während die Anzahl der Typen im Korpus K2 noch 36 467 beträgt, fiel die Summe in K1 um 1160 Typen auf 35 307. Vermutlich hat sich der Wortschatz durch den Einfluss von 9/11 verringert. 6.1.3 Die Häufigkeitslisten Das Wordsmith-Tool „Wordlist“ erzeugt neben der Textstatistik und der alphabetischen Wortliste eine nach Häufigkeiten geordnete Liste. In dieser Frequenzliste sind dieselben Werte wie in der alphabetischen Liste zu finden, jedoch jetzt nach Häufigkeiten geordnet. Es sind alle in einem Korpus enthaltenen Typen aufgelistet, versehen mit der Prozentzahl und der Anzahl der Token. Für unsere drei Hauptkorpora entstehen deshalb drei unterschiedliche Frequenzlisten. Im Folgenden sind die oberen 30 Einträge dieser drei Listen von K1 (35 307 Typen), K2 (36 467 Typen) und K3 (48 738 Typen) zu finden. Wenn wir die drei Listen mit jeweils 30 Typen nebeneinander platzieren, so stellen wir fest, dass diese wider Erwarten leicht voneinander abweichen. Bei einem fest definierten Register wie dem der Sprache von Qualitätszeitungen, erwarten wir, dass dieses Grundgerüst der Sprache, das sich aus den häufigsten Worten konstituiert, relativ gleich verteilt ist. Unter den obersten 30 Typen in den drei Frequenzlisten von K1, K2 und K3 befinden sich in erster Linie Funktionswörter (K1: 22 Funktionswörter, K2: 22, K3: 23). Die aufgelisteten Typen sind dem Satzzusammenhang entrissen, deren grammatikalische Funktion kann in vielen Fällen nicht klar bestimmt werden, da die Formen isoliert stehen. 95 K1 K2 K3 12.09.200111.12.2001 N WORD 1 THE 2 TO 3 OF 4 A 5 AND 6 IN 7 THAT 8 FOR 9 IS 10 WAS 11 ON 12 HE 13 SAID 14 IT 15 BY 16 BE 17 WITH 18 AS 19 HAVE 20 AT 21 ARE 22 HIS 23 FROM 24 HAD 25 MR 26 NOT 27 HAS 28 BUT 29 THEY 30 AN 01.06.200111.09.2001 N WORD 1 THE 2 TO 3 OF 4 A 5 AND 6 IN 7 THAT 8 FOR 9 WAS 10 IS 11 ON 12 HE 13 SAID 14 IT 15 BY 16 WITH 17 BE 18 AT 19 AS 20 HIS 21 HAVE 22 FROM 23 HAD 24 MR 25 ARE 26 HAS 27 BUT 28 THEY 29 NOT 30 WERE 01.01.199021.08.1990 N WORD Freq. 1 THE 144181 2 OF 64965 3 TO 58396 4 A 43686 5 IN 42938 6 AND 42799 7 THAT 21467 8 FOR 20423 9 IS 17051 10 ON 15804 11 WAS 15644 12 BY 14137 13 MR 13581 14 BE 13036 15 IT 12683 16 SAID 12523 17 WITH 11968 18 HE 11697 19 AS 11302 20 AT 10738 21 FROM 9800 22 HAVE 9549 23 ARE 8859 24 HAS 8826 25 HAD 8148 26 AN 8103 27 NOT 7978 28 WHICH 7721 29 WERE 7336 30 BUT 7311 Freq. 67324 29690 29403 22933 21823 20984 12820 9797 9236 9097 7962 7390 7227 6823 6376 6306 5949 5774 5402 5260 5014 4905 4698 4688 4541 4479 4477 4347 4138 4069 % 6,66 2,94 2,91 2,27 2,16 2,08 1,27 0,97 0,91 0,9 0,79 0,73 0,72 0,68 0,63 0,62 0,59 0,57 0,53 0,52 0,5 0,49 0,47 0,46 0,45 0,44 0,44 0,43 0,41 0,4 Freq. 66047 29181 28526 24483 21404 21062 11833 10224 9723 8383 8067 7612 7208 6692 6175 6093 5984 5890 5808 5514 5179 5011 4859 4621 4415 4218 4101 4090 4065 3980 % 6,54 2,89 2,82 2,42 2,12 2,09 1,17 1,01 0,96 0,83 0,8 0,75 0,71 0,66 0,61 0,6 0,59 0,58 0,58 0,55 0,51 0,5 0,48 0,46 0,44 0,42 0,41 0,4 0,4 0,39 st. Wert 72091 32483 29198 21843 21469 21400 10734 10212 8526 7902 7822 7069 6791 6518 6342 6262 5984 5849 5651 5369 4900 4775 4430 4413 4074 4052 3989 3861 3668 3656 % 7,13 3,21 2,89 2,16 2,12 2,12 1,06 1,01 0,84 0,78 0,77 0,7 0,67 0,65 0,63 0,62 0,59 0,58 0,56 0,53 0,48 0,47 0,44 0,44 0,4 0,4 0,39 0,38 0,36 0,36 Tab. 14: Vergleich der oberen 30 Einträge der Frequenz-Listen von K1, K2 und K3 (Freq.-Liste K3: st. Werte aufgerundet), die Funktionswörter sind unterstrichen Die Nicht-Funktionswörter in K1 sind der Reihenfolge nach die Typen >HE<, >SAID<, >IT<, >AS<, >MR< und >THEY<. In K2 sind es die gleichen wie in K1, auch in dieser Reihenfolge, jedoch mit leicht differierenden Häufigkeiten. In K3 hingegen sind es der Reihenfolge nach >MR<, >IT<, >SAID<, >HE< und >AS<. Der deutlichste Ausreißer ist die Anrede >MR< mit 0,67 % in K3 gegenüber 0,45 % in K1 und 0,46 % in K2. Es wirft Fragen auf, weshalb >MR< 2001 seltener verwendet wurde als 1990. Das deutet 96 auf einen Verlust von Höflichkeitsformen hin und ist damit als Qualitätsverlust zu werten. Auffällig ist ferner, dass der bestimmte Artikel >THE< in K3 sehr viel stärker vertreten ist (7,13 % gegenüber 6,66 % in K1 und 6,54 % in K2) und der unbestimmte Artikel >A< hingegen in K2 (2,42 %) und K1 (2,27 %) deutlich häufiger ist als in K3 (2,16 %). >THE< gilt in der funktionalen Grammatik als specific determiner, >A< als non-specific determiner der nominalen Deixis (Halliday 2004, S.315, siehe Ergebnisse von Jucker, in: Stubbs 1996, S.16 ff., bzw. s.o. Kap. 3.6). >OF< erreicht in K3 mit 3,21 % deutlich höhere Werte als in K1 (2,91 %) und K2 (2,82 %). >OF< fungiert dabei als Postmodifier oder post-Head Qualifier (Halliday 2004, S. 332). Das belegt eine reduzierte Verwendung dieser Funktionswörter in 2001 (s.o. Jucker). >THAT< ist in K1 mit 1,27 % deutlich häufiger vertreten als in K2 (1,17 %) und in K3 (1,06 %), (siehe Punkt 6.3.1, Subordinators). Das Personalpronomen >HE< fällt in K3 mit 0,58 % deutlich schwächer aus als in K2 (0,75 %) und in K1 (0,73 %). Das ist eine gegenläufige Entwicklung zur Type >MR< und weist auf eine Substitution hin: Die Personalpronomina stehen in Referenz zu Eigennamen (proper name) oder zu Dingen (thing), (Halliday 2004, S.325). Dieses kohäsive Mittel (pronominal reference) erzeugt im laufenden Text eine Referenzkette (reference chain, Halliday 2004, S.555). Der Verweis erfolgt innerhalb des Textes, deshalb wird von einer anaphorischer Referenz gesprochen (anaphoric reference), (Halliday 2004, S.554). Da die Tokenzahlen für >SHE< zu gering waren, um in die Liste Einzug zu erhalten, wurden etwaige Tendenzen nicht berücksichtigt (siehe auch >MRS< unter Punkt 6.2.3, naming strategies). Die geringe Referenz zu weiblichen Personen verdeutlicht, dass wir in einer größtenteils von Männern dominierten Welt leben. Bei der Type >IT< (specific non-personal pronoun, Halliday 2004, S. 315) ist ein nur geringes, aber stetiges Ansteigen von K3 (0,63 %) zu K2 (0,66 %) zu K1 (0,68 %) zu verzeichnen: Das Personalpronomen >THEY< erscheint nicht in Liste K3, ist deshalb < 0,36 %. In K1 (0,41 %) und K2 (0,4 %) sind die Werte fast gleichstark. 97 Wir werden an späterer Stelle bei der Auswertung der Subordinators und der Keyword-Listen auf weitere frappierende Abweichungen stoßen, die nicht unter den obersten 30 Einträgen dieser drei Häufigkeitslisten zu finden sind. Auch bei den Verbformen sind Schwankungen zu verzeichnen: >WAS< (K1: 0,9 %; K2: 0,96 %; K3: 0,77 %), >IS< (K1: 0,91 %; K2: 0,83 %; K3: 0,84 %), >HAVE< (K1: 0,53 %; K2: 0,51 %; K3: 0,47), >ARE< (K1: 0,5 %; K2: 0,44 %; K3: 0,44 %), >HAD< (K1: 0,46 %; K2: 0,48 %; K3: 0,4 %). Zur Diskussion der Coordinators siehe Punkt 6.3. Wie aussagekräftig diese Daten tatsächlich sind, ist schwierig zu beurteilen, da fraglich ist, ob und welche Testverfahren sicher angewendet werden können, um Ergebnisse zu gewinnen: Stichproben mit Wortgruppen, grammatikalischen Strukturen, Syntax- und Wortbildungsmustern sind anders zu bewerten als Stichproben aus Versuchspersonen in den Sozialwissenschaften oder Verkaufszahlen in den Wirtschaftswissenschaften. Jedoch kann, was einzelne Wörter anbetrifft, die Häufigkeit mit einem geläufigen Frequenzwörterbuch wie dem von Leech et al. (2001) oder mit den aufgelisteten Kollokationen in einem Kollokationswörterbuch verglichen werden (Oxford Collocations Dictionary for Students of English 2003). Solche Wörterbücher geben jedoch nur Anhaltspunkte für erwartete Häufigkeiten oder „Erwartete Begleitwörter“ und sagen uns nichts über vermeidlich signifikante Häufigkeitsveränderungen. So erfahren wir im Frequenzwörterbuch von Leech et al. (2001), das auf dem BNC basiert, dass die Type >HE< eine gerundete Häufigkeit von 16 475 (per million word tokens) für imaginative writing besitzt, jedoch nur 4240 in informative writing. Es wird ferner ein Log-LikelihoodWert (LL) angegeben, im Falle von >HE< 260 201, der die Signifikanz des Unterschiedes zwischen imaginative vs. informative beschreiben hilft. Für die Type >HE< als Beispiel bedeutet das, dass sie eine höhere Häufigkeit im Bereich imaginative writing erreicht. In unseren drei Korpora (K1: 7390; K2: 7612; K3: 5849 st. Wert) liegt der Wert für diese Type deutlich niedriger als für imaginative writing bei Leech et al. Er ist dennoch in allen drei Fällen höher als der Standardwert für informative writing. Das kann als Beleg für eine Boulevardisierung gewertet werden. 98 6.1.4 Die alphabetischen Listen und Hapax Legomena Betrachten wir die von Wordsmith mit Hilfe des Tools „Wordlist“ erstellten alphabetischen Listen, lässt sich erkennen, dass sie deutlich einem Wörterbuch oder Dictionary ähneln. Die Begriffe bzw. Typen sind von A bis Z aufgeführt. Doch anders als bei Lexika enthält die Wortliste keine Übersetzungen oder Worterklärungen, sondern den Rangplatz in der Liste, die Anzahl der Token pro Wort und die daraus resultierende Prozentzahl, sofern diese mindestens 0,01 % beträgt. Jedoch sind bei aus Korpusanalysen gewonnenen Listen aus Zeitungsartikeln sind, erstens, sehr viele Namen von Personen des politischen und gesellschaftlichen Geschehens sowie Orts- und Landesbezeichnungen enthalten, weiter, alle Rechtschreibfehler mit aufgelistet, die bei Zeitungen im Vergleich zur schöngeistigen Literatur verhältnismäßig häufig vorkommen. Darüber hinaus, finden wir in den alphabetischen Listen sehr viele Allomorphe, deklinierte Formen von Nomen, flektierte Verbformen, Komparativ-Formen von Adjektiven, Pluralformen, den sächsischen Genitiv, Amalgamierungen von Hilfsverben, aber auch Akronyme und andere Sonderformen, die für Dictionarys nicht in Frage kommen oder dort nur Einzug erhalten, wenn sie auf die geläufige Grundform, das Lexem, reduziert sind. Dictionarys werden nach strengen Kriterien konzipiert und viele Wortformen sind nicht geläufig genug, um aufgenommen zu werden, zu neu oder gehören eher in Spezialwörterbücher. KorpusanalyseProgramme sind hingegen undifferenziert und undifferenzierend, denn sie listen alles auf, jede im Korpus vorhandene Worttype, ob sie orthografische oder Tippfehler enthält, eine orthografische Varietät darstellt, Begriffe aus anderen Sprachen oder seltene und einmalige Neologismen. Zahlen werden jedoch nicht aufgelistet, es sei denn, sie sind als Wörter ausgeschrieben. Im Folgenden sind die ersten 25 Einträge der alphabetisch geordneten Liste von K1 aufgeführt. 99 New Wordlist (A) Freq. % N Word 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 22.933 A 1 À 6 Á 1 A´GLEINN 4 AA 2 AA´S 1 AACHEN 2 AAMER 3 AARON AARONOVICH 1 AARONOVITCH 1 1 AAS 2 ABACHA 2 ABAGUL 1 ABAGUL´S 36 ABANDON 48 ABANDONED ABANDONING 13 ABANDONMENT 4 2 ABANDONS 1 ABASSAN 2 ABATING 4 ABATTOIR 1 ABATTOIRS 1 ABAYA 2,27 * * * * * * * * * * Tab. 15.: Die obersten 25 Einträge in der alphabetischen Liste von K1 (Hapaxe sind mit einem Asterisk gekennzeichnet). Werfen wir einen näheren Blick auf die Liste, die Wordsmith2.0 aus K1 erzeugt, so erkennen wir, dass viele der Bestandteile Hapax Legomena (Oakes 2003, S. 151) oder kurz Hapaxe sind. Das sind Wortformen, die in einem Text oder Textkorpus nur ein einziges Mal vorkommen. Es lässt sich erkennen, dass sich unter den Hapaxen in erster Linie Namen von Personen und Orten befinden. Die Originalliste von K1 ist insgesamt 35 307 Zeilen lang. Unter den ersten 25 Typen dieser Liste befinden sich 10 Hapaxe (40 % der Typen, aber nur 0,04 % der Token). Vermutlich befinden sich in Zeitungstexten signifikant mehr Hapax Legomena als in anderen Texttypen als Resultat der tagesaktuellen Berichterstattung mit vielen singulären Ereignissen. Weitere Korpusanalysen könnten darüber Aufschluss geben. 100 6.2 Grammatikalische Untersuchungen In diesem Unterkapitel wurden textuelle Parameter untersucht, die dem linguistischen Teilbereich Grammatik zuzuordnen sind. Dazu gehören adverbiale Bestimmungen und Adverbien, die Skepsis und Zweifel ausdrücken, Modalverben und Modaladverbien, die einen Grad der Wahrscheinlichkeit beschreiben. Außerdem werden „Naming“-Strategien untersucht. 6.2.1 Effects of scepticism and doubt Es gibt eine Reihe von Adverben und adverbialen Bestimmungen, deren Vorkommen als Indiz dafür herangezogen werden kann, ob bei der Berichterstattung Skepsis oder Zweifel geäußert werden (Reah 1998, S.92). Dazu zählen >ALTHOUGH<, >FALSELY<, >ACTUALLY<, >HOWEVER<, >IN FACT<, >INSTEAD< und >IT IS DOUBTFUL<. K1 Freq. WORD 458 ALTHOUGH 8 FALSELY 79 ACTUALLY 517 HOWEVER 59 IN FACT 136 INSTEAD 1 IT IS DOUBTFUL 1258 ∑ K2 % 0,05 0,05 0,01 - Freq. 402 10 96 475 38 149 1170 K3 % 0,04 0,05 0,01 - Freq. 1006 14 90 1617 94 273 10 stand. W. 503 7 45 809 47 137 5 % 0,05 0,08 0,01 - 3104 Tab. 16: Effects of scepticism and doubt Doch eine Häufigkeitsanalyse dieser Begriffe in den drei Hauptkorpora hat nur geringfügige Abweichungen ergeben: Der Subordinator >ALTHOUGH< ist in K3 mit 0,05 % und 503 standardisierten Nennungen am häufigsten, am zweithäufigsten in K1 mit ebenfalls 0,05 % bei 458 Nennungen. In K2 sind es 402 Token bei 0,04 % (siehe Tab. 22, Verteilung der Subordinators). Das Adverb 101 >FALSELY< kommt insgesamt nur recht selten in den drei Korpora vor: 96-mal in K2, 79-mal in K1 und 90-mal in K3 (stand. Wert 45). >HOWEVER< kann sowohl Adverb als auch Konjunktion sein und drückt einen Widerspruch in den berichteten Tatsachen aus. Diese Type erreicht die höchste Anzahl an Token in dieser Liste. Die meisten Nennungen sind in K3 vorzufinden: 0,08 %, 1617 Token (stand. Wert 809). Am zweithäufigsten ist >HOWEVER< in K1 (0,05 %, 517 Nennungen). Den niedrigsten Wert erzielt K2 mit 0,05 % bei 475 Nennungen. >IN FACT< wurde prozentual nicht erfasst, da diese Phrase aus zwei Wörtern besteht. Wordsmith kann nur Häufigkeiten von einzelnen Wörtern errechnen. Die Werte mussten aus den Konkordanzlisten abgelesen werden. In K1 sind es 59 Nennungen, in K3 94 (stand. Wert 47), für K2 liegen 38 Belege vor. Das Adverb >INSTEAD< kommt in jedem der drei Hauptkorpora zu 0,01 % vor, in K2 sind es 149 Token, in K3 sind es 273 (stand. Wert 137), in K1 136 Token. Die Wortkette >IT IS DOUBTFUL< ist nur in K3 (stand. Wert 5) und in K1 (eine Textstelle) vorhanden. Die deutlichste Abweichung ist die Häufigkeit von >HOWEVER<, die nach 1990 um gut 0,03 % gesunken ist, eine Verwendung, die deutliche Skepsis ausdrückt. Vergleichen wir schließlich die Summen der Häufigkeiten, so erhalten wir den höchsten Wert für K3 mit 3104 Token (stand. Wert 1552). Die Werte für K1 (1258) und K2 (1170) sind deutlich niedriger. Es lässt sich deshalb festhalten, dass 1990 mehr Zweifel und Skepsis ausgedrückt wurde als 2001, sofern wir das an den oben aufgeführten Adverbien, Konjunktionen und adverbialen Bestimmungen erkunden können. 6.2.2 Degree of probability Die in der folgenden Tabelle aufgeführten Modalverben und Modaladverbien stehen für Grade von Wahrscheinlichkeit, bzw. Degree of Probability (Reah 1998, S.91) in den im Quoting oder Reporting getroffenen Äußerungen, sowie in den kommentierenden Textpassagen o.Ä. 102 K1 K2 K3 12.9.- 11.12.2001 1.6.- 11.09.2001 1.1.- 21.08.1990 Word Freq. % Freq. % Freq. stand. W. % CAN WILL SHALL MAY MUST COULD WOULD SHOULD MIGHT 1126 3825 38 915 395 1497 3036 937 413 0,11 0,38 0,09 0,04 0,15 0,3 0,09 0,04 1056 3679 38 930 391 1479 2946 805 342 0,1 0,36 0,09 0,04 0,15 0,29 0,08 0,03 1963 7311 65 1890 849 3006 6668 2123 894 982 3656 33 945 425 1503 3334 1062 447 0,1 0,36 0,09 0,04 0,15 0,33 0,11 0,04 POSSIBLY LIKELY 71 359 0,04 62 377 0,04 142 759 71 380 0,04 ∑ 12612 12105 25670 12838 Tab. 17.: Degree of probability (anhand von Modalverben und -adverbien) Wie wir der Tabelle entnehmen können, stechen nur recht wenige Werte hervor: >CAN< (0,11 %) und >WILL< (0,38 %) sind in K1 am stärksten vertreten. Das Hilfsverb >WILL< ist zugleich das insgesamt häufigste Element der oben aufgeführten Kategorien. Die jeweiligen Werte liegen nahe beieinander. >MAY< ist mit 0,09 % bei 1890 Nennungen (stand. Wert 945) in K3 am stärksten vertreten, ebenso wie >MUST< mit 0,04 % (424 standardisierte Nennungen). Auch >COULD< ist in K3 am häufigsten (0,15 %; 1503 stand. Nennungen). Ferner ist für >WOULD< in K3 der größte Anteil vertreten (0,33 %; 3334 stand. Nennungen), dieses ist zugleich die zweitgrößte Kategorien. Auch >SHOULD< ist in K3 im Vergleich am häufigsten (0,11 %; 1062 stand. Nennungen). Das Gleiche gilt für >MIGHT< mit 0,04 % bei 447 stand. Nennungen. Der Wert von >SHALL< ist mit einem Range von 32 (stand. Nennungen in K3) bis 38 (je in K1 und K2) sehr gering, deshalb werden die Werte prozentual nicht erfasst. Das Gleiche gilt für das erste der beiden Modaladverbien: >POSSIBLY< ist mit einem Range von 62 (K2) bis 71 in K1 und K3 (bei einem Gesamtwert von 142 in K3) sehr selten enthalten. Anders 103 ist es mit >LIKELY< bei einem Range von 359 (K1) bis 379 (K3, orig. Wert 759) ist es mit 0,04 % in K3 am stärksten präsent. Die beiden Hilfsverben >CAN< und >WILL< stehen für klare Aussagen, es ist nicht verwunderlich, dass gerade nach dem 11. September diese beiden Formen vergleichsweise häufiger verwendet werden, als in den anderen beiden Untersuchungszeiträumen, denn es ging schließlich in dem Chaos der Wochen und Monate nach den Terroranschlägen darum, klare Stellung zu beziehen, das weitere Prozedere zu erklären und gegen die Niedergeschlagenheit anzugehen. Für das Gros der restlichen Modalverben und die beiden Modaladverbien sind in K3 die Verteilungsgipfel zu finden. Diese Wahrscheinlichkeitsformen stehen auch für sprachliche Kreativität. Sie haben rein psychologisch die Funktion, beim Beschreiben von Sachverhalten zu helfen. Diese Verwendung ist in 2001 seltener geworden. Für K3 erhalten wir eine Summe von 25 670 Token (stand. Wert 12 835). Am geringsten ist der Wert für diese Kategorie in K2 mit 12 105. In K1 ist die Gesamttokenzahl wieder etwas größer (12 612). Dennoch liegen die drei Werte relativ dicht beieinander. 6.2.3 Naming als Indikator für Boulevardisierung „Naming“-Strategien, bzw. die Verwendungen von Namen innerhalb von Pressetexten ist ein ausgezeichneter Indikator dafür, wie mit Personen in der Presse umgegangen wird (Reah 1998, S.55 ff.). Halliday differenziert in proper names (names of individual participants), common nouns (names of classes of participants) und personal pronouns (Halliday 2004, S.178 u. 325). Die Analyse des „Naming“ kann darüber Aufschluss geben, ob bestimmte Personen durch die Berichterstattung in den Vordergrund gehoben werden, oder gar Personenkult betrieben wird. Wenn außerdem Personen mit ihren unterschiedlichen Bezeichnungen (z.B.: >PRESIDENT<, >MR BUSH<, >GEORGE BUSH<, >GEORGE W. BUSH<, etc.) gegenüber Sachthemen immer stärker in den Vordergrund treten, so kann dieses als Indiz für eine zunehmende Boulevardisierung gelten. In der folgenden Tabelle sind für die drei Hauptkorpora die jeweils zwölf häufigsten Namen, Gruppen- und Personenbezeichnungen 104 aufgeführt. Personalpronomina wurden dabei außer Acht gelassen, ebenso die Synonyme. Die Namen bzw. Bezeichnungen sind den Frequenzlisten entnommen. N steht für den Rang innerhalb der jeweiligen Liste. K1 (12.9.-11.12.01) K2 (1.6.-11.9.01) K3 (1.1.- 1.8.90) N WORD Freq % N WORD Freq % N WORD Freq st.W. % 25 MR 4541 0,45 24 MR 4621 0,46 13 MR 13581 6791 0,67 51 PEOPLE 1936 0,19 54 POLICE 1854 0,18 44 GOVERNMENT 4168 2084 0,21 67 GOVERNMENT 1529 0,15 58 PEOPLE 1806 0,18 64 PEOPLE 3020 1560 0,15 78 POLICE 1224 0,12 70 PARTY 1386 0,14 74 PRESIDENT 2447 1224 0,12 94 BIN 949 0,09 73 LABOUR 1306 0,13 78 PARTY 2349 1175 0,12 95 MINISTER 947 0,09 74 GOVERNMENT 1262 0,12 79 POLICE 2348 1174 0,12 111 PARTY 800 0,08 113 MINISTER 787 0,08 91 MINISTER 1994 997 0,1 115 SECRETARY 775 0,08 126 TORY 703 0,07 113 LABOUR 1568 784 0,08 117 TALEBAN 759 0,08 131 FAMILY 687 0,07 114 COUNCIL 1544 772 0,08 118 LADEN 758 0,08 135 CHILDREN 660 0,07 121 SECRETARY 1436 718 0,07 120 CHILDREN 739 0,07 137 MAN 654 0,06 128 MRS 1391 696 0,07 121 FORCES 739 0,07 138 BLAIR 652 0,06 172 MEMBERS 1089 545 0,05 ∑ 16378 ∑ 36935 ∑ 15696 Tab. 18: Die häufigsten Namen, Personenbezeichnungen in K1, K2 und K3 Gruppen- und Diesmal werden nur die Prozentwerte miteinander verglichen, da jede untersuchte Kategorie prozentual erfasst werden konnte. Das herausragende Ergebnis bei der Auswertung ist die Tatsache, dass die Form >MR< gegenüber K3 eine starke Veränderung durchlaufen hat. Während >MR< in K3 noch 0,67 % aller Token ausmacht, sind es in K2 nur 0,46 %, in K1 sogar 0,45 %. Unter den ersten zwölf Namensverwendungen in K1 sind vier vorhanden, die in den beiden Zwölfertabellen von K2 und K3 nicht zu finden sind: >BIN< (0,09 %), >TALEBAN< (0,08 %), >LADEN< (0,08 %) und >FORCES< (0,07 %). Das kann als Indiz dafür gewertet werden, dass ein neues Feindbild aufgebaut werden sollte (siehe 5.5). Die ausschließlich unter den zwölf obersten Einträgen von K2 zu findenden Namensverwendungen sind >TORY< (0,07 %), >FAMILY< (0,07 %), >MAN< (0,06 %) und >BLAIR< (0,06 %). Ausschließlich in der Zwölferstaffel von K3 enthalten sind 105 >PRESIDENT< (0,12 %), >COUNCIL< (0,08 %), >MRS< (0,07 %) und >MEMBERS< (0,05 %). Die Nennung von >GOVERNMENT< hat gegenüber 1990 (0,21 %) in K2 (0,12 %) und K1 (0,15 %) stark eingebüßt. Die Personengruppe der Polizisten (>POLICE<) ist in K2 mit 0,18 % vergleichsweise stark vertreten gegenüber jeweils 0,12 % in K1 und K3. In K2 kommt >POLICE< noch vor anderen Common Nouns wie >FAMILY< (0,07 %), >CHILDREN< (0,07 %) und >MAN< (0,06 %). Es ist verwunderlich, dass >PEOPLE< in K3 nur 0,15 % einnimmt, in K2 sind es 0,18 % und in K1 sogar 0,19 %. Ebenso bemerkenswert ist, dass der Wert von >MRS< in den Zwölferstaffeln von 2001 nicht zu finden ist, jedoch mit 0,07 % in der Liste K3. Das liegt zum überwiegenden Teil an den Berichten über Margaret Thatcher, die in rund 80 % der Nennungen (insg. 742 in K3) die Anrede >MRS< erhält.13 Vergleichen wir die Spaltensummen, so stellen wir fest, dass K3 mit 36 935 (stand. Wert 18 468) die höchsten Werte erreicht. Darauf folgt der Wert von K2 mit 16 378 Token und schließlich der von K1 mit 15 696. Dennoch reichen die gewonnenen Werte nicht aus, um zu entscheiden, ob in den untersuchten Zeiträumen eine Boulevardisierung stattgefunden hat. Die Daten weisen laut Spaltensummen einen entgegengesetzten Trend auf (zur Schlüsselwortfunktion von Pronomina, siehe Punkt 6.4.3.3). Um zu überprüfen, wie gravierend die Veränderungen beim „Naming“ zwischen 1990 und 2001 waren, wurde für die Anreden >MR< und >MRS< bzw. >MS< ein 4-Felder-χ²-Test durchgeführt. 1990 Mr Mrs/Ms Summe 13581 1709 15290 a 2001 9162 1668 c Summe 22743 b 10830 d 3377 26120 Abb. 5: 4-Felder-χ²-Test >MR< und >MRS</ >MS< 1990/ 2001 13 Margaret Thatcher erklärte am 22. November 1990 ihren Rücktritt vom Amt der Premierministerin. Das zeitliche Range von K3 reicht vom 1.1.1990 bis zum 21.8.1990. 106 Die zu überprüfende Hypothese lautet, dass die Verwendung der männlichen und weiblichen Anreden in den Zeitungen 1990 und 2001 gleichstark vertreten sind. Dabei wurde die folgende Formel angewendet: χ² = n × (ad - bc)² = 100,50 (a+b) × (c+d) × (a+c) × (b+d) (mit df = 1 Freiheitsgrad; siehe: Bortz 2005, S. 169). Die Tabelle für χ²-Tests (Bortz 2005, S. 817/18) für einen zweiseitigen Test (df=1; α = 0.001; χ²crit = 10,828) weist als oberen Grenzwert 10,828 auf. Daraus ergibt sich ein sehr signifikanter Wert. Die eingangs aufgestellte Hypothese muss deshalb verworfen werden. Die männlichen und weiblichen Anreden sind in 1990 und 2001 in den analysierten Pressekorpora nicht gleich verteilt. Die größte Abweichung stellt der Wert für die männliche Anrede >MR< 1990 mit 13 581 Nennungen dar. Dieselbe Hypothese können wir auf K1 und K2 anwenden, dass die männlichen und weiblichen Artikel in den Presse-Texten vor dem 11. September und denen danach gleich verteilt sind. Daraus ergab sich das folgende 4-Felder-χ²-Schema: K2 Mr Mrs/Ms Summe 4621 947 5568 a K1 4541 721 c Summe 9162 b 5262 d 1668 10830 Abb. 6: 4-Felder-χ²-Test für >MR< und >MRS</ >MS< in K2 und K1 107 Nach Anwendung der Formel (s.o.) erhalten wir χ²= 22,69. Es wurde dasselbe Prüfniveau veranschlagt wie im Test zuvor (df=1; α = 0.001; χ²crit = 10,828). Nach Einsicht in Tabelle C wurde das Ergebnis als sehr signifikant bewertet, d.h.: die männlichen und weiblichen Anreden sind in K1 und K2 nicht gleich verteilt. Besonders hervorstechend ist der sehr niedrige Wert für die weiblichen Formen >MRS< und >MS< nach dem 11. September mit 279 Nennungen. Zusammenfassend lässt sich sagen, dass Namen mehr und mehr ohne >MR<, >MRS< bzw. >MS< verwendet werden, trotz des Maximums für >MRS< während der Thatcher-Ära ab. Auch dass die Token >MRS< und >SHE< (siehe 6.4.3.3) eine gegenläufige Entwicklung in ihren Häufigkeiten durchlaufen haben, kann nur mit dem nahezu protokollarischen Verwenden der Anredeformel >MRS (MARGARET) THATCHER< in 1990 erklärt werden. 6.3 Untersuchungen an der Syntax Im folgenden Kapitel sind Untersuchungen auf Basis der von Wordsmith ermittelten Satzlängen durchgeführt worden. Ausgewählte Kollokationen und Konkordanzen sind aufgeführt und anhand von Beispielsätzen illustriert. 6.3.1 Vergleich der durchschnittlichen Satzlängen in den Untersuchungszeiträumen Bignell (1997, S. 94) nennt in seinem Buch „Media Semiotics“ die Faustregel, dass Qualitätszeitungen generell längere Sätze verwenden als Boulevardzeitungen. Außerdem finden wir in Qualitätszeitungen keine Parasprache, keine unvollständigen Sätze, keine Rechtschreibfehler, keine Puns bzw. Wortspiele in Überschriften u.Ä. Wie bereits in Tabelle 13 dargestellt, zählt Wordsmith für K1 und K2 zusammen 72 732 Sätze bei circa zwei Millionen Wörtern (33 981 (K1) + 38 751 (K2)). Für K3 werden hingegen 43 364 Sätze bei zwei Millionen Wörtern ermittelt. Ferner wurde eine durchschnittliche 108 Satzlänge von 22,34 Wörtern für K1 ermittelt und 21,85 für K2. Demgegenüber finden sich im Durchschnitt 40,69 Wörter pro Satz in K3. Die Streuung in der Wortmenge pro Satz für K1 beträgt laut Wordsmith 13,59, für K2 11,43, für K3 38,25. Die Werte für die durchschnittliche Satzlänge sind im Folgenden in einem Balkendiagramm dargestellt: Anz. der Wörter durchschn. Satzlänge 45 40 35 30 25 20 15 10 5 0 40,69 22,34 21,85 durchschn. Satzlänge K1 K2 K3 Korpus Grafik 5: Durchschnittliche Satzlängen in den Hauptkorpora (Excel-Grafik) Diese Werte wurden überprüft, indem das Produkt aus Anzahl der Sätze und durchschnittlicher Satzlänge gebildet wurde, das der tatsächlichen Korpusgröße in Anzahl der Wörter entsprechen muss. Dabei wurden starke Diskrepanzen festgestellt. N Sentences Sentence length Sd. Sentence (A) (B) length AxB K1 33.981 22,34 13,59 759135 K2 38.751 21,85 11,43 846709 K3 43.364 40,69 38,25 1764481 ∑ 116096 3370326 Tab. 19: Produkt aus Anzahl der Sätze und Satzlänge Das Produkt aus Anzahl der Sätze und durchschnittliche Wortmenge pro Satz in K3 ergibt 1 764 481 Wörter, hätte jedoch 2 021 045 109 Wörter ergeben müssen (siehe Tab. 13). Für K2 ergibt sich die Zahl 846 709 Wörter, es hätten sich 1 010 073 Wörter ergeben müssen. Für K1 sind es 759 135 Wörter statt 1 010 191 Wörter. Deshalb sollte Grafik 5 nur unter Vorbehalt betrachtet werden. Wir können den Werten vorerst nur eine Tendenz entnehmen. Um die Ergebnisse der Auszählung der Satzlängen zu überprüfen, wurden den Hauptkorpora Stichproben in der Größe von dreimal 45 Artikeln entnommen, deren Satzlängen einmal per Hand und einmal von Wordsmith durchgezählt wurden. Tendenziell wurden die Ergebnisse der Wordsmith-Statistik aus Tabelle 13 bestätigt. Die totalen Werte in der Stichprobe liegen jedoch näher beieinander als bei der Wordsmithzählung. Die Tendenz sowohl der Auszählung für die drei Hauptkorpora als auch für die neun Subkorpora und der selbst durchgezählten Stichproben geht eindeutig in die Richtung, dass die längsten Sätze in K3 zu finden sind, deutlich kürzere Sätze in K2 und K1, wobei der Wert für K1 geringfügig höher liegt als der für K2. In einem weiteren Schritt wurde die Satz-Statistik für die neun Subkorpora erstellt. Daraus resultiert die folgende Tabelle: N Sentences Sentence sd. Sentence (A) length (B) length AxB K1 Independent.2001.danach 6849 36,21 35,25 248002 Guardian.2001.danach 8458 28,82 29,17 243759 Times.2001.danach 17880 27,65 24,72 494382 K2 Times.2001.davor 21568 23,23 13,98 501024 Independent.2001.davor 5991 41,27 41,67 247248 Guardian.2001.davor 10673 23,11 13,34 246653 K3 Independent.1990 11731 42,52 40,49 498802 Times.1990 18749 53,72 60,2 1007196 Guardian.1990 12565 39,84 39,97 500589 ∑ 114464 3987655 Tab. 20: Satzmenge und Satzlänge in den neun Subkorpora 110 In dieser Tabelle entspricht das Produkt aus Satzlänge und -menge (A x B) mit geringen Schwankungen den in Tab. 13 festgehaltenen Werten.14 Die Tabelle zeigt außerdem, dass sich die längsten Sätze in den drei Subkorpora von 1990 befinden. Den höchsten Wert insgesamt erzielt Times.1990 mit einer durchschnittlichen Satzlänge von 53,72 Wörtern pro Satz. Den absolut geringsten Wert erzielt Guardian.2001.davor mit nur 23,11 Wörtern pro Satz. In Kennedy 1998 (S.157/58) finden wir einen Hinweis, dass die Anzahl der Wörter pro Satz in „informative prose“ deutlich länger ist als in „imaginative prose“. Für Presse-Reportagen nennt Kennedy einen Richtwert von 20,72 Wörtern/ Satz. Dieser Kategorie von Kennedy kommt das Subkorpus Guardian.2001.davor am nächsten. In den drei Subkorpora von K2 gibt es eine deutliche Abweichung, das sind die durchschnittlich 41,27 Wörter pro Satz in Independent.2001.davor gegenüber 23,11 (Guardian.2001.davor) und 23,23 (Times.2001.davor). In den Erhebungszeitraum des Independent-Subkorpus fällt unter anderem die Berichterstattung über den Milošević -Prozess. Die Korpora, die in War on terror und Kuwait-Krise fallen - das ist als Fazit hier festzuhalten - beinhalten verhältnismäßig lange Sätze. Die Subkorpora von K2 hingegen haben deutlich kürzere Sätze mit der Ausnahme des besagten Subkorpus mit Berichten über den Milošević-Prozess. Das folgende Histogramm zeigt die durchschnittliche Satzlänge in den neun Subkorpora. 14 Wir können daraus schließen, dass Wordsmith bereits ab einer Korpusgröße von 1 Mio Wörtern für die Anzahl der Wörter pro Satz keine exakten Werte mehr liefert, dieses jedoch für eine Korpusgröße von 0,5 Mio Wörtern leistet. 111 nd en t.2 G ua 00 rd 1. ia da n. na 20 ch Ti 01 m .d es an .2 ac 00 h Ti 1. da m In e de na pe s.2 c 0 nd 01 h en . t.2 dav G ua or 00 rd 1. ia da n. vo 20 r In 01 de . d pe av nd or en t.1 99 Ti 0 m es G .1 ua 99 rd 0 ia n. 19 90 In de pe Durchschn. Wörter/ Satz 60 50 40 30 20 10 0 Subkorpora Grafik 6: Durchschnittliche Satzlängen in den Subkorpora Es ist nicht auszuschließen, dass die folgende Faktoren zu den Diskrepanzen bei der Ermittlung der Satzlängen beigetragen haben: Die Zeilenlänge in den verwendeten Datenspeichern (CD-Rom, Electronic Database, Online-Zeitungen) war nicht einheitlich, ebenso wie das Setzen der Satzzeichen, sowie Abgrenzung von Überschriften, Absätzen und Paragrafen mit Hilfe von Leerstellen und Leerzeilen. Die von Wordsmith2.0 ermittelten Ergebnisse wurden später von der Software Wordsmith3.0 überprüft, die exakt dieselben Daten lieferte. Wir wissen von der funktionalen Grammatik, dass ’verbal’ clauses eine wichtige Rolle bei der Zeitungsberichterstattung spielen (Halliday 2004, S. 174). Das so genannte Reporting und Quoting sind speziell im Register der Pressesprache allgegenwärtig, und häufig ist das Reporting dem Quoting vorangestellt (Halliday, S. 462). In der Zeit nach den Terroranschlägen wurden unzählige Reden von ranghöchsten Politikern gehalten und in den Zeitungen wiedergegeben, insbesondere von George Bush und Tony Blair. Das Korpus K1 beinhaltet deshalb sehr viele Zitate, deutlich mehr als die anderen beiden Korpora, was stichprobenhaft anhand der Korpusbestandteile und der Konkordanzlisten überprüft wurde. Nach dem 11. September waren die vorrangigen Themen West vs. Islam, Islam vs. Christianity, Verfahrensweise mit der Al-Qaeda, etc. Und es waren in erster Linie die Politikerreden, die das 112 ideologische und pragmatische Fundament für die Berichterstattung boten; die spiegelt sich im Quoting und Reporting wider. Um die gravierenden Unterschiede bei den von Wordsmith ermittelten durchschnittlichen Satzlängen zu analysieren, wurde der Versuch unternommen, die Verteilung der nebenordnenden bzw. parataktischen Konjunktionen (Coordinators) und der unterordnenden bzw. hypotaktischen Konjunktionen (Subordinators) zu überprüfen. Zunächst die Auflistung der Coordinators: K1 K2 12.09.200111.12.2001 K3 01.06.200111.09.2001 01.01.199021.08.1990 Nr. 1. 2. 3. 4. 5. 6. 7. 8. WORD (Coordinator) AND BUT EITHER NEITHER NOR OR SO THEN Freq. 21823 4347 125 76 109 2019 1250 660 % 2,16 0,43 0,01 0,01 0,2 0,12 0,07 Freq. 21404 4101 141 63 73 1944 1113 693 % 2,12 0,41 0,01 0,19 0,11 0,07 Freq. 42799 7311 297 130 193 3722 1873 1104 stand. Wert 21400 3656 149 65 97 1861 937 552 % 2,12 0,36 0,01 0,18 0,09 0,05 9. YET 344 0,03 225 0,02 528 264 0,03 30753 3,03 29757 2,93 57957 28981 2,84 Σ Tab. 21: Verteilung der Coordinators in den drei Hauptkorpora Für die Verteilung der Coordinators >AND<, >BUT<, >EITHER<, >NEITHER<, >NOR<, >OR<, >SO<, >THEN< und >YET< (siehe: Halliday 2004, S.81) zeigt sich das folgende Bild: den höchsten Wert erzielt das Korpus K1 mit 30 753 Formen. In K2 sind es 29 757 und in K3 nur 57 957 (stand. Wert 28 981). Das weist auf einen Widerspruch hin, denn in sehr langen Sätzen wie in K3 sind deutlich mehr Konjunktionen zu erwarten als in kurzen. Es wurde vorab vermutet, dass die vermehrte Anwendung dieser Funktionswörter Sätze eher strecken, als dass sie diese verkürzen. Um zu überprüfen, wie signifikant die Veränderungen bei der Verwendung der Coordinators von K2 zu K1 ist, wurde ein χ²-Test durchgeführt. Dabei wurde der Wert von K2 als Basiswert verwendet. Es wurde davon ausgegangen, dass die erwartete Häufigkeit der Coordinators in K1 genauso ist wie in K2. 113 Laut Bortz (2005, S.156) errechnet sich die erwartete Häufigkeit aus den beobachteten Häufigkeiten: f e (1) = f e (2) = f b(1) + f b(2) 2 = 30753 + 29757 2 = 30255 ; Für die beobachteten Häufigkeiten (f b) wurden die Spaltensummen für K1 und K2 eingefügt. In einem weiteren Schritt kann die χ²-Technik angewendet werden (Bortz 2005, S.163): 2 χ²emp. = Σ j=1 (f b(j) – fe(j))² f e (j) 16,39 = Aus der Anzahl der Spalten und Zeilen wurden gemäß Oakes (2003, S.42) df=(9-1) ·(2-1) = 8 Freiheitsgrade errechnet. In der Tabelle C für den χ²-Test (Bortz 2005, S.817/18) finden wir den Wert 15,51 als obere Grenze für nicht-signifikante Ergebnisse (auf einem 5%-Niveau). Damit ist das hier gefundene Ergebnis signifikant, d.h. es ist zu einer signifikanten Veränderung bei der Verwendung der Coordinators von K2 (vor 9/11) zu K1 (nach 9/11) gekommen. Die folgende Tabelle zeigt die Verteilung der Subordinators (siehe: Halliday 2004, S.81) in den drei Hauptkorpora: 114 K1 K2 12.09.200111.12.2001 Nr. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. WORD Freq. 2371 AFTER 458 ALTHOUGH 8 ASSUMING (THAT) 1065 BECAUSE 1082 BEFORE EVEN IF* GIVEN THAT* 1638 IF 25 IN CASE 43 IN ORDER TO IN SPITE OF THE FACT (THAT) 1 19 IN THE EVENT (THAT) 3 PROVIDED THAT SEEING THAT* 793 SINCE SO THAT* SUPPOSING THAT* 11410 THAT 89 UNLESS 396 UNTIL 1918 WHEN 399 WHETHER 620 WHILE 01.01.199021.08.1990 % 0,23 0,05 0,11 0,11 Freq. 2662 402 3 1147 1060 % 0,26 0,04 0,11 0,1 Freq. 3983 1006 24 1829 1787 stand. Wert % 1992 0,2 503 0,05 12 915 0,09 894 0,09 0,16 - 1668 15 35 1 11 2 0,17 - 3162 30 118 64 7 1581 15 59 32 4 0,16 - 0,08 690 0,07 1520 760 0,08 1,27 0,04 0,19 0,04 0,06 10413 90 401 2042 345 718 1,17 0,04 0,2 0,03 0,07 20179 217 794 3206 799 1310 10090 109 397 1603 400 655 1,06 0,01 0,04 0,16 0,04 0,06 26505 13254 14832 Σ K3 01.06.200111.09.2001 14009 Tab. 22: Verteilung der Subordinators in den Hauptkorpora (Mit * gekennzeichnete Subordinators sind bereits an anderer Stelle mitgezählt (IF, THAT). Die Konkordanzlisten wurden für >THAT< stichprobenhaft überprüft, so dass ausschließlich die Subordinators berücksichtigt wurden.) Wir sind erneut mit dem Widerspruch konfrontiert, dass trotz deutlich längerer Sätze im Korpus von 1990 die Anzahl der Subordinators dort geringer ist. Die Spaltensummen zeigen, dass die meisten Subordinators in K1 enthalten sind (14 832). In K2 sind es 14 009 und in K3 nur 26 505 (stand. Wert 13 254). Das belegt einen deutlichen Zuwachs von 1990 zu 2001, und einen geringen Zuwachs von K1 zu K2. Auch für die Subordinators in K1 und K2 ist ein χ²-Test durchgeführt worden: f e (1) = f e (2) = f b(1) + f b(2) = 14832 + 14009 2 2 115 = 14421 ; Für die beobachteten Häufigkeiten (f b) wurden die Spaltensummen für K1 und K2 eingefügt. In einem weiteren Schritt kann erneut die χ²-Technik angewendet werden: 2 χ²emp. = Σ j=1 (f b(j) - fe(j))² f e (j) 23,48 ; = Es wurden df=(18-1) ·(2-1) = 17 Freiheitsgrade errechnet. In der Tabelle C für χ²-Tests (Bortz 2005, S.817/18) finden wir bei einem 5%-Prüf-Niveau und 17 Freiheitsgraden den Wert 27,59. Im Gegensatz zur Coordinators-Gruppe ist das Ergebnis für die Subordinators nicht signifikant. Deshalb sind hier zwei Faktoren zu nennen, die zu den Veränderungen bei den durchschnittlichen Satzlängen beigetragen haben können: erstens, dass bei den Satzkonstruktionen 1990 trotz geringerer Menge an Konjunktionen und Aufzählpartikel längere Hauptsätze konstruiert wurden. Zweitens, dass aufgrund der unterschiedlichen Urspungsmedien der Zeitungsartikel keine einheitliche Wort- und Satzgrenzenerkennung durchgeführt wurde. Der 11. September hingegen, der in der Zeitungssprache für vermehrtes Quoting und Reporting sorgte, hatte nur einen relativ geringen Einfluss auf die Länge der produzierten Sätze. Es wurden zwar die meisten Konjunktionen insgesamt verwendet, die Sätze waren jedoch nicht annähernd so lang wie 1990. 6.3.2 Ausgewählte Konkordanzen Im Folgenden Unterkapitel sind Konkordanzlisten zu den Suchwörtern >ISLAM< und >ARABIC< aufgeführt. In einem weiteren Schritt sind Konkordanzen aus den Wortgruppen „Arabisch“ und „islamische Welt“ mit einem der Kontextwörter aus der Wortgruppe „Terror“ verknüpft, um zu erkunden, ob eine der beiden Gruppen häufiger mit dem Themenkreis Terror korreliert. Die Befunde sind anhand von vollständigen Sätzen illustriert (siehe auch: syntaktische Ambiguität, Kap. 6.4.1) 116 6.3.2.1 Die Konkordanzliste zu >Islam< in K1 Zur Debatte steht im Folgenden die Konkordanzliste zu >ISLAM<. Das Wort ist klar definiert (OED, Band VIII.: a. The religious system of Muhammed, Muhammadanism; the body of Muslims, the Muslim world. B. An orthodox Muslim. Obs.) In K1 finden wir 115 Konkordanzen zu >Islam<. Hier ein Auszug mit den 40 ersten Einträgen der Liste: N Concordance is not a sect but a way of looking at Islam. It is found mainly in areas of 1 g a retired Pakistani officer named Islam Khan. Captain Rasul, who di 2 inalising a famous author who calls Islam a hateful religion on televisi 3 waging a war against terrorists, not Islam; that American supported the 4 a conflict between Christianity and Islam," he said. The Muslim Coun 5 n or a society, at all well; I doubt if Islam has understood the West mu 6 An extreme Salafi interpretation of Islam, according to a source close t 7 vert to an ancient and "pure" form of Islam. Although most are ultra-cons 8 Bat terrorism, and not an attack on Islam. "Those who try to portray th 9 10 s," and "offer Iran's interpretation of Islam to the world", it was announc 11 Lim College and one-time adviser on Islam to Prince Charles, challenge hey are terrorists pure and simple. Islam is a peaceful and tolerant reli 12 Sees itself as a spiritual leader in Islam and a model Muslim nation 13 ss, the attitude of the West towards Islam needs to be one of understa 14 15 back from a confrontation between Islam and the west. But after dispi le between modernity and militant Islam" being waged across the Mid 16 s not a battle between the west and Islam, he argued. King Abdullah s 17 accurate." Extremist view of Islam unites terror suspects Salaf 18 19 nt bombardment of Kabul on Friday, Islam's holy day. 20 breeding-grounds for radical, violent Islam, there are more complex legal 21 breeding-grounds for radical, violent Islam, there are more complex legal 22 ounis Khalis' brigade of the Hizb al Islam (the Islamic Party), he was w 23 Ited the world's largest, Indonesia) Islam diminishes the individual. It di tement condemning the terrorism. Islam is a religion of peace and I d 24 d concerning the spread of radical Islam from the Taleban, the weapon 25 e conflict becoming a war between Islam and the West. As Mr Blair 26 27 contradicting the sublime values of Islam, a religion of peace," it said. 28 1 "to convey the eternal message of Islam to the entire world". Investig Two cousins, Javed Lodi, 27, and Islam Deim, 28, intended to follow h 29 Ction between terrorism and political Islam . . . we demand a distinctio 30 Est not to engage in a war against Islam, saying: "We must not let wh 31 Be erased. A literal interpretation of Islam, which laid down that a man's 32 33 ", evoking a religious clash between Islam and Christianity. Last week I 117 Word No. File 537.662 e:\k1.txt 180.585 e:\k1.txt 327.784 e:\k1.txt 350.801 e:\k1.txt 591.799 e:\k1.txt 255.594 e:\k1.txt 536.709 e:\k1.txt 536.765 e:\k1.txt 660.258 e:\k1.txt 596.568 e:\k1.txt 601.459 e:\k1.txt 251.901 e:\k1.txt 293.283 e:\k1.txt 255.567 e:\k1.txt 648.468 e:\k1.txt 332.768 e:\k1.txt 744.640 e:\k1.txt 536.669 e:\k1.txt 442.710 e:\k1.txt 833.189 e:\k1.txt 884.258 e:\k1.txt 949.953 e:\k1.txt 328.438 e:\k1.txt 212.878 e:\k1.txt 133.019 e:\k1.txt 393.094 e:\k1.txt 660.277 e:\k1.txt 536.846 e:\k1.txt 725.137 e:\k1.txt 300.945 e:\k1.txt 117.226 e:\k1.txt 950.349 e:\k1.txt 563.246 e:\k1.txt % 53 18 33 35 59 25 53 53 66 59 60 25 29 25 64 33 74 53 44 83 88 94 33 21 13 39 66 53 72 30 12 94 56 extremists, a malign perversion of Islam ruling by fear. America bear 34 35 Airfax, California, who converted to Islam four years ago and had spent 36 as flouting the religious tolerance of Islam by Barry Malik, a local magi 37 West's foreign policy in relation to Islam. "There is no distinction bet 38 im. God is great, may pride be with Islam. May peace and God's merc 39 of the groups of Islam, vanguards of Islam, they destroyed America. I pr to widen that gulf. They want to put Islam against Christian, Arab again 40 254.546 e:\k1.txt 900.090 e:\k1.txt 710.275 e:\k1.txt 300.936 e:\k1.txt 252.680 e:\k1.txt 252.228 e:\k1.txt 649.133 e:\k1.txt 25 89 71 30 25 25 65 Abb. 7: Auszug aus der 115 Einträge starken Konkordanzliste zu >Islam< von K1 Es ist wiederholt von Krieg, Konflikt und Konfrontation die Rede: >war between Islam and the west<, >confrontation between Islam and the West<, >a battle between the West and Islam<, >conflict between Islam and the West<, >the perceived West vs Islam conflict<, >attitude of the West towards Islam<, etc. Und es findet eine klare Schuldzuweisung statt: “The attacks on America aimed not just to kill thousands of people but to provoke war between the West and Islam, drive the US out of the Middle East and destroy Israel.” (The trouble when two priorities become three, The Times, 12.10.2001). Doch auch der Gegensatz zwischen Christentum und Islam kommt zur Sprache: >pitting Christianity against Islam< oder >clash between Islam and Christianity< In diesem Zusammenhang fällt das Wort Kreuzzug, die Reaktionen darauf sind zurückhaltend: “Mr Khan, whose own family originally came from Ghazni and the Logar Valley in Afghanistan, was appalled when he heard President Bush describe the coalition against terror as a "crusade", with all its historic and provocative implications of pitting Christianity against Islam.” (Don't rush into a mistake, Imran Khan warns US, The Times, 21.9.2001). Des Weiteren spielt die Darstellung des Islam als etwas Bedrohliches eine ausschlaggebende Rolle: >ultra-conservative view of Islam<, >breeding-grounds for radical, violent Islam<, >who calls Islam a hateful religion<, >militant Islam<, >extremist view of Islam<, >perverse views of Islam<,… 118 So lesen wir in K1 den Satz: “Elsewhere, in Arab and other countries with governments that officially support the coalition, but which are breeding-grounds for radical, violent Islam, there are more complex legal and diplomatic issues to be tackled.” (War without end..., The Independent, 02. 12.2001). Dieser Satz zeugt von dem martialischen Sprachgebrauch, der sich in den Medien nach dem 11. September durchsetzte. Doch es gibt auch Stellungnahmen zu dem bipolaren Konflikt mit eher moderatem Ton: The dangers of this being seen as a true "war" of the West against Islam, or of the rich against the poor, are apparent. (Without the UN, we can never have a just end to the Afghan nightmare, The Times, 13.10.2001) und “Those efforts had helped to clarify the west's view that the campaign was not a battle between the west and Islam, he argued.” (Raids go on, Blair tells Musharraf, The Guardian, 9.11.2001) Paradoxerweise ist nicht nur von >war against America< die Rede, sondern auch von einem Krieg gegen den Islam: >war against Islam<, >attack on Islam<, >action against Islam<, >at war with Islam<. In diesem Zusammenhang finden wir in K1 die folgende Textpassage über den Kriegsausbruch in Afghanistan: “Obviously an attack on an Islamic country, however justified, will raise the cry that this is an attack on Islam as an whole; that would be an attack on a billion people stretching across the world from a large African country such as Nigeria to a large Asian country such as Indonesia, with large minority populations in almost every major country except Japan.” (For the world's sake, this had to be done, The Times, 08.10.2001). Aber es gibt differenziertere Stimmen, die einen diplomatischen Ton verwenden und nicht alle Anhänger dieser Religion über einen Kamm scheren: >promoting orthodox Islam<, >authentic Islam<, >political Islam<, >pure form of Islam<, >a literal interpretation of Islam<, >moderate Islam<. Es werden wiederholt Politiker zitiert, die Schlüsselreden gehalten haben, Auszüge von Parlamentssitzungen werden wiedergegeben: 119 “Labour would do the defining of Islam around here.” (A chair can be a cow when Tony says it is, The Times, 04.10.2001). Und “The US defence secretary, Donald Rumsfeld, said there was nothing in Islam "that suggests that conflicts have to stop in Ramadan”.” (Straw softens line on bombing pause, The Guardian, 29.10.2001) und “In Cairo , Mr Blair said that the purpose of the terrorists was not just to kill large numbers of innocent people but to set in train events that would divide the Arab and Western worlds, Islam and other faiths.” (Blair knocked off course by Saudi Rejection, The Times, 12.10.2001). In einigen Fällen beinhalten die Zeitungstexte Kriegsberichterstattung: “Frightened Afghan families started fleeing their homes as the US jets eased their constant bombardment of Kabul on Friday, Islam's holy day.” (US missed most Kabul targets, aid workers say, The Times, 20.10.2001) Durch den 11. September ist die Berichterstattung über islamische Themen vollends aus dem Ruder gelaufen. Wir stellen eine zunehmend antipodische Konstellation zwischen dem Westen auf der einen Seite und der islamischen Welt auf der anderen fest. Die aus der Kollokationsliste gewonnenen Daten zeigen ganz deutlich, dass in einigen Artikeln zurückhaltende und diplomatische Töne überwiegen, in anderen jedoch eine konfrontationsbereite Sprache, die nicht davor zurückschreckt, die Krise als Kampf zwischen dem Islam15 und dem Westen, dem Islam und dem Christentum zu deklarieren. Das Problem des Terrorismus wurde nicht richtig erkannt, das zeigen diverse Textproben, nämlich dass es stets eine radikale Minderheit ist, die versucht ein gesellschaftliches Gefüge zu manipulieren. Stattdessen wird dem Wort >ISLAM< die Konnotation >TEROR< beigelegt, wodurch gravierende Vorurteile entstehen können. Auch wenn wir in den westlichen Medien häufig aufgebrachte Demonstranten in den islamischen Staaten sehen, so ist doch die 15 Das Wort >ISLAM< wird sowohl für Religion als auch für den Kulturkreis verwendet. Nicht mehr gebräuchlich hingegen ist heutzutage die Verwendung >ORIENT<. 120 überwiegende Mehrheit dort friedliebend. Die Anzahl der wirklichen Terroristen beträgt nur den Bruchteil eines Promille. Doch gerade diese Minderheit hat das Weltgefüge durcheinander gebracht, und nicht die Weltreligion Islam. Das scheint in Vergessenheit geraten zu sein, wenn von >West vs. Islam< die Rede ist. 6.3.2.2 Die Konkordanzliste zu >Islam< in K2 In dem Korpus K2 wird noch sehr viel reservierter und zurückhaltender über den Islam berichtet. Das Konfliktpotential wird in den Texten nur angedeutet. Die Liste ist deutlich kürzer als die von K1 oder K3 und beinhaltet nur 11 Konkordanzen: N Concordance Word No. File e Romans came, the Arab forces of Islam came and then British and 1 22.261 e:\k2.txt Britain. The head of the Nation of Islam has been excluded since 198 501.216 e:\k2.txt 2 reeing that in the higher interests of Islam it had no authority to debate 183.959 e:\k2.txt 3 s book, The Jew, the Gypsy and El Islam, was never published in full, b 175.571 e:\k2.txt 4 Muhammad, leader of the Nation of Islam, a Chicago-based militant se 501.649 e:\k2.txt 5 Nation" Tory who would embrace Islam, Hinduism, Sikhism and co 809.809 e:\k2.txt 6 support of such values. Nation of Islam members and supporters sat 501.434 e:\k2.txt 7 Eini had said: "If MPs are against Islam and the system, they are no 184.231 e:\k2.txt 8 ey for some time," he said. Noor Islam, who owns a takeaway in the 149.677 e:\k2.txt 9 10 Tives on the rival versions of political Islam that each embodies: the "ci 183.333 e:\k2.txt Race: Nation of Islam leader in battle to overturn Bri 501.173 e:\k2.txt 11 % 2 50 18 17 50 80 50 18 15 18 50 Abb. 8: Vollständige Konkordanzliste von >Islam< aus K2 Wir finden hier Wendungen wie >the Arab forces of Islam<, >the higher interests of Islam<, >the rival versions of political Islam<, die Artikeln entnommen sind, die in den Monaten vor dem 11. September 2001 geschrieben wurden, als noch niemand die Katastrophe vermuten konnte. Beispielsweise ist insgesamt viermal von der Partei >Nation of Islam< die Rede. Und wir finden im Originaltext den folgenden Satz: “The head of the Nation of Islam has been excluded since 1986 because successive home secretaries have ruled that his inflammatory speeches could stir racial unrest.” 121 (Nation of Islam leader in battle to overturn British exclusion order, The Independent, 13.07.2001). Ersichtlich wird hier, dass die Auseinandersetzung mit dem Islam etwas mit ethnischen Problemen zu tun haben kann. Nach dem 11. September hingegen wäre die Assoziation zwischen Islam und Rasse „Öl ins Feuer zu gießen“ gleichgekommen und kam in den untersuchten Texten nicht vor. 6.3.2.3 Die Konkordanzliste zu >Islam< in K3 Bei der Konkordanzanalyse von K3 für das Suchwort >ISLAM< ergab sich eine 34 Einträge starke Liste, die hier vollständig abgedruckt ist: N Concordance Word No. File % e are all soldiers for Saddam and Islam willing to fight and die. 1 2.005.855 e:\k3.txt 100 d an adventurer. He converted to Islam to marry the woman he lo 1.136.630 e:\k3.txt 56 2 minance and its brand of radical Islam. After the war, it found few 1.597.081 e:\k3.txt 79 3 s and allowing them to practise Islam. Chanting ``resign, resign'' 165.574 e:\k3.txt 8 4 rica and its puppets. Victory to Islam', read one banner. 'The hat 1.978.696 e:\k3.txt 98 5 Ah Khomeini's teachings that in Islam religion and politics are not 1.603.458 e:\k3.txt 79 6 legacy, but also the upholders of Islam and nationalism - as long 1.925.656 e:\k3.txt 95 7 defence of Mecca and Medina, Islam's holy sites, rather than in 1.880.476 e:\k3.txt 93 8 e doing protecting the keeper of Islam's most holy places? Mr Bu 1.714.220 e:\k3.txt 85 9 li army general in his war against Islam. He patronizes every crim 1.405.354 e:\k3.txt 69 10 overnment has no wish to insult Islam and it understands the nov 1.603.301 e:\k3.txt 79 11 oops in the country that contains Islam's holiest places. There is 1.855.558 e:\k3.txt 92 12 13 bul Islam Bhuiyan (Law), Mr Tajul Islam Chowdhury (Land) and Dr 1.178.824 e:\k3.txt 58 i for alleged blasphemy against Islam in the novel still stood. ` 1.073.992 e:\k3.txt 53 14 o make a pilgrimage to Mecca', Islam's most holy city. Ina said t 1.927.775 e:\k3.txt 96 15 He is a man of religion; he taught Islam,'' he says. ``He was at hi 1.336.029 e:\k3.txt 66 16 names and forbidden to practise Islam. About 300,000 Turks left t 165.684 e:\k3.txt 8 17 Tive practices of many countries. Islam often seeks to become th 1.539.478 e:\k3.txt 76 18 vember. His simple message of 'Islam is the Solution' got him ele 1.755.649 e:\k3.txt 87 19 ct in Port of Spain, the Society of Islam – have been arrested and 1.599.885 e:\k3.txt 79 20 21 ousands of people roared for Zia, Islam and victory for Islamic fo 1.971.961 e:\k3.txt 98 efender of the Faith, of keeping Islam strictly under his wing, is n 1.306.993 e:\k3.txt 65 22 of criminals working to eliminate Islam, would not budge and ligh 1.405.223 e:\k3.txt 69 23 24 problems ourselves. Our religion, Islam, does not allow us to kil 1.732.828 e:\k3.txt 86 Ople shared his commitment to Islam. Ejaz ul-Haq, the new st 1.972.253 e:\k3.txt 98 25 st recently - in the inspiration of Islam. This has led them to ques 1.713.956 e:\k3.txt 85 26 27 ve returned. Wake up, giant of Islam', said another. Hostility 1.978.710 e:\k3.txt 98 q (Commerce), Justice Habibul Islam Bhuiyan (Law), Mr Tajul Isl 1.178.819 e:\k3.txt 58 28 n solidarity under the banner of Islam and Arabism, and warned 1.625.898 e:\k3.txt 80 29 122 30 31 32 33 34 r stability and an awakening for Islam that Zia gave the country, United States as ``the enemy of Islam''. Rarely since the death se unaffected include Mr Anisul Islam Mahmud (Foreign) and Mr Are flocking to join the Nation of Islam, led by the Rev Louis Farr , which brought together the pro-Islam and anti-Bhutto lobbies in t 1.972.200 1.262.170 1.178.838 838.452 1.971.995 e:\k3.txt e:\k3.txt e:\k3.txt e:\k3.txt e:\k3.txt 98 62 58 41 98 Abb. 9: Vollständige Konkordanzliste von >Islam< aus K3 In K3 hat >Islam< häufig die positive Konnotation als eine Religion, die von ihren Anhängern ausgeübt wird: >allowing them to practice Islam<, >commitment to Islam<, >the inspiration of Islam<, >contains Islam’s holiest places<. Doch bereits 1990 wurde das negative Potential des Islam und dessen dogmatischer Charakter thematisiert, wenn auch nicht in dem Maße wie zehn Jahre später nach 9/11: >its brand of radical Islam<, >Islam is the solution<, >soldiers for Saddam and Islam<, >the enemy of Islam<. So schreibt The Independent am 03.08.1990: “Iraq was supplied with arms from the Soviet Union and funds by other Gulf states which feared Iran's dominance and its brand of radical Islam.” (The Invasion of Kuwait: Saddam's dependence on West leaves him exposed to embargo). 6.3.2.4 Die Konkordanzen zu >ARABIC< Die Bedeutung von >ARABIC< ist im Oxford English Dictionary klar definiert. Dieses Wort ist zumeist auf die Sprache bezogen: (OED I., S.598: 1. Of or pertaining to Arabia or its language. 2. esp. in gum arabic, which is exuded by certain species of Acacia, and arabic acid, obtained from it. 3. absol. The language of the Arabs.) Die vollständige Konkordanzliste zu >ARABIC< in K1: N Concordance Mains of a similar paper handwritten in Arabic were found in the wreckage 1 Sident Arab websites. Its message in Arabic has been placed on sites MI5 2 To increase, as attention being paid to Arabic media already has done in r 3 He can chew." He said that although Arabic script had very different char 4 123 Word No. 164.112 519.310 559.340 96.304 File e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt % 16 52 56 10 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 ictionary allows both definitions. The Arabic, jihad, means "struggle, conte 301.478 the inter-faith service, which included Arabic prayers to commemorate the 83.847 s like hawala, common throughout the Arabic world. The system is based 647.360 Nts to visit Mr Walker, who had studied Arabic and Islam in Yemen and Pak 929.511 S the author of the document, written in Arabic, translated and published by 164.228 y pattern of flowers intertwined with the Arabic script for Allah. Appalled at s 446.516 suddenly flooding on to al-Jazeera, the Arabic TV news network. Voice of A 350.213 Nit, performed the graveside service in Arabic, and the body was placed in t 967.002 mmunity sentence because he was an Arabic speaker and might be need 548.704 med sorghum, sesame seeds and gum arabic. But others claim it was all a 834.454 ed sorghum, sesame seeds and gum arabic. But others claim it was all 885.523 aks Farsi (the main language of Iran), Arabic, and a clutch of European la 520.002 artyrdom'. The name comes from the Arabic word 'salaf', meaning forefath 537.754 failed to translate legal documents into Arabic correctly. FBI chiefs, who 496.983 ties. According to the Asharq al-Awsat Arabic daily, Tehran has asked a s 375.086 e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt 30 8 64 92 16 44 35 96 55 83 88 52 53 49 37 Abb. 10: Die Konkordanzen zu >ARABIC< in K1 In K1 findet sich das Wort >ARABIC< insgesamt 19-mal. In den meisten Fällen wird das Wort als Adjektiv verwendet: >ARABIC MEDIA<, >ARABIC SCRIPT<, >ARABIC PRAYERS<, etc. In einigen Fällen fungiert es als Nomen: >HANDWRITTEN IN ARABIC<, >ITS MESSAGE IN ARABIC<, >WHO HAD STUDIED ARABIC<, etc. Mit dem Wort >ARABIC< wird nach dem 11. September vergleichsweise zurückhaltend und sparsam umgegangen. Das Register der untersuchten Zeitungen nimmt in K1 partiell einen analytischen, fast kriminalistischen Tenor an, um die Geschehnisse aufzuarbeiten: „Remains of a similar paper handwritten in Arabic were found in the wreckage of Flight 93, which crashed to the ground in Pennsylvania.“ (Terror manual for journey to paradise, The Times, 15.9.2001) Im Presse-Korpus K2 ist die Type >ARABIC< nur viermal enthalten, in allen vier Fällen mit der Konnotation Arabische Sprache. Dreimal fungiert >ARABIC< als Nomen, einmal als Kompositum (>ARABIC-SPEAKING<). N Concordance Word No. File of the bomb attacks a message in Arabic was left by a local Islamic group 667.845 E:\k2.txt 1 2 mist-dominated governments in the Arabic- speaking north. The proposed 364.599 E:\k2.txt yrian guard said only one word in Arabic: Damarit ("Destroyed"). Journalists 273.287 E:\k2.txt 3 - which ominously translates from Arabic as "the Monster's Back" - Lebane 435.543 E:\k2.txt 4 Abb. 11: Die Konkordanzen zu >ARABIC< in K2 124 % 66 36 27 43 Aber auch hier ist schon von Terror die Rede. Als Beispiel sei der folgende Satz aufgeführt: “At the scene of one of the bomb attacks a message in Arabic was left by a local Islamic group claiming responsibility for the explosion outside a bookshop used by expatriate workers.” (British trio 'tortured' into confessions, The Times, 15.08.2001). In K3 finden wir >ARABIC< 18-mal. Wir müssen wieder berücksichtigen, dass K3 so groß ist wie K1 und K2 zusammen. In neun Fällen ist >ARABIC< als Nomen gebraucht und steht für die Sprache „Arabisch.“ In den anderen neun Fällen fungiert >ARABIC< als Adjektiv, und konnotiert auf der einen Seite die Sprache (>AN ARABIC INSCRIPTION<), auf der anderen Seite den Kulturkreis (>GOOD ARABIC FOOD<). Auch 1990 zeichnet sich ein Konflikt mit dem arabischen Raum ab: >MANY ARABIC AND ISLAMIC FORCES TO DEFEND...<. Im Folgenden sei hier die vollständige Konkordanzliste für >ARABIC< aus K3 aufgeführt: N Concordance , almost carnival scene where Hebrew, Arabic and a dozen other languages 1 en pitched alongside the small fort (in Arabic, kuwait) of a tribal chief. Fami 2 Nce. It has been printed in French and Arabic, and Turkish and English editi 3 d in the new city wall, each bearing an Arabic inscription that reads 'rebuilt d 4 waiting Galaxy. 'We ate some good Arabic food last night. Yes, we enjoye 5 Arabic press reports 'rift' over Iraq 6 Hram, headlined the 'arrival of many Arabic and Islamic forces to defend Sa 7 The ICRC said after examining the Arabic text by the Organisation of Re 8 The 76-leaf manuscript was written in Arabic and had 56 colour illustrations. 9 its mixed reactions THERE is an Arabic saying, that a man carrying a s 10 Marvels in Arabic fetch Pounds 495,000;Saleroom 11 REPORTS published yesterday in Arabic newspapers have given a mixed 12 13 y, and pointed out that he had cost the Arabic-speaking nations more than p The group's typewritten statement in Arabic called on ``the real kidnappers 14 15 Mbers of the pro- Iranian Ad- Dawa - Arabic for Islamic Call - an Iraqi group 987. The type-written declaration in Arabic said: ``We have decided to mov 16 17 ng to Saudi Arabia. Another London Arabic daily Al-Ahdath took a more ne 18 e was tuned into Radio Monte Carlo's Arabic service and the BBC for news. Abb. 12: Die Konkordanzliste zu >ARABIC< in K3 Wir finden den folgenden Satz: 125 Word No. File % 6.847 e:\k3.txt 0 1.595.640 e:\k3.txt 79 490.440 e:\k3.txt 24 1.760.400 e:\k3.txt 87 1.834.726 e:\k3.txt 91 1.654.501 e:\k3.txt 82 1.964.401 e:\k3.txt 97 1.859.010 e:\k3.txt 92 1.054.029 e:\k3.txt 52 1.791.874 e:\k3.txt 89 1.053.956 e:\k3.txt 52 1.625.595 e:\k3.txt 80 1.930.472 e:\k3.txt 96 1.136.961 e:\k3.txt 56 1.623.372 e:\k3.txt 80 876.760 e:\k3.txt 43 1.717.675 e:\k3.txt 85 1.908.927 e:\k3.txt 95 “The type-written declaration in Arabic said: “We have decided to move the hostages affair forward by releasing an American hostage within 48 hours. ….’ “ (US hostage `will be free by tomorrow', The Times, 19.4.1990). Bei den drei gewählten Beispielen, die auf arabische Schriftstücke im Zusammenhang mit Terroranschlägen verweisen, stellen wir deutlich investigative Züge in der Zeitungsberichterstattung fest, was auch die Aufgabe von Medien ist: Bei der Verbrechensbekämpfung mitzuwirken und die Bevölkerung über den Stand der Ermittlungen zu informieren. 6.3.2.5 Konkordanzen mit dem Kontextwort [>TERROR<] Bei der Anwendung der Wordsmith-Funktion Concord können diverse Feineinstellungen vorgenommen werden, dazu zählt die Hinzufügung eines Kontextwortes bei der Suche nach Konkordanzen zu bestimmten Suchwörtern. In der folgenden Tabelle sind alle Konkordanzen aufgelistet, in denen Begriffe der Wortgruppen „islamische Welt“ bzw. „Arabisch“ ein Kontextwort aus der Wortgruppe „Terror“ zugeordnet wurde (zur Einteilung der Wortgruppen siehe 6.4.5). Ziel ist es, festzustellen, ob Begriffe wie >TERROR<, >TERRORIST< oder >TERRORISM< häufiger mit Wörtern der Wortgruppe >ARAB<, >ARABS<, >ARABIC< oder aber der Wortgruppe bestehend aus >ISLAM<, >ISLAMIC<, >ISLAMIST<, >MUSLIM<, >MUSLIMS<, korrelieren. Für K1 entstanden so insgesamt 34 Konkordanzen, 29 davon aus den Wortgruppen „islamische Welt“ und „Terror“ gegenüber nur fünf aus der Verbindung „Arabisch“ und „Terror.“ Für K2 sind keine Konkordanzen aus einer der beiden Kombinationen zu verzeichnen. In K3 findet Wordsmith insgesamt nur drei Konkordanzen zu den gesuchten Kombinationen, zwei davon ergeben sich aus dem Vergleich der Wortgruppen „Arabisch“ und „Terror“ und nur eine aus der Verbindung „islamische Welt“ mit einem Kontextwort aus der Wortgruppe „Terror.“ 126 K1 N 1 2 1 1 2 1 2 1 2 3 4 5 6 7 8 9 10 1 1 1 1 1 2 3 1 2 3 1 2 3 1 2 3 1 Concordance MI5 posts terror appeal on Arab websites Man's land, Arab fighters spread terror In the twilight hours of th in the Arab- dominated al-Qa'ida terrorist network might be handed between two loyalties in the war on terrorism. As Washington's main Arab London that support for the war on terrorism could collapse in the Arab world F the Islamic warlord's British terror network being realised. he Egyptian Islamic Jihad, the terror organisation blamed for character and past of the Islamic terrorist. There are just two types are members of the counter-terrorist security forces fighting Islamic fanatics creating the Afghan-based Islamic terrorist groups during the 1980s. Egyptian with the Algerian GIA terrorist organisation, with the Islamic Jihad to fund Osama bin Laden's Islamic terrorist network. The CIA is to de randed Hamas and Islamic Jihad as "terrorist networks" for the first tim Others named included well-known terrorist groups such as Egyptian of the most dangerous and radical terrorist opponents of Israel, includin Ush were the targets of an Islamic terrorist plot to assassinate them, fr at he was involved with an Islamic terrorist organsiation, Markaz Dawa bly of Muslim Youth - a suspected terrorist organisation". WAMY me Said: "BCCI's former links to Islamist terror organisations are known to us." Extremist view of Islam unites terror suspects Salafi Purist tea believe that he was a new kind of terrorist, committed to Islam but not be done at once. And if Islamist terrorism is to be thwarted in its ambit ing of the fight back against Islamist terrorism, but the opening, as Mr Bus on the question of depriving Islamist terrorism of funds. Of the 369 terrori quashed. His theme is that Islamic terrorism must be thwarted in its goal This madness. This is no longer terrorism by Islamic Jihad or Hamas. Would seriously hamper the anti-terrorism coalition. Islamic guerrilla groups ders of the faith. That is not true. Terrorism is forbidden by Islam; it "There is no distinction between terrorism and political Islam . . . clear statement condemning the terrorism. Islam is a religion of pe Muslim community but against terrorism on a worldwide scale. It ould not afford to stop its war on terrorism for the Muslim holy mon r world of Muslim extremism and terrorism. But belief in a just strug he had raised funds for terrorism and recruited British Muslims to be trained Word No. 519.507 967.684 948.134 293.368 447.021 148.070 153.353 329.309 166.291 740.552 148.999 67.686 1.004.152 95.998 648.921 169.272 301.502 723.652 67.784 536.889 149.494 327.401 254.615 310.074 309.681 893.430 352.211 255.709 301.163 213.093 130.129 661.689 449.942 301.560 File k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt k1.txt % 52 96 94 29 44 15 15 33 17 74 15 7 99 10 64 17 30 72 7 53 15 33 25 31 31 89 35 25 30 21 13 66 45 30 K3 1 1 1 the US presence will prompt acts of terrorism in Arab countries backing 1.730.252 k3.txt 86 Arab terrorist killed by own book bomb 452.494 k3.txt 22 spread of Islamic fundamentalism closely followed by terrorism were the 980.935 k3.txt 48 Abb. 13: Gemeinsame Konkordanzen der Wortgruppen „islamische Welt“ bzw. „Arabisch“ mit dem Kontextwort „Terror“ (Kombination >TERROR…< + >ARAB…< markiert) Wordsmith listet jedoch auch Textstellen auf, bei denen sich die beiden gesuchten Begriffe nicht in ein und demselben Satz befinden. Im Folgenden sind vier Beispielsätze aufgeführt: 127 Im folgenden Satz aus The Independent vom 7.12.2001 kommt ein Widersspruch zum Tragen, da nicht klar wird, dass die Taliban zum überwiegenden Teil Afghanen sind, in Einzelfällen Pakistanis, aber keinesfalls Araber. Es wird der Eindruck erweckt, als müssten andere Top-Taliban-Commander an andere Länder ausgeliefert werden. Die Wahrheit ist jedoch, dass die Verhafteten in Guantanamo Bay auf Kuba inhaftiert und nicht an ihre Ursprungsländer überführt wurden: “One idea floated by Mr Rumsfeld was that the top Taliban commanders and senior figures in the Arab-dominated al-Qa'ida terrorist network might be handed over to their own countries – which in the case of Mullah Omar would mean him being dealt with by the Karzai government in Kabul” (US insists Taliban chief must be brought to justice). Im folgenden Satz aus The Times vom 12.10.2001 wird eine Verbindung von Religion und Terrorismus konstruiert, ohne zu erwähnen, dass es sich bei den Terroristen um Kriminelle handelt: “MI5 claimed that he had raised funds for terrorism and recruited British Muslims to be trained for a holy war in Kashmir.” (Lords support exile of cleric, The Times, 12.10.2001) Im Rahmen der Kriegsberichterstattung während der Kuwait-Krise ist von möglichem Terrorismus in arabischen Staaten die Rede, ohne der Thematik einen religiösen Hintergrund beizufügen: “The sources add that President Saddam may be hoping the US presence will prompt acts of terrorism in Arab countries backing Washington, putting further pressure on their leaders to accept his annexation of Kuwait.” (The Invasion of Kuwait: Local intelligence says 'no invasion', The Independent, 10.8.1990) The Times differenzierte am 24.4.1990 noch klar und deutlich zwischen islamischen Fundamentalismus und Terrorismus: “A poll last week among 2,439 Turks found that the rapid spread of Islamic fundamentalism closely followed by terrorism were the two things people feared most in their daily lives.“ (Islamic backlash pushes Turkey down violent path, The Times, 24.4.1990) Das sind weitere Belege dafür, dass in der Presseberichterstattung nach dem 11. September etwas aus dem Gefüge geraten ist, dass Terrorismus als eine extreme Form von Kriminalität in vielen Fällen 128 mit Religion in Verbindung gebracht wurde. Erforderlich wäre eine sehr viel differenziertere Darstellung der Problematik.16 6.3.3 Die häufigsten Kollokationen von >MUSLIM<, >ISLAMIC< und >ARAB< In einem weiteren Analyseschritt wurden für die Typen >MUSLIM<, >ISLAMIC< und >ARAB< die häufigsten rechts- und linksseitigen Kollokationen aus den Konkordanzlisten herausgesucht. Die drei Wörter sind im Oxford English Dictionary definiert. >MUSLIM< kann sowohl Nomen als auch Adjektiv sein: (OED X., S. 134: Muslim: [a. Arab. Muslim, active pple. Of aslama, of which the noun of action is islām: see Islam.] A. sb. One who professes Islam; a Muhammadan; … B. adj. A. Of or pertaining to Muslims; Muhammadan.) >ISLAMIC< hingegen ist stets Adjektiv: (OED VIII., S.109: Islamic… [Of or pertaining to Islam; Muhammad, Muslim]…). >ARAB< wird verwendet: sowohl substantivisch als auch adjektivisch (OED I., S. 597: Arab … A. sb. 1. One of the Semitic race inhabiting Saudi Arabia and neighbouring countries. … B. adj. 1. Of or pertaining to Arabia or the Arabs.) Kollokationen lassen sich als Satzbestandteile begreifen, die je nach Gliederung ein Syntagma (Verbal-, Nominalphrase) oder ein Kompositum mit dem dazugehörigen Suchwort formieren können, 16 Mit den Werten der Konkordanzliste wurde ein 4-Felder-χ²-Test durchgeführt (a=2, b=1, c=5, d=29). Die Daten liefern jedoch keine brauchbaren Ergebnisse, da das Testverfahren voraussetzt, dass alle erwarteten Häufigkeiten mindestens n=5 betragen und insgesamt n=30 Fälle einbezogen werden. 129 aber auch unterschiedlichen Syntagmen eines Satzes angehören können, da sich vor oder hinter dem Suchwort eine strukturelle Grenze oder weitere Wörter befinden.17 Bei der Erstellung der folgenden Kollokationslisten wurde das Superkorpus, bestehend aus K1, K2 und K3, verwendet. Das Wordsmith-Tool „Concord“ erstellte die Konkordanzen. Alle Zeitungsartikel befinden sich in chronologischer Reihenfolge. Bei Bedarf wurden Konkordanzlisten für die einzelnen Hauptkorpora K1, K2 und K3, sowie für jedes einzelne der neun Subkorpora erstellt. Jede Konkordanz besteht aus einer Zeile als Wortkette, die das gesuchte Wort enthält. Wordsmith nimmt keine Rücksicht auf Satzgrenzen (siehe auch Beispiel für >PRESS< unter Punkt 6.5.1). Um die Problematik der rechts- und linksseitigen Kollokationen aufzudecken, wurden in den folgenden Listen ausschließlich die unmittelbaren Kollokationen berücksichtigt und nicht die von der Software produzierten Zeilen. Für einige der hier aufgeführten Kollokationen existiert ein Eintrag im Oxford Collocations Dictionary for Students. Diese Begriffe sind in den folgenden Listen markiert. 6.3.3.1 Linksseitige Kollokationen zu >ARAB< In der folgenden Analyse erscheinen besonders die linksseitigen Kollokationen sehr aus dem Zusammenhang gerissen. Erneut enthalten die durch Wordsmith erzeugten Konkordanzlisten dermaßen viele Informationen, dass wir uns in der folgenden Darstellung auf die obersten Einträge beschränken müssen. Die Liste ist insgesamt 1018 Einträge lang. 17 Syntagma wird hier synonym mit dem Begriff Wortgefüge verwendet (siehe auch: Vater 1999, S.106). 130 No. Kollokation Freq 1 2 3 4 5 6 7 8 9 10 11 12 UNITED ARAB OTHER ARAB AL-ARAB GULF(:)ARAB PAN-ARAB EMERGENCY ARAB ISRAELI ARAB MODERATE ARAB ANY ARAB FELLOW ARAB ITS ARAB TWO ARAB 45 38 25 17 14 12 12 10 8 7 7 7 Tab. 23: Linksseitige Kollokationen zu >ARAB< Als häufigste linksseitige Kollokation für >ARAB< finden wie >UNITED ARAB< mit 45 Nennungen im Superkorpus. Davon fallen 7 auf K1, 4 auf K2 und 34 auf K3. Wie wir weiter unten sehen werden, sind davon in 42 Fällen >EMIRATES< die rechtsseitigen Kollokationen. Am zweithäufigsten ist >OTHER ARAB< mit 38 Einträgen. Textstellen mit >AL-ARAB< bringen es auf 25 Einträge (ausschließlich in K3 vorhanden), alle entweder als Bestandteil des geografischen Begriffes >SHATT AL-ARAB< (13-mal) oder der Zeitung >DAILY AL-ARAB< (achtmal und viermal als Zeitungsname ohne >DAILY<). >GULF(:)ARAB<18 lässt sich 17-mal ausfindig machen, achtmal davon befindet sich ein Doppelpunkt zwischen beiden Wörtern. Bis auf eine der Nennungen befinden sich alle in K3. Die Kombination >PAN-ARAB< ist insgesamt 14-mal enthalten, alle Einträge finden sich in K3. >EMERGENCY ARAB< kommt 12-mal vor, alle Textstellen liegen in K3, elfmal heißt das Wortgefüge >EMERGENCY ARAB SUMMIT< einmal >EMERGENCY ARAB LEAGUE SUMMIT< Ebenso häufig ist >ISRAELI ARAB< enthalten (K1: 2; K2: 2; K3: 8, davon eine Form mit Bindestrich). >MODERATE ARAB< ist zehnmal enthalten (K1: 7; K3: 3). >ANY ARAB< achtmal (K1: 1; K2: 1; K3: 6). Je siebenmal sind die Formen 18 (:) bedeutet, dass z.T. ein Doppelpunkt zwischen den beiden Wörtern plaziert war. Diese Fälle kamen in Überschriften im Independent 1990 vor, die mit Crisis in the Gulf:... eingeleitet wurden. Diese Hauptüberschrift bzw. –schlagzeile hat die Funktion, ein Themenfeld fortzusetzen (äquivalent bei Election 2001:... in Guardian.2001.davor oder War on terror nach 9/11 bei The Times). 131 >FELLOW ARAB< (K1: 1; K3: 6), >ITS ARAB< (K1: 2; K3: 5) und >TWO ARAB< (alle in K3) enthalten. Diese Liste mit linksseitigen Kollokationen ist nicht sehr aussagekräftig, da >ARAB< in seiner Funktion als Adjektiv das Bezugswort auf der rechten Seite trägt. Aufgrund der Kuwait-Krise finden wir die meisten Formen in K3. 6.3.3.2 Rechtsseitige Kollokationen zu >ARAB< Bei den rechtsseitigen Kollokationen zu >ARAB< handelt es sich um sehr umfangreiche Gruppierungen. Die Liste ist erneut 1018 Einträge lang. No. Kollokation Freq 1 2 3 4 5 6 7 8 9 10 11 12 ARAB WORLD ARAB STATE(S) ARAB LEADER(S) ARAB NATION('(S)) ARAB EMIRATES ARAB SUMMIT ARAB LEAGUE(‘S) ARAB COUNTRY/ -IES ARAB FORCE(S) ARAB PRESS ARAB-ISRAELI ARAB AND MUSLIM 99 66 54 43 42 41 40 38 25 18 16 11 Tab. 24: Rechtsseitige Kollokationen zu >ARAB< Die meisten Textstellen sind für >ARAB WORLD< vorhanden. Es sind 99 an der Zahl. 83 davon sind in K3 zu finden, dem Korpus von 1990, was bemerkenswert ist, denn nach 9/11 war bevorzugt von einem Konflikt des Westens mit der islamischen bzw. muslimischen Welt die Rede (s.u.). >ARAB STATE(S)< ist 66-mal enthalten, 53 davon befinden sich in K3. Die Kombination >ARAB LEADER(S)< wurde 54-mal aufgefunden, 52 der Textstellen befinden sich in K3. >ARAB NATION(’)(S)< kommt 43-mal vor, mitgezählt sind Singular, Plural und die Genitiv-Formen. Alle Textstellen liegen in K3. >ARAB EMIRATES< ist 42-mal auffindbar (s.o.), 32 davon sind in K3 lokalisiert. Die Kombination >ARAB SUMMIT< kommt 41-mal vor, alle Textstellen liegen in K3. Textstellen mit >ARAB LEAGUE(’S)< 132 sind 40-mal zu finden, bis auf eine einzige liegen diese in K3. Die Kombination >ARAB COUNTRY/-IES< findet sich 38-mal (34 davon liegen in K3). Textstellen mit >ARAB FORCE(S)< existiert 25-mal (23 in K3). Belegstellen mit >ARAB PRESS< liegen insgesamt 18-mal vor, 16 davon in K3. Die Kombination >ARABISRAELI< ist 16-mal vorhanden (zehnmal in K3). Und schließlich ist >ARAB AND MUSLIM< elfmal enthalten (dreimal in K3 und achtmal in K1). Diese Daten lassen auf eine Veränderung in der Verwendung des Wortes >ARAB< schließen, es scheint eine Substitution vorzuliegen. Offensichtlich vermieden es die Zeitungen nach 9/11 >ARAB< im Zusammenhang mit den Terroristen zu verwenden. Stattdessen wurde der Konflikt „Islam vs. West“ heraufbeschworen (siehe Punkt 6.3.2). 6.3.3.3 Linksseitige Kollokationen zu >MUSLIM< Laut Oxford Collocations Dictionary for Students (2003, S.515) gelten für >MUSLIM< als häufigste Kollokationen: Muslim (noun): ·Adj.: devout, fervent / Shia, Shiite, Sunni. ·Noun: beliefs, fait / community / extremist, fundamentalist In der hier vorliegenden Analyse sind die häufigsten linksseitigen Kollokationen zu >MUSLIM< primär Artikel, Konjunktionen und Präpositionen wie >AS<, >AND<, >BY<, >IN<, >OF< und >THE<. Diese werden in der folgenden Kollokationsliste nicht berücksichtigt, denn hier sind statt Funktionswörter Inhaltswörter von Interesse. No. Kollokation Freq 1 2 3 4 5 6 7 8 9 10 SHIA MUSLIM ARAB AND MUSLIM BRITISH MUSLIM OTHER MUSLIM EVERY MUSLIM KASHMIRI MUSLIM BOSNIAN MUSLIM NON-MUSLIM ONLY MUSLIM MEMBER(S) OF MUSLIM 26 11 7 7 6 6 5 5 5 4 Tab. 25.: Linksseitige Kollokationen zu >MUSLIM< (Kollokationen aus dem Oxford Collocations Dictionary sind markiert) 133 Es dominiert die substantivische Verwendung. Viele Syntagmen sind unvollständig, da sich das Wortgefüge auf der rechten Seite des Suchwortes fortsetzt. Speziell bei Adjektiven als Suchwort befindet sich das Bezugswort auf der rechten Seite. Am häufigsten ist die Kombination >SHIA MUSLIM< mit 26 Nennungen unter den linksseitigen Kollokationen der 547 Einträge starken Liste zu finden. Das ist die Kollokation, die im Oxford Collocations Dictionary (s.o.) als häufigstes Begleitwort genannt ist. 21 der Textstellen für >SHIA MUSLIM< liegen in K3, nur fünf liegen in K1. Am zweithäufigsten ist >ARAB AND MUSLIM< mit elf Nennungen vertreten (K1: 8; K3: 3). >BRITISH MUSLIM< kommt siebenmal vor (sechsmal davon in K1). Dieser Begriff wirkt diskriminierend. Ebenfalls sechsmal kommt >OTHER MUSLIM< vor (K1: 6; K3: 1). Die Kombination >EVERY MUSLIM< ist sechsmal vorhanden, fünfmal in K1 und einmal in K3 (eine der Nennungen ist ein sächsischer Genitiv). >KASHMIRI MUSLIM< ist ebenfalls sechsmal enthalten (ausschließlich in K3), je fünfmal ist >BOSNIAN MUSLIM< (dreimal K1, zweimal K2), >NONMUSLIM< (dreimal K1, zweimal K3) und >ONLY MUSLIM< (K1: 3; K3: 2) zu finden. Der Begriff >NON-MUSLIM< wirkt ebenfalls etwas diskriminierend. >MEMBER(S) OF THE MUSLIM< kommt viermal als linksseitige Kollokation im Superkorpus aus K1, K2 und K3 vor. Dieses Wortgefüge ist jedoch unterbrochen, da das Suchwort in der Mitte des Syntagmas liegt. 6.3.3.4 Rechtsseitige Kollokationen zu >MUSLIM< Die rechtsseitigen Kollokationen sind wieder sehr viel intensiver ausgeprägt als die linksseitigen. Es dominiert der adjektivische Gebrauch: 134 No. Kollokation Freq 1 2 3 4 5 6 7 8 9 10 MUSLIM WORLD MUSLIM COUNTRY/-IES MUSLIM LEADER(S) MUSLIM HOLY MUSLIM COMMUNITY/-IES MUSLIM FUNDAMENTALIST(S) MUSLIM STATE(S) MUSLIM CLERIC(S) MUSLIM EXTREMIST(S) MUSLIM MILITANT(S) 28 25 23 16 15 13 13 12 12 12 Tab. 26: Rechtsseitige Kollokationen zu >MUSLIM< (Kollokationen aus dem Oxford Collocations Dictionary sind markiert) Am häufigsten finden wir die Nominalphrase >MUSLIM WORLD< mit 28 Nennungen insgesamt. 22 dieser Kollokationen liegen in K1, fünf liegen in K3 und nur eine in K2. Die Kollokation >MUSLIM COUNTRY/ -IES< finden wir 25-mal. Siebzehn der Textstellen liegen in K1, acht in K3. >MUSLIM LEADER(S)< ist 23-mal enthalten. 14 der Einträge liegen in K1, neun in K3. Das aufgebrochene Syntagma >MUSLIM HOLY…< finden wir 16-mal, davon befinden sich zwölf in K1 und vier in K3. Die Kombination >MUSLIM COMMUNITY/ -IES< ist 15-mal vorhanden. Neun dieser Kollokationen sind in K1 zu finden, fünf in K3 und eine in K2. 13-mal finden wir >MUSLIM FUNDAMENTALIST(S)<, davon liegen neun in K3, drei in K1 und eine in K2. >MUSLIM STATE(S)< (13-mal insgesamt) finden wir siebenmal in K1, viermal in K3, zweimal in K2. Je 12-mal ist >MUSLIM CLERIC(S)< (K1: 10; K3: 2), >MUSLIM EXTREMIST(S)< (K3: 7; K1: 4; K2: 1) und >MUSLIM MILITANT(S)< (K3: 10; K1: 1; K2: 1) vorhanden. Gerade die letzten beiden Einträge >MUSLIM EXTREMIST(S)< und >MUSLIM MILITANT(S)< zeigen ein klares Missverhältnis auf, da jeweils die meisten Verwendungen in K3 liegen. In K1 ist hingegen häufig von >TERRORIST(S)< die Rede (1012-mal, 676 davon im Singular). Es drängt sich der Verdacht auf, dass nach dem 11. September alle über einen Kamm geschert wurden (s.o. 5.4). Ferner fällt auf, dass die häufigsten im Oxford Collocations Dictionary aufgeführten Begleitwörter sich nicht unter den obersten vier Rängen dieser Liste befinden. Die Verwendung von >MUSLIM 135 FUNDAMENTALIST(S)<, >MUSLIM COMMUNITY/-IES< und >MUSLIM EXTREMIST(S)< ist sogar im Vergleich zu K3 seltener geworden. 6.3.3.5 Linksseitige Kollokationen für >ISLAMIC< Die linksseitigen Kollokationen sind in diesem Fall wieder nicht so häufig wie die rechtsseitigen, was daran liegt, dass mit >ISLAMIC< ein Adjektiv betrachtet wird, das das syntagmatische Bezugswort auf der rechten Seite trägt. Deshalb bestehen die meisten linksseitigen Kollokationen in der 505 Einträge starken Liste aus Artikeln, Konjunktionen und Präpositionen wie >AN<, >AND<, >BY<, >FOR<, >FROM<, >IN<, >OF<, >ON<, >THE<, >TO<, and >WITH<. Die übrigen Kollokationen zeugen zu einem Großteil von einer negativen Konnotation des Wortes >ISLAMIC<, da die Verwendung stark von der Berichterstattung unter Einfluss des 11. September beinflusst ist. No. Kollokation Freq 1 2 3 4 5 6 7 8 HAMAS AND ISLAMIC -BASED ISLAMIC EGYPTIAN ISLAMIC AFGHAN ISLAMIC ATTACKS BY ISLAMIC MILITANT ISLAMIC MEMBER(S) OF ISLAMIC RADICAL ISLAMIC 10 8 8 7 5 5 4 4 Tab. 27: Linksseitige Kollokationen zu >ISLAMIC< Abgesehen von den genannten Artikeln und Präpositionen ist die häufigste linksseitige Kollokation >HAMAS AND ISLAMIC< mit zehn Nennungen. In jedem der zehn Fälle ist >JIHAD< die rechtsseitige Kollokation (s.u.). Sieben der Textstellen liegen in K1 und drei in K2, jedoch keine in K3. An zweiter Stelle liegt eine Form, die Teil eines Kompositums ist: > -BASED ISLAMIC<. Sechs der acht Kollokationen bestehen aus dem Kompositum >LONDONBASED<. Alle acht Kollokationen liegen in K1. An Stelle drei finden wir >EGYPTIAN ISLAMIC<, und in jedem der acht Fälle ist >JIHAD< die rechtsseitige Kollokation (>EGYPTIAN ISLAMIC 136 JIHAD<). Dieses Syntagma ist erneut ausschließlich in K1 zu finden. Siebenmal finden wir >AFGHAN< als linksseitige Kollokation, die gesamte Wortkette lautet in jedem einzelnen Fall >AFGHAN ISLAMIC PRESS<. Alle liegen in K1. Fünfmal finden wir >ATTACKS BY ISLAMIC< (drei in K1, eine in K2 und eine in K3). Ebenfalls fünfmal ist >MILITANT ISLAMIC< enthalten (dreimal in K2, zweimal in K1). Viermal finden wir >MEMBER bzw. MEMBERS OF ISLAMIC< (zweimal K1, zweimal K2), ebenfalls viermal ist >RADICAL ISLAMIC< vorhanden (alle in K1). Die folgenden Konstruktionen kommen jeweils dreimal vor, sind in der obigen Tabelle nicht aufgeführt: >ACCORDING TO ISLAMIC<, >CLAIMED BY ISLAMIC<, >EXTREMIST ISLAMIC< (dreimal K1), >HELD BY ISLAMIC<, >HIGHER ISLAMIC (COUNCIL)<, >INCLUDING ISLAMIC< und >UN-ISLAMIC<. Tabelle 27 verdeutlicht, dass sich Religion, Terrorismus und Nationalität zweifelsfrei als häufig aneinander gebundene Begriffe erweisen, und das in K1 deutlich stärker als in den anderen beiden Korpora. 6.3.3.6 Rechtsseitige Kollokationen >ISLAMIC< Wenn wir uns die rechtsseitigen Kollokationen des Adjektivs >ISLAMIC< ansehen, so stellen wir fest, dass es sehr häufig in einem negativen Zusammenhang verwendet wird. Wieder sind die Häufigkeiten der rechtsseitigen Kollokationen sehr viel ausgeprägter, was für Adjektive im Englischen typisch ist: No. Kollokation Häuf. 1 2 3 4 5 6 7 8 9 10 11 ISLAMIC JIHAD ISLAMIC MILITANT(S) ISLAMIC FUNDAMENTALIST(S) ISLAMIC GROUP(S) ISLAMIC FUNDAMENTALISM ISLAMIC REVOLUTION ISLAMIC MOVEMENT(S) ISLAMIC STATE ISLAMIC TERRORIST(S) ISLAMIC CONFERENCE ISLAMIC REPUBLIC 90 28 18 18 11 11 10 10 10 9 9 Tab. 28: Rechtsseitige Kollokationen von >ISLAMIC< 137 Ganze 90-mal ist >JIHAD< zur Rechten des Adjektivs >ISLAMIC< zu finden (viermal davon als sächsischer Genitiv). 44 dieser Kollokationen sind in K1 enthalten, 36 in K3 und 10 in K2. Bei der Durchsicht der Wortlisten fällt ferner auf, dass die meisten Nennungen an bestimmten Stellen des Korpus eine Kumulation haben (12-mal bei 73 % des Korpus, zehnmal bei 79 %, sechsmal bei 32 %).19 An diesen Punkten des chronologisch geordneten Korpus war ein Kontext gegeben, der die Verwendung >ISLAMIC JIHAD< förderte, wahrscheinlich infolge eines Terroranschlages oder einer öffentlichen Stellungnahme zu der Thematik. Für >ISLAMIC MILITANT(S)< gibt es 28 Belege, die sich zu 17 auf K1, drei auf K2 und acht auf K3 verteilen. Die Verbindung >ISLAMIC FUNDAMENTALIST(S)< kommt 18-mal vor, elf Textstellen liegen in K3 und sieben in K1. Die Nominalphrase >ISLAMIC GROUP(S)< ist 18-mal enthalten, 13 der Textstellen liegen in K1, vier in K2 und nur eine in K3. >ISLAMIC FUNDAMENTALISM< ist elfmal zu finden (K3: 8; K1: 3), genauso häufig wie >ISLAMIC REVOLUTION< (K3: 9; K1: 2). Die Kombination >ISLAMIC MOVEMENT(S)< findet sich zehnmal (K1: 7; K2: 2; K3: 1). >ISLAMIC STATE< ist zehnmal vorhanden (K1: 8; K3: 2), diese Nominalphrase existiert nicht in der Pluralform. >ISLAMIC TERRORIST(S)< ist zehnmal enthalten, alle Kollokationen liegen in K1. Sowohl >ISLAMIC CONFERENCE< (K3: 6; K1: 3) als auch >ISLAMIC REPUBLIC< kommen neunmal vor. >ISLAMIC REPUBLIC< ist siebenmal in K3 vorhanden und zweimal in K2, aber keinmal in K1. Das Adjektiv >ISLAMIC< wird ganz offensichtlich in Verbindung mit bedrohlichen Mächten wie >JIHAD<, >MILITANT(S)<, >FUNDAMENTALIST(S)<, >GROUP(S)<, >MOVEMENTS<, >TERRORIST(S)< etc. verwendet. Das ist in erster Linie auf die Panik zurückzuführen, die nach dem 11. September herrschte. 19 Wordsmith zeigt in jeder Konkordanzliste mit Hilfe eines Prozentwertes, an welcher Stelle des chronologisch geordneten Korpus eine Konkordanz bzw. Kollokation zu finden ist. Hätten wir in einem Korpus 100 gleichlange Texte (Anzahl der Wörter) und die Konkordanz den Eintrag 73 %, so befindet sich die gesuchte Kollokation im 73. Text. 138 6.3.3.7 Gebräuchlichkeitsveränderungen Die Überprüfung der Kollokationen von >ARAB<, >MUSLIM< und >ISLAMIC< hat ergeben, dass es in den Untersuchungszeiträumen eine deutliche Begriffsverschiebung zwischen >ARAB< auf der einen Seite und >MUSLIM< und >ISLAMIC< auf der anderen Seite gegeben hat. Während 1990 im Zuge der Kuwait-Krise die Gebräuchlichkeit von >ARAB< dominant war (837 Token bei 0,04 % in K3), konnten für 2001 nur insgesamt 181 Token gefunden werden, davon 159 in K1 (0,02 %) und 22 in K2. WORD ARAB MUSLIM ISLAMIC ∑ Superkorpus K1 K2 K3 Freq. 1018 547 505 2070 12.9.-11.12.2001 Freq. % 159 0,02 268 0,03 271 0,03 698 1.6.-11.9.2001 Freq. % 22 43 33 98 1.1.-21.8.1990 Freq. stand. Wert 837 418 236 118 201 105 1274 % 0,03 0,01 0,01 % 0,04 0,01 - Tab. 29: Die Verteilung von >ISLAMIC<, >MUSLIM< und >ARAB< in den drei Hauptkorpora (aus Wordsmith- Wortliste ) Tabelle 28 macht deutlich, dass alle drei hier analysierten Begriffe (>ARAB<, >MUSLIM< und >ISLAMIC<) in ihren Häufigkeiten nach dem 11. September einen starken Schub erhalten haben (∑=698). In K2 hingegen ist von der Nachrichtenagenda her eine Ruhephase zu verzeichnen (∑=98), was eine Auseinandersetzung mit der muslimischen oder arabischen Welt betrifft. Es gab weder größere militärische Auseinandersetzungen zwischen der westlichen und der islamischen Welt im Erhebungszeitraum von K2, noch gab es ausufernde terroristische Anschläge, verübt durch Terroristen aus dem arabischen Raum. Die Summe der Nennungen in K3 beträgt 1274 (stand. Wert 637). Für die Wörter >MUSLIM< und >ISLAMIC<, die sich auf Religion und die Personen, die diesen Glauben ausüben beziehen, lässt sich eine entgegengesetzte Tendenz feststellen. Während >MUSLIM< 1990 mit 0,01 % und 236 Token vertreten war (s.o.), waren es 2001 zusammengenommen 311 (268 in K1 und 43 in K2). >ISLAMIC< 139 kommt im Korpus von 1990 auf 201 Token (s.o.), 2001 waren es 271 (K1) und 33 (K2). Das Wort >ARAB<, das sich hingegen auf den Sprachraum, die Sprecher und die Sprache bezieht und etwaige religiöse Komponenten außer Acht lässt, hatte 1990 überwiegend eine politische Konnotation, wenn von der Kuwait-Krise die Rede war. Es drängt sich der Verdacht auf, dass diese Verwendung nach 9/11 teilweise durch den Gebrauch von >MUSLIM< und >ISLAMIC< substituiert worden ist, um nicht explizit mit dem arabischen Raum in Opposition zu treten. Vielleicht hätten die Zeitungen sich auf die Sprachregelung >ARABICSPEAKING TERRORISTS< einigen sollen, anstatt die Terroristen permanent in einen Zusammenhang mit der islamischen Religion zu stellen. Dabei waren 15 der 19 Attentäter von 9/11 saudi-arabische Staatsbürger (Spiegel 36/ 2006). Der überwiegende Teil der Araber, also Menschen, die Arabisch sprechen bzw. in arabischen Staaten leben, gehört dem Islam an. Wir müssen jedoch bedenken, dass es Moslems, also Anhänger des Islam, auch anderenorts gibt als in der Arabisch sprechenden Welt, so zum Beispiel in der Türkei, Pakistan und Indonesien, etc. Zum Vergleich: das Wort >CHRISTIAN< kommt in allen drei Korpora insgesamt nur 330-mal vor. Die fremde Religion ist damit häufiger Bestand der Zeitungsberichterstattung als die eigene in der westlichen Welt vorherrschende.20 Anstelle der 1990 eher verwendeten Kollokationen wie >ARAB WORLD<, >ARAB STATES<, >ARAB COUNTRY/ -IES<, >ARAB NATION(S)< finden wir 2001 eher Verwendungen wie >MUSLIM WORLD<, >MUSLIM COUNTRY/ -IES<, >MUSLIM COMMUNITY/-IES<, >MUSLIM STATES< und >ISLAMIC STATE<. Es liegt auf der Hand, zu vermuten, dass es Veränderungen in den Wortgebräuchlichkeiten gegeben hat, die in der Sprachgeschichte nicht selten vorkommen (Fritz 1998, S.68), in dem hier behandelten Kontext u.U. aus einem politischen Kalkül heraus, das „Feindbild Islam“ aufzubauen, woraus wiederum Vorurteile gegen Muslime entstehen. 20 Vergleiche auch die Werte für >PROTESTANT< (Superkorpus 84 Token) und >CATHOLIC< (Superkorpus 298 Token) 140 6.4 Untersuchungen an der Lexik In diesem Abschnitt der Arbeit sind die Punkte Synonymie, lexikalische Dichte, die Funktion Keyness und die Analyse ausgewählter Wortgruppen thematisiert. Synonymie wird hier besprochen, da sie bei der Zusammenstellung von Wortgruppen eine wichtige Rolle spielt. Wenn wir exakt sein sollen, reicht es im Grunde genommen nicht aus, die Häufigkeit eines einzelnen Wortes zu vermerken, sofern es dazu mehrere Synonyme gibt, die dieselbe Bedeutung haben. Die Wortlisten wirken deshalb manchmal ein wenig verquer, denn der tatsächliche Wert eines Wortoder Projektionsfeldes kann sehr viel höher sein. 6.4.1 Das Problem der Synonymie Der Begriff Synonymie spiegelt die Tatsache wider, dass für die einzelnen Sachverhalte, Personen, Orte, Handlungen, etc., unterschiedliche Wörter bzw. Ersatzwörter verwendet werden. Synonyme Wörter haben „den gleichen Sinn“ (Lyons 1985, S.211). Dieses sprachliche Phänomen hat einen Einfluss auf die bei Korpusanalysen erstellten Wortlisten. Deshalb müssten wir, um präzise zu sein, die Häufigkeiten der Synonyme ein und derselben Sache aufaddieren (>PRIME MINISTER<, >MR BLAIR<, >TONY BLAIR<, >LABOUR LEADER<, etc.), um die Gesamtverwendung der zu bezeichnenden Sache, des „Referenten“, herauszufinden. Gängige Korpusanalyseprogramme sind derzeit nicht in der Lage, die verschiedenen Synonyme ein und derselben Sache in Wortgruppen zusammenzufassen. Es geht lediglich um die Typen (Signifikanten) und deren Häufigkeit, denen wir sprachliche Tendenzen ablesen können, nicht um das Signifikat, also das, was die Wörter bedeuten oder die Sache, die sie bezeichnen. Auch wenn wir ein gesamtes Wortfeld fokussieren wollen (>PFERD<, >RAPPE<, >GALOPPER<, >HENGST<, >STUTE<, >FOHLEN<, >PONY<, etc.), müssten wir alle Formen heraussuchen und gemeinsam betrachten. Doch innerhalb eines Wortfeldes können 141 Hierarchien vorhanden sein (Geckeler in: Lutzeier 1993, S. 11). Herkömmliche Annotations- bzw. Tagging-Programme helfen uns in diesem Fall nicht weiter, denn sie annotieren die Worttypen über Vergleichslisten, die fest definiert sind. Soll für jedes Wort das Wortfeld bestimmt und die Anzahl der verschiedenen Bedeutungen ausgezählt werden, so ist dies mit erheblichem Zeitaufwand verbunden. Wir müssen uns derzeit noch damit zu Frieden geben, die Wortgruppen zu bestimmten Themen oder Hyperonymen selbst auszuwählen und deren Bestandteile bzw. die benötigten Formen aus den Listen herauszuarbeiten (siehe Punkt 6.4.5). Auch die Ambiguität ganzer Sätze stellt ein Problem dar. In der Linguistik gilt der folgende Satz von Noam Chomsky (1979, S. 68) als Paradebeispiel: “Flying planes can be dangerous”, der nach dem 11. September 2001 einen bitteren Beigeschmack erhalten hat. Das Phänomen syntaktische Ambiguität kommt besonders in den Konkordanzlisten häufig zum Tragen, wenn nur ein begrenzter Ausschnitt eines Satzes zur Verfügung steht (siehe 6.3.2.1 bis 6.3.2.5) und die Konkordanz aus dem Textzusammenhang gerissen ist. 6.4.2 Lexikalische Dichte und Funktionswörter Eine mathematische Betrachtungsweise, die dabei hilft, sinnvolle Aussagen über den verwendeten Wortschatz innerhalb eines homogenen Korpus treffen zu können, ist die Berechnung der lexikalischen Dichte. Die lexikalische Dichte von Korpora im Vergleich ermöglicht ein Urteil darüber, ob sich Sprache vereinfacht oder verkompliziert hat. Bereits bei Halliday (1984, S. 32) spielt dieser Begriff eine wichtige Rolle (lexical density: proportion of lexical items (content words) to words as a whole). Er gibt zu bedenken, dass geschriebene Sprache eine höhere lexikalische Dichte als gesprochene und deshalb einen komplexeren Wortschatz besitzt (Halliday, 1984, S.224). Diese Erkenntnisse kommen in der Übersetzungswissenschaft zum Tragen, wenn analysiert wird, ob übersetzte Texte gegenüber den Ursprungstexten in punkto Schwierigkeitsgrad eine Veränderung durchlaufen haben. Es ist von den vier universellen Eigenschaften von 142 Übersetzungen die Rede (Baker 1998, S. 288 ff, Hansen/ Teich 1999, S.312-322): “simplification“, “explicitation“, “normalisation“ und “levelling out“. Diese Feststellung über die Komplexität von Ursprungstexten (source) und Zieltexten (target) lassen sich auf die Korpuslinguistik übertragen. Die lexikalische Dichte beschreibt hier den Prozentsatz, den wir erhalten, wenn in einem ersten Schritt die Anzahl der Funktionswörter eines Textes oder eines Korpus von der Gesamtzahl der Token subtrahiert wird. Auf diese Weise erhalten wir die Anzahl der Inhaltswörter bzw. content words. Das Ergebnis wird durch die Gesamtzahl der Wörter (Token) dividiert und mit 100 multipliziert. Wir erhalten schließlich die Prozentzahl aller Inhaltswörter eines Korpus. Texte sind laut Baker besser zu verstehen, wenn mehr Funktionswörter und weniger Inhaltswörter verwendet werden. In der hier vorliegenden Korpusanalyse kann für jedes einzelne der drei Hauptkorpora (K1, K2, K3) die Anzahl der Funktionswörter ermittelt und die lexikalische Dichte berechnet werden. Laut Fries (1952, S.87) existieren in der englischen Sprache genau 154 Funktionswörter. Man kann den Theorieansatz von Fries zwar deshalb kritisieren, weil die so genannten Funktionswörter in der Grammatik bereits wohldefinierten Typen entsprechen (Artikel, Hilfsverben, Präpositionen, etc.). Fakt ist jedoch, dass sich sowohl die Begriffe Funktionswörter als auch Inhaltswörter in der Aphasiologie bei der Beschreibung des Aufbaus des mentalen Lexikons durchgesetzt haben (Tesak 1997, S.66/67, Pinker 1996, S.55/56). Bei der Berechnung der lexikalischen Dichte wurde die Gesamtzahl der Funktionswörter von der Summe aller Token abgezogen (s.o.). Das Hauptproblem bestand darin, die genaue Zahl dieser Wortklasse in den Hauptkorpora zu ermitteln: Einige Klassen von Wörtern sind in jedem Fall Funktionswörter, andere hingegen nur bei einer bestimmten Konstellation, so zum Beispiel die Wörter >STILL<, >EVEN<, >SOME< und >NO<, die erst in Verbindung mit einer Steigerungsform (z.B. >STILL BETTER< ) zu Funktionswörtern werden. Einige Funktionswortgruppen wie >VERY MUCH TOO< brauchen nicht als ganze betrachtet zu werden, da jedes einzelne Wort für sich schon ein Funktionswort ist. In diesem Fall mussten nicht extra Konkordanzlisten aufgerufen werden, sondern die einzelnen Wörter 143 konnten den Häufigkeitslisten entnommen werden, da sie von Wordsmith aufgesplittet und separat betrachtet wurden. Es gibt andere Beispiele, in denen es sehr aufwendig war, herauszufiltern, ob ein Wort als Funktionswort gilt oder nicht, so kann dieses zum Beispiel von einem bestimmten Intonationsschema abhängig sein (>MORE OR LESS<). Deshalb ist nicht auszuschließen, dass bei der Ermittlung der Anzahl der Funktionswörter kleine Fehler unterlaufen sind. Diese Fehlergröße ist jedoch als gering zu erachten und wurde bei der Ermittlung der lexikalischen Dichte vernachlässigt, zumal sich diese Fehlergröße auf die seltensten Begriffe beschränkt, also die Typen betrifft, die weiter unten in den Häufigkeitslisten zu finden sind. Wenn nur eine einzige Verwendungsform von mehreren gesucht und eine recht große Konkordanzliste zu durchsuchen war, so wurde eine Stichprobe von 100 Konkordanzen herangezogen und die Auszählung hochgerechnet. Funktionswörter stellen innerhalb einer Sprache im Gegensatz zu Fachwortschätzen oder temporären Modebegriffen eine stabile Größe dar. Der Vergleich der lexikalischen Dichten der drei Hauptkorpora soll lediglich eine Tendenz ausdrücken. Auch bei Funktionswörtern gibt es Homonymie, so kann z.B. >PRETTY< mal Adverb, mal Adjektiv sein, aber auch ein Name >MRS PRETTY<. In diesem Fall sollten die Konkordanzlisten konsultiert werden. Für K1 wurden schließlich 394 891 Bestandteile dieser Klasse ermittelt. Für K2 waren es 393 106 und 777 980 für K3. Als Gesamttokenzahl wurden das Ergebnis der Wordsmith-Zählung herangezogen (siehe Punkt 6.1.1). Es kam die folgende Formel zur Anwendung: T – F . 100 = L T (T = Anzahl der Token, F = Anzahl der Funktionswörter, L = lexikalische Dichte). Für die drei Hauptkorpora ergeben sich die folgenden Werte: K1: K2: K3: 60,91 % 61,08 % 61,51 % 144 Die lexikalische Dichte bzw. die Komplexität des Wortschatzes ist demnach in K3 am höchsten, am zweithöchsten ist sie in K2 und am dritthöchsten in K1.21 Parallel dazu dient die Type–Token–Relation als Bewertungsmaßstab für die Komplexität (siehe oben 6.1.2). Wie bereits erwähnt, ist laut Baker ein Text einfacher zu verstehen, wenn mehr Funktionswörter verwendet wurden. Übertragen wir diese Erkenntnis auf diese Dissertation, so können wir folgern, dass die Sprache in K1 besser zu verstehen ist als in K2. Etwas schlechter ist sie demnach in K3 zu verstehen, denn dort ist der Wortschatz am komplexesten. Doch es ist schwer zu sagen, wie gravierend diese absoluten Zahlen sind, da Vergleichswerte von anderen Korpusanalysen fehlen. Dieses Urteil betrifft außerdem nur eine kleine Facette der Bewertung der Sprache. Orthografie, Ausdruck und Grammatik beispielsweise können durch diese Analysen nicht beurteilt werden. Würden wir nur von der lexikalischen Dichte als Bewertungsmaßstab für die Qualität von Zeitungssprache ausgehen, so ignorieren wir andere wichtige Eigenschaften. Wir können deshalb festhalten, dass sich die Verständlichkeit gemessen an der lexikalischen Dichte von Korpus zu Korpus verbessert hat. Auffällig ist ferner, dass die Abnahme der lexikalischen Dichte von K2 zu K1 wesentlich stärker ist als von K3 zu K2. Vielleicht lässt sich deshalb behaupten, dass Krisenjournalismus eine geringere lexikalische Dichte besitzt, als der Alltagsjournalismus. 6.4.3 Die Funktion Keywords Das dritte Wordsmith-Tool, das innerhalb dieser Analyse zur Anwendung kommt, heißt „Keywords.“ Mit dessen Hilfe können die zuvor abgespeicherten Häufigkeitslisten zweier Korpora automatisch miteinander verglichen werden (siehe Punkt 4.1). Die Software filtert 21 Im Gegensatz zu diesem Beispiel aus der Korpuslinguistik wird in der funktionalen Grammatik (Halliday 2004, S.655) die lexikalische Dichte errechnet, indem die Anzahl der lexikalischen Einheiten (lexical items) durch die Anzahl der aneinander gereihten Sätze (ranking clauses) dividiert wird. 145 im Rahmen dieser Funktion all jene Begriffe heraus, die in ihren Häufigkeiten, ausgehend von der erstgeladenen Liste, besonders stark differieren. In den Keyness-Listen werden die frappierendsten prozentualen Abweichungen auf den oberen Rängen der Liste aufgeführt. Jedes Korpus hat eigene Schlüsselwörter, nur Funktionswörter finden wir darunter selten. Für die drei Hauptkorpora lassen sich primär sechs Keyness-Listen erstellen: K1 zu K2, K2 zu K1, K1 zu K3, K3 zu K1, K2 zu K3 und K3 zu K2. Zusätzlich lassen sich K1 und K2 zu einem Korpus von 2001 zusammenfassen, das als Ursprungskorpus und als Vergleichskorpus mit K3 verglichen werden kann. Im folgenden Schritt wollen wir uns jedoch auf die wichtigsten sechs Listen beschränken. Die Kombinationen K3 zu K1 und K1 zu K3 wurden außer Acht gelassen. Aus Platzgründen sind für jede Liste nur die obersten 25 Einträge aufgeführt. Erst im nächsten Kapitel (6.4.4) werden auch die drei Subkorpora von K1 im Einzelnen einer KeynessAnalyse unterzogen. 6.4.3.1 Die Keyword-Liste von K1 mit K2 als Referenzkorpus Als erstes sei hier die Keyword-Liste K1 zu K2 dargestellt. Diese Liste steht eindeutig unter dem Einfluss des Hauptereignisses NineEleven. Das Range dieser Keyness-Liste bewegt sich zwischen 242,6 und 1489,5 Keynesspunkten. 146 N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 WORD FREQ. K1 AFGHANISTAN 1.141 949 BIN 759 TALEBAN 758 LADEN 720 TALIBAN 2.186 US TERRORISM 571 676 TERRORIST 857 ATTACKS 549 AL 361 OSAMA 540 ALLIANCE 361 AFGHAN 368 ANTHRAX 322 KABUL 341 PAKISTAN 739 FORCES 802 MILITARY 1.037 WAR 230 KANDAHAR SEPTEMBER 631 411 BOMBING TERRORISTS 336 732 AMERICAN 175 LADEN'S K1 % 0,11 0,09 0,08 0,08 0,07 0,22 0,06 0,07 0,08 0,05 0,04 0,05 0,04 0,04 0,03 0,03 0,07 0,08 0,1 0,02 0,06 0,04 0,03 0,07 0,02 FREQ. K2 9 6 0 4 1 742 18 62 149 44 0 47 3 5 0 15 179 212 365 0 155 58 33 226 0 K2 % Keyness 1.489,50 1.251,40 1.052,40 1.006,60 984,5 0,07 745,1 655,6 597,4 0,01 550,9 508,6 500,5 486,3 469,9 464,1 446,4 369,2 0,02 366,9 0,02 366 0,04 335,9 318,8 0,02 309,2 299,2 289,3 0,02 281,4 242,6 Tab. 30: Die obersten 25 Typen der Keyword-Liste von K1 zu K2 Der Mittelwert aus diesen 25 Werten beträgt 508,6. Aufgrund der ausgelösten internationalen Krise ist offensichtlich die Themenvielfalt, die als Qualitätskriterium für Informationsjournalismus gilt, stark eingeschränkt (siehe 5.9). Wir finden in der Liste viele die Typen, die in K2 nicht ein einziges Mal vorkommen. Dazu gehören >TALEBAN<, >OSAMA<, >KABUL<, >KANDAHAR< und >LADEN’S<. Das ist bezeichnend dafür, wie extrem sich der Fokus der Berichterstattung verschoben hat. Die Type >AFGHANISTAN< erreicht einen Keyness-Wert von 1489,50. Sie kommt in K1 ganze 1141-mal vor (0,11 %), in K2 hingegen nur neunmal (0 %). Dieses Land war schlagartig im Zentrum der Medienberichterstattung, weil die Verantwortlichen für die Anschläge hier vermutet wurden. Es lässt sich sagen, dass der Nachrichtenwert dieser Type sehr hoch ist. 147 Die Type >BIN<, die in den Texten zum überwiegenden Teil zu dem Namen Osama Bin Laden gehört, liegt an zweiter Stelle, die Verteilung hat ein Verhältnis von 949 (0,09 %) in K1 zu 6 (0 %) in K2.22 Daraus ergibt sich ein Keyness-Wert von 1251,40. Bin ist ein arabisches Namensprädikat, das „Sohn von …“ bedeutet. Die Verteilung kann als Hinweis gelten, dass die US-Regierung alles Mögliche tat, um der Weltöffentlichkeit schnellstmöglich einen lebendigen Verantwortlichen für die Terroranschläge zu präsentieren. >TALEBAN< ist die Bezeichnung für die radikale islamische Miliz in Afghanistan. Diese Type erreicht 759 Token in K1 (0,08 %), jedoch kein Token in K2. Das ergibt einen Keyness-Wert von 1052, 40. Auf Rang vier steht >LADEN< (758 Token (0,08 %) in K1 zu 4 (0 %) in K2) mit 1006,60 Keyness. Rang 5 nimmt >TALIBAN< ein (720 (0,07 %) zu 1 (0 %)) mit einem Keyness-Wert von 984,5. Gäbe es nur eine Schreibvariante von >TALIBAN< oder >TALEBAN< so wäre diese Type auf Rang eins der Liste zu finden. Es folgt >US< (2186/ 742 Token bzw. 0,22 zu 0,07 %), Keyness-Wert 745,1. >US< kann zum einen das Kürzel von >UNITED STATES< sein, zum anderen das Personalpronomen erste Person Plural in der Objektform. Die Type >TERRORISM< steht auf Rang 7 (571/ 18 Token bzw. 0,06 zu 0 %) mit einem Keyness-Wert von 655,6. Auf Rang 8 der Liste finden wir >TERRORIST< (676/ 62 Token bzw. 0,07 zu 0 %) mit einem Keyness-Wert von 597,4. Nummer 9 ist >ATTACKS< (857/ 149 Token in K1 bzw. 0,08 zu 0,01 % in K2 mit einem, Keyness-Wert von 550,9). Platz 10 nimmt die Type >AL< ein (549/ 44 Token bzw. 0,05 zu 0 %) mit 508,6 Keyness. Das ist der standardarabische Singular-Artikel. Der arabische Vorname >OSAMA<, Rang 11, (361/ 0 Token bzw. 0,04 zu 0 %) erzielt 500,5 Keyness-Punkte. Die Type >ALLIANCE< (540/ 47 Token bzw. 0,05 zu 0 %) erreicht einen Keyness-Wert von 486,3. Mit diesem Begriff wird sowohl die „Northern Alliance“ in Afghanistan bezeichnet, als auch das Bündnis gegen den Terror aus verschiedenen westlichen Staaten unter der Führung der USA. >AFGHAN<, auf Rang 13, kommt in K1 auf 361 Token 22 Es finden sich auch >BIN AL-SHIBH<, >BIN FAHD<, >BIN MUHAMMAD< u.a. Ferner finden wir die Verwendung im Sinne von Behälter, Abfalleimer (>BREAD BIN<, >MAIL BIN<, >WHEELIE-BIN<). Daraus resultiert, dass >BIN< häufiger ist als Laden. 148 (0,04 %), in K2 auf drei Token (0 %). Das erzeugt einen KeynessWert von 469,9. Auf Rang 14 befindet sich >ANTHRAX<, die Bezeichnung für die Infektionskrankheit Milzbrand, (368/ 5 Token bzw. 0,04 zu 0 %). Der dazugehörige Keyness-Wert beträgt 464,1. Dieser Wert ist Ausdruck der Angst vor weiteren schwerwiegenden Terrorangriffen in der Zeit nach 9/11. Die Type >KABUL< kommt im Verhältnis 322 (0,03 %) zu 0 vor. Der Keyness-Wert beträgt 446,4. Die afghanische Hauptstadt Kabul wurde ebenso wie die Provinz Kandahar in den Monaten vor dem 11. September nicht thematisiert. Die Type >PAKISTAN<, auf Rang 16, hat ein Verhältnis von 341(0,03 %) zu 15 (0 %). Der Keyness-Wert beträgt 369,2. Die Type >FORCES< (739 Token (0,07 %) zu 179 (0,02 %)) auf Rang 17 hat in dieser Korpus-Konstellation einen Keyness-Wert von 366,9. Mit >FORCES< wurden nicht nur die alliierten Truppen unter der Führung der USA bezeichnet, die bald nach dem 11. September zu ersten Kampfhandlungen übergingen, sondern auch taleban forces, israeli forces, und viele andere mehr. Das Militärwesen trat häufig in der Berichterstattung auf. Das belegen auch die folgenden beiden Typen: >MILITARY< (802 Token (0,08 %) zu 212 (0,02 %)) erhält einen Keyness-Wert von 366 und steht damit auf Rang 18 der Liste. Auf Rang 19 finden wir >WAR< mit 1037 (0,10 %) zu 365 Token (0,04 %) bei einem Keyness-Wert von 335,9. Auf Rang 20 folgt >KANDAHAR<, die Hochburg der Taliban, die am 7.12.2001 von diesen aufgegeben wurde (230/ 0 Token bzw. 0,02 zu 0 %). Der Keyness-Wert beträgt 318,8. Platz 21 nimmt >SEPTEMBER< ein (631/ 155 Token bzw. 0,06 zu 0,02 %), der dazugehörige Keyness-Wert beträgt 309,2. Wir finden den Begriff >BOMBING< als 22. Schlüsselwort (411/ 58 Token bzw. 0,04 zu 0 %) mit 299,2 Keyness-Punkten. Auf Rang 23 steht >TERRORISTS< mit 336 Token in K1 (0,03 %) und 33 in K2 (0 %), Keyness-Wert: 289,3. Auf Rang 24 steht >AMERICAN< (732/ 226 Token bzw. 0,07 zu 0,02 %) und einer Keyness von 281,4. Wert Nummer 25 in dieser Liste ist der von >LADEN’S< (175/ 0 Token bzw. 0,02 zu 0 %); Keyness: 242,6). Die Folgen des 11. September sind unter diesen obersten 25 Einträgen der Keyword-Liste von K1 zu K2 beherrschendes Thema. Andere Themenbereiche als der Terrorismus und dessen Folgen sind deutlich 149 unterrepräsentiert. Die vier höchsten Einträge erreichen sogar Keyness-Werte von über 1000. Das zeigt überaus deutlich, wie gravierend die sprachlichen Veränderungen in der Folgezeit nach dem 11. September waren. Das Vokabular der Berichterstattung über diesen Terroranschlag ist vorherrschend. Schlüsselwörter anderer politischer Themen sind in dieser Liste nicht zu finden. Es ist in dieser Liste nur ein medienrelevanter Akteur genannt: Osama Bin Laden, der vermeidliche Drahtzieher der Terroranschläge. Kein westlicher Politiker schafft es auf die obersten 25 Ränge. Jedoch sind vier Ortsbezeichnungen enthalten: >AFGHANISTAN<, >PAKISTAN<, >KABUL< und >KANDAHAR<. 6.4.3.2 Die Keyword-Liste von K2 mit K1 als Referenzkorpus Betrachten wir die Keywords-Liste von Ausgangskorpus K2 zu Referenzkorpus K1, so stellen wir fest, dass in erster Linie innenpolitische Themen festgehalten wurden. Die Wörter aus K2 mit den höchsten Abweichungen in ihrer Häufigkeit zu K1 stehen erneut ganz oben. Das Range dieser Keyness-Liste bewegt sich zwischen 109 und 399 Keyness-Punkten (Mittelwert 163,9). Die Typen dieser Auswertung haben demgemäß eine deutlich geringere Schlüsselwortfunktion als die in der vorhergehenden. Unter den obersten 25 Typen dieser Liste befinden sich genau sieben Namen: >CLARKE<, >HAGUE<, >ARCHER<, >PORTILLO<, >DANDO<, >HAMILTONS<, >MCGOWAN<. Anhand dieser Keyness-Liste und speziell der aufgeführten Namen erkennen wir hinreichend deutlich, dass das Presse-Korpus K2 vorrangig von innenpolitischen Themen geprägt ist, vor Allem von den Unterhauswahlen in Großbritannien am 7.6.2001.23 23 Die Sprache von New Labour hat Fairclough (2000) in „New labour, new language?“ mit einer gelungenen Korpusanalyse untersucht. 150 N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 WORD FREQ. K2 919 ELECTION 888 POUNDS 1.306 LABOUR 460 CLARKE 395 HAGUE 2.608 HER 703 TORY 445 VOTE 188 ARCHER 484 CONSERVATIVE 1.386 PARTY 2.487 SHE 215 PORTILLO 249 LIB 218 VOTES 391 TORIES 140 TURNOUT 1.854 POLICE 98 DANDO 175 VOTING 90 LANDSLIDE 133 FESTIVAL 82 HAMILTONS 266 VOTERS 99 MCGOWAN K2 % 0,09 0,09 0,13 0,05 0,04 0,26 0,07 0,04 0,02 0,05 0,14 0,25 0,02 0,02 0,02 0,04 0,01 0,18 0,02 0,01 0,03 FREQ. K1 255 256 530 68 64 1.598 236 122 14 165 800 1.686 33 52 38 131 10 1.224 2 28 1 13 76 4 K1 % 0,03 0,03 0,05 0,16 0,02 0,01 0,02 0,08 0,17 0,01 0,12 KEYNESS 399 369,8 338,9 326,5 265,6 245,5 243,1 195,6 178,3 163,9 159,3 155,1 149,3 140,3 139,9 135,5 134,5 130,1 119 118,6 115,2 114,7 113,7 111,8 109 Tab. 31: Die obersten 25 Typen der Keword-Liste von K2 zu K1 Den höchsten vom Computer errechneten Keyness-Wert für diese Korpuskonstellation erhält >ELECTION< mit 399,0. Dieser ergibt sich aus den Werten für K2 (919 Token, 0,19 %) und dem Referenzkorpus K1 (255 Token, 0,03 %). Auf Rang zwei finden wir die Type >POUNDS< mit 888 Token (0,09 %) in K2 und 256 (0,03 %) in K1. Der Keyness-Wert beträgt 369,8. Rang drei >LABOUR< erzielt 1306 Token in K2 (0,13 %) und 530 in K1 (0,05 %). Der Keyness-Wert beträgt 338,9. Rang vier nimmt der Name >CLARKE< ein: 460 Token (0,05 %) in K2 und 68 (0 %) in K1. Der von Wordsmith errechnete KeynessWert beträgt 326,5. In K2 sind diverse Personen mit diesem Nachnamen aufgelistet: Charles C., Kenneth C., Victoria C. Auf Rang fünf befindet sich der Name >HAGUE< (395 Token in K2 (0,04 %) zu 64 in K1 (0 %)) mit einem Keyness-Wert von 265,6. 151 Diese Type steht in erster Linie für den Tory-Vorsitzenden William Hague und die Stadt The Hague. Die Type >HER< zählt 2608 Token in K2 (0,26 %), jedoch erstaunlicherweise nur 1598 in K1 (0,16 %), erlangt durch einen Keyness-Wert von 245,5 Rang sechs dieser Keyword-Liste. Die Type >TORY< steht auf Rang sieben (703 Token in K2 (0,07 %), 236 Token in K1 (0,02 %)). Der korrespondierende Keyness-Wert beträgt 243,1. Auf Rang acht findet sich >VOTE< mit 445 Token (0,04 %) in K2 gegenüber 122 (0,01 %) in K1 und 195,6 KeynessPunkten. >ARCHER< mit 188 Token in K2 (0,02 %) gegenüber 14 in K1 (0 %) erlangt 178,3 Keyness-Punkte. In den meisten Fällen ist der konservative Politiker und Schriftsteller Jeffrey Archer gemeint. Die Type >CONSERVATIVE< mit 484 Token in K2 (0,05 %) und 165 in K1 (0,02 %) erreicht 163,9 Keyness-Punkte. Die Type >PARTY< mit 1386 Token in K2 (0,14 %) und 800 in K1 (0,08 %) erreicht 159,3 Keyness-Punkte. Die Type >SHE< mit 2487 Token in K2 (0,25 %) und nur 1686 in K1 (0,17 %) erreicht 155,1 KeynessPunkte. Es ist wieder bemerkenswert, dass dieses Feminin-Pronomen in K1 deutlich schwächer vertreten ist (s.o. >HER<). >PORTILLO< kommt mit 215 Token in K2 (0,02 %) und 33 in K1 (0 %) auf 149,3 Keyness-Punkte. Michael Portillo war bis 1997 Verteidigungsminister. Die Abkürzung >LIB< (Liberal Democrats), erreicht 140,3 Keyness-Punkte bei 249 zu 52 Token (0,02 % vs. 0 %). Rang 15 >VOTES< erreicht 139,9 Punkte (218 vs. 38 Token bzw. 0,02 % vs. 0 %). >TORIES< erzielt mit 391 Token in K2 (0,04 %) und 131 in K1 (0,01 %) genau 135,5 Punkte und liegt damit auf Rang 16 der Liste. Die Type >TURNOUT< erzielt 140 Token bzw. 0,01 % in K2 und 10 Token bzw. 0 % in K1 (134,5 Keyness-Punkte). Für >POLICE< (Rang 18) sind in K2 1854 Token zu verzeichnen (0,18 %). In K1 sind es nur 1224 Token (0,12 %), was einen KeynessWert von 130,1 ergibt. >DANDO< (Rang 10) erfährt in K2 98 Nennungen (0 %), in K1 nur zwei (0 %), Keyness-Wert: 119. Gill Dando war eine beliebte englische Fernsehmoderatorin, die am 26.4.1999 in London vor ihrer Haustür erschossen wurde. Die Type >VOTING< auf Rang 20 (175 vs. 28 Token bzw. 0,02 % vs. 0 %) erhält einen Keyness-Wert von 118,6. >LANDSLIDE< 152 erzielt mit 90 zu 1 Token (beide Werte zählen 0 %) 115,2 KeynessPunkte und landet damit auf Rang 21. Die Type >FESTIVAL< (133 in K2 (0,01 %) und 13 in K1 (0 %)) liegt auf Rang 22 der Liste, der korrespondierende Keyness-Wert beträgt 114,7. >HAMILTONS< (Rang 23) erzielt 113,7 KeynessPunkte und 82 Token in K2 (0 %) gegenüber keinem Token in K1. Das Skandalehepaar Neil und Christine Hamilton war wegen des Vorwurfs eines Sexualverbrechens längere Zeit in den Medien präsent. Darauf folgt der Begriff >VOTERS< mit 266 Token in K2 (0,03 %) und 76 in K1 (0 %) mit 111,8 Keyness-Punkten. Die letzte Stelle in diesem Auszug aus der Keyness-Liste von K2 mit dem Referenzkorpus K1 nimmt der Name >MCGOWAN< ein. Den 99 Einträgen in K2 (0 %) stehen vier in K1 gegenüber (0 %). Der Keyness-Wert beträgt 109 Punkte. Der schwarze Harold McGowan war eines der Opfer der rassistisch motivierten Morde in der Stadt Telford in 1999/2000. Die herausragenden Zahlen für >HER< und >SHE< lassen sich sowohl auf den Dando-Mordfall zurückführen, als auch auf den 100. Geburtstag und den Tod von Queen Mum. Des Weiteren ist zu vermerken, dass sich in dieser Liste keine Ortsbezeichnung befindet, mit Ausnahme der Fälle, in denen Hague für die niederländische Stadt steht. 6.4.3.3 Die Keyword-Liste von K2 mit K3 als Referenzkorpus Fokussieren wir die Keyword-Liste, die ausgehend von K2 mit dem Referenzkorpus K3 erzeugt wird, so sehen wir, dass erneut innenpolitische Themen im Vordergrund stehen. Im Folgenden sind die ersten 25 Ränge dieser Liste aufgeführt. Das Range bewegt sich zwischen 294,2 und 1251,20 (Mittelwert: 444,6): 153 N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 WORD FREQ. K2 652 BLAIR 2.608 HER 2.487 SHE DUNCAN 468 2.921 I 395 HAGUE 5.514 HIS ASYLUM 342 493 SMITH 406 TONY 703 TORY ELECTION 919 SEEKERS 211 169 EU ARCHER 188 235 MOUTH 175 IAIN 211 EURO 249 LIB 7.612 HE PORTILLO 215 CLARKE 460 BLAIR'S 146 3.927 WHO 249 FOOT K2 % 0,06 0,26 0,25 0,05 0,29 0,04 0,55 0,03 0,05 0,04 0,07 0,09 0,02 0,02 0,02 0,02 0,02 0,02 0,02 0,75 0,02 0,05 0,01 0,39 0,02 FREQ. K3 23 2.144 2.037 31 2.747 28 7.132 37 164 111 392 645 6 0 7 34 8 25 49 11.697 33 242 2 5.463 59 K3 % KEYNESS 1.251,20 0,11 929,2 0,1 891,9 821,5 0,14 796 684,8 0,35 579,2 539,3 478,2 444,6 0,02 434,6 0,03 423 413,7 371,5 358,6 339,9 325,4 324,5 320,6 0,58 316,7 304,8 0,01 302,9 301,3 0,27 295,4 294,2 Tab. 32: Die obersten 25 Typen der Keyword-Liste von K2 zu K3 Wir müssen bei dieser Auswertung erneut bedenken, dass K3 doppelt so groß ist wie K2. Wordsmith nimmt automatisch einen Umrechnungsprozess vor. Auch diese Keynessliste belegt eindeutig, dass K2 stark von innenpolitischen Themen geprägt ist. Unter den 25 Typen befinden sich zehn Namensformen. Das sind mehr als in jeder anderen hier vorgenommenen KeynessAuswertungen. Der höchste Eingang in diesem Korpusvergleich ist >BLAIR< mit 652 Token (0,06 %) im Ausgangskorpus K2 versus 23 (0 %) im Referenzkorpus K3. Der dazugehörige Keyness-Wert ist 1251,20. Die Type >HER< (2608 Token (0,26 %) in K2, 2144 (0,11 %) in K3) steht auf Rang zwei der Liste und erzielt 929,2 Keyness-Punkte. >SHE<, ebenfalls ein Personalpronomen, findet sich mit 2487 Token (0,25 %) in K2 und 2037 (0,10 %) in K3 auf Rang 3 (891,9 Keyness-Punkte). Diese Tatsache unterstreicht, dass in K2 154 Höchstwerte für diese Pronomina des Femininum erreicht wurden (Queen Mum, Dando). Der Name >DUNCAN< (Rang 4) erzielt 468 Token (0,05 %) in K2 und 31 (0 %) in K3 (Keyness-Wert 821,5). Die Type >I< (Rang 5) erzielt bei 2921 Token in K2 (0,29 %) versus 2747 in K3 (0,14 %) 796 Keyness-Punkte. Iain Duncan Smith ist der Name eines konservativen britischen Politikers. >HAGUE< (Rang 6) bringt es auf 395 Token in K2 (0,04 %) versus 28 (0 %) in K3 und erzielt somit 684,8 Keyness-Punkte. Das Possessivpronomen >HIS< auf Rang sieben (5514 Token (0,55 %) in K2 und 7132 (0,35 %) in K3) bringt es auf 579,2 Keyness-Punkte. >ASYLUM< (Rang acht) kommt auf 539,3 Keyness-Punkte (342 Token in K2 (0,03 %) und 37 (0 %) in K3). Die Asylproblematik ist in den Zeitungsartikeln von K2 sehr viel häufiger thematisiert und hat dort einen deutlich höheren Nachrichtenwert als in K3. Der Name >SMITH< steht an neunter Stelle der Liste, erreicht 493 Token in K2 (0,05 %) und 164 in K3 (0 %) und damit einen Keyness-Wert von 478,2. Der Vorname >TONY< (Rang 10) erzielt 406 Token in K2 (0,04 %) und 111 in K3 (0 %), kommt damit auf 444,6 Keyness-Punkte. Listeneintrag elf >TORY< erzielt 703 Token in K2 (0,07 %) versus 392 in K3 (0,02 %) und damit 434,6 Keyness-Punkte. Listeneintrag 12 >ELECTION< erzielt 919 Token in K2 (0,09 %) und 645 im doppelt so großen Referenzkorpus K3 (0,03 %) was 423 KeynessPunkte ergibt. Das ist erneut ein Effekt der Tatsache, dass in K2 über die Unterhauswahlen am 7.6.2001 berichtet wurde. Rang 13 >SEEKERS< zählt 211 Token im Ausgangskorpus K2 (0,02 %), aber nur sechs Token im Referenzkorpus K3 (0 %). Der Keyness-Wert beträgt 413,7. Das Kürzel >EU< (Rang 14) hat 169 Token in K2 zu verzeichnen (0,02 %), in K3 keine. Das ergibt einen Keyness-Wert von 371,5. Die Europäische Union, für die diese Abkürzung steht, wurde erst im November 1993 ins Leben gerufen. Der Name >ARCHER< (Rang 15) erhält in K2 188 Token (0,02 %) in K3 ganze sieben (0 %). Der dazugehörige Keyness-Wert beträgt 358,6. Der Begriff >MOUTH< (Rang 16) mit 235 Token in K2 (0,02 %) und 34 in K3 (0 %) kommt auf 339,9 Keyness-Punkte. Auf Rang 17 steht >IAIN< mit 175 Token in K2 (0,02 %) versus acht in 155 K3 (0 %). Der korrespondierende Keyness-Wert beträgt 325,4 Keyness-Punkte. Auf Rang 18 steht >EURO< mit 211 Token in K2 (0,02 %) versus 25 in K3 (0 %) mit einem Keyness-Wert von 324,5. Die neue europäische Währung Euro wurde am 1.1.2002 in mehreren Ländern eingeführt. Die Type >LIB< (Rang 19) kommt in K2 ganze 249-mal vor (0,02 %) und in K3 nur 49-mal (0 %). Die dazugehörige Keyness-Zahl beträgt 320,6. Das Personalpronomen >HE< (Rang 20) kommt in K2 auf 7612 Token und in K3 auf 11 697. Der Keyness-Wert beträgt 316,7. Der Wert in K2 ist höher zu bewerten, da >HE< 0,75 % von K2 ausmacht gegenüber 0,58 % in K3. Rang 21 >PORTILLO< ist in K2 215-mal enthalten, das sind 0,02 %. In K3 hingegen sind es 33 Token (0 %), das ergibt 304,8 Keyness-Punkte. Der Name >CLARKE< (Rang 22) bringt es auf 460 Token in K2 (0,05 %) und 242 in K3 (0,01 %). Der Keyness-Wert beträgt 302,9. Die Genitivform >BLAIR’S< (Rang 23) kommt in K2 146-mal (0,01 %), in K3 zweimal vor (0 %), das ergibt einen Keyness-Wert von 301,3. Auf Rang 24 steht >WHO< mit 3927 Token in K2 (0,39 %) und 5463 in K3 (0,27 %), Keyness-Wert 295,4. Auf Rang 25 findet sich >FOOT< mit 249 Nennungen in K2 (0,02 %) und 59 in K3 (0 %), Keyness-Wert 294,2. Die Token >MOUTH< und >FOOT< stehen zum überwiegenden Teil für die Rinderkrankheit (>MOUTH AND FOOT DISEASE<), die im Erhebungszeitraum von K3 noch keine Rolle spielte. Es zeigt sich wie schon in der vorhergehenden Keyness-Liste, dass Namen in 2001 eine größere Schlüsselwortfunktion haben als in 1990. Neben >HER< und >SHE< gewinnen auch die Pronomina >I<, >HE< und >HIS< in K2 deutlich hinzu. Unter diesen 25 Einträgen befindet sich erneut keine Ortsbezeichnung. 6.4.3.4 Die Keyword-Liste von K3 mit K2 als Referenzkorpus Lassen wir Wordsmith die Keyword-Liste von K3 zu K2 erzeugen, so zeigt sich, dass die Begriffswelt außenpolitischer Themen überwiegt. Dazu zählen sowohl der Golfkrieg als auch die 156 Entwicklung in Osteuropa. Im Folgenden sind wieder die 25 höchsten Eingänge in die Liste aufgeführt. Das Range bewegt sich zwischen 289,2 und 1692,30 (Mittelwert: 450,1). N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 WORD FREQ. K3 2.370 SOVIET 1.577 IRAQ 1.228 KUWAIT 1.179 IRAQI PRESIDENT 2.447 984 GULF 13.581 MR 837 ARAB 805 MOSCOW 767 SAUDI 937 OIL COMMUNIST 698 570 SADDAM 144.181 THE 3.051 US 64.965 OF 479 EC 1.737 UNION 524 ARABIA 523 INVASION 1.345 MILITARY 1.828 EAST GORBACHOV 378 689 C 482 HONG K3 % 0,12 0,08 0,06 0,06 0,12 0,05 0,67 0,04 0,04 0,04 0,05 0,03 0,03 7,13 0,15 3,21 0,02 0,09 0,03 0,03 0,07 0,09 0,02 0,03 0,02 FREQ. K2 26 41 5 26 350 33 4.621 22 28 26 65 26 10 66.047 742 28.526 5 316 13 15 212 361 0 49 15 K2 % KEYNESS 1.692,30 1.692,30 986,5 941,6 762,2 0,03 644,2 579,2 0,46 543,7 522,3 469,1 450,1 421,2 399 383,1 6,54 373 0,07 354,9 2,82 348,1 343,6 0,03 339,5 331 320 0,02 317,2 0,04 315,3 306,4 305,8 289,2 Tab. 33: Die obersten 25 Typen der Keyword-Liste K3 zu K2 Diese Keyness-Liste zeigt deutlich, dass im Presse-Korpus K3 Ortsund Landesbezeichnungen überwiegen, die auf Krisenregionen und Machtzentren schließen lassen. Dazu gehören Typen wie >IRAQ<, >KUWAIT<, >GULF<, >ARABIA<, >HONG<, >EAST<. Spitzenreiter in der Liste ist >SOVIET< mit 2370 Token im Ausgangskorpus K3 (0,12 %) gegenüber nur 26 im Referenzkorpus K2 (0 %). Der Keyness-Wert beträgt 1692,30. Auf Rang zwei steht >IRAQ< mit 1577 in K3 (0,08 %) gegenüber nur 41 in K2 (0 %), obwohl der Irak als permanente Krisenregion bezeichnet werden kann. Die Type >IRAQ< erzielt damit 986,5 Keyness-Punkte. 157 Auf Rang drei folgt >KUWAIT< mit 1228 Token (0,06 %) in K3 versus fünf (0 %) in K2 und einem Keyness-Wert von 941,6. Auf Rang vier steht >IRAQI< mit 1179 Token in K3 (0,06 %) und 26 in K2 (0 %), das sind 762,2 Keyness-Punkte. Die Type >PRESIDENT< (Rang 5) erzielt 2447 Token in K3 (0,12 %) und 350 in K2 (0,03 %). Der Keyness-Wert beträgt 644,2. Der Begriff >GULF< (Rang 6) zählt 984 Token in K3 (0,05 %) gegenüber 33 in K2 (0 %), Keyness-Wert 579,2. Die Type >MR< (Rang 7) kommt 13 581-mal in K3 vor (0,67 %), 4621-mal in K2 (0,46 %), das ergibt 543,7 Keyness-Punkte. Rang 8 >ARAB< findet sich in K3 837-mal (0,04 %), in K2 22-mal (0 %), der Keyness-Wert beträgt 522,3. Auf Rang neun befindet sich der Städtename >MOSCOW<. Er kommt in K3 805-mal vor (0,04 %), in K2 28-mal (0 %). Der Keyness-Wert beträgt 469,1. Auf Rang zehn steht >SAUDI< mit 767 Token (0,04 %) in K3 und 26 in K2 (0 %). Das erzeugt 450 Keyness-Punkte. Die Type >OIL< steht auf Rang elf, sie erreicht 937 Token in K3 (0,05 %) und 65 in K2 (0 %). Das sind 421,2 Keyness-Punkte. Rang 12 >COMMUNIST< erfährt 698 Nennungen in K3 (0,03 %) und 26 in K2 (0 %), wodurch 399 Keyness-Punkte erzeugt werden. >SADDAM< (Rang 13) kommt auf 570 Token in K3 (0,03 %) gegenüber nur 10 in K2 (0 %). Daraus ergeben sich 381,1 KeynessPunkte. >SADDAM< ist damit der wichtigste Name in dieser Keyness-Konstellation. Der bestimmte Artikel >THE< ist auf Rang 14 der Keyword-Liste zu finden. Er kommt 144 181-mal in K3 vor (7,13 %) und 66 047-mal in K2 (6,54 %). Der Keyness-Wert beträgt 373. Die Type >US< erzielt 3051 Token in K3 und 742 in K2 (0,07 %). Wir müssen wieder berücksichtigen, dass >US< sowohl als Pronomen als auch als Kürzel für United States stehen kann. Der Keyness-Wert beträgt 354,9. Rang 16 >OF< ist 64 965-mal in K3 enthalten (3,21 %) und 28 526mal in K2 (2,82 %), der Keyness-Wert beträgt 348,1. Die Abkürzung >EC< (Rang 17) erfährt 479 Nennungen in K3 (0,02 %) und fünf in K2 (0 %), Keyness-Wert 343,6. Die Type >UNION< mit 1737 Token in K3 (0,09 %) und 316 in K2 (0,03 %) erzielt 339,5 Keyness-Punkte (Rang 18). Die Type >ARABIA< (Rang 19) erzielt mit 524 Token (0,03 %) in K3 versus 158 13 in K2 (0 %) 331 Keyness-Punkte. >INVASION< (Rang 20) erzielt mit 523 Token (0,03 %) in K3 und 15 in K2 (0 %) 320 KeynessPunkte. Das resultiert ebenfalls aus der Tatsache, dass der Irak am 2.8.1990 den Nachbarstaat Kuwait angriff. Rang 21 >MILITARY< erzielt in K3 1345 Token (0,07 %) gegenüber 212 in K2 (0,02 %), der von Wordsmith errechnete Keyness-Wert beträgt 317,2. Auf Rang 22 finden wir >EAST< mit 1828 Token in K3 (0,09 %) gegenüber 361 in K2 (0,04 %). >EAST< erreicht somit 315,3 Keyness-Punkte. Der Ost-West-Konflikt befand sich damals in der Endphase, die Sowjetunion löste sich am 12.12.1991 auf. Auf Rang 23 finden wir >GORBACHOV< mit 378 Token in K3 (0,02 %) und keiner Nennung in K2. Der Keyness-Wert beträgt 306,4. Auf Rang 24 finden wir die Abkürzung >C< als Type. Diese kommt in K3 689-mal vor (0,03 %) und in K2 nur 49-mal (0 %). >C< erreicht damit 305,8 Keyness-Punkte.24 In dieser Liste befinden sich lediglich zwei Namen: >SADDAM< und >GORBACHOV<. Dies ist ein weiterer Beleg dafür, dass Namen 2001 stärker im Mittelpunkt standen als 1990. 6.4.3.5 Die Keyword-Liste von (K1 + K2) mit K3 als Referenzkorpus Für die folgenden Keyness-Analysen wurden die Korpora K1 und K2 zu einem Korpus zusammengefasst (K1 + K2) und mit K3 verglichen. Beide Listen (K1 + K2) zu K3 und zweitens K3 zu (K1 + K2) sind deutlich von den jeweiligen Hauptereignissen geprägt. Im Folgenden sind die obersten 25 Analyseergebnisse aufgeführt: 24 In den meisten Fällen steht diese Abkürzung >C< für >CONSERVATIVE PARTY<. Die Abkürzung wurde sehr häufig im Rahmen der landesweiten Abstimmung zum Thema Abtreibung verwendet, als die Ergebnisse in den Zeitungen veröffentlicht wurden. Andere Verwendungen sind z.B. >HEPATITIS C<, >CLASS C DRUG< und >C$< (Canadian dollars). 159 N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 WORD FREQ. K1/K2 1.353 BLAIR 955 BIN AFGHANISTAN 1.150 759 TALEBAN 721 TALIBAN 5.592 I 762 LADEN 4.173 SHE 682 DUNCAN 4.206 HER 10.419 HIS 402 EU 741 TONY 537 ASYLUM 361 OSAMA 1.006 ATTACKS 373 ANTHRAX 459 HAGUE 738 TERRORIST TERRORISM 589 318 BLAIR'S 337 SEEKERS 15.002 HE 741 SMITH 5.772 WE K1/K2 % 0,07 0,05 0,06 0,04 0,04 0,28 0,04 0,21 0,03 0,21 0,52 0,02 0,04 0,03 0,02 0,05 0,02 0,02 0,04 0,03 0,02 0,02 0,74 0,04 0,29 FREQ. K3 23 14 61 0 0 2.747 14 2.037 31 2.144 7.132 0 111 37 0 248 4 28 145 82 2 6 11.697 164 3.852 K3.TXT % KEYNESS 1.674,70 1.197,50 1.196,10 1.052,60 999,9 0,14 993,5 936 0,1 751,9 733,8 0,11 683,7 0,35 623,2 557,5 522,1 521,5 500,6 0,01 491,6 478,5 461 435,7 432,2 419,5 415,2 0,58 414,2 398,4 0,19 387,3 Tab. 34: Die obersten 25 Typen der Keyword-Liste (K1 + K2) zu K3 In dieser Keynessliste zeigt sich, dass der 11. September im zusammengefassten Korpus K1+K2 eine prägende Rolle spielt, auch wenn die innenpolitischen Themen vor 9/11 statistisch mitberücksichtigt wurden. In diesem Hauptvergleich 2001 versus 1990 wird deutlich, dass die Namen politischer Akteure am Anfang des neuen Jahrtausends eine andere Rolle in den analysierten Printmedien spielen als noch zehn Jahre zuvor. In der Keyness-Liste finden wir neun Namen. Das ist ein deutlicher Beleg für eine zunehmende Boulevardisierung. Das Range bewegt sich zwischen 387,3 und 1.674,70 (Mittelwert: 683,7). Die Schlüsselwörter sind von allen durchgeführten KeynessAnalysen in diesem Vergleich am höchsten bewertet. Auffällig ist ferner die hohe Zahl an Subjekt- und Objekt-Pronomina zugunsten von K1+K2 ( >I<, >SHE<, >HER<, >HIS<, >HE<, >WE<) unter den obersten 25 Einträgen. Die Verwendung von Pronomina in 160 Zeitungstexten lässt Referenz entstehen und gilt in der funktionalen Grammatik als Kohärenzphänomen (Thompson 2004, S.191). Offensichtlich geschieht dieses 2001 stärker als noch 1990. Auf Rang eins der Liste finden wir erneut den Namen >BLAIR< mit 1353 Token im Ausgangskorpus K1+K2 (0,07 %) versus 23 im Referenzkorpus K3 (0 %). Der Keyness-Wert beträgt 1674,70 Punkte. Auf Rang zwei finden wir >BIN< mit 955 Token in K1+K2 (0,05 %) versus 14 Token (0 %) in K3. Der Keyness-Wert für >BIN< beträgt 1197,50. Auf Rang drei steht >AFGHANISTAN< mit 1150 Token in K1+K2 (0,06 %) gegenüber 61 in K3 (0 %), Keyness-Wert 1196,10. Rang vier nimmt >TALEBAN< ein. Diese Type erreicht 759 Token in K1+K2 (0,04 %) gegenüber Null Token in K3. Der Keyness-Wert beträgt 1052,60. Die Type >TALIBAN< (Rang fünf) erhält in der Wordsmith-Zählung 721 Token in K1+K2 (0,04 %) gegenüber Null Token in K3. Der Keyness-Wert für >TALIBAN< beträgt 999,9 Punkte. Auch hier zeigt sich, dass >TALIBAN< das wichtigste Keyword gewesen wäre, hätte es nur eine Schreibweise gegeben. Die Type >I<, auf Rang sechs stehend, zählt 5592 Token in K1+K2 (0,28 %) gegenüber 2747 in K3. Das Personalpronomen >I< erhält damit 993,5 Keyness-Punkte. Rang sieben >LADEN< erzielt in K1+K2 762 Token (0,04 %), in K3 nur 14 (0 %). Der Keyness-Wert beträgt 936 Punkte. Auf Rang acht finden wir das SubjektPersonalpronomen >SHE< mit 4173 Token in K1+K2 (0,21 %) versus 2037 in K3 (0,10 %), dadurch werden 751,9 Keyness-Punkte erreicht. Der Name >DUNCAN< erzielt 682 Token in K1+K2 (0,03 %) versus 31 (0 %) in K3 mit einem Keyness-Wert von 733,8. Die Werte für >HER< (Rang zehn) verteilen sich zu 4206 Token (0,21 %) auf K1+K2 und zu 2144 Token auf K3 (0,11 %). Der von Wordsmith erzeugte Keyness-Wert beträgt 683,7 Punkte. Rang elf >HIS< zählt 10 419 Token in K1+K2 (0,52 %) und 7132 in K3 (0,35 %). Das ergibt 623,2 Keyness-Punkte. Das Kürzel >EU< auf Rang 12 erhält 402 Token in K1+K2 (0,02 %) gegenüber null Token in K3. Der Keyness-Wert beträgt 557,5. Der Vorname >TONY< erzielt mit 741 Token in K1+K2 (0,04 %) und 111 in K3 (0 %) 522,1 Keyness-Punkte und steht damit auf Rang 13 der Liste. Rang 14 >ASYLUM< erfährt 537 Nennungen in K1+K2 (0,03 %) versus 37 (0 %) in K3, Keyness-Wert 521,5. Rang 15 >OSAMA< zählt 361 Token in K1+K2 (0,02 %) versus Null Token 161 in K3. Der Keyness-Wert beträgt 500,6. >ATTACKS< (Rang 16) bringt es auf 1006 Token in K1+K2 (0,05 %) bzw. 248 (0,01 %) in K3. >ATTACKS< erzielt dadurch 491,6 Keyness-Punkte. Rang 17 >ANTHRAX< erfährt 373 Nennungen in K1+K2 (0,02 %) gegenüber vier (0 %) in K3. Daraus werden 478,1 Keyness-Punkte errechnet. Rang 18 >HAGUE< mit 459 Token in K1+K2 (0,02 %) und 28 in K3 (0 %) erzielt 461 Keyness-Punkte. Die Type >TERRORIST< erzielt 738 Token in K1+K2 (0,04 %) und 145 Token (0 %) in K3. >TERRORIST< erzielt 435,7 Keyness-Punkte. Rang 20 >TERRORISM< zählt 589 Token in K1+K2 (0,03 %) und 82 in K3 (0 %). Der Keyness-Wert beträgt 432,2. Die Type >BLAIR’S< kommt auf 318 Token in K1+K2 (0,02 %) und 2 (0 %) in K3. Der Keyness-Wert zählt 419,5 Punkte, so dass >BLAIR’S< Rang 21 einnimmt. Die Type >SEEKERS< erfährt in K1+K2 337 Nennungen (0,02 %), in K3 sind es sechs (0 %). Die 415,2 KeynessPunkte setzen diese Type auf Rang 22. Das Personalpronomen >HE< erzielt 15 002 Token in K1+K2 (0,74 %), jedoch nur 11 697 (0,58 %) in K3. Ein Keyness-Wert von 414,2 setzt >HE< auf Rang 23. Rang 24 >SMITH< erhält 741 Token in K1+K2 (0,04 %), jedoch 164 (0 %) in K3, Keyness-Wert 398,4. Rang 25 >WE< hat in K1+K2 5772 Token (0,29 %), in K3 hingegen 3852 (0,19 %). Der KeynessWert beträgt 387,3. Zu den wichtigsten Sachthemen, die hier anhand der Schlüsselwörter repräsentiert sind, zählen der 11. September, „Asylum Seekers“, die Unterhauswahlen 2001 und die EU. 6.4.3.6 Die Keyword-Liste von K3 mit (K1 + K2) als Referenzkorpus Die folgende Liste K3 zu (K1 + K2), die wieder aus 25 Typen besteht, hat ein Range, das sich zwischen 419,8 und 2.327,00 (Mittelwert: 636,9) bewegt. Auch in dieser Liste ist es zu keiner Verzerrung aufgrund von unterschiedlichen Größenverhältnissen gekommen, sowohl K3 als auch K1 + K2 haben eine Korpusgröße von rund zwei Millionen Wörtern. Die Schwerpunkte in dieser Auswertung sind erneut unterschiedlich gelagert, die Hauptereignisse von K1 und K2 werden gemeinsam 162 betrachtet. Diese Konstellation hebt hervor, welche Schlüsselwörter im Korpus von 1990 im Vergleich zum zusammengefassten Referenzkkorpus von 2001 enthalten sind. N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 WORD SOVIET KUWAIT IRAQ IRAQI MR GULF POUNDS COMMUNIST UNION OIL MOSCOW PRESIDENT EC SADDAM GORBACHOV EAST C CENT HONG PER ARAB INVASION THE KONG AGED FREQ. K3 2.370 1.228 1.577 1.179 13.581 984 2.836 698 1.737 937 805 2.447 479 570 378 1.828 689 3.086 482 3.230 837 523 144.181 446 1.033 K3 % 0,12 0,06 0,08 0,06 0,67 0,05 0,14 0,03 0,09 0,05 0,04 0,12 0,02 0,03 0,02 0,09 0,03 0,15 0,02 0,16 0,04 0,03 7,13 0,02 0,05 FREQ. K1/K2 K1/K2 % 157 30 164 65 9.162 0,45 127 1.144 0,06 48 546 0,03 149 102 1.038 0,05 11 45 0 704 0,03 93 1.568 0,08 28 1.704 0,08 181 52 133.371 6,6 28 304 0,02 KEYNESS 2.327,00 1.460,40 1.326,60 1.214,20 867,2 750,2 742,8 677,8 653 636,9 619,4 586,2 573,9 530,5 523,9 516,7 513,4 504,3 489,9 479,8 458,2 447,9 447,7 444,2 419,8 Tab. 35: Die obersten 25 Typen der Keyword-Liste K3 zu (K1 + K2) Es zeigt sich, dass K3 auch in dieser Keyness-Konstellation eindeutig von außenpolitischen Themen wie Hongkong, der Abstieg der Sowjetunion und der Invasion Kuwaits geprägt ist. Die Liste beinhaltet die folgenden Ergebnisse: Mit großem Vorsprung auf Rang eins steht die Type >SOVIET< mit dem höchsten Keyness-Wert aller für diese Dissertation durchgeführten Analysen. >SOVIET< kommt im Ausgangskorpus K3 auf 2370 Token (0,12 %). Im Referenzkorpus K1+K2 sind es 157 Token (0 %). Der errechnete Keyness-Wert beträgt 2327,0 Punkte. Rang zwei >KUWAIT< erzielt 1228 Token in K3 (0,06 %), in K1+K2 sind es 30 Token (0 %), Keyness-Wert 1460,40. Auf Rang drei finden wir >IRAQ< mit 1577 Token in K3 (0,08 %), aber nur 163 164 in K1+K2 (0 %). Der Keyness-Wert für >IRAQ< beträgt 1326,60. Auf Rang vier finden wir >IRAQI< mit 1179 Token (0,06 %) in K3 gegenüber 65 in K1+K2 (0 %), Keyness-Wert 1214,20. Die Type >MR< erzielt 13 581 Token in K3 (0,67 %), jedoch 9162 in K1+K2 (0,45 %). Der Keyness-Wert beträgt 867,2 Punkte (siehe 6.2.3 Naming Strategies). Die Type >GULF< (Rang 6) zählt 984 Token in K3 (0,05 %) gegenüber 127 in K1+K2 (0 %), Keyness-Wert: 750,2. Rang sieben >POUNDS< erhält 2836 (0,14 %) versus 1144 Token (0,06 %) und dadurch 742,8 Keyness-Punkte. Die britische Währung ist damit 2001 weniger als halb so stark im Gespräch wie noch 1990. Die Type >COMMUNIST< (Rang acht) erzielt 698 Token in K3 (0,03 %) gegenüber nur 48 in K1+K2 (0 %). Der Keyness-Wert für >COMMUNIST< beträgt 677,8. Die Type >UNION< (Rang neun) schafft es auf 1737 Token im Hauptkorpus von 1990 K3 (0,09 %) gegenüber 546 (0,03 %) in den beiden Korpora von 2001 K1+K2 (Keyness-Wert 653). Die Type >UNION< ist häufig Bestandteil von >SOVIET UNION<. Rang zehn >OIL< erzielt 937 Token in K3 (0,05 %) gegenüber 149 in K1+K2 (0 %). Der Keyness-Wert für >OIL< beträgt 636,9. Aufgrund der Kuwait-Krise wurde 1990 häufiger die Ölversorgung thematisiert. Der Städtename >MOSCOW< (Rang elf) zählt 805 Token in K3 (0,04 %) gegenüber 102 in K1+K2 (0 %). Das ergibt 619,4 KeynessPunkte. Trotz des Falls des Eisernen Vorhangs 1989 und dem damit verbundenen Machtverlust steht die Stadt Moskau 1990 immer noch im Fokus der Berichterstattung, und das deutlich stärker als 2001. Nummer 12 >PRESIDENT< findet sich 2447-mal in K3 (0,12 %) jedoch nur 1038-mal in K1+K2 (0,05 %). Das sind 586,2 KeynessPunkte. Auf Rang 13 steht >EC< mit 479 Token in K3 (0,02 %) versus 11 Token in K1+K2 (0 %). Das Kürzel der European Community ist demnach ungebräuchlich geworden. Der KeynessWert beträgt 573,9. Rang 14 >SADDAM< zählt 570 Token in K3 (0,03 %), jedoch nur 45 (0 %) in K1+K2 (Keyness-Wert 530,5). Rang 15 >GORBACHOV< erreicht mit 378 Token in K3 (0,02 %) und keiner Nennung in K1+K2 letztendlich 523,9 Keyness-Punkte. Die Type >EAST<, häufig synonym verwendet für das alte Osteuropa, ist Schlüsselwort Nummer 16. Es kommt 1828-mal in K3 164 vor (0,09 %), aber nur 704-mal im gleichgroßen Referenzkorpus K1+K2 (0,03 %). Der von Wordsmith errechnete Keyness-Wert beträgt 516,7 %. Auf Rang 17 steht die Abkürzung >C< mit 689 Nennungen in K3 (0,03 %) und 93 in K1+K2 (0 %). Der KeynessWert für diese Konstellation beträgt 513,4. Die Type >CENT< zählt 3086 Token in K3 (0,15 %), aber 1568 in K1+K2 (0,08 %). Die Verwendung dieser Type hat sich nahezu halbiert. Der Keyness-Wert von >CENT< beträgt 504,3 (s.u.). Die Type >HONG<, Bestandteil des Städtenamens Hong Kong, ist in K3 482-mal vorhanden (0,02 %), in K1+K2 jedoch nur 28-mal (0 %), so dass ein Keyness-Wert von 489,9 Punkten entsteht. Die Type >PER< erhält 3230 Token in K3 (0,16 %) jedoch nur 1704 in K1+K2 (0,08 %). Das ergibt einen Keyness-Wert von 479,8. Die Verhältnisse sind ähnlich wie bei >CENT<. Ein Blick in die Konkordanzlisten ergab, dass 1990 noch doppelt so häufig mit Prozentwerten operiert wurde als in 2001, obwohl in K3 über keine nationalen Wahlen berichtet wurde.25 Das lässt sich durch die zunehmend isolierte Verwendung von Infografiken erklären (Lilienthal 1998, S. 116), die als selbsterklärend vorausgesetzt werden. Rang 21 >ARAB< mit 837 Token in K3 (0,04 %) und 181 im Referenzkorpus K1+K2 (0 %) erzielt 458,2 Keyness-Punkte. Der Begriff >INVASION< zählt 523 Token in K3 (0,03 %) und 52 in K1+K2 (0 %). Der Keyness-Wert beträgt 447,9. >THE< (Rang 23) erzielt 144 181 Nennungen in K3 (7,13 %) versus 133 371 in K1+K2 (6,6 %). Der daraus erzeugte Keyness-Wert beträgt 447,7 Punkte. Für >KONG< (Rang 24) sind in K3 insgesamt 446 Nennungen zu verzeichnen (0,02 %) in K1+K2 jedoch nur 28 (0 %).26 Der KeynessWert beträgt 444,2. Auf Rang 25 befindet sich das Schlüsselwort >AGED< mit 1033 Token in K3 (0,05 %) versus 304 Token in K1+K2 (0,02 %). Der dazugehörige Keyness-Wert beträgt 419,8. Das Alter von Personen wurde 1990 deutlich häufiger erwähnt, in vielen Fällen als Bestandteil von Nominalphrasen-Appositionen, abgetrennt durch Kommata hinter dem Namen. 25 Tatsächlich kommt >PER CENT< in K3 3022 mal vor, in K1+K2 jedoch nur 739+823= 1562 mal. Das Prozentzeichen >%< findet sich hingegen nur 27-mal in K3, aber 524-mal in K2 und 287-mal in K1. 26 Die Werte für >HONG KONG< betragen 13+15 Nennungen in K1+K2 und 477 in K3. Die Differenz aus den Zählungen für >HONG< und >KONG< resultiert daraus, dass die Genitiv-Formen, >KONG’S< (35 Token), gesondert aufgelistet werden. 165 Es zeigt sich, dass 1990 die Reformen in Osteuropa, die Kuwaitkrise und die Ausgliederung Hong Kongs aus dem „British Empire“ zu den prägenden Ereignissen zählten. Als Ergebnis der sechs oben aufgeführten Keyness-Listen können wir festhalten, dass 1990 deutlich mehr Ortsbezeichnungen als Schlüsselbegriffe fungierten. In dem Korpus von 2001 waren es hingegen vorrangig die Nach- und Vornamen von Personen des politischen Geschehens, aber auch Pronomina. Diese Tatsache konnte nicht durch den Einfluss des 11. September abgeändert werden, auch wenn Ortsbezeichnungen wie >AFGHANISTAN<, >KABUL<, >PAKISTAN<, >KANDAHAR< eine Hochkonjunktur erlebten. 6.4.4 Weitere Schlüsselwörter im Zusammenhang mit dem 11. September 2001 Im Rahmen dieser Keyness-Analysen bestand die Möglichkeit, die einzelnen Subkorpora miteinander zu vergleichen, ebenso einzelne Subkorpora mit einem Hauptkorpus als Referenzkorpus. Um weitere Schlüsselbegriffe im Zusammenhang mit dem 11. September ausfindig zu machen, wurden im Folgenden die drei Subkorpora, die eine Zeitphase nach dem 11. September markieren, als Ausgangskorpora verwendet, um einen Direktvergleich mit K2 als Referenzkorpus zu ermöglichen. Wir müssen bei diesen drei Einzelanalysen zwar berücksichtigen, dass jedes der drei Subkorpora die Artikel einer eigenständigen Zeitung beinhaltet, doch diese sind von den jeweiligen Hauptereignissen gleichermaßen abhängig und den Informationen, die von den Nachrichtenagenturen für alle Zeitungen angeboten werden. 6.4.4.1 Times.2001.danach mit K2 als Referenzkorpus Zunächst die Keyword-Liste, die vom Subkorpus Times.2001.danach mit dem Referenzkorpus K2 erstellt wurde. Die in dieser Liste aufgeführten Schlüsselwörter stehen für die ersten sechs Wochen Zeitungsberichterstattung von The Times nach dem 11. September vom 12.9. bis zum 24.10.2001: 166 N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 WORD FREQ. 749 TALEBAN 619 BIN AFGHANISTAN 628 493 LADEN TERRORISM 363 435 TERRORIST 498 ATTACKS 250 ANTHRAX 1.026 US 208 OSAMA 185 KABUL 195 AFGHAN 206 PAKISTAN 462 MILITARY 457 AMERICAN 243 AL 575 WAR 335 AMERICA 138 QAEDA TERRORISTS 206 220 ALLIANCE 122 LADEN'S 287 BUSH 215 AIRCRAFT 354 FORCES Times.% 0,15 0,13 0,13 0,1 0,07 0,09 0,1 0,05 0,21 0,04 0,04 0,04 0,04 0,09 0,09 0,05 0,12 0,07 0,03 0,04 0,04 0,02 0,06 0,04 0,07 FREQ. 0 6 9 4 18 62 149 5 742 0 0 3 15 212 226 44 365 124 0 33 47 0 108 54 179 K2.TXT % KEYNESS 1.667,90 1.315,40 1.311,00 1.054,30 677,5 643,8 0,01 529,2 511,3 0,07 470,4 463 411,8 405,4 360,9 0,02 358,1 0,02 330,3 330,1 0,04 315,1 0,01 309 307,2 293 278,7 271,6 0,01 261,5 251,9 0,02 250,3 Tab. 36: Keyword-Liste Times.2001.danach zu K2 In diesem Korpusvergleich wird deutlich, dass während der Berichterstattung in den Wochen nach 9/11 keine Themenvielfalt gegeben war: ausnahmslos alle 25 Schlüsselbegriffe stehen im Zusammenhang mit dem 11. September. Das Range der 25 Keyness-Werte beträgt 250,3 – 1667,90 Punkte (Mittelwert: 436). Auf Rang eins steht die Form >TALEBAN< mit 749 Token im Ausgangskorpus Times.2001.danach (0,15 %) und keiner Nennung im Referenzkorpus K2. Der Keyness-Wert ist mit 1667,90 Punkten der höchste dieser Konstellation. Diese Tatsache scheint ein Hinweis auf den überstürzten Versuch zu sein, ein neues Feindbild aufzubauen (siehe: Kleinsteuber 2003, S.218). Weitere Schlüsselbegriffe unterstützen diese Behauptung. Auf Rang zwei finden wir >BIN<. Diese Type zählt 619 Token in 167 Times.2001.danach (0,13 %), jedoch nur sechs in K2 (0 %), so dass ein Keyness-Wert von 1315,40 entsteht.27 Rang drei >AFGHANISTAN< zählt 628 Token in Times.2001.danach, jedoch nur neun in K2 (0 %). Der Keyness-Wert beträgt 1311,00. Die Type >TERRORISM< (Rang 5) erfährt 363 Nennungen in Times.2001.danach (0,07 %), auf der anderen Seite nur 18 in K2 (0 %). Das ergibt 677,5 Keyness-Punkte. Rang sechs >TERRORIST< zählt im ersten Subkorpus nach den Terroranschlägen von New York Times.2001.danach 435 Token (0,09 %) gegenüber 62 (0 %) in K2. Rang sieben >ATTACKS< zählt 498 Token im The Times-Subkorpus (0,10 %) und 149 (0,01 %) im Hauptkorpus K2. Das ergibt einen Keyness-Wert von 529,2 Punkten. Rang acht >ANTHRAX< erzielt 250 Token in Times.2001.danach (0,05 %), jedoch nur fünf in K2 (0 %). Der Keyness-Wert beträgt 511,3 Punkte. Die Type erzielt im Subkorpus von The Times ihr Maximum. In den Wochen nach 9/11 sind tatsächlich mehrere Anthrax-Anschläge verübt worden. Listeneintrag Nummer neun >US< erzielt 1026 Token (0,21 %) in Times.2001.danach, auf der anderen Seite nur 742 Token (0,07 %) im doppelt so großen Hauptkorpus K2. >US< erhält dadurch einen Keyness-Wert von 470,4. Rang zehn >OSAMA< kommt in Times.2001.danach 208-mal vor (0,04 %), in K2 gibt es diese Type nicht (463 Keyness-Punkte). Der Städtename >KABUL< erreicht eine Tokenzahl von 185 in Times.2001.danach (0,04 %) und Null in K2 (Keyness-Wert 411,8). Rang 12 >AFGHAN< kommt auf 195 Token im The TimesSubkorpus Times.2001.danach (0,04 %) und auf drei Token in K2 (0 %). Der Keyness-Wert für >AFGHAN< beträgt 405,4. Rang 13 >PAKISTAN< kommt auf 206 Token in Times.2001.danach (0,04 %) und 15 Token (0 %) in K2. Der Keyness-Wert beträgt 360,9. Den Ländern Pakistan und Afghanistan wurde eine Teilschuld an den Hergängen angelastet. Die Type >MILITARY< (Rang 14) erzielt 462 Token im Subkorpus (0,09 %) und 212 (0,02 %) in K2. Der Keyness-Wert beträgt 358,1. Für >AMERICAN< ergeben sich 457 und 0,09 % (Times.2001.danach) sowie 226 und 0,02 % (K2) bei einem 27 Die Kollokationen in den sechs Fällen sind >BIN BAG<, >BIN TO<, >BIN THERE<, >IN THE BIN<, >MOHAMMAD BIN RASHID< und >WHEELIE BIN<. 168 Keyness-Wert von 330,3. Die Type >AL< umfasst 243 Token in dem rund 500 000 Wörter starken Subkorpus (0,05 %), jedoch nur 44 Token im circa eine Mio. starken Hauptkorpus K2. Der Keyness-Wert für >AL<, den arabischen Artikel, beträgt 330,1. Die Type >WAR<, 575 Token (0,12 %) in Times.2001.danach gegenüber 365 Token (0,04 %) in K2, erzielt 315,1 Keyness-Punkte. Die Type >AMERICA< mit 335 Token (0,07 %) in Times.2001.danach und 124 (0,01 %) in K2 kommt auf einen Keyness-Wert von 309. Es ist das einzige Mal, dass >AMERICA< unter die obersten 25 Ränge einer Keyness-Liste gelangt. Die Type >QAEDA< erfährt 138 Nennungen (0,03 %) in Times.2001.danach gegenüber Null Token in K2 (Keyness-Wert 307,2). Die zuvor unbekannte Terrororganisation wurde zum ersten Mal am 20.09.2001 von George Bush namentlich genannt. >TERRORISTS<, zu 206 Token (0,04 %) in Times.2001.danach enthalten vs. 33 Token in K2 (0 %), erzielt 293 Keyness-Punkte. Für die Type >ALLIANCE< auf Rang 21 finden wir 220 Token im Subkorpus von The Times von 2001 (danach), aber nur 47 Token (0 %) im Hauptkorpus (2001 vor 9/11). Wir erhalten 278,7 KeynessPunkte. Die Type >LADEN’S< (Rang 22) wird 122-mal für Times.2001.danach aufgezählt (0,02 %), für K2 keinmal. Wordsmith errechnet einen Keyness-Wert von 271,6. Für >BUSH< sind 287 Token in Times.2001.danach zu verzeichnen (0,06 %), in K2 sind es 108 Token (0,01 %). Das ergibt einen Keyness-Wert von 261,5 (Rang 23). >AIRCRAFT< erzielt 215 Token in Times.2001.danach (0,04 %) jedoch nur auf 54 (0 %) in K2. Der Keyness-Wert für >AIRCRAFT< beträgt 251,9. Auf Rang 25 der Liste steht >FORCES< (354 Token bei 0,07 % in Times.2001.danach gegenüber 179 Token bei 0,02 % in K2). Diese Type erzielt 250,3 Keyness-Punkte. Es sind nur zwei Personen namentlich unter den obersten 25 Einträgen zu finden: Osama Bin Laden und Bush. Es fällt ferner auf, dass weder die Type >NEW< noch >YORK< unter den Schlüsselwörtern zu finden sind. 169 6.4.4.2 Guardian.2001.danach mit K2 als Referenzkorpus Im Folgenden betrachten wir das zweite Zeitintervall vom 25.10.2001 bis zum 9.11.2001. Es handelt sich um das Subkorpus Guardian.2001.danach, das mit dem Hauptkorpus K2 verglichen wurde. Das Range der gewonnenen 25 Keyness-Werte reicht von 109,5 – 1264,30 (Mittelwert: 255,2). N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 WORD FREQ. GUARD~% FREQ. K2.TXT % 390 0,16 1 TALIBAN 0,12 9 AFGHANISTAN 304 169 0,07 6 BIN 607 0,25 742 0,07 US 135 0,06 4 LADEN 100 0,04 0 QAIDA 159 0,07 47 ALLIANCE 155 0,06 44 AL 154 0,06 58 BOMBING 0,04 18 TERRORISM 107 85 0,03 3 AFGHAN 76 0,03 0 OSAMA 87 0,04 5 ANTHRAX 72 0,03 0 KABUL 90 0,04 15 PAKISTAN 127 0,05 62 TERRORIST 204 0,08 212 0,02 MILITARY 0,07 155 0,02 SEPTEMBER 173 166 0,07 149 0,01 ATTACKS 254 0,1 365 0,04 WAR 162 0,07 179 0,02 FORCES 127 0,05 115 0,01 TROOPS 39 0,02 0 MAZAR 0,03 33 TERRORISTS 71 75 0,03 43 MUSLIM KEYNESS 1.264,30 918,2 503,9 453 407,7 327,6 319,9 316,5 280,7 255,2 253,5 248,9 248,3 235,8 215,2 203,6 183,4 180 172,4 151,7 136,2 130,8 127,7 116,9 109,5 Tab. 37: Keyword-Liste Guardian.2001.danach zu K2 Anhand dieser Liste wird deutlich, dass die Berichterstattung über 9/11 bereits in die nächste Phase übergegangen ist. Die Themenvielfalt ist offensichtlich immer noch stark eingeschränkt, auch in diesem Subkorpus geht es um die neuen Feindbilder: Im Gegensatz zur vorherigen Keyness-Analyse steht hier eine Schreibvariante von >TALEBAN<, nämlich >TALIBAN<, an erster Stelle. Die Type >TALIBAN< kommt im Ausgangskorpus Guardian.2001.danach 390-mal vor (0,16 %), in K2 hingegen nur einmal (0 %). Der Keyness-Wert beträgt 1264,30. Auf Rang zwei 170 folgt >AFGHANISTAN< mit 304 Token (0,12 %) in Guardian.2001.danach und neun Token (0 %) in K2. >AFGHANISTAN< ist etwas schwächer vertreten als zuvor im doppelt so großen Subkorpus von The Times. Der Keyness-Wert beträgt 918,2 Punkte. Rang drei >BIN< erreicht in Guardian.2001.danach 169 Token (0,07 %) in K2 hingegen nur sechs (0 %). Der Keyness-Wert beträgt 503,9. Auf Rang vier steht >US<. Diese Type erreicht in Guardian.2001.danach 607 Token (0,25 %). In K2 sind es zwar 742 Token (0,07 %), jedoch ist K2 mit rund einer Mio. Wörtern viermal so groß wie das verwendete The Guardian-Subkorpus. Der KeynessWert beträgt 453 Punkte. Rang fünf >LADEN< erzielt in Guardian.2001.danach 135 Token (0,06 %), in K2 hingegen nur vier (0 %). Der Keyness-Wert beträgt 407,7. Auf Rang sechs finden wir >QAIDA<, eine Schreibvariante des im vorherigen Abschnitt abgehandelten >QAEDA<. Die Type >QAIDA< erzielt 100 Token in Guardian.2001.danach (0,04 %). In K2 existiert dazu kein Token. Der Keyness-Wert beträgt 327,6. Rang sieben >ALLIANCE< erhält 159 Token (0,07 %) im Ausgangskorpus Guardian.2001.danach gegenüber 47 Token (0 %) in K2. Das macht 319,9 Keyness-Punkte. Die Type >AL< (Rang acht) hat 155 Token in Guardian.2001.danach zu verzeichnen (0,06 %), auf der anderen Seite nur 44 Token (0 %) in K2. Der Keyness-Wert für >AL< beträgt 316,5. >BOMBING< (Rang neun) schafft es auf 154 Token im Subkorpus von The Guardian (0,06 %) gegenüber 58 (0 %) in K2. Der KeynessWert beträgt 280,7. Nummer 10 >TERRORISM< erzielt 107 Token im The Guardian-Subkorpus (0,04 %) versus 18 in K2 (0 %). Der Keyness-Wert beträgt 255,2. Die fallende Tendenz gegenüber der vorhergehenden Analyse (6.4.4.1.) belegt ein Abklingen der Anfangspanik (siehe auch Werte für >TERRORIST< und >TERRORISTS<). >AFGHAN< steht in dieser Liste auf Rang 11. Es sind 85 Token (0,03 %) im Subkorpus gegenüber drei in K2 (0 %). Der KeynessWert beträgt 253,5. Für den arabischen Vornamen >OSAMA< (Rang 12) sind 76 Nennungen in Guardian.2001.danach zu verzeichnen (0,03 %). In K2 hingegen ist die Type nicht vorhanden. Es entsteht ein Keyness-Wert von 248,9. 171 Rang 13 >ANTHRAX< ist in dieser Liste nicht mehr so stark vertreten wie in der Keyness-Liste von Times.2001.danach mit K2 als Referenzkorpus (s.o.). >ANTHRAX< erzielt in Guardian.2001.danach 87 Token (0,04 %), in K2 hingegen nur fünf (0 %). Der Keyness-Wert beträgt hier 248,3 Punkte. In der Liste von Times.2001.danach mit dem Referenzkorpus K2 waren es noch 511.3 Keyness-Punkte. In der letzten Liste dieser Untersuchung (Independent.2001.danach zu K2) ist >ANTHRAX< nicht mehr unter den obersten 25 Einträgen zu finden. Die aktuelle Liste zeigt auf Rang 14 >KABUL<. Diese Type zählt 72 Token in Guardian.2001.danach (0,03 %) und Null Token in K2. Der Keyness-Wert beträgt 235,8 (in Tab. 36 waren es noch 411,8 Keyness-Punkte). Rang 15 >PAKISTAN< erreicht 90 Token in Guardian.2001.danach (0,04 %) versus 15 Token (0 %) in K2. Der Keyness-Wert beträgt 215,2 Punkte. Rang 16 >TERRORIST< kommt auf 127 Token in Guardian.2001.danach (0,05 %) gegenüber 62 (0 %) in K2, Keyness-Wert: 203,6 (in Tab. 36. waren es noch 643,8 Keyness-Punkte). Die Type >MILITARY< (Rang 17) erzielt 204 Token in Guardian.2001.danach (0,08 %), jedoch 212 Token im viermal so starken Hauptkorpus K2 (0,02 %). Der Keyness-Wert beträgt 183,4. In Tab. 36 lag >MILITARY< noch bei 358,1 KeynessPunkten. Rang 18 >SEPTEMBER< erzielt 173 Token in Guardian.2001.danach (0,07 %) gegenüber 155 in K2 (0,02 %). Der Keyness-Wert beträgt 180. Der Monat September ist zum Synonym für die Katastrophe geworden. >ATTACKS< hat gegenüber der vorherigen Liste deutlich verloren. Es sind 166 Token in Guardian.2001.danach (0,07 %). Die Häufigkeit in K2 beträgt 149 Token (0,01 %). Der Keyness-Wert liegt jetzt bei 172,4 gegenüber 529,2 in der Analyse für Times.2001.danach verglichen mit K2. Rang 20 >WAR< zählt jetzt in Guardian.2001.danach 254 Token (0,01 %) gegenüber 365 (0,04 %) in K2. Der Keyness-Wert liegt bei 151,7, in der vorherigen Liste waren es noch 315,1. Rang 21 >FORCES< zählt 162 Token in Guardian.2001.danach (0,07 %). Im Referenzkorpus K2 sind es 179 Token (0,02 %). Der dazugehörige Keyness-Wert beträgt 136,2. Rang 22 >TROOPS< zählt 127 Token in Guardian.2001.danach (0,05 %). In K2 sind es 115 Token (0,01 %). Der Keyness-Wert beträgt 130,8 Punkte. 172 Die Type >MAZAR< (Rang 23), das ist der Name einer Stadt in Afghanistan, ist in Guardian.2001.danach 39-mal genannt (0,02 %), in K2 keinmal (Keyness-Wert 127,7). >TERRORISTS< hat gegenüber der vorhergehenden Keyness-Liste (Tab. 36) stark verloren. Es sind 71 Token in Guardian.2001.danach (0,03 %). In K2 sind es 33 Token (0 %). Der Keyness-Wert beträgt 116,9 Punkte (zuvor 293). Auf Rang 25 steht >MUSLIM< mit 75 Token in Guardian.2001.danach (0,03 %) versus 43 (0 %) in K2. Der Keyness-Wert beträgt 109,5. Wir stellen fest, dass viele Schlüsselbegriffe mit zunehmendem Abstand zu den Terroranschlägen an Keyness, also an Schlüsselwortfunktion verlieren (>TERRORISM<, >TERRORIST<, >TERRORISTS<, >ANTHRAX<, >KABUL<, >AFGHAN<, >AMERICA<, >ATTACKS<, >LADEN<, >OSAMA<), andere hingegen hinzugewinnen (>ALLIANCE<, >BOMBING<, >QAIDA<). 6.4.4.3 Independent.2001.danach mit K2 als Referenzkorpus In einer letzten Keyword-Analyse sei hier das zeitlich jüngste Subkorpus nach dem 11. September 2001 verwendet: Independent.2001.danach, das vom 26.11.2001 bis zum 11.12.2001 reicht. Als Referenzkorpus diente wieder K2, das Hauptkorpus, das die Zeit vom 1.6. bis zum 11.9.2001 repräsentiert. Das Range der obersten 25 Werte beträgt 156,5 – 1019,50 (Mittelwert 277,9). Diese dritte Keyness-Liste mit Independent.2001.danach als BezugsKorpus lässt einen neuen Schwerpunkt in der Berichterstattung erkennen, denn jetzt ist auch der Konflikt in Israel und den Palästinensergebieten berücksichtigt. 173 N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 WORD FREQ. 318 TALIBAN AFGHANISTAN 197 140 KANDAHAR 149 BIN 110 QA'IDA 120 LADEN 159 ALLIANCE 522 US 148 AL 131 ARAFAT PALESTINIAN 195 164 ISRAEL 81 AFGHAN 71 OSAMA 213 FORCES 93 FIGHTERS 180 ISRAELI 65 KABUL TERRORISM 91 87 HAMAS 57 MULLAH 169 ATTACKS 53 KARZAI 58 OMAR 126 ITV INDEP % 0,13 0,08 0,06 0,06 0,04 0,05 0,06 0,21 0,06 0,05 0,08 0,07 0,03 0,03 0,09 0,04 0,07 0,03 0,04 0,04 0,02 0,07 0,02 0,02 0,05 FREQ. 1 9 0 6 0 4 47 742 44 32 122 86 3 0 179 17 136 0 18 22 1 149 0 3 89 K2.TXT % KEYNESS 1.019,50 569,6 454,5 435,6 357,1 356 315,6 0,07 307,2 293,1 277,9 0,01 264,2 248,4 238,4 230,5 0,02 229,7 214,7 0,01 212,2 211 205,6 182,5 175,4 0,01 174,5 172 165,7 156,5 Tab. 38: Keyword-Liste Independent.2001.danach zu K2 Die Themenvielfalt scheint allmählich wieder zuzunehmen, auch wenn der Brennpunkt Israel ähnliche, von Terror und Mord geprägte Themen hervorbringt. Die Werte im Einzelnen sind wie folgt: Auf Rang eins der Liste steht wieder >TALIBAN< mit 318 Token in Independent.2001.danach (0,13 %) und einer einzigen Toke in K2 (0 %). Der Keyness-Wert beträgt etwas weniger als in der vorherigen Analyse (1019,50 Keyness-Punkte). Rang zwei >AFGHANISTAN< hat im Subkorpus 197 Token (0,08 %), in K2 sind es neun Token (0 %). Der Keyness-Wert liegt jetzt bei 569,6. Rang drei >KANDAHAR< zählt in Independent.2001.danach 140 Token (0,06 %), in K2 existiert diese Type nicht (Keyness-Wert 454,5). >BIN< erzielt 149 Token in Independent.2001.danach (0,06 %), in K2 jedoch nur sechs (0 %). Der Keyness-Wert beträgt 435,6. Auf Rang 5 steht >QA’IDA<. Dieses ist die spezielle Schreibvariante des Independent. In diesem Subkorpus finden wir sie 110-mal (0,04 %), in K2 keinmal. Der Keyness-Wert beträgt 357,1. Hier ist ein Anstieg zu verzeichnen (Tab. 35: >QAEDA< 307,2; Tab. 36: >QAIDA< 174 327,6 Keyness-Punkte). Mit zunehmendem Abstand von 9/11 gewinnt dieses Schlüsselwort trotz unterschiedlicher Schreibvarianten weiter an Gewicht (siehe Punkt 6.4.5.5). Auf Rang sechs finden wir >LADEN<. Wordsmith zählt 120 Token in Independent.2001.danach (0,05 %) und vier Token in K2 (0 %). Der Keyness-Wert beträgt 356. Auch dieses Schlüsselwort verliert von Untersuchungszeitraum zu Untersuchungszeitraum an Stärke. Der Begriff >ALLIANCE< (Rang 7) erzielt 159 Token in Independent.2001.danach (0,06 %). In K2 sind es 47 Token (0 %). Der Keyness-Wert beträgt 315,6 Punkte, ist jedoch geringfügig schwächer als in der vorigen Liste von Guardian.2001.danach mit K2 als Referenzkorpus (319,9 Keyness-Punkte). Rang acht >US< erzielt 522 Token in Independent.2001.danach (0,21 %) und 742 Token in K2 (0,07 %). Der Keyness-Wert beträgt 307,2 Punkte. Auch diese Type verliert mit zunehmendem Abstand zum 11. September stärker an Keyness. Rang neun >AL< mit 148 Token in Independent.2001.danach (0,06 %) und 44 Token in K2 (0 %) erzielt 293,1 Keyness-Punkte. Auf Rang 10 ist >ARAFAT< zu finden, der Name des verstorbenen Palästinenserführers. Es liegen 131 Token für Independent.2001.danach vor (0,05 %) versus 32 Token (0 %) in K2. Dieser Name hat eine Keyness-Zahl von 277,9 zu verzeichnen. In den anderen beiden bezüglich 9/11 herangezogenen Keyword-Listen ist >ARAFAT< nicht unter den obersten 25 Einträgen zu finden. Auch die Einträge elf und 12 sind neu unter den obersten 25. Die Type >PALESTINIAN< (Rang 11) zählt 195 Token in Independent.2001.danach (0,08 %). In K2 sind es 122 Token (0,01 %) bei circa vierfacher Korpusgröße. Der Keyness-Wert beträgt 264,2 Punkte. Für die Type >ISRAEL< sind in Independent.2001.danach 164 Token zu verzeichnen (0,07 %). In K2 sind es 86 (0 %). Der Keyness-Wert beträgt 248,4. >AFGHAN< hat in Independent.2001.danach eine Häufigkeit von 81 Token (0,03 %). In K2 sind es nur drei Token (0 %). Der KeynessWert beträgt 238,4. Auch diese Type verliert mit zeitlichem Abstand zum 11. September an Gewicht. Rang 14 >OSAMA< zählt im Subkorpus von The Independent 71 Token (0,03 %). In K2 existiert kein Token dieser Form. Der 175 Keyness-Wert beträgt 230,5 Punkte. Auch >OSAMA< verliert im Vergleich an Keyness. Rang 15 >FORCES< mit 213 Token in Independent.2001.danach (0,09 %) und 179 in K2 (0,02 %) erhält 229,7 Keyness-Punkte. Nach den 136,2 Keyness-Punkten in der Auszählung von Guardian.2001.danach mit K2 als Referenzkorpus kann diese Type hinzugewinnen, erreicht jedoch nicht mehr den hohen Wert von 250,3 Keyness-Punkten aus der Analyse des The Times-Subkorpus. Rang 16 >FIGHTERS< erhält 93 Token in Independent.2001.danach (0,04 %) gegenüber 17 in K2 (0 %). Der Keyness-Wert beträgt 214,7. >FIGHTERS< ist hier das erste Mal unter den ersten 25 Typen zu finden. Das Gleiche gilt für Rang 17 >ISRAELI<. Diese Type erreicht 180 Token im The IndependentSubkorpus (0,07 %) versus 136 in K2 (0,01 %). Der Keyness-Wert beträgt 212,2. Nummer 18 >KABUL< liegt bei 65 Token im The IndependentSubkorpus (0,03 %). In K2 ist >KABUL< keinmal enthalten. Der Keyness-Wert beträgt 211. Auch diese Type verliert mit Abstand zum traumatischen Moment von New York immer stärker an Gewicht. Das Gleiche gilt für >TERRORISM<. Independent.2001.danach beinhaltet diese Type 91-mal (0,04 %) versus 18 Token in K2. Der Keyness-Wert beträgt nur noch 205,6. Einträge 20 >HAMAS< und 21 >MULLAH< sind zum ersten mal unter den 25 Schlüsselwörtern zu finden. >HAMAS<, das ist der Name einer militanten Palästinenserorganisation, zählt 87 Token im Subkorpus von The Independent (0,04 %) gegenüber 22 (0 %) in K2. Der Keyness-Wert beträgt 182,5. >MULLAH< zählt 57 Token in Independent.2001.danach (0,02 %), jedoch nur eine Toke in K2 (175 Keyness-Punkte). Ein Mullah ist ein islamischer Lehrer bzw. Theologiestudent. In den meisten Fällen ist Mullah Omar gemeint, doch es gibt noch eine Reihe anderer islamischer Geistlicher, die nach 9/11 in der Zeitungsberichterstattung Erwähnung finden (Mullah Turabi, Mullah Khaksar u.a.). Rang 22 >ATTACKS< zählt 169 Token im The IndependentSubkorpus (0,07 %) versus 149 in K2 (0,01 %). Der Keyness-Wert beträgt 174,5, dennoch ist dieser Wert geringfügig höher als im Vergleich von Guardian.2001.danach und Referenzkorpus K2, obwohl Independent.2001.danach jünger ist. 176 Auch Rang 23 >KARZAI< ist ein Neuzugang unter den ersten 25 Einträgen. Es sind 53 Token (0,02 %) in Independent.2001.danach enthalten versus kein Token in K2. Der Keyness-Wert beträgt 172. Karzai ist der Name des Präsidenten der Übergangsregierung von Afghanistan. Auch die Ränge 24 und 25 sind in den beiden vorhergehenden 25erListen nicht enthalten. Der Name >OMAR< (s.o. Mullah Omar) erreicht 58 Token in Independent.2001.danach (0,02 %) versus drei Token in K2 (0 %). Der Keyness-Wert zählt 165,7 Punkte. An letzter Stelle der Liste finden wir >ITV<. Diese Type kommt 126mal in Independent.2001.danach vor (0,05 %) gegenüber 89 Token (0 %) in K2. Der Keyness-Wert beträgt 156,5. ITV ist die Abkürzung des britischen kommerziellen Fernsehsenders Independent Television. Die drei vorangegangenen Keyness-Auswertungen machen deutlich, wie die kontextuelle Wahrscheinlichkeit, die durch den 11. September erzeugt wurde, allmählich von Subkorpus zu Subkorpus an Stärke verliert, auch wenn das Ereignis 9/11 und die damit verbundenen Schlüsselbegriffe lange nachhallen. Die lexikalische Wahrscheinlichkeit bestimmter Begriffe, die infolge der Katastrophe sprunghaft anstieg, nimmt mit zeitlicher Entfernung der Subkorpora von 9/11 ab. Andere Schlüsselwörter gewinnen im Zuge der ausgelösten Ereigniskette an Stärke (>KANDAHAR<, >ARAFAT<, >PALESTINIAN<, >ISRAEL<, >FIGHTERS<, >ISRAELI<, >HAMAS<, >MULLAH<, >KARZAI<, >OMAR<, >ITV<). 6.4.5 Analyse ausgewählter Wortgruppen Die in den Auswertungslisten erfassten Typen lassen sich Wortgruppen zuordnen. Wir können dabei zusammengehörende Begriffe Themen wie Arabisch, Gewalt, Terrorismus, Islam oder Al Qaeda zuordnen. Diese Themen können auf der einen Seite als Hyperonyme fungieren. Auf der anderen Seite können sie als morphologische Kategorien gelten (z.B. wie aus den Allomorphen zu >ARAB< ersichtlich), oder sogar verschiedene Schreibvarianten zusammen betrachten (Al Qaida, Al-Qaeda, Al-Qa’ida, etc.). 177 Der Begriff Wortgruppe ist in diesem Zusammenhang nicht zu verwechseln mit dem des Wortfeldes (siehe Kapitel 6.4.1). Die hier gewählten Kategorien haben keinen Anspruch auf Vollständigkeit und sollen lediglich dabei helfen, Tendenzen widerzuspiegeln. 6.4.5.1 Die Wortgruppe „Arabisch“ Zunächst werden die Veränderungen bei der Wortgruppe „Arabisch“ untersucht, für die folgende Worttypen ausgewählt wurden: >ARAB<, >ARABS< und >ARABIC<. Diese Auswahl wurde vorgenommen, um einen Vergleich mit der Wortgruppe islamische Welt vorzunehmen. Die Arabisch sprechenden Menschen sind zwar zur überwiegenden Mehrheit Bestandteil der islamischen Welt, in der Weltreligion Islam wird jedoch nur zu einem Teil Arabisch gesprochen, denn hier gibt es Sprachen wie Urdu, Turksprachen, Farsi bzw. Dari, Javanisch, Paschto, Pandschabi, Thai und viele mehr. Thematische Landkarten für Sprachen und Religionen sind deshalb nicht kongruent. 2,7 % der Weltbevölkerung sprechen Arabisch als erste Sprache, jedoch sind 14 % Mohammedaner (Bertelsmann Atlas International 1984, S. 355/56). Es muss einschränkend gesagt werden, dass in allen muslimischen Ländern, ob Sunnitisch oder Schiitisch, Standardarabisch in den Koranschulen gelernt wird, auch wenn Umgangssprache und Amtssprache nicht der arabischen Sprachfamilie (hamito-semitisch) angehören (Crystal 1997, S.318). Superkorpus K1 12.9.-11.12.01 WORD Freq. % Freq. % 1018 0,03 159 0,02 ARAB 41 57 ARABS 181 19 ARABIC Σ 1240 235 K2 1.6.-11.9.01 Freq. % 22 4 4 30 K3 1.1.-21.8.1990 Freq. St. Wert % 837 419 0,04 120 60 18 9 975 488 Tab. 39: Die Wortgruppe „Arabisch“ mit den Typen >ARAB<, >ARABS< und >ARABIC< Vergleichen wir die Werte für diese Wortgruppe, so stellen wir fest, dass die größte Menge an Token in K3 erzielt wird, dass ist das Korpus, das Artikel über die Kuwait-Krise enthält. Dort sind es 975 178 Nennungen (stand. Wert 488). Weniger als halb so viele Token dieser Wortgruppe finden wir in K1, das Korpus, in das die Berichterstattung über den 11. September fällt. Hier sind es 235 Token. Vergleichsweise gering ist der Wert für K2 mit nur 30 Token insgesamt. Die lexikalische Häufigkeit, die proportional zu Korpusgröße ist, nimmt zwar nach dem 11. September deutlich zu, erreicht aber nicht die Ausmaße wie zu Zeiten der Kuwait-Krise. Das ist ein Indiz dafür, dass arabische Themen nach 9/11 deutlich stärker vertreten sind, aber verglichen mit der Wortgruppe „islamische Welt“ (s.u.) kein Maximum in K1 erreichen. 6.4.5.2 Die Wortgruppe „islamische Welt“ Was die lexikalische Häufigkeit von Bestandteilen aus der Wortgruppe „islamische Welt“ anbetrifft, ist ein deutlicher Spitzenwert in K1 zu verzeichnen. Hier sind es 847 Token gegenüber 112 in K2 und 588 (stand. Wert 295) in K3. Superkorpus WORD Freq. % 160 ISLAM 0,01 ISLAMIC 505 ISLAMIST 34 0,01 MUSLIM 547 MUSLIMS 291 1537 Σ K1 K2 K3 Freq. % Freq. % Freq. 115 - 11 - 34 271 0,03 33 - 211 32 2 268 0,03 43 - 236 161 0,02 23 - 107 847 112 588 St. Wert % 17 106 118 0,01 54 295 Tab. 40: Die Wortgruppe „islamische Welt“ Diese Verteilung ist mit den Terroranschlägen von New York zu erklären und der Suche nach den Drahtziehern in der islamischen Welt, die nicht immer gleichzusetzen ist mit dem arabischen Raum. Im Erhebungszeitraum von K2 kam es zwar auch zu Terroranschlägen durch Religionsfanatiker, doch diese waren vergleichsweise harmlos. Sie erreichten nicht den Schwellenwert für weltweite Fahndungen und Truppenbewegungen. Der Wert für K3, nur etwa ein Drittel des Wertes von K1, dennoch fast dreimal so groß wie der von K2, lässt sich wieder mit der Kuwait-Krise und der Auseinandersetzung mit Saddam Hussein und dem Irak erklären. 179 Es fällt auf, dass in den Korpora vor dem 11. September die Type >MUSLIM<, zugleich Substantiv und Adjektiv, häufiger verwendet wurde als >ISLAMIC<. Nach 9/11 wurde diese Proportion umgekehrt. Die Type >ISLAMIST<, die Bestandteil dieser Wortgruppe ist, kommt ausschließlich in den Korpora von 2001 vor: 32-mal in K1 und zweimal in K2. In nur einem einzigen Fall liegt ein Substantiv vor, das dazu mit einem großen Anfangsbuchstaben geschrieben ist: “Maulana Sufi Mohammad, a leading Islamist, said he had obtained permission from the Taliban to enter Afghanistan's Kunar province to swell what he claimed were 12,000 Pakistani volunteers.“ (The Guardian, 7.11.2001, Pakistanis reinforce Taliban trenches) Im Oxford English Dictionary, Band VIII. finden wir den Eintrag: Islamist, an orthodox Muslim (S.109). Die Type >ISLAMIST< ist ein geeignetes Beispiel, dass ein relativ seltenes Wort in der Presse an Bedeutung gewinnt, weil der Kontext dieses erfordert. In der deutschsprachigen Presse beispielsweise sind Begriffe wie >ISLAMISTEN<, >ISLAMISTISCH< und >ISLAMISMUS< schon lange vor dem 11. September ein unverzichtbarer Bestandteil der Diskussion über den Islam (z.B. FAZ, 30.08.2001, S.5, NZZ 28.8.2001, S.5, SZ 26.07.2001, S.8). 6.4.5.3 Die Wortgruppe „Terror“ Zur Bewertung der Wortgruppe „Terror“ wurden an dieser Stelle nicht nur die Formen >TERROR<, >TERRORIST< und >TERRORISM< herangezogen, sondern auch die vorhandenen Allomorphe zur Grundform, damit das ganze Spektrum an Verwendungen aufgezeigt werden kann. 180 K1 Nr. Word 1. 2. 3. 4. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. ∑ TERROR TERROR'S TERRORISING TERRORISM TERRORIST TERRORIST'S TERRORISTS TERRORITY TERRORRIST TERRORS 10 K2 Freq. % 214 1 5 571 676 1 336 1 2 1 1808 0,02 0,06 0,07 0,03 - K3 Word Freq. % Word TERROR TERRORISED TERRORISING TERRORISM TERRORIST TERRORISTS 6 12 3 3 18 62 33 131 - TERROR TERRORISE TERRORISED TERRORISM TERRORIST TERRORIST'S TERRORISTS TERRORIZE TERRORIZED TERROSRISTS 10 Freq. % 44 2 2 82 145 1 80 1 3 1 361 - Tab. 41: Verwendung des Kopfwortes >TERROR< und dessen Allomorphe Die Formen sind im Folgenden diskutiert: In K1, dem Korpus von 2001 mit Texten erschienen nach 9/11 finden wir den Begriff >TERROR< 214-mal, das sind 0,02 % von K1. >TERROR’S< finden wir einmal, >TERRORISING< fünfmal, >TERRORISM< 571-mal (0,06 % von K1). Die Type >TERRORIST< zählt 676 Token (0,07 % von K1), >TERRORIST’S< eine Toke, >TERRORISTS< 336 Token und damit 0,03 % von K1. Die mir unbekannte Wortform >TERRORITY< ist einmal enthalten, das orthografisch falsche >TERRORRIST< zweimal, >TERRORS< einmal. Das sind insgesamt 1808 Wortformen inklusive und aufbauend auf der Grundform >TERROR< und damit 0,18 % aller Wörter des Korpus K1. In K2 hingegen findet sich >TERROR< nur 12-mal, >TERRORISED< dreimal, >TERRORISING< dreimal, >TERRORISM< 18-mal, >TERRORIST< 62-mal, >TERRORISTS< 33-mal. Die Grundform >TERROR< und die darauf aufbauenden Wortformen lassen sich in K2 insgesamt 131-mal finden, das sind 0,01 % des Korpus K2. In K3, das von der Wortmenge so groß ist wie K1 und K2 zusammen, also etwa 2 Millionen Wörter stark, finden wir die Type >TERROR< 181 44-mal, >TERRORISE< zweimal, >TERRORISED< ebenso zweimal, >TERRORISM< 82-mal, >TERRORIST< 145-mal, >TERRORIST’S< einmal, >TERRORISTS< 80-mal, die amerikanische Wortform >TERRORIZE< einmal, >TERRORIZED< (am.) dreimal, >TERROSRISTS< inklusive eines orthografischen Fehlers einmal. Das sind insgesamt 361 Wortformen und 0,02 % in K3, die auf die Grundform >TERROR< aufbauen. Zusammenfassend ist hier festzuhalten, dass K3 prozentual mehr als doppelt so viele Wortformen beinhaltet, die auf der Grundform >TERROR< aufbauen als K2, aber nur 1/9 der Menge von K1. Die Verwendung der Wortgruppe Terror hat sich von K3 zu K1 circa um den Faktor 9 vergrößert, von K2 zu K1 jedoch sogar um den Faktor 15. Auffällig ist ferner, dass in K1 zehn Worttypen enthalten sind, die auf der Grundform >TERROR< aufbauen (inklusive der orthografisch falschen Form >TERRORRIST<), in K2 sechs und in K3 wieder zehn (inklusive der orthografisch falschen Form (>TERROSRISTS<) und den amerikanischen Verwendungen >TERRORIZE< und >TERRORIZED<). 6.4.5.4 Die Wortgruppe „Gewalt“ Um zu analysieren, ob nicht nur die Wortgruppe „Terror“ einen starken Zuwachs nach dem 11. September erhalten hat, sondern vielleicht sogar der gesamte Themenkomplex „Gewalt“, seien hier Wörter aufgeführt, die Gewalt betreffen: >WAR<, >VIOLENCE<, >DRUGS< und >CRIMINAL<. Gewalt ist ständig in den Medien präsent, ob es die tägliche Gewalt auf der Straße ist oder Krieg. Superkorpus K1 K2 (12.9.- 11.12.2001) Nr. 1. 2. 3. 4. Σ WORD Freq. % 2583 WAR 860 VIOLENCE 656 DRUGS 601 CRIMINAL 4700 Freq. 0,06 0,02 0,02 0,01 1037 184 146 122 0,11 1489 K3 (1.6.-11.9.2001) (1.1.-21.8.1990) % Freq. % Freq. Stand.W. % 0,1 365 0,04 1181 591 0,06 0,02 220 0,02 456 228 0,02 0,01 245 0,02 265 133 0,01 0,01 174 0,02 305 153 0,02 0,14 1004 0,1 2207 1105 0,11 Tab. 42: Die Wortgruppe „Gewalt“ mit den Typen >WAR<, >VIOLENCE<, >DRUGS< und >CRIMINAL< 182 Betrachten wir die Spaltensummen der Tabelle, so erkennen wir folgende Konstellation: am stärksten ist diese Wortgruppe in K1 vertreten. Dort sind es 1489 Token (0,14 %). Den zweithöchsten Wert erreicht wieder K3 mit 2207 Token (stand. Wert 1105) und 0,11 %. Geringfügig weniger erreicht K2 mit 1004 Token und 0,10 %. Von einer Themenverdrängung im Bereich der Berichterstattung über Gewalt ungeachtet der Wortgruppe Terror kann deshalb nicht die Rede sein, was vor allem auf den herausragenden Wert für >WAR< in K1 (1037 Nennungen) zurückzuführen ist. Über das Thema Drogen ist hingegen in K2 am häufigsten berichtet worden (245 Nennungen). 6.4.5.5 Die Wortgruppe „Al-Qaida“ in den drei Subkorpora von K1 Das Terrornetzwerk, das als Al-Qaida bezeichnet wird, findet sich ausschließlich in den Zeitungsartikeln, die nach dem 20. September erschienen sind. Es handelt sich dabei um einen Lehnwort aus dem Arabischen, das infolge des 11. September in den Wortschatz der nicht arabisch-sprechenden Welt aufgenommen wurde. Die Al-Qaida wurde ursprünglich als eine Kontaktgruppe für arabische Freiwillige aufgestellt, die dem afghanischen Widerstand beitreten wollten (Townshend 2002, S.110). Für die Weltöffentlichkeit war dieser Begriff zum ersten Mal im Rahmen der Rede des amerikanischen Präsidenten Bush vor dem amerikanischen Kongress am 20.09.2001 zu vernehmen. Bis auf eine Ausnahme sind alle der in K1 vorkommenden 376 Formen mit dem arabischen Artikel >AL< versehen, mal mit, mal ohne Bindestrich. Im Arabischen Wörterbuch für die Schriftsprache der Gegenwart (Wehr 1985, S. 1045) finden wir den folgenden Eintrag: ةqā’ida pl. دعاوقqawā’id Grundlage; Basis; Fundament; Grundlinie (geom.); Sockel, Fußgestell, Fuß, Piedestal; Stützpunkt (mil.); … Laut Görlach (1999, S. 143) haben Lehnwörter den folgenden Nutzen: Sie dienen zur Bezeichnung fremder Gegenstände und Sachverhalte aus einer Fremdsprache, in diesem Fall Arabisch, für deren 183 Umschreibung Begriffe der heimischen Sprache zu umständlich oder missverständlich wären. Außerdem füllen Lehnwörter Lücken für bekannte, bisher nicht bezeichnete Inhalte, erlauben eine feinere Differenzierung, und dienen der Internationalität des Wortschatzes. Wir können hier noch einen weiteren Grund anführen, dass sie zur Marginalisierung von Gruppen oder zum Verfestigen eines Feindbildes beitragen können, was besonders in Kriegszeiten üblich ist (die Tommys, der Ivan, the krauts, the huns, etc.). In der folgenden Liste wurden diesmal nur die Kopfwörter aufgelistet, ungeachtet des Artikels und der Bindestriche. Es sind auch die Genitiv-Formen mit Apostroph aufgeführt. Nr. 1. 2. 3. 4. 5. 6. 7. Σ Independent. Guardian. Times. 2001.danach 2001.danach 2001.danach (26.11.-11.12.2001) (25.10.-9.11.2001) (12..9.–24.10.20 01) Word Freq. QAEDA QAEDA'S QA'IDA QA’IDA’S QAIDA QAIDA’S QAI’DA % Freq. 110 0,04 1 5 5 - 100 2 - % 121 102 Freq. - 0,04 - 138 7 8 153 stand. Wert % 69 0,03 4 4 77 Tab. 43: Verwendung des Wortes >AL-QAEDA< und dessen Schreibvarianten In den verwendeten drei britischen Zeitungen finden wir dieses Lehnwort in unterschiedlichen Schreibvarianten. Je weiter das Subkorpus vom Ereignis 9/11 entfernt liegt, desto häufiger wird das Wort AL-QAEDA in seinen unterschiedlichen Schreibvarianten verwendet. Es muss jedoch berücksichtigt werden, dass es erst rund zehn Tage nach den Anschlägen zum ersten Mal verwendet wurde. In Times.2001.danach sind es insgesamt 153 Formen aus dieser Wortgruppe, der standardisierte Wert beträgt 77. Vier der 153 Formen schreiben sich ohne Bindestrich. In Guardian.2001.danach sind es insgesamt 102 Nennungen, alle mit Bindestrich geschrieben, in Independent.2001.danach sind es 121, fünf davon ohne Bindestrich, eine Form ohne den Artikel >AL<. Es wird deutlich, dass die drei betrachteten Zeitungen unterschiedliche Varianten bevorzugen. The Times verwendet fast ausschließlich die 184 Form >QAEDA< (138-mal; sowie siebenmal mit Apostroph-S), The Guardian >QAIDA< (100-mal) und The Independent bevorzugt >QA’IDA< (110-mal), jeweils versehen mit der vorangestellten Form des arabischen Artikels >AL<. Zusätzlich ist in Times.2001.danach siebenmal die Form >QAEDA’S< enthalten, in Guardian.2001.danach zweimal die Form >QAIDA’S< und in Independent.2001.danach finden sich die Formen >QAI’DA< (5x) und >QA’IDA’S< (1x). Wir finden diverse Komposita bzw. Nominalphrasen, die eine der Wortformen enthält, und das in allen drei Subkorpora. Die häufigsten Formen sind: >AL-QAEDA FIGHTERS<, >AL-QAEDA TERRORIST<, >AL-QAEDA BASES<, >AL-QAEDA NETWORK<, >AL-QAEDA CELL<, >AL-QAEDA MEMBERS<, >AL-QAEDA FORCES<, >AL-QA’IDA OPERATIVES<, u.v.a. In The Independent sind 68 % der Formen Bestandteile von Komposita. In The Guardian sind es 40 % und in The Times 57 %. Die Terrororganisation >AL-QAEDA< wird zum ersten Mal in dem Artikel Bush address to Congress erwähnt (The Times vom 21.09.2001). Darin ist die historische Rede des Präsidenten Bush in editierter Form wiedergegeben. Hier lesen wir den Satz: “Americans are asking,"Who attacked our country?" The evidence we have gathered all points to a collection of loosely affiliated terrorist organisations known as al-Qaeda.” Damit waren die Schuldigen für die Terroranschläge vom 11. September benannt. Später fällt im Zusammenhang mit Al-QAEDA der Begriff APPEASEMENT, der bisher historisch belegt war und für die Politik des Britischen Außenministers Chamberlain gegenüber dem 3. Reich im Rahmen der Annexion der Tschechoslowakei stand: “The appeasement of al-Qaeda or any of its allied networks, most especially by Muslim rulers fearful of being branded "traitors" to Islam, will prolong the conflict unleashed on September 11 and add to its dangers for Muslims as well as the West” (The Times, The trouble when two priorities become three, 12.10.2001). Doch es verstärkt sich der Eindruck, dass die führenden Politiker Schwierigkeiten hatten, die Verantwortlichen von 9/11 genau zu 185 benennen, ob es ausschließlich die kleine Gruppe von Selbstmördern war oder ob ein weltweit agierendes Terrornetzwerk verantwortlich ist. Die erste Möglichkeit wurde schnell verworfen. Am 26.10.2001 schreibt Jack Straw, Foreign Secretary, in The Guardian: “We tried hard to deal with the Taliban/al-Qaida nexus through non-military means.” (Building will follow the bombing). In diesem Beispielsatz finden wir ein Zwillingskompositum, das eine Gedankenbrücke herstellt. Durch diese Wortkombination wird ein komplexer Sachverhalt, der Zusammenhang von Al-Qaeda und Taliban, vereinfacht ausgedrückt (siehe auch: 6.5.2.1, Miller 1992, S.140/41). Vielleicht sind sie ein weiterer Beleg für die Kommunikationsprobleme, die nach dem 11. September in Anbetracht der Katastrophe in weiten Teilen der Medien und der Öffentlichkeit vorherrschten. 6.5 Morphologische Analysen: Ausgewählte Komposita Dieses Unterkapitel beschäftigt sich mit der Kompositabildung in den durch die Hauptkorpora repräsentierten Untersuchungszeiträumen. Vorangestellt sei hier ein semantischer Exkurs, speziell über die Sonderstellung von Homonymen, für die zum Teil dasselbe gilt wie für Komposita: Eine computergestützte Bedeutungsanalyse ist nicht möglich, ebenso nicht das Orten zusammengehöriger Formen. 6.5.1 Das Problem der Erkennung von Komposita und Homonymie Beim Durchsehen der Wortlisten werden wir fortwährend mit dem Problem der Homonymie konfrontiert, das ist die Tatsache, dass Lexemen zwar die gleiche Form haben, sich jedoch in ihrer Bedeutungen unterscheiden (Lyons 1985, S.35). Wenn in der herkömmlichen Häufigkeitsliste ein bestimmtes Wort erscheint, z.B. >PLANT<, >FRONT<, >MAJOR<, >PRESS<, >NORMAN<, etc., so lässt sich daraus primär nicht erkennen, welche Bedeutung 186 intendiert ist. Wir erschließen den Bedeutungstyp erst, wenn wir in die Kollokationsliste sehen, in der die Wortumgebungen des gesuchten Wortes auf die tatsächliche Bedeutung hinweisen. Es lässt sich feststellen, dass trotz derselben graphemischen Repräsentation mal ein Nomen und mal ein Verb aufgelistet wurde, wie das Beispiel für >PRESS< verdeutlicht, das der 216 Einträge starken Konkordanzliste von K1 entnommen wurde. N 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 Concordance ly informed at 5pm. The press knew before the s ylum-seekers. He must press ahead urgently w appeared in the Iranian press. Israel cancelled ident George Bush is to press US allies to outla es were unduly late, the press corps would have ave warned they would press charges if the thie l workers dominated the press conference by Ari rsue legal action. At a press conference in Lon tic rebuff came at a joint press conference in Da papers and the Catholic press in which he insiste lar briefings for the Arab press at Downing Street le story for the popular press, with daily twists le story for the popular press, with daily twists mber talking to an MoD press officer after the rt by the Afghan Islamic Press said that Ms Ridle ellation of a presidential press event yesterday af Word No. File % 786.383 216.484 112.900 658.800 157.161 624.759 499.377 79.764 636.446 539.101 408.759 916.392 917.448 307.498 163.971 904.936 e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt e:\k1.txt 78 22 11 65 16 62 50 8 63 54 41 91 91 31 16 90 * * * Abb.: 14: Konkordanzliste von >PRESS< (Auszug, 16 von insgesamt 216 Einträgen). Die Verben sind mit einem Asterisk gekennzeichnet. Neben dem Erkennen von Homonymen ist das Orten der Komposita ein gravierendes Problem. Im Englischen werden Komposita entweder auseinander oder durch einen Bindestrich verbunden oder zusammen geschrieben, z.B. >ASYLUM SEEKERS< vs. >ASYLUMSEEKERS< vs. >ASYLUMSEEKERS<. Für viele Komposita gibt es eine Standardversion, für andere gibt es keine Konvention (Seely 2004, S.32). Diese Tatsache wird von „Wordsmith“ nicht erkannt und folglich werden die Komposita aufgebrochen, jede Konstituente wird in den Wortlisten separat aufgeführt, es sei denn, dass beide Formen zusammengeschrieben sind. Nur mit Hilfe der Kollokationslisten oder der Suchfunktion, in die das ganze Kompositum als eine Wortkette eingegeben wird, lassen sich diese Wörter ausfindig machen. Deshalb finden wir in den Wortlisten die folgenden Bezeichnungen nicht: 187 >NEW YORK<, >POLL TAX<, >ASYLUM SEEKERS<, >GULF WAR<, >UNITED STATES<, >PRIME MINISTER<, etc. Das birgt Schwierigkeiten, da diese Termini zusammen gehören und separat ihre Gesamtbedeutung verlieren. Die Komposita gehen im Gesamtkorpus auf, die Elemente besitzen einzeln eine andere Bedeutung als in der zusammengesetzten Form. Sowohl das Problem der Homonymie als auch das der Registrierung der Komposita lässt sich nur umgehen, wenn annotierte Vergleichskorpora mit Listen von Homonymen mit ihren Kollokationen verwendet werden, oder auf der anderen Seite Listen mit allen gängigen Komposita, diese ebenfalls annotiert. Dieses hätte in Form von so genannten „parallel alligned corpora“ bzw. „parallel corpora“ (Oakes 2003, S.135) zu geschehen, also parallel angeordnete Vergleichskorpora. Das Annotieren bzw. Taggen der betreffenden Wörter wäre wohl unumgänglich, es kommt ganz auf die Vorgehensweise eines etwaigen Projektleiters an. Die Software Wordsmith ist für einen solchen Vergleich jedoch nicht geeignet. Was für Homonyme und Komposita gilt, trifft auch zu auf Metaphern, Phrasal Verbs, Redewendungen und viele andere zusammengehörenden Wortketten, die als Ganzes betrachtet werden sollen. Wir müssen deshalb alle Bestandteile des Kompositums als Suchwort ins Eingabefeld der Funktion Concord einfügen, um die dazugehörige Konkordanzliste zu erhalten. 6.5.2 Analyse ausgewählter Komposita Wir widmen uns in den nächsten beiden Unterkapiteln einer Reihe von Komposita mit Bestandteilen aus den Wortgruppen „Arabisch“, „islamische Welt“ und „Terror“. Die Wortgruppen „Arabisch“ und „islamische Welt“ wurden dabei zusammengefasst. 188 6.5.2.1 Komposita mit Bestandteilen aus den Wortgruppen „Arabisch“ und „Islamische Welt“ Im Folgenden ist eine Auswahl von Komposita aufgeführt, die auf den folgenden sieben Wortformen basieren: >ARAB<, >ARABIC<, >ISLAM<, >ISLAMIC<, >ISLAMIST<, >MUSLIM< und >MUSLIMS<. Wie bereits angesprochen besitzt Wordsmith keine spezielle Suchfunktion für Komposita. Deshalb mussten die sieben Konkordanzlisten einzeln durchgesehen werden. Die drei Spalten der folgenden Tabelle sind alphabetisch und nicht nach den Kopfwörtern der Komposita sortiert. Hier wurden sowohl die Formen mit Bindestrich als auch die zusammengeschriebenen berücksichtigt, aber keine auseinander geschriebenen Formen, so dass Verwechslungen mit Nominalphrasen vermieden werden konnten. Die Verwendung von Bindestrichen im Englischen (hyphenation) ist vollkommen willkürlich (Bauer 1995, S.101). Deshalb sind für mehrere Formen zwei Schreibweisen gefunden worden. Komposita, die ein Kopfwort besitzen, nennen sich endocentric compounds. Ferner gilt in der englischen Sprache die right-hand head rule, RHR (Katamba 1993, S.311). Diese Regel besagt, dass sich das Kopfwort eines Kompositums auf der rechten Seite befindet. Das ist bei den meisten hier analysierten Komposita der Fall, mit Ausnahme von wenigen exocentric compounds, bei denen kein Element als Kopfwort fungiert (z.B.: >FATWA-ISLAMIC<). Es sind ferner copulative compounds (>WESTERN-ARAB<) enthalten. Für die aufgeführten noun compounds (>FELLOW-MUSLIMS<) und verbal compounds (>ARABIC-SPEAKING<) gilt die RHR. 189 Nr. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. Komposita K1 ANTI-ARAB ANTI-ISLAMIC ANTI-MUSLIM ARAB-AMERICAN ARAB-DOMINATED ARAB-ISRAELI ARAB-OWNED INTRA-MUSLIM Fq 1 2 1 1 1 7 1 1 ISLAMIC-NATIONALIST 1 2 MUSLIM-CROAT 1 MUSLIM-RELATED 3 NON-MUSLIM 1 NON-MUSLIMS 1 PRO-ISLAMIST 2 UN-ISLAMIC Kompositum K2 ALL-MUSLIMS ARABIC-SPEAKING Σ N=15 N=4 26 Fq 1 1 ISLAMIST-DOMINATED 1 1 MUSLIM-CROAT 4 Nr. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. Kompositum K3 ARAB-JEWISH AD-DAWA-ARABIC AL-ARAB AL-MUSLIMEEN ANTI-ARAB ANTI-MUSLIM ARAB-AMERICAN ARAB-CANADIANS ARAB-ISLAMIC ARAB-ISRAELI ARAB-OWNED EL-ARAB FATWA-ISLAMIC Fq 3 1 23 4 3 1 2 1 1 9 1 1 1 FELLOW-MUSLIMS 1 INTER-ARAB 3 1 ISLAMIC-STYLE ISRAELI-ARAB 1 1 MUSLIM-HINDU NON-ARAB 1 2 NON-MUSLIM 1 NON-MUSLIMS PAN-ARAB 14 PRO-ARAB 2 1 PRO-ISLAM SHATT-AL-ARAB 2 1 UN-ISLAMIC US-ARAB 1 WESTERN-ARAB 2 N=28 Tab. 44.: Komposita der Wortgruppen >ISLAM< (fettgedruckt) und >Arabisch< in K1, K2 und K3. In K1 sind 15 verschiedene Komposita insgesamt 26-mal enthalten. Im doppelt so großen Korpus K3 kommen 28 verschiedene Komposita 85-mal vor. Berücksichtigen wir die unterschiedlichen Korpusgrößen enthält K3 die größte Gesamtzahl an Komposita, K1 hingegen die meisten verschiedenen Komposita aus dieser Gruppe. In K2 finden sich insgesamt nur vier verschiedene Komposita je einmal (>ALL-MUSLIMS<, >ARABIC-SPEAKING<, >ISLAMIST-DOMINATED<, >MUSLIM-CROAT<). Das lässt sich damit begründen, dass in das Range des Presse-Korpus K2 kein Konflikt mit der arabischen Welt fällt, anders als in den 190 85 anderen beiden Textsammlungen K1 und K3 (K1: War on Terror, K3: Crisis in Kuwait). Betrachten wir die Komposita im Detail, so stoßen wir auf positiv bzw. neutral belegte Konstruktionen wie >INTER-ARAB<, >PANARAB< oder >ARAB-SPEAKING<. Auf der anderen Seite finden wir stark simplifizierende Zusammensetzungen wie >ANTIMUSLIM<, >ANTI-ARAB<, >ANTI-ISLAMIC<, >INTRAMUSLIM< oder >MUSLIM-RELATED<. Es sind mehrere Gegensatzpaare zu lokalisieren, die u.U. als dvanda compounds (Bauer 1995, S.36) aufgefasst werden können: >ARABISRAELI< (16 x), >WESTERN-ARAB< (2 x), >US-ARAB< (1 x), >ARAB-AMERICAN< (1 x), >ISRAELI-ARAB< (1 x), u.a. Wir finden überaus häufig Formen, bei denen Präfixe durch Bindestrich vom Kopfwort abgetrennt sind (>ANTI-ARAB<, >NONMUSLIM<, >UN-ISLAMIC<, >INTRA-MUSLIM<, >PROISLAM<, >INTER-ARAB<, etc.). Diese Wortbildungsmuster sind typisch für Pressesprache bzw. Pressephonologie und finden sich häufig in den Schlagzeilen der Boulevardpresse. Auf diese Art und Weise wird versucht, komplexe Sachverhalte sprachlich zu vereinfachen. Komposition zur Kennzeichnung bestimmter Sachverhalte ist speziell in Fachsprachen üblich (Mesthrie et. al, 2001, S.257), z.B. >BLOOD CLOTTING FACTOR<, aber auch als Wortformierungsmöglichkeit bei englischen Pidgin-Sprachen (Mesthrie et al. 2001, S. 537). Das sind zumeist Bereiche, in denen wissenschaftliche Neuerungen beschreibbar gemacht werden müssen, oder, im Falle des Pidgin, Sprecher unterschiedlicher Sprachen in Kontakt treten und neue Wortschöpfungen in Form von Komposita benötigen (z.B. >MINAPALMA<, small palmtree, Arends et al. 1994, S. 195). Die Verwendung von Komposita kann ein Zeichen für sprachliche Kreativität sein, andererseits helfen diese Wortkombinationen, einen mehr oder weniger komplexen Sachverhalt vereinfacht zu benennen, indem sie Gedankenbrücken herstellen und Themengebiete miteinander verknüpfen. Bei Pressesprache insbesondere in Überschriften erzeugen sie eine Art Telegrammstil. Sie werden häufig genutzt, wenn syntaktische Standardbewegungen nicht ausführbar sind. Sie vermögen zu klassifizieren und ersparen das Paraphrasieren. Diese Methode ist kurz und prägnant. Das geschieht manchmal auf 191 Kosten des sprachlichen Ausdrucks wie etwa bei der Szene- oder Anti-Sprache. (siehe 6.4.5.5, Miller 1992, S.140/41). Es lässt sich sagen, dass es sowohl 2001 als auch 1990 diskriminierende Sprachverwendungen in Form von Komposita aus den oben untersuchten Begriffsgruppen gab (>MUSLIM-RELATED<, >ANTI-ISLAMIC<), jedoch 2001 stärker als in 1990. 6.5.2.2 Komposita mit Bestandteilen aus der Wortgruppe „Terror“ Zu der Wortform >TERRORISM< finden wir in den drei Korpora u.A. folgende Komposita: >STATE TERRORISM<, >TERRORISM ACT<, >TERRORISM ANGST<, >TERRORISM CRISIS<, >TERRORISM LEGISLATION< und >TERRORISM CASES<. Je nach Betrachtungsweise können diese Kombinationen als Nominalphrasen oder als Komposita (compound nouns) aufgefasst werden (Katamba 1993, S. 307, u.a.), auch wenn diese N-Komposita letztendlich selbst ein Typ von Nominalphrase sind. Dasselbe gilt für die Type >TERROR<: >TERROR BLITZ<, >TERROR SUSPECTS<, >TERROR NETWORK<, >ANTHRAX TERROR<, >TERROR GROUP<, >TERROR ATTACKS<. Zu >TERRORIST< sind es Wortverbindungen wie >MIDDLE EAST TERRORIST<, >SAUDI TERRORIST<. In der folgenden Stichprobe wollen wir uns ausschließlich auf die zusammengeschriebenen Komposita und diese mit Bindestrich beschränken. In K1 finden wir aus der in Augenschein genommenen Gruppe 18 verschiedene Komposita mit insgesamt 190 Nennungen: 192 Nr. Kompositum in K1 Fq Kompositum in K2 Fq Kompositum in K3 Fq 1. ANTI-TERROR 20 ANTI-TERRORISM 1 ANTI-TERROR 1 2. ANTI-TERRORISM 50 ANTI-TERRORIST 9 ANTI-TERRORIST 29 3. ANTI-TERRORIST 56 BIO-TERRORISM 1 COUNTER-TERROR 1 4. BIOTERROR 3 COUNTER-TERRORISM 1 COUNTER-TERRORISM 1 5. BIOTERRORISM 15 COUNTERTERRORIST 1 COUNTER-TERRORIST 3 6. BIO-TERRORISM 1 DRUG-TERRORISM 1 7. BIOTERRORIST 8 NARCO-TERRORIST 1 8. COUNTERTERRORISM 1 NON-TERRORIST 1 9. COUNTER-TERRORISM 13 TERRORIST-RELATED 2 10. COUNTERTERRORIST 1 TERRORIST-RIDDEN 1 11. COUNTER-TERRORIST 10 12. SUPER-TERRORIST 2 13. TERRORIST-FREE 1 14. TERRORIST-RELATED 2 N=10 41 15. TERRORIST-SPONSORING 2 16. TERRORIST-TRACKING 1 17. TERROR-RIDDEN 1 18. TERROR-SUPPORTING 3 Σ 190 N=18 N=5 13 Tab. 45: Komposita aus der Wortgr. “Terror” in K1, K2 und K3 Mit 56 Nennungen ist >ANTI-TERRORIST< die deutlich häufigste Form, gefolgt von >ANTI-TERRORISM< (50 Nennungen) und >ANTI-TERROR< mit 20 Nennungen. In K2 sind es hingegen nur fünf Komposita aus dieser Gruppe mit insgesamt 13 Nennungen. Die häufigste Form ist >ANTI-TERRORIST< mit neun Nennungen. In K3 finden wir zehn Komposita aus dieser Wortgruppe mit 41 Nennungen. Auch hier ist die Verbindung >ANTI-TERRORIST< quantitativ am bedeutensten (29 Nennungen). Speziell die Formen mit >ANTI…<, >BIO…< und >COUNTER…< sind ab dem 12.09.01 zu geläufigen und häufig verwendeten Standardformen avanciert. In der Morphologie existieren geteilte Meinungen darüber, ob die Kompositabildung das Ergebnis eines morphologischen oder eines syntaktischen Prozesses ist oder beides (Bauer 1995, S.100). Auf der einen Seite wird argumentiert, dass durch Komposition neue Sinneinheiten bzw. Lexeme geschaffen werden. Auf der anderen Seite 193 gelten Komposita als Sequenzen von Lexemen, die im linguistischen Teilgebiet Syntax abzuhandeln sind (Bauer, 1995, S. 102). Vergleichen wir schließlich die Tabellen für die Wortgruppen „Arabisch/ Islamische Welt“ und „Terror“, so stellen wir fest, dass für erstere die meisten Komposita in K3 zu finden sind, für die Wortgruppe „Terror“ jedoch in K1. In beiden Fällen sind für K2 vergleichsweise wenig Formen zu verzeichnen. Vergleichen wir jedoch die Befunde der Analyse der Wortgruppe „Islamische Welt“ mit denen für die Komposita (in Tab. 44 fettgedruckt), so stellen wir ein Ungleichgewicht fest. Die Anzahl der Komposita beträgt 15 für K1 und 15 für K3. Die Wortgruppe „Islamische Welt“ ist hingegen in K1 (847 Token) fast dreimal so stark wie in K3 (588, stand. Wert 295). Das Verhältnis von Komposita mit einem Bestandteil aus der Wortgruppe „Arabisch“ ist hingegen 11 (K1) zu 71 (K3). Der Umfang der Wortgruppe „Arabisch“ beträgt insgesamt 235 in K1 vs. 975 (st. Wert 488) in K3. Das ist ein Indiz dafür, dass eine Auseinandersetzung explizit mit der arabischen Welt nach 9/11 vermieden wurde. Des Weiteren ist zu bemerken, dass einige Formen eher dazu prädestiniert sind, Angst zu erzeugen als diese zu verhindern, z.B. der Komplex >BIOTERROR…< mit insgesamt 27 Nennungen. Ferner muss der Wert von 190 Komposita in K1 mit einem Bestandteil der Wortgruppe „Terror“ als außerordentlich hoch bezeichnet werden. 6.6 Weitere Analysedaten In einem letzten Analyseschritt werden Berechnungen im Rahmen des Zipfschen Gesetzes und die Entropie vorgenommen. 6.6.1 Anwendung des Zipfschen Gesetzes Wenn wir die Textstatistiken miteinander vergleichen, so können wir hinterfragen, ob das Zipfsche Gesetz für die Gruppierungen der Wortlängen zutrifft. Dieses Gesetz besagt, dass kürzere Wörter häufiger verwendet werden als längere, oder anders ausgedrückt: je 194 größer ein Wort von der Länge her, desto wenig häufig wird es verwendet (Zipf 1965, S.22). Für jedes einzelne der drei Hauptkorpora trifft das Zipfsche Gesetz zu, auch wenn als Ausnahme die Wörter, die aus einem einzigen Buchstaben bestehen, unterrepräsentiert sind. Zipf bezieht seine Beobachtungen nicht explizit auf die Anzahl der Buchstaben, sondern auf Silben und phonemische Einheiten. Wordsmith ermittelt hingegen die Anzahl der Buchstaben. Die Kategorie „Wörter aus zwei Buchstaben“ (2-letter-words) ist im Vergleich zu dem am stärksten vertretenen Wert (3-letter-words) geringfügig kleiner. Dieses liegt daran, dass es im Englischen sehr viele Wörter gibt, die zwar aus nur einer Silbe bestehen, jedoch aus drei Buchstaben, wie >THE<, >AND< und >FOR<. Fassen wir K1 und K2 zu einem Großkorpus für 2001 zusammen und vergleichen die Worthäufigkeiten für 2001 und 1990, indem wir die Anzahl der Buchstaben pro Wort als Kategorien nehmen, so stellen wir fest, dass im Korpus von 1990 ein Überhang existiert, was längere Wörter anbetrifft, also Wörter ab einer Größe von sechs Buchstaben: (K1 + K2) 1-letter words 58.533 2-letter words 338.574 3-letter words 395.480 4-letter words 322.848 5-letter words 224.315 6-letter words 184.526 7-letter words 171.729 8-letter words 124.218 9-letter words 91.277 10-letter words 53.384 11-letter words 28.870 12-letter words 14.534 13-letter words 7.766 14(+)-letter words 2.940 K3 55.113 342.545 387.468 303.438 216.448 185.055 175.738 128.695 102.882 60.709 31.358 17.584 9.155 3.405 Tab. 46: Anzahl der Wörter nach Wortgröße in (K1 + K2) und K3 (Die höheren Werte im Vergleich sind fettgedruckt.) Dieselben Werte lassen sich in einem Balkendiagramm darstellen: 195 or ds 3le tte rw or ds 5le tte rw or ds 7le tte rw or ds 9le tte rw or 11 ds -le tte rw or 13 ds -le tte rw or ds K1+K2 K3 1le tte rw Anzahl der Wörter/ Wortlänge 450.000 400.000 350.000 300.000 250.000 200.000 150.000 100.000 50.000 0 Wortlänge Grafik 7: Darstellung der unterschiedlichen Wortlängen bei (K1+K2) und K3 Wir erkennen anhand des Balkendiagramms, dass in den Korpora trotz geringer Schwankungen dieselbe Tendenz zu erkennen ist. Bis einschließlich der Kategorie 5-Letter-Words ist ein Überhang bei K1+K2 zu finden, mit Ausnahme der Kategorie 2-Letter-Words. Hier ist die Wert für K3 geringfügig größer. Ein Inspizieren der Häufigkeitslisten ergab, das die Verteilung der Type >MR< dafür verantwortlich ist (K1+K2: 9162 Token; K3: 13 581 Token, siehe auch 6.2.3). Ab der Kategorie 6-Letter-Words ist wieder ein Überhang der Werte in K3 zu verzeichnen. Das weist eindeutig auf einen Trend zur bevorzugten Verwendung von kürzeren Wörtern in 2001 hin, mit Ausnahme der Gebräuchlichkeit der oben erwähnten Type >MR<. In einer weitere Feinabstimmung können die Häufigkeit bei den Wortlängen für K1 und K2 festhalten werden, um weitere Veränderungen, verursacht durch 9/11, aufzuspüren. Wir können anhand der folgenden Tabelle erkennen, dass der Trend zu einer fortschreitenden Verkürzung der Wörter, in diesem Fall der zunehmenden Verwendung von kürzeren Wörtern, nach dem 11. September 2001 eine geringfügig rückläufige Tendenz hatte. 196 K1 1-letter words 28.128 2-letter words 170.671 3-letter words 196.963 4-letter words 158.947 5-letter words 111.625 6-letter words 91.246 7-letter words 87.498 8-letter words 62.798 9-letter words 47.333 10-letter words 26.777 11-letter words 14.786 12-letter words 7.387 13-letter words 3.928 14(+)-letter words 1.494 K2 30.405 167.903 198.517 163.901 112.690 93.280 84.231 61.420 43.944 26.607 14.084 7.147 3.838 1.446 Tab. 47.: Anzahl der Wörter nach Wortgröße in K1 und K2 (höhere Werte fettgedruckt.) Mit Ausnahme der 2-Letter-Words sind in den Kategorien 1-LetterWords bis zu den 6-Letter-Words die höheren Häufigkeiten in K2 zu finden. Eine Überprüfung der höchsten Eingänge für die 2-LetterWords in den beiden Korpora ergab, dass der Zahlenwert in K1 hauptsächlich durch die Typen >US< und >AL< verursacht wurde. >US< erreicht in K1 2186 Token, in K2 nur 742.28 Der arabische Artikel >AL< bringt es in K1 auf 549 Nennungen, in K2 nur auf 44. Ab einer Größe von sieben Buchstaben sind mehr Wörter in K1 zu finden als in K2. Ist dies vielleicht ein Indiz für eine Verkomplizierung von Sprache und Ausdrucksweise nach den Terroranschlägen? Um ein abschließendes Urteil treffen zu können, müssten weitere Zeitintervalle und Korpora gebildet werden. Zur besseren Veranschaulichung sei ein Histogramm verwendet: 28 In K3 fungiert >US< zu 78 % als Abkürzung von United States, in K2 zu 49 % und in K1 zu 81 %. In den restlichen Fällen ist >US< ein Personalpronomen. 197 200.000 150.000 K1 K2 100.000 50.000 0 1le t 2- ter le wo tt 3- er rds le wo t 4- ter rds le wo t 5- ter rds le wo tt 6- er rds le wo t 7- ter rds le wo t 8- ter rds le wo t 9- ter rds le w 10 tter ord -le w s 11 tter ord -le w s 12 tte ord -le r w s 13 tter ord 14 -le wo s (+ tte rd )-l r w s et te ord rw s or ds Anzahl der Worter/ Wortlänge 250.000 Wortlänge Grafik 8: Anzahl der Wörter nach Wortgröße in K1 und K2 Das Balkendiagramm verdeutlicht, dass es nur zu geringfügigen Veränderungen gekommen ist. 6.6.2 Die Entropie der Typen Mit den von Wordsmith erzeugten Daten lässt sich jede nur erdenkliche mathematischen Spielereien durchführen. Abschließend sei hier auf die Entropie, den mittleren Informationsgehalt, verwiesen. Die Entropie zählt zu den formalen Aspekten der Medienrealität (Jarren/ Bonfadelli 2001, S. 393). Wordsmith ermittelt für die Anzahl der Typen recht divergierende Werte (siehe Punkt 6.1.1). In K1 sind es 35 307 Typen bei rund einer Mio Wörtern, in K2 sind es 36 467 Typen bei rund einer Mio Wörtern und in K3 finden sich 48 738 Typen bei rund zwei Mio. Wörtern. Für diese Werte lässt sich die Entropie, d.h. der mittlere Informationsgehalt berechnen. Er errechnet sich aus dem logarithmus dualis (ld) der Anzahl aller verwendeten Zeichen. In der folgenden Berechnung ist die Anzahl der Typen mit der Anzahl der verwendeten Zeichen gleichgesetzt. Für die drei Korpora ergaben sich daraus die folgenden Werte: 198 Korpus K1 hat eine Entropie von 15,11 Bit, Korpus K2 hat eine Entropie von 15,15 Bit, und K3 15,57 Bit. Der Informationsgehalt ist demnach in K3 am höchsten und in K1 am geringsten. Es gibt Theorieansätze, bei denen die Type-Token Relation als Indikator für den individuellen Wortschatzumfang, die verbale Kreativität und die Intelligenz des Verfassers gilt (siehe 6.1.2). Das kann unter Abstrichen auch für die Entropie in Bezug auf die Anzahl der Typen behauptet werden. Laut Lewandowski (1990, S.1200) können speziell schichtspezifische Unterschiede aus der Anzahl der verschiedenen Wörter ersichtlich werden. Doch aufgrund des HaloEffekts sagen uns beide Größen, sowohl TTR als auch Entropie relativ wenig, solange wir nicht wissen, wie viele verschiedene Journalisten insgesamt Artikel zu der Erhebung beigesteuert haben. 7. KAPITEL: Schlussbetrachtung (Zusammenfassung, Kritik und Ausblick) Abschließend ist an dieser Stelle zu betonen, dass die gewonnenen Daten sehr umfangreich sind, so dass bei der Zusammenfassung der Ergebnisse eine sinnvolle Selektion vorgenommen werden musste. Die im 6. Kapitel dargelegten Auswertungen zeigen nur einen Ausschnitt aus unzähligen weiteren möglichen AnalyseKonstellationen. Es ließen sich diverse andere Fragestellungen finden, die letztendlich den Rahmen der Arbeit gesprengt hätten. Speziell die Möglichkeiten im Bereich der Zusammenstellung von Wortgruppen und Konkordanzen mit Kontextwörtern sind nahezu unerschöpflich. Diese Methodik war unumgänglich, um beweiskräftiges Material für die Beantwortung der Frage zu sammeln, ob es bei britischen Qualitätszeitungen zu Qualitätsveränderungen gekommen ist. Die weiteren Punkte dieses Schlusskapitels bestehen aus einer kritischen Betrachtung der Korpuslinguistik und einem Ausblick auf die Zukunft dieser noch vergleichsweise jungen linguistischen Disziplin. Diese Arbeit kann als Pilotstudie gesehen werden, die sondieren soll, was die wesentlichen Veränderungen in der Pressesprache am Ende des 20. und am Beginn des 21. Jahrhunderts sind. Letztendlich zeigt sich, dass die von Wordsmith erstellten Korpusstatistiken und 199 die Keywordlisten die aufschlussreichsten Ergebnisse liefern, was sprachliche Veränderungen betrifft. Die Häufigkeits- und die Konkordanzlisten hingegen liefern riesige Mengen an Daten bzw. Detailinformationen, bei denen vieles übersehen, aber auch vieles ungewollt in den Vordergrund gedrängt werden kann. 7.1 Zusammenfassung der Ergebnisse Im Folgenden sind die Ergebnisse der Korpusanalyse thesenartig zusammengefasst: 1. Die durchschnittliche Satzlänge hat sich von 1990 bis 2001 verringert, stieg nach dem 11. September wieder leicht an. 2. Die Type-Token Relation hat sich zwischen 1990 und 2001 verringert, stieg nach dem 11. September wieder leicht an. 3. Die Tendenz, dass gemäß dem Zipfschen Gesetz kürzere Wörter häufiger verwendet werden als die längeren Wörter, hat sich von 1990 bis 2001 verstärkt, jedoch wurde diese Tendenz nach dem 11. September geringfügig umgekehrt. 4. Die durchschnittliche Artikellänge hat sich zwischen 1990 und 2001 stark erhöht. Nach dem 11. September ist es zu einem erneuten Anstieg der Artikellänge gekommen. 5. Die Auswertungen von Konkordanzlisten hat ergeben, dass Bestandteile der Wortgruppe „Terror” häufig eine Kollokation aus der Wortgruppe „Islamische Welt” erhalten, seltener aus der Wortgruppe „ Arabisch.” 6. Die Auswertung der Keyword-Listen zeigt, dass es zu einer verstärkten Verwendung von Pronomina in 2001 gegenüber 1990 gekommen ist, bei einer gleichzeitigen Zunahme der Verwendung von Namen (>BUSH<, >BLAIR<, >BIN LADEN<), was als Indikator für eine Boulevardisierung gewertet werden kann. 7. 1990 rangierten vorrangig Bezeichnungen für Orte des politischen Geschehens als Schlüsselbegriffe. 8. Die Verwendung der Begriffe >ISLAMIC< und >MUSLIM< in K1 kann als „nahezu diskriminierend“ betrachtet werden. 9. Die lexikalische Dichte und die Entropie der Korpora haben sich seit 1990 von Korpus zu Korpus verringert. 200 10. Es ist zu einem starken Anstieg der Präsenz der Wortgruppe >TERROR< nach 9/11 gekommen. Das Gleiche gilt für eine Reihe anderer Begriffe aus diesem Themenkomplex. 11. Die Summe der Anredeformen (>MR<, >MRS< und >MS<) hat sich von 1990 zu 2001 deutlich verringert. 12. Die Keyness-Werte sind in K3 verglichen mit (K1 + K2) am höchsten. 13. Bei der Berichterstattung über den 11. September handelt es sich um Beitragswellen, die beim Rezipienten einen nicht der Realität entsprechenden Eindruck einer Häufung bestimmter Ereignisse vermitteln. 14. Im Korpus von 1990 wurde deutlich häufiger mit Prozentwerten operiert als in den Korpora von 2001. Das Gleiche gilt für die Verwendung von Altersangaben mit Hilfe der NP-Apposition >AGED<. Das lässt auf Veränderungen bei der journalistischen Arbeit schließen. 7.1.1 Gründe für die Veränderungen des Wortschatzes Es sind unterschiedliche Gründe für die Veränderungen des in Zeitungen verwendeten Wortschatzes aufzuführen. Zum einen kann angenommen werden, dass in den Verlagshäusern der Zeitungen ein Generationswechsel stattgefunden hat, dass neue Redakteure eine andere sprachliche Kompetenz einbringen, was von deren Sozialisationsweg abhängig ist. Ein weiterer Punkt ist die Tatsache, dass sich politische Systeme verändern, andere Parteien an die Macht gelangen und neue Regierungen gewählt werden. Drittens können sich neue Arbeitstechniken wie neue Formen der Texterstellung, neue Recherchemethoden durch das Medium Internet und eine damit einhergehende Umwälzung des Redaktionsalltages in der von den Redakteuren verwendeten Sprache niederschlagen. Viertens erfordert der Lauf der Zeit neue Begriffe: neue Ideologien, Erfindungen und Gesetze spiegeln sich in den Zeitungen wider, in denen immer noch mehr Text verwendet wird als in den Nachrichtensendungen. Für die Beschreibung dieser Vorgänge sind ständig neue politische, technischwissenschaftliche Termini erforderlich. Last but not least ist die Wortwahl maßgeblich abhängig von den in den Zeitungen 201 reflektierten Themen. Ein Negativereignis wie Nine-Eleven löst zwangsläufig eine Ereigniskette aus, die massive Veränderungen in der Presseberichterstattung zur Folge hat. Die Sprache in den Zeitungen ist immer ein Reflex auf die vorangegangenen und bevorstehenden Ereignisse und den dazugehörigen Fachwortschatz. Doch auch eine zunehmende Boulevardisierung spielt eine wichtige Rolle, die als Qualitätsverlust gewertet werden kann. Die verschiedenen medienrelevanten Akteure gewinnen auf Kosten der Themenvielfalt immer mehr an Publizität. Seit dem Aufkommen des Internet wurde dieses neue Medium zunehmend attraktiver. Durch neues Textdesign und Pressefotos gestalten sich die Online-Zeitungen immer farbenprächtiger, was auf das Printprodukt zurückwirkt. Die Tatsache, dass 1990 noch viel häufiger mit Prozentwerten in den Zeitungsartikeln operiert wurde als 2001, lässt darauf schließen, dass die neuen Recherchemethoden des Internet andere Sichtweisen zu etablieren vermochten. Das gilt auch für die NP-Apposition >AGED …<, die 1990 deutlich häufiger verwendet wurde. Das Alter der Medienakteure wird zunehmend zu einem Tabuthema. 7.1.2. Sprachliche Veränderungen durch die Internet-Einführung Laut Bucher (1999) wirken veränderte Rezeptionsgewohnheiten, die aus der Internetnutzung resultieren, zurück auf das Printprodukt. Wenn wir in einigen Fällen die Kohärenz innerhalb von Texten betrachten, fällt auf, dass in 2001 viele Artikel im Verlauf des Textes vom Thema der Überschrift abweichen. Das ist ein Hinweis auf den neuen Designer-Journalismus. Inwieweit abgesehen von den direkten Auswirkungen des neuen Textdesigns und Veränderungen bei der Verwendung von Begriffen wie >PER CENT< und >AGED< auch andere Veränderungen von 1990 bis 2001 aus der Einführung des Internet resultieren, wie z.B. die Verkürzung der durchschnittlichen Satzlänge, kann nicht mit Sicherheit beantwortet werden. Fakt ist, dass das Internet das journalistische Arbeiten revolutioniert und das Denken verändert hat. Das Verwenden kürzerer Zeitungsartikel und kürzerer Sätze kann auf die Delinearisierungstendenzen in den Printmedien zurückgeführt 202 werden, die als Reflex auf die neue Form der Online-Zeitung zu verstehen sind (siehe 4.10). Die automatische Vorgabe von Artikelund Zeilenlänge kann dabei eine entscheidende Rolle gespielt haben. Ferner erwartet die neue Welt der Online-Kommunikation kürzere Sätze, ob im Chat, in Emails oder Newsgroups. Wer sich nicht kurz und bündig ausdrückt, läuft Gefahr, als langatmig zu gelten. Das kann sich auch auf die Arbeit der Journalisten ausgewirkt haben. Ob veränderte Häufigkeiten bei den „Naming“-Strategien, bei Pronomina wie (>I<, >SHE<, >HE<, >HER<, >HIS<) oder auf der anderen Seite bei der Schlüsselwortfunktion von Orten des politischen Geschehens tatsächlich durch die neuen Arbeitsbedingungen des Internet verursacht wurden, kann in der hier vorliegenden Arbeit nicht mit Sicherheit beantwortet werden. Es kann sein, dass die Allgegenwart von Prominenten im Internet auf die Zeitungsberichterstattung einwirkte, so dass im neuen Millennium zunächst Personen eine wichtigere Rolle spielten als Sachthemen, bis der 11. September einen Paradigmenwechsel einleitete und fortan der „War on Terror“ die Agenda prägte. Wenn wir die Boulevardisierung ebenso als Folge der Delinearisierung betrachten - viele OnlineZeitungen tendieren zu einer Art Boulevardvariante - so können wir auch die Veränderungen bei der Verwendung von Anredeformeln und Pronomina hinzuzählen. Es ist nicht auszuschließen, dass Veränderungen im Rahmen des Zipfschen Gesetzes, der TTR und der lexikalischen Dichte auf den neuen Kommunikationsgewohnheiten basieren. Viele Vermutungen lassen sich erst bekräftigen, wenn die Mitarbeiter der Redaktionen mit Hilfe von Fragebogen zu Details der InternetEinführung befragt würden oder die Sprachprofile einzelner Journalisten vor und nach der Einführung miteinander verglichen wurden. In den hier vorliegenden Korpora sind die individuellen Sprachprofile aufgrund des Halo-Effekts irrelevant (siehe 7.1.5). Es ist festzuhalten, dass das Nachholbedürfnis in technischen Fragen, verursacht durch die Einführung von Internet und Online-Zeitungen, offensichtlich auf Kosten der Hinwendung zu Sachthemen geschah (cultural lag, knowledge gap, Kunczik, Zipfel, 2001, S. 384 ff.), denn die Keyness-Listen belegen eine Einschränkung der Themenvielfalt in 2001 gegenüber 1990. Das kann als weitere Qualitätseinbuße gewertet werden. 203 7.1.3 Emotionsneutrale Datenauswertung durch den Rechner Sprachliche Veränderungen wie die infolge des 11. September können im Rahmen einer computergestützten Korpusanalyse adäquat aufgedeckt werden, weil Computer nüchtern und unspektakulär die fokussierten Artikel analysieren. Korpusanalyseprogramme können erfolgreich angewendet werden, ohne dass eine etwaige emotionale Blockade, Trauer, Depression oder gar Rachsucht die Analyse verfälschen. Speziell die horrorfilmähnlichen Bilder wie die des Einschlagens der Passagierflugzeuge in die beiden Türme des "World Trade Centers", die brennenden Türme, die aus dem Gebäude springenden Menschen, die Panik auf den Straßen und schließlich das Zusammenstürzen der beiden Wolkenkratzer, können unter Umständen "Anxiety Disorder", "Post Traumatic Stress Disorder" und "Memory Disorders" auslösen (siehe: Baddeley et al. 1995, S.618), so dass eine intellektuelle Auseinandersetzung mit diesem Thema unter Umständen formalen, inhaltlichen und ausdrucksbedingten Verzerrungen unterliegt. Für den Computer sind diese Bilder und deren Begleitumstände irrelevant, er verarbeitet alle von ihm verwertbaren Texte technisch gleich. Die Begleitumstände und Inhalte werden zum verschwindenden Moment (Holzkamp 1985, S.311). Auch wenn Computer nur wenige Formen der Textanalyse durchzuführen vermögen, so tun sie es mit emotionaler Neutralität. Ein Mensch hingegen kann bei der Datensammlung, der Bedienung der Software und der Datenauswertung Fehler begehen. 7.1.4 Der Umgang mit dem Thema Terror Zweifelsohne ist der Terrorismus eines der schrecklichsten und unangenehmsten politischen Probleme. Terroristen sind Schwerstkriminelle und keine religiösen Menschen. Die Attentäter von New York waren zwar Araber, werden in der Berichterstattung jedoch nicht als solche benannt. Im Zusammenhang mit dem 11. September nutzen sowohl die Terroristen und ihre Peripherie die Religion für ihre niederen politischen Ziele aus als auch mehrere Führungspersönlichkeiten der westlichen Welt, die Schlagwörter wie 204 West vs. Islam, Christianity against Islam oder crusade auf die Agenda setzen. Die westlichen Medien verhindern diese fatale Verbindung zwischen Terror und Religion nicht, und begünstigen damit den Aufbau eines neuen Feindbildes. Was die Zeitungsberichterstattung nach 9/11 anbetrifft, erhalten Wörter wie >TERROR<, >TERRORIST< und >TERRORISM< in fast fahrlässiger Weise die Konnotation >ISLAMIC< oder >MUSLIM<. Dadurch wird ein Kampf der Kulturen heraufbeschworen, der bereits zu Krieg geführt hat. Die von Wordsmith erstellten Konkordanzlisten sind ein ausgezeichnetes Mittel, um diese Schwächen der Zeitungsberichterstattung aufzuspüren. Was die Verwendungen von Typen aus den Wortgruppen Arabisch und islamische Welt anbetrifft, so ist hier zu vermerken, dass obwohl 15 der 19 Attentäter des 11. September saudi-arabische Staatsbürger waren, Ausdrücke wie >ISLAMIC< und >MUSLIM< im Rahmen der Berichterstattung über die Folgen dieses Verbrechens der Verwendung >ARAB< und >ARABIC< vorgezogen wurden. Auch das häufig besser geeignete Wort >ISLAMIST< kommt verhältnismäßig selten vor. Das ist sowohl auf die Ausnahmesituation in den Zeitungshäusern nach 9/11 als auch auf das mangelnde Fachwissen (Knowledge-Gap, siehe 5.7) bezüglich des Themenkomplexes Terror zurückzuführen. Was die Verwendung von Komposita aus dem Bezugsrahmen Terrorismus-Arabisch-Islamische Welt anbetrifft, ist festzuhalten, dass der Telegrammstil, der durch diese Wortverbindungen erzeugt werden kann, nach Nine-Eleven nur verstärkt für Bestandteile der Wortgruppe „Terror“ (in K1: 190 Komposita) zu verzeichnen ist (Kap. 6.5.2.2), nicht aber für Elemente der Wortgruppen „Islamische Welt“ (K1: 15 Komposita) und „Arabisch“ (K1:11); (Kap. 6.5.2.1). Mehr als jedes zehnte Wort der Wortgruppe „Terror“ (insg. 1808 Nennungen) aus K1 ist ein Kompositum, in K3, zu Zeiten der KuwaitKrise, bei deutlich kleinerer Gruppengröße sogar fast jedes neunte Wort. Diese Proportion wird in den anderen mitanalysierten Wortgruppen nur von der Gruppe „Arabisch“ in K3 erreicht. Ferner wirken einige Wortkombinationen eher angsterzeugend, dazu zählen undurchsichtige Formulierungen wie >BIOTERRORISM<, >COUNTER-TERRORISM< oder >ANTI-TERRORIST<. 205 7.1.5 Halo-Effect und Primacy-Recency-Effect Ein weiterer zu berücksichtigender Faktor ist die Tatsache, dass die analysierten Artikel nur von wenigen Journalisten geschrieben wurden. Dennoch stehen diese stellvertretend für die Pressesprache eines ganzen Landes, für die Sprache der Qualitätszeitungen während des festgehaltenen Zeitraumes. Dieser Halo-Effect (Trautner 1997, S.439) kann mit dem Satz „Write once, read many times“ umschrieben werden. Ferner wird ein einzelnes Exemplar von mehr als einer Person gelesen. Ob die Reduzierung der Type-Token Relation von 1990 zu 2001 eventuell mit der Tatsache zusammenhängt, dass 1990 in den verwendeten Zeitungen mehr Redakteure angestellt waren als 2001, konnten im Rahmen dieser Analyse nicht überprüft werden. Der Primacy-Recency-Effect der ursprünglich angesetzten Korpusgrenzen konnte umgangen werden, indem eine Korpusgrenze direkt auf den 11. September gelegt wurde. Sonst wäre erstens die sprachliche Veränderung durch den 11. September weniger ersichtlich geworden. Zweitens konnte das Korpus von 1990 sowohl mit einem Korpus von 2001 ohne den Effekt des 11.9. verglichen werden als auch mit einem Korpus, das maßgeblich von diesem Ereignis beeinflusst wurde. Ein weiterer Primacy-Recency-Effect ist durch die Einführung des Internet messbar, obwohl dieses im Gegensatz zu 9/11 kein schlagartiger Prozess war. Dieses neue Medium brauchte fast ein halbes Jahrzehnt, um sich zu etablieren, und die Fortentwicklung ist noch nicht abgeschlossen. 7.2 Korpuslinguistische Methoden kritisch betrachtet Trotz der Fülle an Ergebnissen, die im Rahmen dieser Dissertation gefunden wurden, soll an dieser Stelle nicht unerwähnt bleiben, dass der Einsatz von Wordsmith eine ganze Reihe von Problemen mit sich bringt, die z.T. auch bei anderer Korpusanalyse-Software nicht zu vermeiden gewesen wären. Diese Probleme stehen im Zusammenhang mit der technischen Verarbeitung von Sprache generell. Dazu zählen 206 sowohl Satz- und Wortgrenzenerkenung als auch das Erkennen von Synonymen, Homonymen, Polysemie und Komposita. Wäre beispielsweise das Programm in der Lage zu differenzieren, dass mit >BUSH< 1990 eine andere Person gemeint war als 2001, so wären die Namen als Schlüsselbegriffe in Keyness-Listen sehr viel weiter oben zu verzeichnen gewesen. Die Tokenzahlen heben sich jedoch in den Keyness-Listen bei identischer Schreibweise gegenseitig auf. Wenn wir das Wort >ALLIANCE< als Schlüsselwort entdecken, müssen wir bedenken, dass damit zum einen die Allianz gegen den Terror gemeint sein kann, zum anderen die Northern Alliance der Taliban. Wir brauchen deshalb detailiertes Hintergrundwissen, wenn wir Zuordnungsfehler vermeiden wollen. Die Defizite bei der Satz- und Wortgrenzenerkennung lassen sich auf die unterschiedlichen Ursprungsmedien der Zeitungsartikel zurückführen, die häufig kein einheitliches Textlayout zur Verfügung stellen. Ferner werden Wörter, die 14 Buchstaben und mehr beinhalten (14(+)-letter-words) in den Korpusstatistiken zu einer Kategorie zusammengefasst. Das hat wiederum geringe Konsequenzen für Zählungen im Zusammenhang mit dem Zipfschen Gesetz. In den Konkordanzlisten werden Satzgrenzen nicht berücksichtigt, so dass unter Umständen Kollokationen oder Kontextwörter einem anderen Satz angehören als das Suchwort. Des Weiteren sei an die Tatsache erinnert, dass es bereits bei einer Korpusgröße von einer Mio Wörtern zu einer ungenauen Berechnung der durchschnittlichen Satzlänge kommen kann. Wenn wir uns ebenso dieser Probleme bewusst sind, wie der Gesetzmäßigkeiten des erfolgreichen Korpusdesigns, so kann eine Korpusanalyse fruchtbare Ergebnisse liefern. 7.2.1 Schlüsselwort ungleich Inhalt Bei korpuslinguistischen Verfahren sollte stets bedacht werden, dass ein betrachtetes Schlüsselwort nicht stellvertretend für den Inhalt von Texten steht. Wenn Begriffe besonders häufig aufgelistet werden, so ist dieses lediglich ein Indiz dafür, dass das Bezeichnete häufig 207 berichtenswert erschien; ob es in einem positiven oder negativen Zusammenhang verwendet wird, bleibt im Verborgenen, bis entweder die Quelltexte gelesen oder die Konkordanzlisten analysiert wurden. Die Konkordanzen geben immer nur einen sehr kurzen Ausschnitt von einer Zeilenlänge preis. Anders ist es bei Schlüsselbegriffen wie >TERRORISM<. Die Korpusdaten nach dem 11. September lassen auf eine Katastrophe schließen, >TERRORISM< hat stets eine negative Konnotation. Doch auch hier stehen die Details im Hintergrund. Der genaue Inhalt, die vielen beschriebenen Einzelschicksale, sind den Daten nicht zu entnehmen, sondern nur den Quelltexten, die wiederum nur einen kleinen Ausschnitt der Realität abdecken können. Auf der anderen Seite wird mit den vielen Mutmaßungen in Zeitungsartikeln so verfahren, wie mit den eindeutigen Fakten: beides wird objektiv vom Computer analysiert. Dass einige Wörter polysem sind oder einen weit gefächerten Bedeutungsspielraum haben, muss ebenso berücksichtigt werden wie die Tatsache, dass es weitere Synonyme gibt, die ein und dieselbe Sache bezeichnen, dass Fremdwörter verwendet werden oder dass Rechtschreibfehler vorliegen, die ein Wort an anderer Stelle der Liste aufrufen oder zumindest eine einheitliche Zuordnung erschweren. Neben den Rechtschreib-, Ausdrucks-, Wortverwendungsfehlern, Schreibvarietäten etc. gibt es eine nicht zu unterschätzende Anzahl an technischen Fehlern wie fehlerhafte Autokorrekturen, typografische Fehler, Satzfehler, Textverarbeitungsfehler, Layoutfehler, Trennfehler, die bei der technischen Erstellung der Texte entstehen. Diese Art von Fehlern vermag Wordsmith technisch nicht aufzuspüren. Ein Fachmann, der ausschließlich auf die Korpusstatistiken und Wortlisten zurückgreifen kann, ist zwar in der Lage, ein Urteil über die lexikogrammatikalische Einordnung eines Textes zu treffen, jedoch nur unter Vorbehalt über den Inhalt. Vergleichskorpora helfen dann nur bedingt weiter. Diese sind zwar in der Lage, Textkorpora gegeneinander „aufzurechnen“, jedoch nur aus einer korpuslinguistischen Warte und nicht aus einer hermeneutischen. Mikro- und Makro-Ebene der verwendeten Texte können anhand der Analysedaten nur erahnt werden. Bei einer Korpusanalyse werden die Texte in ihre Bestandteile zerlegt, die wiederum in Wortlisten und Statistiken neu arrangiert werden, aber auch in Form von 208 Kollokationslisten. Der ursprüngliche Textzusammenhang, die Bindung oder Kohärenz der einzelnen Glieder geht verloren. Das abschließende Urteil dieser Dissertation muss deshalb zurückhaltend formuliert werden. Die Sprache des Journalismus ist nicht schlechter geworden, jedoch hat die technische Revolution im Computersektor als längerfristiger Prozess Spuren hinterlassen, ebenso wie das durch den 11. September ausgelöste Trauma als Schlüsselereignis in der westlichen Zivilisation, gespiegelt in der globalen Medienlandschaft. 7.2.2 Wie sinnvoll ist der Einsatz der Korpuslinguistik? Wie die Auswertungen in Kapitel 6 gezeigt haben, ist die Korpuslinguistik ein sinnvolles Instrument der statistischen Textanalyse. Sie wertet die Daten emotionsneutral aus. Dennoch kann es, wie wir am Beispiel der Auszählungen der durchschnittlichen Satzlängen gesehen haben, zu Rechen- oder Zählfehlern kommen, die auf eine unzureichende Erkennung der Satzgrenzen zurückzuführen sind. Eine Korpusanalyse ist immer nur so gut wie die Mischung aus Fähigkeiten des Analyseprogramms, ausgewogenem Korpusdesign und Fachwissen des Korpusanalytikers. Es sind speziell die Konkordanzlisten, die uns die neuralgischen Punkte der Berichterstattung nach 9/11 aufzeigen können, indem das bisher Berichtete mit Hilfe von Kontextwörtern neu sortiert wurde. Es sind die Politkerreden und die unterstützenden Stellungnahmen der Journalisten, die den Verlautbarungsjournalismus zu etablieren vermochten. Das neue Feindbild Islam wurde, wie diese Dissertation zeigt, von der britischen Presse mitgetragen. Und es wurde vermieden, den Westen und den arabischen Raum in einen Gegensatz zu stellen. Stattdessen wurden der Islam und der Westen in Opposition gestellt. Eine Abgrenzung von Islam und dem arabischen Raum kommt jedoch an den entscheidenden Stellen der Berichterstattung zu kurz. Die Konfrontation der Religionen wurde damit heraufbeschworen, die später in den Mohhammed-Karikaturenstreit mündete. 209 7.3 Rückschlüsse auf die Qualität von Texten mittels quantitativer Analysen Zunächst lässt sich nicht von quantitativen Veränderungen bei Zeitungstexten, ob anhand der durchschnittlichen Artikellänge, Artikelmenge, Satzlänge, Wortlänge, Worthäufigkeiten, der Stärke ausgewählter Wortgruppen oder der Type-Token Relation auf qualitative Veränderungen der Zeitungssprache schließen. Dieses geschieht primär durch die Beurteilung der ausformulierten Sätze und Texte im dazugehörigen Kontext. Im Rahmen von Korpusanalysen hingegen lassen sich bestimmte Detailfragen eines logisch und homogen gestalteten Presse-Korpus gezielt fokussieren, um zunächst quantitative Aussagen über Zeitungstexte zu ermöglichen. Zu diesen Detailfragen, bei denen quantitative Analysen lohnenswerte Ergebnisse zur Beurteilung von Qualität liefern, gehören quantitative Veränderungen bei den Höflichkeitsformen und die Kürze oder Prägnanz von Texten. Dazu zählen ferner Häufigkeiten von emotional negativ beladenen Ausdrücken, Themen, Kontextwörter, Schlüsselwörter, Beitragswellen, Verdrängung von Themenkomplexen, die anhand von Keyness-Listen und Wortgruppen festgestellt werden können, Pressephonologie, uneinheitliche Rechtschreibkonventionen oder Boulevardisierungstendenzen. Das fachmännische Wissen des geschulten Linguisten ermöglicht es, aus den Korpusdaten die Aspekte herauszugreifen, die Rückschlüsse auf Qualitätsveränderungen ermöglichen. Wenn ein sprachliches Gleichgewicht durch gesellschaftliche Veränderungen oder sogar Terroranschläge in ein Ungleichgewicht überführt wurde, ist dieses feststellbar, sobald Häufigkeiten oder Relationen nicht mehr dem erwarteten Bild entsprechen. Wenn negativ beladene Kontextwörter signifikant häufig verwendet werden (>ISLAMIC TERROR<), obwohl ein neutraler Terminus erforderlich ist, kann dieses in Konkordanzlisten dargestellt werden. Finden wir auf diesem Weg Hinweise auf eine fragwürdige journalistische Praxis - und das Errichten von Feindbildern und Stigmatisieren von religiösen Gruppen gehört dazu - so haben wir eine weitere Schnittstelle zwischen quantitativer und qualitativer Analyse gefunden. 210 Qualitativ hochwertiger Journalismus ist anhand bestimmter Kriterien messbar, wie etwa durch die Berücksichtigung von Nachrichtenfaktoren und journalistischen Qualitätskriterien. Offenbaren die Keynesslisten, dass bestimmte Themen und deren Schlüsselwörter über einen längeren Zeitraum bevorzugt oder vernachlässigt wurden, so lässt sich vermuten, dass Kriterien wie z.B. „Fairness“, „Transparenz“ und „Richtigkeit“ (Kunczik, Zipfel 2001, S. 276) nicht ausreichend umgesetzt wurden. Was die Bewertung von Zeitungsartikeln anbetrifft, gibt es sicher unterschiedliche Standpunkte, ob eher kurze oder lange Artikel und Sätze bevorzugt werden und welche Wortwahl als adäquat empfunden wird. Doch erst breit gefächerte quantitative Analysen geben Anhaltspunkte, ob sich im großen Maßstab etwas verändert hat. Die Feststellung beispielsweise, dass sich die Artikellänge von K3 zu K2 zu K1 fortwährend reduziert hat, kann nicht als bloße quantitative Veränderung festgestellt werden, ebenso wie die Verringerung der Verwendung der Type >MR< oder der TTR von K3 zu K2. Auch die Boulevardisierung als qualitative Größe kann anhand von Naming-Listen quantitativ messbar gemacht werden. Ferner stellt sich die Frage, welche Konsequenzen es hat, dass in 2001 deutlich weniger mit Prozentwerten operiert wurde als 1990. Zu den denkbaren Ursachen der sprachlichen Veränderungen seit 1990 zählen technische Umwälzungen in den Redaktionen inklusive neuer Recherchemethoden, politischer Systemwandel, Neuerungen im Mediensystem oder restriktive Maßnahmen infolge der Terroranschläge. Sprachliche Veränderungen, die nach 9/11 zu verzeichnen sind, so z.B. die wiederholte Bindung der Wortgruppe „Terror“ an Religionszugehörigkeit, sind quantitativ belegbar. Die ausgewählten Textpassagen zeigen sowohl, dass neue Feindbilder errichtet, als auch, dass politische Stellungnahmen von Führungspersönlichkeiten kritiklos übernommen wurden. Sogar Untersuchungen im Rahmen des Zipfschen Gesetzes können stichhaltige Ergebnisse beisteuern: nach 9/11 waren die Journalisten stärker gefordert als zuvor, das zeigt sich in der Elaboriertheit der Sprache des Krisenjournalismus. Ferner ist das Verhältnis von Funktions- zu Inhaltswörtern, lexikalische Dichte genannt, nicht nur eine quantitative Relation. Durch die Veränderungen dieser Größe lässt sich die Homogenität des untersuchten Wortschatzes beurteilen. 211 8. LITERATURLISTE: - ARENDS, J.: Pidgins and Creoles: An Introduction, Amsterdam, Benjamins, 1994. - ARMSTRONG, S. (ed.): Using Large Corpora, Cambridge, Mass.; London, England; MIT Press, 1994. - BADDELEY, A.: Handbook of Memory Disorders, Chichester, John Wiley and Sons, 1995. - BADDELEY, A.: Human Memory, Hove, New York, Psychology Press, 2003. - BAKER, M. (ed.): Routledge Encyclopedia of Translation Studies, London, New York, Routledge, 1998. - BARTHES, R.: Die helle Kammer, Frankfurt a.M. Suhrkamp, 1989. - BAUER, L.: Introducing Linguistic Morphology, Edinburgh, Edinburgh University Press, 1995. - BERTELSMANN ATLAS INTERNATIONAL, Gütersloh, Bertelsmann Lexikathek Verlag, 1984. - BEUTHNER, M.: Wie wenig Zeit braucht guter Journalismus? Echtzeitjournalismus zwischen Aktualitätsdruck, Sorgfaltspflicht und Bilderflut, in: Bilder des Terrors – Terror der Bilder? Krisenberichterstattung am und nach dem 11. September, Köln, Herbert von Halem Verlag, 2003. - BIBER, D., CONRAD, S., REPPEN, R.: Corpus linguistics: investigating language structure and use, Cambridge, Cambridge Univ. Press, 1998. - BIBER, D.: Using Register-Diversified Corpora for general Language Studies, in: ARMSTRONG, S. (ed.): Using large Corpora, Cambridge/ Mass., London, Engl., MIT Press, 1994. - BIGNELL, J.: Media Semiotics, An Introduction, Manchester, Manchester University Press, 1997. - BORTZ, J.: Statistik für Human- und Sozialwissenschaftler, Berlin u.a., Springer, 2005. - BUCHER, H.-J.: Die Zeitung als Hypertext, in: LOBIN, H.: Texte in digitalen Medien, Opladen, Westdeutscher Verlag, 1999. - BUCHER, H.-J.: Vom Textdesign zum Hypertext – Gedruckte und elektronische Zeitungen als nicht-lineare Medien, in: HOLLY, BIERE: Medien im Wandel: Opladen, Wiesbaden, Westdeutscher Verlag, 1998. 212 - CARSTENSEN, EBERT; ENDRISS; JEKAT; KLABENDE; LANGER (ed.): Computerlinguistik und Sprachtechnologie, Heidelberg, Berlin, Spektrum Lehrbuch, 2001. - CHOMSKY, N.: Essays on Form and Interpretation, New York, Amsterdam, Oxford, North-Holland, 1979. - CHOMSKY, N.: Thesen zur Theorie der generativen Grammatik, Studienbuch Linguistik, Weinheim, Beltz-Athenäum, 1995. - CRYSTAL, D.: The Cambridge Encyclopedia of Language, Cambridge, Cambridge University Press 1997. - DE BEAUGRANDE, DRESSLER: Einführung in die Textlinguistik, Tübingen, Niemeyer Verlag, 1981. - DE HAAN, P.: The Optimum Corpus Sample Size? in: LEITNER; G. (ed.): New Directions in English Language Corpora, Mouton de Gruyter, Berlin, New York, 1992. - DITTMAR, N.: Sozialer Umbruch und Sprachwandel am Beispiel der Modalpartikel >halt< und >eben< in der berliner Kommunikationsgemeinschaft nach der „Wende“, in: Auer, P., Hausendorf, H.: Kommunikation in gesellschaftlichen Umbruchsituationen, Tübingen, Max Niemeyer Verlag, 2000. - DÖLLING, E.: Multimediale Texte: Multimodalität und Multicodalität, in Hess-Lüttich (Hrsg.): Medien, Texte und Maschinen, Angewandte Semiotik, Westdeutscher Verlag 2001. - ELBEDOUR, S.: The Abusive Behaviours of Teachers in Bedouin Schools in Israel, in: School Psychology International, London, Sage Publications, Vol. 18, Aug. 1997. - FAIRCLOUGH, N.: New Labour, New Language? London, New York, Routledge, 2000. - FAULSTICH, W.: Grundwissen Medien, Fink, München, 2004. - FISCHER, R.: Lexical Change in Present-Day English, A Corpus-based Study of the Motivation, Institutionalization, and Productivity of Creative Neologism, Tübingen, Gunter Narr Verlag, Reihe: Language in Performance 17 (LIP), 1998. - FRIES, C. C.: The Structure of English, London, Longmans, 1952. - FRITZ, G.: Historische Semantik, Stuttgart, Weimar, Sammlung Metzler, Band 313, 1998. - GALPERIN, P. Y.: Stages in the Development of Mental Acts, in: A Handbook of Contemporary Soviet Psychology, New York, London, Cole/ Maltzman, 1969. 213 - GECKELER, H.: Strukturelle Wortfeldforschung heute, in: LUTZEIER, P. R.: Studien zur Wortfeldtheorie, Tübingen, Niemeyer, 1993. - GOLDHAGEN, D. J.: Hitlers willige Vollstrecker, München, Goldmann Verlag, 2000. - GÖRLACH, M.: Einführung in die Englische Sprachgeschichte, Wiesbaden, UTB Quelle und Meyer, 1999. - GRICE, H. P.: Studies in the way of words, Cambridge, Mass., London, Engl., Harvard University Press, 1991. - HABERMAS, J.: Theorie und Praxis, Sozialphilosophische Studien. Frankfurt a.M., Suhrkamp, 1982. - HACKER, W.: Allgemeine Arbeitspsychologie, Schriften zur Arbeitspsychologie Band 58) Bern, Verlag Hans Huber, 2005. - HALLIDAY, M.A.K.: An Introduction to Functional Grammar, London, New York, Arnold Publishers, 2004. - HALLIDAY, M.A.K.: Language as social semiotic, London, Arnold, 1984. - HANSEN, S./TEICH, E.: „Kontrastive Analyse von Übersetzungskorpora: ein funktionales Modell.“ In: GIPPERT, J. (Hrsg.): Multilinguale Corpora: Codierung, Strukturierung, Analyse. 11. Jahrestagung der GLDV, Prag: enigma corporation. S. 311322, 1999. - HOLZKAMP, K.: Grundlegung der Psychologie, Frankfurt a.M., New York, Campus, 1985. - HRUSKA, V.: Die Zeitungsnachricht – Information hat Vorrang, Bonn, ZV Zeitungs-Verlag, 1999. - JARREN, O., BONFADELLI, H.(eds.): Einführung in die Publizistikwissenschaft, Bern, Stuttgart, Wien, UTB, 2001. - JELLOUN, T.B.: Trennt Religion und Politik, in: AMIS, M., AUSTER, P., BEGLEY, L. et al.: Dienstag 11. September 2001, Reinbek bei Hamburg, Rowohlt, 2001. - KATAMBA, F.: Morphology, Houndmills, Mcmillan Press, 1993. - KENNEDY, G.: An Introduction to Corpus Linguistic, London, New York, Longman, 1998. - KINTSCH, W., VAN DIJK, T.: Strategies of Discourse Comprehension, New York, Academic Press, 1983. - KLEIN, E.: Konditionalität in englischen und deutschen Leitartikeln, in: Forum angewandte Linguistik 26, 1994. 214 - KLEINSTEUBER, H.J.: Terrorismus und Feindbilder. Zur visuellen Konstruktion von Feinden am Beispiel Osama Bin Laden und Saddam Hussein, in: Bilder des Terrors – Terror der Bilder? Krisenberichterstattung am und nach dem 11. September, Köln, Herbert von Halem Verlag, 2003. - KROTZ, F.: Krieg als transkultureller Konflikt in der globalisierten Gesellschaft und die Rolle der Medien, in: Bilder des Terrors – Terror der Bilder? Krisenberichterstattung am und nach dem 11. September, Köln, Herbert von Halem Verlag, 2003. - KUNCZIK, M., ZIPFEL, A. (eds.): Publizistik. Ein Studienhandbuch, Böhlau, UTB, 2001. - LEECH, G., RAYSON, P., WILSON, A.: Word Frequencies in Written and Spoken English, Harlow, London, Longman, 2001. - LEHR, A.: Kollokationen und maschinenlesbare Korpora, Tübingen, Niemeyer, 1996. - LEWANDOWSKI, T.: Linguistisches Wörterbuch 3, Wiesbaden, UTB Quelle und Meyer, 1990. - LILIENTHAL, B.: Hypertextartige Strukturen in der Regionalpresse und neue Möglichkeiten in der Gestaltung von Online-Zeitungen, in: Forum Angewandte Linguistik, Bd. 34., Europ. Verlag der Wissenschaften, Berlin, Bern, Frankfurt a.M., 1998. - LYONS, J.: Semantics I und II, Cambridge, Cambridge Univ. Press, 1985. - MAST, C., POPP, M., THEILMANN, R.: Journalisten auf der Datenautobahn, Qualifikationsprofile im Multimediazeitalter, Konstanz, UKV Medien, 1997. - MCENERY, T., WILSON, A.: Corpus Linguistics, Edinburgh University Press, 2001. - MESTHRIE, R. et al.: Concise Encyclopedia of Sociolinguistics, Amsterdam, Elsevier, 2001. - MILLER, G.A.: Wörter, Heidelberg, Berlin, New York, Spektrum, Akamemischer Verlag, 1992 - MÜLLER, H.: Terror und Trauma, in: Spektrum der Wissenschaft, Heidelberg, November 2001. - MURPHY,A.C.: Markers of attribution in English and Italian opinion articles: A comparative corpus-based study, in: ICAMEJournal No. 29, S.131-150, April 2005. - NERLICH, B. et al.: Polysemy – Flexible patterns of meaning in 215 mind and language, Berlin, New York, Mouton de Gruyter, 2003. - NEVERLA, I.: Zäsur und Kompezenz. Thesen zur journalistischen Krisenberichterstattung, in: Bilder des Terrors – Terror der Bilder? Krisenberichterstattung am und nach dem 11. September, Köln, Herbert von Halem Verlag, 2003. - NOELLE-NEUMANN, E. (ed.): Fischer Lexikon Publizistik Massenkommunikation, Frankfurt a.M., Fischer Taschenbuch Verlag, 2002. - OAKES, M.P.: Statistics for corpus linguistics, Edinburgh, Edinburgh University Press, 2003. - OXFORD COLLOCATIONS DICTIONARY FOR STUDENTS OF ENGLISH, Oxford, Oxford University Press 2003. - OXFORD ENGLISH DICTIONARY (OED), Oxford, Oxford University Press 1991. - PINKER, S.: Der Sprachinstinkt, München, Kindler Verlag, 1996. - QUIRK, R., GREENBAUM, S.: A comprehensive Grammar of the English Language, London, Longman, 2004. - RADEMANN, T.: Using online electronic newspapers in modern English-Language press corpora: Benefits and pittfalls, in: ICAMEJournal No. 22, S.49-71, April 1998. - RADLMAIER, S.: Der Nürnberger Lernprozess – Von Kriegsverbrechern und Starreportern, Frankfurt a.M., Eichborn AG, 2001. - REAH, D.: The Language of Newspapers, London, New York, Routledge, 1998. - ROMAINE, S.: Bilingualism, Oxford, Basil Blackwell Ltd., 1989. - SCHLÜSSELWÖRTER DER WENDEZEIT (Wörter-Buch zum öffentlichen Sprachgebrauch 1989/ 90), Berlin, de Gruyter, 1997. - SCHMIDT, S. J. (ed.): Gedächtnis: Probleme und Perspektiven der interdisziplinären Gedächtnisforschung, Frankfurt a.M., Suhrkamp, 1991. - SCHNEIDER, P.: Verschon mein Haus, zünd andere an, in: AMIS, M., AUSTER, P., BEGLEY, L. et al.: Dienstag 11. September 2001, Reinbek bei Hamburg, Rowohlt, 2001. - SCHWARZ, M., CHUR, J.: Semantik – Ein Arbeitsbuch, Tübingen, Gunter Narr Verlag, 1993. - SCOTT, M.: Wordsmith Tools Manual Version 3.0, Oxford, Oxford University Press 1998. - SEARLE, J. R.: Ist der menschliche Geist ein Computerprogramm? 216 in: Spektrum der Wissenschaft, Heidelberg, März 1990. - SEELY, J.: Oxford A-Z of Grammar and Punctuation, Oxford, Oxford University Press, 2004. - SEMINO, E., SHORT, M.: Corpus stylistics, Routledge, London, New York, 2004. - SHANNON, C. E., WEAVER, W.: Mathematische Grundlagen der Informationstheorie, München, R. Oldenbourg Verlag, 1976. - SINCLAIR, J.: Corpus Concordance Collocation, Oxford, Oxford University Press, 1991. - SINCLAIR, J.: Korpustypologie. Ein Klassifikationsrahmen, in : TEUBERT, W. (ed.): Neologie und Korpus, Tübingen, Narr, 1998. - SOUEIF, A.: Durch die Augen der Enteigneten, in: AMIS, M., AUSTER, P., BEGLEY, L. et al.: Dienstag 11. September 2001, Reinbek bei Hamburg, Rowohlt, 2001. - SPOLSKY, B.: Sociolinguistics, Oxford, New York, Oxford University Press, 1998. - STORRER, A.: Kohärenz in Text und Hypertext, in: LOBIN, H.: Texte in digitalen Medien, Opladen, Westdeutscher Verlag, 1999. - STSCHERBAK, J.: Protokolle einer Katastrophe, Frankfurt a.M., Athenäum, 1988. - STUBBS, M.: Text and Corpus Analysis, Oxford, Blackwell, 1996. - SVARTVIK, J. (ed.), GREENBAUM, S.: The London-Lund Corpus of Spoken English, Lund, Lund University Press, 1990. - TESAK, J.: Einführung in die Aphasiologie, Stuttgart, New York, Thieme, 1997. - THOMPSON, G.: Introducing Functional Grammar, London, Arnold, 2004. - TODD, E.: Weltmacht USA - Ein Nachruf, München, Zürich, Piper, 2002. - TOGNINI-BONELLI, E.: Corpus Linguistics at work, Amsterdam/ Philadelphia, John Benjamins Publishing Company, 2001. - TOWNSHEND, C.: Terrorism – A very short Introduction, Oxford, Oxford University Press, 2002. - TRAUTNER, H. M.: Lehrbuch der Entwicklungspsychologie, Göttingen u.a., Verlag für Psychologie Hogrefe, 1997. - VATER, H.: Einführung in die Sprachwissenschaft, München UTB, 1999. - VESTER, F.: Denken, Lernen, Vergessen; Stuttgart, DTV217 Taschenbuch, 1976. - VYGOTSKY, L. S.: Thought and Language; Cambridge, Mass., M.I.T. Press, 1962. - WEHR, H.: Arabisches Wörterbuch für die Schriftsprache der Gegenwart, Wiesbaden, Otto-Harrossowitz-Verlag, 1985. - WESTIN, I., GEISLER, C.: A multi-dimensional study of diachronic variation in British newspaper editorials, in: ICAME-Journal No. 26, S.133-152, April 2002. - WICHTER, S.: Zur Computerwortschatzausbreitung in die Gemeinsprache, Frankfurt a.M., Bern, New York, Paris, Peter Lang Verlag, 1991. - ZIPF, G.K.: The Psycho-Biology of Language, Cambridge, Mass., MIT Press, 1965. Zeitschriften, Zeitungen, Broschüren etc. - Audit Bureau of Circulations. - Berliner Zeitung, 01.11.2001. - Frankfurter Allgemeine Zeitung, 30.08.2001 - ICAME-Journal No. 18, April 1994. - ICAME-Journal No. 22, April 1998. - ICAME-Journal No. 26, April 2002. - ICAME-Journal No. 29, April 2005. - Neue Zürcher Zeitung, 28.8.2001 - TENCH, P., Press Phonology (Poster), Centre of Language and Communication, University of Cardiff, UK, 1990. - Der Spiegel-Spezial (29.6.2004): Der Krieg des 21. Jahrhunderts. - Der Spiegel 36/ 2006 - Süddeutsche Zeitung, 26.07.2001 - The Independent, 02.12.2001. - The Times, 19.11.2001. - Time, 10.04.2006. 218 Literaturnachweis der Korpusquellen: The Guardian CD-Rom 1990. The Guardian CD-Rom 2001. The Independent CD-Rom 1990. The Times CD-Rom 1990. Online Zeitung von The Guardian vom 26.11. bis 11.12.2001 (www.guardian.co.uk). Online Zeitung von The Independent vom 26.11. bis 11.12.2001 (www.independent.co.uk). Online Zeitung von The Times vom 2.8. bis 15.10.2001 (www.thetimes.co.uk). Electronic Database des British Council (www.britishcouncil.de). Beilage: CD-Rom mit drei Versionen der Korpora: 1. Die drei Hauptkorpora 2. Die neun Subkorpora 3. Das Superkorpus 219 Danksagung Ich danke den betreuenden Professoren des Doktorandenkolloquiums des Instituts für Semiotik der Technischen Universität Berlin, Frau Dölling und Herrn Posner. Ich bedanke mich ferner beim Englischen Seminar der ChristianAlbrechts-Universität Kiel und dessen Bibliothekarinnen für deren freundliche Unterstützung und Erteilung einer Seminarkarte. Bei den Mitarbeitern des „British Council“ in Berlin bedanke ich mich, dass sie mir die benötigten Zeitungs-CD-Roms überlassen haben. Ebenso danke ich den Mitarbeitern des Zentrums für Fremdsprachenausbildung IT- und Medieneinsatz (ZFIM) der CAU für die Einrichtung eines Nutzer-Accounts im ZFIM-Pool. Ein besonderer Dank gilt meinem Doktorvater, dem emeritierten Prof. Braun, der mich in vielen Einzelgesprächen in meinem Anliegen unterstützte. Danke an meine Familie, sowie an Heribert Rüther und Maria Kiesbye fürs Korrekturlesen. 220