K2 - DepositOnce

Transcrição

K2 - DepositOnce

„Linguistische Untersuchungen über Qualitätsveränderungen bei britischen Qualitätszeitungen
seit Aufkommen des Internet und infolge des 11.
September“
vorgelegt von
Magister Artium
Roland Scheller
aus Kiel
von der Fakultät I - Geisteswissenschaften
der Technischen Universität Berlin
zur Erlangung des akademischen Grades
Doktor der Philosophie
- Dr. phil. genehmigte Dissertation
Promotionsausschuss:
Vorsitzender: Prof. Dr. Eberhard Knobloch
Berichter:
Prof. Dr. em. Friedrich Braun
Berichter:
Prof. Dr. Peter Erdmann
Tag der wissenschaftlichen Aussprache: 20.02.2007
Berlin 2007
D 83
Abstract:
Has the language used in British quality newspapers, i.e. “The
Times”, “The Guardian” and “The Independent”, changed
between 1990 and 2001 as a result of the rise of the internet and
later on as a reaction to 9/11? To answer these questions three text
corpora were collected in order to conduct a diachronic corpus
analysis: one from 1990 (two million words) and two from 2001
(one million words each). One corpus from 2001 contains only
articles that appeared before 9/11, the other only articles that
appeared afterwards. The analysed fields are “News“, “World
News“ and “Politics“. This method and ‘corpus constellation’ is
used first in order to analyse the special nature of press language
and second, to analyse lexical changes over a period of ten years.
The results show that the “type token ratio” and the average
sentence length has decreased since 1990, whereas the length of
the articles has increased. The number of pronouns has also
increased in 2001 compared to 1990. Furthermore, a dramatic
change in the use of terms such as >ARAB<, >ISLAM< and
>MUSLIM< can be measured as a direct result of the terrorist
attacks of 9/11. The conclusion of this investigation is that
newspaper language is dependent on those great political topics
that appear during the survey period and that technical changes
within newspaper houses may cause changes in the newspapers
themselves as well as their articles. While in 1990 forms such as
>MR<, >AGED< and >PER CENT< were used more frequently,
after 9/11 changes in lexical use appeared, among them the
application of terms like >ISLAMIC< in the context of
>TERROR<, terms that indicate a new concept of enemy.
2
Abstract:
Hat die Sprache in den britischen Qualitätszeitungen „The Times“,
„The Guardian“ und „The Independent“ zwischen 1990 und 2001
aufgrund des Aufkommens des Internet und infolge des 11. September
eine Veränderung durchlaufen? Um diese Fragen zu beantworten,
wurden drei Text-Korpora erstellt, um eine diachrone Korpusanalyse
durchzuführen: eins von 1990 (zwei Millionen Worte) und zwei von
2001 (mit je einer Million Worten). Das eine Korpus von 2001
beinhaltet ausschließlich Artikel, die vor dem Ereignis 11. September,
das andere ausschließlich Artikel, die danach erschienen sind. Die
analysierten Themenfelder sind „News“, „World News“ und
„Politics“. Diese Textkorpora wurden mit Hilfe korpuslinguistischer
Methoden
analysiert.
Dieses
Verfahren
bzw.
die
„Korpuskonstellation“ wurde gewählt, erstens, um die Besonderheiten
von Zeitungssprache zu analysieren, zweitens, um lexikalische
Veränderungen über eine Zeitdauer von zehn Jahren zu untersuchen.
Die Ergebnisse zeigen, dass sich seit 1990 die Type-Token Relation
und durchschnittliche Satzlänge verringert haben, während sich die
Artikellänge vergrößert hat. Die Anzahl der Pronomina vergrößerte
sich ebenfalls 2001 im Vergleich zu 1990. Des Weiteren wurde eine
dramatische Veränderung in der Verwendung von Begriffen wie
>ARAB<, >ISLAM< und >MUSLIM< festgestellt, die in einem
engen Zusammenhang mit den Terrorangriffen vom 11. September
stehen. Die Schlussfolgerung dieser Untersuchung ist, dass
Zeitungssprache von den großen politischen Themen abhängig ist, die
sich während des Erhebungszeitraumes ereigneten, und dass
technische
Veränderungen
innerhalb
der
Zeitungshäuser
Veränderungen an den Zeitungen und deren Artikel herbeiführen
können. Während 1990 Formen wie >MR<, >AGED< und >PER
CENT< häufiger verwendet wurden, kam es nach 9/11 zu
Gebräuchlichkeitsveränderungen einiger Begriffe, dazu zählt die
Verwendung von Begriffen wie >ISLAMIC< im Kontext von
>TERROR<, die auf ein neues Feindbild hinweisen.
3
1. EINLEITUNG
S. 9
2. KAPITEL: Die Eigenschaften der Korpuslinguistik
S.14
2.1 Die Vorteile bei der Verwendung von Korpora
2.2 Die Korpuslinguistik in Analogie zu kognitiven
Fähigkeiten
S.14
S.16
3. KAPITEL: Korpuslinguistik als
Sprachanalysemethode
S.20
3.1 Ein Beispiel für eine populäre Korpusanalyse:
Das Wendekorpus
3.2 Kommunikative Grundlagen der Korpuslinguistik
3.3 Textanalyse und Textkorpora
3.4 Die medienspezifischen Charakteristika einer Zeitung
3.5 Wahrheitswerte von Sätzen und Texten
3.6 Pressesprache und Registeranalyse
3.7 Ereignisorientierte Veränderungen von Sprache
3.8 Die Grenzen der Korpuslinguistik
S.21
S.23
S.26
S.26
S.28
S.29
S.34
S.35
4. KAPITEL: Die Strukturierung der Korpora und die
technischen Hindernisse
S.36
4. 1 Die Funktionsweise von Wordsmith
4. 2 Die Korpusprotokolle
4. 3 Das Korpusdesign
4. 4 Überarbeitung des Korpusdesigns
4. 5 Sortieren der Unterkorpora
4. 6 Entstehungsprozess und Textformatierungsprobleme
4. 7 Metatext als relevante Fehlergröße
4. 8 Layout-Redundanz
4. 9 Die Zusammenstellung der Subkorpora
4.10 Veränderungen in den Themenfeld-Bezeichnungen
4.11 Anzahl der Artikel pro Subkorpus
S.37
S.40
S.42
S.49
S.50
S.51
S.54
S.56
S.57
S.67
S.68
4
5. KAPITEL: Der 11. September als Ausgangspunkt für
Veränderungen in Sprache, Medien und Gesellschaft S. 72
5. 1 Das Ereignis 11. September
5. 2 Die Medienreaktionen auf die Terroranschläge
vom 11.9.2001
5. 3 Medienwissenschaftliche Betrachtung des
11.September
5. 4 Das Dilemma der Medien im Zusammenhang mit
dem 11. September
5. 5 Der 11. September als Auslösefaktor für Spekulationen
5. 6 Kontextuelle und lexikalische Wahrscheinlichkeit
5. 7 Der 11. September als Agenda-Setting-Prozess
5. 8 Der Nachrichtenfaktor des 11.September
5. 9 Qualitätskriterien für Informationsjournalismus
5.10 Die Nachrichtenwert-Theorie
5.11 Der 11. September als Schlüsselereignis
5.12 Das Textkorpus mit Artikeln erschienen nach
dem 11. September
S. 73
S. 76
S. 77
S.
S.
S.
S.
S.
S.
S.
S.
78
80
82
84
86
87
88
89
S. 90
6. KAPITEL: Auswertung der Analysedaten
S. 91
6.1 Die von Wordsmith gewonnenen Basisdaten
S. 91
6.1.1 Die Auswertung der Korpusstatistiken
6.1.2 Die Type-Token Relation (TTR)
6.1.3 Die Häufigkeitslisten
6.1.4 Die alphabetischen Listen und Hapax Legomena
S.
S.
S.
S.
6.2
Grammatikalische Untersuchungen
S.101
6.2.1 Effects of scepticism and doubt
6.2.2 Degree of probability
6.2.3 Naming als Indikator für Boulevardisierung
S.101
S.102
S.104
6.3 Untersuchungen an der Syntax
S.108
5
91
93
95
99
6.3.1 Vergleich der durchschnittlichen Satzlängen in den
Untersuchungszeiträumen
6.3.2 Ausgewählte Konkordanzen
6.3.2.1 Die Konkordanzliste zu >ISLAM< in K1
6.3.2.4 Die Konkordanzen zu >ARABIC<
6.3.2.5 Konkordanzen mit dem Kontextwort [>TERROR<]
6.3.3 Die häufigsten Kollokationen von >MUSLIM<,
>ISLAMIC< und >ARAB<
6.3.3.1 Linksseitige Kollokationen zu >ARAB<
6.3.3.2 Rechtsseitige Kollokationen zu >ARAB<
6.3.3.3 Linksseitige Kollokationen zu >MUSLIM<
6.3.3.4 Rechtsseitige Kollokationen zu >MUSLIM<
6.3.3.5 Linksseitige Kollokationen zu >ISLAMIC<
6.3.3.6 Rechtsseitige Kollokationen zu >ISLAMIC<
6.3.3.7 Gebräuchlichkeitsveränderungen
S.108
S.116
S.117
S.121
S.122
S.123
S.126
S.129
S.130
S.132
S.133
S.134
S.136
S.137
S.139
6.4
Untersuchungen an der Lexik
S.141
6.4.1
6.4.2
6.4.3
6.4.3.1
Das Problem der Synonymie
Lexikalische Dichte und Funktionswörter
Die Funktion Keywords
Die Keyword-Liste von K1 mit K2 als
Referenzkorpus
Referenzkorpus
Referenzkorpus
Referenzkorpus
Die Keyword-Liste von (K1 + K2) mit K3 als
Referenzkorpus
Die Keyword-Liste von K3 mit (K1 + K2) als
Referenzkorpus
S.141
S.142
S.145
6.4.3.2
6.4.3.3
6.4.3.4
6.4.3.5
6.4.3.6
6.4.4
Weitere Schlüsselwörter im Zusammenhang
mit dem 11. September 2001
6
S.146
S.150
S.153
S.156
S.159
S.162
S.166
6.4.4.1 Times.2001.danach mit K2 als Referenzkorpus
6.4.4.2 Guardian.2001.danach mit K2 als Referenzkorpus
6.4.4.3 Independent.2001.danach mit K2 als Referenzkorp.
6.4.5 Analyse ausgewählter Wortgruppen
6.4.5.1 Die Wortgruppe „Arabisch”
6.4.5.2 Die Wortgruppe „Islamische Welt“
6.4.5.3 Die Wortgruppe „Terror“
6.4.5.4 Die Wortgruppe „Gewalt“
6.4.5.5 Die Wortgruppe „Al-Qaida“ in den Subkorpora
von K1
6.5
S.183
Morphologische Analysen: Ausgewählte Komposita S.186
6.5.1 Das Problem der Erkennung von Komposita
und Homonymie
6.5.2 Analyse ausgewählter Komposita
6.5.2.1 Komposita mit Bestandteilen aus den Wortgruppen
„Arabisch“ und Islamische Welt“
6.5.2.2 Komposita mit Bestandteilen aus der Wortgruppe
„Terror“
6.6
S.166
S.170
S.173
S.177
S.178
S.179
S.180
S.182
S.186
S.188
S.189
S.192
Weitere Analysedaten
S.194
6.6.1 Das Zipfsche Gesetz
6.6.2 Die Entropie der Typen
S.194
S.198
7.
KAPITEL: Schlussbetrachtung (Zusammenfassung,
Kritik und Ausblick)
S.199
7.1
Zusammenfassung der Ergebnisse
7.1.1 Gründe für die Veränderungen des Wortschatzes
7.1.2 Sprachliche Veränderungen durch die
Internet-Einführung
7.1.3 Emotionsneutrale Datenauswertung durch
den Rechner
7.1.4 Der Umgang mit dem Thema Terror
7.1.5 Halo-Effect und Primacy-Recency-Effect
7
S.200
S.201
S.202
S.204
S.204
S.206
7.2
Korpuslinguistische Methoden kritisch betrachtet
7.2.1 Schlüsselwort ungleich Inhalt
7.2.2 Wie sinnvoll ist der Einsatz der Korpuslinguistik?
7.3
8.
S.206
S.207
S.209
Rückschlüsse auf die Qualität von Texten mittels
quantitativer Analysen
S.210
LITERATURLISTE
S.212
8
1. EINLEITUNG
In dieser Dissertation werden drei Presse-Korpora mit dem Ziel
analysiert, die sprachlichen Veränderungen in den britischen
Qualitätszeitungen „The Times“, „The Independent“ und „The
Guardian“ zwischen 1990 und 2001, und die Veränderungen im
Zusammenhang mit den Terroranschlägen vom 11. September 2001
zu untersuchen. Aus diesem Grunde wurden zwei Presse-Korpora von
2001 erstellt, sowie ein Presse-Korpus von 1990, das als
Vergleichskorpus dient.
Das eine Textkorpus von 2001 enthält ausschließlich Artikel, die vor
dem 11. September erschienen sind (K2 genannt), das andere
hingegen Artikel, die nach der Katastrophe in New York in den
Zeitungen zu lesen waren (K1). Diese beiden Korpora von 2001
enthalten Zeitungsartikel von je einer Million Worten. Darunter sind
in jedem der beiden Korpora 500 000 Wörter aus „The Times“,
250 000 aus „The Guardian“ und noch einmal 250 000 aus „The
Independent“. Das Korpus von 1990, K3 genannt, besteht aus
insgesamt 2 Millionen Worten, davon sind eine Million aus „The
Times“, 500 000 Wörter aus „The Guardian“ und noch einmal
500 000 Wörter aus „The Independent“.
Die drei Presse-Korpora K1, K2 und K3 wurden miteinander
verglichen. Diverse weitere Korpuskonstellationen wurden
vergleichbar gemacht, indem K1 und K2 zu einem gemeinsamen
Korpus zusammengefügt wurden. Zusätzlich konnten die dreimal drei
Subkorpora, die K1, K2 und K3 konstituieren, ggf. miteinander
verglichen werden, um weitere Ergebnisse zu gewinnen. Die
Software, die dabei zur Verfügung stand war Wordsmith 2.0 und
später Wordsmith 3.0.
Die für die Erstellung der Korpora herangezogenen Quellen sind
soweit verfügbar den CD-Roms der drei oben genannten
Qualitätszeitungen entnommen, aber auch deren Online-Zeitungen
von 2001 und der Electronic Database des British Council. Da die
Presse-Korpora verschiedene Zeitphasen repräsentieren, ist die
vorliegende Korpusanalyse eine Longitudinalanalyse (Jarren,
Bonfadelli 2001, S.507).
Wegen einer klaren Eingrenzung des Registers sind die verwendeten
Zeitungsartikel ausschließlich Themenfeldern wie Politics, News und
9
Foreign News entnommen, die von der Bezeichnung her von Zeitung
zu Zeitung variierten.
Diese Dissertation umfasst insbesondere die Erläuterung des Designs
der Korpora, das Beschreiben der Korpusquellen, die Funktionsweise
des verwendeten Analyseprogramms und die Analyse der sodann
gewonnenen Wort- und Konkordanzlisten. Die zentralen
Fragestellungen der Arbeit lauten:
Wie hat sich die Sprache in den Printmedien verändert?
Üben das Internet und die Online-Zeitungen einen erkennbaren
Einfluss aus?
War der 11.September tatsächlich ein dermaßen gravierendes
Ereignis, dass sogar der Sprachgebrauch beeinflusst wurde?
Diese Fragen können aufgrund der Auswahl der Textquellen nur für
die Zeitungssprache in Großbritannien beantwortet werden.
Grundsätzlich ist das Heranziehen von Computern zur Textanalyse
nur bei bestimmten Fragestellungen effektiv. Das ist der Fall, wenn
besonders große Textmengen zu analysieren sind. Einschränkend
muss an dieser Stelle gesagt werden, dass ein Analyseprogramm,
hermeneutische Detailfragen betreffend, nicht das zu bewerkstelligen
vermag, was ein einzelner, adäquat geschulter Mensch durchzuführen
im Stande ist. Der Mensch kann, was Textanalysen betrifft, beim
derzeitigen Stand der Technik den Computer fast ausschließlich für
rein statistische Vorgänge verwenden, wie dem Auszählen von
Wortklassen, Bestimmen von durchschnittlicher Satz- oder Wortlänge,
Wörterzählen, Type-Token-Analyse, Erstellen von alphabetischen
Wortlisten, Frequenzlisten und Differenzmengen. Die Ausnahmen zu
den rein statistischen Funktionen stellen die Konkordanzen und
Kollokationen zu einem festgelegten Wort oder String dar.
M.A.K. Halliday spricht in diesem Zusammenhang von Low–Level
Analysis. Eine Korpusanalyse ist deshalb keine Textanalyse im
herkömmlichen Sinne. Die per Hand ausgeführte Analyse wird in der
Funktionalen Grammatik als High-Level Analysis bezeichnet
(Halliday 2004, S.49). Dennoch kann man Computer ausgewählte
Teilaufgaben der qualitativen Analyse von Texten übernehmen lassen,
wenn wir nach Textstellen und Kollokationen von Bildspendern für
Metaphern oder anderen Schlüsselwörtern suchen.
Eine erfolgreich durchgeführte Korpusanalyse stellt eine
ausgezeichnete Hilfe beim Aufspüren von Details dar, die der Leser
10
unter Umständen übersieht. Das sind zumeist statistische Kennwerte
bezogen auf Lexik, Syntax, Wortbildung und Grammatik.
Was die Medienberichterstattung des Jahres 2001 anbetrifft, so ist der
11.9.2001 ein einschneidendes Ereignis gewesen, dass ungeahnte
Veränderungen nach sich gezogen hat wie die Anti-Terror-Allianz,
weltweite Sicherheitsmaßnahmen, Islamismus-Debatte und den
Kriegszustand in Afghanistan und Irak. Hierzu liefert der Vergleich
der beiden Korpora von 2001 Ergebnisse.
Analog dazu fand in den 90er Jahren ein technischer Umbruch statt,
darüber vermag das Vergleichskorpus von 1990 Aufschluss geben.
Das Internet, laut „Time-Magazine“ seit 1991 für die Öffentlichkeit
nutzbar, hat sich während der 90er Jahre weltweit etabliert und ist zu
einem anerkannten Kommunikationsmedium geworden. Die
Veränderungen sind auf allen gesellschaftlichen Ebenen spürbar.
Die von dem Textanalyseprogramm Wordsmith produzierten
Korpusstatistiken, Frequenzlisten und Differenzmengen etc. lassen
Urteile über die gravierendsten Unterschiede der Presse-Korpora zu.
Ebenso konnten neue Tendenzen bei der Verwendung von Sprache in
den Printmedien im Zusammenhang mit dem 11. September
aufgefunden werden. Die Begriffe, die sprachliche Veränderungen
ausgelöst durch Großereignisse, beschreiben helfen, sind lexikalische
und kontextuelle Wahrscheinlichkeit.
Ein weiterer Schwerpunkt dieser Arbeit lag in der Untersuchung, ob
die verwendete politische Sprache 1990 eventuell eine andere war, als
2001, wobei auch hier wieder zwischen der Zeitungsberichterstattung
vor und nach dem 11. September differenziert wird. Deshalb wurden
Begriffe zu Wortgruppen wie Islamische Welt, Arabisch, Terror,
Al-Qaeda und Gewalt zusammengefasst.
In weiteren Analyseschritten wurde der Fragestellung nachgegangen,
ob sich der benutzte Wortschatz in den untersuchten Medien zwischen
1990 und 2001 quantitativ verändert hat, was durch die von
Wordsmith erstellte Type-Token Relation überprüft wurde, durch
Aussagen im Rahmen des Zipfschen Gesetzes, sowie durch die
Veränderungen bei den durchschnittlichen Satzlängen.
Des Weiteren wurden Kompositabildung, Konkordanzen und
Kollokationen zu Schlüsselwörtern untersucht, die ergänzend anhand
von Kernsätzen plastisch dargestellt wurden.
11
Pressesprache wird als eigenständiges Sprachregister vorgestellt, es
wird diskutiert, wie repräsentativ diese drei Presse-Korpora für die
gesamte englische Sprache sind.
Eventuelle Veränderungen der britischen Presse, speziell der
Qualitätspresse, manifestieren sich nicht ausschließlich am
Sprachgebrauch. Diese zeigen sich auch bei der Themenwahl und
beim neuen Textdesign. Doch diese beiden Punkte werden nur am
Rande angesprochen.
Was die Darbietung der gewonnenen Daten anbetrifft, werden von
vornherein drei Formen von Statistiken unterschieden:
Statistiken, die in Form von Protokollen bei der Entnahme der
Zeitungsartikel aus den Korpusquellen entstanden sind: sie dienten der
Orientierung, um zu gewährleisten, dass bei der Datenerhebung der
Faden nicht verloren ging.
Diese Protokolle bilden die Basis für die zweite Form von Statistik,
die beschreibt, wie viele Artikel pro Zeitung, Themenfeld und
Erscheinungstag verwendet wurden. Auch diese zweite Statistik ist
von Hand erstellt worden. Es wurden Aufschlüsse darüber gewonnen,
ob sich die Artikel generell verkürzt haben.
Die dritte Form von Statistik ist die von Wordsmith erzeugte
Korpusstatistik, die in Typen und Token differenziert und die
verschiedenen Wortlisten erstellt. Ohne Computer wäre das Erstellen
dieser Listen nicht möglich gewesen.
Neben den bereits angesprochenen thematischen und strukturellen
Veränderungen lassen sich noch weitere Parameter wie
Personalisierung der Berichterstattung anhand der Verwendung von
Namen und Pronomina erkunden, dies unter dem Aspekt einer zu
untersuchenden „Boulevardisierung“.
Doch Veränderungen lassen sich vor allem mit Hilfe der erstellten
Wortlisten ausfindig machen, indem überprüft wird, ob bestimmte
Begriffe oder Wortgruppen und damit Sachthemen in den drei
Untersuchungszeiträumen gleichermaßen thematisiert sind.
Es wird der Frage nachgegangen, inwieweit die Berichterstattung über
den 11. September eventuell andere Themen temporär verdrängt
haben könnte, Stichwort „Agenda-Setting“, und es wird dargelegt,
dass der 11.September das schwerwiegendste politische Ereignis war,
das letztendlich auch zu einem Dilemma der Medien wurde.
12
Anhand ausgewählter Einzelfälle wurde überprüft, ob sich für
Schlüsselwörter die Häufigkeiten und der Gebrauchskontext zwischen
1990 und 2001, aber auch im Hinblick auf den 9/11, verändert haben.
Es wird thematisiert, inwieweit die Korpuslinguistik zu
Fragestellungen
aus
dem
Grenzbereich
Sprachund
Medienwissenschaft Methoden zur Verfügung stellen kann, ob es
nicht teilweise zu wenig ist, sich auf Sprache zu konzentrieren,
während weitere Codes zur Verfügung stehen wie z.B. Pressefotos.
Die Vor- und Nachteile der Korpuslinguistik werden diskutiert, hierzu
zählt die Tatsache, dass ein Text zunächst zu einem bloßen Datensatz
reduziert wird, um dennoch Werturteile zu treffen, aber auch dass
übergroße und emotional belastende Textmengen teilweise nicht mehr
von einem einzigen Menschen adäquat durchgearbeitet werden
können.
Die
folgende
Flow-Chart
lässt
sich
als
verlässliche
Orientierungsgrundlage verwenden:
Formulierung der
wissenschaftlichen Fragestellung
↓
Festlegung des Designs
↓
Erstellung der Hauptkorpora
↓
Suchen eines adäquaten
Vergleichskorpus
↓
Durchführung der Korpusanalyse mit
geeignetem Analyseprogramm
↓
Aufbereitung und Auswertung der
Ergebnisse
↓
Zusammenfassung der Ergebnisse/
Schlussfolgerung
Abb.1: Flow-Chart Korpusanalyse
13
2. KAPITEL: Die Eigenschaften der Korpuslinguistik
In der Sprachwissenschaft verstehen wir unter einem Korpus eine
Sammlung von geschriebenen Texten oder transkribierter Rede, die
als Grundlage für eine Untersuchung mit Hilfe des Computers
verwendet werden kann (Kennedy 1998, S.3 ff).
Die Elemente eines Korpus gehören in ihrer Gesamtheit bestimmten
Kategorien an, die im Korpusdesign von vornherein festgelegt sind.
Es handelt sich um eine mehr oder weniger zusammenhängende oder
kohärente Textsammlung, wie beispielsweise ein Korpus bestehend
aus Zeitungsartikeln zu einem bestimmten Thema. So kann eine
Sammlung von Artikeln zu einem bestimmten politischen Ereignis ein
Korpus ergeben, wie etwa Artikel ausschließlich über den Nürnberger
Kriegsverbrecherprozess (Radlmaier 2001). Textkorpora könnten, was
eine Kategorisierung im Bereich der Literatur oder Textlinguistik
betrifft, gattungsspezifisch als maschinenlesbarer Text, Input-Text
oder „recycelter Text“ bezeichnet werden. Es kommt ganz darauf an,
wofür das Konstrukt verwendet werden soll. Es gibt vor allem in der
Linguistik diverse Fragestellungen, bei denen Korpusanalysen
heutzutage unumgänglich sind.
Grundsätzlich können Korpora auch andere Daten als Textdaten
enthalten, wie z.B. Codes, Tagging- und Wortschatzinformationen etc.
2.1 Die Vorteile bei der Verwendung von Korpora
Im Rahmen dieser Arbeit verstehen wir unter einem Textkorpus einen
maschinenlesbaren Text, der von einem Analyseprogramm auf die
einzelnen Bestandteile hin untersucht werden kann. Sinnvollerweise
ist es ein Text, der sehr groß ist und nicht von einer Person in kurzer
Zeit effektiver bearbeitet werden kann.1 Alle anderen Korpora mit nur
1
Korpora können durchaus eine enorme Größe erlangen, das ist der Fall, wenn eine ganze Sprache in einem
Korpus erfasst werden soll. Dieses kann sinnvoll sein, wenn wir eine Sprache als Ganzes analysieren wollen, um
hinter ihre Gesetzmäßigkeiten zu gelangen. Ein solches Korpus ist beispielsweise das "British National Corpus
(BNC)", das aus etwa 100 Mio. Wörtern besteht (Kennedy 1998, S.12). Letztendlich stellt ein Wörterbuch auch
ein Korpus dar, ob es nun als Buch, als CD-Rom oder als Datensatz im Internet vorliegt. Wörterbücher werden
heutzutage zumeist durch Korpusanalysen erstellt. Das Longman Dictionary of Contemporary English
beispielsweise versieht wichtige Wörter im laufenden Text mit kleinen Statistiken, die mit Prozentzahlen über
14
wenig Textinhalt gelten deshalb als Probe- oder Testkorpora. Es wird
weiter unterschieden in Sample Corpora, Monitorkorpora,
Zeitungskorpora,
Dialogstrukturenkorpora,
Handbuchkorpora,
Grammatikkorpora und Vergleichskorpora (Lehr 1996, S.63-69).
Korpora können nach Orten benannt sein, das sind zumeist die
Erstellungsorte oder die Institute, die bei der Erstellung federführend
agieren und kooperieren, wie etwa das Mannheimer Korpus 1 und 2,
das Nijmwegen Korpus, das Lancaster-Oslo-Bergen Korpus etc.
Ebenso existieren diverse Korpora, die nach Schriftstellern bzw.
Philosophen benannt wurde, da darin ausschließlich deren Texte
enthalten sind. So gibt es das Goethe Korpus, das Thomas-MannKorpus, das Marx-Korpus.
Ferner können Korpora nach ihren Designern benannt sein (BrownKorpus), und es können untersuchte Zeitphasen als Namensgeber
fungieren, z.B. das Wendekorpus, das die Berichterstattung
unmittelbar vor und nach der deutschen Wiedervereinigung 1989
widerspiegelt (siehe Punkt 3.1).
Schließlich kann der Korpusbegriff von Wissensgebiet zu
Wissensgebiet variieren. In der Geschichtswissenschaft ist es möglich,
eine ganze Ideologie als Korpus zu bezeichnen. Im Zusammenhang
mit der Sprache der Nationalsozialisten ist vom „Korpus des
antijüdischen Denkens“ die Rede (Goldhagen 2000, S.107).
Heutzutage basieren große Grammatiken wie „A comprehensive
Grammar of the English Language“ von Greenbaum und Quirk
(2004) auf umfangreichen Korpusanalysen. Es sind gerade die
systematischen Korpusanalysen, die in der Lage sind, vermutete
Regularitäten einer Sprache aufzuzeigen, die die ausgewogene
Erstellung von modernen Grammatiken erst ermöglichen (Chomsky
1995, S. 35).
Es gibt eine ganze Reihe von Analysen an Presse-Korpora, die
ausgewählte Facetten von Zeitungssprache fokussieren (z.B. markers
of attribution, Murphy 2005, ICAME-Journal 29, S.131-150).
Verwiesen sei hier auch auf eine synchrone Korpusanalyse von
deutschen und englischen Leitartikeln bezüglich der Verwendung von
Konditionalität (Klein 1994, S.185 ff.).
unterschiedliche Bedeutungen und Verwendungen Aufschluss geben, die auf dem BNC und dem Longman
Lancaster Corpus basieren.
15
Eine weitere interessante Analyse ist die Untersuchung von Westin
und Geisler (2002, ICAME-Journal No. 26, S.133-152), die bei
Editorials britischer Qualitätszeitungen während des 20. Jahrhunderts
eine Zunahme der Argumentativität bei gleichzeitiger Abnahme der
Narrativität festgestellt hat.
Ferner können an Printmedien synchrone Sprachanalysen
durchgeführt werden, das ist der Fall, wenn unterschiedliche
Zeitungen eines Erscheinungstages miteinander verglichen werden.
2.2 Die Korpuslinguistik in Analogie zu kognitiven Fähigkeiten
Noam Chomsky hebt hervor, dass bei uns Menschen gerade die
Begrenztheit des Gedächtnisses, Zerstreutheit und Verwirrung, die
Verschiebung der Absicht im Verlauf des Sprechens sehr typisch sind
(Chomsky 1995, S. 18). Diese Eigenschaften hat ein Computer nicht.
Der Computer muss sich auf die Funktionen des Analyseprogrammes
beschränken. Ferner sind ihm Restriktionen durch das
Textverarbeitungsprogramm und den im Rechner verwendeten
Mikroprozessor auferlegt. Auch die durch eine Analyse gewonnenen
Daten vermag der Computer nicht selbständig auszuwerten. Die
Auswertung muss eine entsprechend geschulte Person durchführen.
Die Software steuert lediglich die besagten Frequenzlisten,
Textstatistiken und Konkordanzlisten bei, eine sinnvolle Analyse ist
erst abgeschlossen, wenn eine Hypothese angenommen oder
verworfen wurde. Eine solche Hypothese kann beispielsweise sein,
dass in einem bestimmten Zeitraum der in Qualitätszeitungen
verwendete Wortschatz geschrumpft ist. Der Computer ist bei der
Korpusanalyse bloße Rechenmaschine, deren Vorteil darin besteht,
besonders große Datenmengen zu analysieren, für deren Durchzählen
ein einzelner Mensch u.U. Monate oder Jahre benötigt, ohne dabei die
Zähl- und Rechenfehler zu berücksichtigen. Der Computer vollzieht
dieses gefühlsneutral. Doch im Mittelpunkt steht immer der Mensch,
der seine Arbeit an einem Korpus mit einer bestimmten Fragestellung
verknüpft. Der Computer ist lediglich sein Werkzeug.
Gemäß der „Computermetapher“ wird von einigen Wissenschaftlern
das menschliche Gehirn als biologische Maschine oder Computer
16
aufgefasst, dessen Gedächtnis ein Riesenspeicher ist (Schmidt 1991,
S.219). Umgekehrt lässt sich der Computer in seiner Funktion als
Datenspeicher auch als ein systematisches Gedächtnis begreifen.
Wenn wir diese Theorie logisch weiterführen, so ist das, was in der
Psychologie als geistige Handlung bezeichnet wird (Galperin 1969, S.
249 ff.) nichts anderes, als ein vom Computer ausgeführter
Rechenprozess. An anderer Stelle ist in der Psychologie vom
selbständigen Planen und Ausführen von Konzepten als typisch
menschlicher Eigenschaft die Rede (Vygotsky 1962, S. 82 ff.). Es
lässt sich darüber streiten wie weit sich Computer dieser Eigenschaft
schon angenähert haben.
Auf der anderen Seite behandelt laut Searle ein Computer eingegebene
Daten immer nur syntaktisch, nicht aber semantisch (1990, Spektrum
der Wissenschaft, S.40 ff.).
Die geistige Handlung beim Menschen, die dem Rechenprozess bei
der Korpuslinguistik gleichgesetzt werden soll, ist unter anderem ein
gewisses Sprachverständnis oder sprachliches Wissen, das in der Lage
ist, Sprache zu kategorisieren, egal ob es sich um geschriebene
Sprache (Zeitungstext, Krimi, Gesetzestext,...) oder gesprochene
Sprache handelt (Slang, Dialekt, Fachjargon,...). Der Computer
manipuliert letztendlich nur die Symbole. Das bietet jedoch keine
Gewähr dafür, dass die Bedeutung der Symbole verstanden wird.
Diesen Sachverhalt bezeichnet Searle als das „Chinesische Zimmer“
(Searle 1990, S. 40 ff.), ein Gedankenexperiment, bei dem ein Mensch
in einem geschlossenen Raum Zettel mit Geschichten in chinesischer
Notation zugestellt bekommt, die er ohne Kenntnisse der
Fremdsprache bearbeiten soll.
Trotz der Theorie der Computermetapher sind die Unterschiede in den
Funktionsweisen von menschlichem Gehirn und einem Computer
offensichtlich
(Rechengeschwindigkeit,
soziales
Gedächtnis,
mechanistisches Handeln, materielle Basis, Form, etc.). Ohne Zweifel
erhält ein Mensch durch diese neue Methodik einen ganz anderen
Blickwinkel auf sprachliche Fragestellungen im Zusammenhang mit
Soziologie, Psychologie und Politologie wie Legasthenie,
Szenesprache, Analyse von Politikerreden, etc. Zusätzlich trägt die
Korpuslinguistik zu einer Entwicklung der wissenschaftlichen
Betrachtungsweise bei, und wir müssen Sorge tragen, dass deren
Möglichkeiten nicht negativ ausgenutzt werden. Das gilt z.B. für die
17
systematische
Erforschung
menschlicher
Schwächen
in
Verkaufsgesprächen,
korpusbasierte
Lügendetektoren
und
Stigmatisierungen auf Grund von korpuslinguistischen Befunden.
Der Computer ist letztendlich nur ein Medium, auch wenn in einem
ganz anderen Sinn als ein Buch oder eine Zeitung. Dass der Computer
dem menschlichen Gehirn gleichkommt, ist nur eine Idealvorstellung.
Während Computer in einigen Bereichen, was die Rechenleistung
anbetrifft, den Menschen weit übertreffen, sind sie in anderen
Bereichen unterlegen, gerade was hermeneutische Fragen anbetrifft.
Der Rechner erstellt bei der Korpuslinguistik nur Textstatistiken,
Kollokationen und Vergleichslisten, und dieses in relativ großem
Umfang und in Sekundenschnelle. Doch letztendlich geht es um das
Verstehen von Texten, und das Treffen von klaren Aussagen.
Ein Computer wird jedoch einen Text nie verstehen können, auch
wenn er Daten liefert, die zum Verstehen beitragen können. Dennoch
ist der Prozess bei der Korpuslinguistik dem geistigen Handeln des
menschlichen Gehirns nachempfunden, denn sie zählt, kategorisiert,
sortiert, listet auf, ordnet und errechnet mathematische Werte, dies auf
der Basis geistiger Grundoperationen, die der Logik und der
Mathematik entlehnt sind. Das geistige Repertoire des Gehirns liefert
den Grundstock für das, was die Programmierer dem Rechner
beibringen wollen. Doch anders als beim Menschen stehen beim
Computer nicht Körper und Gehirn in Einklang, was die physische
Grundvoraussetzung für sinnvolle Lernprozesse ist.
Der Mensch kann mit ausreichend Hintergrundwissen sofort
kategorisieren, ob es sich um amerikanisches Englisch handelt, ein
Fachgespräch von Computerfreaks oder um eine Kirchenpredigt. Der
Computer hingegen kann Wort- und Keynesslisten erstellen, die bei
richtiger Auswertung zu demselben Ergebnis führen können.
Ein sehr gravierender Unterschied zu Gunsten des Computers ist
die Datenmenge, die es zu kategorisieren gilt. Die von einem
Menschen vorgenommene Kategorisierung geschieht durch Verstand
und Beurteilung. Dabei wird das im Gedächtnis verankerte
Kontextwissen zu Rate gezogen. Ein Mensch kann lediglich
Stichproben nehmen, wenn er große Text- oder Literaturmengen
untersucht, es sei denn, dass er ein Textmedium über Jahre nutzt wie
den allmorgendlichen „Tagesspiegel“ oder den Lieblingsautor
Stephen King. Wenn der Rezipient diese Textmengen beurteilt, fällt er
18
andere Schlüsse als ein Computer, erkennt, die Zeitung ist konservativ
geworden oder ein Krimi-Autor langatmig.
Der Computer kann nur den Weg über eine lexikalische Analyse
gehen und Sprach- oder Textmuster vergleichen, wenn durch ihn
Texte kategorisiert werden sollen. Nur wenn für den Texttyp
Kirchenpredigt auch ein Textmuster oder eine Wortliste für
Kirchenpredigten als Vergleichswert bereitsteht, so kann der
Computer das Urteil fällen, ob es sich bei dem Input-Text tatsächlich
um diese Textform handelt oder nicht, sofern er dafür programmiert
ist (siehe 3.6).
Das menschliche Gedächtnis ist durch seine Lernfähigkeit flexibel,
der Computer muss immer jeweils neu programmiert werden, ist also
vom Programmierer oder der intelligenten Software abhängig. Ein
Mensch kann vergessen, ein Computer auf der anderen Seite nicht.
Bei ihm spielen andere mehr oder weniger folgenreiche Einflüsse eine
Rolle wie Viren oder Computerabstürze.
Bei der Computermetapher kann man jedoch einwenden, dass diese
Theorie zu mechanistisch ist, dass es zu bracchial ist, das Gehirn und
den menschlichen Geist mit einem Computer gleichzusetzen und alle
anderen nur dem Menschen vorbehaltenen Domänen einfach zu
ignorieren. Die vom Menschen kategorisierten Daten liegen nicht
explizit in einer Datei gespeichert vor, sondern unterliegen den
Schwächen
des
menschlichen
Geistes
wie
Irrtümern,
Missverständnissen, Täuschungen und Aberglaube. Der Computer ist
hingegen rational-exakt, nicht aber kritisch.
Auch in der Psychologie ist vom Gedächtnis als Speicher die Rede.
Es wird sogar noch weiter differenziert in gesellschaftlichen und
(ontogenetischen) individuellen Speicher und (phylogenetisches)
„Artgedächtnis“ (Holzkamp 1985, S.128). Ein Mensch kann durch
das Erinnern, Assoziieren und Transferieren auf diesen Speicher
zurückgreifen. In der Korpuslinguistik wäre das verwendete Korpus
als Speicher zu begreifen, im Kontext dieser Dissertation als Speicher
von 10 219 Zeitungsartikeln. Doch der Zugriff läuft nicht über
Gedächtnismuster wie beim Menschen (Schmidt 1991, S.22), sondern
über die Suchfunktion und die Konkordanzlisten.
Wie diese Dissertation zeigt, ist die Analysesoftware in der Lage, die
Textkorpora als Speicherinhalt statistisch zu „durchpflügen“. Bei den
Menschen hingegen haftet eher die Qualität als die Quantität, aber
19
auch die Art und Weise und die Relevanz. Für den Rechner zählt
ausschließlich die Quantität, was die Auszähllisten anbelangt. Die
anderen drei Grice’schen Maximen Qualität, Art und Weise, Relevanz
(Grice 1991, S.26 ff.) bleiben ihm in der uns bekannten Form
verschlossen.
Das Gedächtnis des menschlichen Gehirns als emotions- und
situationsabhängiger Speicher ist sehr umfassend: haptisches,
Namens-, visuelles, akustisches, episodisches Textgedächtnis, etc.
(Vester 1976, S.153/54, Kintsch und van Dijk 1983). Es ist damit in
der Natur ein einzigartiges Konstrukt, das nicht annähernd in seiner
Harmonie von der Technik nachgebildet werden kann. Die
Komplexität des menschlichen Gedächtnisses ist adäquat durch das
Modell von Atkinson und Shiffrin beschrieben (Baddeley 2003, S.44).
Hier gibt es eine Unterteilung in Sensory Register, Short-term Store
und Long-term Store. Auf Computer lassen sich diese Feinheiten
nicht wirklich übertragen.
Es müssen also stets beide Seiten betrachtet werden: die
Korpuslinguistik vermag auf der einen Seite Leistungen zu
vollbringen, zu denen ein Mensch nicht ohne beträchtlichen Aufwand
in der Lage ist. Auf der anderen Seite entbehrt die Korpuslinguistik
der mühsam erlernten Verstehensleistung des menschlichen
Verstandes.
3. KAPITEL: Korpuslinguistik als Sprachanalysemethode
Als Einstieg in dieses dritte Kapitel dient ein Beispiel für eine
populäre Korpusanalyse in Deutschland. Es handelt sich dabei um das
so genannte Wendekorpus. Die Korpuslinguistik wird ferner mit der
klassischen
Kommunikationstheorie
umrissen
und
die
Textualitätskriterien werden auf sie angewendet. Auch die
medienspezifischen Charakteristika einer Zeitung, Wahrheitswerte
und die zunehmende Erweiterung des Computerwortschatzes sind
Bestandteil dieses Kapitels. Wir lernen die Korpuslinguistik als
Sprachanalysemethode kennen und den Begriff des sprachlichen
Registers.
20
3.1 Ein Beispiel für eine populäre Korpusanalyse:
Das Wendekorpus
Die wohl populärste korpuslinguistische Untersuchung im
deutschsprachigen Raum ist das so genannte Wendekorpus. Mithilfe
dreier Korpora, dem Wendekorpus DDR (WKD), dem Wendekorpus
Bundesrepublik (WKB) und einem Vergleichskorpus, wurden aus
Zeitungstexten die Schlüsselwörter der Wendezeit extrahiert.
Das
durch
diese
Korpusanalyse
erstellte
Wörter-Buch
(SCHLÜSSELWÖRTER DER WENDEZEIT, Wörter-Buch zum
öffentlichen Sprachgebrauch 1989/90) enthält die wichtigsten
Elemente des öffentlichen Sprachgebrauchs in der DDR und in der
Bundesrepublik Deutschland von Mitte 1989 bis Ende 1990 bezüglich
der Wendethematik. Analysiert wurden Texte aus dem Bereich der
öffentlich-politischen Kommunikation, dazu gehören Auszüge aus
verschriftlichten Redebeiträgen der Tagungen der Volkskammer und
der Sitzungen des Bundestages, öffentliche Reden, Demosprüche,
(Leit)artikel, Kommentare, Interviews aus Zeitungen und
Zeitschriften, Flugblätter, Aufrufe und Wahlprogramme (s.u.). Es wird
in drei Hauptphasen unterteilt: die Vorwendezeit, die Wende und die
Nachwendezeit. Für diese Phasen werden noch weitere
Unterscheidungen getroffen.
Das Projekt wurde von der so genannten „Gesamtdeutschen
Korpusinitiative“ initiiert. Dieses Korpusprojekt ist vom Institut für
deutsche Sprache in Zusammenhang mit dem damals noch
existierenden Zentralinstitut für Sprachwissenschaft der Akademie der
Wissenschaften in Ost-Berlin angeregt worden. Durch dieses Projekt
entstand ein maschinell gespeichertes Korpus im Umfang von etwa
vier Millionen Wortformen. Die verwendeten Themenkreise waren
„politischer Umbruch in der DDR“ und „Annäherung und
Vereinigung der beiden deutschen Staaten“. Das so entstandene
Wendekorpus, kurz WK, ergänzt die bereits seit Mitte der 60er
angelegten Textkorpora zur deutschen Gegenwartssprache. Das
Wendekorpus DDR (WKD) enthält 1632 Texte aus der DDR bzw. aus
den neuen Bundesländern mit insgesamt rund 1,5 Millionen
Wortformen. Als Quellen wurden herangezogen Aufrufe, Flugblätter,
öffentliche Erklärungen von Bürgerbewegungen und Parteien,
Wahlkampfmaterialien, verschriftlichte Demosprüche, Reden,
21
Protokolle von Volkskammertagungen. 50 % der Texte des WKD
machen Texte aus Tages- und Wochenzeitungen aus (z.B. „Berliner
Zeitung“, „Neues Deutschland“, „Junge Welt“, „Leipziger Andere
Zeitung“, „Wochenpost“).
Das Wendekorpus BRD (WKB) enthält 1755 Texte aus der
Bundesrepublik bzw. aus den alten Bundesländern mit zusammen
rund 1,8 Millionen Wortformen. Die Quellen für das WKB waren zu
80 % Tages-, Wochenzeitungen und Zeitschriften. Dazu zählten z.B.
„Frankfurter Rundschau“, „Rheinischer Merkur“, „Mannheimer
Morgen“, „Der Spiegel“, „Die Zeit“, „Stern“. Hinzu kamen
verschriftlichte Politikerreden und Protokolle von Sitzungen des
Bundestages. Für die lexikologische Untersuchung wurde das
Rechnersystem COSMAS verwendet.
Durch die Korpusanalyse wurden diverse Schlüsselwörter dieser
Zeitperiode extrahiert. Es wurden beispielsweise Begriffe wie
>WENDE<,
>REVOLUTION<,
>UMWÄLZUNG<,
>UMBRUCH<,
>UMSTURZ<,
>VERÄNDERUNG<,
>WANDLUNG<, >ERNEUERUNG< und >REFORM< als
unterschiedliche „Bezeichnungen für die politischen Ereignisse des
Herbstes 1989 in der DDR und für damit zusammenhängende
gesellschaftliche Veränderungen“ aufgeführt. Hinzu kommen Belege
mit Quellenangabe und Datum, so dass der Leser erkennen kann, in
welchen Phasen welche Begriffe verwendet wurden. Für jedes
analysierte und mit Textstellen belegte Wort werden zusätzlich die
Definitionen aus dem „Wörterbuch der deutschen Gegenwartssprache
(HDG)“ und dem „Duden. Deutsches Universalwörterbuch (DUW)“
gegenübergestellt.
Eine wichtige Rolle spielte bei der Analyse ein Vergleichskorpus, dass
speziell für diesen Zweck zusammengestellt wurde. Darin sind
mehrere der im Institut für deutsche Sprache vorhandenen
gegenwartssprachlichen Korpora mit insgesamt 20 Millionen
Wortformen enthalten. Dazu gehören die Mannheimer Korpora 1
und 2, das Bonner Zeitungskorpus, vier Handbuchkorpora, das
Limas Korpus, das Thomas Mann Korpus und das GrammatikKorpus 1.
An dieser Stelle soll nicht unerwähnt bleiben, dass es noch ein
weiteres „Wende“-Korpus bzw. ein Berliner „Wende“-Korpus gibt: Es
besteht aus Interviews mit 39 Informanten aus dem Ostteil und 38
22
Informanten aus dem Westteil Berlins. In dieser Analyse wurde der
Gebrauch der Modalpartikel >EBEN< und >HALT< untersucht. Fazit
ist u.a., dass die Verwendung des Modalpartikels >HALT< mit
Prestige versehen ist: >HALT< gilt bei den Ostberlinern als markiert,
d.h. typisch westdeutsch. Dessen Verwendung resultiere jedoch bei
den Ostberlinern in Schuldgefühlen, die Solidarität mit der eigenen
Gruppe zu verletzen. >EBEN< hingegen wurde stets stärker in
Ostberlin verwendet (Dittmar 2000, S.1999 ff.).
3.2 Kommunikative Grundlagen der Korpuslinguistik
Zeitungstexte
stehen
in
einem
bestimmten
Kommunikationszusammenhang. Printmedien sind in der Regel
immer für Massenkommunikation ausgerichtet (Noelle-Neumann
2002, S.155). Das ist nur noch eingeschränkt gültig, wenn Zeitungen
nicht mehr aktuell oder ausschließlich in Archiven zu finden sind.
Diese Archive können auf der einen Seite aus OriginalZeitungsausgaben bestehen, oder virtuelle Datenspeicher wie
Zeitungs-CD-Roms, Online-Archive oder begrenzt zugängliche
Dateien wie die Electronic Database des „British Council“ (s.u.)
sein. In Archiven nehmen Zeitungen und Zeitungsartikel im Rahmen
von Recherchen an einem Kommunikationsprozess teil, die Archive
können besichtigt werden, real oder virtuell.
Genauso, wie Printmedien eine besondere Form der Kommunikation
zwischen Autor und Leser darstellen, lässt sich bei der
Korpuslinguistik eine Kommunikation zwischen den Schreibern der
Artikel bzw. der zu Grunde liegenden Texte auf der einen Seite und
den Rezipienten der Auswertung der Korpusanalyse auf der anderen
Seite feststellen. Dieser spezielle kommunikative Effekt war den
Redakteuren zur Zeit der Erstellung der Texte nicht bewusst. Eine
besondere Rolle spielt dabei der Korpusdesigner.
Die Bestandteile von Presse-Korpora hatten ursprünglich die
Funktion, die Leser zu informieren, zu unterhalten, zu beeinflussen,
etc. Der Korpusdesigner gibt diesen ursprünglich hochaktuellen
Artikeln nachträglich eine neue Funktion, indem er die Texte nach
vorher festgelegten Kriterien neu ordnet und die bisherige Kohärenz
23
der Korpusquellen aufbricht. In den Auswertungen der
Analyseergebnisse sucht er unter einer nun ganz anderen, neuen
Fragestellung
nach
verwertbaren
Gesetzmäßigkeiten.
Der
Korpusdesigner
fungiert
damit
als
„Resteverwerter“,
„Nachlassverwalter“ oder „Textrecycler“. Er nimmt die nicht mehr
aktuellen Zeitungsartikel, ordnet ihnen eine neue, mehr statistische
Funktion zu, indem er sie zum Bestandteil des Korpus macht. Im
nächsten Schritt sucht der Designer in den Zeitungstexten mit
statistischen Methoden nach Informationen, die von einer anderen
Qualität sind, die zum Zeitpunkt der Entstehung der vormals aktuellen
Texte noch unerheblich waren und gar nicht in Betracht gezogen
wurden.
Erst aus einer zeitlichen Distanz und in Verbindung mit zielgerichtet
arrangierten
Vergleichskorpora
erhalten
die
ausgewählten
Zeitungstexte eine neue Bedeutung. Die neue kommunikative
Funktion besteht darin, Zeitungsartikel aus einer Distanz zu
betrachten. Jetzt zählen nicht mehr die medienspezifischen
Charakteristika einer Zeitung wie Publizität, Aktualität, Periodizität,
Universalität, uneingeschränkte Verfügbarkeit und Fixierung in
Schrift und Druck (Faulstich 2004, S. 485), sondern andere Parameter,
die etwas über die zeitliche Epoche, Zeitphase oder Periode aussagen.
Diese Parameter stehen in dieser Untersuchung in Verbindung mit
journalistischem Fachvokabular, zeitspezifischer Sprache oder
historisch terminierten politischen Begriffen, z.B. >GLASNOST<,
>POLL TAX< oder >GROUND ZERO<.
Die Sprache in tagesaktuellen Quellen, bzw. Quellen vom Vortag,
wird zu einer überholten Sprache. Die Bewertung ist distanzierter und
gefühlsneutraler. Die zunächst neue Zeitung wird mehr und mehr zu
einer Konserve, wenn neue Ereignisse die Schlagzeilen von gestern
überholen, auch wenn der Informationsgehalt rein mathematisch
derselbe bleibt. Wir können auf Korpusanalysen also das klassische
Kommunikationsmodell von Shannon und Weaver beziehen. In
diesem Modell wird von einem Sender, einer Nachricht und einem
Empfänger ausgegangen (Shannon/ Weaver 1976, S. 43/44). Bei einer
herkömmlichen Zeitung besteht der Sender aus den Textproduzenten,
also in erster Linie dem Redakteur, der einen Artikel verfasst hat. Die
Nachricht ist der Inhalt des Zeitungsartikels und der Empfänger ist der
Leser.
Ein
Feedback,
das
in
diesem
klassischen
24
Kommunikationsmodell nicht berücksichtigt wurde, kann in Form von
Leserbriefen, Emails oder Anrufen bei der Redaktion gegeben werden.
Im Rahmen der Korpuslinguistik stellt sich dieser Prozess anders
dar: Obwohl die einzelnen Zeitungsartikel, die Bestandteil des Korpus
sind, jeweils auch Verfasser haben, fungieren diese nur sekundär als
Sender. Sie sind in der Masse der Artikel bedeutungslos geworden.
Fortan ist der Korpusdesigner verantwortlich für die Auswahl der
Texte. Wer die Artikel verfasst hat, spielt jetzt kaum eine Rolle, oder
ist im Extremfall nicht mehr nachzuprüfen, wenn keine
Korpusprotokolle existieren. Die transportierte Nachricht ist jetzt nicht
mehr das Ausschlaggebende, sondern der statistische Beitrag zur
Gesamtanalyse. Es sind nicht mehr der Redakteur und die Zeitung
verantwortlich für die geschriebenen Inhalte, sondern der
Korpusdesigner für die Einhaltung der Regeln des Korpusdesigns und
die ordnungsgemäße Durchführung und Auswertung der Analyse. Die
neue Botschaft der Texte ergibt sich erst aus dem Vergleich zweier
Korpora und der anschließenden statistischen Auswertung. Der
Empfänger ist nicht mehr der Zeitungsleser, sondern derjenige, der
die Schlussanalyse vorgelegt bekommt.
SENDER
(Korpusdesigner)
→
NACHRICHT
(Auswertung
d. Korpusanalyse)
→
EMPFÄNGER
( Rezipienten der
Auswertung)
Abb. 2: Die Korpuslinguistik in Verbindung mit dem
Kommunikationsmodell von Shannon und Weaver (stark
vereinfacht)
Bezogen auf den 11. September als Schlüsselereignis bedeutet das im
Rahmen einer korpuslinguistischen Betrachtung, dass eine große
Menge an Artikeln über dieses Ereignis zusammengetragen wurde,
um diese als Ganzes zu interpretieren, unabhängig vom ursprünglich
intendierten tagesaktuellen Zweck dieser Artikel. Die Botschaft, die
wir daraus gewinnen, ist nicht mehr die Einzelnachricht, sondern der
Tenor einer größeren Menge an Artikeln zu diesem Thema. Dieser
Tenor ist unabhängig betrachtet vom unmittelbaren Geschehen des
Vortages und den einzelnen Stellungnahmen der Redakteure. Der
25
Empfänger erhält als Botschaft eine Synthese der journalistischen
Arbeit nach dem 11. September, die besagen kann, dass Terrorismus,
ob gewollt oder ungewollt, in einen Zusammenhang mit der
islamischen Religion gestellt wurde.
3.3 Textanalyse und Textkorpora
Wenn wir diskutieren, was ein Textkorpus ist, lässt es sich nicht
vermeiden, eine moderne Form der Textanalyse anzusprechen.
Deshalb sei hier kurz das Konzept der Textualitätskriterien vorgestellt.
Laut De Beaugrande/ Dressler (1981, S. 20/21) gelten Kohäsion,
Kohärenz, Intentionalität bzw. Akzeptabilität, Informativität,
Situationalität und Intertextualität als die sechs Textualitätskriterien.
Im Folgenden soll kurz das Kriterium der Kohärenz in Bezug auf die
Verwendung von Textkorpora skizziert werden.
Die bisher bestehende Kohärenz von Zeitungsartikeln in den
jeweiligen Zeitungsausgaben beispielsweise ist in der neuen Form,
dem Textkorpus, nicht mehr existent. Zwar gibt es Kohärenz nach wie
vor innerhalb des im Korpus plazierten Ursprungstextes, jedoch ist die
Form der vormaligen Gesamtzeitung aufgehoben, deren Artikel
gebunden an Themenfelder vorliegen und die teilweise innerhalb
derselben und über mehrere Ausgaben hinweg systematisch
miteinander verknüpft sind, wie etwa durch >SIEHE AUCH
KOMMENTAR
S.12<,
>WIR
BERICHTETEN<,
>GEGENDARSTELLUNG<,
>IN
DER
MORGIGEN
AUSGABE<. In einem Textkorpus machen jetzt die Vorgaben des
Korpusdesigns die Kohärenz aus. Die Kohärenz der in einem Korpus
abgelegten Zeitungsartikel besteht beispielsweise in einer zeitlichen,
thematischen und typologischen Zuordnung.
3.4 Die medienspezifischen Charakteristika einer Zeitung
Ein Korpus, das ausschließlich aus Zeitungstexten zusammengesetzt
ist, enthält alle inhaltlichen Informationen der Ursprungstexte, jedoch
26
haben diese in der neuen Form eine andere Funktion. Das gilt
insbesondere für die medienspezifischen Charakteristika einer
Zeitung:
allgemeine Zugänglichkeit (Publizität), Zeitnähe (Aktualität),
regelmäßiges Erscheinen (Periodizität), inhaltliche Vielfalt
(Universalität), die freie Verfügbarkeit nach Ort, Zeit, das Lesetempo
(Disponibilität) und schließlich die Fixierung in Schrift und Druck
(Faulstich 2004, S.485).
Hinsichtlich der Publizität von Zeitungstexten in einem Korpus ist
festzustellen, dass diese gänzlich anders zugänglich sind: Das Korpus
als Textdatei soll vom Rechner geöffnet, durch das Analyseprogramm
geschickt und bei Bedarf in Form von Listen und Statistiken
ausgedruckt werden. Wenn das Korpus eine große Zeitspanne abdeckt
oder das Erscheinen der Originalausgaben weit zurückliegt, verlieren
die Texte mehr und mehr an Aktualität.
Das Merkmal regelmäßiges Erscheinen (Periodizität) ist in einem
Korpus irrelevant, denn unter Umständen sind die Ausgaben über
Wochen, Monate oder sogar Jahre hinweg zusammengefasst. Der
Erscheinungstag spielt im Korpus nur eine untergeordnete Rolle, ist
ggfs. als Metatext vermerkt.
Auch die inhaltliche Vielfalt (Universalität) ist aufgebrochen, da bei
der Erstellung des Korpus’ die benötigten Zeitungstexte unter
Umständen selektiv ausgewählt wurden. Ein Presse-Korpus ist
zumeist einem Thema oder Genre wie Politik, Wirtschaft oder Sport
zugeordnet, was Konsequenzen für die Klassifizierung des Registers
hat (siehe 3.6).
Der fünfte Punkt, die Disponibilität, relativiert sich, denn ein Korpus
stellt ein ganz anderes Medium dar als zuvor die einzelnen
Zeitungsausgaben. Es dient nur noch der technischen
Weiterverarbeitung, bzw. der statistischen Auswertung. Nicht die
einzelnen Informationen sind ausschlaggebend, sondern die
statistische Gesamtaussage im Vergleich zu anderen Textkorpora.
Statt der medienspezifischen Charakteristika einer Zeitung spielt in
der Korpuslinguistik die Betrachtung von Korpus bzw. Korpusdesign
eine ausschlaggebende Rolle. Unerlässlich sind die Punkte
Korpusgröße, Repräsentativität, Diversität, Korpusbestandteile,
Korpusquelle, Synchronität oder Diachronität und Korpusfunktion
(siehe Punkt 4.3).
27
Einschränkend muss hier gesagt werden, dass je nach Zweck des
Korpus ein medienspezifisches Charakteristikum in einem Korpus
wieder an Bedeutung hinzugewinnen kann, wenn beispielsweise die
Aktualität auch später ungebrochen ist. Das ist beispielsweise der Fall,
wenn bestimmte Ereignisse von der Öffentlichkeit nicht richtig
verarbeitet wurden. Deshalb lässt sich behaupten, dass Artikel über
den 11. September 2001 auch Jahre später immer noch eine hohe
Aktualität besitzen können.
3.5 Wahrheitswerte von Sätzen und Texten
Ob eine Nachrichten oder ein Texte wahr oder fiktiv ist, ob sie von
einem Menschen oder sogar von einem Computer erstellt wurden, ist
durch eine Korpusanalyse nicht ohne weiteres zu klären. Der Rechner
ist zwar in der Lage, lexikalische, grammatikalische und
orthografische Strukturen zu überprüfen, aber ob die Texte der
Wahrheit entsprechen oder erfunden sind, lässt sich nicht mit
statistischen Textanalysen und Kollokationslisten beurteilen. Die
einzige Möglichkeit, die sich hier ergibt, ist das Taggen eines Textes
gemäß der Wahrheitswerte bzw. Aussagenlogik (Schwarz, Chur 1993,
S.129 ff.). Wer einen Text taggt, muss in der Lage sein zu beurteilen,
ob die einzelnen Aussagen, die innerhalb eines Textes oder Satzes
getroffen werden, wahr oder falsch sind. Ein Computer kann dieses
nicht beurteilen.
Ob ein Text maschinell erstellt wurde (Textgenerierungsprogramm,
Textzusammenfassung, Übersetzung), lässt sich nur feststellen, wenn
entsprechende Voruntersuchungen getätigt wurden und für jedes Programm ein statistisch verifizierter linguistischer Fingerabdruck erstellt
wurde. Dieser lässt sich höchstwahrscheinlich haargenau herstellen,
denn solche Textgenerierungsprogramme funktionieren nach
allgemeingültigen Prinzipien, die von Programmierern entworfen
wurden.
Textgenerierungsprogramme sollen mit einem vorgefertigten
Wortschatz und Syntaxschablonen auskommen und machen typische
Fehler, die ein Mensch nicht machen würde. Genauso sind in
Zeitungstexten sehr viel mehr Flüchtigkeitsfehler zu finden als in
28
einem Roman. In Bedienungsanleitungen, die übersetzt wurden, gibt
es häufiger Fehler in der Wortwahl und im Ausdruck.
Nur wer ausreichendes Kontextwissen hat und die Hintergründe von
beschriebenen Ereignissen kennt, wer über Beweise verfügt, oder wer
Augenzeuge war und einen Tathergang exakt erinnert, kann den
Wahrheitsgehalt eines beschriebenes Ereignisses beurteilen. Überlässt
man dem Rechner diese Entscheidung, so öffnet man dem Irrtum Tor
und Tür.
Es sei in diesem Zusammenhang auch auf das Ausfindigmachen von
Plagiaten erinnert. Dabei wird überprüft, ob im Streitfall ein Text oder
einzelne Textpassagen tatsächlich dem verantwortlichen Autor
zugesprochen werden können, oder einer anderen Person.
3.6 Pressesprache und Registeranalyse
Sprachliche Register (Thompson 2004, S.40; Halliday 2004, S.525;
Spolsky 1998, S.33-35) sind nicht zu verwechseln mit
Sprachdomänen (domains of language use, Romaine 1989, S.29-31).
Während sich sprachliche Register als Sprachverwendung in
Textsorten oder –themen sowohl bei gesprochener als auch
geschriebener Sprache beschreiben lassen (Sprache des Journalismus,
juristische Fachsprache, Jugendsprache, etc.), so bezieht sich der
Begriff sprachliche Domäne auf die Orte, an denen bestimmte Formen
der Sprache verwendet werden (Religionsgemeinschaft, Peer-Group,
Familie, etc).
Ein Textproduzent oder Autor fällt die Entscheidung, welche
Wortwahl er trifft, um einen Sachverhalt darzustellen. Diese Begriffe
sind maßgeblich von der beschriebenen Sache abhängig, von dem
Fachvokabular, auch wenn dort jede Menge an Variationen möglich
ist. Es kommt dabei auf den Sozialisationsweg an, denn ein
Naturwissenschaftler beschreibt u.U. denselben Sachverhalt anders als
ein Geisteswissenschaftler oder ein Experte auf dem interessierenden
Themengebiet. Ein Techniker benutzt mehr technische Ausdrücke,
während ein Geisteswissenschaftler mehr ästhetische Begriffe
verwendet. Ebenso unterscheidet sich die Schreibweise von
Journalisten, die bei einer Qualitätszeitung arbeiten, von denen, die für
29
die Boulevardpresse schreiben, obwohl sie über ein und dasselbe
Thema berichten.
Ein Presse-Korpus kann nur unter starken Einschränkungen für die
Charakterisierung von Gemeinsprache herangezogen werden.
Rückschlüsse auf andere sprachliche Register sind nur bedingt
möglich, selbst wenn sich gewisse Tendenzen übertragen lassen, wie
die Tatsache, dass Sprache zunehmend zu Redundanz neigt.
Wer jedoch eine allgemeingültige Korpusanalyse Erfolg versprechend
durchführen will, d.h. eine Analyse, die Rückschlüsse auf
Gemeinsprache zulässt, dem wird empfohlen, das Korpus
registerübergreifend zu konstituieren (Biber 1994, S.186 ff).
Es existieren diverse Versuche, mit Hilfe von Korpusanalysen
sprachliche Register zu definieren und exakte Zuordnungen zu treffen
(automated prediction of registers, Biber 1994, S.193). Biber
schlägt fünf Dimensionen zur Klassifizierung von Registern vor
(narrative versus non-narrative, involved vs. informal production,
elaborated vs. situation dependent, overt expression of
argumentation, impersonal vs. non-impersonal style). Demnach
lässt sich jeder Text anhand des verwendeten Wortschatzes mit Hilfe
dieser Dimensionen genau klassifizieren, ob gesprochene oder
geschriebene
Sprache,
ob
schöngeistige
Literatur
oder
Presseberichterstattung vorliegt (Biber 1998, S. 133ff.).
Zeitungsartikel bestehen aufgrund der Verwendung von Reden,
Zitaten und Interviews von Politikern, Sportlern, Prominenten etc.
nicht nur aus geschriebener Sprache, sondern auch aus gesprochener:
Was Pressesprache ausmacht, ist nicht nur das Fachvokabular des
jeweiligen Themenfeldes, sondern auch das Verwenden von Zitaten
(Quoting) und das Berichten (Reporting) (Halliday 2004, S. 462). In
vielen Fällen wird das Quoting in Anführungszeichen gestellt und
durch ein Komma vom Nebensatz abgetrennt, in dem Reporting
stattfindet. Bei der englischen Zeitungsberichterstattung ist häufig das
Reporting dem Quoting vorangestellt, um das Geschehene besser
widerzuspiegeln und plastisch darzustellen.
Dementsprechend findet sich das Quoting im Hauptsatz (main clause)
und das
Reporting im Nebensatz (’verbal’ clause). In der
funktionalen Grammatik haben sich dafür die Begriffe projecting
clause (’verbal’ process clause) und projected clause (das, was
gesagt wurde) eingebürgert (Halliday 2004, S.445).
30
Was sich im Zuge des 11. September häufig feststellen lässt, ist die
Tatsache, dass Politikerreden als vollständige Artikel in Zeitungen
erscheinen und später nicht differenziert werden kann, ob es sich um
eine Rede handelt oder um einen Gastkolumnisten. Diese Texte
wirken wie Appelle an die Bevölkerung (z.B. Jack Straw in The
Guardian, am 26.10.2001, s.u.).
Zeitungsartikel sind nach bestimmten Grundprinzipien aufgebaut,
Stichwort: die sechs journalistische W-Fragen Wer? Wie? Was?
Wann? Wo? Warum? (Hruska 1999, S. 35 ff). Jedoch gibt es keinen
100-prozentig exakten Bauplan, der von jedermann eingehalten
werden kann.
Die Differenzen bei der Berichterstattung verschiedener Zeitungen
resultieren aus der Hinwendung zu unterschiedlichen Zielgruppen,
deren Weltbildern und politischer Gesinnung, aber auch aus den
Vorgaben des Chefredakteurs.
Eine weitere Größe ist die lexiko-grammatikalische Ausdrucksweise
des Verfassers (Biber 1998, S. 84), dessen momentane Stimmung, die
Haltung zu einem Thema, aber auch externe Faktoren wie das
persönliche Umfeld, das ihn u.U. beeinflussen kann.
Es ist anzunehmen, dass eine monarchistisch orientierte Zeitung wie
„The Daily Telegraph“ mit Themen die Regentschaft betreffend
anders umgeht als eine linksorientierte Zeitung wie „The Guardian“.
Umgekehrt gewichtet eine Zeitung wie „The Guardian“ Themen, die
die Arbeiterschaft betreffen, anders als die konservative „The
Times“. Diese Behauptung könnte durch eine Korpusanalyse
verifiziert werden.
Es lässt sich in drei Aspekte der Sprachverwendung innerhalb von
Zeitungshäusern
differenzieren:
zunächst
der
vertikalen
Ausdrucksweise innerhalb eines Zeitungshauses in Form von
Richtlinien, Sprachregelungen, Redaktionsanweisungen, dann das
lexiko-grammatikalische Wissen der einzelnen Autoren, als drittes der
Tenor eines Artikels, also der sozialen Distanz, die zwischen dem
Autor eines Artikels (speaker) und den Lesern (addressee) herrscht
(contextual variables of tenor: status, formality and politeness,
Halliday 2004, S.631).
Die lexiko-grammatikalische Ausdrucksweise ist abhängig vom
Sozialisationsprozess des Autors, der seinen Schreibstil und sein
Sprachprofil aus dem Umfeld erworben hat, also in den verschiedenen
31
Sprachdomänen wie Familie, Schule, Universität, Journalistenschule,
Freundeskreis und zu guter Letzt vom Redakteur, der ihn in einer
Zeitung ausbildete. Doch in der Masse der Zeitungsschreiber
verschwimmt der Stil eines einzelnen Journalisten in der
Korpusanalyse (Halo-Effekte: Der Gesamteindruck oder eine
hervorstechende Eigenschaft einer Person beeinflusst die Beobachtung
und Beurteilung anderer Merkmale, Trautner 1997, S.439). Sein
Artikel wird jetzt lediglich mitanalysiert, der z.T. informativästhetische Wert, den der Leser bei gutem Journalismus zu schätzen
weiß, findet keine Berücksichtigung mehr. Der Stil des Einzelnen hat
in der Korpuslinguistik erst einen Wert, wenn von dieser Person
hinreichend Material vorliegt. Nur die Masse an Texten zählt und
kann ein aussagekräftiges Ergebnis herbeiführen.
Im Folgenden sind Wortpaare aufgeführt, die von einer
unterschiedlichen Sozialisation der Sprecher oder Schreiber zeugen
und damit von einer unterschiedlichen lexiko-grammatikalischen
Ausdrucksweise:
>MEHRWERT<
>PRODUKTIONSMITTEL<
>SOZIALISATION<
>KAPITAL<
>E-KAPITALISMUS<
>REVOLUTION<
>BASIS<
>VOLK<
>RESTRIKTIV<
>MUSLIMISCH<
>ÜBERWACHUNG<
>FREIHEITSKÄMPFER<
vs.
vs.
vs.
vs.
vs.
vs.
vs.
vs.
vs.
vs.
vs.
vs.
>KONZERNGEWINN<
>MASCHINEN<
>ERZIEHUNG<
>GUTHABEN<
>NEW ECONOMY<
>UMBRUCH< (siehe 3.1)
>GRUNDLAGE<
>BEVÖLKERUNG<
>AUTORITÄR<
>ISLAMISCH<
>KONTROLLE<
>TERRORIST<
Abb. 3: Synonyme Wortpaare aus unterschiedlichen Registern
(eigene Beispiele)
Die Ausdrucksweise einzelner Autoren wird dadurch aufgehoben,
dass eine große Menge an Zeitungsartikeln dreier unterschiedlicher
Zeitungen analysiert wird. Dieser Halo-Effect muss aus Gründen des
Aufwandes in dieser Dissertation unberücksichtigt bleiben. Es kann
32
nicht für jeden einzelnen Autor eine separate Analyse durchgeführt
werden. Interessant wäre ferner die Fragestellung, ob für 1990 mehr
tätige Journalisten zu verzeichnen sind als für 2001, was etwaige
Veränderungen der Type-Token Relation erklären könnte.
Für die Analyse von journalistischer Sprache sind auch andere
Korpuskonstellationen denkbar als die in dieser Dissertation
vorliegende. So ließen sich Zeitungen nach Up-Market-, MiddleMarket- und Down-Market-Newspapers klassifizieren. Für dies
Klassifizierungsschema
wurde
von
Jucker
1992
eine
Querschnittsanalyse durchgeführt (nach Stubbs 1996, S.16 ff.), die als
Ergebnis lieferte, dass in den 43 000 Nominalphrasen der 371
analysierten Zeitungsartikel bei Up-Market-Newspapers deutlich mehr
Modifiers verwendet wurden als bei Down-Market-Papers, zweitens,
dass Nominalphrasen-Appositionen in der Lage sind, diese drei
Zeitungstypen zu klassifizieren, und drittens, dass Down-MarketNewspapers ständig die Determiner >A< und >THE< in den NPAppositionen weglassen.
Es soll an dieser Stelle vorweggenommen werden, dass der Beruf des
Journalisten durch die Einführung des Internet gravierende
Veränderungen durchlaufen hat, die Arbeitsgrundlage dieser
Berufssparte
hat
sich
durch
dieses
neue
Informationsbeschaffungsinstrument enorm erweitert. Technische
Kenntnisse sind fortan zunehmend gefragt, es ist ein Umbruch in
diesem Berufsstand zu verzeichnen. Neben den veränderten
Arbeitsbedingungen hat sich auch die journalistische Kompetenz
verändert. Die Anforderungen an den Journalismus sind wegen der
z.T. parallelen Aufbereitung der Nachrichten für Print- und OnlineAusgaben gestiegen, und das bei immer knapperen Zeitbudgets (Mast,
Popp, Theilmann 1997, S.53ff.). Es konnten sich neue Formen des
Textdesigns etablieren (siehe 4.10).
Der Sozialphilosoph Habermas gibt in diesem Zusammenhang zu
bedenken, dass eben die Mittel uneingeschränkter Kommunikation die
Entwicklung kritischer, vernünftiger Argumentation einschränken und
in ihrer Wirksamkeit blockieren (Habermas 1982, S.11/12).
33
3.7 Ereignisorientierte Veränderungen von Sprache
Es kommt in der Geschichte regelmäßig zu gravierenden nationalen
und weltpolitischen Ereignissen, die in der Lage sind, Einfluss auf die
Sprachverwendung in einem Staat, Kulturkreis oder Sprachraum zu
nehmen. Zu diesen Ereignissen gehören die Französische Revolution,
die Machtergreifung der Nationalsozialisten, das Ende des Dritten
Reiches, die Kulturrevolution in China, die Reformen Atatürks in der
Türkei und der Fall des Eisernen Vorhangs.
Im Zuge des Falls der Berliner Mauer und der deutschen
Wiedervereinigung fiel offiziell im Bereich der ehemaligen DDR der
Fachwortschatz des historischen Materialismus weg, der zuvor die
Sprache in den Medien und im politischen Diskurs entscheidend
prägte. Stattdessen wurde nach einer gewissen Übergangsperiode der
politische Wortschatz der alten Bundesländer adaptiert (siehe 3.1).
Nach der weltweiten Einführung des Internet in der uns heute
bekannten Form 1991, kam es zu unzähligen sprachlichen
Neuerungen, verwiesen sei hier auf die technischen Fachbegriffe des
„World Wide Web“, die sprachlichen Besonderheiten des „Chat“ und
der Email-Kommunikation, sowie der Fachwortschatz der Informatik.
Ein Internet-User benötigt das Fachvokabular der Internet-Nutzung
wie
>BROWSEN<,
>NAVIGIEREN<,
>SURFEN<,
>WEBDESIGN<, >CACHE<, >COOKIES<, >SPAM FILTER<,
>IP-ADRESSE<, >JUNKMAIL< u.v.m.
Durch die technischen Neuerungen in den Neunziger Jahren sind
Tausende von Begriffen neu ins Lexikon aufgenommen worden, die
uns helfen sollen, die neue Technik zu verwenden, zu beschreiben und
darüber zu diskutieren. Ferner ist eine Unzahl an neuen Berufen
entstanden (>WEB-DESIGNER<, >NETZWERK-SPEZIALIST<,
>ONLINE-REDAKTEUR<,
etc.).
Der
Anteil
des
Computerwortschatzes an der Gemeinsprache in Deutschland hat sich
vom Stand Null in den vierziger Jahren auf einen Level erhöht, der
bereits 1991 einen Anteil von schätzungsweise zwei Promille erzielte,
ausgehend von den Lemmata im Universalwörterbuch (Wichter 1991,
S.56, S.127). Diese Tendenz kann sich nach der weitflächigen
Einführung des Internet nur weiter verstärkt haben.
Das dritte Beispiel, das hier aufgeführt werden soll, sind die
sprachlichen Veränderungen, die durch die Terroranschläge vom 11.
34
September 2001 herbeigeführt wurden. Dieser neu etablierte
Wortschatz ist geprägt von Sicherheitsthemen, Krisenmanagement
und Generalabrechnungen. Auch hier stehen neue Begriffe im
Mittelpunkt: >SLEEPER<, >AL-QAIDA<, >AXIS OF EVIL<,
>BIOTERRORISM<, >DIRTY BOMB<, >GROUND ZERO<,
etc. (siehe Kapitel 5.). Die Nachrichtenagenda wurde auf den Kopf
gestellt. Der Laissez-faire-Journalismus wurde ersetzt durch einen
Journalismus der Stärke, Kompromisslosigkeit und Loyalität
gegenüber den USA.
3.8 Die Grenzen der Korpuslinguistik
In der Regel verführt der Computer dazu, ihn auf alles Mögliche
anzuwenden, selbst wenn diese Bezugssysteme unausgegoren sind.
Problematisch wird dieses nur, wenn daraus Fehlschlüsse gezogen
werden, beispielsweise wenn die Sprache von Tacitus, Sallust oder
Cicero stellvertretend für die gesamte Epoche als Standard betrachtet
wird. So sprechen die amerikanischen Linguisten McEnery und
Wilson (2001, S.108) von den drei Irrtümern der historischen
Korpuslinguistik: “philologist’s dilemma“, “god’s truth fallacy“
und “mystery of vanishing reliability“.
Das „philologist’s dilemma“ liegt vor, wenn die Texte nicht mehr in
ihrem Kontext studiert werden können, wenn der Computer nur noch
das vorliegende Korpus analysiert und die Quelltexte,
Zusatzinformation wie Abbildungen, Literaturhinweise, Fußnoten
Schlagzeilengröße,
Fettgedrucktes
und
Bildunterschriften
unberücksichtigt lässt. So wird auch die so genannte Pressephonologie
(Tench 1990), zumeist ein Schlagzeilenphänomen, unberücksichtigt
gelassen. Riesige Schlagzeilen stehen in einem Korpus gleichrangig
mit den anderen Bestandteilen, obwohl diese auf den Leser einen
besonderen Effekt haben sollen und deshalb eine andere Funktion als
der restliche Artikel besitzen. Dieser Beurteilungsgrundsatz sollte bei
einer Korpusanalyse berücksichtigt werden.
Das Phänomen „god’s truth fallacy“ liegt vor, wenn falsche
Rückschlüsse auf eine ganze Epoche gezogen werden. Es sind aus der
Antike nur wenige Quellen erhalten, darunter häufig Texte von
35
Geschichtsschreibern, Dichtern und Politikern. Wenn ein
Computerprogramm deren Wortschatz und typische grammatische
Strukturen ermittelt, so sind diese Erkenntnisse nur auf die Register
dieser Personen zu beziehen und nicht auf die von der damaligen
Bevölkerung verwendete Sprache. Wenn in einer Analyse festgestellt
wird, wie häufig bei Cicero das Gerundium Verwendung findet, darf
man dieses nicht für alle sprachlichen Handlungen im gesamten
damaligen römischen Reich verallgemeinern. Das heißt für eine
Analyse von Presse-Korpora, dass die Ergebnisse nicht auf den
gesamten Sprachgebrauch transferiert werden dürfen, auch wenn der
Effekt von Medien auf die Bevölkerung nicht unterschätzt werden
darf.
Das so genannte „mystery of vanishing reliability“ besagt, dass es
problematisch ist, wenn innerhalb eines Korpus zu viele Punkte
fokussiert werden, da dadurch der Blick fürs Wesentliche verloren
geht. Das ist beispielsweise der Fall, wenn in einem getaggten Korpus
zu viele Elemente kodiert wurden. Es führte regelrecht in ein Chaos
innerhalb eines Korpus Themenfeldzugehörigkeit, soziolinguistische
und grammatikalische Variablen gleichzeitig zu kodieren. Es sollte
nur ein Bereich fokussiert werden, um zu gewährleisten, dass die
Quintessenz herausgefiltert wird.
Zu diesem Punkt ist zu bemerken, dass eine Korpusanalyse Unmengen
an Daten produziert. Davon kann alles in die Beurteilung einfließen,
das für eine nüchterne Bewertung brauchbar ist. Die Kunst sollte darin
bestehen, die wichtigsten Ergebnisse herauszufiltern und die
gewonnenen Daten in einer akzeptablen Form zu präsentieren.
4. KAPITEL: Die Strukturierung der Korpora und die
technischen Hindernisse
Das folgende Kapitel soll die Funktionsweise der verwendeten
Analysesoftware „Wordsmith“ beschreiben und die Probleme, die
auf dem Weg dieser Arbeit in verschiedenen Bereichen zum Tragen
kamen. Es wird die Vielzahl von Arbeitsschritten deutlich werden, die
zu einer umfassenden computergestützten Textanalyse führt. Wir
lernen etwas über die Entstehungsgeschichte der verwendeten
36
Textkorpora, die eigens für diese Analyse aus Zeitungsartikeln aus
„The Times“, „The Guardian“ und des „The Independent“ erstellt
worden sind. Die genaue Zusammensetzung der Korpora ist in
Tabellen dargestellt.
Des Weiteren werden die Auswirkungen von gravierenden
medienrelevanten Ereignissen wie 9/11 auf die Sprachverwendung in
die Diskussion eingebracht.
4.1 Die Funktionsweise von Wordsmith
Bei der für diese Korpusanalyse verwendeten Software „Wordsmith“
handelt es sich um die Version 2.0 von Mike Scott & Oxford
University Press, eine weit verbreitete Analysesoftware.
Vergleichbare Programme sind Word-Cruncher, MonoConc oder
Sara, die jeweils unterschiedliche Schwerpunkte in ihren Funktionen
vorweisen können. Die Funktionen von Wordsmith sind ausführlich
im dazugehörigen Handbuch beschrieben (Scott 1998).
Diese Software besteht aus drei Tools: „Wordlist“, „Concord“
und „Keywords“. Diese Tools beinhalten diverse Unterfunktionen.
Wird das Tool „Wordlist“ auf ein Korpus angewendet, so werden
stets automatisch drei Listen erzeugt: erstens, die alphabetische
Wortliste, zweitens, die Häufigkeitsliste, die aus denselben Daten
besteht, wie die alphabetische Liste, nur dass diese nach Häufigkeiten,
also Anzahl der Token pro Type, geordnet ist. Als drittes wird eine
Liste erzeugt, die eine kleine Statistik mit den wichtigsten
Korpusdaten enthält. Diese besteht u.a. aus Anzahl der Wörter,
Anzahl der Sätze, durchschnittlicher Satzlänge und Type-Token
Relation.
Das Programm arbeitet auf rein mathematischer Basis. Ein Zeiger
läuft den Text, der sich als Zeichenkette oder als String begreifen
lässt, von Anfang bis Ende durch, zählt die Wörter so aus, dass für
jede Type eine Kategorie eröffnet wird, in der die Anzahl der Token
auf der einen Seite als natürliche Zahl und auf der anderen als
Prozentzahl festgehalten wird.
Ein wichtiger Bestandteil der Korpusstatistik ist die so genannte TypeToken-Analyse, bei der die Type-Token Relation (TTR), die im
37
betrachteten Korpus vorliegt, ermittelt wird. Diese ergibt sich aus der
Anzahl der Token eines Textes, also der Anzahl aller Elemente in
Form von Wörtern und der Anzahl der verschiedenen Wörter, die
Typen genannt werden.
Für die Type-Token Relation erhalten wir eine Prozentzahl, die
besagt, wie viel Prozent aller Token zugleich auch Typen sind
(Anzahl der Typen dividiert durch Anzahl der Token, Ergebnis
multipliziert mit 100, Hansen/ Teich 1999, S.311-322). Diese Relation
ist nicht zuletzt aus dem Grund sehr wichtig, da sie ein Urteil darüber
zulässt, wie umfangreich der Wortschatz eines analysierten Textes
oder Korpus ist, also wie viele unterschiedliche Wörter in einem Text
oder einer Textsammlung vorkommen. Bei der Analyse sind die
einzelnen Wörter grundsätzlich nicht „case sensitive“, d.h. es spielt
keine Rolle, ob die Wörter groß oder klein geschrieben sind. Jedoch
lässt sich dieses mit Feineinstellungen der Software ändern.
Im Rahmen der Statistik des Tools „Wordlist“ wird zusätzlich die
durchschnittliche Wortlänge bestimmt, die Anzahl der Sätze und die
durchschnittliche Satzlänge in Anzahl der Wörter. Ferner wird die
Größe des Korpus in Bytes angegeben.
Eine weitere Funktion ist das Auflisten der Wörter nach Anzahl der in
ihnen enthaltenen Buchstaben: die Anzahl der Wörter bestehend aus
einem Buchstaben (1-letter-words) bis hin zur Kategorie 14(+)letter-words, also die Anzahl der Wörter, die sich aus 14 und mehr
Buchstaben zusammensetzen.
Ein gravierender Nachteil bei diesen Listen ist die Tatsache, dass
Wörter, die aus mehr als zehn oder elf Buchstaben bestehen, nicht
vollständig in den Listen erfasst werden können. Deshalb werden
entweder die ersten oder die letzten oder die ersten und die letzten
Buchstaben abgeschnitten, was in einigen wenigen Fällen
Schwierigkeiten bei der Auswertung verursacht.
Das Tool „Concord“ listet alle Belegstellen (Konkordanzen) des
eingegebenen Wortes, Kompositums bzw. der Wortkette auf, versehen
mit ihren Kollokationen. Wordsmith gilt neben CobuildDirect,
Lexa, TACT und Hua Xia als eins der wichtigsten KonkordanzTools (Oakes 2003, S.193-195). Die Auflistung kann nach links- und
rechtsseitigen Kollokationen sortiert werden. Unter Kollokation
verstehen wir die Wortumgebung eines markierten Wortes (Sinclair
1991, S.170). Diese ermöglichten eine weitere Differenzierung und
38
helfen beispielsweise auftretende semantische Formen wie
Homonyme (Lyons 1985, S.35) zu bestimmen. Zu kritisieren ist dabei,
dass in den Konkordanzlisten nicht der gesamte Satz aufgeführt
werden kann, sondern nur ein kleiner Ausschnitt, teilweise auch das
Ende des vorhergehenden Satzes oder der Anfang des folgenden.
Eine Differenzierung zwischen den semantischen Relationen kann
das Programm nicht eigenständig durchführen, auch wenn der
gefundene Kontext darüber Aufschluss geben kann. Textorientierte
Computersoftware
wie
Rechtschreib-,
Übersetzungsoder
Suchprogramme sind heutzutage nur bedingt in der Lage, diese
Unterscheidungen eindeutig vorzunehmen (siehe Punkt 6.5.1), es sei
denn, dass wir auch die Wortumgebungen (context word) eingeben,
die die Bedeutung im Kontext genau definieren helfen. Es kommt
ferner darauf an, ob wir eine semantische oder morphologische
Fragestellung verfolgen. Auch die Verfahrensweise, dass ganze
Wortstrings eingegeben werden, kann zum Ausschluss wichtiger
Textstellen aus der Konkordanzliste führen, da hierbei zumeist nicht
die unterschiedlichen Ableitungen der Grundform, des Lemmas,
mitberücksichtigt werden können.
Es ist stets eine genaue Überprüfung der vom Computer produzierten
Kollokationslisten erforderlich, ob auch Belegstellen für homonyme
und polyseme Wörter aufgelistet wurden.2
Tool Nummer drei „Keywords“ ermöglicht es, ein ausgewähltes
Korpus mit einem Referenzkorpus zu vergleichen. Dafür müssen zwei
zuvor erstellte Wortlisten abgespeichert werden. „Keywords“ listet
die Schlüsselwörter auf und versieht sie mit einem Keyness-Wert.
Bei der Anwendung dieses Tools ist ausschlaggebend, welches
Korpus Basiskorpus (bzw. Ausgangskorpus) ist und welches
Referenzkorpus. Aus dem Basiskorpus werden die Schlüsselwörter
extrahiert, also die Wörter, die signifikant häufiger im Basiskorpus
vorkommen, als im Referenzkorpus. Die Konstellation kann später
vertauscht werden. Somit sind bei drei Korpora (K1, K2 und K3)
insgesamt sechs Keyness-Analysen möglich.
Wir können sagen, dass die Funktion „Keywords“ die Wörter aus
dem Basiskorpus extrahiert, die im Referenzkorpus aus irgendwelchen
zu überprüfenden Gründen nicht oder seltener vorhanden sind.
2
Nerlich et. al (2003, S.4) grenzen Polysemie und Homonymie folgendermaßen voneinander ab: während es für
homonyme Wörter wie (financial) bank und (river) bank zwei lexikalische Einträge gibt (lexical entries), ist es
für polyseme Wörter nur ein Eintrag (z.B. nose, ’facial organ’, ’sense of smell’, ’attribute of a wine’).
39
Entweder existierten sie in dem vom Korpus erfassten Zeitraum noch
nicht, sind mittlerweile schon wieder aus der Mode gekommen oder
ihr Gebrauch ist nicht mehr zeitgemäß, stigmatisiert oder vergessen.
Gleichzeitig werden die Worte aufgelistet, die im Referenzkorpus sehr
viel seltener vorkommen. Die Wörter mit der prozentual höchsten
Abweichung stehen ganz oben. Der Keyness-Wert ergibt sich
mathematisch aus Anwendung von χ²-Tests und Log-LikelyhoodMethode auf die beiden Frequenzwerte und Prozentwerte des zu
analysierenden Korpus und des Referenzkorpus (Oakes 2003, S.38,
S.189). Die maximale Länge dieser Listen beträgt 500 Einträge.
Es lassen sich Grenzwerte in Prozent festlegen, so dass speziell die
Wörter extrahiert werden, die außerhalb oder innerhalb dieser Grenzen
liegen, also mindestens die gewünschte vorher festgelegte
Häufigkeitsdifferenz zum Auftreten im Vergleichskorpus ergeben.
So können wir gezielt die Wörter vergleichen, die eine Häufigkeit
zwischen 0,5 % und 0,75 % in den Textkorpora haben. Das kann u.U.
wichtig sein, wenn beispielsweise zwei scheinbar identische Korpora
miteinander verglichen werden sollen.
Besonders der Vergleich von Worthäufigkeiten und deren
anschauliche Darstellung in Listenform stellt ein ausgezeichnetes
Arbeitsinstrument dar.
4.2 Die Korpusprotokolle
Zu jedem Textkorpus wurden während der Erstellung die wichtigsten
Begleitinformationen in einem Korpusprotokoll festgehalten. Dieses
Vorgehen war aus den folgenden Gründen unerlässlich: Die
Protokolle sind zum einen die Basis für die spätere Statistik, zum
anderen gelten sie als Anhaltspunkt, wie weit die Korpuserstellung
fortgeschritten ist.
Zunächst wurden sechs Korpusprotokolle erstellt. Darin sind die
Indizes der Korpora aufgeführt (Times.1990, Independent.1990,
Guardian.1990, Times.2001, Independent.2001, Guardian.2001),
das Datum der erfassten Zeitungsausgabe, das erfasste Themenfeld,
Anzahl der Artikel pro Publikationstag und Themenfeld und die ersten
drei Wörter der ersten und letzten Schlagzeile pro Themenfeld und
40
Tag. Die Protokollerstellung ist akribisch durchgehalten worden, um
gegebenenfalls bei einer Unterbrechung der Arbeit am Korpus sofort
den bisher erreichten Punkt wieder zu finden.
Nachdem aus Designgründen, d.h. wegen einer besseren Auswertung
von Texten im Zusammenhang mit dem 11. September 2001, die
Korpusgrenzen noch einmal verändert wurden, mussten weitere Texte
gesammelt werden. Zwecks besserer Unterscheidung erhielten die
Subkorpora
eigene
Bezeichnungen
(Times.2001.danach,
Independent.2001.danach, Guardian.2001.danach, siehe 4.6). Die
Subkorpora mit Artikeln bis einschließlich dem 11. September
erhielten das Kürzel 2001.davor.3
Die
Korpusprotokolle beinhalten Randnotizen, die bestimmte
Auffälligkeiten festhalten, die während der Korpuserstellung bemerkt
wurden, in erster Linie Themenhäufungen infolge von politischen
Ereignissen
(z.B.
>POLL
TAX
DEMONSTRATION<,
>LITHUANIA<, >GERMAN REUNIFICATION<, etc.). Diese
Vorgehensweise sollte bei der späteren Datenauswertung hilfreich
sein.
Die Anzahl der bisher gesammelten Artikel wurde festgehalten, um
kalkulieren zu können, wie viele Artikel für das derzeit bearbeitete
Unterkorpus noch benötigt werden. Ferner konnte vorab berechnet
werden, wie viel Zeit auf die weitere Korpusarbeit zu verwenden war.
Aus diesen Protokollen wurden schließlich die eigenen
Korpusstatistiken erstellt (siehe Punkt 4.9), die nicht zu verwechseln
sind mit den Korpusstatistiken, die von Wordsmith erstellt wurden.
Letztendlich wurden nur das Datum, Zeitung und Zeitraum,
Themenfeld und die Anzahl der Artikel pro Themenfeld in diese
Statistiken übernommen.
Die Protokolle gelten deshalb als eine unverzichtbare
Orientierungsgrundlage, als auch später die Korpora noch einmal
überarbeitet
wurden,
um
beispielsweise
die
textlichen
Metainformationen zu tilgen, Sichwort: Post-Editing und Stripping
(siehe 4.7). Außerdem bieten sie wichtige Anhaltspunkte, wenn die
Korpora für andere Zwecke oder Projekte weiterverwendet oder Teile
extrahiert werden sollen. Das Protokoll ist insofern unerlässlich.
3
Der 11. September fiel direkt in die Phase der Korpuserstellung.
41
4.3 Das Korpusdesign
Die erfolgreiche Durchführung einer Korpusanalyse ist abhängig vom
Erstellen bzw. Designen des Textkorpus oder der Textkorpora nach
wissenschaftlichen Kriterien. Wenn stichhaltige Ergebnisse erzielt
werden sollen, müssen mindestens zwei Korpora miteinander
verglichen werden. Diese Korpora sollten einer einheitlichen
Thematik zugeordnet werden. Als Kategorien könnten zu Grunde
gelegt sein: Texte aus Qualitätszeitungen, Zeitungstyp, Texte aus der
Rubrik Politik, etc. Diese Baupläne müssen für alle verwendeten
Korpora gleichermaßen „wie ein Kochrezept“ gelten. Doch es müssen
unterscheidende Variablen wie Zeitungsjahrgang oder Zeitungstyp
festgelegt werden, je nachdem, ob eine diachrone oder synchrone
Analyse durchgeführt werden soll. Das Design darf die Ergebnisse der
Analyse auf keinen Fall zu manipulieren versuchen. Es müssen die
Gesetze der Statistik angewendet werden, da es sich bei einem
Textkorpus um eine Stichprobe der Gemeinsprache handelt.
In der Statistik wird differenziert in Zufallsstichproben,
Klumpenstichproben und geschichtete Stichproben (Bortz 2005, S.8689). Bei den für die vorliegende Analyse verwendeten Zeitungstexten
handelt es sich um Zufallstichproben, da jeweils aus der Masse aller
Zeitungsartikel bestimmte Artikel herausgegriffen wurden. Dies
geschah nicht systematisch, auch wenn teilweise aufeinander folgende
Ausgaben verwendet wurden (siehe Punkt 4.9).
Ein Textkorpus ist immer nur ein Ausschnitt einer umfangreichen
Textmenge. Zunächst muss die Größe des zu erstellenden Korpus
festgelegt werden. Als Faustregel gilt, dass das Korpus so
umfangreich sein muss, dass es statistisch verwertbare Ergebnisse
liefert. Dieses ist stets vom Untersuchungsgegenstand abhängig und
wie viel Textmaterial dazu vorhanden ist. Eine optimale
Stichprobengröße gibt es deshalb nicht. Jedoch haben Untersuchungen
gezeigt, dass eine Korpusgröße von 20 000 Wörtern ausreichend groß
sein kann, um statistisch verlässliche Ergebnisse über Häufigkeiten zu
erlangen, es sei denn, dass der Forschungsgegenstand zu komplex ist
(De Haan 1992, S.3 ff.).
Da im vorliegenden Fall qualitative Veränderungen von
Zeitungssprache, speziell bei britischen Qualitätszeitungen analysiert
42
werden sollen, sind umfangreichere Korpusgrößen veranschlagt
worden. Dabei haben zwei Parameter die Entstehung der insgesamt
drei Hauptkorpora beeinflusst: das ist zum einen die Einführung des
Internet, und zum anderen der 11. September 2001.
Generell muss die Gesamtzahl der Wörter, Artikel oder
Zeitungsausgaben so repräsentativ sein, dass exakte Rückschlüsse auf
den Sprachgebrauch in dem analysierten Medium, die Wortwahl, den
Stil und die Ausdrucksweise gezogen werden können, aber auch auf
Rechtschreibfehler, sofern dieses thematisiert wurde. Erst eine
ausreichende Menge von analysierten Presse-Texten lässt ein
adäquates Urteil über den Sprachgebrauch einer Zeitung zu, der mal
verallgemeinernd, mal einzelfallbezogen, mal zusammenfassend, mal
reißerisch, mal objektiv und mal detailliert sein kann.
Biber geht in „Corpus Linguistics“ (1998, S.148) von sechs
Determinierungsmöglichkeiten für Textkorpora aus: Korpusgröße,
Repräsentativität, Diversität, Korpusbestandteile, Korpusquelle
und synchrones vs. asynchrones Korpus.
Mit dem Thema Korpusgröße haben sich bereits diverse Linguisten
auseinandergesetzt (Armstrong 1994; Kennedy 1998, S.66; Sinclair
1991, S.18/19). Es zeigt sich, dass es stark divergierende Meinungen
dazu gibt. Die Tendenz geht dahin, dass immer größere Korpora
verwendet werden. Diese Entwicklung geht Hand in Hand mit dem
Fortschritt auf dem Computersektor. Im Rahmen der hier
vorliegenden Arbeit wurde vorab eine Korpusgröße festgelegt, die
ausreichen sollte, um als sinnvolle Stichprobe zu gelten. In der
Korpuslinguistik ist es üblich, runde Zahlen für die Anzahl der Wörter
festzulegen (British National Corpus (BNC): 100 Millionen).
Deshalb wurde für diese Untersuchung entschieden, drei Korpora mit
insgesamt 4 Millionen Wörtern zusammenzustellen, die sich jeweils
aus drei Unterkorpora zusammensetzen. Diese Korpusgröße ist
ausreichend, um als sinnvoll verwertbare Stichprobe zu gelten.
Als Orientierungsmarke sei angeführt, dass das vollständige LondonLund-Corpus of Spoken Englisch aus 100 Texten mit insgesamt
500 000 Wörtern gesprochener englischer Sprache besteht (Svartvik
1990, S.14).
Für die Untersuchung ist es wichtig, dass ein ausreichender Zeitraum
zwischen den beiden Korpora K3 (1990) und K2 (2001 vor dem
11.9.) liegt, um sprachliche Veränderungen, verursacht durch die
43
Einführung des Internet, ergründen zu können. Dabei wurden rund
zehn Jahre Differenz als ausreichend erachtet. Durch das dritte
Korpus, ein Vergleichskorpus, das aus nach dem 11.September
erschienenen Zeitungsartikeln besteht, kann diesen sprachlichen
Veränderungen noch eine weitere Vergleichskomponente zugeordnet
werden.
Die Entscheidung für die Größe der Korpora hatte zunächst nur
praktische Gründe, um ein Limit festzusetzen, das gegebenenfalls
später noch einmal korrigiert werden könnte, nachdem ein erster
Einblick in die Materie genommen wurde. Ferner musste die
Korpuserstellung stetig vorangebracht werden, da bei der
Korpuslinguistik das Zusammentragen der Texte u.U. das größte
Problem darstellen kann. Gerade im Laufe der Korpuserstellung
gewinnt der Designer ständig neue Erkenntnisse über die
Korpusquellen.
Ein Korpus kann aber auch zu groß sein: es sind Grenzen durch die
Speicherkapazität und Funktionalität der Rechner gesetzt, das Korpus
muss vom Analyseprogramm eingelesen werden können, der Zeitund Kostenfaktor ist zu berücksichtigen. Das Alphabet und die
verwendeten Zeichen müssen für die Software lesbar sein. Der
Aufwand bei der Erstellung darf nicht zu groß werden. Wir können
den folgenden Leitsatz der Arbeitspsychologie darauf beziehen:
Effektivität ist das Verhältnis von Aufwand zu Ergebnis (Hacker
2005, S.107).
Ferner war dieses Prozedere außerordentlich wichtig, da zu diesem
Zeitpunkt noch keine statistischen Daten über die Korpusquellen in
Form der Online-Zeitungen, der Zeitungs-CD-Roms und der
Electronic Database des „British Council“ vorlagen. Erst die aktive
Arbeit mit diesen Quellen ergab neue Erkenntnisse über die Einteilung
und Stärke der Themenkreise und die Anzahl der tagtäglich
erscheinenden Artikel. Dennoch wurden Vorannahmen getätigt, indem
originale Printausgaben überschlägig durchgezählt wurden. Die
dadurch gewonnenen Zahlen waren nur bedingt verallgemeinerbar, da
Gesamtseitenzahl, Artikelzahl pro Seite, Themenfeld und die
Themenfeldeinteilung selbst sich als stark veränderbar herausstellten,
zumal Großereignisse einen nicht zu vernachlässigenden Einfluss auf
die Zeitungsprodukte Printausgabe, Online-Zeitung und CD-Rom
nehmen können.
44
Das ideale Korpus wäre jenes, das tatsächlich alle Artikel eines
Jahrgangs einer Zeitung enthält. Doch dafür wäre der Aufwand zu
hoch. Stattdessen bietet es sich an, eine geeignete Stichprobe aus allen
erschienenen Artikeln einer Zeitung in einem einzigen Jahr nach
statistischen Kriterien auszuwählen, also in Form einer
Zufallsstichprobe.
Aus praktischen Gründen habe ich mich für die drei
Qualitätszeitungen „The Times“, „The Guardian“ und „The
Independent“ als Grundbestandteile entschieden, da diese zu den
wenigen englischen Qualitätszeitungen gehören, die für 1990 auf CDRom erhältlich waren. Optional hätten „The Daily Telegraph“ oder
das Nachrichtenmagazin „The Economist“ verwendet werden
können.
Im Hinblick auf den Punkt Korpusrepräsentativität werden
Überlegungen unternommen, inwieweit die zusammengestellten Texte
für die Gesamtheit des zu untersuchenden Spektrums der Sprache
repräsentativ bzw. ob sie aussagekräftig für ein ganzes Jahr sind:
Kann die Stichprobe für die Gesamtheit an Texten platz-, zeitund
arbeitssparend verwendet werden? Können die gewonnenen
Korpusdaten verallgemeinert werden?
Von einem lexikalischen und grammatikalischen Standpunkt her
gesehen, kann Zeitungssprache als repräsentativ für die gesamte
englische Sprache gelten. Doch wir können mit aus Zeitungsartikeln
bestehenden Korpora keine Rückschlüsse auf andere sprachliche
Register ziehen, denn dafür sind die Korpora nicht erstellt. Wir
können nicht anhand von Zeitungssprache gesprochene Sprache
bewerten, es sei denn, dass wir ein Vergleichskorpus mit gesprochener
Sprache heranziehen.
Der nächste zu berücksichtigende Punkt ist die Diversität des Korpus.
Dieser Faktor beschreibt, welches Spektrum der Sprache im Korpus
widergespiegelt wird. Dazu gehören Parameter wie verwendete
Zeitungen, Erscheinungszeitraum, die verschiedenen Themenkreise,
und ob gesprochene oder geschriebene Sprache verwendet wurde.4
Die Texte, die Eingang in das Korpus finden, werden genau definiert.
Man spricht von einem ausgeglichenen Korpus (balanced corpus),
wenn unterschiedliche Texttypen enthalten sind (Kennedy 1998,
4
Das Korpus K1 ist nicht zuletzt deshalb eine Ausnahme, weil infolge von 9/11 ungewöhnlich viele
Politikerreden und Zitate wiedergegeben sind: das ist in den anderen Korpora in der Intensität nicht der Fall.
45
S.22). Reine Presse-Korpora sind jedoch vergleichsweise einseitig,
auch wenn es innerhalb einer Zeitung unterschiedliche Textsorten gibt
(Kommentar, Interview, Reportage, Orientierungstexte, Leitartikel
u.v.m.).
Beim Korpusdesign kann in „hard news“ und „soft news“
unterschieden werden (Semino, Short 2004, S.20). In dieser
Dissertation wurden beide Nachrichten-Typen berücksichtigt.
Wenn zwei oder mehr Korpora miteinander verglichen werden, ist es
wichtig, dass deren Bestandteile dieselben Themenfelder oder
Rubriken abdecken. Wenn jedoch eine Zeitung innerhalb eines
Untersuchungszeitraumes die Bezeichnung für die Rubriken bzw.
Themenfelder ändert, so wie es in den 90er Jahren auch bei „The
Guardian“ geschehen ist, so muss ich mir die Themenfelder
aussuchen, die mit denen des Vergleichskorpus übereinstimmen.
Textkorpora sind deshalb vergleichbar, weil sie dieselben
Grundkategorien enthalten wie Texttyp, dieselbe Sprache, identisches
Speicherformat, proportionale Textmengen, vergleichbare Quellen,
etc. Korpusbestandteile sollten jene Elemente sein, die in einzelnen
ausgewählten Medien und deren unterschiedlichen Ausgaben
erschienen sind und laut Definition in das Korpus hineinpassten.
Aus der Masse der 10 219 Artikel entfallen auf K1 2211 Artikel, K2
enthält 2398 Artikel, und K3 5610 (siehe 4.12).
Die Determinierungsmöglichkeit Korpusquelle gibt nicht nur
Aufschluss darüber, welche Herkunftsmedien herangezogen wurden.
Relevant ist auch die Erscheinungszeit, Medientyp, Autor und
Bezugsquelle. Das sind in dieser Analyse die Zeitungsausgaben von
„The Times“, „The Guardian“ und „The Independent“ der Jahre
1990 und 2001, jedoch sind die Speichermedien Online- oder CDRom-Ausgaben und die Electronic Database. Die genaue
Aufschlüsselung erfolgt in Kap. 4.6.
Letztendlich entscheidet die Vorgabe des Korpusdesigns und die
Arbeitshypothese, welche Quellen zu verwenden sind. Das Material
muss gesichtet und auf Brauchbarkeit überprüft werden.
Wenn wir die Printausgaben einer Zeitung vergleichen wollen, ist es
sehr viel einfacher, die Texte von einer CD-Rom, aus einer OnlineZeitung oder der Electronic Database in ein Textdokument zu
kopieren. Allerdings muss dabei gewährleistet sein, dass die
maschinell gespeicherten Artikel mit denen der Printversion identisch
46
sind. Das sollte stichprobenhaft überprüft werden und ist im Rahmen
dieser Dissertation geschehen.
Die verwendeten Online-Zeitungen sind vergleichsweise spät ins
Leben gerufen worden. Nach Auskunft der Online-Redaktionen ist
„The Times“ seit dem 1. Januar 1996 online, „The Guardian“ seit
Januar 1999 und „The Independent“ seit Mitte 1999.
Online-Zeitungen lassen sich unterschiedlichen Gestaltungsprinzipien
zuordnen (Bucher 1998, S. 95 ff, Bucher 1999, S. 16-20):
Strukturvariante, Sparvariante, Boulevardvariante, Listenvariante,
Schalttafel, Ressortvariante, Schaufenstervariante und verschiedene
Kombinationsformen. Die drei für die Korpusgestaltung verwendeten
Online-Zeitungen stellen eine Kombination aus Ressort- und
Listenvariante dar, wirken jedoch wegen der vielen Fotos, Hyperlinks
und Orientierungstexte wie Boulevardvarianten.
Für 1990 wären in allen drei Fällen CD-Roms erhältlich. Die als dritte
Quelle verwendete „Electronic Database“ des „British Council“ ist
erst seit 2003 im Netz zu finden.
Das letzte Kriterium, das Biber als Grunddeterminante des
Korpusdesigns nennt, ist die Unterteilung in „synchrones vs.
asynchrones Korpus“.
Bei einer synchronen Korpusanalyse müssen die zu vergleichenden
Korpora dieselbe Zeitspanne abdecken. Auf diese Art und Weise ließe
sich überprüfen, in welcher sprachlichen Form (register)
unterschiedliche Zeitungen während desselben Zeitraumes berichten
und welcher Tenor verwendet wird.
Der Korpus-Vergleich dieser Dissertation ist eine diachrone
Sprachanalyse bzw. Längsschnitt oder Longitudinalanlyse. Der
Zeitraum, der zwischen den ersten beiden Korpora liegt (K3 zu K2),
beträgt rund 10 Jahre. Die Zeitphase, die zwischen K1 und K2 liegt,
ist jedoch lediglich die Phase zwischen der Veröffentlichung der
Ausgaben am frühen Morgen des 11. September GMT und dem
Folgetag.
Im Gegensatz zu Biber nennt Tognini-Bonelli die Design-Kriterien
„authenticity, representativeness und sampling“ (2001, S.55-62).
Die drei von mir erstellten Presse-Korpora haben einzig die Funktion,
die sprachlichen Veränderungen zwischen 1990 und 2001, und
speziell verursacht durch den Anschlag auf das World Trade Center,
47
analysieren zu helfen. Damit wird der Primacy-Recency Effect (siehe
5.12) zum Design-Kriterium.
Was die Bestandteile der Korpora anbetrifft, habe ich mich aus
praktischen Gründen für „The Times“, „The Independent“ und
„The Guardian“ entschieden: Die Quellen waren am besten
verfügbar. Das Korpus von 1990 besteht zu 1 Million Wörter aus
„The Times“, 500 000 Wörter aus „The Guardian“ und 500 000
Wörter aus „The Independent“. Die beiden Korpora von 2001
bestehen jeweils zu 500 000 Wörtern aus „The Times“, zu 250 000
Wörtern aus dem „The Guardian“ und noch einmal zu 250 000
Wörtern aus dem „The Independent“, so dass sich folgende KorpusNormung ergibt: 50 % an Text aus der „The Times“ und jeweils 25 %
aus „The Guardian“ und „The Independent“.
Der Boulevardpresse zuzuordnende Blätter wie „The Mirror“, „The
Daily Star“, „The Sun“, „The Express“ sowie „The Daily Mail“
wurden gemäß Fragestellung der Dissertation außer Acht gelassen.
„The Daily Telegraph“ stand für 1990 nicht als CD-Rom in Berlin
zur Verfügung, existiert jedoch für dieses Jahr.
Es erleichterte die Arbeit, dass ich bei dem Korpus von 2001 die
Artikel zum größten Teil direkt aus den Online-Zeitungen
herauskopieren konnte. Bei dem Jahrgang 1990 konnte ich auf CDRoms zurückgreifen.
Es fällt auf, dass das Korpus von 1990 doppelt so groß ist wie jedes
einzelne von 2001. Das wurde festgelegt, damit die beiden Korpora
von 2001 später zu einem 2-Millionen-Wort-Korpus zusammengefasst
werden konnten, das sich besser mit dem Korpus von 1990
vergleichen ließ. Ferner fällt auf, dass „The Times“ doppelt so stark
vertreten ist wie die anderen beiden Zeitungen. Dieses ist
gerechtfertigt, da „The Times“ eine deutlich stärkere Auflagenzahl
aufweist als die beiden anderen verwendeten Zeitungen (Auflagenzahl
Juli-Dez. 1997: The Times 792 151, The Guardian: 403 999, The
Independent: 260 223; Quelle: Audit Bureau of Circulations).
Hauptmotiv war jedoch, dass ein aussagefähiges Korpusmodell
geschaffen werden sollte. Weitere Parameter wie Schichtzugehörigkeit
der Leser, Parteinahme und Boulevardisierungsgrad konnten nicht
oder nur am Rande berücksichtigt werden.
Um die Korpora von 2001 nach der Tilgung des Metatextes (siehe
Punkt 4.7) und der Überarbeitung der Korpusgrenzen wegen des 11.
48
September (Punkt 4.4.) wieder aufzufüllen, wurden mittlerweile für
2001 verfügbare CD-Roms und die 2003 installierte „Electronic
Database“ verwendet.
4.4 Überarbeitung des Korpusdesigns
Ursprünglich sollten nur zwei Korpora für diese Dissertation erstellt
werden, das eine für 1990 und das andere für 2001. Trotz des 11.
September wurde das ursprünglich geplante Eine-Million-WortKorpus von 2001 fertig gestellt. Von den darin enthaltenen Wörtern
wurden genau 19,01 % der Zeitungsartikel bis einschließlich dem
11.9.01 und 80,99 % danach geschrieben. Wäre dieses Korpus
beibehalten worden, hätte der Primacy-Recency-Effect (siehe Kapitel
5.12) nicht berücksichtigt werden können. Spätere Beobachtungen
wären beeinflusst durch frühere Beobachtungen interpretiert worden,
d.h., etwaige Veränderungen hervorgerufen durch den 11. September
wären durch die Ruhephase in der Zeit davor in den Korpusdaten
aufgehoben worden.
Das Gewicht von Schlüsselwörtern und anderen Korpus-Daten hätte
sich deutlich abgeschwächt. Eine Korpusgrenze direkt auf dem 11.
September hingegen ermöglichte sehr viel differenziertere Urteile.
Doch der 11. September hatte dermaßen gravierende Auswirkungen
auf die Weltpolitik, dass die Fragestellung der Dissertation
dahingehend geändert wurde, dass nicht nur ein Korpusvergleich
zwischen 1990 und 2001 vorgenommen werden konnte, sondern auch
eine Untersuchung über Auswirkungen des 11. September auf die
Pressesprache in Großbritannien.
Zusätzlich kam die Tatsache zum Tragen, dass bereits im Korpus von
1990 ein Konflikt mit einem arabischen Staat auf der Zeitungsagenda
stand: die Kuwait-Krise, die sich maßgeblich in der Berichterstattung
widerspiegelte. Es konnte deshalb besser verglichen werden, wie 1990
im Vergleich zu 2001 in der Presse mit den Krisen im arabischen
Raum5 umgegangen wurde.
5
In dieser Dissertation wird der Begriff „Arabischer Raum“ bevorzugt, da selbst in den Ländern, in denen trotz
islamischer Religion andere Amtssprachen gesprochen werden als Arabisch, trotzdem Standardarabisch die
Sprache der Koranschulen ist (siehe: Crystal 1997, S. 318).
49
Das bisherige Korpus als Textdokument wurde ab dem
Erscheinungstag der Ursprungsartikel am 12.9.2001 in zwei ungleiche
Teile geteilt, das einen enthielt 19,01 % des bisherigen Korpus, das
andere 80,99 %. Beide neu zu gestaltenden Korpora sollten je
1 000 000 Wörter beinhalten.
Da aber die aktuellen Online-Zeitungen im Netz nicht mehr verfügbar
waren, mussten Zeitungs-CD-Roms und die Electronic Database
herangezogen werden.
Deshalb wurde das Korpus „2001.davor“ (K2) soweit verfügbar mit
Artikeln aus CD-Roms und mit Artikeln aus der Electronic Database
des British Council aufgefüllt, bis die eine Million Wortgrenze
erreicht war (siehe Punkt 4.9 Zusammenstellung der Subkorpora).
Dafür mussten Zeitungsartikel mit rund 800 000 Wörtern gesammelt
werden. Die 80,99 Prozentanteile des Ursprungskorpus, die nach dem
11. September erschienen sind, wurden für „2001.danach“ (K1)
ebenso auf 1 000 000 aufgefüllt, obwohl hierfür lediglich etwa 200
000 neue Wörter erforderlich waren. Die Artikel stammen aus der
Electronic Database des British Council. In beiden Fällen wurden die
Größenverhältnisse beibehalten, d.h. je 500 000 Wörter aus „The
Times“ und je 250 000 für beide Korpora aus „The Guardian“ und
„The Independent“.
Es wurde eine weitere Arbeitshypothese aufgestellt, die besagt, dass
das Ereignis 11. September die Zeitungssprache nachhaltig verändert
hat. Das zweite Korpus von 1990 soll in einer zweiten
Betrachtungsweise lediglich als Vergleichskorpus dienen, während die
beiden Korpora „vor“ und „nach dem 11. September“ als zwei
separate Hauptkorpora betrachtet werden. Dennoch wurde die
ursprüngliche Überlegung, dass sprachliche Veränderungen durch die
Einführung des Internet bewirkt wurden, nicht außer Acht gelassen,
auch wenn diese Frage wegen der überwältigenden Auswirkungen von
9/11 immer stärker in den Hintergrund treten musste.
4.5 Sortieren der Unterkorpora
Nachdem die einzelnen neun Unterkorpora bzw. Korpussegmente
erstellt waren, mussten diese wie die Einzelteile eines Mosaiks zu drei
50
Hauptkorpora K1, K2 und K3 zusammengefügt werden. Das Gleiche
geschah bei der Erstellung des Superkorpus, in dem die drei
Hauptkorpora ein Textdokument konstituieren.
Auch wenn bei den Hauptanalysen alle Texte „in einen Topf“
geworfen werden, ist es wichtig, die chronologische Reihenfolge der
Zeitungsartikel einzuhalten, ebenso die im Protokoll manifestierte
Themenkreiseinteilung wie Politics, Overseas News oder UK News,
etc. (siehe 4.9 und 4.10), um gegebenenfalls zwecks Überprüfungen
oder bei Unstimmigkeiten in den später erstellten Listen die
betreffende Stelle im Korpuskontext noch einmal aufrufen zu können.
Die Sortierung der Unterkorpora ergibt sich automatisch aus dem
vorher festgelegten Korpusdesign und den chronologisch geordneten
Protokollen. Wenn die Teilkorpora von Metatext befreit sind, müssen
sie gegebenenfalls noch auf ihr Soll-Maß gebracht werden. Dieses
Auffüllen geschah, indem sie durch weitere Texte auf die vom Design
geforderte Soll-Größe gebracht wurden (s.u.).
4.6 Entstehungsprozess und Textformatierungsprobleme
Bei der Erstellung der Korpora kam es immer wieder zu
Formatierungsproblemen der Word-Dokumente, deren Quelltexte
unterschiedlichen Datenträgern entnommen wurden. Die Datenträger,
die verwendet wurden, waren erstens Online-Zeitungen von 2001.
Diese existierten 1990 noch nicht, konnten folglich für das Korpus
von 1990 nicht verwendet werden. Zweitens, die „Electronic
Database“ des „British Council“ in Berlin, die ebenfalls 1990 noch
nicht existierte, und schließlich die unterschiedlichen CD-Roms
sowohl von 1990 als auch von 2001, die zum Teil unterschiedliche
Texteditoren verwenden.
Als die Korpusarbeit 2001 gestartet wurde, existierten die CD-Roms
mit dem Gesamtjahrgang der drei verwendeten Zeitungen von 2001
noch nicht. Um brauchbare Korpora zu erstellen und einen
vernünftigen Zeitrahmen zu wahren, musste auf verschiedene
Speichertypen zurückgegriffen werden: die CD-Roms als klassische
Konserve, die Online-Zeitungen (bei denen man heute nicht weiß, wie
lange die Artikel im Internet stehen, wie und ob sie archiviert
51
werden), und schließlich die erst seit 2003 verfügbare OnlineDatenbank des „British Council“, die nur für Mitglieder und
Besucher des „British Council“ zugänglich ist.
Ferner entstand das Problem, dass die Texte beim Kopieren in die
Word-Dokumente einen unterschiedlichen Schriftgrad und Schrifttyp
besaßen, dass die Absätze, sofern vorhanden, unterschiedlich
arrangiert waren. Außerdem war die Zeilenlänge nicht immer
einheitlich. Diese Tatsache hatte Konsequenzen bei der Erstellung der
Konkordanzlisten, da bei verkürzten Zeilen, die nur aus drei, vier oder
fünf Wörtern bestehen, nicht die volle Zeilenlänge übertragen wurde.
Schließlich sind mehrere der Unterkorpora deshalb Mischkorpora,
weil unterschiedliche Speichermedien als Quellen verwendet wurden,
auch wenn das keinen oder nur einen geringen Effekt auf den Inhalt
hatte6.
Quelle
prozentualer Anteil
The Times online
15,25
The Independent online
6,25
The Guardian online
6,25
The Guardian-CD-Rom 1990
12,5
The Guardian CD-Rom 2001
6,25
The Independent-CD-Rom 1990
12,5
The Times-CD-Rom 1990
25
Electronic Database The Times
9,75
Electronic Database The Independent
6,25
Summe 100,0
%
%
%
%
%
%
%
%
%
%
Anzahl
der Artikel
1917
466
491
1212
555
1434
2964
547
633
10219
Tab. 1: Verwendete Speichermedien bzw. Quelldateien und deren
prozentualer Anteil an der Menge aller verwendeter Artikel.
6
Im Subkorpus Independent.2001.danach sind aus diesem Grunde ca. 5 – 10 Artikel doppelt enthalten. Das
liegt vermutlich daran, dass sie innerhalb der Online-Zeitung in unterschiedlichen Themenfeldern aufgeführt
waren, bzw. unterschiedliche Datumsangaben vorlagen. An einigen wenigen Stellen sind ferner Rückstände von
Metatext vorhanden. Designfehler sind fast nicht zu vermeiden. Diese Fehlergröße wurde als nicht gravierend
hingenommen.
52
Onl.-Times
6,25
9,75
Onl.-Independent
15,25
Onl.-Guardian
6,25
Guard.-CD-R 1990
6,25
Guardian CD-R 2001
25
12,5
12,5
Indep.-CD-R 1990
6,25
Times-CD-R 1990
Electr. Database Times
Electr. Database Indep.
Grafik 1: Die für die Korpora verwendeten Korpusquellen
(Angaben in Prozent)
Die dritte Form der hier verwendeten Speichermedien, die
„Electronic Database“ des „British Council“, ist ein OnlineTextarchiv, in dem die Zeitungsartikel von den CD-Roms der großen
britischen Zeitungen zur Verfügung gestellt sind, die über ein
spezielles Eingabefeld abgerufen werden können. Das hat zur
Konsequenz, dass die Artikel unter anderen Themenfeldern
eingeordnet sind, als auf den CD-Roms. Eine stichprobenhafte
Überprüfung ergab, dass diese Artikel mit denen im Printprodukt und
auf CD-Rom übereinstimmen.7
Des Weiteren sind zwar die Editorfenster der CD-Roms aller
verfügbaren Qualitätszeitungen 1990 noch dieselben, doch die
längeren Artikel passen nicht auf eine Editorseite. 2001 wurden
bereits andere Editoren verwendet, die jedoch keine einheitlichen
Konstrukte sind, sondern von Zeitung zu Zeitung variieren.
7
Laut Rademann 1998 (ICAME-Journal Nr. 22, S. 49-71) sind 97 % der Texte und 65 % der Fotos der
Printausgaben auch in den Online-Zeitungen enthalten.
53
4.7 Metatext als relevante Fehlergröße
Maschinell abgespeicherte Quelltexte auf CD-Rom, in Emails oder in
Online-Zeitungen o.Ä. können unter Umständen so genannte
Headerinformationen, Struktur- oder Metainformationen enthalten
(Carstensen et al. 2001, S.371). Diese Informationen sind entweder
nicht für den menschlichen Leser gedacht, oder dienen der
datentechnischen Klassifizierung von Texten und damit der
Orientierung des Lesers.
Der ursprünglich in den drei Hauptkorpora enthaltene Metatext,
schätzungsweise 150 000 Wörter, stellte eine nicht zu unterschätzende
Fehlergröße dar, die eine statistische Auswertung der Korpora unnötig
verzerrt hätte. Deshalb wurden die Textsammlungen nachträglich von
Metatext befreit und mit rund 600 Artikeln neu aufgefüllt, um das
festgelegte Limit von zwei mal zwei Millionen Wörtern
wiederherzustellen. Auch hier wurde wieder auf die Zeitungs-CDRoms und die Electronic Database zurüchgegriffen.
Metatext ist sowohl auf den als Quelltext verwendeten CD-Roms von
1990 und 2001 als auch bei den Online-Zeitungen von 2001 und der
„Electronic Database“ vorhanden. Er war in jedem der insgesamt
10 219 verwendeten Zeitungsartikel sowohl am Anfang als eine Art
Kopftext zu finden, der eine Klassifizierung für eine spätere
Verwendung oder datentechnische Verarbeitung darstellt. Bei einer
großen Anzahl von Artikeln war zusätzlich Metatext am Ende als
Schlussinformation enthalten.
SOURCE: The Guardian DATE: 03 January 1990
HOME PAGE 2
1/2
Rating expert's gut rejection
Dennis Barker
Bsp. 1: Metatext am Anfang eines Artikels, in den die Schlagzeile
eingebettet ist (aus: The Guardian CD-Rom von 1990)
54
Source: The Times (London, England), July 13, 2001 p14.
Title: Pentagon to break arms pact in months.(Home news)
Electronic
Collection:
CJ76523905
RN:
CJ76523905
Full
Text
COPYRIGHT
2001
The
Times
Byline: Michael Evans Defence Editor and Ben Macintyre in
Washington
Bsp. 2: Metatext eines Zeitungsartikels aus der „electronic
database“ des British Council
Die Wortlisten wären unter einer Miteinbeziehung des Metatextes
stark verzerrt gewesen, da Begriffe wie >SOURCE<, >DATE<,
>NEWS<, >PAGE<, >FOREIGN<, >THE INDEPENDENT<,
>THE GUARDIAN<, >THE TIMES<, >HOME<, >UK<,
>AUTHOR<, >PHOTOGRAPH<, >OMITTED<, >PRESS<,
>IN<, >PARIS<, >KABUL<, >AMMAN<, >JERUSALEM<,
>WASHINGTON<,
>CORRESPONDENT<,
>MONDAY<,
>TUESDAY<, >NOVEMBER<, >AUG<, >IND<, >1990<, >2001<,
>CD-ROM<,
>EDITOR<,
>HEALTH<,
>REUTERS<,
>UPDATE<, >FIRST<, >SECOND<, >MAP<, >FORECAST<,
>EDITION<, >TITLE<,
u.v.m. z.T. Ränge unter den 100
wichtigsten Wörtern belegt hätten. Die Häufigkeit anderer Typen wäre
demgegenüber unterbewertet gewesen.
Die durch den Metatext erzeugte Fehlergröße hätte sich nachträglich
mathematisch berechnen lassen, d.h. wir hätten mit der Fehlergröße
arbeiten können. Es ließe sich ein Faktor berechnen, der besagt, wie
hoch die tatsächliche Verzerrung der Korpora durch Metatext ist.
Eine weitere Alternative wäre gewesen, alle zunächst
mitgespeicherten Metatexte in ein separates Extrakorpus oder sogar
unterteilt in Metatextkorpus 1990 und 2001 usw. abzuspeichern.
Tatsächlich sind die drei Korpora in zwei Versionen auf CD-Rom
abgespeichert worden, einmal mit Metatext und einmal ohne. Im
letzteren Fall wurden die Korpora wie erwähnt noch einmal
aufgestockt. Zusätzlich für die Korpora mit Metatext eine
Frequenzanalyse durchzuführen und auszuwerten hätte den Rahmen
gesprengt, hätte zu dem Ziel dieser Dissertation, die sprachlichen
55
Veränderungen zu erkunden, nicht beitragen können, lediglich zum
Untersuchen der Fehlergröße Metatext.
Das Wesentliche ist freilich nicht der für die maschinelle Speicherung
und Archivierung von Programmierern zur Orientierung eingefügte
Metatext, sondern der tatsächlich in der Printausgabe erschienene
Text. Nur an den Pressetexten lassen sich sprachliche Veränderungen
adäquat überprüfen.
4.8 Layout-Redundanz
Wenn wir Zeitungstexte zum Bestandteil unserer Korpora machen, so
kommen diverse typografische Elemente der Printprodukte, der
online- und cd-rom-basierten Zeitungstexte in den erstellten Korpora
nicht mehr zur Geltung, da sie bei einer rein textuellen Analyse
redundant sind. Sie können nicht vom Analyseprogramm registriert
werden. Darunter fallen Elemente wie Layout, Textdesign und
Formatierung. Dazu zählen ferner Äußerlichkeiten wie Fett-,
Kursivdruck und Unterstreichungen, Schriftgrad, Schlagzeilen in ihren
unterschiedlichen Ausformungen, Hyperlinks, Schrifttyp, Spalten- und
Zeilenarrangement, Seitenaufteilung etc. Dasselbe gilt für Fotos und
deren Bildunterschriften.
Die Verwertung von CD-Rom und Online-Texten für eine
Verwendung in Textkorpora nennt sich Post-Editing und Stripping
(Rademann 1998, S. 49-71).
Folglich sind alle Elemente, die die Aufmachung von Zeitungen
ansprechend und attraktiv erscheinen lassen, ob im Internet oder auf
Papier, im Rahmen einer Korpusanalyse überflüssig und tragen nicht
zu den softwaregestützten Ergebnissen bei. Bei Korpusanalysen wird
nur der rohe Text analysiert.
Wenn innerhalb eines Zeichensystems verschiedene Codes verwendet
werden, sprechen wir von Multicodalität (Dölling 2001, S.35 ff). Im
Gegensatz zu den Ursprungstexten, die von den Codes Zeitungstext,
Pressefotografien, Überschriften, Textdesign etc. geprägt sind, sind
Textkorpora von diesen Formen befreit, ebenso von Phänomenen wie
Bildüberlegenheit und Suggestivwirkung von Überschriften (Bignell
1997, S.96 ff). Diese Tatsache ist vom Korpusdesigner während der
56
Erstellung der Korpora zu berücksichtigen. Abgesehen von dem zu
Grunde liegenden, nicht sichtbaren ASCII-Code, haben wir es
innerhalb von Textkorpora, die unter dem Format „nur Text +
Zeilenwechsel“ gespeichert sind, mit einem einzigen Code zu tun, der
englischen Schriftsprache.
Die für das Medium Internet so typische neue Schriftformen des
Hypertextes (Storrer 1999, S.33-62), aber auch die Layout- bzw.
Textdesignformen auf den Zeitungs-Webpages wie Übersichtstexte,
Orientierungstexte und Infoleisten, etc. (Bucher 1998, S.77 ff.), sind
im
Rahmen
von
Korpusanalysen
irrelevant.
Diese
Gestaltungselemente von Webpages, aber auch die von Editoren bei
Zeitungs-CD-Roms und Online-Datenbanken, spielen bei der
letztendlichen Korpusanalyse deshalb keine Rolle, weil sie von der
Korpusanalysesoftware nicht erfasst werden können.
Dennoch
zählen
diese
Textmerkmale
visuell
zu
den
Hauptveränderungen in der Medienlandschaft der 90er Jahre, sowohl
im Internet und als Reflex darauf in den Printmedien.
4.9 Die Zusammenstellung der Subkorpora
Jedes der drei Korpora (K1, K2 und K3) setzt sich aus drei
Unterkorpora zusammen. In Anlehnung an Sinclair (1998, S.115 ff.)
wird der Begriff Subkorpus als Klassifizierungsgröße verwendet.
Im Folgenden sind die Bestandteile dieser dreimal drei Subkorpora in
Tabellenform dargestellt. Die Parameter für die Auswahl dieser
Bestandteile sind Anzahl der Artikel pro Erscheinungstag und Anzahl
der Artikel pro Themenfeld. Dabei stand gemäß den Vorgaben des
Korpusdesigns das Themenfeld Politik zur Disposition, das je nach
betrachteter Zeitung in weitere Teilbereiche unterteilt ist.
Die Subkorpora sind in eine chronologische Reihenfolge gebracht,
was deren Erscheinungszeitraum anbetrifft. Überschneidungen gab es
dabei nicht. Die erste Tabelle beschreibt das jüngste Korpus, die letzte
das älteste.
Zunächst K1: Das erste hier aufgeführte und damit jüngste Subkorpus
ist Independent.2001.danach. Die Quelle für dieses Korpus, der
57
Independent-Online hat die Themenfeldeinteilung UK und World.
Dieses Subkorpus beinhaltet 466 Zeitungsartikel mit insgesamt
250 292 Worten8.
Anzahl der Artikel pro Themenfeld
UK
World
Zeilensumme
Datum
26.11.2001
29.11.2001
30.11.2001
01.12.2001
03.12.2001
04.12.2001
06.12.2001
07.12.2001
08.12.2001
10.12.2001
11.12.2001
Spaltensumme
48
34
40
54
29
10
27
34
3
279
5
47
25
23
25
13
19
8
22
187
53
34
40
101
25
52
35
13
46
42
25
466
Tab. 2.: Subkorpus Independent.2001.danach, Bestandteil von
Korpus K1, Korpusquelle: Online-Zeitung von The Independent,
(www.independent.co.uk)
Zwei der Hauptereignisse innerhalb der Berichterstattung von The
Independent waren der erste menschliche Klon und der Krieg in
Afghanistan.
The Guardian-Online hat, was die Rubrik Politik anbetrifft, folgende
Themenfeldeinteilung: UK News, Politics und International. Das
spiegelt sich im Subkorpus Guardian.2001.danach wider. Dieses
Subkorpus beinhaltet 250 241 Wörter aus 491 Artikeln. Die Artikel
verteilen sich wie folgt:
8
Die Gesamtzahlen basieren auf der Microsoft Word Zählung, die nach der Fertigstellung der Korpora erhoben
wurde.
58
UK News Politics
International
Zeilensumme
25.10.2001
26.10.2001
27.10.2001
29.10.2001
30.10.2001
31.10.2001
01.11.2001
02.11.2001
05.11.2001
06.11.2001
07.11.2001
08.11.2001
09.11.2001
24
8
22
15
20
23
21
22
23
18
15
20
27
3
18
12
6
9
17
1
11
4
6
2
8
24
22
10
14
8
22
10
24
2
-
27
34
22
51
48
42
52
30
46
39
43
28
29
Spaltensumme
258
89
144
491
Datum
Tab. 3.: Subkorpus Guardian.2001.danach, Bestandteil von
Korpus K1, Korpusquelle: Online-Zeitung von The Guardian
(www.guardian.co.uk)
Ein Schwerpunkt der Berichterstattung dieses Subkorpus lag auf der
Flächenbombardierung Afghanistans, die bereits am 7.10.2001
begann.
Das Subkorpus Times.2001.danach ist zwei verschiedenen Quellen
entnommen, nämlich der Online-Times und der Electronic Database
des British Council. Es besteht aus exakt 500 018 Wörtern aus 1254
verschiedenen Zeitungsartikeln. Die Online-Times setzt sich aus
diversen Themenfeldern zusammen: Politics, World News und einem
Feld Homepage, dem ausschließlich Artikel entnommen wurden,
wenn sie etwas mit dem Themenfeld Politik zu tun hatten. Artikel aus
den Bereichen Sport, Kultur und Wirtschaft blieben unberücksichtigt.
Die Online-Times ist so aufgebaut, dass alle in der Printversion
erschienenen Artikel über die Auswahl „Newspaper Edition“
ausgewählt werden können. Die Artikel aus der Electronic Database
sind mit denen in der Printausgabe identisch.
59
Politics
World News
British News Homepage
Datum
12.09.2001
14.09.2001
15.09.2001
18.09.2001
19.09.2001
20.09.2001
21.09.2001
22.09.2001
24.09.2001
25.09.2001
26.09.2001
27.09.2001
28.09.2001
29.09.2001
01.10.2001
02.10.2001
04.10.2001
06.10.2001
08.10.2001
10.10.2001
12.10.2001
13.10.2001
15.10.2001
5
8
4
5
7
10
5
6
-
16.10.2001
17.10.2001
18.10.2001
19.10.2001
20.10.2001
22.10.2001
23.10.2001
24.10.2001
Spaltensumme
Zeilensumme
War on Terror
20
21
18
21
22
19
20
15
16
20
13
23
17
16
11
21
16
19
18
25
Home News
43
43
48
43
39
33
51
45
19
9
9
17
13
18
20
16
17
11
12
7
11
8
-
41
40
6
20
21
23
21
30
23
39
24
25
37
26
41
37
36
35
39
38
32
29
44
41
40
6
-
4
2
1
5
Overseas News
24
22
23
25
32
28
24
24
-
-
67
65
71
68
71
61
75
69
50
214
716
187
87
1254
Tab. 4.: Subkorpus Times.2001.danach, Bestandteil von Korpus
K2,
Korpusquellen:
Online-Zeitung
der
Times,
(www.thetimes.co.uk), ab 16.10.2001 Electronic Database des
British Council
Die Hauptereignisse in diesem Subkorpus sind der 11. September, der
War on Terror, erste Stellungnahmen von Politikern und der Beginn
der Bombardierung Afghanistans.
Das besondere an der Themenkreisaufteilung ist die Tatsache, dass ab
dem 12.10.2001 ein neues Themenfeld eingefügt worden ist (War on
Terror). Artikel aus den Feldern World News, Homepage und War
on Terror wurden nur übernommen, wenn sie nicht bereits in den
60
Kategorien Politics und British News erschienen waren und vice
versa. Bei der nachträglichen Auffüllung konnten nur Artikeln aus der
Electronic Database verwendet werden, da die CD-Rom nicht
verfügbar
war.
Diese
hat
wiederum
eine
andere
Themenfeldaufteilung: Overseas News und Home News.
Die drei folgenden Tabellen beschreiben die Zusammensetzung von
K2, erneut in chronologischer Reihenfolge. Als erstes sei hier das
Subkorpus Times.2001.davor dargestellt. Die darin enthaltenen
Artikel wurden ausschließlich der Online-Times entnommen. Die
verwendeten Themenfelder sind Politics und British News. Es enthält
1210 Artikel mit insgesamt 500 171 Wörtern.
Datum
02.08.2001
03.08.2001
04.08.2001
06.09.2001
07.08.2001
08.08.2001
10.08.2001
11.08.2001
13.08.2001
14.08.2001
15.08.2001
16.08.2001
17.08.2001
18.08.2001
20.08.2001
21.08.2001
22.08.2001
24.08.2001
25.08.2001
27.08.2001
28.08.2001
29.08.2001
30.08.2001
31.08.2001
01.09.2001
03.09.2001
04.09.2001
05.09.2001
08.09.2001
10.09.2001
11.09.2001
Spaltensumme
Politics
2
4
2
2
4
5
1
6
7
5
6
4
6
4
3
5
2
3
5
6
3
8
5
7
British News
10
35
43
51
39
39
41
36
34
35
34
38
34
36
30
39
38
35
29
34
32
32
32
39
43
25
41
38
41
34
38
Zeilensumme
10
35
43
51
39
39
43
40
36
37
38
43
35
42
37
44
44
39
35
34
36
35
37
41
46
30
47
41
49
39
45
105
1105
1210
-
Tab. 5.: Subkorpus Times.2001.davor, Bestandteil von Korpus K2,
Korpusquelle: Online-Zeitung der Times, (www.thetimes.co.uk)
61
Die Hauptereignisse in diesem Subkorpus waren der 101. Geburtstag
von Queen Mother und ihr späterer Tod.
Für
die
nachträgliche
Auffüllung
des
Subkorpus
Independent.2001.davor war eine CD-Rom verfügbar. Deshalb sind
die Themenfelder der CD-Rom maßgeblich. Es liegt hier wiederum
eine Einteilung in Title Page, News und Foreign News vor. Es
wurden erneut nur Artikel aus dem Themenfeld Titlepage verwendet,
wenn sie etwas mit dem Thema Politik zu tun hatten. Insgesamt
wurden 633 Artikel eingebaut, die 250 145 Wörter beinhalten.
Title Page
News
Foreign News
Zeilensumme
Datum
02.07.2001
03.07.2001
04.07.2001
05.07.2001
06.07.2001
07.07.2001
09.07.2001
10.07.2001
11.07.2001
13.07.2001
5
1
4
8
4
3
4
6
6
6
39
47
41
56
42
35
30
44
50
29
11
26
20
29
14
21
17
19
16
-
55
74
65
93
60
59
51
69
72
35
Spaltensumme
47
413
173
633
Tab. 6.: Subkorpus Independent.2001.davor, Bestandteil von
Korpus K2, Korpusquelle: Electronic Database
Eines der Hauptthemen in diesem Subkorpus war der Prozess um
ehemaligen serbischen Diktator Milošević.
Für die nachträgliche Erstellung von Guardian.2001.davor konnte
eine CD-Rom verwendet werden. Die Online Zeitungen waren für
diese Zeitphase nicht mehr verfügbar. In der folgenden Tabelle ist die
auf dieser CD-Rom getroffene Einteilung in Home News und
Overseas News übernommen. Insgesamt beinhaltet dieses Subkorpus
555 Artikel mit 250 104 Wörtern.
62
Datum
01.06.2001
02.06.2001
04.06.2001
05.06.2001
06.06.2001
07.06.2001
08.06.2001
09.06.2001
Home News
65
53
54
56
62
65
76
44
Overseas News
14
11
8
12
10
13
12
-
Zeilensumme
79
64
62
68
72
78
88
44
Spaltensumme
475
80
555
Tab. 7.: Subkorpus Guardian.2001.davor, Bestandteil von Korpus
K2, Korpusquelle: CD-Rom des Guardian 2001
In diesem Subkorpus war eins der Haupthemen die Unterhauswahl in
Großbritannien.
In den folgenden Tabellen sind die Bestandteile der drei Subkorpora
von K3 aufgeführt. Von der Anzahl der Wörter insgesamt ist K3 so
groß wie K1 und K2 zusammen, jedoch nicht von der Anzahl der
Artikel (siehe Punkt 4.11).
Das unten beschriebene Subkorpus Independent.1990 enthält 1434
Artikel bestehend aus 500 011 Wörtern. Die Artikel sind der
Independent-CD-Rom von 1990 entnommen.
In das Range dieses Subkorpus fällt als Hauptereignis die Invasion
Kuwaits durch den Irak.
63
Title Page
Home News Page
Foreign News Page
Editorial Page
Zeilensumme
01.08.1990
02.08.1990
03.08.1990
04.08.1990
06.08.1990
07.08.1990
08.08.1990
09.08.1990
10.08.1990
11.08.1990
13.08.1990
14.08.1990
15.08.1990
16.08.1990
17.08.1990
18.08.1990
20.08.1990
21.08.1990
3
8
5
4
6
5
4
7
4
5
4
4
4
4
5
3
47
44
37
37
24
43
29
35
32
31
29
34
36
34
30
32
54
33
35
30
35
51
39
32
41
38
37
45
48
46
55
41
45
57
23
-
5
1
2
3
3
3
1
2
-
90
75
82
93
70
84
78
77
77
80
82
84
97
79
79
94
77
36
Spaltensumme
75
641
698
20
1434
Datum
Tab. 8.: Korpus Independent.1990, Bestandteil von Korpus K3,
Korpusquelle: The Independent CD-Rom 1990
Die vorhandenen Themenfelder sind Title Page, Home News Page,
Foreign News Page und Editorial Page. Die Artikel wurden nur in
den Fällen den Themenfeldern Title Page und Editorial Page
entnommen, wenn diese dem Bereich Politik zugeordnet werden
konnten.
Das achte Subkorpus und damit das „achtälteste“ ist Times.1990.
Darin enthalten sind genau 2964 Artikel mit 1 000 001 Wörtern. Es ist
das größte aller neun Subkorpora.
64
Datum
02.04.1990
03.04.1990
04.04.1990
05.04.1990
06.04.1990
07.04.1990
09.04.1990
10.04.1990
11.04.1990
12.04.1990
13.04.1990
14.04.1990
16.04.1990
17.04.1990
18.04.1990
19.04.1990
20.04.1990
21.04.1990
23.04.1990
24.04.1990
25.04.1990
26.04.1990
27.04.1990
28.04.1990
30.04.1990
01.05.1990
02.05.1990
03.05.1990
04.05.1990
05.05.1990
07.05.1990
08.05.1990
09.05.1990
10.05.1990
11.05.1990
12.05.1990
14.05.1990
15.05.1990
16.05.1990
17.05.1990
18.05.1990
19.05.1990
Spaltensumme
Home News
36
37
52
53
68
40
41
35
48
43
44
40
47
31
40
39
48
48
29
46
38
38
58
52
36
47
48
40
53
46
41
46
58
45
46
39
41
42
55
50
52
12
Foreign News
31
27
28
30
29
24
28
34
32
23
24
21
22
31
34
30
26
26
29
27
31
25
32
28
32
32
32
32
32
29
28
30
27
26
23
33
25
36
7
20
-
Zeilensumme
36
68
79
81
98
69
65
63
82
75
67
64
68
53
71
73
78
74
55
75
65
69
83
84
64
79
80
72
85
78
70
74
88
72
72
62
74
67
91
57
72
12
1848
1116
2964
Tab. 9.: Subkorpus Times.1990, Bestandteil von Korpus K3,
Korpusquelle: The Times CD-Rom 1990
Die Artikel stammen aus der Times-CD-Rom von 1990, die darin
implementierten Themenfelder sind Home News und Foreign News.
65
In diesen Untersuchungszeitraum fallen die Unabhängigkeitsbestrebungen im Baltikum.
Abschließend ist hier die Verteilung der 1212 Artikel im Subkorpus
Guardian.1990 aufgelistet. Es beinhaltet 500 248 Wörter. Die Artikel
entstammen der The Guardian CD-Rom von 1990, auf der die
Themenkreise Home News, Foreign News und City News
implementiert sind.
Home News
Foreign News
City News
Zeilensumme
30
26
30
34
40
32
3
28
37
39
33
47
41
6
37
54
51
36
29
23
13
18
39
16
16
15
10
18
30
15
13
16
20
7
9
29
18
26
26
11
19
27
34
15
17
27
31
21
66
58
72
70
105
74
3
55
71
76
85
92
41
6
69
94
98
77
604
291
317
1212
Datum
01.01.1990
02.01.1990
03.01.1990
04.01.1990
05.01.1990
06.01.1990
07.01.1990
08.01.1990
09.01.1990
10.01.1990
11.01.1990
12.01.1990
13.01.1990
14.01.1990
15.01.1990
16.01.1990
17.01.1990
18.01.1990
Spaltensumme
Tab. 10.: Subkorpus Guardian.1990, Bestandteil von Korpus K3,
Korpusquelle: The Guardian CD-Rom 1990
Viele Artikel in diesem Subkorpus berichten über die Proteste im
Zuge der Einführung der Poll Tax in Großbritannien.
Die Tatsache, dass unterschiedliche Datenträger verwendet werden
mussten, zeugt von dem Umbruch und den damit verbundenen
Schwierigkeiten in der Computerindustrie. Während 1990
ausschließlich CD-Roms als Datenspeicher für die Öffentlichkeit zur
Verfügung standen, waren 2001 parallel dazu bereits OnlineZeitungen erhältlich, und ab 2003 die Electronic Database, der
rückwirkend Artikel entnommen werden konnten. Erschwerend kam
bei der Erstellung hinzu, dass Online-Zeitungen zumeist am Folgetag
nicht mehr aufrufbar waren oder nur noch partiell.
66
4.10 Veränderungen in den Themenfeld-Bezeichnungen
Die für diese Korpusanalyse zusammengetragenen Presse-Texte sollen
primär das Themengebiet Politik abdecken. Darunter wird sowohl die
landes- als auch die internationale Politik gefasst.
Werfen wir einen näheren Blick auf die Quellen der für die drei
Hauptkorpora (K1, K2, K3) verwendeten Zeitungstexte, so stellen wir
fest, dass es in den Bezeichnungen für die Themenfelder der
herangezogenen Medien zu Veränderungen gekommen ist.
Die Themenfelder variieren sowohl von Zeitung zu Zeitung, als auch
in den jeweiligen Erhebungszeiträumen und innerhalb der
verschiedenen Speichermedien.
Die klassische Genreeinteilung in Politik, Wirtschaft, Kultur, Sport
und Lokales, wie wir sie von deutschen Tageszeitungen kennen
(Faulstich 2004, S.486), ist in den britischen Qualitätszeitungen nicht
vorzufinden, obwohl es gewisse Ähnlichkeiten gibt. Deshalb wird der
Begriff Themenfeld bzw. -kreis gegenüber dem des Genres bevorzugt.
Zeitung The Times
The Independent
The Guardian
Title Page, Editorial Page,
Home News Page,
Foreign News Page
Quelle: CD-Rom
Home News,
Foreign News,
City News
Quelle: CD-Rom
Korpus
K3
(von 01.01.1990
bis 21.08.1990)
Home News,
Foreign News
Quelle: CD-Rom
K2
(von 1.6.2001
bis 11.9.2001)
K1
(von 12.09.2001
bis 11.12.2001)
Politics,
Title Page, News,
Home News,
British News
Foreign News
Overseas News
Quelle: Online-Zeitung Quelle: Electronic Database Quelle: CD-Rom
Politics, Homepage,
UK,
World News,
World
British News,
War on Terror
Quelle: Online-Zeitung Quelle: Online-Zeitung
und Electronic Database
UK News,
Politics,
International
Quelle: Online-Zeitung
Tab. 11: Die für die Korpusanalyse verwendeten Themenfelder
Die Tabelle listet die unterschiedlichen in den Ursprungsmedien
verwendeten Themenfeldbezeichnungen auf. Die Veränderungen in
67
den Bezeichnungen sind darauf zurückzuführen, dass Zeitungen im
Laufe der Zeit ihre Aufmachung verändern. Das vollzieht sich nicht
nur in punkto Textdesign, Infografiken, Bildqualität, Layout,
Werbung und Format, sondern auch in den Bereichen Artikellänge
und Themenfeldeinteilung.
Auch Printmedien müssen sich dem Zeitgeist anpassen,
maßgeschneiderte
Textverarbeitungsprogramme
und
andere
redaktionelle Software halten Einzug in den Redaktionen. Die
technischen Veränderungen in Zeitungsverlagen und Redaktionen sind
in Deutschland bis in die Regionalpresse spürbar (Lilienthal 1998,
S.110).
Das äußere Erscheinungsbild von Zeitungen und anderen Printmedien
wurde in den letzten Jahren entscheidend von neuen Formen des
Textdesigns geprägt (Bucher 1998, S.66), aber auch von
farbenprächtigen, suggestiv wirkenden und mit vielen Berichten über
Prominente ausgestatteten Hochglanzmagazinen.
Die Online-Zeitung als Hypertext wirkt zurück auf das ursprüngliche
Printprodukt: Printmedien entwickeln zunehmend hypertextuelle
Strukturen (Delinearisierung der Zeitung, Bucher 1999, S.12). Viele
Entwicklungen sind als Reflex auf neue Produktions-, Speicher- und
Publikationsverfahren zu begreifen, genannt seien hier nur die
computerbasierten Layoutprogramme, die Nachbearbeitung von
Fotografien und die parallele Aufbereitung von Artikeln für Print- und
Online-Ausgaben, was zu einer Etablierung neuer Texttypen wie
Orientierungstext, Ankündigungstext und Promo-Box bzw. Infokasten
geführt hat.
4.11 Anzahl der Artikel pro Subkorpus
Was Veränderungen bei der Anzahl der Artikel in britischen
Zeitungen anbetrifft, existiert bereits eine Untersuchung über die The
Guardian-CD-Roms von 1990 bis 1996 (Fischer 1998, S.72-80). In
der Analyse wurde u.a. festgestellt, dass die Anzahl aller Artikel aus
allen Themenbereichen zusammen auf der CD-Rom von 1990 genau
47 308 Artikel beträgt. Bis zu der CD-Rom für das Jahr 1996 (57 854
Artikel) ist ein Anstieg von rund 10 000 Artikeln oder 22 % zu
verzeichnen. Die Online-Zeitung von The Guardian existiert jedoch
68
erst seit Januar 1999. Der Prozess der massiven Veränderungen der
Werte wie Artikellänge und Wortmenge hat folglich schon vor der
Freischaltung der Online-Version von The Guardian eingesetzt.
Ähnlich verhält es sich mit den Wortzählungen. Die totale Anzahl an
Wörtern pro Jahr stieg von 1990 bis 1996 laut Fischer um 25 %. Die
durchschnittliche Anzahl an Wörtern pro Artikel stieg nur
unwesentlich bei einem deutlichen Anstieg der Anzahl der Artikel.
Im Folgenden sind die Befunde für den Vergleich die Artikelmengen
und -längen in den neun Subkorpora dieser Dissertation dargestellt.
Aufgrund der unterschiedlichen verwendeten Speichermedien kann
diese Analyse lediglich Tendenzen widerspiegeln.
Anzahl
Artikel
K1
Independent.2001.danach
Guardian.2001.danach
Times.2001.danach
K2
Times.2001.davor
Independent.2001.davor
Guardian.2001.davor
K3
Independent.1990
Times.1990
Guardian.1990
∑
der Anzahl der Wörter Wörter/ Artikel im
Durchschnitt
466
491
1254
248281
243808
494344
532,79
496,55
394,21
1210
633
555
501090
247276
246699
414,12
390,64
444,50
1434
2964
1212
498852
1007262
500577
347,87
339,83
413,02
10219
3988189
Tab. 12.: Anzahl der Artikel und Wörter/ Artikel
Subkorpora9
in den
Zur besseren Veranschaulichung sind die Werte aus Tabelle 12 im
Folgenden als Balkendiagramme dargestellt:
9
Weshalb Wordsmith für die Hauptkorpora und die Summe der Subkorpora unterschiedliche Zählungen
vornimmt, ist fraglich.
69
nd
en
t.2
G
ua
00
rd
1.
ia
da
n.
na
20
ch
Ti
0
1.
m
da
es
na
.2
00
ch
1.
Ti
da
m
In
es
de
na
.2
pe
ch
0
01
nd
.d
en
av
t.2
G
or
ua
00
rd
1
.d
ia
n.
av
20
or
In
0
de
1.
da
pe
vo
nd
r
en
t.1
99
Ti
0
m
es
G
.1
ua
99
rd
0
ia
n.
19
90
In
de
pe
N Artikel
70
Subkorpus
Grafik 3: Anzahl der Artikel in den Subkorpora
Guardian.1990
Times.1990
Independent.1990
Guardian.2001.dav
or
Independent.2001.
davor
Times.2001.davor
Times.2001.danac
h
Guardian.2001.dan
ach
Independent.2001.
danach
Anzahl der Wörter
Anzahl der Wörter in den Subkorpora
1200000
1000000
800000
600000
400000
200000
0
Subkorpus
Grafik 2: Anzahl der Wörter in den Subkorpora
In Grafik 2 sticht deutlich der Wert von Times.1990 hervor
(1 007 262 Wörter).
Anzahl der Artikel
3500
3000
2500
2000
1500
1000
500
0
Grafik 3 zeigt, dass Times.1990 die größte Anzahl an Artikeln enthält,
gleichzeitig aber die kürzesten Artikel (s.u. Grafik 4). Die geringste
Anzahl hingegen erreicht das Subkorpus Independent.2001.danach,
das wiederum die insgesamt längsten Artikel enthält.
600
500
400
300
200
100
0
In
de
pe
nd
en
t.2
G
ua
00
rd
1.
ia
da
n.
na
20
ch
Ti
0
1
m
.d
es
an
.2
ac
00
h
1.
Ti
da
m
In
es
na
de
.2
ch
pe
0
01
nd
.d
en
av
t.2
G
or
ua
00
rd
1
.d
ia
av
n.
20
or
In
0
1.
de
da
pe
vo
nd
r
en
t.1
99
Ti
0
m
es
G
.1
ua
99
rd
0
ia
n.
19
90
N Artikel
Wörter/ Artikel im Durchschnitt
Subkorpus
Grafik 4: Durchschnittliche Artikellänge in den Subkorpora
Die Grafik verdeutlicht noch einmal, dass sich die längsten Artikel in
den
Subkorpora
Independent.2001.danach
und
Guardian.2001.danach befinden. Die kürzesten Artikel finden wir
hingegen in Times.1990 (1 007 262 Wörter, 2964 Artikel, 339,83
Wörter pro Artikel) und Independent.1990 (498 852 Wörter, 1434
Artikel, im Durchschnitt 347,87 Wörter pro Artikel). Im Subkorpus
Guardian.1990 befinden sich bei einer Anzahl von 500 577 Wörtern
1212 Artikel. Das sind im Durchschnitt 413,02 Wörter pro Artikel.
Es ist eine deutliche Tendenz zu längeren Artikeln von 1990 bis 2001
zu verzeichnen.
Für die drei Subkorpora von 2001.davor (K2) erhalten wir für
Guardian.2001.davor 555 Artikel bei 246 699 Wörtern insgesamt.
Das sind 444,50 Wörter pro Artikel im Durchschnitt. Zugleich ist das
der höchste Durchschnittswert von K2. Independent.2001.davor
beinhaltet 633 Artikel bei 247 276 Wörtern. Das sind 390,64 Wörter
pro Artikel im Durchschnitt. Independent.2001.davor beinhaltet
71
folglich die kürzesten Artikel in K2. Einen Mittelwert nimmt
Times.2001.davor ein. Die insgesamt 501 090 Wörtern sind auf 1210
Artikel verteilt, das sind im Durchschnitt 414,12 Wörter pro Artikel.
Im jüngsten Korpus K1 ragt der Wert von Times.2001.danach heraus
(494 344 Wörter, 1254 Artikel, im Durchschnitt nur 344,21 Wörter
pro Artikel). Den mittleren Wert nimmt Guardian.2001.danach ein.
Bei 243 808 Wörtern sind das 491 Artikel und im Durchschnitt 496,55
Wörter. Das ist der zweitgrößte Wert aller neun Subkorpora.
Die
längsten
Artikel
in
dieser
Untersuchung
enthält
Independent.2001.danach. Es ist zugleich das jüngste aller Korpora.
Es beinhaltet bei 248 281 Wörtern 466 Artikel. Im Durchschnitt sind
das 532,79 Wörter.
Deshalb können wir des Weiteren schlussfolgern, dass sich die
Artikellänge en gros auch durch den Einfluss des 11. September
vergrößert hat. Jedoch stellt die Times dabei eine Ausnahme dar. Die
Zahlen zeigen ferner, dass nach der Einführung des Internet und neuer
Formen des Textdesigns die Zeitungsartikel länger geworden sind.
Die von Fischer (1998) festgehaltene Tendenz (s.o.) lässt sich nur
bedingt an dem hier gewählten Korpusdesign bestätigen. Die Anzahl
der Artikel in den Subkorpora ist nicht gleichzusetzen mit der
Gesamtzahl der auf Zeitungs-CD-Rom erhältlichen Artikel eines
Jahrgangs.10
5. KAPITEL: Der 11. September als Ausgangspunkt für
Veränderungen in Sprache, Medien und Gesellschaft
Dieses 5. Kapitel greift das globale Hauptereignis des Jahres 2001 auf,
die Terroranschläge in den USA. Doch wie vermitteln die Medien die
Katastrophe und ihre Folgen? Was sind die Hintergründe und was
leisten die Medien zur Aufklärung und Deeskalation, oder tragen sie
sogar zur Eskalation bei? Verschiedene publizistische Theorien
werden herangezogen, um diese Fragen zu beantworten, ergänzt durch
die Ergebnisse der Korpusanalyse.
10
Eine Zählung aller Artikel auf den Ursprungs-CD-Roms von 1990 und 2001 wurde im Rahmen der hier
vorliegenden Dissertation nicht vorgenommen.
72
Das Ereignis und die Folgen sind ausschließlich im Textkorpus K1
reflektiert. Die Auswertung der Korpusanalysen erfolgt im sechsten
Kapitel. Zuvor wird das folgende fünfte Kapitel die Vorarbeit zum
medientheoretischen Verständnis leisten und die Brisanz der
Medienberichterstattung andeuten.
5.1 Das Ereignis 11. September
Am 11.9.2001 flogen zwei Passagierflugzeuge mit einem zeitlichen
Abstand von 18 Minuten in die beiden Türme des „World Trade
Centers“ in New York an der Lower East Side Manhattan. Der
Einschlag der Maschinen bewirkte, dass die beiden Türme
nacheinander in sich zusammenbrachen. Parallel dazu schlug eine
weitere Passagiermaschine ins Pentagon ein. Dieses Ereignis ging
später als größter Terroranschlag aller Zeiten in die Geschichte ein.
Bei dieser Katastrophe kamen 2981 Menschen ums Leben (Time, 10.
April 2006, S.45), Millionen von Augenzeugen wurden stark
traumatisiert. Weltweit brach Trauer und Empörung über diese
schreckliche generalstabsmäßig durchgeführte Terroraktion aus. Die
Welt stürzte in eine seelische Krise (Todd 2002, S.17). Als Folge kam
es zu verschärften Maßnahmen in der Sicherheitspolitik und als
sekundärer Reaktion zu ersten Kriegshandlungen gegen das angeblich
mitverantwortliche Talibanregime in Afghanistan. Die Reaktionen der
USA auf diesen wohl fürchterlichsten Terroranschlag aller Zeiten
wurde weltweit mit gemischten Gefühlen aufgenommen. Als
mutmaßlicher Drahtzieher dieses Anschlages stellte sich später der
islamische Radikale Osama Bin Laden heraus.
Selten hat ein einzelnes Ereignis derart immense Auswirkungen auf
die Berichterstattung in den Medien gehabt wie das des 11.
September. Grundsätzlich muss gesagt werden, dass die
Berichterstattung in Zeitungen maßgeblich von den unterschiedlichen
Ereignissen abhängig ist. So waren einige relevante Ereignisse 1990
der Panamakrieg, die deutsche Wiedervereinigung, die Poll Tax
Demonstrationen in Großbritannien und die Kuwait-Krise. Themen
sind selten so gravierend, dass sie der täglichen Berichterstattung in
bedeutendem Maße eine neue Prägung geben. 2001 gab es eine ganze
Menge an herausragenden Begebenheiten, doch keines hatte so
73
umwälzende Effekte wie die großen Terroranschläge. Sie standen als
„hard news“ massiv im Mittelpunkt und verdrängten viele
unerhebliche Geschehnisse bzw. „soft news.“ Es wurde seitenweise
über den Terrorakt berichtet und nicht nur in ein bis drei Artikeln, wie
es sonst bei gewöhnlichen politischen Ereignissen der Fall ist.
Je relevanter das Ereignis, je größer das öffentliche Interesse, desto
größer auch die Reaktion der Medien. Es sind sonst nur Kriege wie
Vietnamkrieg, Golfkrieg oder Balkankriege, aber auf der anderen
Seite auch die Reaktorkatastrophe von Tschernobyl, die besonders
breit gefächerte Berichterstattungen bewirkten und die sehr lange in
den Medien präsent waren. So heißt es beispielsweise in Stscherbacks
Protokollen zu Tschernobyl:
„Es waren dafür keine Lösungen, keine technischen Mittel
vorgesehen. …Wir hatten für solch eine Situation keinen
Verhaltensalgorithmus“ (Stscherbak 1988, S.168 u. S.169).
Dieses Urteil lässt sich gleichermaßen auf die Katastrophe von New
York beziehen.
Der 11. September hat mittlerweile massive gesellschaftliche
Veränderungen nach sich gezogen wie die Islamismus-Diskussion,
restriktivere Sicherheitsgesetze oder die internationale Kooperation in
der Terrorismusbekämpfung.
9/11 ist nachhaltig im Korpus von 2001 reflektiert. Die Artikel
darüber sind so zahlreich, dass sie in den Statistiken einen
signifikanten Einfluss hinterlassen.
Der 11. September gehört zu den verheerenden Resultaten des
Terrorismus, der mit Regelmäßigkeit um sich greift, auch wenn dieser
Terroranschlag der bisher größte war. Die Zeitungsreaktionen zeigen,
wie stark ein einzelnes Ereignis die Agenda von Zeitungen vollständig
verändern kann.
Dieses verheerende Ereignis hatte sogar Auswirkungen auf das
Textdesign und die Themenfeldaufteilung: In der Phase direkt danach
war in der Times, sowohl online als auch bei der Printversion, die
Hauptüberschrift „Terror in America“ zu finden. Ab dem
12.10.2001 installierte „The Times“ ein Themenfeld mit der
Bezeichnung „War on Terror“.
Die Online-Zeitungen waren jetzt nicht mehr so übersichtlich wie
zuvor. Es erschienen fortan wichtige Artikel zu diesem Thema,
sowohl unter ”World News”, auf der ”Homepage” als auch unter
74
den besagten Sondersparten, die sich ganz dem „War on Terror“
widmeten. Die Berichterstattung und damit die Aktualisierung der
Pages verlief z.T. chaotisch, da sich die Ereignisse überschlugen.
Einige Artikel enthielten eine besonders dramatische Berichterstattung
und die traumatischen Momente wurden wieder und wieder
beschrieben.
Was die Korpusarbeit anbetrifft, versuchte ich bis einschließlich
8.10.2001 die bisherigen Themenfeld- und Korpuseinteilung
beizubehalten, hatte aber den Eindruck, auf diese neuen Themenfelder
reagieren zu müssen, sie einfließen zu lassen, da sonst der statistische
Wert des Korpus verfälscht worden wäre (Primacy-Recency-Effect).
Es sind insgesamt 87 Artikel des Themenkreises „War on Terror“
mit in das entsprechende Korpus eingeflossen. Doch dieses spielt eine
untergeordnete Rolle, da seit dem 12.9.2001, dem Tag nach den
Anschlägen, eine Großzahl an Zeitungsartikel in Verbindung mit dem
11. September standen, wenn auch nicht offensichtlich.
Der Anschlag war ein Vorfall, der nicht nur das Sicherheitsempfinden
und die Gefühle der Menschen verändert hat, sondern auch die
Berichterstattung. Nicht nur die Rhetorik der zitierten Politiker wirkt
wie ein „notwendiges Beruhigungsmittel für eine traumatisierte
Nation“ (Townshend 2002, S.118). Der Schock saß tief, die Sprache
in den Medien stand ständig unter dem Eindruck dieser Katastrophe.
Es herrschte die Sprache des Krisenmanagements und des Mitgefühls,
aber
auch
die
der
strategischen
Reaktion
und
der
Ursachenforschung.Der Terroranschlag auf das World Trade Center
und das Pentagon-Gebäude ist ein gutes Beispiel dafür, wie die
Nachrichtenagenda durcheinander gebracht werden kann und dem
Journalismus eine andere Rolle zugewiesen wird. Wir können in
diesem Zusammenhang von einem Verlautbarungsjournalismus
sprechen, denn es wurden unzählige Politikerreden und
Stellungnahmen zum weiteren Prozedere wiedergegeben.
Der 11. September 2001 kann als ein physikalisches Ereignis
begriffen werden, das ein Vorher und ein Nachher hat, ebenso wie der
Mauerfall am 9. November 1989 oder die Schüsse von Sarajevo 1914
als Symbol des Ausbruchs des 1.Weltkrieges.
Wir können in diesem Zusammenhang auch von einer Reihe von so
genannten motivationalen Ketten sprechen (Dittmar 2000, S. 203),
die als Auslösefaktoren für ein Ereignis gelten (Hegemonie der USA,
75
Unterdrückung der Palästinenser im Nahen Osten, Streit ums Erdöl,
Aufbegehren des islamischen Fundamentalismus), equivalent zu
Kausalketten, die durch ein solches Ereignis ausgelöst werden können
(Gründung
einer
internationalen
Allianz,
Bombardierung
Afghanistans, Kriegserklärung an den Irak).
Einzig das physikalische Ereignis von 9/11 war es, das eine
sprachliche Veränderung zu bewirken vermochte, wie sie in dieser
Dissertation untersucht wird. Es löste die besagte Kausalkette aus, zu
der auch die permanente Präsenz der Kampfhandlungen in den
Medien zählt. Wir können von einer Übergangsphase sprechen
zwischen Vorher und Nachher, dem Umbruchkern als temporalem
Intervall, ein Begriff, der anderenorts im Zusammenhang mit der Zeit
zwischen Maueröffnung und politischer Wiedervereinigung
Verwendung fand (Dittmar 2000, S.199 ff). Das ist im Kontext von
9/11 die Zeit des Chaos zwischen dem Einschlagen des ersten
Passagierflugzeuges und der Manifestierung des Traumas in den
Wochen danach bis zu ersten breit organisierten Gegen- und
Katastrophenmaßnahmen.
Das Trauma dieses „Megaterrorismus“ (Müller 2001, S.88) hat, wie
wir heute alle wissen, die Welt verändert. Endpunkt dieser
Übergangsphase war der Kriegsbeginn in Afghanistan.
Die Datenauswahl und speziell die Entscheidung für die
Korpusgrenzen vollzieht in gewisser Weise die Effekte des 11.
September
nach,
bzw.
die
abrupte
Veränderung
der
11
Zeitungsberichterstattung infolge der Geschehnisse.
5.2 Die Medienreaktionen auf die Terroranschläge vom 11.9.2001
Die Ereignisse wurden mit weltweiter Empörung aufgenommen. Die
grauenvollen Bilder waren allgegenwärtig: in der Presse, im Internet
und im Fernsehen. Es handelte sich um ein dermaßen einschneidendes
Ereignis, dass alle anderen Themen verdrängt wurden oder unwichtig
erschienen, so auch die Meldung vom ersten geklonten menschlichen
Embryo (First clone of a human embryo created, The Independent,
26.11.2001).
11
In der Zwischenzeit kam es zu weiteren schwerwiegenden Terroranschlägen in westlichen Metropolen, am
11.03.2004 in Madrid und am 07.07.2005 in London.
76
Während durch das Internet im Laufe der 90er allmählich das neue
Millennium eingeleitet wurde, trat durch die Katastrophe des 11.
September eine deutliche Ernüchterung ein. Nach dem 11. September
standen die neuen, mit Online-Zugängen ausgestatteten High-TechRedaktionen zum ersten Mal vor einer Zerreißprobe. Die Medien
schienen überfordert zu sein, da alle, was die Täter anbetraf, lange im
Dunkeln tappten. Es begann eine überhastete Suche nach Antworten
(Beuthner 2003, S.137). Mit der weltweiten Empörung und dem
ausgelösten Trauma kam die Trauer um die Opfer der
Terroranschläge. Über Monate gab es kein anderes Thema, das
berichtenswerter erschien. Auch in der Medienbranche war niemand
auf eine dermaßen verheerende Katastrophe eingestellt, so dass teils
mehr Verwirrung gestiftet wurde als Aufklärung geschaffen (Jelloun
2001, S.71/72). Presseerklärungen über mögliche Drahtzieher wurden
scheinbar kritiklos übernommen. Die Stimmen, die Zurückhaltung
forderten, fanden wenig Gehör, denn allerorts wurde Loyalität
gegenüber den USA gefordert.
5.3 Medienwissenschaftliche Betrachtung des 11.September
Wenn wir den 11. September aus einer medienwissenschaftlichen
Sicht betrachten, so müssen wir annehmen, dass für diese spezielle
Form der Darstellung von Gewalt - und der 11. September ist
schließlich nichts anderes als ein Akt der Gewalt - das Gleiche gilt,
wie für andere Gewaltdarstellungen in Fernsehen, Kino, Zeitungen,
etc. Primär ist hierbei festzuhalten, dass die nahezu voyeuristische
Darstellung von Gewalt inklusive vieler Wiederholungen aus
unterschiedlichen Perspektiven in vielen aufeinander folgenden
Sequenzen, Sendungen oder Ausgaben eine Verrohung der Zuschauer,
aber auch der beteiligten Medienakteure zur Folge haben kann, und
das trotz Trauer und Betroffenheit. Es ist deshalb nicht
auszuschließen, dass diese Melange zu einer Übereifrigkeit bei der
Berichterstattung beigetragen haben könnte (Schneider 2001, S.80 ff.).
Die Zuschauer, Zuhörer und Leser erkennen nicht, dass durch das
wiederholte Zeigen von grausamen Bildern Angst erzeugt wird, ohne
die Ursachen zu klären. Die Medien können die Ursachen nur am
Rande bekämpfen, weil dies in den Aufgabenbereich von Politikern
77
im öffentlichen, von Psychotherapeuten im privaten Bereich gehört.
Doch bei den Verbindungen der Presse zur Politik heutzutage
(Stichwort: Murdoch, Kirch, Springer), müssen Journalisten teilweise
auf der Hut sein, bei der Ursachenforschung als zu kritisch zu
erscheinen, was sie im Extremfall den Arbeitsplatz kosten kann. Es
dringt nicht an die Öffentlichkeit, inwieweit Journalisten und andere
Medienschaffende muslimischer Herkunft eventuellen Restriktionen
unterworfen sind, denn der Islam ist auch in der westlichen Welt
überall vertreten. Die Medienvielfalt erfährt eine Determiniertheit. Die
freie Presse unterläuft der Gefahr, sich aus Partei- und
Regierungskreisen bevormunden zu lassen. Der Krisenjournalismus
(Neverla 2003, S.158ff.) wird zu einem Protokoll- und
Verlautbarungsjournalismus (Kunczik, Zipfel 2001, S.169).
Jedoch muss ein objektiver Betrachter zugeben, dass sich die Presse
schon lange vor dem 11. September 2001 stark verändert hat, was zum
Teil auf die Einführung des Internet, von Online-Zeitungen und neuen
Formen des Textdesigns zurückzuführen ist. Das waren jedoch
lediglich strukturelle Veränderungen, die vorrangig Textdesign,
Farbgestaltung und Recherchemethoden betrafen. Einschneidende
politisch-restriktive Veränderungen scheinen sich jedoch erst im Zuge
des 11. September durchzusetzen, was besonders die Kündigungen
von kritischen und damit vermeidlich illoyalen Journalisten beweisen
(Berliner Zeitung, 1.11.2001).
5.4 Das Dilemma der Medien im Zusammenhang mit dem 11.
September
Die Tragik der Ereignisse des 11. September steht außer Frage. Wir
können in Anbetracht der Bilder nicht von Hoch- oder
Herunterspielen von Ereignissen sprechen. Eine solche Katastrophe
hat zwangsläufig eine ständige Medienpräsenz zur Folge, in welcher
Form auch immer.
Dass es bei der Berichterstattung zu Fehlern kam, war unvermeidbar.
Die sprachlich-journalistische Berichterstattung fand jetzt unter ganz
anderen Voraussetzungen statt, es gab kein „Business-as-usual“ mehr.
Das gewohnte Verhältnis von Sprache und Bildern hatte das
Gleichgewicht verloren. Normalerweise ist jedes wichtige
78
Medienereignis mit Bildern illustriert und einem ergiebigen Text
versehen. Doch was den 11. September anbetrifft, sehen wir
wochenlang immer wieder das gleiche Szenario: Die einschlagenden
Flugzeuge, die brennenden WTC-Türme, den Trümmerhaufen,
Fahndungsfotos und das ausgelöste Chaos bestehend aus Helfern bei
der Arbeit, Menschen auf der Suche nach Angehörigen und andere
trauernde Menschen. Der so genannte „photographische Schock“
(Barthes 1989, S.41) ist groß12. Die Bilder graben sich meditativ in
das Gedächtnis vieler konsternierter Menschen ein und werden damit
zum Trauma (“TV viewers may suffer trauma; Terror in
America.“ The Times, 19. September 2001). Es kommt zu einer Flut
von Artikeln über das Ereignis und die Begleitumstände, die immer
wieder die Bilder der Katastrophe und der Stunden danach evozieren.
Doch die Zeitungen besaßen kein Krisenmanagement oder
Beraterteams, die darauf vorbereitet waren. Es zeigt sich, dass
Journalisten eben keine Psychotherapeuten sind. Stattdessen wirkt in
den Medien ein journalistisches Trauma (Beuthner 2003, S.138), dass
das Unbehagen nur verstärkt.
Aus Angst vor den Konsequenzen wird nicht über die politischen
Beweggründe von Terroristen gesprochen, für die der Staat USA die
Personifikation des Bösen ist. Es mutet nahezu absurd an, dass der
Gegenpol ebenso argumentiert, es ist von der „Achse des Bösen“ die
Rede (Todd 2002, S.13). Diese Tatsache wird nirgends diskutiert,
niemand fragt, wofür die Negativbezeichnung „Das Böse“ steht, ob
für eine Religionsform, ein martialisches Rechtssystem, finanzielle
Ausbeutung, Weltherrschaft oder Unterdrückung des schwachen
Geschlechts. Diese Tatsache, dass die Leute sich gegenseitig als das
Böse bezeichnen, ist wohl die Crux der politischen Berichterstattung,
denn dieser kritische Zustand fordert zur Selbstreflexion und –kritik
auf, die jedoch auf beiden Seiten ausbleibt. Erschwerend kommt bei
der Berichterstattung hinzu, dass es eine Tendenz gibt, Begriffe wie
>ARAB<, >MUSLIM<, >FANATIC< oder >TERRORIST< als
austauschbar bzw. synonym zu betrachten (Soueif 2001, S.60). Dass
jedoch die Mörder vom 11. September von der islamischen Welt nicht
als wahre Muslime verstanden werden (Jelloun 2001, S.70 ff.), wird in
den Medienberichten nicht ausreichend berücksichtigt.
12
Der „photographische Schock“ kann bei einer Korpusanalyse von Zeitungstexten nicht analysiert werden, auch
wenn Texte und Bilder in einem gewissen Abhängigkeitsverhältnis stehen.
79
5.5 Der 11. September als Auslösefaktor für Spekulationen
Dieser unbegreifliche Terroranschlag am 11. September 2001 erzeugte
viel Spielraum für Mutmaßungen, Verschwörungstheorien und
Mythenbildung. Das Trauma war und ist selbst bei den Journalisten so
stark, dass es bei der folgenden Berichterstattung permanent
gegenwärtig zu sein scheint. Die Zeitungen hielten sich nicht zurück,
wenn es darum ging, eventuelle Drahtzieher der Anschläge zu
benennen und aufzuspüren. Die Printmedien waren in der Folgezeit
des 11. September übersät mit Spekulationen, auch die kühnsten
wurden in den als loyal geltenden Qualitätszeitungen nicht ausgespart.
Wir erfahren von mutmaßlichen internationalen Terrornetzwerken, in
die sogar ordentliche Staatschefs und Regierungen verstrickt sein
sollen. Es ist von aufzudeckenden Terrorzellen die Rede, doch die
meisten Spuren erweisen sich als irreführend. Ursachenforschung für
diese Tat findet in der Hektik der Ereignisse noch nicht statt. Parallel
dazu werden neue Feindbilder konstruiert, die von Osama Bin Laden,
Saddam Hussein und der Al-Qaida verkörpert werden (Kleinsteuber
2003, S.218).
Journalisten haben stets eine Wahrheits- und Sorgfaltspflicht
gegenüber der Bevölkerung (Hruska 1999, S.18/19). Wenn jedoch die
Journalisten der Wahrheit nicht auf den Grund gehen können, weil
eine sorgfältige Recherche verhindert wird, muss das Publikum
darüber in Kenntnis gesetzt werden. Es muss deutlich gemacht
werden, dass die übermittelten Wahrheiten nur Teilwahrheiten sein
können, vielleicht sogar unwahr. Der Golfkrieg von 1991 ist als
Beispiel dafür in die Geschichte eingegangen, dass „Zensur und
gelenkte Nachrichten die Presse in Ohnmacht versetzen“ können
(Hruska 1999, S.19).
Deshalb stellt sich die Frage, weshalb die Terrororganisation Al-Qaida
weltweit erst am 20.09.2001 zum ersten Mal in der
Zeitungsberichterstattung namentlich genannt wurde. Es drängt sich
der Verdacht auf, dass es diese Organisation entweder bis dato gar
nicht gab, oder dass deren Existenz zuvor verschwiegen wurde.
Beides verstößt gegen Pressegrundsätze, denn Information hat im
Rahmen der Wahrheits- und Sorgfaltspflicht der Presse Vorrang.
Das Desaster von New York wird damit zu einem Desaster der
Medien, denn auch Journalisten sind nur Menschen, die genauso
80
traumatisiert und fassungslos sein können wie die übrige USamerikanische Bevölkerung und die Weltöffentlichkeit. Die
Journalisten versuchen jetzt das, was sie nicht können: bei der
Aufklärung der Anschläge entscheidend behilflich zu sein, die
Journalisten avancieren zu Terror- und Islam-Experten ohne fundiertes
Hintergrundwissen und sorgen dadurch eher für Verwirrung als für
Aufklärung (Schneider 2001, S.80 ff).
Die Leser sehen sich mit einer Mixtur aus Panik und Desinformation
konfrontiert. Statt genauer Statistiken und Fakten hören wir von
angeblichen Börsendeals im Zusammenhang mit dem 11. September,
angeblicher
Beteiligung
von
Geheimdiensten,
islamischen
Machthabern und Spendensammlern. Es wird über Monate ungewollt
Panik erzeugt und Angst geschürt durch Berichte über mögliche neue
Terrorziele und Terrorwaffen wie Anthrax, Kofferbomben oder die
„Dirty Bomb“.
Die Journalisten, die sonst bei der alltäglichen Berichterstattung das
Geschehen vom Vortag für die Leserschaft aufzubereiten haben,
kommen auch Monate, sogar Jahre später immer wieder auf das
traumatische Ereignis zurück, wir erfahren - vermutlich politisch
gefilterte - Fakten und Spekulationen über Täter, Mitwisser und
Gehilfen.
Trotz der Unklarheiten gibt es eine Fülle von Publikationen, die
versuchen, Licht in das Dunkel zu bringen, auch wenn diese lediglich
auf Mutmaßungen basieren. Letztendlich ist in vielen Artikeln die
Trennung zwischen Nachricht, Kommentar und Spekulation
aufgehoben, und das aus blindem Eifer heraus, neue Details
aufzuzeigen.
Die
folgende
Textstelle
stammt
aus
dem
Korpus
Independent.2001.danach. Sie ist sehr bezeichnend für die
Berichterstattung nach 9/11:
“War without end ...Phase one is almost over. Now the US has its
sights set beyond the Taliban - America's blood is up. And they're
not stopping at Kabul.” (The Independent, 02.12.2001, World).
Dieses ist ein Beleg für den harscher werdenden Ton, der sich in der
Berichterstattung nach dem 11. September etablierte. Wir müssen
bedenken, dass es sich hierbei nicht um einen Kommentar handelt,
sondern um einen Artikel aus dem Themenfeld „World“.
81
Für den neuen vehementen Ton in den Medien gibt es weitere
Beispiele (s.u.). Die Sprache verhärtet sich, ohne dass bedacht wird,
dass sich Angst und Unsicherheit durch dieses politische und
journalistische Fehlverhalten unbeabsichtigt weiter verstärken.
Psychologische Hilfestellung, wie mit der permanenten Angst vor
neuen Terroranschlägen umzugehen ist, scheint gänzlich zu fehlen.
Die schreckliche Tat soll möglichst schnell gesühnt werden, selbst
Kriegsdrohungen und Kriegserklärungen durch die amerikanische und
englische Regierung werden unreflektiert mitgetragen.
5.6 Kontextuelle und lexikalische Wahrscheinlichkeit
Ein Ereignis wie der 11.September erzeugt eine gewisse lexikalische
Wahrscheinlichkeit. Je schwerwiegender,
berichtenswerter oder
effektvoller ein Ereignis ist (Tschernobyl, Maueröffnung, Gewinn der
Weltmeisterschaft
im
Fußball,...),
desto
größer
die
Wahrscheinlichkeit, dass dieser Kontext über einen längeren Zeitraum
beibehalten wird, weitere Artikel auf der Erstbeschreibung des
Ereignisses aufbauen, wie sich ausbreitende Wellen, die erst mit
einem bestimmten Abstand vom Ursprung abebben. Dabei wird eine
bestimmte lexikalische Wahrscheinlichkeit erzeugt (Armstrong 1994,
S.8 ff), die besagt, dass die Schlüsselbegriffe, die mit diesem Ereignis
einhergehen, häufiger verwendet werden als in Vergleichszeiträumen
(>TERROR ATTACK<, >TERRORISM<, >EXPLOSION<,
>WORLD TRADE CENTER<, >ISLAMIC<, >CRISIS<, >NEW
YORK<, >GROUND ZERO<, >HIJACKER<,...).
Die ausgelöste Ereigniskette bewirkt deshalb eine sprachliche
Kontextverschiebung:
82
Terroranschläge am 11.9.2001
↓
Trauer und Trauma
↓
Diskussionen/ Debatten
↓
Solidarisierung mit den USA
↓
Erste politische Entscheidungen
↓
Streit
↓
Drohung
↓
Reaktionen und Handlungen
(Bombardierung Afghanistans)
↓
Krieg gegen den Irak
↓
?
Abb. 4: Flow-Chart Ereigniskette nach dem 11.9.2001
In der Zeit bis zum Verschwinden eines schwerwiegenden Ereignisses
aus der täglichen Berichterstattung, werden Mutmaßungen über Täter
angestellt, erste politische Entscheidungen getroffen, es kommt zu
Katastrophenschutzmaßnahmen, internationalen Reaktionen und
ersten militärischen Gegenmaßnahmen, während das Hauptereignis
traumatisch nachhallt. Das Thema muss zwangsläufig wiederholt
aufgegriffen werden, wenn auch nur in einem Nebensatz oder sobald
neue Erkenntnisse über die Ursachen, neue Theorien oder neue
Aussagen darüber vorliegen.
83
Nachfolgende Terroraktionen werden jetzt anders bewertet, die
Bedrohung durch den Terrorismus wird sehr viel ernster genommen.
Der Begriff Terrorismus ist schon ein Indiz dafür, dass sich
Täterschaft nicht an konkreten Personen ausmachen lässt. Ferner
beinhaltet dieser Terminus Vermutungen über Netzwerke und
Handlanger. Das Gespenst eines globalen Terrornetzwerkes kommt
auf, eine Tatsache, die sich sprachlich widerspiegelt. Nehmen wir die
Pressesprache vor dem 11. September als Soll-Wert, was
Nüchternheit, Geradlinigkeit, Ruhe und Vernunft anbetrifft, so sollte
dieser Wert irgendwann wieder erreicht sein, vorausgesetzt, dass nicht
alles aus dem Gefüge gerät. Normalerweise werden die mit einem
Ereignis verbundenen Schlüsselwörter mit einem wachsenden
Abstand zum Hauptereignis immer seltener verwendet, bis sich der
„sprachliche Soll-Zustand des Alltags“ wieder eingestellt hat. Ein
diametral entgegengesetztes Beispiel wäre das Erringen des
Weltmeistertitels im Fußball, der immer nationale Euphorie auslöst,
die in der Sportberichterstattung, speziell in den Fußballberichten,
lange erhalten bleiben kann. Die Kontextuelle Wahrscheinlichkeit,
dass ein Ereignis in der Presse wieder und wieder aufgegriffen wird,
steigt mit der Wichtigkeit bestimmter Wörter und Wortgruppen, die
als Schlüsselbegriffe der aktuellen Thematik gelten (siehe Punkt 6.4).
Die Ereigniskette, die zunehmend zur Eskalation geführt hat, geht
einher mit einer Entwicklung von Sprache und Gewalt in einem
reziproken Verhältnis, das eine Zäsur fast verunmöglicht.
5.7 Der 11. September als Agenda-Setting-Prozess
Die Ereignisse des 11. September haben in der unmittelbaren
Folgezeit von der Quantität der Berichterstattung her einen Umfang
eingenommen, der in Anbetracht der Grausamkeit des Ereignisses als
angemessen bezeichnet werden muss. Doch ob die Presse-Texte den
richtigen Tenor besaßen, ist fraglich, denn in der Nachfolgezeit sind
zwei Kriege in Asien (Afghanistan, Irak) geführt worden, weil
Regierungen in einen Zusammenhang mit den Terroristen des 11.
September gebracht worden sind. Ergo hat der 11.9., erstens,
maßgeblich das Agenda-Setting bestimmt (Agenda-Setting-Effect).
Zweitens wurde die Vorreiterrolle der USA und Großbritanniens in
84
der internationalen Terrorismus-Bekämpfung konstatiert (PrimingEffect). Drittens wurde eine radikale Methode der Konfliktlösung in
Form von Flächenbombardierungen (Afghanistan) , Internierungen
(Guantanamo Bay), Invasion (Irak) und Folter (Abu Ghureib) einer
diplomatischen Lösung vorgezogen (Framing-Effect), wohl auch aus
einer gewissen Ohnmacht heraus in Anbetracht des Horrorszenarios.
Dieses Handlungsschema der Medien ist bereits für den ersten
Golfkrieg 1990/91 festzustellen (Kunczik, Zipfel, 2001, S.371).
Eine weitere Betrachtungsweise der Agenda-Setting-Theorie ist die
Tatsache, dass die Rezipienten die Medien-Agenda als soziale
Wirklichkeit sehen (Jarren, Bonfadelli 2001, S.360/61). Dazu gehört
die permanente, massive Angst in allen Teilen der Gesellschaft vor
weiteren Anschlägen. Was in New York am 11. September 2001
passierte, könnte plötzlich in London, Chicago oder Berlin passieren.
Viele, die in einem Hochhaus arbeiten, malten sich das Horrorszenario
von New York noch einmal aus. Dieses Beispiel ist symptomatisch für
die Angst, die durch den 11. September ausgelöst wurde. Der 11.
September hat deshalb einen >>Backlash<< (negative Rückwirkung)
auf die gesamte westliche Zivilisation. Die in den Medien
erforderliche Auseinandersetzung mit der islamischen bzw. arabischen
Welt zeugte ferner von einem kulturellen >>Lag<<, was das Wissen
über diese Staaten, Kulturen und Sprachen anbetrifft, denn es zeigte
sich, dass es allerorts an Islamwissenschaftlern fehlte (>>Knowledgegap<<, Kunczik, Zipfel, 2001, S. 384 ff.).
Eine weitere Begleiterscheinung ist, dass der durch den 11. September
ausgelöste
Schockzustand
bewirkt
hat,
dass
die
alte
Nachrichtenagenda, die zuvor im Gleichgewicht war, zurückgedrängt
wurde. Der 11. September und seine Folgen überdeckten andere
Themen aus der Berichterstattung, die aufgrund ihrer permanenten
Wichtigkeit normalerweise einer ständigen Präsenz in den
Nachrichten bedurften (Kunczik, Zipfel, 2001). Sie mussten
letztendlich dem Hauptereignis weichen, das nahezu eine Sogwirkung
erzeugte.
Auf der anderen Seite wurden Themen bevorzugt, da sie mit in den
Strudel hineingerissen wurden, insbesondere die Berichterstattung
über aggressive islamische Staaten (Pakistan, Afghanistan, Irak, etc.),
internationale Außenpolitik und Katastrophenschutz.
85
Die Verdrängung anderer immens wichtiger Nachrichten ist als
problematisch zu erachten, da vieles in Vergessenheit geriet.
Der 11. September fiel in eine Phase, als dringliche Themen auf der
Tagesordnung standen, beispielsweise die Nachverhandlungen zum
Kyoto-Protokoll. Diverse Ereignisketten sind drastisch unterbrochen
worden und auf unbestimmte Zeit aufgeschoben. Es ist fraglich, wann
gerade im Bereich von Umweltschutzabkommen, Abrüstung,
Migration und Bekämpfung von Hunger und Aids erneut zu einer
sinnvollen Diskussion angesetzt werden kann.
Die Verdrängung anderer Themenkomplexe spielt generell immer eine
Rolle, wenn Ereignisse wie Kriege, Revolutionen und Katastrophen
das Weltgefüge aus der Bahn werfen.
5.8 Der Nachrichtenfaktor des 11.September
In der Publizistik existiert das Modell der Nachrichtenfaktoren, das
definiert, was die Voraussetzungen sein können, dass ein Ereignis in
die Medien Einzug hält.
Diese Faktoren spielen im Zusammenhang mit dem 11.September nur
noch eine untergeordnete Rolle, da eine Kettenreaktion ausgelöst
wurde, ähnlich wie im Krieg, der jetzt mittlerweile auch dem 11.
September gefolgt ist. Nachrichtenfaktoren wie Frequenz,
Schwellenfaktor,
Eindeutigkeit,
Bedeutsamkeit,
Konsonanz,
Kontinuität, Überraschung, Variation, Bezug zu Elite-Nationen,
Bezug zu Elite-Personen, Personalisierung und Negativismus
(Kunczik, Zipfel 2001, S.248) scheinen in Anbetracht des
schockierenden Ausmaßes des Terrorangriffes ad absurdum geführt zu
sein. Neue Nachrichtenfaktoren könnten auch Trauma, Verzweiflung
und Chaos heißen. Doch selbst die Schwere des Ereignisses vermag es
nicht, die allgegenwärtige Produktwerbung, den Sexismus und die
Demontage von in Ungnade gefallenen Prominenten nur für eine
kurze Trauerphase aus den Medien zu verbannen. Die Empörung
verstärkt sich durch das taktlose Verhalten der Medien, die dadurch
mit in den Abgrund der ideologischen Krise hineingerissen werden.
86
5.9 Qualitätskriterien für Informationsjournalismus
In der Publizistikwissenschaft ist ferner von den Qualitätskriterien für
Informationsjournalismus die Rede (Jarren/ Bonfadelli 2001, S.276).
Zu diesen zählen Kriterien wie Richtigkeit, Vielfalt, Relevanz,
Vermittlung, Professionalität, Akzeptanz, Neuigkeit, Aktualität,
Originalität, Unabhängigkeit, Fairness, Transparenz, Verständlichkeit,
Interaktivität etc. Diese Kriterien sind untereinander verkettet
(fehlende Vielfalt – fehlende Transparenz – fehlende Professionalität
etc.). Viele dieser Beurteilungsgrößen sind infolge des 11. September
beeinträchtigt worden. Das belegt das Durcheinander in der Presse,
das den ersten Katastrophenbildern folgte.
Die Korpuslinguistik ist nur schwerlich in der Lage, diese Kriterien
gezielt zu überprüfen (s.u.). Dieses kann nur der kritische Leser für
sich selbst vornehmen. Was das Kriterium der Richtigkeit anbetrifft,
so ist zu betonen, dass viele Spekulationen getätigt wurden, ohne diese
einer Prüfung zu unterziehen (z.B.: „Osama Bin Laden hält sich im
Sudan auf“). Die Vielfalt wurde deshalb beeinträchtigt, da fortan ein
Thema vorrangig gegenüber den meisten anderen Themen behandelt
wurde (Was wurde aus den Nachverhandlungen zum KyotoProtokoll?). Die Vermittlung entsprach einer ausufernden
Krisenberichterstattung mit zum Teil fehlender Transparenz (z.B.
fraglich: Weshalb hatte der Staat Afghanistan eine Mitschuld?). Die
Professionalität hatte zu leiden, da es an Islam- und TerrorismusExperten mangelte (z.B. fraglich: Warum erhielt das Wort Terrorist so
häufig das Attribut islamisch?). Auch die Unabhängigkeit schien nicht
mehr gewährleistet, da kaum kritische Stimmen über die Reaktionen
der USA zu vernehmen waren, es wurden sogar Entlassungen von
Journalisten bekannt, die den Leitlinien der Zeitungen nicht mehr
entsprachen (Berliner Zeitung 1.11.2001). In diesem Zusammenhang
ist vom „neuen Patriotismus“ in den USA die Rede. Diese Tatsachen
wären als Qualitätseinbußen zu verstehen, ja sogar als autokratische
Veränderungen in den Zeitungshäusern, wenn wir das durch den
Terroranschlag verursachte Trauma und die Depressionen außer Acht
ließen. Auch das Kriterium der Fairness schien über den Haufen
geworfen zu sein, da diverse Personen, Gruppierungen, sogar ganze
Staaten mit den Terroristen des 11. September undifferenziert über
einen Kamm geschert wurden.
87
Wie ein ständig wiederkehrender Albtraum wurden die
traumatischen Bilder und der vermeidliche Tathergang ständig
wiederholt. Die nüchterne Berichterstattung wurde verdrängt, die
Katastrophe mutierte durch die Zurschaustellung der Bilder zur
Sensation, die erst von der Kriegsberichterstattung über die
Bombardierung Afghanistans und später den Einmarsch in den Irak
abgelöst wurde. In diesem Zusammenhang darf nicht verschwiegen
werden, dass Fachleute infolge des 11. September die Presse- und
Meinungsfreiheit im Kern als bedroht sahen (Krotz 2003, S.312). Das
ist eine Situation, in der Bewertungsmaßstäbe wie Qualitätskriterien
generell ad absurdum geführt werden.
Es bleibt in Bezug auf die Korpuslinguistik festzuhalten, dass sich
diese Qualitätskriterien nicht über Wortlisten und Textstatistiken
überprüfen lassen, wenn überhaupt, können ausgewählte
Konkordanzen (siehe 6.3.2) oder Keyword-Analysen (siehe 6.4.3)
belegen, dass es in Zeitungsartikeln an Professionalität, Fairness,
Vielfalt und Transparenz mangelt. Zeigt beispielsweise eine KeywordAnalyse, dass die Themenvielfalt gegenüber einem Vergleichskorpus
stark eingeschränkt ist, zählt das als Anhaltspunkt dafür, dass
Qualitätskriterien nicht eingehalten wurden.
In diesem Zusammenhang zeigen sich viele Missverhältnisse erst,
wenn Detailanalysen ausgewählter Zeitungsartikel oder ganzer
Zeitungsausgaben per Hand durchgeführt werden.
5.10 Die Nachrichtenwert-Theorie
Die Nachrichtenwert-Theorie gibt Aufschluss über die Faktoren der
Nachrichtenselektion. Sie besteht im Wesentlichen aus fünf
Elementen: Ablauf, Anlass, Modalität, Folgen und Akteure. Dabei gilt
der Leitspruch, dass je mehr Faktoren auf ein Ereignis zutreffen, desto
größer die Wahrscheinlichkeit wird, dass es zu einer Nachricht wird
(Jarren, Bonfadelli 2001, S.273). Dazu zählt das Prinzip der
Additivität und der Komplementarität.
In Bezug auf den 11. September ist festzuhalten, dass alle fünf
Faktoren in Millionen von Artikeln, Berichten, Reportagen,
Kommentaren und Essays aufgegriffen wurden. Ganze Bücher wurden
über den angeblichen Ablauf geschrieben, über den Anlass wurde
bekanntlich viel spekuliert. Die Modalität des Ereignisses kann mit
88
den Begriffen Drama, Regelwidrigkeit und Konflikt umrissen werden.
Die Folgen bestehend aus Negativität und Schaden beschäftigen die
Medien heute noch und werden es auch weiterhin tun. Selbst die
Akteure, der fünfte Faktor dieser Nachrichtenwert-Theorie, finden
immer wieder Medienpräsenz, egal ob diese leben oder bereits tot
sind, ob es wirkliche Hintermänner sind oder eigens aufgebaute
Feindbilder. Schließlich avancieren Politiker wie Bush, Rumsfeld und
Blair selbst zu Akteuren, die von Kritikern mitunter als Kriegstreiber
bezeichnet werden.
Wenn es möglich wäre, dem 11. September als Nachricht einen
mathematischen Wert zuzuordnen, so müsste dieser ein Maximum
erreichen, das vergleichbar mit einem Bodediagramm fortwährend
andauert. Diese Tatsache spiegelt sich auch in der Auswertung dieser
Dissertation wieder, wenn es darum geht, die Häufigkeiten von
Begriffen zu vergleichen, die nach dem 11. September eine stärkere
Verwendung fanden (>TERROR<, >ISLAMIC<, >ANTHRAX<,
etc.). Es lässt sich bereits jetzt absehen, dass kein Ereignis seit dem
Ende des 2. Weltkrieges einen so großen Nachrichtenwert besaß wie
die Katastrophe in New York, vielleicht mit Ausnahme der
Maueröffnung in Berlin am 9.11.1989. Auf der anderen Seite haben
Katastrophen, die eine sehr lange physikalische und biologische
Nachwirkung erzeugten wie die großen Reaktorkatastrophen
(Tschernobyl, Harrisburg, Sellafield), im Vergleich zum 11.
September verhältnismäßig schnell ihren Nachrichtenwert verloren.
5.11 Der 11. September als Schlüsselereignis
Schwere Verbrechen, Unfälle und Katastrophen können im
Medientenor zu Schlüsselereignissen avancieren (Kunczik, Zipfel
2001, S.259). Das trifft für den 11. September ganz eindeutig zu, mehr
noch als für die meisten anderen Ereignisse der letzten Jahre und
Jahrzehnte. Schlüsselereignisse vermögen das Auswahlverhalten der
Journalisten zu verändern. Das zeigt sich darin, dass zumindest
kurzfristig, oder wie im Zusammenhang mit Nine-Eleven sogar
längerfristig, über zusammenhängende Themen bevorzugt berichtet
wird, was regelrechte Beitragswellen zur Folge haben kann. Dieses
ist für den 11. September uneingeschränkt zu beobachten.
Beitragswellen können laut Kunczik, Zipfel beim Rezipienten einen
89
nicht der Realität entsprechenden Eindruck von der Häufung
bestimmter Ereignisse vermitteln, in diesem Fall von
Terroranschlägen, die es trotz des unwidersprochen katastrophalen
Ausmaßes des 11. September in der unmittelbaren Folgezeit nicht
gegeben hat. Eine kritische Auseinandersetzung mit den Themen
Islam, Globalisierung und Vorherrscherrolle der USA unterblieb
hingegen. Andererseits ist zu vermerken, dass eine kritische
Auseinandersetzung mit den Wurzeln von Religionsfanatismus
weitestgehend unterbleibt, zu denen beispielsweise die Prügelstrafe in
den Beduinenschulen gehört (Elbedour et al. 1997, S.2001-215).
Andererseits entsteht beim wiederholten Deklarieren von Terroristen
und Terrorverdächtigen als muslimisch und islamisch die Gefahr, dass
gesellschaftliche Prozesse ausgelöst werden, die nicht mehr
kalkulierbar sind.
Es wird das Medienimage erzeugt, dass Muslime mit Terroristen
gleichsetzt. Diese Form der Berichterstattung birgt deshalb die Gefahr,
dass sie eine Situation heraufbeschwört, vor der sie warnen wollte.
Muslime, die ihre Religion diskriminiert und bedroht sehen, laufen
Gefahr, selbst Torheiten zu begehen, sei es aus Verwirrung oder um
sich für das an ihrer Religion begangene Unrecht zu rächen. Der so
genannte „islamische Terror“, der ursprünglich der Terror einer
kriminellen Minderheiten war, wird dadurch zu einer Self-FulfillingProphecy (Kunczik, Zipfel, S.235).
5.12 Das Textkorpus mit Artikeln erschienen nach 9/11
Das Korpus K1 enthält ausschließlich Artikel, die nach dem 11.
September in dem Zeitraum vom 12.9.2001 bis zum 11.12.2001
erschienen sind. Presse-Korpora, die sich ein und demselben Thema
widmen wie beispielsweise dem Tod von Prinzessin Diana, werden in
der Linguistik als thematische Korpora bezeichnet (Rademann 1998,
S. 49-71). Wir können das Korpus K1 deshalb als thematisches
Korpus bezeichnen, da es ausschließlich Zeitungsartikel enthält, die
nach 9/11 erschienen sind. Zwar handeln nicht alle Artikel direkt von
den traumatischen Ereignissen in New York, jedoch sind die
Zeitungsredaktionen von den Nachwirkungen der lang anhaltenden
Krise beeinflusst gewesen. Aufgrund dieser Korpuskonstellation
können wir auch von einer Simulation der sprachlichen
90
Veränderungen nach dem 11. September sprechen, oder besser von
einem messbaren Vorher-Nachher-Effekt (Primacy-Recency-Effect,
Trautner 1997, S.439), in dem die vor 9/11 erschienen Artikel mit den
danach publizierten und geschriebenen verglichen werden können. In
Anlehnung an Kennedy können wir von einem Pilot Corpus oder
Snapshot sprechen (Kennedy 1998, S.60 u. 69).
6. KAPITEL: Auswertung der Analysedaten
In diesem sechsten Kapitel sind die an den Korpora vorgenommenen
Hauptanalysen dargelegt. Zunächst werden hier die Basisdaten
aufgezeigt, in den weiteren Unterkapiteln Veränderungen an
Grammatik, Syntax, Lexik und Morphologie diskutiert.
6.1 Die von Wordsmith gewonnenen Basisdaten
Die Korpusanalyse mit dem Programm „Wordsmith“ lieferte eine
Fülle an Ergebnissen, die im Folgenden dargelegt sind. Zum einen
haben wir die drei Korpusstatistiken von K1, K2 und K3. Zweitens
die alphabetisch geordneten Frequenzlisten, weiter die nach
Prozentzahlen geordneten Frequenzlisten, viertens die automatisch
erstellten Vergleichslisten (Keyness) und schließlich, fünftens, die
Konkordanzlisten ausgewählter Begriffe.
6.1.1 Die Auswertung der Korpusstatistiken
Zum Erstellen der Korpusstatistiken wurde das Wordsmith-Tool
„Wordlist“ verwendet. Grundsätzlich ist zu betonen, dass eine
Korpusanalyse dreier Textkorpora mit insgesamt mehr als vier
Millionen Wörtern eine dermaßen umfangreiche Datenmenge liefert
(z.B. Wortliste von Korpus K1, nach prozentualer Häufigkeit
geordnet, enthält 35 307 Zeilen mit je bis zu vier Einträgen), dass eine
Fokussierung auf die wichtigsten Aussagen bei der Auswertung
erforderlich wird, um den Rahmen der Korpusanalyse nicht zu
sprengen. Um die Essenz der Wortlisten herauszufiltern, können die
91
obersten Einträge zunächst vernachlässigt werden, bei denen es sich
zumeist um bloße Funktionswörter wie Artikel, Präpositionen und
Hilfsverben handelt (siehe 6.1.3). Ebenso können die unteren Einträge
vernachlässigt werden, denn die Wörter kommen im Korpus zu selten
vor und sind größtenteils Hapax Legomena (siehe Tab. 15). Die drei
Korpusstatistiken sind hier in einer Tabelle zusammengefasst:
Text File
Bytes
Tokens
Types
Type/Token Ratio
Standardised Type/Token
Ave. Word Length
Sentences
Sent.length
Sd. Sent. Length
Paragraphs
Para. Length
Sd. Para. Length
Headings
Heading length
Sd. Heading length
1-letter words
2-letter words
3-letter words
4-letter words
5-letter words
6-letter words
7-letter words
8-letter words
9-letter words
10-letter words
11-letter words
12-letter words
13-letter words
14(+)-letter words
OVERALL
K1.TXT
K2.TXT
K3.TXT
25.312.808
4.041.309
68.428
1,69
47,61
4,81
116.096
29,03
26,93
139.941
28,88
109,75
0
6.261.170
1.010.191
35.307
3,5
47,58
4,79
33.981
22,34
13,59
34.133
29,6
102,94
0
6.243.089
1.010.073
36.467
3,61
47,5
4,76
38.751
21,85
11,43
40.503
24,94
81,69
0
12.808.549
2.021.045
48.738
2,41
47,69
4,87
43.364
40,69
38,25
65.305
30,95
126,96
0
113.646
681.119
782.948
626.286
440.763
369.581
347.467
252.913
194.159
114.093
60.228
32.118
16.921
6.345
28.128
170.671
196.963
158.947
111.625
91.246
87.498
62.798
47.333
26.777
14.786
7.387
3.928
1.494
30.405
167.903
198.517
163.901
112.690
93.280
84.231
61.420
43.944
26.607
14.084
7.147
3.838
1.446
55.113
342.545
387.468
303.438
216.448
185.055
175.738
128.695
102.882
60.709
31.358
17.584
9.155
3.405
Tab. 13: Zusammenfassung der drei von Wordsmith erstellten
Korpusstatistiken (sd. = standardised).
Zunächst ist für jedes Korpus die Anzahl der Bytes genannt. Daraus
ließen sich die Wortgrößen in Bytes und Bits errechnen, doch da
Wordsmith dieses nicht vornimmt und es für unsere
92
Betrachtungsweise irrelevant ist, soll diese Möglichkeit hier lediglich
angesprochen und nicht weiter ausgeführt werden.
Wie wir den Listen entnehmen können, enthält K1 1 010 191 Token,
K2 1 010 073 und K3 2 021 045. Das sind leichte Diskrepanzen im
Vergleich zu den Zählungen des Textverarbeitungsprogramms
Microsoft Word (Version 2000). Für K1 ermittelt „Word 2000“
1 000 789 Wörter, für K2 1 001 211 Wörter und für K3 2 000 131
Wörter. Diese Unterschiede sind damit zu begründen, dass
Wordsmith und Microsoft Word unterschiedliche Satz- und
Wortgrenzenerkennung durchführen (siehe Punkt 6.3.1).
Wenn wir die durchschnittliche Anzahl der Wörter pro Satz für jedes
der drei Korpora miteinander vergleichen, so stellen wir fest, dass es
zu einer frappierenden Veränderung zwischen 1990 und 2001
gekommen ist. Dieses Phänomen ist unter Punkt 6.3 (Untersuchungen
an der Syntax) näher beschrieben.
Weitere Punkte der Tabelle sind Anzahl der Paragrafen, die
Paragrafengröße und die standardisierte Paragrafengröße. Doch diese
Werte sind nicht zuverlässig, da die Zeitungsartikel in ihren
elektronischen Ursprungsmedien nicht immer einheitlich in
Paragrafen unterteilt sind. Für die drei Größen Schlagzeilenzahl,
-länge und standardisierte Schlagzeilenlänge sind keine Werte von
Wordsmith errechnet worden. Ob die Unterfunktion funktioniert,
wurde nicht nachvollziehbar.
6.1.2 Die Type-Token Relation (TTR)
Wenn wir alle Wörter eines Textkorpus zählen, unabhängig davon, ob
diese mehrfach vorkommen und deshalb mehrfach gezählt werden, so
ermitteln wir die Anzahl aller Token. Ein Text, bestehend aus 1000
Wörtern, hat folglich 1000 Token. Zählen wir die Wiederholung eines
Wortes in derselben Schriftweise nicht mit, auch ungeachtet der Großund Kleinschreibung, jedoch ohne orthografische Fehler, so erhalten
wir die Kategorien verschiedener Wörter. Für diese Kategorien
verwenden wir die Bezeichnung Typen.
Die TTR ist ein mathematischer Wert, der beschreibt, wie hoch der
prozentuale Anteil der Typen an der Gesamtzahl der Wörter bzw.
Token ist. Hat ein Text bestehend aus 1000 Wörtern 250 verschiedene
Wörter, ergibt sich eine TTR von 25 %. Laut Hansen/ Teich (1999, S.
93
312) lässt sich anhand der Type-Token Relation die Komplexität eines
Textes bewerten.
Typen
Token
.
100
=
TTR
Formel für die Type-Token Relation (TTR), Hansen/ Teich, S.312
(Laut Lewandowski 1990, S.1200: Quotient aus der Anzahl der
verschiedenen Wörter und der Gesamtzahl der Wörter in einem Text
bzw. einer Sprachprobe)
Die TTR erlaubt Aussagen über den individuellen Wortschatz und die
sprachliche Kreativität. Ferner ist ein Zusammenhang zwischen der
messbaren Intelligenz des Verfassers und seinem TTR-Wert
nachweisbar (Lewandowski 1990,S. 1200).
Wir können jetzt die Type-Token Relation der drei Textkorpora K1,
K2, und K3 miteinander vergleichen (siehe Tab. 13). Für K3 (1990)
ergibt sich ein Wert von 2,41 %. Das heißt, dass 2,41 % der
enthaltenen Wörter Typen sind. Für K2 (2001 vor dem 11.9.)
ermitteln wir einen Wert von 3,61 %. Für K1 (2001 nach dem 11.9.)
erhalten wir 3,50 %. Wir lernen daraus, dass zum einen bei einer
zunehmenden Korpusgröße die Type-Token Relation geringer wird.
Auf der anderen Seite erkennen wir, dass zwischen K2 und K1 bei
gleicher Korpusgröße eine andere Zahl entsteht, die Type-Token
Relation von K2 zu K1 hat sich geringfügig um 0,11 Prozentpunkte
verringert.
Wir können die Werte von K1, K2 und K3 vergleichbar machen,
obwohl K3 so viele Token beinhaltet, wie K1 und K2 zusammen,
indem wir die standardisierte Type-Token Relation betrachten. Bei
diesem Wert wird ein Korpus in Intervalle von 1000 Wörtern
unterteilt, für jedes Intervall wird die Type-Token Relation erstellt,
aus diesen Werten wird schließlich ein Mittelwert berechnet. Für K1
(2001 nach dem 11.9.) erhalten wir 47,58 %, für K2 (2001 vor dem
11.9.) 47,50 % und für K3 (1990) 47,69 %. Daraus schließen wir, dass
sich die durchschnittliche Type-Token Relation bei Intervallen von
1000 Worten von 1990 bis zu dem Zeitraum 2001 vor dem 11.9.
zunächst um 0,19 Prozentpunkte reduziert hat. Nach dem 11.9. stieg
diese Relation jedoch wieder um 0,08 Prozentpunkte an. Also wurde
94
der Trend zur Redundanz kurzfristig umgekehrt, indem wieder mehr
verschiedene Wörter verwendet wurden.
Die Anzahl der Token in K1 und K2 ist nahezu gleich (s.o.). Während
die Anzahl der Typen im Korpus K2 noch 36 467 beträgt, fiel die
Summe in K1 um 1160 Typen auf 35 307. Vermutlich hat sich der
Wortschatz durch den Einfluss von 9/11 verringert.
6.1.3 Die Häufigkeitslisten
Das Wordsmith-Tool „Wordlist“ erzeugt neben der Textstatistik und
der alphabetischen Wortliste eine nach Häufigkeiten geordnete Liste.
In dieser Frequenzliste sind dieselben Werte wie in der alphabetischen
Liste zu finden, jedoch jetzt nach Häufigkeiten geordnet. Es sind alle
in einem Korpus enthaltenen Typen aufgelistet, versehen mit der
Prozentzahl und der Anzahl der Token. Für unsere drei Hauptkorpora
entstehen deshalb drei unterschiedliche Frequenzlisten.
Im Folgenden sind die oberen 30 Einträge dieser drei Listen von K1
(35 307 Typen), K2 (36 467 Typen) und K3 (48 738 Typen) zu
finden. Wenn wir die drei Listen mit jeweils 30 Typen nebeneinander
platzieren, so stellen wir fest, dass diese wider Erwarten leicht
voneinander abweichen.
Bei einem fest definierten Register wie dem der Sprache von
Qualitätszeitungen, erwarten wir, dass dieses Grundgerüst der
Sprache, das sich aus den häufigsten Worten konstituiert, relativ
gleich verteilt ist. Unter den obersten 30 Typen in den drei
Frequenzlisten von K1, K2 und K3 befinden sich in erster Linie
Funktionswörter (K1: 22 Funktionswörter, K2: 22, K3: 23).
Die aufgelisteten Typen sind dem Satzzusammenhang entrissen, deren
grammatikalische Funktion kann in vielen Fällen nicht klar bestimmt
werden, da die Formen isoliert stehen.
95
K1
K2
K3
12.09.200111.12.2001
N WORD
1 THE
2 TO
3 OF
4 A
5 AND
6 IN
7 THAT
8 FOR
9 IS
10 WAS
11 ON
12 HE
13 SAID
14 IT
15 BY
16 BE
17 WITH
18 AS
19 HAVE
20 AT
21 ARE
22 HIS
23 FROM
24 HAD
25 MR
26 NOT
27 HAS
28 BUT
29 THEY
30 AN
01.06.200111.09.2001
N WORD
1 THE
2 TO
3 OF
4 A
5 AND
6 IN
7 THAT
8 FOR
9 WAS
10 IS
11 ON
12 HE
13 SAID
14 IT
15 BY
16 WITH
17 BE
18 AT
19 AS
20 HIS
21 HAVE
22 FROM
23 HAD
24 MR
25 ARE
26 HAS
27 BUT
28 THEY
29 NOT
30 WERE
01.01.199021.08.1990
N WORD Freq.
1 THE
144181
2 OF
64965
3 TO
58396
4 A
43686
5 IN
42938
6 AND
42799
7 THAT 21467
8 FOR
20423
9 IS
17051
10 ON
15804
11 WAS
15644
12 BY
14137
13 MR
13581
14 BE
13036
15 IT
12683
16 SAID
12523
17 WITH 11968
18 HE
11697
19 AS
11302
20 AT
10738
21 FROM 9800
22 HAVE 9549
23 ARE
8859
24 HAS
8826
25 HAD
8148
26 AN
8103
27 NOT
7978
28 WHICH 7721
29 WERE 7336
30 BUT
7311
Freq.
67324
29690
29403
22933
21823
20984
12820
9797
9236
9097
7962
7390
7227
6823
6376
6306
5949
5774
5402
5260
5014
4905
4698
4688
4541
4479
4477
4347
4138
4069
%
6,66
2,94
2,91
2,27
2,16
2,08
1,27
0,97
0,91
0,9
0,79
0,73
0,72
0,68
0,63
0,62
0,59
0,57
0,53
0,52
0,5
0,49
0,47
0,46
0,45
0,44
0,44
0,43
0,41
0,4
Freq.
66047
29181
28526
24483
21404
21062
11833
10224
9723
8383
8067
7612
7208
6692
6175
6093
5984
5890
5808
5514
5179
5011
4859
4621
4415
4218
4101
4090
4065
3980
%
6,54
2,89
2,82
2,42
2,12
2,09
1,17
1,01
0,96
0,83
0,8
0,75
0,71
0,66
0,61
0,6
0,59
0,58
0,58
0,55
0,51
0,5
0,48
0,46
0,44
0,42
0,41
0,4
0,4
0,39
st. Wert
72091
32483
29198
21843
21469
21400
10734
10212
8526
7902
7822
7069
6791
6518
6342
6262
5984
5849
5651
5369
4900
4775
4430
4413
4074
4052
3989
3861
3668
3656
%
7,13
3,21
2,89
2,16
2,12
2,12
1,06
1,01
0,84
0,78
0,77
0,7
0,67
0,65
0,63
0,62
0,59
0,58
0,56
0,53
0,48
0,47
0,44
0,44
0,4
0,4
0,39
0,38
0,36
0,36
Tab. 14: Vergleich der oberen 30 Einträge der Frequenz-Listen von
K1, K2 und K3 (Freq.-Liste K3: st. Werte aufgerundet), die
Funktionswörter sind unterstrichen
Die Nicht-Funktionswörter in K1 sind der Reihenfolge nach die
Typen >HE<, >SAID<, >IT<, >AS<, >MR< und >THEY<. In K2
sind es die gleichen wie in K1, auch in dieser Reihenfolge, jedoch mit
leicht differierenden Häufigkeiten. In K3 hingegen sind es der
Reihenfolge nach >MR<, >IT<, >SAID<, >HE< und >AS<.
Der deutlichste Ausreißer ist die Anrede >MR< mit 0,67 % in K3
gegenüber 0,45 % in K1 und 0,46 % in K2. Es wirft Fragen auf,
weshalb >MR< 2001 seltener verwendet wurde als 1990. Das deutet
96
auf einen Verlust von Höflichkeitsformen hin und ist damit als
Qualitätsverlust zu werten.
Auffällig ist ferner, dass der bestimmte Artikel >THE< in K3 sehr
viel stärker vertreten ist (7,13 % gegenüber 6,66 % in K1 und 6,54 %
in K2) und der unbestimmte Artikel >A< hingegen in K2 (2,42 %)
und K1 (2,27 %) deutlich häufiger ist als in K3 (2,16 %).
>THE< gilt in der funktionalen Grammatik als specific determiner,
>A< als non-specific determiner der nominalen Deixis (Halliday
2004, S.315, siehe Ergebnisse von Jucker, in: Stubbs 1996, S.16 ff.,
bzw. s.o. Kap. 3.6).
>OF< erreicht in K3 mit 3,21 % deutlich höhere Werte als in K1
(2,91 %) und K2 (2,82 %). >OF< fungiert dabei als Postmodifier
oder post-Head Qualifier (Halliday 2004, S. 332). Das belegt eine
reduzierte Verwendung dieser Funktionswörter in 2001 (s.o. Jucker).
>THAT< ist in K1 mit 1,27 % deutlich häufiger vertreten als in K2
(1,17 %) und in K3 (1,06 %), (siehe Punkt 6.3.1, Subordinators).
Das Personalpronomen >HE< fällt in K3 mit 0,58 % deutlich
schwächer aus als in K2 (0,75 %) und in K1 (0,73 %). Das ist eine
gegenläufige Entwicklung zur Type >MR< und weist auf eine
Substitution hin: Die Personalpronomina stehen in Referenz zu
Eigennamen (proper name) oder zu Dingen (thing), (Halliday 2004,
S.325). Dieses kohäsive Mittel (pronominal reference) erzeugt im
laufenden Text eine Referenzkette (reference chain, Halliday 2004,
S.555). Der Verweis erfolgt innerhalb des Textes, deshalb wird von
einer anaphorischer Referenz gesprochen (anaphoric reference),
(Halliday 2004, S.554).
Da die Tokenzahlen für >SHE< zu gering waren, um in die Liste
Einzug zu erhalten, wurden etwaige Tendenzen nicht berücksichtigt
(siehe auch >MRS< unter Punkt 6.2.3, naming strategies). Die
geringe Referenz zu weiblichen Personen verdeutlicht, dass wir in
einer größtenteils von Männern dominierten Welt leben.
Bei der Type >IT< (specific non-personal pronoun, Halliday 2004,
S. 315) ist ein nur geringes, aber stetiges Ansteigen von K3 (0,63 %)
zu K2 (0,66 %) zu K1 (0,68 %) zu verzeichnen:
Das Personalpronomen >THEY< erscheint nicht in Liste K3, ist
deshalb < 0,36 %. In K1 (0,41 %) und K2 (0,4 %) sind die Werte fast
gleichstark.
97
Wir werden an späterer Stelle bei der Auswertung der Subordinators
und der Keyword-Listen auf weitere frappierende Abweichungen
stoßen, die nicht unter den obersten 30 Einträgen dieser drei
Häufigkeitslisten zu finden sind. Auch bei den Verbformen sind
Schwankungen zu verzeichnen:
>WAS< (K1: 0,9 %; K2: 0,96 %; K3: 0,77 %),
>IS<
(K1: 0,91 %; K2: 0,83 %; K3: 0,84 %),
>HAVE< (K1: 0,53 %; K2: 0,51 %; K3: 0,47),
>ARE< (K1: 0,5 %; K2: 0,44 %; K3: 0,44 %),
>HAD< (K1: 0,46 %; K2: 0,48 %; K3: 0,4 %).
Zur Diskussion der Coordinators siehe Punkt 6.3.
Wie aussagekräftig diese Daten tatsächlich sind, ist schwierig zu
beurteilen, da fraglich ist, ob und welche Testverfahren sicher
angewendet werden können, um Ergebnisse zu gewinnen: Stichproben
mit Wortgruppen, grammatikalischen Strukturen, Syntax- und
Wortbildungsmustern sind anders zu bewerten als Stichproben aus
Versuchspersonen in den Sozialwissenschaften oder Verkaufszahlen
in den Wirtschaftswissenschaften. Jedoch kann, was einzelne Wörter
anbetrifft, die Häufigkeit mit einem geläufigen Frequenzwörterbuch
wie dem von Leech et al. (2001) oder mit den aufgelisteten
Kollokationen in einem Kollokationswörterbuch verglichen werden
(Oxford Collocations Dictionary for Students of English 2003).
Solche Wörterbücher geben jedoch nur Anhaltspunkte für erwartete
Häufigkeiten oder „Erwartete Begleitwörter“ und sagen uns nichts
über vermeidlich signifikante Häufigkeitsveränderungen. So erfahren
wir im Frequenzwörterbuch von Leech et al. (2001), das auf dem
BNC basiert, dass die Type >HE< eine gerundete Häufigkeit von 16
475 (per million word tokens) für imaginative writing besitzt, jedoch
nur 4240 in informative writing. Es wird ferner ein Log-LikelihoodWert (LL) angegeben, im Falle von >HE< 260 201, der die
Signifikanz des Unterschiedes zwischen imaginative vs. informative
beschreiben hilft. Für die Type >HE< als Beispiel bedeutet das, dass
sie eine höhere Häufigkeit im Bereich imaginative writing erreicht.
In unseren drei Korpora (K1: 7390; K2: 7612; K3: 5849 st. Wert)
liegt der Wert für diese Type deutlich niedriger als für imaginative
writing bei Leech et al. Er ist dennoch in allen drei Fällen höher als
der Standardwert für informative writing. Das kann als Beleg für
eine Boulevardisierung gewertet werden.
98
6.1.4 Die alphabetischen Listen und Hapax Legomena
Betrachten wir die von Wordsmith mit Hilfe des Tools „Wordlist“
erstellten alphabetischen Listen, lässt sich erkennen, dass sie deutlich
einem Wörterbuch oder Dictionary ähneln. Die Begriffe bzw. Typen
sind von A bis Z aufgeführt. Doch anders als bei Lexika enthält die
Wortliste keine Übersetzungen oder Worterklärungen, sondern den
Rangplatz in der Liste, die Anzahl der Token pro Wort und die daraus
resultierende Prozentzahl, sofern diese mindestens 0,01 % beträgt.
Jedoch sind bei aus Korpusanalysen gewonnenen Listen aus
Zeitungsartikeln sind, erstens, sehr viele Namen von Personen des
politischen und gesellschaftlichen Geschehens sowie Orts- und
Landesbezeichnungen enthalten, weiter, alle Rechtschreibfehler mit
aufgelistet, die bei Zeitungen im Vergleich zur schöngeistigen
Literatur verhältnismäßig häufig vorkommen. Darüber hinaus, finden
wir in den alphabetischen Listen sehr viele Allomorphe, deklinierte
Formen von Nomen, flektierte Verbformen, Komparativ-Formen von
Adjektiven, Pluralformen, den sächsischen Genitiv, Amalgamierungen
von Hilfsverben, aber auch Akronyme und andere Sonderformen, die
für Dictionarys nicht in Frage kommen oder dort nur Einzug erhalten,
wenn sie auf die geläufige Grundform, das Lexem, reduziert sind.
Dictionarys werden nach strengen Kriterien konzipiert und viele
Wortformen sind nicht geläufig genug, um aufgenommen zu werden,
zu neu oder gehören eher in Spezialwörterbücher. KorpusanalyseProgramme sind hingegen undifferenziert und undifferenzierend, denn
sie listen alles auf, jede im Korpus vorhandene Worttype, ob sie
orthografische oder Tippfehler enthält, eine orthografische Varietät
darstellt, Begriffe aus anderen Sprachen oder seltene und einmalige
Neologismen. Zahlen werden jedoch nicht aufgelistet, es sei denn, sie
sind als Wörter ausgeschrieben.
Im Folgenden sind die ersten 25 Einträge der alphabetisch geordneten
Liste von K1 aufgeführt.
99
New Wordlist (A)
Freq.
%
N
Word
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
22.933
A
1
À
6
Á
1
A´GLEINN
4
AA
2
AA´S
1
AACHEN
2
AAMER
3
AARON
AARONOVICH 1
AARONOVITCH 1
1
AAS
2
ABACHA
2
ABAGUL
1
ABAGUL´S
36
ABANDON
48
ABANDONED
ABANDONING 13
ABANDONMENT 4
2
ABANDONS
1
ABASSAN
2
ABATING
4
ABATTOIR
1
ABATTOIRS
1
ABAYA
2,27
*
*
*
*
*
*
*
*
*
*
Tab. 15.: Die obersten 25 Einträge in der alphabetischen Liste von
K1 (Hapaxe sind mit einem Asterisk gekennzeichnet).
Werfen wir einen näheren Blick auf die Liste, die Wordsmith2.0 aus
K1 erzeugt, so erkennen wir, dass viele der Bestandteile Hapax
Legomena (Oakes 2003, S. 151) oder kurz Hapaxe sind. Das sind
Wortformen, die in einem Text oder Textkorpus nur ein einziges Mal
vorkommen. Es lässt sich erkennen, dass sich unter den Hapaxen in
erster Linie Namen von Personen und Orten befinden.
Die Originalliste von K1 ist insgesamt 35 307 Zeilen lang. Unter den
ersten 25 Typen dieser Liste befinden sich 10 Hapaxe (40 % der
Typen, aber nur 0,04 % der Token). Vermutlich befinden sich in
Zeitungstexten signifikant mehr Hapax Legomena als in anderen
Texttypen als Resultat der tagesaktuellen Berichterstattung mit vielen
singulären Ereignissen. Weitere Korpusanalysen könnten darüber
Aufschluss geben.
100
6.2 Grammatikalische Untersuchungen
In diesem Unterkapitel wurden textuelle Parameter untersucht, die
dem linguistischen Teilbereich Grammatik zuzuordnen sind. Dazu
gehören adverbiale Bestimmungen und Adverbien, die Skepsis und
Zweifel ausdrücken, Modalverben und Modaladverbien, die einen
Grad der Wahrscheinlichkeit beschreiben. Außerdem werden
„Naming“-Strategien untersucht.
6.2.1 Effects of scepticism and doubt
Es gibt eine Reihe von Adverben und adverbialen Bestimmungen,
deren Vorkommen als Indiz dafür herangezogen werden kann, ob bei
der Berichterstattung Skepsis oder Zweifel geäußert werden (Reah
1998, S.92). Dazu zählen >ALTHOUGH<, >FALSELY<,
>ACTUALLY<, >HOWEVER<, >IN FACT<, >INSTEAD< und
>IT IS DOUBTFUL<.
K1
Freq.
WORD
458
ALTHOUGH
8
FALSELY
79
ACTUALLY
517
HOWEVER
59
IN FACT
136
INSTEAD
1
IT IS DOUBTFUL
1258
∑
K2
%
0,05
0,05
0,01
-
Freq.
402
10
96
475
38
149
1170
K3
%
0,04
0,05
0,01
-
Freq.
1006
14
90
1617
94
273
10
stand. W.
503
7
45
809
47
137
5
%
0,05
0,08
0,01
-
3104
Tab. 16: Effects of scepticism and doubt
Doch eine Häufigkeitsanalyse dieser Begriffe in den drei
Hauptkorpora hat nur geringfügige Abweichungen ergeben:
Der Subordinator >ALTHOUGH< ist in K3 mit 0,05 % und 503
standardisierten Nennungen am häufigsten, am zweithäufigsten in K1
mit ebenfalls 0,05 % bei 458 Nennungen. In K2 sind es 402 Token bei
0,04 % (siehe Tab. 22, Verteilung der Subordinators). Das Adverb
101
>FALSELY< kommt insgesamt nur recht selten in den drei Korpora
vor: 96-mal in K2, 79-mal in K1 und 90-mal in K3 (stand. Wert 45).
>HOWEVER< kann sowohl Adverb als auch Konjunktion sein und
drückt einen Widerspruch in den berichteten Tatsachen aus. Diese
Type erreicht die höchste Anzahl an Token in dieser Liste. Die
meisten Nennungen sind in K3 vorzufinden: 0,08 %, 1617 Token
(stand. Wert 809). Am zweithäufigsten ist >HOWEVER< in K1
(0,05 %, 517 Nennungen). Den niedrigsten Wert erzielt K2 mit
0,05 % bei 475 Nennungen.
>IN FACT< wurde prozentual nicht erfasst, da diese Phrase aus
zwei Wörtern besteht. Wordsmith kann nur Häufigkeiten von
einzelnen Wörtern errechnen. Die Werte mussten aus den
Konkordanzlisten abgelesen werden. In K1 sind es 59 Nennungen, in
K3 94 (stand. Wert 47), für K2 liegen 38 Belege vor.
Das Adverb >INSTEAD< kommt in jedem der drei Hauptkorpora zu
0,01 % vor, in K2 sind es 149 Token, in K3 sind es 273 (stand. Wert
137), in K1 136 Token. Die Wortkette >IT IS DOUBTFUL< ist nur
in K3 (stand. Wert 5) und in K1 (eine Textstelle) vorhanden.
Die deutlichste Abweichung ist die Häufigkeit von >HOWEVER<,
die nach 1990 um gut 0,03 % gesunken ist, eine Verwendung, die
deutliche Skepsis ausdrückt.
Vergleichen wir schließlich die Summen der Häufigkeiten, so erhalten
wir den höchsten Wert für K3 mit 3104 Token (stand. Wert 1552).
Die Werte für K1 (1258) und K2 (1170) sind deutlich niedriger. Es
lässt sich deshalb festhalten, dass 1990 mehr Zweifel und Skepsis
ausgedrückt wurde als 2001, sofern wir das an den oben aufgeführten
Adverbien, Konjunktionen und adverbialen Bestimmungen erkunden
können.
6.2.2 Degree of probability
Die in der folgenden Tabelle aufgeführten Modalverben und
Modaladverbien stehen für Grade von Wahrscheinlichkeit, bzw.
Degree of Probability (Reah 1998, S.91) in den im Quoting oder
Reporting getroffenen Äußerungen, sowie in den kommentierenden
Textpassagen o.Ä.
102
K1
K2
K3
12.9.-
11.12.2001
1.6.-
11.09.2001 1.1.-
21.08.1990
Word
Freq.
%
Freq.
%
Freq.
stand. W.
%
CAN
WILL
SHALL
MAY
MUST
COULD
WOULD
SHOULD
MIGHT
1126
3825
38
915
395
1497
3036
937
413
0,11
0,38
0,09
0,04
0,15
0,3
0,09
0,04
1056
3679
38
930
391
1479
2946
805
342
0,1
0,36
0,09
0,04
0,15
0,29
0,08
0,03
1963
7311
65
1890
849
3006
6668
2123
894
982
3656
33
945
425
1503
3334
1062
447
0,1
0,36
0,09
0,04
0,15
0,33
0,11
0,04
POSSIBLY
LIKELY
71
359
0,04
62
377
0,04
142
759
71
380
0,04
∑
12612
12105
25670 12838
Tab. 17.: Degree of probability (anhand von Modalverben und
-adverbien)
Wie wir der Tabelle entnehmen können, stechen nur recht wenige
Werte hervor: >CAN< (0,11 %) und >WILL< (0,38 %) sind in K1
am stärksten vertreten. Das Hilfsverb >WILL< ist zugleich das
insgesamt häufigste Element der oben aufgeführten Kategorien. Die
jeweiligen Werte liegen nahe beieinander. >MAY< ist mit 0,09 % bei
1890 Nennungen (stand. Wert 945) in K3 am stärksten vertreten,
ebenso wie >MUST< mit 0,04 % (424 standardisierte Nennungen).
Auch >COULD< ist in K3 am häufigsten (0,15 %; 1503 stand.
Nennungen).
Ferner ist für >WOULD< in K3 der größte Anteil vertreten (0,33 %;
3334 stand. Nennungen), dieses ist zugleich die zweitgrößte
Kategorien. Auch >SHOULD< ist in K3 im Vergleich am häufigsten
(0,11 %; 1062 stand. Nennungen). Das Gleiche gilt für >MIGHT<
mit 0,04 % bei 447 stand. Nennungen. Der Wert von >SHALL< ist
mit einem Range von 32 (stand. Nennungen in K3) bis 38 (je in K1
und K2) sehr gering, deshalb werden die Werte prozentual nicht
erfasst. Das Gleiche gilt für das erste der beiden Modaladverbien:
>POSSIBLY< ist mit einem Range von 62 (K2) bis 71 in K1 und K3
(bei einem Gesamtwert von 142 in K3) sehr selten enthalten. Anders
103
ist es mit >LIKELY< bei einem Range von 359 (K1) bis 379 (K3,
orig. Wert 759) ist es mit 0,04 % in K3 am stärksten präsent.
Die beiden Hilfsverben >CAN< und >WILL< stehen für klare
Aussagen, es ist nicht verwunderlich, dass gerade nach dem 11.
September diese beiden Formen vergleichsweise häufiger verwendet
werden, als in den anderen beiden Untersuchungszeiträumen, denn es
ging schließlich in dem Chaos der Wochen und Monate nach den
Terroranschlägen darum, klare Stellung zu beziehen, das weitere
Prozedere zu erklären und gegen die Niedergeschlagenheit anzugehen.
Für das Gros der restlichen Modalverben und die beiden
Modaladverbien sind in K3 die Verteilungsgipfel zu finden. Diese
Wahrscheinlichkeitsformen stehen auch für sprachliche Kreativität.
Sie haben rein psychologisch die Funktion, beim Beschreiben von
Sachverhalten zu helfen. Diese Verwendung ist in 2001 seltener
geworden. Für K3 erhalten wir eine Summe von 25 670 Token (stand.
Wert 12 835). Am geringsten ist der Wert für diese Kategorie in K2
mit 12 105. In K1 ist die Gesamttokenzahl wieder etwas größer
(12 612). Dennoch liegen die drei Werte relativ dicht beieinander.
6.2.3 Naming als Indikator für Boulevardisierung
„Naming“-Strategien, bzw. die Verwendungen von Namen innerhalb
von Pressetexten ist ein ausgezeichneter Indikator dafür, wie mit
Personen in der Presse umgegangen wird (Reah 1998, S.55 ff.).
Halliday differenziert in proper names (names of individual
participants), common nouns (names of classes of participants) und
personal pronouns (Halliday 2004, S.178 u. 325).
Die Analyse des „Naming“ kann darüber Aufschluss geben, ob
bestimmte Personen durch die Berichterstattung in den Vordergrund
gehoben werden, oder gar Personenkult betrieben wird. Wenn
außerdem Personen mit ihren unterschiedlichen Bezeichnungen (z.B.:
>PRESIDENT<, >MR BUSH<, >GEORGE BUSH<, >GEORGE
W. BUSH<, etc.) gegenüber Sachthemen immer stärker in den
Vordergrund treten, so kann dieses als Indiz für eine zunehmende
Boulevardisierung gelten.
In der folgenden Tabelle sind für die drei Hauptkorpora die jeweils
zwölf häufigsten Namen, Gruppen- und Personenbezeichnungen
104
aufgeführt. Personalpronomina wurden dabei außer Acht gelassen,
ebenso die Synonyme. Die Namen bzw. Bezeichnungen sind den
Frequenzlisten entnommen. N steht für den Rang innerhalb der
jeweiligen Liste.
K1 (12.9.-11.12.01)
K2 (1.6.-11.9.01)
K3 (1.1.-
1.8.90)
N
WORD
Freq
%
N
WORD
Freq
%
N
WORD
Freq
st.W. %
25
MR
4541
0,45
24
MR
4621
0,46
13
MR
13581
6791
0,67
51
PEOPLE
1936
0,19
54
POLICE
1854
0,18
44
GOVERNMENT 4168
2084
0,21
67
GOVERNMENT 1529
0,15
58
PEOPLE
1806
0,18
64
PEOPLE
3020
1560
0,15
78
POLICE
1224
0,12
70
PARTY
1386
0,14
74
PRESIDENT
2447
1224
0,12
94
BIN
949
0,09
73
LABOUR
1306
0,13
78
PARTY
2349
1175
0,12
95
MINISTER
947
0,09
74
GOVERNMENT 1262
0,12
79
POLICE
2348
1174
0,12
111
PARTY
800
0,08
113 MINISTER
787
0,08
91
MINISTER
1994
997
0,1
115
SECRETARY
775
0,08
126 TORY
703
0,07
113 LABOUR
1568
784
0,08
117
TALEBAN
759
0,08
131 FAMILY
687
0,07
114 COUNCIL
1544
772
0,08
118
LADEN
758
0,08
135 CHILDREN
660
0,07
121 SECRETARY
1436
718
0,07
120
CHILDREN
739
0,07
137 MAN
654
0,06
128 MRS
1391
696
0,07
121
FORCES
739
0,07
138 BLAIR
652
0,06
172 MEMBERS
1089
545
0,05
∑
16378
∑
36935
∑
15696
Tab.
18:
Die
häufigsten
Namen,
Personenbezeichnungen in K1, K2 und K3
Gruppen-
und
Diesmal werden nur die Prozentwerte miteinander verglichen, da jede
untersuchte Kategorie prozentual erfasst werden konnte. Das
herausragende Ergebnis bei der Auswertung ist die Tatsache, dass die
Form >MR< gegenüber K3 eine starke Veränderung durchlaufen hat.
Während >MR< in K3 noch 0,67 % aller Token ausmacht, sind es in
K2 nur 0,46 %, in K1 sogar 0,45 %.
Unter den ersten zwölf Namensverwendungen in K1 sind vier
vorhanden, die in den beiden Zwölfertabellen von K2 und K3 nicht zu
finden sind: >BIN< (0,09 %), >TALEBAN< (0,08 %), >LADEN<
(0,08 %) und >FORCES< (0,07 %). Das kann als Indiz dafür
gewertet werden, dass ein neues Feindbild aufgebaut werden sollte
(siehe 5.5). Die ausschließlich unter den zwölf obersten Einträgen
von K2 zu findenden Namensverwendungen sind >TORY< (0,07 %),
>FAMILY< (0,07 %), >MAN< (0,06 %) und >BLAIR< (0,06 %).
Ausschließlich in der Zwölferstaffel von K3 enthalten sind
105
>PRESIDENT< (0,12 %), >COUNCIL< (0,08 %), >MRS< (0,07 %)
und >MEMBERS< (0,05 %).
Die Nennung von >GOVERNMENT< hat gegenüber 1990 (0,21 %)
in K2 (0,12 %) und K1 (0,15 %) stark eingebüßt. Die Personengruppe
der Polizisten (>POLICE<) ist in K2 mit 0,18 % vergleichsweise
stark vertreten gegenüber jeweils 0,12 % in K1 und K3. In K2 kommt
>POLICE< noch vor anderen Common Nouns wie >FAMILY<
(0,07 %), >CHILDREN< (0,07 %) und >MAN< (0,06 %). Es ist
verwunderlich, dass >PEOPLE< in K3 nur 0,15 % einnimmt, in K2
sind es 0,18 % und in K1 sogar 0,19 %.
Ebenso bemerkenswert ist, dass der Wert von >MRS< in den
Zwölferstaffeln von 2001 nicht zu finden ist, jedoch mit 0,07 % in der
Liste K3. Das liegt zum überwiegenden Teil an den Berichten über
Margaret Thatcher, die in rund 80 % der Nennungen (insg. 742 in
K3) die Anrede >MRS< erhält.13
Vergleichen wir die Spaltensummen, so stellen wir fest, dass K3 mit
36 935 (stand. Wert 18 468) die höchsten Werte erreicht. Darauf folgt
der Wert von K2 mit 16 378 Token und schließlich der von K1 mit
15 696. Dennoch reichen die gewonnenen Werte nicht aus, um zu
entscheiden, ob in den untersuchten Zeiträumen eine
Boulevardisierung stattgefunden hat. Die Daten weisen laut
Spaltensummen einen entgegengesetzten Trend auf (zur
Schlüsselwortfunktion von Pronomina, siehe Punkt 6.4.3.3).
Um zu überprüfen, wie gravierend die Veränderungen beim
„Naming“ zwischen 1990 und 2001 waren, wurde für die Anreden
>MR< und >MRS< bzw. >MS< ein 4-Felder-χ²-Test durchgeführt.
1990
Mr
Mrs/Ms
Summe
13581
1709
15290
a
2001
9162
1668
c
Summe
22743
b
10830
d
3377
26120
Abb. 5: 4-Felder-χ²-Test >MR< und >MRS</ >MS< 1990/ 2001
13
Margaret Thatcher erklärte am 22. November 1990 ihren Rücktritt vom Amt der Premierministerin. Das
zeitliche Range von K3 reicht vom 1.1.1990 bis zum 21.8.1990.
106
Die zu überprüfende Hypothese lautet, dass die Verwendung der
männlichen und weiblichen Anreden in den Zeitungen 1990 und 2001
gleichstark vertreten sind. Dabei wurde die folgende Formel
angewendet:
χ² =
n × (ad - bc)²
= 100,50
(a+b) × (c+d) × (a+c) × (b+d)
(mit df = 1 Freiheitsgrad; siehe: Bortz 2005, S. 169).
Die Tabelle für χ²-Tests (Bortz 2005, S. 817/18) für einen zweiseitigen
Test (df=1; α = 0.001; χ²crit = 10,828) weist als oberen Grenzwert
10,828 auf. Daraus ergibt sich ein sehr signifikanter Wert. Die
eingangs aufgestellte Hypothese muss deshalb verworfen werden. Die
männlichen und weiblichen Anreden sind in 1990 und 2001 in den
analysierten Pressekorpora nicht gleich verteilt. Die größte
Abweichung stellt der Wert für die männliche Anrede >MR< 1990
mit 13 581 Nennungen dar.
Dieselbe Hypothese können wir auf K1 und K2 anwenden, dass die
männlichen und weiblichen Artikel in den Presse-Texten vor dem 11.
September und denen danach gleich verteilt sind. Daraus ergab sich
das folgende 4-Felder-χ²-Schema:
K2
Mr
Mrs/Ms
Summe
4621
947
5568
a
K1
4541
721
c
Summe
9162
b
5262
d
1668
10830
Abb. 6: 4-Felder-χ²-Test für >MR< und >MRS</ >MS< in K2 und
K1
107
Nach Anwendung der Formel (s.o.) erhalten wir χ²= 22,69. Es wurde
dasselbe Prüfniveau veranschlagt wie im Test zuvor (df=1; α = 0.001;
χ²crit = 10,828). Nach Einsicht in Tabelle C wurde das Ergebnis als
sehr signifikant bewertet, d.h.: die männlichen und weiblichen
Anreden sind in K1 und K2 nicht gleich verteilt. Besonders
hervorstechend ist der sehr niedrige Wert für die weiblichen Formen
>MRS< und >MS< nach dem 11. September mit 279 Nennungen.
Zusammenfassend lässt sich sagen, dass Namen mehr und mehr ohne
>MR<, >MRS< bzw. >MS< verwendet werden, trotz des Maximums
für >MRS< während der Thatcher-Ära ab.
Auch dass die Token >MRS< und >SHE< (siehe 6.4.3.3) eine
gegenläufige Entwicklung in ihren Häufigkeiten durchlaufen haben,
kann nur mit dem nahezu protokollarischen Verwenden der
Anredeformel >MRS (MARGARET) THATCHER< in 1990 erklärt
werden.
6.3 Untersuchungen an der Syntax
Im folgenden Kapitel sind Untersuchungen auf Basis der von
Wordsmith
ermittelten
Satzlängen
durchgeführt
worden.
Ausgewählte Kollokationen und Konkordanzen sind aufgeführt und
anhand von Beispielsätzen illustriert.
6.3.1 Vergleich der durchschnittlichen Satzlängen in den
Untersuchungszeiträumen
Bignell (1997, S. 94) nennt in seinem Buch „Media Semiotics“ die
Faustregel, dass Qualitätszeitungen generell längere Sätze verwenden
als Boulevardzeitungen. Außerdem finden wir in Qualitätszeitungen
keine Parasprache, keine unvollständigen Sätze, keine
Rechtschreibfehler, keine Puns bzw. Wortspiele in Überschriften u.Ä.
Wie bereits in Tabelle 13 dargestellt, zählt Wordsmith für K1 und
K2 zusammen 72 732 Sätze bei circa zwei Millionen Wörtern (33 981
(K1) + 38 751 (K2)). Für K3 werden hingegen 43 364 Sätze bei zwei
Millionen Wörtern ermittelt. Ferner wurde eine durchschnittliche
108
Satzlänge von 22,34 Wörtern für K1 ermittelt und 21,85 für K2.
Demgegenüber finden sich im Durchschnitt 40,69 Wörter pro Satz in
K3. Die Streuung in der Wortmenge pro Satz für K1 beträgt laut
Wordsmith 13,59, für K2 11,43, für K3 38,25. Die Werte für die
durchschnittliche Satzlänge sind im Folgenden in einem
Balkendiagramm dargestellt:
Anz. der Wörter
durchschn. Satzlänge
45
40
35
30
25
20
15
10
5
0
40,69
22,34
21,85
durchschn. Satzlänge
K1
K2
K3
Korpus
Grafik 5: Durchschnittliche Satzlängen in den Hauptkorpora
(Excel-Grafik)
Diese Werte wurden überprüft, indem das Produkt aus Anzahl der
Sätze und durchschnittlicher Satzlänge gebildet wurde, das der
tatsächlichen Korpusgröße in Anzahl der Wörter entsprechen muss.
Dabei wurden starke Diskrepanzen festgestellt.
N Sentences Sentence length Sd. Sentence
(A)
(B)
length
AxB
K1
33.981
22,34
13,59
759135
K2
38.751
21,85
11,43
846709
K3
43.364
40,69
38,25
1764481
∑
116096
3370326
Tab. 19: Produkt aus Anzahl der Sätze und Satzlänge
Das Produkt aus Anzahl der Sätze und durchschnittliche Wortmenge
pro Satz in K3 ergibt 1 764 481 Wörter, hätte jedoch 2 021 045
109
Wörter ergeben müssen (siehe Tab. 13). Für K2 ergibt sich die Zahl
846 709 Wörter, es hätten sich 1 010 073 Wörter ergeben müssen. Für
K1 sind es 759 135 Wörter statt 1 010 191 Wörter. Deshalb sollte
Grafik 5 nur unter Vorbehalt betrachtet werden. Wir können den
Werten vorerst nur eine Tendenz entnehmen.
Um die Ergebnisse der Auszählung der Satzlängen zu überprüfen,
wurden den Hauptkorpora Stichproben in der Größe von dreimal 45
Artikeln entnommen, deren Satzlängen einmal per Hand und einmal
von Wordsmith durchgezählt wurden. Tendenziell wurden die
Ergebnisse der Wordsmith-Statistik aus Tabelle 13 bestätigt. Die
totalen Werte in der Stichprobe liegen jedoch näher beieinander als
bei der Wordsmithzählung.
Die Tendenz sowohl der Auszählung für die drei Hauptkorpora als
auch für die neun Subkorpora und der selbst durchgezählten
Stichproben geht eindeutig in die Richtung, dass die längsten Sätze in
K3 zu finden sind, deutlich kürzere Sätze in K2 und K1, wobei der
Wert für K1 geringfügig höher liegt als der für K2.
In einem weiteren Schritt wurde die Satz-Statistik für die neun
Subkorpora erstellt. Daraus resultiert die folgende Tabelle:
N Sentences Sentence sd. Sentence
(A)
length (B) length
AxB
K1
Independent.2001.danach 6849
36,21
35,25
248002
Guardian.2001.danach
8458
28,82
29,17
243759
Times.2001.danach
17880
27,65
24,72
494382
K2
Times.2001.davor
21568
23,23
13,98
501024
Independent.2001.davor
5991
41,27
41,67
247248
Guardian.2001.davor
10673
23,11
13,34
246653
K3
Independent.1990
11731
42,52
40,49
498802
Times.1990
18749
53,72
60,2
1007196
Guardian.1990
12565
39,84
39,97
500589
∑
114464
3987655
Tab. 20: Satzmenge und Satzlänge in den neun Subkorpora
110
In dieser Tabelle entspricht das Produkt aus Satzlänge und -menge
(A x B) mit geringen Schwankungen den in Tab. 13 festgehaltenen
Werten.14
Die Tabelle zeigt außerdem, dass sich die längsten Sätze in den drei
Subkorpora von 1990 befinden. Den höchsten Wert insgesamt erzielt
Times.1990 mit einer durchschnittlichen Satzlänge von 53,72 Wörtern
pro Satz. Den absolut geringsten Wert erzielt Guardian.2001.davor
mit nur 23,11 Wörtern pro Satz.
In Kennedy 1998 (S.157/58) finden wir einen Hinweis, dass die
Anzahl der Wörter pro Satz in „informative prose“ deutlich länger ist
als in „imaginative prose“. Für Presse-Reportagen nennt Kennedy
einen Richtwert von 20,72 Wörtern/ Satz. Dieser Kategorie von
Kennedy kommt das Subkorpus Guardian.2001.davor am nächsten.
In den drei Subkorpora von K2 gibt es eine deutliche Abweichung,
das sind die durchschnittlich 41,27 Wörter pro Satz in
Independent.2001.davor gegenüber 23,11 (Guardian.2001.davor)
und 23,23 (Times.2001.davor). In den Erhebungszeitraum des
Independent-Subkorpus fällt unter anderem die Berichterstattung
über den Milošević -Prozess.
Die Korpora, die in War on terror und Kuwait-Krise fallen - das ist
als Fazit hier festzuhalten - beinhalten verhältnismäßig lange Sätze.
Die Subkorpora von K2 hingegen haben deutlich kürzere Sätze mit
der Ausnahme des besagten Subkorpus mit Berichten über den
Milošević-Prozess.
Das
folgende
Histogramm
zeigt
die
durchschnittliche Satzlänge in den neun Subkorpora.
14
Wir können daraus schließen, dass Wordsmith bereits ab einer Korpusgröße von 1 Mio Wörtern für die
Anzahl der Wörter pro Satz keine exakten Werte mehr liefert, dieses jedoch für eine Korpusgröße von 0,5 Mio
Wörtern leistet.
111
nd
en
t.2
G
ua
00
rd
1.
ia
da
n.
na
20
ch
Ti
01
m
.d
es
an
.2
ac
00
h
Ti
1.
da
m
In
e
de
na
pe s.2
c
0
nd
01 h
en
.
t.2 dav
G
ua
or
00
rd
1.
ia
da
n.
vo
20
r
In
01
de
.
d
pe
av
nd
or
en
t.1
99
Ti
0
m
es
G
.1
ua
99
rd
0
ia
n.
19
90
In
de
pe
Durchschn. Wörter/ Satz
60
50
40
30
20
10
0
Subkorpora
Grafik 6: Durchschnittliche Satzlängen in den Subkorpora
Es ist nicht auszuschließen, dass die folgende Faktoren zu den
Diskrepanzen bei der Ermittlung der Satzlängen beigetragen haben:
Die Zeilenlänge in den verwendeten Datenspeichern (CD-Rom,
Electronic Database, Online-Zeitungen) war nicht einheitlich, ebenso
wie das Setzen der Satzzeichen, sowie Abgrenzung von Überschriften,
Absätzen und Paragrafen mit Hilfe von Leerstellen und Leerzeilen.
Die von Wordsmith2.0 ermittelten Ergebnisse wurden später von der
Software Wordsmith3.0 überprüft, die exakt dieselben Daten lieferte.
Wir wissen von der funktionalen Grammatik, dass ’verbal’ clauses
eine wichtige Rolle bei der Zeitungsberichterstattung spielen
(Halliday 2004, S. 174). Das so genannte Reporting und Quoting
sind speziell im Register der Pressesprache allgegenwärtig, und häufig
ist das Reporting dem Quoting vorangestellt (Halliday, S. 462).
In der Zeit nach den Terroranschlägen wurden unzählige Reden von
ranghöchsten Politikern gehalten und in den Zeitungen
wiedergegeben, insbesondere von George Bush und Tony Blair. Das
Korpus K1 beinhaltet deshalb sehr viele Zitate, deutlich mehr als die
anderen beiden Korpora, was stichprobenhaft anhand der
Korpusbestandteile und der Konkordanzlisten überprüft wurde.
Nach dem 11. September waren die vorrangigen Themen West vs.
Islam, Islam vs. Christianity, Verfahrensweise mit der Al-Qaeda,
etc. Und es waren in erster Linie die Politikerreden, die das
112
ideologische und pragmatische Fundament für die Berichterstattung
boten; die spiegelt sich im Quoting und Reporting wider.
Um die gravierenden Unterschiede bei den von Wordsmith
ermittelten durchschnittlichen Satzlängen zu analysieren, wurde der
Versuch unternommen, die Verteilung der nebenordnenden bzw.
parataktischen
Konjunktionen
(Coordinators)
und
der
unterordnenden bzw. hypotaktischen Konjunktionen (Subordinators)
zu überprüfen. Zunächst die Auflistung der Coordinators:
K1
K2
12.09.200111.12.2001
K3
01.06.200111.09.2001
01.01.199021.08.1990
Nr.
1.
2.
3.
4.
5.
6.
7.
8.
WORD (Coordinator)
AND
BUT
EITHER
NEITHER
NOR
OR
SO
THEN
Freq.
21823
4347
125
76
109
2019
1250
660
%
2,16
0,43
0,01
0,01
0,2
0,12
0,07
Freq.
21404
4101
141
63
73
1944
1113
693
%
2,12
0,41
0,01
0,19
0,11
0,07
Freq.
42799
7311
297
130
193
3722
1873
1104
stand. Wert
21400
3656
149
65
97
1861
937
552
%
2,12
0,36
0,01
0,18
0,09
0,05
9.
YET
344
0,03
225
0,02
528
264
0,03
30753
3,03
29757
2,93
57957
28981
2,84
Σ
Tab. 21: Verteilung der Coordinators in den drei Hauptkorpora
Für die Verteilung der Coordinators >AND<, >BUT<, >EITHER<,
>NEITHER<, >NOR<, >OR<, >SO<, >THEN< und >YET< (siehe:
Halliday 2004, S.81) zeigt sich das folgende Bild: den höchsten Wert
erzielt das Korpus K1 mit 30 753 Formen. In K2 sind es 29 757 und
in K3 nur 57 957 (stand. Wert 28 981). Das weist auf einen
Widerspruch hin, denn in sehr langen Sätzen wie in K3 sind deutlich
mehr Konjunktionen zu erwarten als in kurzen. Es wurde vorab
vermutet, dass die vermehrte Anwendung dieser Funktionswörter
Sätze eher strecken, als dass sie diese verkürzen.
Um zu überprüfen, wie signifikant die Veränderungen bei der
Verwendung der Coordinators von K2 zu K1 ist, wurde ein χ²-Test
durchgeführt. Dabei wurde der Wert von K2 als Basiswert verwendet.
Es wurde davon ausgegangen, dass die erwartete Häufigkeit der
Coordinators in K1 genauso ist wie in K2.
113
Laut Bortz (2005, S.156) errechnet sich die erwartete Häufigkeit aus
den beobachteten Häufigkeiten:
f e (1) = f e (2) =
f b(1) + f b(2)
2
= 30753 + 29757
2
=
30255 ;
Für die beobachteten Häufigkeiten (f b) wurden die Spaltensummen
für K1 und K2 eingefügt. In einem weiteren Schritt kann die
χ²-Technik angewendet werden (Bortz 2005, S.163):
2
χ²emp.
=
Σ
j=1
(f b(j) – fe(j))²
f e (j)
16,39
=
Aus der Anzahl der Spalten und Zeilen wurden gemäß Oakes (2003,
S.42)
df=(9-1) ·(2-1) = 8 Freiheitsgrade
errechnet.
In der Tabelle C für den χ²-Test (Bortz 2005, S.817/18) finden wir den
Wert 15,51 als obere Grenze für nicht-signifikante Ergebnisse (auf
einem 5%-Niveau). Damit ist das hier gefundene Ergebnis signifikant,
d.h. es ist zu einer signifikanten Veränderung bei der Verwendung der
Coordinators von K2 (vor 9/11) zu K1 (nach 9/11) gekommen.
Die folgende Tabelle zeigt die Verteilung der Subordinators (siehe:
Halliday 2004, S.81) in den drei Hauptkorpora:
114
K1
K2
12.09.200111.12.2001
Nr.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
WORD
Freq.
2371
AFTER
458
ALTHOUGH
8
ASSUMING (THAT)
1065
BECAUSE
1082
BEFORE
EVEN IF*
GIVEN THAT*
1638
IF
25
IN CASE
43
IN ORDER TO
IN SPITE OF THE FACT (THAT) 1
19
IN THE EVENT (THAT)
3
PROVIDED THAT
SEEING THAT*
793
SINCE
SO THAT*
SUPPOSING THAT*
11410
THAT
89
UNLESS
396
UNTIL
1918
WHEN
399
WHETHER
620
WHILE
01.01.199021.08.1990
%
0,23
0,05
0,11
0,11
Freq.
2662
402
3
1147
1060
%
0,26
0,04
0,11
0,1
Freq.
3983
1006
24
1829
1787
stand. Wert %
1992
0,2
503
0,05
12
915
0,09
894
0,09
0,16
-
1668
15
35
1
11
2
0,17
-
3162
30
118
64
7
1581
15
59
32
4
0,16
-
0,08
690
0,07
1520
760
0,08
1,27
0,04
0,19
0,04
0,06
10413
90
401
2042
345
718
1,17
0,04
0,2
0,03
0,07
20179
217
794
3206
799
1310
10090
109
397
1603
400
655
1,06
0,01
0,04
0,16
0,04
0,06
26505
13254
14832
Σ
K3
01.06.200111.09.2001
14009
Tab. 22: Verteilung der Subordinators in den Hauptkorpora
(Mit * gekennzeichnete Subordinators sind bereits an anderer Stelle mitgezählt (IF, THAT).
Die Konkordanzlisten wurden für >THAT< stichprobenhaft überprüft, so dass ausschließlich
die Subordinators berücksichtigt wurden.)
Wir sind erneut mit dem Widerspruch konfrontiert, dass trotz deutlich
längerer Sätze im Korpus von 1990 die Anzahl der Subordinators dort
geringer ist. Die Spaltensummen zeigen, dass die meisten
Subordinators in K1 enthalten sind (14 832). In K2 sind es 14 009 und
in K3 nur 26 505 (stand. Wert 13 254). Das belegt einen deutlichen
Zuwachs von 1990 zu 2001, und einen geringen Zuwachs von K1 zu
K2.
Auch für die Subordinators in K1 und K2 ist ein χ²-Test durchgeführt
worden:
f e (1) = f e (2) =
f b(1) + f b(2)
= 14832 + 14009
2
2
115
=
14421 ;
Für die beobachteten Häufigkeiten (f b) wurden die Spaltensummen
für K1 und K2 eingefügt. In einem weiteren Schritt kann erneut die
χ²-Technik angewendet werden:
2
χ²emp.
=
Σ
j=1
(f b(j) - fe(j))²
f e (j)
23,48 ;
=
Es wurden df=(18-1) ·(2-1) = 17 Freiheitsgrade errechnet.
In der Tabelle C für χ²-Tests (Bortz 2005, S.817/18) finden wir bei
einem 5%-Prüf-Niveau und 17 Freiheitsgraden den Wert 27,59. Im
Gegensatz zur Coordinators-Gruppe ist das Ergebnis für die
Subordinators nicht signifikant.
Deshalb sind hier zwei Faktoren zu nennen, die zu den Veränderungen
bei den durchschnittlichen Satzlängen beigetragen haben können:
erstens, dass bei den Satzkonstruktionen 1990 trotz geringerer Menge
an Konjunktionen und Aufzählpartikel längere Hauptsätze konstruiert
wurden.
Zweitens,
dass
aufgrund
der
unterschiedlichen
Urspungsmedien der Zeitungsartikel keine einheitliche Wort- und
Satzgrenzenerkennung durchgeführt wurde.
Der 11. September hingegen, der in der Zeitungssprache für
vermehrtes Quoting und Reporting sorgte, hatte nur einen relativ
geringen Einfluss auf die Länge der produzierten Sätze. Es wurden
zwar die meisten Konjunktionen insgesamt verwendet, die Sätze
waren jedoch nicht annähernd so lang wie 1990.
6.3.2 Ausgewählte Konkordanzen
Im Folgenden Unterkapitel sind Konkordanzlisten zu den
Suchwörtern >ISLAM< und >ARABIC< aufgeführt. In einem
weiteren Schritt sind Konkordanzen aus den Wortgruppen
„Arabisch“ und „islamische Welt“ mit einem der Kontextwörter aus
der Wortgruppe „Terror“ verknüpft, um zu erkunden, ob eine der
beiden Gruppen häufiger mit dem Themenkreis Terror korreliert. Die
Befunde sind anhand von vollständigen Sätzen illustriert (siehe auch:
syntaktische Ambiguität, Kap. 6.4.1)
116
6.3.2.1 Die Konkordanzliste zu >Islam< in K1
Zur Debatte steht im Folgenden die Konkordanzliste zu >ISLAM<.
Das Wort ist klar definiert
(OED, Band VIII.: a. The religious system of Muhammed,
Muhammadanism; the body of Muslims, the Muslim world. B. An
orthodox Muslim. Obs.)
In K1 finden wir 115 Konkordanzen zu >Islam<. Hier ein Auszug mit
den 40 ersten Einträgen der Liste:
N Concordance
is not a sect but a way of looking at Islam. It is found mainly in areas of
1
g a retired Pakistani officer named Islam Khan. Captain Rasul, who di
2
inalising a famous author who calls Islam a hateful religion on televisi
3
waging a war against terrorists, not Islam; that American supported the
4
a conflict between Christianity and Islam," he said. The Muslim Coun
5
n or a society, at all well; I doubt if Islam has understood the West mu
6
An extreme Salafi interpretation of Islam, according to a source close t
7
vert to an ancient and "pure" form of Islam. Although most are ultra-cons
8
Bat terrorism, and not an attack on Islam. "Those who try to portray th
9
10 s," and "offer Iran's interpretation of Islam to the world", it was announc
11 Lim College and one-time adviser on Islam to Prince Charles, challenge
hey are terrorists pure and simple. Islam is a peaceful and tolerant reli
12
Sees itself as a spiritual leader in Islam and a model Muslim nation
13
ss,
the attitude of the West towards Islam needs to be one of understa
14
15 back from a confrontation between Islam and the west. But after dispi
le between modernity and militant Islam" being waged across the Mid
16
s not a battle between the west and Islam, he argued. King Abdullah s
17
accurate."
Extremist view of Islam unites terror suspects Salaf
18
19 nt bombardment of Kabul on Friday, Islam's holy day.
20 breeding-grounds for radical, violent Islam, there are more complex legal
21 breeding-grounds for radical, violent Islam, there are more complex legal
22 ounis Khalis' brigade of the Hizb al Islam (the Islamic Party), he was w
23 Ited the world's largest, Indonesia) Islam diminishes the individual. It di
tement condemning the terrorism. Islam is a religion of peace and I d
24
d concerning the spread of radical Islam from the Taleban, the weapon
25
e conflict becoming a war between Islam and the West. As Mr Blair
26
27 contradicting the sublime values of Islam, a religion of peace," it said.
28 1 "to convey the eternal message of Islam to the entire world". Investig
Two cousins, Javed Lodi, 27, and Islam Deim, 28, intended to follow h
29
Ction
between terrorism and political Islam . . . we demand a distinctio
30
Est not to engage in a war against Islam, saying: "We must not let wh
31
Be erased. A literal interpretation of Islam, which laid down that a man's
32
33 ", evoking a religious clash between Islam and Christianity. Last week I
117
Word
No.
File
537.662 e:\k1.txt
180.585 e:\k1.txt
327.784 e:\k1.txt
350.801 e:\k1.txt
591.799 e:\k1.txt
255.594 e:\k1.txt
536.709 e:\k1.txt
536.765 e:\k1.txt
660.258 e:\k1.txt
596.568 e:\k1.txt
601.459 e:\k1.txt
251.901 e:\k1.txt
293.283 e:\k1.txt
255.567 e:\k1.txt
648.468 e:\k1.txt
332.768 e:\k1.txt
744.640 e:\k1.txt
536.669 e:\k1.txt
442.710 e:\k1.txt
833.189 e:\k1.txt
884.258 e:\k1.txt
949.953 e:\k1.txt
328.438 e:\k1.txt
212.878 e:\k1.txt
133.019 e:\k1.txt
393.094 e:\k1.txt
660.277 e:\k1.txt
536.846 e:\k1.txt
725.137 e:\k1.txt
300.945 e:\k1.txt
117.226 e:\k1.txt
950.349 e:\k1.txt
563.246 e:\k1.txt
%
53
18
33
35
59
25
53
53
66
59
60
25
29
25
64
33
74
53
44
83
88
94
33
21
13
39
66
53
72
30
12
94
56
extremists, a malign perversion of Islam ruling by fear. America bear
34
35 Airfax, California, who converted to Islam four years ago and had spent
36 as flouting the religious tolerance of Islam by Barry Malik, a local magi
37 West's foreign policy in relation to Islam. "There is no distinction bet
38 im. God is great, may pride be with Islam. May peace and God's merc
39 of the groups of Islam, vanguards of Islam, they destroyed America. I pr
to widen that gulf. They want to put Islam against Christian, Arab again
40
254.546 e:\k1.txt
900.090 e:\k1.txt
710.275 e:\k1.txt
300.936 e:\k1.txt
252.680 e:\k1.txt
252.228 e:\k1.txt
649.133 e:\k1.txt
25
89
71
30
25
25
65
Abb. 7: Auszug aus der 115 Einträge starken Konkordanzliste zu
>Islam< von K1
Es ist wiederholt von Krieg, Konflikt und Konfrontation die Rede:
>war between Islam and the west<, >confrontation between Islam
and the West<, >a battle between the West and Islam<, >conflict
between Islam and the West<, >the perceived West vs Islam
conflict<, >attitude of the West towards Islam<, etc.
Und es findet eine klare Schuldzuweisung statt:
“The attacks on America aimed not just to kill thousands of people
but to provoke war between the West and Islam, drive the US out of
the Middle East and destroy Israel.”
(The trouble when two priorities become three, The Times,
12.10.2001).
Doch auch der Gegensatz zwischen Christentum und Islam kommt zur
Sprache: >pitting Christianity against Islam< oder >clash between
Islam and Christianity<
In diesem Zusammenhang fällt das Wort Kreuzzug, die Reaktionen
darauf sind zurückhaltend:
“Mr Khan, whose own family originally came from Ghazni and the
Logar Valley in Afghanistan, was appalled when he heard President
Bush describe the coalition against terror as a "crusade", with all its
historic and provocative implications of pitting Christianity against
Islam.”
(Don't rush into a mistake, Imran Khan warns US, The Times,
21.9.2001).
Des Weiteren spielt die Darstellung des Islam als etwas Bedrohliches
eine ausschlaggebende Rolle:
>ultra-conservative view of Islam<, >breeding-grounds for
radical, violent Islam<, >who calls Islam a hateful
religion<,
>militant Islam<, >extremist view of Islam<, >perverse views of
Islam<,…
118
So lesen wir in K1 den Satz:
“Elsewhere, in Arab and other countries with governments that
officially support the coalition, but which are breeding-grounds for
radical, violent Islam, there are more complex legal and diplomatic
issues to be tackled.”
(War without end..., The Independent, 02. 12.2001).
Dieser Satz zeugt von dem martialischen Sprachgebrauch, der sich in
den Medien nach dem 11. September durchsetzte. Doch es gibt auch
Stellungnahmen zu dem bipolaren Konflikt mit eher moderatem Ton:
The dangers of this being seen as a true "war" of the West against
Islam, or of the rich against the poor, are apparent.
(Without the UN, we can never have a just end to the Afghan
nightmare, The Times, 13.10.2001)
und
“Those efforts had helped to clarify the west's view that the
campaign was not a battle between the west and Islam, he argued.”
(Raids go on, Blair tells Musharraf, The Guardian, 9.11.2001)
Paradoxerweise ist nicht nur von >war against America< die Rede,
sondern auch von einem Krieg gegen den Islam:
>war against Islam<, >attack on Islam<, >action against Islam<,
>at war with Islam<.
In diesem Zusammenhang finden wir in K1 die folgende Textpassage
über den Kriegsausbruch in Afghanistan:
“Obviously an attack on an Islamic country, however justified, will
raise the cry that this is an attack on Islam as an whole; that would
be an attack on a billion people stretching across the world from a
large African country such as Nigeria to a large Asian country such
as Indonesia, with large minority populations in almost every major
country except Japan.”
(For the world's sake, this had to be done, The Times, 08.10.2001).
Aber es gibt differenziertere Stimmen, die einen diplomatischen Ton
verwenden und nicht alle Anhänger dieser Religion über einen Kamm
scheren:
>promoting orthodox Islam<, >authentic Islam<, >political
Islam<, >pure form of Islam<, >a literal interpretation of Islam<,
>moderate Islam<.
Es werden wiederholt Politiker zitiert, die Schlüsselreden gehalten
haben, Auszüge von Parlamentssitzungen werden wiedergegeben:
119
“Labour would do the defining of Islam around here.”
(A chair can be a cow when Tony says it is, The Times, 04.10.2001).
Und
“The US defence secretary, Donald Rumsfeld, said there was
nothing in Islam "that
suggests that conflicts have to stop in
Ramadan”.”
(Straw softens line on bombing pause, The Guardian, 29.10.2001)
und
“In Cairo , Mr Blair said that the purpose of the terrorists was not
just to kill large numbers of innocent people but to set in train
events that would divide the Arab and Western worlds, Islam and
other faiths.”
(Blair knocked off course by Saudi Rejection, The Times,
12.10.2001).
In einigen Fällen beinhalten die Zeitungstexte Kriegsberichterstattung:
“Frightened Afghan families started fleeing their homes as the US
jets eased their constant bombardment of Kabul on Friday, Islam's
holy day.”
(US missed most Kabul targets, aid workers say, The Times,
20.10.2001)
Durch den 11. September ist die Berichterstattung über islamische
Themen vollends aus dem Ruder gelaufen. Wir stellen eine
zunehmend antipodische Konstellation zwischen dem Westen auf der
einen Seite und der islamischen Welt auf der anderen fest. Die aus der
Kollokationsliste gewonnenen Daten zeigen ganz deutlich, dass in
einigen Artikeln zurückhaltende und diplomatische Töne überwiegen,
in anderen jedoch eine konfrontationsbereite Sprache, die nicht davor
zurückschreckt, die Krise als Kampf zwischen dem Islam15 und dem
Westen, dem Islam und dem Christentum zu deklarieren.
Das Problem des Terrorismus wurde nicht richtig erkannt, das zeigen
diverse Textproben, nämlich dass es stets eine radikale Minderheit ist,
die versucht ein gesellschaftliches Gefüge zu manipulieren.
Stattdessen wird dem Wort >ISLAM< die Konnotation >TEROR<
beigelegt, wodurch gravierende Vorurteile entstehen können.
Auch wenn wir in den westlichen Medien häufig aufgebrachte
Demonstranten in den islamischen Staaten sehen, so ist doch die
15
Das Wort >ISLAM< wird sowohl für Religion als auch für den Kulturkreis verwendet. Nicht mehr
gebräuchlich hingegen ist heutzutage die Verwendung >ORIENT<.
120
überwiegende Mehrheit dort friedliebend. Die Anzahl der wirklichen
Terroristen beträgt nur den Bruchteil eines Promille. Doch gerade
diese Minderheit hat das Weltgefüge durcheinander gebracht, und
nicht die Weltreligion Islam. Das scheint in Vergessenheit geraten zu
sein, wenn von >West vs. Islam< die Rede ist.
In dem Korpus K2 wird noch sehr viel reservierter und
zurückhaltender über den Islam berichtet. Das Konfliktpotential wird
in den Texten nur angedeutet. Die Liste ist deutlich kürzer als die von
K1 oder K3 und beinhaltet nur 11 Konkordanzen:
N Concordance
Word No. File
e Romans came, the Arab forces of Islam came and then British and
1
22.261 e:\k2.txt
Britain. The head of the Nation of Islam has been excluded since 198 501.216 e:\k2.txt
2
reeing that in the higher interests of Islam it had no authority to debate 183.959 e:\k2.txt
3
s book, The Jew, the Gypsy and El Islam, was never published in full, b 175.571 e:\k2.txt
4
Muhammad, leader of the Nation of Islam, a Chicago-based militant se 501.649 e:\k2.txt
5
Nation" Tory who would embrace Islam, Hinduism, Sikhism and co 809.809 e:\k2.txt
6
support of such values. Nation of Islam members and supporters sat 501.434 e:\k2.txt
7
Eini had said: "If MPs are against Islam and the system, they are no 184.231 e:\k2.txt
8
ey for some time," he said. Noor Islam, who owns a takeaway in the 149.677 e:\k2.txt
9
10 Tives on the rival versions of political Islam that each embodies: the "ci 183.333 e:\k2.txt
Race: Nation of Islam leader in battle to overturn Bri 501.173 e:\k2.txt
11
%
2
50
18
17
50
80
50
18
15
18
50
Abb. 8: Vollständige Konkordanzliste von >Islam< aus K2
Wir finden hier Wendungen wie >the Arab forces of Islam<, >the
higher interests of Islam<, >the rival versions of political Islam<,
die Artikeln entnommen sind, die in den Monaten vor dem 11.
September 2001 geschrieben wurden, als noch niemand die
Katastrophe vermuten konnte. Beispielsweise ist insgesamt viermal
von der Partei >Nation of Islam< die Rede. Und wir finden im
Originaltext den folgenden Satz:
“The head of the Nation of Islam has been excluded since 1986
because successive home secretaries have ruled that his
inflammatory speeches could stir racial unrest.”
121
(Nation of Islam leader in battle to overturn British exclusion order,
The Independent, 13.07.2001).
Ersichtlich wird hier, dass die Auseinandersetzung mit dem Islam
etwas mit ethnischen Problemen zu tun haben kann. Nach dem 11.
September hingegen wäre die Assoziation zwischen Islam und Rasse
„Öl ins Feuer zu gießen“ gleichgekommen und kam in den
untersuchten Texten nicht vor.
Bei der Konkordanzanalyse von K3 für das Suchwort >ISLAM<
ergab sich eine 34 Einträge starke Liste, die hier vollständig
abgedruckt ist:
N Concordance
Word No. File
%
e are all soldiers for Saddam and Islam willing to fight and die.
1
2.005.855 e:\k3.txt 100
d an adventurer. He converted to Islam to marry the woman he lo 1.136.630 e:\k3.txt 56
2
minance and its brand of radical Islam. After the war, it found few 1.597.081 e:\k3.txt 79
3
s and allowing them to practise Islam. Chanting ``resign, resign'' 165.574 e:\k3.txt 8
4
rica and its puppets. Victory to Islam', read one banner. 'The hat 1.978.696 e:\k3.txt 98
5
Ah Khomeini's teachings that in Islam religion and politics are not 1.603.458 e:\k3.txt 79
6
legacy, but also the upholders of Islam and nationalism - as long 1.925.656 e:\k3.txt 95
7
defence of Mecca and Medina, Islam's holy sites, rather than in 1.880.476 e:\k3.txt 93
8
e doing protecting the keeper of Islam's most holy places? Mr Bu 1.714.220 e:\k3.txt 85
9
li army general in his war against Islam. He patronizes every crim 1.405.354 e:\k3.txt 69
10
overnment has no wish to insult Islam and it understands the nov 1.603.301 e:\k3.txt 79
11
oops in the country that contains Islam's holiest places. There is 1.855.558 e:\k3.txt 92
12
13 bul Islam Bhuiyan (Law), Mr Tajul Islam Chowdhury (Land) and Dr 1.178.824 e:\k3.txt 58
i for alleged blasphemy against Islam in the novel still stood. ` 1.073.992 e:\k3.txt 53
14
o make a pilgrimage to Mecca', Islam's most holy city. Ina said t 1.927.775 e:\k3.txt 96
15
He is a man of religion; he taught Islam,'' he says. ``He was at hi 1.336.029 e:\k3.txt 66
16
names and forbidden to practise Islam. About 300,000 Turks left t 165.684 e:\k3.txt 8
17
Tive practices of many countries. Islam often seeks to become th 1.539.478 e:\k3.txt 76
18
vember. His simple message of 'Islam is the Solution' got him ele 1.755.649 e:\k3.txt 87
19
ct in Port of Spain, the Society of Islam – have been arrested and 1.599.885 e:\k3.txt 79
20
21 ousands of people roared for Zia, Islam and victory for Islamic fo 1.971.961 e:\k3.txt 98
efender of the Faith, of keeping Islam strictly under his wing, is n 1.306.993 e:\k3.txt 65
22
of criminals working to eliminate Islam, would not budge and ligh 1.405.223 e:\k3.txt 69
23
24 problems ourselves. Our religion, Islam, does not allow us to kil 1.732.828 e:\k3.txt 86
Ople shared his commitment to Islam. Ejaz ul-Haq, the new st 1.972.253 e:\k3.txt 98
25
st recently - in the inspiration of Islam. This has led them to ques 1.713.956 e:\k3.txt 85
26
27 ve returned. Wake up, giant of Islam', said another. Hostility
1.978.710 e:\k3.txt 98
q (Commerce), Justice Habibul Islam Bhuiyan (Law), Mr Tajul Isl 1.178.819 e:\k3.txt 58
28
n solidarity under the banner of Islam and Arabism, and warned 1.625.898 e:\k3.txt 80
29
122
30
31
32
33
34
r stability and an awakening for Islam that Zia gave the country,
United States as ``the enemy of Islam''. Rarely since the death
se unaffected include Mr Anisul Islam Mahmud (Foreign) and Mr
Are flocking to join the Nation of Islam, led by the Rev Louis Farr
, which brought together the pro-Islam and anti-Bhutto lobbies in t
1.972.200
1.262.170
1.178.838
838.452
1.971.995
e:\k3.txt
e:\k3.txt
e:\k3.txt
e:\k3.txt
e:\k3.txt
98
62
58
41
98
Abb. 9: Vollständige Konkordanzliste von >Islam< aus K3
In K3 hat >Islam< häufig die positive Konnotation als eine Religion,
die von ihren Anhängern ausgeübt wird:
>allowing them to practice Islam<, >commitment to Islam<, >the
inspiration of Islam<, >contains Islam’s holiest places<.
Doch bereits 1990 wurde das negative Potential des Islam und dessen
dogmatischer Charakter thematisiert, wenn auch nicht in dem Maße
wie zehn Jahre später nach 9/11:
>its brand of radical Islam<, >Islam is the solution<, >soldiers for
Saddam and Islam<, >the enemy of Islam<. So schreibt The
Independent am 03.08.1990:
“Iraq was supplied with arms from the Soviet Union and funds by
other Gulf states which feared Iran's dominance and its brand of
radical Islam.”
(The Invasion of Kuwait: Saddam's dependence on West leaves him
exposed to embargo).
6.3.2.4 Die Konkordanzen zu >ARABIC<
Die Bedeutung von >ARABIC< ist im Oxford English Dictionary
klar definiert. Dieses Wort ist zumeist auf die Sprache bezogen:
(OED I., S.598: 1. Of or pertaining to Arabia or its language. 2. esp.
in gum arabic, which is exuded by certain species of Acacia, and
arabic acid, obtained from it. 3. absol. The language of the Arabs.)
Die vollständige Konkordanzliste zu >ARABIC< in K1:
N Concordance
Mains of a similar paper handwritten in Arabic were found in the wreckage
1
Sident Arab websites. Its message in Arabic has been placed on sites MI5
2
To increase, as attention being paid to Arabic media already has done in r
3
He can chew." He said that although Arabic script had very different char
4
123
Word
No.
164.112
519.310
559.340
96.304
File
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
%
16
52
56
10
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
ictionary allows both definitions. The Arabic, jihad, means "struggle, conte 301.478
the inter-faith service, which included Arabic prayers to commemorate the 83.847
s like hawala, common throughout the Arabic world. The system is based 647.360
Nts to visit Mr Walker, who had studied Arabic and Islam in Yemen and Pak 929.511
S the author of the document, written in Arabic, translated and published by 164.228
y pattern of flowers intertwined with the Arabic script for Allah. Appalled at s 446.516
suddenly flooding on to al-Jazeera, the Arabic TV news network. Voice of A 350.213
Nit, performed the graveside service in Arabic, and the body was placed in t 967.002
mmunity sentence because he was an Arabic speaker and might be need 548.704
med sorghum, sesame seeds and gum arabic. But others claim it was all a 834.454
ed sorghum, sesame seeds and gum arabic. But others claim it was all
885.523
aks Farsi (the main language of Iran), Arabic, and a clutch of European la 520.002
artyrdom'. The name comes from the Arabic word 'salaf', meaning forefath 537.754
failed to translate legal documents into Arabic correctly. FBI chiefs, who
496.983
ties. According to the Asharq al-Awsat Arabic daily, Tehran has asked a s 375.086
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
30
8
64
92
16
44
35
96
55
83
88
52
53
49
37
Abb. 10: Die Konkordanzen zu >ARABIC< in K1
In K1 findet sich das Wort >ARABIC< insgesamt 19-mal. In den
meisten Fällen wird das Wort als Adjektiv verwendet: >ARABIC
MEDIA<, >ARABIC SCRIPT<, >ARABIC PRAYERS<, etc. In
einigen Fällen fungiert es als Nomen:
>HANDWRITTEN IN ARABIC<, >ITS MESSAGE IN
ARABIC<, >WHO HAD STUDIED ARABIC<, etc. Mit dem Wort
>ARABIC< wird nach dem 11. September vergleichsweise
zurückhaltend und sparsam umgegangen.
Das Register der untersuchten Zeitungen nimmt in K1 partiell einen
analytischen, fast kriminalistischen Tenor an, um die Geschehnisse
aufzuarbeiten:
„Remains of a similar paper handwritten in Arabic were found in
the wreckage of Flight 93, which crashed to the ground in
Pennsylvania.“
(Terror manual for journey to paradise, The Times, 15.9.2001)
Im Presse-Korpus K2 ist die Type >ARABIC< nur viermal enthalten,
in allen vier Fällen mit der Konnotation Arabische Sprache. Dreimal
fungiert >ARABIC< als Nomen, einmal als Kompositum
(>ARABIC-SPEAKING<).
N Concordance
Word No. File
of the bomb attacks a message in Arabic was left by a local Islamic group 667.845 E:\k2.txt
1
2 mist-dominated governments in the Arabic- speaking north. The proposed 364.599 E:\k2.txt
yrian guard said only one word in Arabic: Damarit ("Destroyed"). Journalists 273.287 E:\k2.txt
3
- which ominously translates from Arabic as "the Monster's Back" - Lebane 435.543 E:\k2.txt
4
Abb. 11: Die Konkordanzen zu >ARABIC< in K2
124
%
66
36
27
43
Aber auch hier ist schon von Terror die Rede. Als Beispiel sei der
folgende Satz aufgeführt:
“At the scene of one of the bomb attacks a message in Arabic was
left by a local Islamic group claiming responsibility for the explosion
outside a bookshop used by expatriate workers.” (British trio
'tortured' into confessions, The Times, 15.08.2001).
In K3 finden wir >ARABIC< 18-mal. Wir müssen wieder
berücksichtigen, dass K3 so groß ist wie K1 und K2 zusammen. In
neun Fällen ist >ARABIC< als Nomen gebraucht und steht für die
Sprache „Arabisch.“
In den anderen neun Fällen fungiert >ARABIC< als Adjektiv, und
konnotiert auf der einen Seite die Sprache (>AN ARABIC
INSCRIPTION<), auf der anderen Seite den Kulturkreis (>GOOD
ARABIC FOOD<). Auch 1990 zeichnet sich ein Konflikt mit dem
arabischen Raum ab:
>MANY ARABIC AND ISLAMIC FORCES TO DEFEND...<.
Im Folgenden sei hier die vollständige Konkordanzliste für
>ARABIC< aus K3 aufgeführt:
N Concordance
, almost carnival scene where Hebrew, Arabic and a dozen other languages
1
en pitched alongside the small fort (in Arabic, kuwait) of a tribal chief. Fami
2
Nce. It has been printed in French and Arabic, and Turkish and English editi
3
d in the new city wall, each bearing an Arabic inscription that reads 'rebuilt d
4
waiting Galaxy. 'We ate some good Arabic food last night. Yes, we enjoye
5
Arabic press reports 'rift' over Iraq
6
Hram, headlined the 'arrival of many Arabic and Islamic forces to defend Sa
7
The ICRC said after examining the Arabic text by the Organisation of Re
8
The 76-leaf manuscript was written in Arabic and had 56 colour illustrations.
9
its mixed reactions
THERE is an Arabic saying, that a man carrying a s
10
Marvels in Arabic fetch Pounds 495,000;Saleroom
11
REPORTS published yesterday in Arabic newspapers have given a mixed
12
13 y, and pointed out that he had cost the Arabic-speaking nations more than p
The group's typewritten statement in Arabic called on ``the real kidnappers
14
15 Mbers of the pro- Iranian Ad- Dawa - Arabic for Islamic Call - an Iraqi group
987. The type-written declaration in Arabic said: ``We have decided to mov
16
17 ng to Saudi Arabia. Another London Arabic daily Al-Ahdath took a more ne
18 e was tuned into Radio Monte Carlo's Arabic service and the BBC for news.
Abb. 12: Die Konkordanzliste zu >ARABIC< in K3
Wir finden den folgenden Satz:
125
Word No. File
%
6.847
e:\k3.txt 0
1.595.640 e:\k3.txt 79
490.440 e:\k3.txt 24
1.760.400 e:\k3.txt 87
1.834.726 e:\k3.txt 91
1.654.501 e:\k3.txt 82
1.964.401 e:\k3.txt 97
1.859.010 e:\k3.txt 92
1.054.029 e:\k3.txt 52
1.791.874 e:\k3.txt 89
1.053.956 e:\k3.txt 52
1.625.595 e:\k3.txt 80
1.930.472 e:\k3.txt 96
1.136.961 e:\k3.txt 56
1.623.372 e:\k3.txt 80
876.760 e:\k3.txt 43
1.717.675 e:\k3.txt 85
1.908.927 e:\k3.txt 95
“The type-written declaration in Arabic said: “We have decided to
move the hostages affair forward by releasing an American hostage
within 48 hours. ….’ “
(US hostage `will be free by tomorrow', The Times, 19.4.1990).
Bei den drei gewählten Beispielen, die auf arabische Schriftstücke im
Zusammenhang mit Terroranschlägen verweisen, stellen wir deutlich
investigative Züge in der Zeitungsberichterstattung fest, was auch die
Aufgabe von Medien ist: Bei der Verbrechensbekämpfung
mitzuwirken und die Bevölkerung über den Stand der Ermittlungen zu
informieren.
6.3.2.5 Konkordanzen mit dem Kontextwort [>TERROR<]
Bei der Anwendung der Wordsmith-Funktion Concord können
diverse Feineinstellungen vorgenommen werden, dazu zählt die
Hinzufügung eines Kontextwortes bei der Suche nach Konkordanzen
zu bestimmten Suchwörtern.
In der folgenden Tabelle sind alle Konkordanzen aufgelistet, in denen
Begriffe der Wortgruppen „islamische Welt“ bzw. „Arabisch“ ein
Kontextwort aus der Wortgruppe „Terror“ zugeordnet wurde (zur
Einteilung der Wortgruppen siehe 6.4.5). Ziel ist es, festzustellen, ob
Begriffe wie >TERROR<, >TERRORIST< oder >TERRORISM<
häufiger mit Wörtern der Wortgruppe >ARAB<, >ARABS<,
>ARABIC< oder aber der Wortgruppe bestehend aus >ISLAM<,
>ISLAMIC<,
>ISLAMIST<,
>MUSLIM<,
>MUSLIMS<,
korrelieren. Für K1 entstanden so insgesamt 34 Konkordanzen, 29
davon aus den Wortgruppen „islamische Welt“ und „Terror“
gegenüber nur fünf aus der Verbindung „Arabisch“ und „Terror.“
Für K2 sind keine Konkordanzen aus einer der beiden Kombinationen
zu verzeichnen.
In K3 findet Wordsmith insgesamt nur drei Konkordanzen zu den
gesuchten Kombinationen, zwei davon ergeben sich aus dem
Vergleich der Wortgruppen „Arabisch“ und „Terror“ und nur eine
aus der Verbindung „islamische Welt“ mit einem Kontextwort aus
der Wortgruppe „Terror.“
126
K1
N
1
2
1
1
2
1
2
1
2
3
4
5
6
7
8
9
10
1
1
1
1
1
2
3
1
2
3
1
2
3
1
2
3
1
Concordance
MI5 posts terror appeal on Arab websites
Man's land, Arab fighters spread terror In the twilight hours of th
in the Arab- dominated al-Qa'ida terrorist network might be handed
between two loyalties in the war on terrorism. As Washington's main Arab
London that support for the war on terrorism could collapse in the Arab world
F the Islamic warlord's British terror network being realised.
he Egyptian Islamic Jihad, the terror organisation blamed for
character and past of the Islamic terrorist. There are just two types
are members of the counter-terrorist security forces fighting Islamic fanatics
creating the Afghan-based Islamic terrorist groups during the 1980s.
Egyptian with the Algerian GIA terrorist organisation, with the Islamic Jihad
to fund Osama bin Laden's Islamic terrorist network. The CIA is to de
randed Hamas and Islamic Jihad as "terrorist networks" for the first tim
Others named included well-known terrorist groups such as Egyptian
of the most dangerous and radical terrorist opponents of Israel, includin
Ush were the targets of an Islamic terrorist plot to assassinate them, fr
at he was involved with an Islamic terrorist organsiation, Markaz Dawa
bly of Muslim Youth - a suspected terrorist organisation". WAMY me
Said: "BCCI's former links to Islamist terror organisations are known to us."
Extremist view of Islam unites terror suspects Salafi Purist tea
believe that he was a new kind of terrorist, committed to Islam but
not be done at once. And if Islamist terrorism is to be thwarted in its ambit
ing of the fight back against Islamist terrorism, but the opening, as Mr Bus
on the question of depriving Islamist terrorism of funds. Of the 369 terrori
quashed. His theme is that Islamic terrorism must be thwarted in its goal
This madness. This is no longer terrorism by Islamic Jihad or Hamas.
Would seriously hamper the anti-terrorism coalition. Islamic guerrilla groups
ders of the faith. That is not true. Terrorism is forbidden by Islam; it
"There is no distinction between terrorism and political Islam . . .
clear statement condemning the terrorism. Islam is a religion of pe
Muslim community but against terrorism on a worldwide scale. It
ould not afford to stop its war on terrorism for the Muslim holy mon
r world of Muslim extremism and terrorism. But belief in a just strug
he had raised funds for terrorism and recruited British Muslims to be trained
Word No.
519.507
967.684
948.134
293.368
447.021
148.070
153.353
329.309
166.291
740.552
148.999
67.686
1.004.152
95.998
648.921
169.272
301.502
723.652
67.784
536.889
149.494
327.401
254.615
310.074
309.681
893.430
352.211
255.709
301.163
213.093
130.129
661.689
449.942
301.560
File
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
k1.txt
%
52
96
94
29
44
15
15
33
17
74
15
7
99
10
64
17
30
72
7
53
15
33
25
31
31
89
35
25
30
21
13
66
45
30
K3
1
1
1
the US presence will prompt acts of terrorism in Arab countries backing 1.730.252 k3.txt 86
Arab terrorist killed by own book bomb
452.494
k3.txt 22
spread of Islamic fundamentalism closely followed by terrorism were the
980.935
k3.txt 48
Abb. 13: Gemeinsame Konkordanzen der Wortgruppen
„islamische Welt“ bzw. „Arabisch“ mit dem Kontextwort
„Terror“ (Kombination >TERROR…< + >ARAB…< markiert)
Wordsmith listet jedoch auch Textstellen auf, bei denen sich die
beiden gesuchten Begriffe nicht in ein und demselben Satz befinden.
Im Folgenden sind vier Beispielsätze aufgeführt:
127
Im folgenden Satz aus The Independent vom 7.12.2001 kommt ein
Widersspruch zum Tragen, da nicht klar wird, dass die Taliban zum
überwiegenden Teil Afghanen sind, in Einzelfällen Pakistanis, aber
keinesfalls Araber. Es wird der Eindruck erweckt, als müssten andere
Top-Taliban-Commander an andere Länder ausgeliefert werden.
Die Wahrheit ist jedoch, dass die Verhafteten in Guantanamo Bay auf
Kuba inhaftiert und nicht an ihre Ursprungsländer überführt wurden:
“One idea floated by Mr Rumsfeld was that the top Taliban
commanders and senior figures in the Arab-dominated al-Qa'ida
terrorist network might be handed over to their own countries –
which in the case of Mullah Omar would mean him being dealt with
by the Karzai government in Kabul”
(US insists Taliban chief must be brought to justice).
Im folgenden Satz aus The Times vom 12.10.2001 wird eine
Verbindung von Religion und Terrorismus konstruiert, ohne zu
erwähnen, dass es sich bei den Terroristen um Kriminelle handelt:
“MI5 claimed that he had raised funds for terrorism and recruited
British Muslims to be trained for a holy war in Kashmir.”
(Lords support exile of cleric, The Times, 12.10.2001)
Im Rahmen der Kriegsberichterstattung während der Kuwait-Krise ist
von möglichem Terrorismus in arabischen Staaten die Rede, ohne der
Thematik einen religiösen Hintergrund beizufügen:
“The sources add that President Saddam may be hoping the US
presence will prompt acts of terrorism in Arab countries backing
Washington, putting further pressure on their leaders to accept his
annexation of Kuwait.”
(The Invasion of Kuwait: Local intelligence says 'no invasion', The
Independent, 10.8.1990)
The Times differenzierte am 24.4.1990 noch klar und deutlich
zwischen islamischen Fundamentalismus und Terrorismus:
“A poll last week among 2,439 Turks found that the rapid spread of
Islamic fundamentalism closely followed by terrorism were the two
things people feared most in their daily lives.“
(Islamic backlash pushes Turkey down violent path, The Times,
24.4.1990)
Das sind weitere Belege dafür, dass in der Presseberichterstattung
nach dem 11. September etwas aus dem Gefüge geraten ist, dass
Terrorismus als eine extreme Form von Kriminalität in vielen Fällen
128
mit Religion in Verbindung gebracht wurde. Erforderlich wäre eine
sehr viel differenziertere Darstellung der Problematik.16
6.3.3 Die häufigsten Kollokationen von >MUSLIM<, >ISLAMIC<
und >ARAB<
In einem weiteren Analyseschritt wurden für die Typen >MUSLIM<,
>ISLAMIC< und >ARAB< die häufigsten rechts- und linksseitigen
Kollokationen aus den Konkordanzlisten herausgesucht. Die drei
Wörter sind im Oxford English Dictionary definiert. >MUSLIM<
kann sowohl Nomen als auch Adjektiv sein:
(OED X., S. 134: Muslim: [a. Arab. Muslim, active pple. Of aslama,
of which the noun of action is islām: see Islam.]
A. sb. One who professes Islam; a Muhammadan; …
B. adj. A. Of or pertaining to Muslims; Muhammadan.)
>ISLAMIC< hingegen ist stets Adjektiv:
(OED VIII., S.109: Islamic…
[Of or pertaining to Islam; Muhammad, Muslim]…).
>ARAB< wird
verwendet:
sowohl
substantivisch
als
auch
adjektivisch
(OED I., S. 597: Arab …
A. sb. 1. One of the Semitic race inhabiting Saudi Arabia and
neighbouring countries. …
B. adj. 1. Of or pertaining to Arabia or the Arabs.)
Kollokationen lassen sich als Satzbestandteile begreifen, die je nach
Gliederung ein Syntagma (Verbal-, Nominalphrase) oder ein
Kompositum mit dem dazugehörigen Suchwort formieren können,
16
Mit den Werten der Konkordanzliste wurde ein 4-Felder-χ²-Test durchgeführt (a=2, b=1, c=5, d=29). Die
Daten liefern jedoch keine brauchbaren Ergebnisse, da das Testverfahren voraussetzt, dass alle erwarteten
Häufigkeiten mindestens n=5 betragen und insgesamt n=30 Fälle einbezogen werden.
129
aber auch unterschiedlichen Syntagmen eines Satzes angehören
können, da sich vor oder hinter dem Suchwort eine strukturelle
Grenze oder weitere Wörter befinden.17
Bei der Erstellung der folgenden Kollokationslisten wurde das
Superkorpus, bestehend aus K1, K2 und K3, verwendet. Das
Wordsmith-Tool „Concord“ erstellte die Konkordanzen. Alle
Zeitungsartikel befinden sich in chronologischer Reihenfolge.
Bei Bedarf wurden Konkordanzlisten für die einzelnen
Hauptkorpora K1, K2 und K3, sowie für jedes einzelne der neun
Subkorpora erstellt. Jede Konkordanz besteht aus einer Zeile als
Wortkette, die das gesuchte Wort enthält. Wordsmith nimmt keine
Rücksicht auf Satzgrenzen (siehe auch Beispiel für >PRESS< unter
Punkt 6.5.1). Um die Problematik der rechts- und linksseitigen
Kollokationen aufzudecken, wurden in den folgenden Listen
ausschließlich die unmittelbaren Kollokationen berücksichtigt und
nicht die von der Software produzierten Zeilen.
Für einige der hier aufgeführten Kollokationen existiert ein Eintrag im
Oxford Collocations Dictionary for Students. Diese Begriffe sind in
den folgenden Listen markiert.
6.3.3.1 Linksseitige Kollokationen zu >ARAB<
In der folgenden Analyse erscheinen besonders die linksseitigen
Kollokationen sehr aus dem Zusammenhang gerissen. Erneut
enthalten die durch Wordsmith erzeugten Konkordanzlisten
dermaßen viele Informationen, dass wir uns in der folgenden
Darstellung auf die obersten Einträge beschränken müssen. Die Liste
ist insgesamt 1018 Einträge lang.
17
Syntagma wird hier synonym mit dem Begriff Wortgefüge verwendet (siehe auch: Vater 1999, S.106).
130
No.
Kollokation
Freq
1
2
3
4
5
6
7
8
9
10
11
12
UNITED ARAB
OTHER ARAB
AL-ARAB
GULF(:)ARAB
PAN-ARAB
EMERGENCY ARAB
ISRAELI ARAB
MODERATE ARAB
ANY ARAB
FELLOW ARAB
ITS ARAB
TWO ARAB
45
38
25
17
14
12
12
10
8
7
7
7
Tab. 23: Linksseitige Kollokationen zu >ARAB<
Als häufigste linksseitige Kollokation für >ARAB< finden wie
>UNITED ARAB< mit 45 Nennungen im Superkorpus. Davon
fallen 7 auf K1, 4 auf K2 und 34 auf K3. Wie wir weiter unten sehen
werden, sind davon in 42 Fällen >EMIRATES< die rechtsseitigen
Kollokationen. Am zweithäufigsten ist >OTHER ARAB< mit 38
Einträgen. Textstellen mit >AL-ARAB< bringen es auf 25 Einträge
(ausschließlich in K3 vorhanden), alle entweder als Bestandteil des
geografischen Begriffes >SHATT AL-ARAB< (13-mal) oder der
Zeitung >DAILY AL-ARAB< (achtmal und viermal als
Zeitungsname ohne >DAILY<).
>GULF(:)ARAB<18 lässt sich 17-mal ausfindig machen, achtmal
davon befindet sich ein Doppelpunkt zwischen beiden Wörtern. Bis
auf eine der Nennungen befinden sich alle in K3. Die Kombination
>PAN-ARAB< ist insgesamt 14-mal enthalten, alle Einträge finden
sich in K3. >EMERGENCY ARAB< kommt 12-mal vor, alle
Textstellen liegen in K3, elfmal heißt das Wortgefüge
>EMERGENCY ARAB SUMMIT< einmal >EMERGENCY
ARAB LEAGUE SUMMIT< Ebenso häufig ist >ISRAELI ARAB<
enthalten (K1: 2; K2: 2; K3: 8, davon eine Form mit Bindestrich).
>MODERATE ARAB< ist zehnmal enthalten (K1: 7; K3: 3). >ANY
ARAB< achtmal (K1: 1; K2: 1; K3: 6). Je siebenmal sind die Formen
18
(:) bedeutet, dass z.T. ein Doppelpunkt zwischen den beiden Wörtern plaziert war. Diese Fälle kamen in
Überschriften im Independent 1990 vor, die mit Crisis in the Gulf:... eingeleitet wurden. Diese Hauptüberschrift
bzw. –schlagzeile hat die Funktion, ein Themenfeld fortzusetzen (äquivalent bei Election 2001:... in
Guardian.2001.davor oder War on terror nach 9/11 bei The Times).
131
>FELLOW ARAB< (K1: 1; K3: 6), >ITS ARAB< (K1: 2; K3: 5)
und >TWO ARAB< (alle in K3) enthalten.
Diese Liste mit linksseitigen Kollokationen ist nicht sehr
aussagekräftig, da >ARAB< in seiner Funktion als Adjektiv das
Bezugswort auf der rechten Seite trägt. Aufgrund der Kuwait-Krise
finden wir die meisten Formen in K3.
6.3.3.2 Rechtsseitige Kollokationen zu >ARAB<
Bei den rechtsseitigen Kollokationen zu >ARAB< handelt es sich um
sehr umfangreiche Gruppierungen. Die Liste ist erneut 1018 Einträge
lang.
No.
Kollokation
Freq
1
2
3
4
5
6
7
8
9
10
11
12
ARAB WORLD
ARAB STATE(S)
ARAB LEADER(S)
ARAB NATION('(S))
ARAB EMIRATES
ARAB SUMMIT
ARAB LEAGUE(‘S)
ARAB COUNTRY/ -IES
ARAB FORCE(S)
ARAB PRESS
ARAB-ISRAELI
ARAB AND MUSLIM
99
66
54
43
42
41
40
38
25
18
16
11
Tab. 24: Rechtsseitige Kollokationen zu >ARAB<
Die meisten Textstellen sind für >ARAB WORLD< vorhanden. Es
sind 99 an der Zahl. 83 davon sind in K3 zu finden, dem Korpus von
1990, was bemerkenswert ist, denn nach 9/11 war bevorzugt von
einem Konflikt des Westens mit der islamischen bzw. muslimischen
Welt die Rede (s.u.).
>ARAB STATE(S)< ist 66-mal enthalten, 53 davon befinden sich in
K3. Die Kombination >ARAB LEADER(S)< wurde 54-mal
aufgefunden, 52 der Textstellen befinden sich in K3. >ARAB
NATION(’)(S)< kommt 43-mal vor, mitgezählt sind Singular, Plural
und die Genitiv-Formen. Alle Textstellen liegen in K3. >ARAB
EMIRATES< ist 42-mal auffindbar (s.o.), 32 davon sind in K3
lokalisiert. Die Kombination >ARAB SUMMIT< kommt 41-mal vor,
alle Textstellen liegen in K3. Textstellen mit >ARAB LEAGUE(’S)<
132
sind 40-mal zu finden, bis auf eine einzige liegen diese in K3. Die
Kombination >ARAB COUNTRY/-IES< findet sich 38-mal (34
davon liegen in K3). Textstellen mit >ARAB FORCE(S)< existiert
25-mal (23 in K3). Belegstellen mit >ARAB PRESS< liegen
insgesamt 18-mal vor, 16 davon in K3. Die Kombination >ARABISRAELI< ist 16-mal vorhanden (zehnmal in K3). Und schließlich ist
>ARAB AND MUSLIM< elfmal enthalten (dreimal in K3 und
achtmal in K1).
Diese Daten lassen auf eine Veränderung in der Verwendung des
Wortes >ARAB< schließen, es scheint eine Substitution vorzuliegen.
Offensichtlich vermieden es die Zeitungen nach 9/11 >ARAB< im
Zusammenhang mit den Terroristen zu verwenden. Stattdessen wurde
der Konflikt „Islam vs. West“ heraufbeschworen (siehe Punkt 6.3.2).
6.3.3.3 Linksseitige Kollokationen zu >MUSLIM<
Laut Oxford Collocations Dictionary for Students (2003, S.515)
gelten für >MUSLIM< als häufigste Kollokationen:
Muslim (noun): ·Adj.: devout, fervent / Shia, Shiite, Sunni.
·Noun: beliefs, fait / community / extremist, fundamentalist
In der hier vorliegenden Analyse sind die häufigsten linksseitigen
Kollokationen zu >MUSLIM< primär Artikel, Konjunktionen und
Präpositionen wie >AS<, >AND<, >BY<, >IN<, >OF< und >THE<.
Diese werden in der folgenden Kollokationsliste nicht berücksichtigt,
denn hier sind statt Funktionswörter Inhaltswörter von Interesse.
No.
Kollokation
Freq
1
2
3
4
5
6
7
8
9
10
SHIA MUSLIM
ARAB AND MUSLIM
BRITISH MUSLIM
OTHER MUSLIM
EVERY MUSLIM
KASHMIRI MUSLIM
BOSNIAN MUSLIM
NON-MUSLIM
ONLY MUSLIM
MEMBER(S) OF MUSLIM
26
11
7
7
6
6
5
5
5
4
Tab. 25.: Linksseitige Kollokationen zu >MUSLIM< (Kollokationen
aus dem Oxford Collocations Dictionary sind markiert)
133
Es dominiert die substantivische Verwendung. Viele Syntagmen sind
unvollständig, da sich das Wortgefüge auf der rechten Seite des
Suchwortes fortsetzt. Speziell bei Adjektiven als Suchwort befindet
sich das Bezugswort auf der rechten Seite.
Am häufigsten ist die Kombination >SHIA MUSLIM< mit 26
Nennungen unter den linksseitigen Kollokationen der 547 Einträge
starken Liste zu finden. Das ist die Kollokation, die im Oxford
Collocations Dictionary (s.o.) als häufigstes Begleitwort genannt ist.
21 der Textstellen für >SHIA MUSLIM< liegen in K3, nur fünf
liegen in K1. Am zweithäufigsten ist >ARAB AND MUSLIM< mit
elf Nennungen vertreten (K1: 8; K3: 3). >BRITISH MUSLIM<
kommt siebenmal vor (sechsmal davon in K1). Dieser Begriff wirkt
diskriminierend. Ebenfalls sechsmal kommt >OTHER MUSLIM<
vor (K1: 6; K3: 1). Die Kombination >EVERY MUSLIM< ist
sechsmal vorhanden, fünfmal in K1 und einmal in K3 (eine der
Nennungen ist ein sächsischer Genitiv). >KASHMIRI MUSLIM< ist
ebenfalls sechsmal enthalten (ausschließlich in K3), je fünfmal ist
>BOSNIAN MUSLIM< (dreimal K1, zweimal K2), >NONMUSLIM< (dreimal K1, zweimal K3) und >ONLY MUSLIM< (K1:
3; K3: 2) zu finden. Der Begriff >NON-MUSLIM< wirkt ebenfalls
etwas diskriminierend. >MEMBER(S) OF THE MUSLIM< kommt
viermal als linksseitige Kollokation im Superkorpus aus K1, K2 und
K3 vor. Dieses Wortgefüge ist jedoch unterbrochen, da das Suchwort
in der Mitte des Syntagmas liegt.
6.3.3.4 Rechtsseitige Kollokationen zu >MUSLIM<
Die rechtsseitigen Kollokationen sind wieder sehr viel intensiver
ausgeprägt als die linksseitigen. Es dominiert der adjektivische
Gebrauch:
134
No.
Kollokation
Freq
1
2
3
4
5
6
7
8
9
10
MUSLIM WORLD
MUSLIM COUNTRY/-IES
MUSLIM LEADER(S)
MUSLIM HOLY
MUSLIM COMMUNITY/-IES
MUSLIM FUNDAMENTALIST(S)
MUSLIM STATE(S)
MUSLIM CLERIC(S)
MUSLIM EXTREMIST(S)
MUSLIM MILITANT(S)
28
25
23
16
15
13
13
12
12
12
Tab. 26: Rechtsseitige Kollokationen zu >MUSLIM< (Kollokationen
aus dem Oxford Collocations Dictionary sind markiert)
Am häufigsten finden wir die Nominalphrase >MUSLIM WORLD<
mit 28 Nennungen insgesamt. 22 dieser Kollokationen liegen in K1,
fünf liegen in K3 und nur eine in K2. Die Kollokation >MUSLIM
COUNTRY/ -IES< finden wir 25-mal. Siebzehn der Textstellen
liegen in K1, acht in K3. >MUSLIM LEADER(S)< ist 23-mal
enthalten. 14 der Einträge liegen in K1, neun in K3.
Das aufgebrochene Syntagma >MUSLIM HOLY…< finden wir
16-mal, davon befinden sich zwölf in K1 und vier in K3. Die
Kombination >MUSLIM COMMUNITY/ -IES< ist 15-mal
vorhanden. Neun dieser Kollokationen sind in K1 zu finden, fünf in
K3 und eine in K2. 13-mal finden wir >MUSLIM
FUNDAMENTALIST(S)<, davon liegen neun in K3, drei in K1 und
eine in K2. >MUSLIM STATE(S)< (13-mal insgesamt) finden wir
siebenmal in K1, viermal in K3, zweimal in K2.
Je 12-mal ist >MUSLIM CLERIC(S)< (K1: 10; K3: 2),
>MUSLIM EXTREMIST(S)< (K3: 7; K1: 4; K2: 1) und
>MUSLIM MILITANT(S)< (K3: 10; K1: 1; K2: 1) vorhanden.
Gerade die letzten beiden Einträge >MUSLIM EXTREMIST(S)<
und >MUSLIM MILITANT(S)< zeigen ein klares Missverhältnis
auf, da jeweils die meisten Verwendungen in K3 liegen. In K1 ist
hingegen häufig von >TERRORIST(S)< die Rede (1012-mal, 676
davon im Singular). Es drängt sich der Verdacht auf, dass nach dem
11. September alle über einen Kamm geschert wurden (s.o. 5.4).
Ferner fällt auf, dass die häufigsten im Oxford Collocations
Dictionary aufgeführten Begleitwörter sich nicht unter den obersten
vier Rängen dieser Liste befinden. Die Verwendung von >MUSLIM
135
FUNDAMENTALIST(S)<, >MUSLIM COMMUNITY/-IES< und
>MUSLIM EXTREMIST(S)< ist sogar im Vergleich zu K3 seltener
geworden.
6.3.3.5 Linksseitige Kollokationen für >ISLAMIC<
Die linksseitigen Kollokationen sind in diesem Fall wieder nicht so
häufig wie die rechtsseitigen, was daran liegt, dass mit >ISLAMIC<
ein Adjektiv betrachtet wird, das das syntagmatische Bezugswort auf
der rechten Seite trägt. Deshalb bestehen die meisten linksseitigen
Kollokationen in der 505 Einträge starken Liste aus Artikeln,
Konjunktionen und Präpositionen wie >AN<, >AND<, >BY<,
>FOR<, >FROM<, >IN<, >OF<, >ON<, >THE<, >TO<, and
>WITH<. Die übrigen Kollokationen zeugen zu einem Großteil von
einer negativen Konnotation des Wortes >ISLAMIC<, da die
Verwendung stark von der Berichterstattung unter Einfluss des 11.
September beinflusst ist.
No.
Kollokation
Freq
1
2
3
4
5
6
7
8
HAMAS AND ISLAMIC
-BASED ISLAMIC
EGYPTIAN ISLAMIC
AFGHAN ISLAMIC
ATTACKS BY ISLAMIC
MILITANT ISLAMIC
MEMBER(S) OF ISLAMIC
RADICAL ISLAMIC
10
8
8
7
5
5
4
4
Tab. 27: Linksseitige Kollokationen zu >ISLAMIC<
Abgesehen von den genannten Artikeln und Präpositionen ist die
häufigste linksseitige Kollokation >HAMAS AND ISLAMIC< mit
zehn Nennungen. In jedem der zehn Fälle ist >JIHAD< die
rechtsseitige Kollokation (s.u.). Sieben der Textstellen liegen in K1
und drei in K2, jedoch keine in K3. An zweiter Stelle liegt eine Form,
die Teil eines Kompositums ist: > -BASED ISLAMIC<. Sechs der
acht Kollokationen bestehen aus dem Kompositum >LONDONBASED<. Alle acht Kollokationen liegen in K1. An Stelle drei finden
wir >EGYPTIAN ISLAMIC<, und in jedem der acht Fälle ist
>JIHAD< die rechtsseitige Kollokation (>EGYPTIAN ISLAMIC
136
JIHAD<). Dieses Syntagma ist erneut ausschließlich in K1 zu finden.
Siebenmal finden wir >AFGHAN< als linksseitige Kollokation, die
gesamte Wortkette lautet in jedem einzelnen Fall >AFGHAN
ISLAMIC PRESS<. Alle liegen in K1.
Fünfmal finden wir >ATTACKS BY ISLAMIC< (drei in K1, eine in
K2 und eine in K3). Ebenfalls fünfmal ist >MILITANT ISLAMIC<
enthalten (dreimal in K2, zweimal in K1). Viermal finden wir
>MEMBER bzw. MEMBERS OF ISLAMIC< (zweimal K1,
zweimal K2), ebenfalls viermal ist >RADICAL ISLAMIC<
vorhanden (alle in K1). Die folgenden Konstruktionen kommen
jeweils dreimal vor, sind in der obigen Tabelle nicht aufgeführt:
>ACCORDING TO ISLAMIC<, >CLAIMED BY ISLAMIC<,
>EXTREMIST ISLAMIC< (dreimal K1), >HELD BY ISLAMIC<,
>HIGHER ISLAMIC (COUNCIL)<, >INCLUDING ISLAMIC<
und >UN-ISLAMIC<.
Tabelle 27 verdeutlicht, dass sich Religion, Terrorismus und
Nationalität zweifelsfrei als häufig aneinander gebundene Begriffe
erweisen, und das in K1 deutlich stärker als in den anderen beiden
Korpora.
6.3.3.6 Rechtsseitige Kollokationen >ISLAMIC<
Wenn wir uns die rechtsseitigen Kollokationen des Adjektivs
>ISLAMIC< ansehen, so stellen wir fest, dass es sehr häufig in einem
negativen Zusammenhang verwendet wird. Wieder sind die
Häufigkeiten der rechtsseitigen Kollokationen sehr viel ausgeprägter,
was für Adjektive im Englischen typisch ist:
No.
Kollokation
Häuf.
1
2
3
4
5
6
7
8
9
10
11
ISLAMIC JIHAD
ISLAMIC MILITANT(S)
ISLAMIC FUNDAMENTALIST(S)
ISLAMIC GROUP(S)
ISLAMIC FUNDAMENTALISM
ISLAMIC REVOLUTION
ISLAMIC MOVEMENT(S)
ISLAMIC STATE
ISLAMIC TERRORIST(S)
ISLAMIC CONFERENCE
ISLAMIC REPUBLIC
90
28
18
18
11
11
10
10
10
9
9
Tab. 28: Rechtsseitige Kollokationen von >ISLAMIC<
137
Ganze 90-mal ist >JIHAD< zur Rechten des Adjektivs >ISLAMIC<
zu finden (viermal davon als sächsischer Genitiv). 44 dieser
Kollokationen sind in K1 enthalten, 36 in K3 und 10 in K2. Bei der
Durchsicht der Wortlisten fällt ferner auf, dass die meisten Nennungen
an bestimmten Stellen des Korpus eine Kumulation haben (12-mal bei
73 % des Korpus, zehnmal bei 79 %, sechsmal bei 32 %).19 An diesen
Punkten des chronologisch geordneten Korpus war ein Kontext
gegeben, der die Verwendung >ISLAMIC JIHAD< förderte,
wahrscheinlich infolge eines Terroranschlages oder einer öffentlichen
Stellungnahme zu der Thematik.
Für >ISLAMIC MILITANT(S)< gibt es 28 Belege, die sich zu 17
auf K1, drei auf K2 und acht auf K3 verteilen. Die Verbindung
>ISLAMIC FUNDAMENTALIST(S)< kommt 18-mal vor, elf
Textstellen liegen in K3 und sieben in K1. Die Nominalphrase
>ISLAMIC GROUP(S)< ist 18-mal enthalten, 13 der Textstellen
liegen in K1, vier in K2 und nur eine in K3. >ISLAMIC
FUNDAMENTALISM< ist elfmal zu finden (K3: 8; K1: 3), genauso
häufig wie >ISLAMIC REVOLUTION< (K3: 9; K1: 2). Die
Kombination >ISLAMIC MOVEMENT(S)< findet sich zehnmal
(K1: 7; K2: 2; K3: 1).
>ISLAMIC STATE< ist zehnmal vorhanden (K1: 8; K3: 2), diese
Nominalphrase existiert nicht in der Pluralform. >ISLAMIC
TERRORIST(S)< ist zehnmal enthalten, alle Kollokationen liegen in
K1. Sowohl >ISLAMIC CONFERENCE< (K3: 6; K1: 3) als auch
>ISLAMIC REPUBLIC< kommen neunmal vor. >ISLAMIC
REPUBLIC< ist siebenmal in K3 vorhanden und zweimal in K2,
aber keinmal in K1.
Das Adjektiv >ISLAMIC< wird ganz offensichtlich in Verbindung
mit bedrohlichen Mächten wie >JIHAD<, >MILITANT(S)<,
>FUNDAMENTALIST(S)<, >GROUP(S)<, >MOVEMENTS<,
>TERRORIST(S)< etc. verwendet. Das ist in erster Linie auf die
Panik zurückzuführen, die nach dem 11. September herrschte.
19
Wordsmith zeigt in jeder Konkordanzliste mit Hilfe eines Prozentwertes, an welcher Stelle des chronologisch
geordneten Korpus eine Konkordanz bzw. Kollokation zu finden ist. Hätten wir in einem Korpus 100
gleichlange Texte (Anzahl der Wörter) und die Konkordanz den Eintrag 73 %, so befindet sich die gesuchte
Kollokation im 73. Text.
138
6.3.3.7 Gebräuchlichkeitsveränderungen
Die Überprüfung der Kollokationen von >ARAB<, >MUSLIM< und
>ISLAMIC< hat ergeben, dass es in den Untersuchungszeiträumen
eine deutliche Begriffsverschiebung zwischen >ARAB< auf der einen
Seite und >MUSLIM< und >ISLAMIC< auf der anderen Seite
gegeben hat. Während 1990 im Zuge der Kuwait-Krise die
Gebräuchlichkeit von >ARAB< dominant war (837 Token bei 0,04 %
in K3), konnten für 2001 nur insgesamt 181 Token gefunden werden,
davon 159 in K1 (0,02 %) und 22 in K2.
WORD
ARAB
MUSLIM
ISLAMIC
∑
Superkorpus
K1
K2
K3
Freq.
1018
547
505
2070
12.9.-11.12.2001
Freq.
%
159
0,02
268
0,03
271
0,03
698
1.6.-11.9.2001
Freq.
%
22
43
33
98
1.1.-21.8.1990
Freq. stand. Wert
837
418
236
118
201
105
1274
%
0,03
0,01
0,01
%
0,04
0,01
-
Tab. 29: Die Verteilung von >ISLAMIC<, >MUSLIM< und
>ARAB< in den drei Hauptkorpora (aus Wordsmith- Wortliste )
Tabelle 28 macht deutlich, dass alle drei hier analysierten Begriffe
(>ARAB<, >MUSLIM< und >ISLAMIC<) in ihren Häufigkeiten
nach dem 11. September einen starken Schub erhalten haben (∑=698).
In K2 hingegen ist von der Nachrichtenagenda her eine Ruhephase zu
verzeichnen (∑=98), was eine Auseinandersetzung mit der
muslimischen oder arabischen Welt betrifft. Es gab weder größere
militärische Auseinandersetzungen zwischen der westlichen und der
islamischen Welt im Erhebungszeitraum von K2, noch gab es
ausufernde terroristische Anschläge, verübt durch Terroristen aus dem
arabischen Raum. Die Summe der Nennungen in K3 beträgt 1274
(stand. Wert 637).
Für die Wörter >MUSLIM< und >ISLAMIC<, die sich auf Religion
und die Personen, die diesen Glauben ausüben beziehen, lässt sich
eine entgegengesetzte Tendenz feststellen. Während >MUSLIM<
1990 mit 0,01 % und 236 Token vertreten war (s.o.), waren es 2001
zusammengenommen 311 (268 in K1 und 43 in K2). >ISLAMIC<
139
kommt im Korpus von 1990 auf 201 Token (s.o.), 2001 waren es 271
(K1) und 33 (K2).
Das Wort >ARAB<, das sich hingegen auf den Sprachraum, die
Sprecher und die Sprache bezieht und etwaige religiöse Komponenten
außer Acht lässt, hatte 1990 überwiegend eine politische Konnotation,
wenn von der Kuwait-Krise die Rede war. Es drängt sich der Verdacht
auf, dass diese Verwendung nach 9/11 teilweise durch den Gebrauch
von >MUSLIM< und >ISLAMIC< substituiert worden ist, um nicht
explizit mit dem arabischen Raum in Opposition zu treten. Vielleicht
hätten die Zeitungen sich auf die Sprachregelung >ARABICSPEAKING TERRORISTS< einigen sollen, anstatt die Terroristen
permanent in einen Zusammenhang mit der islamischen Religion zu
stellen. Dabei waren 15 der 19 Attentäter von 9/11 saudi-arabische
Staatsbürger (Spiegel 36/ 2006).
Der überwiegende Teil der Araber, also Menschen, die Arabisch
sprechen bzw. in arabischen Staaten leben, gehört dem Islam an.
Wir müssen jedoch bedenken, dass es Moslems, also Anhänger des
Islam, auch anderenorts gibt als in der Arabisch sprechenden Welt, so
zum Beispiel in der Türkei, Pakistan und Indonesien, etc.
Zum Vergleich: das Wort >CHRISTIAN< kommt in allen drei
Korpora insgesamt nur 330-mal vor. Die fremde Religion ist damit
häufiger Bestand der Zeitungsberichterstattung als die eigene in der
westlichen Welt vorherrschende.20 Anstelle der 1990 eher
verwendeten Kollokationen wie >ARAB WORLD<, >ARAB
STATES<, >ARAB COUNTRY/ -IES<, >ARAB NATION(S)<
finden wir 2001 eher Verwendungen wie >MUSLIM WORLD<,
>MUSLIM COUNTRY/ -IES<, >MUSLIM COMMUNITY/-IES<,
>MUSLIM STATES< und >ISLAMIC STATE<.
Es liegt auf der Hand, zu vermuten, dass es Veränderungen in den
Wortgebräuchlichkeiten gegeben hat, die in der Sprachgeschichte
nicht selten vorkommen (Fritz 1998, S.68), in dem hier behandelten
Kontext u.U. aus einem politischen Kalkül heraus, das „Feindbild
Islam“ aufzubauen, woraus wiederum Vorurteile gegen Muslime
entstehen.
20
Vergleiche auch die Werte für >PROTESTANT< (Superkorpus 84 Token) und >CATHOLIC<
(Superkorpus 298 Token)
140
6.4 Untersuchungen an der Lexik
In diesem Abschnitt der Arbeit sind die Punkte Synonymie,
lexikalische Dichte, die Funktion Keyness und die Analyse
ausgewählter Wortgruppen thematisiert.
Synonymie wird hier besprochen, da sie bei der Zusammenstellung
von Wortgruppen eine wichtige Rolle spielt. Wenn wir exakt sein
sollen, reicht es im Grunde genommen nicht aus, die Häufigkeit eines
einzelnen Wortes zu vermerken, sofern es dazu mehrere Synonyme
gibt, die dieselbe Bedeutung haben. Die Wortlisten wirken deshalb
manchmal ein wenig verquer, denn der tatsächliche Wert eines Wortoder Projektionsfeldes kann sehr viel höher sein.
6.4.1 Das Problem der Synonymie
Der Begriff Synonymie spiegelt die Tatsache wider, dass für die
einzelnen Sachverhalte, Personen, Orte, Handlungen, etc.,
unterschiedliche Wörter bzw. Ersatzwörter verwendet werden.
Synonyme Wörter haben „den gleichen Sinn“ (Lyons 1985, S.211).
Dieses sprachliche Phänomen hat einen Einfluss auf die bei
Korpusanalysen erstellten Wortlisten.
Deshalb müssten wir, um präzise zu sein, die Häufigkeiten der
Synonyme ein und derselben Sache aufaddieren (>PRIME
MINISTER<, >MR BLAIR<, >TONY BLAIR<, >LABOUR
LEADER<, etc.), um die Gesamtverwendung der zu bezeichnenden
Sache, des „Referenten“, herauszufinden.
Gängige Korpusanalyseprogramme sind derzeit nicht in der Lage, die
verschiedenen Synonyme ein und derselben Sache in Wortgruppen
zusammenzufassen. Es geht lediglich um die Typen (Signifikanten)
und deren Häufigkeit, denen wir sprachliche Tendenzen ablesen
können, nicht um das Signifikat, also das, was die Wörter bedeuten
oder die Sache, die sie bezeichnen.
Auch wenn wir ein gesamtes Wortfeld fokussieren wollen
(>PFERD<, >RAPPE<, >GALOPPER<, >HENGST<, >STUTE<,
>FOHLEN<, >PONY<, etc.), müssten wir alle Formen heraussuchen
und gemeinsam betrachten. Doch innerhalb eines Wortfeldes können
141
Hierarchien vorhanden sein (Geckeler in: Lutzeier 1993, S. 11).
Herkömmliche Annotations- bzw. Tagging-Programme helfen uns in
diesem Fall nicht weiter, denn sie annotieren die Worttypen über
Vergleichslisten, die fest definiert sind. Soll für jedes Wort das
Wortfeld bestimmt und die Anzahl der verschiedenen Bedeutungen
ausgezählt werden, so ist dies mit erheblichem Zeitaufwand
verbunden.
Wir müssen uns derzeit noch damit zu Frieden geben, die
Wortgruppen zu bestimmten Themen oder Hyperonymen selbst
auszuwählen und deren Bestandteile bzw. die benötigten Formen aus
den Listen herauszuarbeiten (siehe Punkt 6.4.5).
Auch die Ambiguität ganzer Sätze stellt ein Problem dar. In der
Linguistik gilt der folgende Satz von Noam Chomsky (1979, S. 68) als
Paradebeispiel: “Flying planes can be dangerous”, der nach dem 11.
September 2001 einen bitteren Beigeschmack erhalten hat.
Das Phänomen syntaktische Ambiguität kommt besonders in den
Konkordanzlisten häufig zum Tragen, wenn nur ein begrenzter
Ausschnitt eines Satzes zur Verfügung steht (siehe 6.3.2.1 bis 6.3.2.5)
und die Konkordanz aus dem Textzusammenhang gerissen ist.
6.4.2 Lexikalische Dichte und Funktionswörter
Eine mathematische Betrachtungsweise, die dabei hilft, sinnvolle
Aussagen über den verwendeten Wortschatz innerhalb eines
homogenen Korpus treffen zu können, ist die Berechnung der
lexikalischen Dichte. Die lexikalische Dichte von Korpora im
Vergleich ermöglicht ein Urteil darüber, ob sich Sprache vereinfacht
oder verkompliziert hat.
Bereits bei Halliday (1984, S. 32) spielt dieser Begriff eine wichtige
Rolle (lexical density: proportion of lexical items (content words)
to words as a whole). Er gibt zu bedenken, dass geschriebene
Sprache eine höhere lexikalische Dichte als gesprochene und deshalb
einen komplexeren Wortschatz besitzt (Halliday, 1984, S.224).
Diese Erkenntnisse kommen in der Übersetzungswissenschaft zum
Tragen, wenn analysiert wird, ob übersetzte Texte gegenüber den
Ursprungstexten in punkto Schwierigkeitsgrad eine Veränderung
durchlaufen haben. Es ist von den vier universellen Eigenschaften von
142
Übersetzungen die Rede (Baker 1998, S. 288 ff, Hansen/ Teich 1999,
S.312-322): “simplification“, “explicitation“, “normalisation“ und
“levelling out“. Diese Feststellung über die Komplexität von
Ursprungstexten (source) und Zieltexten (target) lassen sich auf die
Korpuslinguistik übertragen. Die lexikalische Dichte beschreibt hier
den Prozentsatz, den wir erhalten, wenn in einem ersten Schritt die
Anzahl der Funktionswörter eines Textes oder eines Korpus von der
Gesamtzahl der Token subtrahiert wird. Auf diese Weise erhalten wir
die Anzahl der Inhaltswörter bzw. content words. Das Ergebnis wird
durch die Gesamtzahl der Wörter (Token) dividiert und mit 100
multipliziert. Wir erhalten schließlich die Prozentzahl aller
Inhaltswörter eines Korpus.
Texte sind laut Baker besser zu verstehen, wenn mehr
Funktionswörter und weniger Inhaltswörter verwendet werden.
In der hier vorliegenden Korpusanalyse kann für jedes einzelne der
drei Hauptkorpora (K1, K2, K3) die Anzahl der Funktionswörter
ermittelt und die lexikalische Dichte berechnet werden.
Laut Fries (1952, S.87) existieren in der englischen Sprache genau
154 Funktionswörter. Man kann den Theorieansatz von Fries zwar
deshalb kritisieren, weil die so genannten Funktionswörter in der
Grammatik bereits wohldefinierten Typen entsprechen (Artikel,
Hilfsverben, Präpositionen, etc.). Fakt ist jedoch, dass sich sowohl die
Begriffe Funktionswörter als auch Inhaltswörter in der Aphasiologie
bei der Beschreibung des Aufbaus des mentalen Lexikons
durchgesetzt haben (Tesak 1997, S.66/67, Pinker 1996, S.55/56).
Bei der Berechnung der lexikalischen Dichte wurde die
Gesamtzahl der Funktionswörter von der Summe aller Token
abgezogen (s.o.). Das Hauptproblem bestand darin, die genaue Zahl
dieser Wortklasse in den Hauptkorpora zu ermitteln:
Einige Klassen von Wörtern sind in jedem Fall Funktionswörter,
andere hingegen nur bei einer bestimmten Konstellation, so zum
Beispiel die Wörter >STILL<, >EVEN<, >SOME< und >NO<, die
erst in Verbindung mit einer Steigerungsform (z.B. >STILL
BETTER< ) zu Funktionswörtern werden.
Einige Funktionswortgruppen wie >VERY MUCH TOO< brauchen
nicht als ganze betrachtet zu werden, da jedes einzelne Wort für sich
schon ein Funktionswort ist. In diesem Fall mussten nicht extra
Konkordanzlisten aufgerufen werden, sondern die einzelnen Wörter
143
konnten den Häufigkeitslisten entnommen werden, da sie von
Wordsmith aufgesplittet und separat betrachtet wurden. Es gibt
andere Beispiele, in denen es sehr aufwendig war, herauszufiltern, ob
ein Wort als Funktionswort gilt oder nicht, so kann dieses zum
Beispiel von einem bestimmten Intonationsschema abhängig sein
(>MORE OR LESS<). Deshalb ist nicht auszuschließen, dass bei der
Ermittlung der Anzahl der Funktionswörter kleine Fehler unterlaufen
sind. Diese Fehlergröße ist jedoch als gering zu erachten und wurde
bei der Ermittlung der lexikalischen Dichte vernachlässigt, zumal sich
diese Fehlergröße auf die seltensten Begriffe beschränkt, also die
Typen betrifft, die weiter unten in den Häufigkeitslisten zu finden
sind. Wenn nur eine einzige Verwendungsform von mehreren gesucht
und eine recht große Konkordanzliste zu durchsuchen war, so wurde
eine Stichprobe von 100 Konkordanzen herangezogen und die
Auszählung hochgerechnet.
Funktionswörter stellen innerhalb einer Sprache im Gegensatz zu
Fachwortschätzen oder temporären Modebegriffen eine stabile Größe
dar. Der Vergleich der lexikalischen Dichten der drei Hauptkorpora
soll lediglich eine Tendenz ausdrücken.
Auch bei Funktionswörtern gibt es Homonymie, so kann z.B.
>PRETTY< mal Adverb, mal Adjektiv sein, aber auch ein Name
>MRS PRETTY<. In diesem Fall sollten die Konkordanzlisten
konsultiert werden.
Für K1 wurden schließlich 394 891 Bestandteile dieser Klasse
ermittelt. Für K2 waren es 393 106 und 777 980 für K3. Als
Gesamttokenzahl wurden das Ergebnis der Wordsmith-Zählung
herangezogen (siehe Punkt 6.1.1). Es kam die folgende Formel zur
Anwendung:
T – F . 100 = L
T
(T = Anzahl der Token, F = Anzahl der Funktionswörter, L =
lexikalische Dichte). Für die drei Hauptkorpora ergeben sich die
folgenden Werte:
K1:
K2:
K3:
60,91 %
61,08 %
61,51 %
144
Die lexikalische Dichte bzw. die Komplexität des Wortschatzes ist
demnach in K3 am höchsten, am zweithöchsten ist sie in K2 und am
dritthöchsten in K1.21 Parallel dazu dient die Type–Token–Relation
als Bewertungsmaßstab für die Komplexität (siehe oben 6.1.2).
Wie bereits erwähnt, ist laut Baker ein Text einfacher zu verstehen,
wenn mehr Funktionswörter verwendet wurden. Übertragen wir diese
Erkenntnis auf diese Dissertation, so können wir folgern, dass die
Sprache in K1 besser zu verstehen ist als in K2. Etwas schlechter ist
sie demnach in K3 zu verstehen, denn dort ist der Wortschatz am
komplexesten. Doch es ist schwer zu sagen, wie gravierend diese
absoluten Zahlen sind, da Vergleichswerte von anderen
Korpusanalysen fehlen.
Dieses Urteil betrifft außerdem nur eine kleine Facette der Bewertung
der Sprache. Orthografie, Ausdruck und Grammatik beispielsweise
können durch diese Analysen nicht beurteilt werden. Würden wir nur
von der lexikalischen Dichte als Bewertungsmaßstab für die Qualität
von Zeitungssprache ausgehen, so ignorieren wir andere wichtige
Eigenschaften.
Wir können deshalb festhalten, dass sich die Verständlichkeit
gemessen an der lexikalischen Dichte von Korpus zu Korpus
verbessert hat.
Auffällig ist ferner, dass die Abnahme der lexikalischen Dichte von
K2 zu K1 wesentlich stärker ist als von K3 zu K2. Vielleicht lässt
sich deshalb behaupten, dass Krisenjournalismus eine geringere
lexikalische Dichte besitzt, als der Alltagsjournalismus.
6.4.3 Die Funktion Keywords
Das dritte Wordsmith-Tool, das innerhalb dieser Analyse zur
Anwendung kommt, heißt „Keywords.“ Mit dessen Hilfe können die
zuvor abgespeicherten Häufigkeitslisten zweier Korpora automatisch
miteinander verglichen werden (siehe Punkt 4.1). Die Software filtert
21
Im Gegensatz zu diesem Beispiel aus der Korpuslinguistik wird in der funktionalen Grammatik (Halliday
2004, S.655) die lexikalische Dichte errechnet, indem die Anzahl der lexikalischen Einheiten (lexical items)
durch die Anzahl der aneinander gereihten Sätze (ranking clauses) dividiert wird.
145
im Rahmen dieser Funktion all jene Begriffe heraus, die in ihren
Häufigkeiten, ausgehend von der erstgeladenen Liste, besonders stark
differieren. In den Keyness-Listen werden die frappierendsten
prozentualen Abweichungen auf den oberen Rängen der Liste
aufgeführt.
Jedes Korpus hat eigene Schlüsselwörter, nur Funktionswörter finden
wir darunter selten. Für die drei Hauptkorpora lassen sich primär
sechs Keyness-Listen erstellen: K1 zu K2, K2 zu K1, K1 zu K3, K3
zu K1, K2 zu K3 und K3 zu K2. Zusätzlich lassen sich K1 und K2 zu
einem Korpus von 2001 zusammenfassen, das als Ursprungskorpus
und als Vergleichskorpus mit K3 verglichen werden kann.
Im folgenden Schritt wollen wir uns jedoch auf die wichtigsten sechs
Listen beschränken. Die Kombinationen K3 zu K1 und K1 zu K3
wurden außer Acht gelassen. Aus Platzgründen sind für jede Liste nur
die obersten 25 Einträge aufgeführt. Erst im nächsten Kapitel (6.4.4)
werden auch die drei Subkorpora von K1 im Einzelnen einer KeynessAnalyse unterzogen.
6.4.3.1 Die Keyword-Liste von K1 mit K2 als Referenzkorpus
Als erstes sei hier die Keyword-Liste K1 zu K2 dargestellt. Diese
Liste steht eindeutig unter dem Einfluss des Hauptereignisses NineEleven. Das Range dieser Keyness-Liste bewegt sich zwischen 242,6
und 1489,5 Keynesspunkten.
146
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
WORD
FREQ. K1
AFGHANISTAN 1.141
949
BIN
759
TALEBAN
758
LADEN
720
TALIBAN
2.186
US
TERRORISM 571
676
TERRORIST
857
ATTACKS
549
AL
361
OSAMA
540
ALLIANCE
361
AFGHAN
368
ANTHRAX
322
KABUL
341
PAKISTAN
739
FORCES
802
MILITARY
1.037
WAR
230
KANDAHAR
SEPTEMBER 631
411
BOMBING
TERRORISTS 336
732
AMERICAN
175
LADEN'S
K1 %
0,11
0,09
0,08
0,08
0,07
0,22
0,06
0,07
0,08
0,05
0,04
0,05
0,04
0,04
0,03
0,03
0,07
0,08
0,1
0,02
0,06
0,04
0,03
0,07
0,02
FREQ. K2
9
6
0
4
1
742
18
62
149
44
0
47
3
5
0
15
179
212
365
0
155
58
33
226
0
K2 % Keyness
1.489,50
1.251,40
1.052,40
1.006,60
984,5
0,07
745,1
655,6
597,4
0,01
550,9
508,6
500,5
486,3
469,9
464,1
446,4
369,2
0,02
366,9
0,02
366
0,04
335,9
318,8
0,02
309,2
299,2
289,3
0,02
281,4
242,6
Tab. 30: Die obersten 25 Typen der Keyword-Liste von K1 zu K2
Der Mittelwert aus diesen 25 Werten beträgt 508,6.
Aufgrund der ausgelösten internationalen Krise ist offensichtlich die
Themenvielfalt,
die
als
Qualitätskriterium
für
Informationsjournalismus gilt, stark eingeschränkt (siehe 5.9). Wir
finden in der Liste viele die Typen, die in K2 nicht ein einziges Mal
vorkommen. Dazu gehören >TALEBAN<, >OSAMA<, >KABUL<,
>KANDAHAR< und >LADEN’S<. Das ist bezeichnend dafür, wie
extrem sich der Fokus der Berichterstattung verschoben hat.
Die Type >AFGHANISTAN< erreicht einen Keyness-Wert von
1489,50. Sie kommt in K1 ganze 1141-mal vor (0,11 %), in K2
hingegen nur neunmal (0 %). Dieses Land war schlagartig im Zentrum
der Medienberichterstattung, weil die Verantwortlichen für die
Anschläge hier vermutet wurden. Es lässt sich sagen, dass der
Nachrichtenwert dieser Type sehr hoch ist.
147
Die Type >BIN<, die in den Texten zum überwiegenden Teil zu dem
Namen Osama Bin Laden gehört, liegt an zweiter Stelle, die
Verteilung hat ein Verhältnis von 949 (0,09 %) in K1 zu 6 (0 %) in
K2.22 Daraus ergibt sich ein Keyness-Wert von 1251,40. Bin ist ein
arabisches Namensprädikat, das „Sohn von …“ bedeutet. Die
Verteilung kann als Hinweis gelten, dass die US-Regierung alles
Mögliche tat, um der Weltöffentlichkeit schnellstmöglich einen
lebendigen Verantwortlichen für die Terroranschläge zu präsentieren.
>TALEBAN< ist die Bezeichnung für die radikale islamische Miliz
in Afghanistan. Diese Type erreicht 759 Token in K1 (0,08 %), jedoch
kein Token in K2. Das ergibt einen Keyness-Wert von 1052, 40. Auf
Rang vier steht >LADEN< (758 Token (0,08 %) in K1 zu 4 (0 %) in
K2) mit 1006,60 Keyness. Rang 5 nimmt >TALIBAN< ein (720
(0,07 %) zu 1 (0 %)) mit einem Keyness-Wert von 984,5. Gäbe es nur
eine Schreibvariante von >TALIBAN< oder >TALEBAN< so wäre
diese Type auf Rang eins der Liste zu finden.
Es folgt >US< (2186/ 742 Token bzw. 0,22 zu 0,07 %), Keyness-Wert
745,1. >US< kann zum einen das Kürzel von >UNITED STATES<
sein, zum anderen das Personalpronomen erste Person Plural in der
Objektform. Die Type >TERRORISM< steht auf Rang 7 (571/ 18
Token bzw. 0,06 zu 0 %) mit einem Keyness-Wert von 655,6. Auf
Rang 8 der Liste finden wir >TERRORIST< (676/ 62 Token bzw.
0,07 zu 0 %) mit einem Keyness-Wert von 597,4. Nummer 9 ist
>ATTACKS< (857/ 149 Token in K1 bzw. 0,08 zu 0,01 % in K2 mit
einem, Keyness-Wert von 550,9).
Platz 10 nimmt die Type >AL< ein (549/ 44 Token bzw. 0,05 zu 0 %)
mit 508,6 Keyness. Das ist der standardarabische Singular-Artikel.
Der arabische Vorname >OSAMA<, Rang 11, (361/ 0 Token bzw.
0,04 zu 0 %) erzielt 500,5 Keyness-Punkte.
Die Type >ALLIANCE< (540/ 47 Token bzw. 0,05 zu 0 %) erreicht
einen Keyness-Wert von 486,3. Mit diesem Begriff wird sowohl die
„Northern Alliance“ in Afghanistan bezeichnet, als auch das
Bündnis gegen den Terror aus verschiedenen westlichen Staaten unter
der Führung der USA.
>AFGHAN<, auf Rang 13, kommt in K1 auf 361 Token
22
Es finden sich auch >BIN AL-SHIBH<, >BIN FAHD<, >BIN MUHAMMAD< u.a. Ferner finden wir die
Verwendung im Sinne von Behälter, Abfalleimer (>BREAD BIN<, >MAIL BIN<, >WHEELIE-BIN<).
Daraus resultiert, dass >BIN< häufiger ist als Laden.
148
(0,04 %), in K2 auf drei Token (0 %). Das erzeugt einen KeynessWert von 469,9. Auf Rang 14 befindet sich >ANTHRAX<, die
Bezeichnung für die Infektionskrankheit Milzbrand, (368/ 5 Token
bzw. 0,04 zu 0 %). Der dazugehörige Keyness-Wert beträgt 464,1.
Dieser Wert ist Ausdruck der Angst vor weiteren schwerwiegenden
Terrorangriffen in der Zeit nach 9/11.
Die Type >KABUL< kommt im Verhältnis 322 (0,03 %) zu 0 vor.
Der Keyness-Wert beträgt 446,4. Die afghanische Hauptstadt Kabul
wurde ebenso wie die Provinz Kandahar in den Monaten vor dem 11.
September nicht thematisiert.
Die Type >PAKISTAN<, auf Rang 16, hat ein Verhältnis von
341(0,03 %) zu 15 (0 %). Der Keyness-Wert beträgt 369,2.
Die Type >FORCES< (739 Token (0,07 %) zu 179 (0,02 %)) auf
Rang 17 hat in dieser Korpus-Konstellation einen Keyness-Wert von
366,9. Mit >FORCES< wurden nicht nur die alliierten Truppen unter
der Führung der USA bezeichnet, die bald nach dem 11. September zu
ersten Kampfhandlungen übergingen, sondern auch taleban forces,
israeli forces, und viele andere mehr. Das Militärwesen trat häufig in
der Berichterstattung auf. Das belegen auch die folgenden beiden
Typen: >MILITARY< (802 Token (0,08 %) zu 212 (0,02 %)) erhält
einen Keyness-Wert von 366 und steht damit auf Rang 18 der Liste.
Auf Rang 19 finden wir >WAR< mit 1037 (0,10 %) zu 365 Token
(0,04 %) bei einem Keyness-Wert von 335,9.
Auf Rang 20 folgt >KANDAHAR<, die Hochburg der Taliban,
die am 7.12.2001 von diesen aufgegeben wurde (230/ 0 Token bzw.
0,02 zu 0 %). Der Keyness-Wert beträgt 318,8.
Platz 21 nimmt >SEPTEMBER< ein (631/ 155 Token bzw. 0,06 zu
0,02 %), der dazugehörige Keyness-Wert beträgt 309,2. Wir finden
den Begriff >BOMBING< als 22. Schlüsselwort (411/ 58 Token bzw.
0,04 zu 0 %) mit 299,2 Keyness-Punkten.
Auf Rang 23 steht >TERRORISTS< mit 336 Token in K1 (0,03 %)
und 33 in K2 (0 %), Keyness-Wert: 289,3. Auf Rang 24 steht
>AMERICAN< (732/ 226 Token bzw. 0,07 zu 0,02 %) und einer
Keyness von 281,4. Wert Nummer 25 in dieser Liste ist der von
>LADEN’S< (175/ 0 Token bzw. 0,02 zu 0 %); Keyness: 242,6).
Die Folgen des 11. September sind unter diesen obersten 25 Einträgen
der Keyword-Liste von K1 zu K2 beherrschendes Thema. Andere
Themenbereiche als der Terrorismus und dessen Folgen sind deutlich
149
unterrepräsentiert. Die vier höchsten Einträge erreichen sogar
Keyness-Werte von über 1000. Das zeigt überaus deutlich, wie
gravierend die sprachlichen Veränderungen in der Folgezeit nach dem
11. September waren.
Das Vokabular der Berichterstattung über diesen Terroranschlag ist
vorherrschend. Schlüsselwörter anderer politischer Themen sind in
dieser Liste nicht zu finden.
Es ist in dieser Liste nur ein medienrelevanter Akteur genannt: Osama
Bin Laden, der vermeidliche Drahtzieher der Terroranschläge. Kein
westlicher Politiker schafft es auf die obersten 25 Ränge.
Jedoch sind vier Ortsbezeichnungen enthalten: >AFGHANISTAN<,
>PAKISTAN<, >KABUL< und >KANDAHAR<.
Betrachten wir die Keywords-Liste von Ausgangskorpus K2 zu
Referenzkorpus K1, so stellen wir fest, dass in erster Linie
innenpolitische Themen festgehalten wurden. Die Wörter aus K2 mit
den höchsten Abweichungen in ihrer Häufigkeit zu K1 stehen erneut
ganz oben. Das Range dieser Keyness-Liste bewegt sich zwischen 109
und 399 Keyness-Punkten (Mittelwert 163,9). Die Typen dieser
Auswertung
haben
demgemäß
eine
deutlich
geringere
Schlüsselwortfunktion als die in der vorhergehenden.
Unter den obersten 25 Typen dieser Liste befinden sich genau sieben
Namen: >CLARKE<, >HAGUE<, >ARCHER<, >PORTILLO<,
>DANDO<, >HAMILTONS<, >MCGOWAN<.
Anhand dieser Keyness-Liste und speziell der aufgeführten Namen
erkennen wir hinreichend deutlich, dass das Presse-Korpus K2
vorrangig von innenpolitischen Themen geprägt ist, vor Allem von
den Unterhauswahlen in Großbritannien am 7.6.2001.23
23
Die Sprache von New Labour hat Fairclough (2000) in „New labour, new language?“ mit einer gelungenen
Korpusanalyse untersucht.
150
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
WORD
FREQ. K2
919
ELECTION
888
POUNDS
1.306
LABOUR
460
CLARKE
395
HAGUE
2.608
HER
703
TORY
445
VOTE
188
ARCHER
484
CONSERVATIVE
1.386
PARTY
2.487
SHE
215
PORTILLO
249
LIB
218
VOTES
391
TORIES
140
TURNOUT
1.854
POLICE
98
DANDO
175
VOTING
90
LANDSLIDE
133
FESTIVAL
82
HAMILTONS
266
VOTERS
99
MCGOWAN
K2 %
0,09
0,09
0,13
0,05
0,04
0,26
0,07
0,04
0,02
0,05
0,14
0,25
0,02
0,02
0,02
0,04
0,01
0,18
0,02
0,01
0,03
FREQ. K1
255
256
530
68
64
1.598
236
122
14
165
800
1.686
33
52
38
131
10
1.224
2
28
1
13
76
4
K1 %
0,03
0,03
0,05
0,16
0,02
0,01
0,02
0,08
0,17
0,01
0,12
KEYNESS
399
369,8
338,9
326,5
265,6
245,5
243,1
195,6
178,3
163,9
159,3
155,1
149,3
140,3
139,9
135,5
134,5
130,1
119
118,6
115,2
114,7
113,7
111,8
109
Tab. 31: Die obersten 25 Typen der Keword-Liste von K2 zu K1
Den höchsten vom Computer errechneten Keyness-Wert für diese
Korpuskonstellation erhält >ELECTION< mit 399,0. Dieser ergibt
sich aus den Werten für K2 (919 Token, 0,19 %) und dem
Referenzkorpus K1 (255 Token, 0,03 %). Auf Rang zwei finden wir
die Type >POUNDS< mit 888 Token (0,09 %) in K2 und 256
(0,03 %) in K1. Der Keyness-Wert beträgt 369,8. Rang drei
>LABOUR< erzielt 1306 Token in K2 (0,13 %) und 530 in K1
(0,05 %). Der Keyness-Wert beträgt 338,9.
Rang vier nimmt der Name >CLARKE< ein: 460 Token (0,05 %) in
K2 und 68 (0 %) in K1. Der von Wordsmith errechnete KeynessWert beträgt 326,5. In K2 sind diverse Personen mit diesem
Nachnamen aufgelistet: Charles C., Kenneth C., Victoria C.
Auf Rang fünf befindet sich der Name >HAGUE< (395 Token in K2
(0,04 %) zu 64 in K1 (0 %)) mit einem Keyness-Wert von 265,6.
151
Diese Type steht in erster Linie für den Tory-Vorsitzenden William
Hague und die Stadt The Hague.
Die Type >HER< zählt 2608 Token in K2 (0,26 %), jedoch
erstaunlicherweise nur 1598 in K1 (0,16 %), erlangt durch einen
Keyness-Wert von 245,5 Rang sechs dieser Keyword-Liste.
Die Type >TORY< steht auf Rang sieben (703 Token in K2 (0,07 %),
236 Token in K1 (0,02 %)). Der korrespondierende Keyness-Wert
beträgt 243,1. Auf Rang acht findet sich >VOTE< mit 445 Token
(0,04 %) in K2 gegenüber 122 (0,01 %) in K1 und 195,6 KeynessPunkten. >ARCHER< mit 188 Token in K2 (0,02 %) gegenüber 14
in K1 (0 %) erlangt 178,3 Keyness-Punkte. In den meisten Fällen ist
der konservative Politiker und Schriftsteller Jeffrey Archer gemeint.
Die Type >CONSERVATIVE< mit 484 Token in K2 (0,05 %) und
165 in K1 (0,02 %) erreicht 163,9 Keyness-Punkte. Die Type
>PARTY< mit 1386 Token in K2 (0,14 %) und 800 in K1 (0,08 %)
erreicht 159,3 Keyness-Punkte. Die Type >SHE< mit 2487 Token in
K2 (0,25 %) und nur 1686 in K1 (0,17 %) erreicht 155,1 KeynessPunkte. Es ist wieder bemerkenswert, dass dieses Feminin-Pronomen
in K1 deutlich schwächer vertreten ist (s.o. >HER<).
>PORTILLO< kommt mit 215 Token in K2 (0,02 %) und 33 in K1
(0 %) auf 149,3 Keyness-Punkte. Michael Portillo war bis 1997
Verteidigungsminister. Die Abkürzung >LIB< (Liberal Democrats),
erreicht 140,3 Keyness-Punkte bei 249 zu 52 Token (0,02 % vs. 0 %).
Rang 15 >VOTES< erreicht 139,9 Punkte (218 vs. 38 Token bzw.
0,02 % vs. 0 %).
>TORIES< erzielt mit 391 Token in K2 (0,04 %) und 131 in K1
(0,01 %) genau 135,5 Punkte und liegt damit auf Rang 16 der Liste.
Die Type >TURNOUT< erzielt 140 Token bzw. 0,01 % in K2 und 10
Token bzw. 0 % in K1 (134,5 Keyness-Punkte).
Für >POLICE< (Rang 18) sind in K2 1854 Token zu verzeichnen
(0,18 %). In K1 sind es nur 1224 Token (0,12 %), was einen KeynessWert von 130,1 ergibt. >DANDO< (Rang 10) erfährt in K2 98
Nennungen (0 %), in K1 nur zwei (0 %), Keyness-Wert: 119. Gill
Dando war eine beliebte englische Fernsehmoderatorin, die am
26.4.1999 in London vor ihrer Haustür erschossen wurde.
Die Type >VOTING< auf Rang 20 (175 vs. 28 Token bzw. 0,02 %
vs. 0 %) erhält einen Keyness-Wert von 118,6. >LANDSLIDE<
152
erzielt mit 90 zu 1 Token (beide Werte zählen 0 %) 115,2 KeynessPunkte und landet damit auf Rang 21.
Die Type >FESTIVAL< (133 in K2 (0,01 %) und 13 in K1 (0 %))
liegt auf Rang 22 der Liste, der korrespondierende Keyness-Wert
beträgt 114,7. >HAMILTONS< (Rang 23) erzielt 113,7 KeynessPunkte und 82 Token in K2 (0 %) gegenüber keinem Token in K1.
Das Skandalehepaar Neil und Christine Hamilton war wegen des
Vorwurfs eines Sexualverbrechens längere Zeit in den Medien
präsent.
Darauf folgt der Begriff >VOTERS< mit 266 Token in K2 (0,03 %)
und 76 in K1 (0 %) mit 111,8 Keyness-Punkten. Die letzte Stelle in
diesem Auszug aus der Keyness-Liste von K2 mit dem
Referenzkorpus K1 nimmt der Name >MCGOWAN< ein. Den 99
Einträgen in K2 (0 %) stehen vier in K1 gegenüber (0 %). Der
Keyness-Wert beträgt 109 Punkte. Der schwarze Harold McGowan
war eines der Opfer der rassistisch motivierten Morde in der Stadt
Telford in 1999/2000.
Die herausragenden Zahlen für >HER< und >SHE< lassen sich
sowohl auf den Dando-Mordfall zurückführen, als auch auf den 100.
Geburtstag und den Tod von Queen Mum.
Des Weiteren ist zu vermerken, dass sich in dieser Liste keine
Ortsbezeichnung befindet, mit Ausnahme der Fälle, in denen Hague
für die niederländische Stadt steht.
Fokussieren wir die Keyword-Liste, die ausgehend von K2 mit dem
Referenzkorpus K3 erzeugt wird, so sehen wir, dass erneut
innenpolitische Themen im Vordergrund stehen. Im Folgenden sind
die ersten 25 Ränge dieser Liste aufgeführt. Das Range bewegt sich
zwischen 294,2 und 1251,20 (Mittelwert: 444,6):
153
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
WORD
FREQ. K2
652
BLAIR
2.608
HER
2.487
SHE
DUNCAN 468
2.921
I
395
HAGUE
5.514
HIS
ASYLUM 342
493
SMITH
406
TONY
703
TORY
ELECTION 919
SEEKERS 211
169
EU
ARCHER 188
235
MOUTH
175
IAIN
211
EURO
249
LIB
7.612
HE
PORTILLO 215
CLARKE 460
BLAIR'S 146
3.927
WHO
249
FOOT
K2 %
0,06
0,26
0,25
0,05
0,29
0,04
0,55
0,03
0,05
0,04
0,07
0,09
0,02
0,02
0,02
0,02
0,02
0,02
0,02
0,75
0,02
0,05
0,01
0,39
0,02
FREQ. K3
23
2.144
2.037
31
2.747
28
7.132
37
164
111
392
645
6
0
7
34
8
25
49
11.697
33
242
2
5.463
59
K3 % KEYNESS
1.251,20
0,11 929,2
0,1
891,9
821,5
0,14 796
684,8
0,35 579,2
539,3
478,2
444,6
0,02 434,6
0,03 423
413,7
371,5
358,6
339,9
325,4
324,5
320,6
0,58 316,7
304,8
0,01 302,9
301,3
0,27 295,4
294,2
Tab. 32: Die obersten 25 Typen der Keyword-Liste von K2 zu K3
Wir müssen bei dieser Auswertung erneut bedenken, dass K3 doppelt
so groß ist wie K2. Wordsmith nimmt automatisch einen
Umrechnungsprozess vor. Auch diese Keynessliste belegt eindeutig,
dass K2 stark von innenpolitischen Themen geprägt ist.
Unter den 25 Typen befinden sich zehn Namensformen. Das sind
mehr als in jeder anderen hier vorgenommenen KeynessAuswertungen. Der höchste Eingang in diesem Korpusvergleich ist
>BLAIR< mit 652 Token (0,06 %) im Ausgangskorpus K2 versus 23
(0 %) im Referenzkorpus K3. Der dazugehörige Keyness-Wert ist
1251,20. Die Type >HER< (2608 Token (0,26 %) in K2, 2144
(0,11 %) in K3) steht auf Rang zwei der Liste und erzielt 929,2
Keyness-Punkte. >SHE<, ebenfalls ein Personalpronomen, findet sich
mit 2487 Token (0,25 %) in K2 und 2037 (0,10 %) in K3 auf Rang 3
(891,9 Keyness-Punkte). Diese Tatsache unterstreicht, dass in K2
154
Höchstwerte für diese Pronomina des Femininum erreicht wurden
(Queen Mum, Dando).
Der Name >DUNCAN< (Rang 4) erzielt 468 Token (0,05 %) in K2
und 31 (0 %) in K3 (Keyness-Wert 821,5). Die Type >I< (Rang 5)
erzielt bei 2921 Token in K2 (0,29 %) versus 2747 in K3 (0,14 %)
796 Keyness-Punkte. Iain Duncan Smith ist der Name eines
konservativen britischen Politikers.
>HAGUE< (Rang 6) bringt es auf 395 Token in K2 (0,04 %) versus
28 (0 %) in K3 und erzielt somit 684,8 Keyness-Punkte.
Das Possessivpronomen >HIS< auf Rang sieben (5514 Token
(0,55 %) in K2 und 7132 (0,35 %) in K3) bringt es auf 579,2
Keyness-Punkte. >ASYLUM< (Rang acht) kommt auf 539,3
Keyness-Punkte (342 Token in K2 (0,03 %) und 37 (0 %) in K3). Die
Asylproblematik ist in den Zeitungsartikeln von K2 sehr viel häufiger
thematisiert und hat dort einen deutlich höheren Nachrichtenwert als
in K3. Der Name >SMITH< steht an neunter Stelle der Liste, erreicht
493 Token in K2 (0,05 %) und 164 in K3 (0 %) und damit einen
Keyness-Wert von 478,2. Der Vorname >TONY< (Rang 10) erzielt
406 Token in K2 (0,04 %) und 111 in K3 (0 %), kommt damit auf
444,6 Keyness-Punkte.
Listeneintrag elf >TORY< erzielt 703 Token in K2 (0,07 %) versus
392 in K3 (0,02 %) und damit 434,6 Keyness-Punkte. Listeneintrag
12 >ELECTION< erzielt 919 Token in K2 (0,09 %) und 645 im
doppelt so großen Referenzkorpus K3 (0,03 %) was 423 KeynessPunkte ergibt. Das ist erneut ein Effekt der Tatsache, dass in K2 über
die Unterhauswahlen am 7.6.2001 berichtet wurde. Rang 13
>SEEKERS< zählt 211 Token im Ausgangskorpus K2 (0,02 %), aber
nur sechs Token im Referenzkorpus K3 (0 %). Der Keyness-Wert
beträgt 413,7.
Das Kürzel >EU< (Rang 14) hat 169 Token in K2 zu verzeichnen
(0,02 %), in K3 keine. Das ergibt einen Keyness-Wert von 371,5. Die
Europäische Union, für die diese Abkürzung steht, wurde erst im
November 1993 ins Leben gerufen.
Der Name >ARCHER< (Rang 15) erhält in K2 188 Token (0,02 %)
in K3 ganze sieben (0 %). Der dazugehörige Keyness-Wert beträgt
358,6. Der Begriff >MOUTH< (Rang 16) mit 235 Token in K2
(0,02 %) und 34 in K3 (0 %) kommt auf 339,9 Keyness-Punkte. Auf
Rang 17 steht >IAIN< mit 175 Token in K2 (0,02 %) versus acht in
155
K3 (0 %). Der korrespondierende Keyness-Wert beträgt 325,4
Keyness-Punkte. Auf Rang 18 steht >EURO< mit 211 Token in K2
(0,02 %) versus 25 in K3 (0 %) mit einem Keyness-Wert von 324,5.
Die neue europäische Währung Euro wurde am 1.1.2002 in mehreren
Ländern eingeführt.
Die Type >LIB< (Rang 19) kommt in K2 ganze 249-mal vor (0,02 %)
und in K3 nur 49-mal (0 %). Die dazugehörige Keyness-Zahl beträgt
320,6. Das Personalpronomen >HE< (Rang 20) kommt in K2 auf
7612 Token und in K3 auf 11 697. Der Keyness-Wert beträgt 316,7.
Der Wert in K2 ist höher zu bewerten, da >HE< 0,75 % von K2
ausmacht gegenüber 0,58 % in K3.
Rang 21 >PORTILLO< ist in K2 215-mal enthalten, das sind
0,02 %. In K3 hingegen sind es 33 Token (0 %), das ergibt 304,8
Keyness-Punkte.
Der Name >CLARKE< (Rang 22) bringt es auf 460 Token in K2
(0,05 %) und 242 in K3 (0,01 %). Der Keyness-Wert beträgt 302,9.
Die Genitivform >BLAIR’S< (Rang 23) kommt in K2 146-mal
(0,01 %), in K3 zweimal vor (0 %), das ergibt einen Keyness-Wert
von 301,3. Auf Rang 24 steht >WHO< mit 3927 Token in K2
(0,39 %) und 5463 in K3 (0,27 %), Keyness-Wert 295,4.
Auf Rang 25 findet sich >FOOT< mit 249 Nennungen in K2 (0,02 %)
und 59 in K3 (0 %), Keyness-Wert 294,2. Die Token >MOUTH< und
>FOOT< stehen zum überwiegenden Teil für die Rinderkrankheit
(>MOUTH AND FOOT DISEASE<), die im Erhebungszeitraum
von K3 noch keine Rolle spielte. Es zeigt sich wie schon in der
vorhergehenden Keyness-Liste, dass Namen in 2001 eine größere
Schlüsselwortfunktion haben als in 1990.
Neben >HER< und >SHE< gewinnen auch die Pronomina >I<,
>HE< und >HIS< in K2 deutlich hinzu.
Unter diesen 25 Einträgen befindet sich erneut keine Ortsbezeichnung.
Lassen wir Wordsmith die Keyword-Liste von K3 zu K2 erzeugen,
so zeigt sich, dass die Begriffswelt außenpolitischer Themen
überwiegt. Dazu zählen sowohl der Golfkrieg als auch die
156
Entwicklung in Osteuropa. Im Folgenden sind wieder die 25 höchsten
Eingänge in die Liste aufgeführt. Das Range bewegt sich zwischen
289,2 und 1692,30 (Mittelwert: 450,1).
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
WORD
FREQ. K3
2.370
SOVIET
1.577
IRAQ
1.228
KUWAIT
1.179
IRAQI
PRESIDENT 2.447
984
GULF
13.581
MR
837
ARAB
805
MOSCOW
767
SAUDI
937
OIL
COMMUNIST 698
570
SADDAM
144.181
THE
3.051
US
64.965
OF
479
EC
1.737
UNION
524
ARABIA
523
INVASION
1.345
MILITARY
1.828
EAST
GORBACHOV 378
689
C
482
HONG
K3 %
0,12
0,08
0,06
0,06
0,12
0,05
0,67
0,04
0,04
0,04
0,05
0,03
0,03
7,13
0,15
3,21
0,02
0,09
0,03
0,03
0,07
0,09
0,02
0,03
0,02
FREQ. K2
26
41
5
26
350
33
4.621
22
28
26
65
26
10
66.047
742
28.526
5
316
13
15
212
361
0
49
15
K2 %
KEYNESS
1.692,30 1.692,30
986,5
941,6
762,2
0,03
644,2
579,2
0,46
543,7
522,3
469,1
450,1
421,2
399
383,1
6,54
373
0,07
354,9
2,82
348,1
343,6
0,03
339,5
331
320
0,02
317,2
0,04
315,3
306,4
305,8
289,2
Tab. 33: Die obersten 25 Typen der Keyword-Liste K3 zu K2
Diese Keyness-Liste zeigt deutlich, dass im Presse-Korpus K3 Ortsund Landesbezeichnungen überwiegen, die auf Krisenregionen und
Machtzentren schließen lassen. Dazu gehören Typen wie >IRAQ<,
>KUWAIT<, >GULF<, >ARABIA<, >HONG<, >EAST<.
Spitzenreiter in der Liste ist >SOVIET< mit 2370 Token im
Ausgangskorpus K3 (0,12 %) gegenüber nur 26 im Referenzkorpus
K2 (0 %). Der Keyness-Wert beträgt 1692,30.
Auf Rang zwei steht >IRAQ< mit 1577 in K3 (0,08 %) gegenüber nur
41 in K2 (0 %), obwohl der Irak als permanente Krisenregion
bezeichnet werden kann. Die Type >IRAQ< erzielt damit 986,5
Keyness-Punkte.
157
Auf Rang drei folgt >KUWAIT< mit 1228 Token (0,06 %) in K3
versus fünf (0 %) in K2 und einem Keyness-Wert von 941,6. Auf
Rang vier steht >IRAQI< mit 1179 Token in K3 (0,06 %) und 26 in
K2 (0 %), das sind 762,2 Keyness-Punkte.
Die Type >PRESIDENT< (Rang 5) erzielt 2447 Token in K3
(0,12 %) und 350 in K2 (0,03 %). Der Keyness-Wert beträgt 644,2.
Der Begriff >GULF< (Rang 6) zählt 984 Token in K3 (0,05 %)
gegenüber 33 in K2 (0 %), Keyness-Wert 579,2. Die Type >MR<
(Rang 7) kommt 13 581-mal in K3 vor (0,67 %), 4621-mal in K2
(0,46 %), das ergibt 543,7 Keyness-Punkte.
Rang 8 >ARAB< findet sich in K3 837-mal (0,04 %), in K2 22-mal
(0 %), der Keyness-Wert beträgt 522,3. Auf Rang neun befindet sich
der Städtename >MOSCOW<. Er kommt in K3 805-mal vor
(0,04 %), in K2 28-mal (0 %). Der Keyness-Wert beträgt 469,1. Auf
Rang zehn steht >SAUDI< mit 767 Token (0,04 %) in K3 und 26 in
K2 (0 %). Das erzeugt 450 Keyness-Punkte. Die Type >OIL< steht
auf Rang elf, sie erreicht 937 Token in K3 (0,05 %) und 65 in K2
(0 %). Das sind 421,2 Keyness-Punkte. Rang 12 >COMMUNIST<
erfährt 698 Nennungen in K3 (0,03 %) und 26 in K2 (0 %), wodurch
399 Keyness-Punkte erzeugt werden.
>SADDAM< (Rang 13) kommt auf 570 Token in K3 (0,03 %)
gegenüber nur 10 in K2 (0 %). Daraus ergeben sich 381,1 KeynessPunkte. >SADDAM< ist damit der wichtigste Name in dieser
Keyness-Konstellation.
Der bestimmte Artikel >THE< ist auf Rang 14 der Keyword-Liste zu
finden. Er kommt 144 181-mal in K3 vor (7,13 %) und 66 047-mal in
K2 (6,54 %). Der Keyness-Wert beträgt 373.
Die Type >US< erzielt 3051 Token in K3 und 742 in K2 (0,07 %).
Wir müssen wieder berücksichtigen, dass >US< sowohl als Pronomen
als auch als Kürzel für United States stehen kann. Der Keyness-Wert
beträgt 354,9.
Rang 16 >OF< ist 64 965-mal in K3 enthalten (3,21 %) und 28 526mal in K2 (2,82 %), der Keyness-Wert beträgt 348,1. Die Abkürzung
>EC< (Rang 17) erfährt 479 Nennungen in K3 (0,02 %) und fünf in
K2 (0 %), Keyness-Wert 343,6.
Die Type >UNION< mit 1737 Token in K3 (0,09 %) und 316 in K2
(0,03 %) erzielt 339,5 Keyness-Punkte (Rang 18). Die Type
>ARABIA< (Rang 19) erzielt mit 524 Token (0,03 %) in K3 versus
158
13 in K2 (0 %) 331 Keyness-Punkte. >INVASION< (Rang 20) erzielt
mit 523 Token (0,03 %) in K3 und 15 in K2 (0 %) 320 KeynessPunkte. Das resultiert ebenfalls aus der Tatsache, dass der Irak am
2.8.1990 den Nachbarstaat Kuwait angriff.
Rang 21 >MILITARY< erzielt in K3 1345 Token (0,07 %)
gegenüber 212 in K2 (0,02 %), der von Wordsmith errechnete
Keyness-Wert beträgt 317,2. Auf Rang 22 finden wir >EAST< mit
1828 Token in K3 (0,09 %) gegenüber 361 in K2 (0,04 %). >EAST<
erreicht somit 315,3 Keyness-Punkte. Der Ost-West-Konflikt befand
sich damals in der Endphase, die Sowjetunion löste sich am
12.12.1991 auf.
Auf Rang 23 finden wir >GORBACHOV< mit 378 Token in K3
(0,02 %) und keiner Nennung in K2. Der Keyness-Wert beträgt 306,4.
Auf Rang 24 finden wir die Abkürzung >C< als Type. Diese kommt
in K3 689-mal vor (0,03 %) und in K2 nur 49-mal (0 %). >C<
erreicht damit 305,8 Keyness-Punkte.24 In dieser Liste befinden sich
lediglich zwei Namen: >SADDAM< und >GORBACHOV<. Dies ist
ein weiterer Beleg dafür, dass Namen 2001 stärker im Mittelpunkt
standen als 1990.
6.4.3.5 Die Keyword-Liste von (K1 + K2) mit K3 als
Referenzkorpus
Für die folgenden Keyness-Analysen wurden die Korpora K1 und K2
zu einem Korpus zusammengefasst (K1 + K2) und mit K3 verglichen.
Beide Listen (K1 + K2) zu K3 und zweitens K3 zu (K1 + K2) sind
deutlich von den jeweiligen Hauptereignissen geprägt. Im Folgenden
sind die obersten 25 Analyseergebnisse aufgeführt:
24
In den meisten Fällen steht diese Abkürzung >C< für >CONSERVATIVE PARTY<. Die Abkürzung wurde
sehr häufig im Rahmen der landesweiten Abstimmung zum Thema Abtreibung verwendet, als die Ergebnisse in
den Zeitungen veröffentlicht wurden. Andere Verwendungen sind z.B. >HEPATITIS C<, >CLASS C DRUG<
und >C$< (Canadian dollars).
159
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
WORD
FREQ. K1/K2
1.353
BLAIR
955
BIN
AFGHANISTAN 1.150
759
TALEBAN
721
TALIBAN
5.592
I
762
LADEN
4.173
SHE
682
DUNCAN
4.206
HER
10.419
HIS
402
EU
741
TONY
537
ASYLUM
361
OSAMA
1.006
ATTACKS
373
ANTHRAX
459
HAGUE
738
TERRORIST
TERRORISM 589
318
BLAIR'S
337
SEEKERS
15.002
HE
741
SMITH
5.772
WE
K1/K2 %
0,07
0,05
0,06
0,04
0,04
0,28
0,04
0,21
0,03
0,21
0,52
0,02
0,04
0,03
0,02
0,05
0,02
0,02
0,04
0,03
0,02
0,02
0,74
0,04
0,29
FREQ. K3
23
14
61
0
0
2.747
14
2.037
31
2.144
7.132
0
111
37
0
248
4
28
145
82
2
6
11.697
164
3.852
K3.TXT % KEYNESS
1.674,70
1.197,50
1.196,10
1.052,60
999,9
0,14
993,5
936
0,1
751,9
733,8
0,11
683,7
0,35
623,2
557,5
522,1
521,5
500,6
0,01
491,6
478,5
461
435,7
432,2
419,5
415,2
0,58
414,2
398,4
0,19
387,3
Tab. 34: Die obersten 25 Typen der Keyword-Liste (K1 + K2) zu K3
In dieser Keynessliste zeigt sich, dass der 11. September im
zusammengefassten Korpus K1+K2 eine prägende Rolle spielt, auch
wenn die innenpolitischen Themen vor 9/11 statistisch
mitberücksichtigt wurden.
In diesem Hauptvergleich 2001 versus 1990 wird deutlich, dass die
Namen politischer Akteure am Anfang des neuen Jahrtausends eine
andere Rolle in den analysierten Printmedien spielen als noch zehn
Jahre zuvor. In der Keyness-Liste finden wir neun Namen. Das ist ein
deutlicher Beleg für eine zunehmende Boulevardisierung.
Das Range bewegt sich zwischen 387,3 und 1.674,70 (Mittelwert:
683,7). Die Schlüsselwörter sind von allen durchgeführten KeynessAnalysen in diesem Vergleich am höchsten bewertet. Auffällig ist
ferner die hohe Zahl an Subjekt- und Objekt-Pronomina zugunsten
von K1+K2 ( >I<, >SHE<, >HER<, >HIS<, >HE<, >WE<) unter
den obersten 25 Einträgen. Die Verwendung von Pronomina in
160
Zeitungstexten lässt Referenz entstehen und gilt in der funktionalen
Grammatik als Kohärenzphänomen (Thompson 2004, S.191).
Offensichtlich geschieht dieses 2001 stärker als noch 1990.
Auf Rang eins der Liste finden wir erneut den Namen >BLAIR< mit
1353 Token im Ausgangskorpus K1+K2 (0,07 %) versus 23 im
Referenzkorpus K3 (0 %). Der Keyness-Wert beträgt 1674,70 Punkte.
Auf Rang zwei finden wir >BIN< mit 955 Token in K1+K2 (0,05 %)
versus 14 Token (0 %) in K3. Der Keyness-Wert für >BIN< beträgt
1197,50. Auf Rang drei steht >AFGHANISTAN< mit 1150 Token in
K1+K2 (0,06 %) gegenüber 61 in K3 (0 %), Keyness-Wert 1196,10.
Rang vier nimmt >TALEBAN< ein. Diese Type erreicht 759 Token
in K1+K2 (0,04 %) gegenüber Null Token in K3. Der Keyness-Wert
beträgt 1052,60. Die Type >TALIBAN< (Rang fünf) erhält in der
Wordsmith-Zählung 721 Token in K1+K2 (0,04 %) gegenüber Null
Token in K3. Der Keyness-Wert für >TALIBAN< beträgt 999,9
Punkte. Auch hier zeigt sich, dass >TALIBAN< das wichtigste
Keyword gewesen wäre, hätte es nur eine Schreibweise gegeben.
Die Type >I<, auf Rang sechs stehend, zählt 5592 Token in K1+K2
(0,28 %) gegenüber 2747 in K3. Das Personalpronomen >I< erhält
damit 993,5 Keyness-Punkte. Rang sieben >LADEN< erzielt in
K1+K2 762 Token (0,04 %), in K3 nur 14 (0 %). Der Keyness-Wert
beträgt 936 Punkte. Auf Rang acht finden wir das SubjektPersonalpronomen >SHE< mit 4173 Token in K1+K2 (0,21 %)
versus 2037 in K3 (0,10 %), dadurch werden 751,9 Keyness-Punkte
erreicht. Der Name >DUNCAN< erzielt 682 Token in K1+K2 (0,03
%) versus 31 (0 %) in K3 mit einem Keyness-Wert von 733,8. Die
Werte für >HER< (Rang zehn) verteilen sich zu 4206 Token (0,21 %)
auf K1+K2 und zu 2144 Token auf K3 (0,11 %). Der von Wordsmith
erzeugte Keyness-Wert beträgt 683,7 Punkte. Rang elf >HIS< zählt
10 419 Token in K1+K2 (0,52 %) und 7132 in K3 (0,35 %). Das
ergibt 623,2 Keyness-Punkte. Das Kürzel >EU< auf Rang 12 erhält
402 Token in K1+K2 (0,02 %) gegenüber null Token in K3. Der
Keyness-Wert beträgt 557,5.
Der Vorname >TONY< erzielt mit 741 Token in K1+K2 (0,04 %)
und 111 in K3 (0 %) 522,1 Keyness-Punkte und steht damit auf Rang
13 der Liste. Rang 14 >ASYLUM< erfährt 537 Nennungen in K1+K2
(0,03 %) versus 37 (0 %) in K3, Keyness-Wert 521,5. Rang 15
>OSAMA< zählt 361 Token in K1+K2 (0,02 %) versus Null Token
161
in K3. Der Keyness-Wert beträgt 500,6. >ATTACKS< (Rang 16)
bringt es auf 1006 Token in K1+K2 (0,05 %) bzw. 248 (0,01 %) in
K3. >ATTACKS< erzielt dadurch 491,6 Keyness-Punkte.
Rang 17 >ANTHRAX< erfährt 373 Nennungen in K1+K2 (0,02 %)
gegenüber vier (0 %) in K3. Daraus werden 478,1 Keyness-Punkte
errechnet. Rang 18 >HAGUE< mit 459 Token in K1+K2 (0,02 %)
und 28 in K3 (0 %) erzielt 461 Keyness-Punkte. Die Type
>TERRORIST< erzielt 738 Token in K1+K2 (0,04 %) und 145
Token (0 %) in K3. >TERRORIST< erzielt 435,7 Keyness-Punkte.
Rang 20 >TERRORISM< zählt 589 Token in K1+K2 (0,03 %) und
82 in K3 (0 %). Der Keyness-Wert beträgt 432,2. Die Type
>BLAIR’S< kommt auf 318 Token in K1+K2 (0,02 %) und 2 (0 %)
in K3. Der Keyness-Wert zählt 419,5 Punkte, so dass >BLAIR’S<
Rang 21 einnimmt. Die Type >SEEKERS< erfährt in K1+K2 337
Nennungen (0,02 %), in K3 sind es sechs (0 %). Die 415,2 KeynessPunkte setzen diese Type auf Rang 22. Das Personalpronomen >HE<
erzielt 15 002 Token in K1+K2 (0,74 %), jedoch nur 11 697 (0,58 %)
in K3. Ein Keyness-Wert von 414,2 setzt >HE< auf Rang 23.
Rang 24 >SMITH< erhält 741 Token in K1+K2 (0,04 %), jedoch 164
(0 %) in K3, Keyness-Wert 398,4. Rang 25 >WE< hat in K1+K2
5772 Token (0,29 %), in K3 hingegen 3852 (0,19 %). Der KeynessWert beträgt 387,3.
Zu den wichtigsten Sachthemen, die hier anhand der Schlüsselwörter
repräsentiert sind, zählen der 11. September, „Asylum Seekers“, die
Unterhauswahlen 2001 und die EU.
6.4.3.6 Die Keyword-Liste von K3 mit (K1 + K2) als
Referenzkorpus
Die folgende Liste K3 zu (K1 + K2), die wieder aus 25 Typen
besteht, hat ein Range, das sich zwischen 419,8 und 2.327,00
(Mittelwert: 636,9) bewegt. Auch in dieser Liste ist es zu keiner
Verzerrung aufgrund von unterschiedlichen Größenverhältnissen
gekommen, sowohl K3 als auch K1 + K2 haben eine Korpusgröße
von rund zwei Millionen Wörtern.
Die Schwerpunkte in dieser Auswertung sind erneut unterschiedlich
gelagert, die Hauptereignisse von K1 und K2 werden gemeinsam
162
betrachtet. Diese Konstellation hebt hervor, welche Schlüsselwörter
im Korpus von 1990 im Vergleich zum zusammengefassten
Referenzkkorpus von 2001 enthalten sind.
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
WORD
SOVIET
KUWAIT
IRAQ
IRAQI
MR
GULF
POUNDS
COMMUNIST
UNION
OIL
MOSCOW
PRESIDENT
EC
SADDAM
GORBACHOV
EAST
C
CENT
HONG
PER
ARAB
INVASION
THE
KONG
AGED
FREQ. K3
2.370
1.228
1.577
1.179
13.581
984
2.836
698
1.737
937
805
2.447
479
570
378
1.828
689
3.086
482
3.230
837
523
144.181
446
1.033
K3 %
0,12
0,06
0,08
0,06
0,67
0,05
0,14
0,03
0,09
0,05
0,04
0,12
0,02
0,03
0,02
0,09
0,03
0,15
0,02
0,16
0,04
0,03
7,13
0,02
0,05
FREQ. K1/K2 K1/K2 %
157
30
164
65
9.162
0,45
127
1.144
0,06
48
546
0,03
149
102
1.038
0,05
11
45
0
704
0,03
93
1.568
0,08
28
1.704
0,08
181
52
133.371
6,6
28
304
0,02
KEYNESS
2.327,00
1.460,40
1.326,60
1.214,20
867,2
750,2
742,8
677,8
653
636,9
619,4
586,2
573,9
530,5
523,9
516,7
513,4
504,3
489,9
479,8
458,2
447,9
447,7
444,2
419,8
Tab. 35: Die obersten 25 Typen der Keyword-Liste K3 zu (K1 + K2)
Es zeigt sich, dass K3 auch in dieser Keyness-Konstellation eindeutig
von außenpolitischen Themen wie Hongkong, der Abstieg der
Sowjetunion und der Invasion Kuwaits geprägt ist.
Die Liste beinhaltet die folgenden Ergebnisse:
Mit großem Vorsprung auf Rang eins steht die Type >SOVIET< mit
dem höchsten Keyness-Wert aller für diese Dissertation
durchgeführten Analysen. >SOVIET< kommt im Ausgangskorpus
K3 auf 2370 Token (0,12 %). Im Referenzkorpus K1+K2 sind es 157
Token (0 %). Der errechnete Keyness-Wert beträgt 2327,0 Punkte.
Rang zwei >KUWAIT< erzielt 1228 Token in K3 (0,06 %), in
K1+K2 sind es 30 Token (0 %), Keyness-Wert 1460,40. Auf Rang
drei finden wir >IRAQ< mit 1577 Token in K3 (0,08 %), aber nur
163
164 in K1+K2 (0 %). Der Keyness-Wert für >IRAQ< beträgt
1326,60.
Auf Rang vier finden wir >IRAQI< mit 1179 Token (0,06 %) in K3
gegenüber 65 in K1+K2 (0 %), Keyness-Wert 1214,20. Die Type
>MR< erzielt 13 581 Token in K3 (0,67 %), jedoch 9162 in K1+K2
(0,45 %). Der Keyness-Wert beträgt 867,2 Punkte (siehe 6.2.3
Naming Strategies). Die Type >GULF< (Rang 6) zählt 984 Token in
K3 (0,05 %) gegenüber 127 in K1+K2 (0 %), Keyness-Wert: 750,2.
Rang sieben >POUNDS< erhält 2836 (0,14 %) versus 1144 Token
(0,06 %) und dadurch 742,8 Keyness-Punkte. Die britische Währung
ist damit 2001 weniger als halb so stark im Gespräch wie noch 1990.
Die Type >COMMUNIST< (Rang acht) erzielt 698 Token in K3
(0,03 %) gegenüber nur 48 in K1+K2 (0 %). Der Keyness-Wert für
>COMMUNIST< beträgt 677,8. Die Type >UNION< (Rang neun)
schafft es auf 1737 Token im Hauptkorpus von 1990 K3 (0,09 %)
gegenüber 546 (0,03 %) in den beiden Korpora von 2001 K1+K2
(Keyness-Wert 653). Die Type >UNION< ist häufig Bestandteil von
>SOVIET UNION<.
Rang zehn >OIL< erzielt 937 Token in K3 (0,05 %) gegenüber 149 in
K1+K2 (0 %). Der Keyness-Wert für >OIL< beträgt 636,9. Aufgrund
der Kuwait-Krise wurde 1990 häufiger die Ölversorgung thematisiert.
Der Städtename >MOSCOW< (Rang elf) zählt 805 Token in K3
(0,04 %) gegenüber 102 in K1+K2 (0 %). Das ergibt 619,4 KeynessPunkte.
Trotz des Falls des Eisernen Vorhangs 1989 und dem damit
verbundenen Machtverlust steht die Stadt Moskau 1990 immer noch
im Fokus der Berichterstattung, und das deutlich stärker als 2001.
Nummer 12 >PRESIDENT< findet sich 2447-mal in K3 (0,12 %)
jedoch nur 1038-mal in K1+K2 (0,05 %). Das sind 586,2 KeynessPunkte. Auf Rang 13 steht >EC< mit 479 Token in K3 (0,02 %)
versus 11 Token in K1+K2 (0 %). Das Kürzel der European
Community ist demnach ungebräuchlich geworden. Der KeynessWert beträgt 573,9. Rang 14 >SADDAM< zählt 570 Token in K3
(0,03 %), jedoch nur 45 (0 %) in K1+K2 (Keyness-Wert 530,5). Rang
15 >GORBACHOV< erreicht mit 378 Token in K3 (0,02 %) und
keiner Nennung in K1+K2 letztendlich 523,9 Keyness-Punkte.
Die Type >EAST<, häufig synonym verwendet für das alte
Osteuropa, ist Schlüsselwort Nummer 16. Es kommt 1828-mal in K3
164
vor (0,09 %), aber nur 704-mal im gleichgroßen Referenzkorpus
K1+K2 (0,03 %). Der von Wordsmith errechnete Keyness-Wert
beträgt 516,7 %. Auf Rang 17 steht die Abkürzung >C< mit 689
Nennungen in K3 (0,03 %) und 93 in K1+K2 (0 %). Der KeynessWert für diese Konstellation beträgt 513,4. Die Type >CENT< zählt
3086 Token in K3 (0,15 %), aber 1568 in K1+K2 (0,08 %). Die
Verwendung dieser Type hat sich nahezu halbiert. Der Keyness-Wert
von >CENT< beträgt 504,3 (s.u.).
Die Type >HONG<, Bestandteil des Städtenamens Hong Kong, ist in
K3 482-mal vorhanden (0,02 %), in K1+K2 jedoch nur 28-mal (0 %),
so dass ein Keyness-Wert von 489,9 Punkten entsteht.
Die Type >PER< erhält 3230 Token in K3 (0,16 %) jedoch nur 1704
in K1+K2 (0,08 %). Das ergibt einen Keyness-Wert von 479,8. Die
Verhältnisse sind ähnlich wie bei >CENT<. Ein Blick in die
Konkordanzlisten ergab, dass 1990 noch doppelt so häufig mit
Prozentwerten operiert wurde als in 2001, obwohl in K3 über keine
nationalen Wahlen berichtet wurde.25 Das lässt sich durch die
zunehmend isolierte Verwendung von Infografiken erklären
(Lilienthal 1998, S. 116), die als selbsterklärend vorausgesetzt
werden.
Rang 21 >ARAB< mit 837 Token in K3 (0,04 %) und 181 im
Referenzkorpus K1+K2 (0 %) erzielt 458,2 Keyness-Punkte. Der
Begriff >INVASION< zählt 523 Token in K3 (0,03 %) und 52 in
K1+K2 (0 %). Der Keyness-Wert beträgt 447,9. >THE< (Rang 23)
erzielt 144 181 Nennungen in K3 (7,13 %) versus 133 371 in K1+K2
(6,6 %). Der daraus erzeugte Keyness-Wert beträgt 447,7 Punkte.
Für >KONG< (Rang 24) sind in K3 insgesamt 446 Nennungen zu
verzeichnen (0,02 %) in K1+K2 jedoch nur 28 (0 %).26 Der KeynessWert beträgt 444,2. Auf Rang 25 befindet sich das Schlüsselwort
>AGED< mit 1033 Token in K3 (0,05 %) versus 304 Token in
K1+K2 (0,02 %). Der dazugehörige Keyness-Wert beträgt 419,8. Das
Alter von Personen wurde 1990 deutlich häufiger erwähnt, in vielen
Fällen als Bestandteil von Nominalphrasen-Appositionen, abgetrennt
durch Kommata hinter dem Namen.
25
Tatsächlich kommt >PER CENT< in K3 3022 mal vor, in K1+K2 jedoch nur 739+823= 1562 mal. Das
Prozentzeichen >%< findet sich hingegen nur 27-mal in K3, aber 524-mal in K2 und 287-mal in K1.
26
Die Werte für >HONG KONG< betragen 13+15 Nennungen in K1+K2 und 477 in K3. Die Differenz aus den
Zählungen für >HONG< und >KONG< resultiert daraus, dass die Genitiv-Formen, >KONG’S< (35 Token),
gesondert aufgelistet werden.
165
Es zeigt sich, dass 1990 die Reformen in Osteuropa, die Kuwaitkrise
und die Ausgliederung Hong Kongs aus dem „British Empire“ zu den
prägenden Ereignissen zählten.
Als Ergebnis der sechs oben aufgeführten Keyness-Listen können wir
festhalten, dass 1990 deutlich mehr Ortsbezeichnungen als
Schlüsselbegriffe fungierten. In dem Korpus von 2001 waren es
hingegen vorrangig die Nach- und Vornamen von Personen des
politischen Geschehens, aber auch Pronomina. Diese Tatsache konnte
nicht durch den Einfluss des 11. September abgeändert werden, auch
wenn Ortsbezeichnungen wie >AFGHANISTAN<, >KABUL<,
>PAKISTAN<, >KANDAHAR< eine Hochkonjunktur erlebten.
6.4.4 Weitere Schlüsselwörter im Zusammenhang mit dem 11.
September 2001
Im Rahmen dieser Keyness-Analysen bestand die Möglichkeit, die
einzelnen Subkorpora miteinander zu vergleichen, ebenso einzelne
Subkorpora mit einem Hauptkorpus als Referenzkorpus. Um weitere
Schlüsselbegriffe im Zusammenhang mit dem 11. September
ausfindig zu machen, wurden im Folgenden die drei Subkorpora, die
eine Zeitphase nach dem 11. September markieren, als
Ausgangskorpora verwendet, um einen Direktvergleich mit K2 als
Referenzkorpus zu ermöglichen.
Wir müssen bei diesen drei Einzelanalysen zwar berücksichtigen, dass
jedes der drei Subkorpora die Artikel einer eigenständigen Zeitung
beinhaltet, doch diese sind von den jeweiligen Hauptereignissen
gleichermaßen abhängig und den Informationen, die von den
Nachrichtenagenturen für alle Zeitungen angeboten werden.
6.4.4.1 Times.2001.danach mit K2 als Referenzkorpus
Zunächst die Keyword-Liste, die vom Subkorpus Times.2001.danach
mit dem Referenzkorpus K2 erstellt wurde. Die in dieser Liste
aufgeführten Schlüsselwörter stehen für die ersten sechs Wochen
Zeitungsberichterstattung von The Times nach dem 11. September
vom 12.9. bis zum 24.10.2001:
166
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
WORD
FREQ.
749
TALEBAN
619
BIN
AFGHANISTAN 628
493
LADEN
TERRORISM 363
435
TERRORIST
498
ATTACKS
250
ANTHRAX
1.026
US
208
OSAMA
185
KABUL
195
AFGHAN
206
PAKISTAN
462
MILITARY
457
AMERICAN
243
AL
575
WAR
335
AMERICA
138
QAEDA
TERRORISTS 206
220
ALLIANCE
122
LADEN'S
287
BUSH
215
AIRCRAFT
354
FORCES
Times.%
0,15
0,13
0,13
0,1
0,07
0,09
0,1
0,05
0,21
0,04
0,04
0,04
0,04
0,09
0,09
0,05
0,12
0,07
0,03
0,04
0,04
0,02
0,06
0,04
0,07
FREQ.
0
6
9
4
18
62
149
5
742
0
0
3
15
212
226
44
365
124
0
33
47
0
108
54
179
K2.TXT % KEYNESS
1.667,90
1.315,40
1.311,00
1.054,30
677,5
643,8
0,01
529,2
511,3
0,07
470,4
463
411,8
405,4
360,9
0,02
358,1
0,02
330,3
330,1
0,04
315,1
0,01
309
307,2
293
278,7
271,6
0,01
261,5
251,9
0,02
250,3
Tab. 36: Keyword-Liste Times.2001.danach zu K2
In diesem Korpusvergleich wird deutlich, dass während der
Berichterstattung in den Wochen nach 9/11 keine Themenvielfalt
gegeben war: ausnahmslos alle 25 Schlüsselbegriffe stehen im
Zusammenhang mit dem 11. September.
Das Range der 25 Keyness-Werte beträgt 250,3 – 1667,90 Punkte
(Mittelwert: 436). Auf Rang eins steht die Form >TALEBAN< mit
749 Token im Ausgangskorpus Times.2001.danach (0,15 %) und
keiner Nennung im Referenzkorpus K2. Der Keyness-Wert ist mit
1667,90 Punkten der höchste dieser Konstellation. Diese Tatsache
scheint ein Hinweis auf den überstürzten Versuch zu sein, ein neues
Feindbild aufzubauen (siehe: Kleinsteuber 2003, S.218). Weitere
Schlüsselbegriffe unterstützen diese Behauptung. Auf Rang zwei
finden wir >BIN<. Diese Type zählt 619 Token in
167
Times.2001.danach (0,13 %), jedoch nur sechs in K2 (0 %), so dass
ein Keyness-Wert von 1315,40 entsteht.27
Rang
drei
>AFGHANISTAN<
zählt
628
Token
in
Times.2001.danach, jedoch nur neun in K2 (0 %). Der Keyness-Wert
beträgt 1311,00. Die Type >TERRORISM< (Rang 5) erfährt 363
Nennungen in Times.2001.danach (0,07 %), auf der anderen Seite
nur 18 in K2 (0 %). Das ergibt 677,5 Keyness-Punkte.
Rang sechs >TERRORIST< zählt im ersten Subkorpus nach den
Terroranschlägen von New York Times.2001.danach 435 Token
(0,09 %) gegenüber 62 (0 %) in K2. Rang sieben >ATTACKS< zählt
498 Token im The Times-Subkorpus (0,10 %) und 149 (0,01 %) im
Hauptkorpus K2. Das ergibt einen Keyness-Wert von 529,2 Punkten.
Rang acht >ANTHRAX< erzielt 250 Token in Times.2001.danach
(0,05 %), jedoch nur fünf in K2 (0 %). Der Keyness-Wert beträgt
511,3 Punkte. Die Type erzielt im Subkorpus von The Times ihr
Maximum. In den Wochen nach 9/11 sind tatsächlich mehrere
Anthrax-Anschläge verübt worden.
Listeneintrag Nummer neun >US< erzielt 1026 Token (0,21 %) in
Times.2001.danach, auf der anderen Seite nur 742 Token (0,07 %)
im doppelt so großen Hauptkorpus K2. >US< erhält dadurch einen
Keyness-Wert von 470,4. Rang zehn >OSAMA< kommt in
Times.2001.danach 208-mal vor (0,04 %), in K2 gibt es diese Type
nicht (463 Keyness-Punkte).
Der Städtename >KABUL< erreicht eine Tokenzahl von 185 in
Times.2001.danach (0,04 %) und Null in K2 (Keyness-Wert 411,8).
Rang 12 >AFGHAN< kommt auf 195 Token im The TimesSubkorpus Times.2001.danach (0,04 %) und auf drei Token in K2 (0
%). Der Keyness-Wert für >AFGHAN< beträgt 405,4. Rang 13
>PAKISTAN< kommt auf 206 Token in Times.2001.danach
(0,04 %) und 15 Token (0 %) in K2. Der Keyness-Wert beträgt 360,9.
Den Ländern Pakistan und Afghanistan wurde eine Teilschuld an den
Hergängen angelastet.
Die Type >MILITARY< (Rang 14) erzielt 462 Token im Subkorpus
(0,09 %) und 212 (0,02 %) in K2. Der Keyness-Wert beträgt 358,1.
Für >AMERICAN< ergeben sich 457 und 0,09 %
(Times.2001.danach) sowie 226 und 0,02 % (K2) bei einem
27
Die Kollokationen in den sechs Fällen sind >BIN BAG<, >BIN TO<, >BIN THERE<, >IN THE BIN<,
>MOHAMMAD BIN RASHID< und >WHEELIE BIN<.
168
Keyness-Wert von 330,3. Die Type >AL< umfasst 243 Token in dem
rund 500 000 Wörter starken Subkorpus (0,05 %), jedoch nur 44
Token im circa eine Mio. starken Hauptkorpus K2. Der Keyness-Wert
für >AL<, den arabischen Artikel, beträgt 330,1. Die Type >WAR<,
575 Token (0,12 %) in Times.2001.danach gegenüber 365 Token
(0,04 %) in K2, erzielt 315,1 Keyness-Punkte.
Die Type >AMERICA< mit 335 Token (0,07 %) in
Times.2001.danach und 124 (0,01 %) in K2 kommt auf einen
Keyness-Wert von 309. Es ist das einzige Mal, dass >AMERICA<
unter die obersten 25 Ränge einer Keyness-Liste gelangt.
Die Type >QAEDA< erfährt 138 Nennungen (0,03 %) in
Times.2001.danach gegenüber Null Token in K2 (Keyness-Wert
307,2). Die zuvor unbekannte Terrororganisation wurde zum ersten
Mal am 20.09.2001 von George Bush namentlich genannt.
>TERRORISTS<, zu 206 Token (0,04 %) in Times.2001.danach
enthalten vs. 33 Token in K2 (0 %), erzielt 293 Keyness-Punkte. Für
die Type >ALLIANCE< auf Rang 21 finden wir 220 Token im
Subkorpus von The Times von 2001 (danach), aber nur 47 Token
(0 %) im Hauptkorpus (2001 vor 9/11). Wir erhalten 278,7 KeynessPunkte.
Die Type >LADEN’S< (Rang 22) wird 122-mal für
Times.2001.danach aufgezählt (0,02 %), für K2 keinmal.
Wordsmith errechnet einen Keyness-Wert von 271,6.
Für >BUSH< sind 287 Token in Times.2001.danach zu verzeichnen
(0,06 %), in K2 sind es 108 Token (0,01 %). Das ergibt einen
Keyness-Wert von 261,5 (Rang 23). >AIRCRAFT< erzielt 215
Token in Times.2001.danach (0,04 %) jedoch nur auf 54 (0 %) in
K2. Der Keyness-Wert für >AIRCRAFT< beträgt 251,9.
Auf Rang 25 der Liste steht >FORCES< (354 Token bei 0,07 % in
Times.2001.danach gegenüber 179 Token bei 0,02 % in K2). Diese
Type erzielt 250,3 Keyness-Punkte.
Es sind nur zwei Personen namentlich unter den obersten 25 Einträgen
zu finden: Osama Bin Laden und Bush. Es fällt ferner auf, dass
weder die Type >NEW< noch >YORK< unter den Schlüsselwörtern
zu finden sind.
169
6.4.4.2 Guardian.2001.danach mit K2 als Referenzkorpus
Im Folgenden betrachten wir das zweite Zeitintervall vom 25.10.2001
bis zum 9.11.2001. Es handelt sich um das Subkorpus
Guardian.2001.danach, das mit dem Hauptkorpus K2 verglichen
wurde. Das Range der gewonnenen 25 Keyness-Werte reicht von
109,5 – 1264,30 (Mittelwert: 255,2).
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
WORD
FREQ. GUARD~% FREQ. K2.TXT %
390
0,16
1
TALIBAN
0,12
9
AFGHANISTAN 304
169
0,07
6
BIN
607
0,25
742
0,07
US
135
0,06
4
LADEN
100
0,04
0
QAIDA
159
0,07
47
ALLIANCE
155
0,06
44
AL
154
0,06
58
BOMBING
0,04
18
TERRORISM 107
85
0,03
3
AFGHAN
76
0,03
0
OSAMA
87
0,04
5
ANTHRAX
72
0,03
0
KABUL
90
0,04
15
PAKISTAN
127
0,05
62
TERRORIST
204
0,08
212
0,02
MILITARY
0,07
155
0,02
SEPTEMBER 173
166
0,07
149
0,01
ATTACKS
254
0,1
365
0,04
WAR
162
0,07
179
0,02
FORCES
127
0,05
115
0,01
TROOPS
39
0,02
0
MAZAR
0,03
33
TERRORISTS 71
75
0,03
43
MUSLIM
KEYNESS
1.264,30
918,2
503,9
453
407,7
327,6
319,9
316,5
280,7
255,2
253,5
248,9
248,3
235,8
215,2
203,6
183,4
180
172,4
151,7
136,2
130,8
127,7
116,9
109,5
Tab. 37: Keyword-Liste Guardian.2001.danach zu K2
Anhand dieser Liste wird deutlich, dass die Berichterstattung über
9/11 bereits in die nächste Phase übergegangen ist. Die
Themenvielfalt ist offensichtlich immer noch stark eingeschränkt,
auch in diesem Subkorpus geht es um die neuen Feindbilder:
Im Gegensatz zur vorherigen Keyness-Analyse steht hier eine
Schreibvariante von >TALEBAN<, nämlich >TALIBAN<, an erster
Stelle. Die Type >TALIBAN< kommt im Ausgangskorpus
Guardian.2001.danach 390-mal vor (0,16 %), in K2 hingegen nur
einmal (0 %). Der Keyness-Wert beträgt 1264,30. Auf Rang zwei
170
folgt >AFGHANISTAN< mit 304 Token (0,12 %) in
Guardian.2001.danach und neun Token (0 %) in K2.
>AFGHANISTAN< ist etwas schwächer vertreten als zuvor im
doppelt so großen Subkorpus von The Times. Der Keyness-Wert
beträgt 918,2 Punkte.
Rang drei >BIN< erreicht in Guardian.2001.danach 169 Token
(0,07 %) in K2 hingegen nur sechs (0 %). Der Keyness-Wert beträgt
503,9. Auf Rang vier steht >US<. Diese Type erreicht in
Guardian.2001.danach 607 Token (0,25 %). In K2 sind es zwar 742
Token (0,07 %), jedoch ist K2 mit rund einer Mio. Wörtern viermal so
groß wie das verwendete The Guardian-Subkorpus. Der KeynessWert beträgt 453 Punkte.
Rang fünf >LADEN< erzielt in Guardian.2001.danach 135 Token
(0,06 %), in K2 hingegen nur vier (0 %). Der Keyness-Wert beträgt
407,7. Auf Rang sechs finden wir >QAIDA<, eine Schreibvariante
des im vorherigen Abschnitt abgehandelten >QAEDA<. Die Type
>QAIDA< erzielt 100 Token in Guardian.2001.danach (0,04 %). In
K2 existiert dazu kein Token. Der Keyness-Wert beträgt 327,6.
Rang sieben >ALLIANCE< erhält 159 Token (0,07 %) im
Ausgangskorpus Guardian.2001.danach gegenüber 47 Token (0 %)
in K2. Das macht 319,9 Keyness-Punkte. Die Type >AL< (Rang acht)
hat 155 Token in Guardian.2001.danach zu verzeichnen (0,06 %),
auf der anderen Seite nur 44 Token (0 %) in K2. Der Keyness-Wert
für >AL< beträgt 316,5.
>BOMBING< (Rang neun) schafft es auf 154 Token im Subkorpus
von The Guardian (0,06 %) gegenüber 58 (0 %) in K2. Der KeynessWert beträgt 280,7. Nummer 10 >TERRORISM< erzielt 107 Token
im The Guardian-Subkorpus (0,04 %) versus 18 in K2 (0 %). Der
Keyness-Wert beträgt 255,2. Die fallende Tendenz gegenüber der
vorhergehenden Analyse (6.4.4.1.) belegt ein Abklingen der
Anfangspanik (siehe auch Werte für >TERRORIST< und
>TERRORISTS<).
>AFGHAN< steht in dieser Liste auf Rang 11. Es sind 85 Token
(0,03 %) im Subkorpus gegenüber drei in K2 (0 %). Der KeynessWert beträgt 253,5. Für den arabischen Vornamen >OSAMA< (Rang
12) sind 76 Nennungen in Guardian.2001.danach zu verzeichnen
(0,03 %). In K2 hingegen ist die Type nicht vorhanden. Es entsteht ein
Keyness-Wert von 248,9.
171
Rang 13 >ANTHRAX< ist in dieser Liste nicht mehr so stark
vertreten wie in der Keyness-Liste von Times.2001.danach mit K2
als
Referenzkorpus
(s.o.).
>ANTHRAX<
erzielt
in
Guardian.2001.danach 87 Token (0,04 %), in K2 hingegen nur fünf
(0 %). Der Keyness-Wert beträgt hier 248,3 Punkte. In der Liste von
Times.2001.danach mit dem Referenzkorpus K2 waren es noch
511.3 Keyness-Punkte. In der letzten Liste dieser Untersuchung
(Independent.2001.danach zu K2) ist >ANTHRAX< nicht mehr
unter den obersten 25 Einträgen zu finden.
Die aktuelle Liste zeigt auf Rang 14 >KABUL<. Diese Type zählt 72
Token in Guardian.2001.danach (0,03 %) und Null Token in K2.
Der Keyness-Wert beträgt 235,8 (in Tab. 36 waren es noch 411,8
Keyness-Punkte). Rang 15 >PAKISTAN< erreicht 90 Token in
Guardian.2001.danach (0,04 %) versus 15 Token (0 %) in K2. Der
Keyness-Wert beträgt 215,2 Punkte. Rang 16 >TERRORIST<
kommt auf 127 Token in Guardian.2001.danach (0,05 %) gegenüber
62 (0 %) in K2, Keyness-Wert: 203,6 (in Tab. 36. waren es noch
643,8 Keyness-Punkte). Die Type >MILITARY< (Rang 17) erzielt
204 Token in Guardian.2001.danach (0,08 %), jedoch 212 Token im
viermal so starken Hauptkorpus K2 (0,02 %). Der Keyness-Wert
beträgt 183,4. In Tab. 36 lag >MILITARY< noch bei 358,1 KeynessPunkten. Rang 18 >SEPTEMBER< erzielt 173 Token in
Guardian.2001.danach (0,07 %) gegenüber 155 in K2 (0,02 %). Der
Keyness-Wert beträgt 180. Der Monat September ist zum Synonym
für die Katastrophe geworden.
>ATTACKS< hat gegenüber der vorherigen Liste deutlich verloren.
Es sind 166 Token in Guardian.2001.danach (0,07 %). Die
Häufigkeit in K2 beträgt 149 Token (0,01 %). Der Keyness-Wert liegt
jetzt bei 172,4 gegenüber 529,2 in der Analyse für
Times.2001.danach verglichen mit K2. Rang 20 >WAR< zählt jetzt
in Guardian.2001.danach 254 Token (0,01 %) gegenüber 365
(0,04 %) in K2. Der Keyness-Wert liegt bei 151,7, in der vorherigen
Liste waren es noch 315,1.
Rang 21 >FORCES< zählt 162 Token in Guardian.2001.danach
(0,07 %). Im Referenzkorpus K2 sind es 179 Token (0,02 %). Der
dazugehörige Keyness-Wert beträgt 136,2. Rang 22 >TROOPS<
zählt 127 Token in Guardian.2001.danach (0,05 %). In K2 sind es
115 Token (0,01 %). Der Keyness-Wert beträgt 130,8 Punkte.
172
Die Type >MAZAR< (Rang 23), das ist der Name einer Stadt in
Afghanistan, ist in Guardian.2001.danach 39-mal genannt
(0,02 %), in K2 keinmal (Keyness-Wert 127,7). >TERRORISTS<
hat gegenüber der vorhergehenden Keyness-Liste (Tab. 36) stark
verloren. Es sind 71 Token in Guardian.2001.danach (0,03 %). In
K2 sind es 33 Token (0 %). Der Keyness-Wert beträgt 116,9 Punkte
(zuvor 293). Auf Rang 25 steht >MUSLIM< mit 75 Token in
Guardian.2001.danach (0,03 %) versus 43 (0 %) in K2. Der
Keyness-Wert beträgt 109,5. Wir stellen fest, dass viele
Schlüsselbegriffe mit zunehmendem Abstand zu den Terroranschlägen
an
Keyness,
also
an
Schlüsselwortfunktion
verlieren
(>TERRORISM<,
>TERRORIST<,
>TERRORISTS<,
>ANTHRAX<,
>KABUL<,
>AFGHAN<,
>AMERICA<,
>ATTACKS<, >LADEN<, >OSAMA<), andere hingegen
hinzugewinnen (>ALLIANCE<, >BOMBING<, >QAIDA<).
6.4.4.3 Independent.2001.danach mit K2 als Referenzkorpus
In einer letzten Keyword-Analyse sei hier das zeitlich jüngste
Subkorpus nach dem 11. September 2001 verwendet:
Independent.2001.danach, das vom 26.11.2001 bis zum 11.12.2001
reicht. Als Referenzkorpus diente wieder K2, das Hauptkorpus, das
die Zeit vom 1.6. bis zum 11.9.2001 repräsentiert. Das Range der
obersten 25 Werte beträgt 156,5 – 1019,50 (Mittelwert 277,9).
Diese dritte Keyness-Liste mit Independent.2001.danach als BezugsKorpus lässt einen neuen Schwerpunkt in der Berichterstattung
erkennen, denn jetzt ist auch der Konflikt in Israel und den
Palästinensergebieten berücksichtigt.
173
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
WORD
FREQ.
318
TALIBAN
AFGHANISTAN 197
140
KANDAHAR
149
BIN
110
QA'IDA
120
LADEN
159
ALLIANCE
522
US
148
AL
131
ARAFAT
PALESTINIAN 195
164
ISRAEL
81
AFGHAN
71
OSAMA
213
FORCES
93
FIGHTERS
180
ISRAELI
65
KABUL
TERRORISM 91
87
HAMAS
57
MULLAH
169
ATTACKS
53
KARZAI
58
OMAR
126
ITV
INDEP %
0,13
0,08
0,06
0,06
0,04
0,05
0,06
0,21
0,06
0,05
0,08
0,07
0,03
0,03
0,09
0,04
0,07
0,03
0,04
0,04
0,02
0,07
0,02
0,02
0,05
FREQ.
1
9
0
6
0
4
47
742
44
32
122
86
3
0
179
17
136
0
18
22
1
149
0
3
89
K2.TXT % KEYNESS
1.019,50
569,6
454,5
435,6
357,1
356
315,6
0,07
307,2
293,1
277,9
0,01
264,2
248,4
238,4
230,5
0,02
229,7
214,7
0,01
212,2
211
205,6
182,5
175,4
0,01
174,5
172
165,7
156,5
Tab. 38: Keyword-Liste Independent.2001.danach zu K2
Die Themenvielfalt scheint allmählich wieder zuzunehmen, auch
wenn der Brennpunkt Israel ähnliche, von Terror und Mord geprägte
Themen hervorbringt. Die Werte im Einzelnen sind wie folgt:
Auf Rang eins der Liste steht wieder >TALIBAN< mit 318 Token in
Independent.2001.danach (0,13 %) und einer einzigen Toke in K2
(0 %). Der Keyness-Wert beträgt etwas weniger als in der vorherigen
Analyse (1019,50 Keyness-Punkte). Rang zwei >AFGHANISTAN<
hat im Subkorpus 197 Token (0,08 %), in K2 sind es neun Token
(0 %). Der Keyness-Wert liegt jetzt bei 569,6. Rang drei
>KANDAHAR< zählt in Independent.2001.danach 140 Token
(0,06 %), in K2 existiert diese Type nicht (Keyness-Wert 454,5).
>BIN< erzielt 149 Token in Independent.2001.danach (0,06 %), in
K2 jedoch nur sechs (0 %). Der Keyness-Wert beträgt 435,6. Auf
Rang 5 steht >QA’IDA<. Dieses ist die spezielle Schreibvariante des
Independent. In diesem Subkorpus finden wir sie 110-mal (0,04 %),
in K2 keinmal. Der Keyness-Wert beträgt 357,1. Hier ist ein Anstieg
zu verzeichnen (Tab. 35: >QAEDA< 307,2; Tab. 36: >QAIDA<
174
327,6 Keyness-Punkte). Mit zunehmendem Abstand von 9/11 gewinnt
dieses Schlüsselwort trotz unterschiedlicher Schreibvarianten weiter
an Gewicht (siehe Punkt 6.4.5.5).
Auf Rang sechs finden wir >LADEN<. Wordsmith zählt 120 Token
in Independent.2001.danach (0,05 %) und vier Token in K2 (0 %).
Der Keyness-Wert beträgt 356. Auch dieses Schlüsselwort verliert
von Untersuchungszeitraum zu Untersuchungszeitraum an Stärke.
Der Begriff >ALLIANCE< (Rang 7) erzielt 159 Token in
Independent.2001.danach (0,06 %). In K2 sind es 47 Token (0 %).
Der Keyness-Wert beträgt 315,6 Punkte, ist jedoch geringfügig
schwächer als in der vorigen Liste von Guardian.2001.danach mit
K2 als Referenzkorpus (319,9 Keyness-Punkte).
Rang acht >US< erzielt 522 Token in Independent.2001.danach
(0,21 %) und 742 Token in K2 (0,07 %). Der Keyness-Wert beträgt
307,2 Punkte. Auch diese Type verliert mit zunehmendem Abstand
zum 11. September stärker an Keyness.
Rang neun >AL< mit 148 Token in Independent.2001.danach
(0,06 %) und 44 Token in K2 (0 %) erzielt 293,1 Keyness-Punkte.
Auf Rang 10 ist >ARAFAT< zu finden, der Name des verstorbenen
Palästinenserführers.
Es
liegen
131
Token
für
Independent.2001.danach vor (0,05 %) versus 32 Token (0 %) in
K2. Dieser Name hat eine Keyness-Zahl von 277,9 zu verzeichnen. In
den anderen beiden bezüglich 9/11 herangezogenen Keyword-Listen
ist >ARAFAT< nicht unter den obersten 25 Einträgen zu finden.
Auch die Einträge elf und 12 sind neu unter den obersten 25. Die Type
>PALESTINIAN<
(Rang
11)
zählt
195
Token
in
Independent.2001.danach (0,08 %). In K2 sind es 122 Token (0,01
%) bei circa vierfacher Korpusgröße. Der Keyness-Wert beträgt 264,2
Punkte. Für die Type >ISRAEL< sind in Independent.2001.danach
164 Token zu verzeichnen (0,07 %). In K2 sind es 86 (0 %). Der
Keyness-Wert beträgt 248,4.
>AFGHAN< hat in Independent.2001.danach eine Häufigkeit von
81 Token (0,03 %). In K2 sind es nur drei Token (0 %). Der KeynessWert beträgt 238,4. Auch diese Type verliert mit zeitlichem Abstand
zum 11. September an Gewicht.
Rang 14 >OSAMA< zählt im Subkorpus von The Independent 71
Token (0,03 %). In K2 existiert kein Token dieser Form. Der
175
Keyness-Wert beträgt 230,5 Punkte. Auch >OSAMA< verliert im
Vergleich an Keyness.
Rang 15 >FORCES< mit 213 Token in Independent.2001.danach
(0,09 %) und 179 in K2 (0,02 %) erhält 229,7 Keyness-Punkte. Nach
den
136,2
Keyness-Punkten
in
der
Auszählung
von
Guardian.2001.danach mit K2 als Referenzkorpus kann diese Type
hinzugewinnen, erreicht jedoch nicht mehr den hohen Wert von 250,3
Keyness-Punkten aus der Analyse des The Times-Subkorpus.
Rang
16
>FIGHTERS<
erhält
93
Token
in
Independent.2001.danach (0,04 %) gegenüber 17 in K2 (0 %). Der
Keyness-Wert beträgt 214,7. >FIGHTERS< ist hier das erste Mal
unter den ersten 25 Typen zu finden. Das Gleiche gilt für Rang 17
>ISRAELI<. Diese Type erreicht 180 Token im The IndependentSubkorpus (0,07 %) versus 136 in K2 (0,01 %). Der Keyness-Wert
beträgt 212,2.
Nummer 18 >KABUL< liegt bei 65 Token im The IndependentSubkorpus (0,03 %). In K2 ist >KABUL< keinmal enthalten. Der
Keyness-Wert beträgt 211. Auch diese Type verliert mit Abstand zum
traumatischen Moment von New York immer stärker an Gewicht. Das
Gleiche gilt für >TERRORISM<. Independent.2001.danach
beinhaltet diese Type 91-mal (0,04 %) versus 18 Token in K2. Der
Keyness-Wert beträgt nur noch 205,6.
Einträge 20 >HAMAS< und 21 >MULLAH< sind zum ersten mal
unter den 25 Schlüsselwörtern zu finden. >HAMAS<, das ist der
Name einer militanten Palästinenserorganisation, zählt 87 Token im
Subkorpus von The Independent (0,04 %) gegenüber 22 (0 %) in K2.
Der Keyness-Wert beträgt 182,5. >MULLAH< zählt 57 Token in
Independent.2001.danach (0,02 %), jedoch nur eine Toke in K2
(175 Keyness-Punkte). Ein Mullah ist ein islamischer Lehrer bzw.
Theologiestudent. In den meisten Fällen ist Mullah Omar gemeint,
doch es gibt noch eine Reihe anderer islamischer Geistlicher, die nach
9/11 in der Zeitungsberichterstattung Erwähnung finden (Mullah
Turabi, Mullah Khaksar u.a.).
Rang 22 >ATTACKS< zählt 169 Token im The IndependentSubkorpus (0,07 %) versus 149 in K2 (0,01 %). Der Keyness-Wert
beträgt 174,5, dennoch ist dieser Wert geringfügig höher als im
Vergleich von Guardian.2001.danach und Referenzkorpus K2,
obwohl Independent.2001.danach jünger ist.
176
Auch Rang 23 >KARZAI< ist ein Neuzugang unter den ersten 25
Einträgen. Es sind 53 Token (0,02 %) in Independent.2001.danach
enthalten versus kein Token in K2. Der Keyness-Wert beträgt 172.
Karzai ist der Name des Präsidenten der Übergangsregierung von
Afghanistan.
Auch die Ränge 24 und 25 sind in den beiden vorhergehenden 25erListen nicht enthalten. Der Name >OMAR< (s.o. Mullah Omar)
erreicht 58 Token in Independent.2001.danach (0,02 %) versus drei
Token in K2 (0 %). Der Keyness-Wert zählt 165,7 Punkte.
An letzter Stelle der Liste finden wir >ITV<. Diese Type kommt 126mal in Independent.2001.danach vor (0,05 %) gegenüber 89 Token
(0 %) in K2. Der Keyness-Wert beträgt 156,5. ITV ist die Abkürzung
des britischen kommerziellen Fernsehsenders Independent
Television.
Die drei vorangegangenen Keyness-Auswertungen machen deutlich,
wie die kontextuelle Wahrscheinlichkeit, die durch den 11. September
erzeugt wurde, allmählich von Subkorpus zu Subkorpus an Stärke
verliert, auch wenn das Ereignis 9/11 und die damit verbundenen
Schlüsselbegriffe
lange
nachhallen.
Die
lexikalische
Wahrscheinlichkeit bestimmter Begriffe, die infolge der Katastrophe
sprunghaft anstieg, nimmt mit zeitlicher Entfernung der Subkorpora
von 9/11 ab. Andere Schlüsselwörter gewinnen im Zuge der
ausgelösten Ereigniskette an Stärke (>KANDAHAR<, >ARAFAT<,
>PALESTINIAN<, >ISRAEL<, >FIGHTERS<, >ISRAELI<,
>HAMAS<, >MULLAH<, >KARZAI<, >OMAR<, >ITV<).
6.4.5 Analyse ausgewählter Wortgruppen
Die in den Auswertungslisten erfassten Typen lassen sich
Wortgruppen zuordnen. Wir können dabei zusammengehörende
Begriffe Themen wie Arabisch, Gewalt, Terrorismus, Islam oder Al
Qaeda zuordnen. Diese Themen können auf der einen Seite als
Hyperonyme fungieren. Auf der anderen Seite können sie als
morphologische Kategorien gelten (z.B. wie aus den Allomorphen zu
>ARAB< ersichtlich), oder sogar verschiedene Schreibvarianten
zusammen betrachten (Al Qaida, Al-Qaeda, Al-Qa’ida, etc.).
177
Der Begriff Wortgruppe ist in diesem Zusammenhang nicht zu
verwechseln mit dem des Wortfeldes (siehe Kapitel 6.4.1).
Die hier gewählten Kategorien haben keinen Anspruch auf
Vollständigkeit und sollen lediglich dabei helfen, Tendenzen
widerzuspiegeln.
6.4.5.1 Die Wortgruppe „Arabisch“
Zunächst werden die Veränderungen bei der Wortgruppe „Arabisch“
untersucht, für die folgende Worttypen ausgewählt wurden: >ARAB<,
>ARABS< und >ARABIC<. Diese Auswahl wurde vorgenommen,
um einen Vergleich mit der Wortgruppe islamische Welt
vorzunehmen. Die Arabisch sprechenden Menschen sind zwar zur
überwiegenden Mehrheit Bestandteil der islamischen Welt, in der
Weltreligion Islam wird jedoch nur zu einem Teil Arabisch
gesprochen, denn hier gibt es Sprachen wie Urdu, Turksprachen,
Farsi bzw. Dari, Javanisch, Paschto, Pandschabi, Thai und viele mehr.
Thematische Landkarten für Sprachen und Religionen sind deshalb
nicht kongruent. 2,7 % der Weltbevölkerung sprechen Arabisch als
erste Sprache, jedoch sind 14 % Mohammedaner (Bertelsmann Atlas
International 1984, S. 355/56). Es muss einschränkend gesagt werden,
dass in allen muslimischen Ländern, ob Sunnitisch oder Schiitisch,
Standardarabisch in den Koranschulen gelernt wird, auch wenn
Umgangssprache und Amtssprache nicht der arabischen Sprachfamilie
(hamito-semitisch) angehören (Crystal 1997, S.318).
Superkorpus
K1
12.9.-11.12.01
WORD Freq.
% Freq.
%
1018 0,03
159 0,02
ARAB
41
57
ARABS
181
19
ARABIC
Σ
1240
235
K2
1.6.-11.9.01
Freq.
%
22
4
4
30
K3
1.1.-21.8.1990
Freq. St. Wert %
837
419 0,04
120
60
18
9
975
488
Tab. 39: Die Wortgruppe „Arabisch“ mit den Typen >ARAB<,
>ARABS< und >ARABIC<
Vergleichen wir die Werte für diese Wortgruppe, so stellen wir fest,
dass die größte Menge an Token in K3 erzielt wird, dass ist das
Korpus, das Artikel über die Kuwait-Krise enthält. Dort sind es 975
178
Nennungen (stand. Wert 488). Weniger als halb so viele Token dieser
Wortgruppe finden wir in K1, das Korpus, in das die Berichterstattung
über den 11. September fällt. Hier sind es 235 Token. Vergleichsweise
gering ist der Wert für K2 mit nur 30 Token insgesamt. Die
lexikalische Häufigkeit, die proportional zu Korpusgröße ist, nimmt
zwar nach dem 11. September deutlich zu, erreicht aber nicht die
Ausmaße wie zu Zeiten der Kuwait-Krise. Das ist ein Indiz dafür, dass
arabische Themen nach 9/11 deutlich stärker vertreten sind, aber
verglichen mit der Wortgruppe „islamische Welt“ (s.u.) kein
Maximum in K1 erreichen.
6.4.5.2 Die Wortgruppe „islamische Welt“
Was die lexikalische Häufigkeit von Bestandteilen aus der
Wortgruppe „islamische Welt“ anbetrifft, ist ein deutlicher
Spitzenwert in K1 zu verzeichnen. Hier sind es 847 Token gegenüber
112 in K2 und 588 (stand. Wert 295) in K3.
Superkorpus
WORD
Freq. %
160
ISLAM
0,01
ISLAMIC 505
ISLAMIST 34
0,01
MUSLIM 547
MUSLIMS 291
1537
Σ
K1
K2
K3
Freq. % Freq. %
Freq.
115
- 11
- 34
271 0,03 33
- 211
32
2
268 0,03 43
- 236
161 0,02 23
- 107
847
112
588
St. Wert %
17
106
118
0,01
54
295
Tab. 40: Die Wortgruppe „islamische Welt“
Diese Verteilung ist mit den Terroranschlägen von New York zu
erklären und der Suche nach den Drahtziehern in der islamischen
Welt, die nicht immer gleichzusetzen ist mit dem arabischen Raum.
Im Erhebungszeitraum von K2 kam es zwar auch zu Terroranschlägen
durch Religionsfanatiker, doch diese waren vergleichsweise harmlos.
Sie erreichten nicht den Schwellenwert für weltweite Fahndungen und
Truppenbewegungen. Der Wert für K3, nur etwa ein Drittel des
Wertes von K1, dennoch fast dreimal so groß wie der von K2, lässt
sich wieder mit der Kuwait-Krise und der Auseinandersetzung mit
Saddam Hussein und dem Irak erklären.
179
Es fällt auf, dass in den Korpora vor dem 11. September die Type
>MUSLIM<, zugleich Substantiv und Adjektiv, häufiger verwendet
wurde als >ISLAMIC<. Nach 9/11 wurde diese Proportion
umgekehrt.
Die Type >ISLAMIST<, die Bestandteil dieser Wortgruppe ist,
kommt ausschließlich in den Korpora von 2001 vor: 32-mal in K1
und zweimal in K2. In nur einem einzigen Fall liegt ein Substantiv
vor, das dazu mit einem großen Anfangsbuchstaben geschrieben ist:
“Maulana Sufi Mohammad, a leading Islamist, said he had
obtained permission from the Taliban to enter Afghanistan's Kunar
province to swell what he claimed were 12,000 Pakistani
volunteers.“
(The Guardian, 7.11.2001, Pakistanis reinforce Taliban trenches)
Im Oxford English Dictionary, Band VIII. finden wir den Eintrag:
Islamist, an orthodox Muslim (S.109).
Die Type >ISLAMIST< ist ein geeignetes Beispiel, dass ein relativ
seltenes Wort in der Presse an Bedeutung gewinnt, weil der Kontext
dieses erfordert. In der deutschsprachigen Presse beispielsweise sind
Begriffe wie >ISLAMISTEN<, >ISLAMISTISCH< und
>ISLAMISMUS< schon lange vor dem 11. September ein
unverzichtbarer Bestandteil der Diskussion über den Islam (z.B. FAZ,
30.08.2001, S.5, NZZ 28.8.2001, S.5, SZ 26.07.2001, S.8).
6.4.5.3 Die Wortgruppe „Terror“
Zur Bewertung der Wortgruppe „Terror“ wurden an dieser Stelle
nicht nur die Formen >TERROR<, >TERRORIST< und
>TERRORISM< herangezogen, sondern auch die vorhandenen
Allomorphe zur Grundform, damit das ganze Spektrum an
Verwendungen aufgezeigt werden kann.
180
K1
Nr. Word
1.
2.
3.
4.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
∑
TERROR
TERROR'S
TERRORISING
TERRORISM
TERRORIST
TERRORIST'S
TERRORISTS
TERRORITY
TERRORRIST
TERRORS
10
K2
Freq. %
214
1
5
571
676
1
336
1
2
1
1808
0,02
0,06
0,07
0,03
-
K3
Word
Freq. % Word
TERROR
TERRORISED
TERRORISING
TERRORISM
TERRORIST
TERRORISTS
6
12
3
3
18
62
33
131
-
TERROR
TERRORISE
TERRORISED
TERRORISM
TERRORIST
TERRORIST'S
TERRORISTS
TERRORIZE
TERRORIZED
TERROSRISTS
10
Freq. %
44
2
2
82
145
1
80
1
3
1
361
-
Tab. 41: Verwendung des Kopfwortes >TERROR< und dessen
Allomorphe
Die Formen sind im Folgenden diskutiert: In K1, dem Korpus von
2001 mit Texten erschienen nach 9/11 finden wir den Begriff
>TERROR< 214-mal, das sind 0,02 % von K1. >TERROR’S<
finden wir einmal, >TERRORISING< fünfmal, >TERRORISM<
571-mal (0,06 % von K1). Die Type >TERRORIST< zählt 676
Token (0,07 % von K1), >TERRORIST’S< eine Toke,
>TERRORISTS< 336 Token und damit 0,03 % von K1. Die mir
unbekannte Wortform >TERRORITY< ist einmal enthalten, das
orthografisch falsche >TERRORRIST< zweimal, >TERRORS<
einmal. Das sind insgesamt 1808 Wortformen inklusive und
aufbauend auf der Grundform >TERROR< und damit 0,18 % aller
Wörter des Korpus K1.
In K2 hingegen findet sich >TERROR< nur 12-mal,
>TERRORISED<
dreimal,
>TERRORISING<
dreimal,
>TERRORISM<
18-mal,
>TERRORIST<
62-mal,
>TERRORISTS< 33-mal. Die Grundform >TERROR< und die
darauf aufbauenden Wortformen lassen sich in K2 insgesamt 131-mal
finden, das sind 0,01 % des Korpus K2.
In K3, das von der Wortmenge so groß ist wie K1 und K2 zusammen,
also etwa 2 Millionen Wörter stark, finden wir die Type >TERROR<
181
44-mal, >TERRORISE< zweimal, >TERRORISED< ebenso
zweimal, >TERRORISM< 82-mal, >TERRORIST< 145-mal,
>TERRORIST’S< einmal, >TERRORISTS< 80-mal, die amerikanische Wortform >TERRORIZE< einmal, >TERRORIZED<
(am.) dreimal, >TERROSRISTS< inklusive eines orthografischen
Fehlers einmal. Das sind insgesamt 361 Wortformen und 0,02 % in
K3, die auf die Grundform >TERROR< aufbauen.
Zusammenfassend ist hier festzuhalten, dass K3 prozentual mehr als
doppelt so viele Wortformen beinhaltet, die auf der Grundform
>TERROR< aufbauen als K2, aber nur 1/9 der Menge von K1. Die
Verwendung der Wortgruppe Terror hat sich von K3 zu K1 circa um
den Faktor 9 vergrößert, von K2 zu K1 jedoch sogar um den Faktor
15. Auffällig ist ferner, dass in K1 zehn Worttypen enthalten sind, die
auf der Grundform >TERROR< aufbauen (inklusive der
orthografisch falschen Form >TERRORRIST<), in K2 sechs und in
K3 wieder zehn (inklusive der orthografisch falschen Form
(>TERROSRISTS<) und den amerikanischen Verwendungen
>TERRORIZE< und >TERRORIZED<).
6.4.5.4 Die Wortgruppe „Gewalt“
Um zu analysieren, ob nicht nur die Wortgruppe „Terror“ einen
starken Zuwachs nach dem 11. September erhalten hat, sondern
vielleicht sogar der gesamte Themenkomplex „Gewalt“, seien hier
Wörter aufgeführt, die Gewalt betreffen: >WAR<, >VIOLENCE<,
>DRUGS< und >CRIMINAL<. Gewalt ist ständig in den Medien
präsent, ob es die tägliche Gewalt auf der Straße ist oder Krieg.
Superkorpus K1
K2
(12.9.- 11.12.2001)
Nr.
1.
2.
3.
4.
Σ
WORD
Freq.
%
2583
WAR
860
VIOLENCE
656
DRUGS
601
CRIMINAL
4700
Freq.
0,06
0,02
0,02
0,01
1037
184
146
122
0,11
1489
K3
(1.6.-11.9.2001)
(1.1.-21.8.1990)
%
Freq.
%
Freq. Stand.W. %
0,1
365 0,04
1181
591 0,06
0,02
220 0,02
456
228 0,02
0,01
245 0,02
265
133 0,01
0,01
174 0,02
305
153 0,02
0,14
1004
0,1
2207
1105
0,11
Tab. 42: Die Wortgruppe „Gewalt“ mit den Typen >WAR<,
>VIOLENCE<, >DRUGS< und >CRIMINAL<
182
Betrachten wir die Spaltensummen der Tabelle, so erkennen wir
folgende Konstellation: am stärksten ist diese Wortgruppe in K1
vertreten. Dort sind es 1489 Token (0,14 %). Den zweithöchsten Wert
erreicht wieder K3 mit 2207 Token (stand. Wert 1105) und 0,11 %.
Geringfügig weniger erreicht K2 mit 1004 Token und 0,10 %.
Von einer Themenverdrängung im Bereich der Berichterstattung über
Gewalt ungeachtet der Wortgruppe Terror kann deshalb nicht die
Rede sein, was vor allem auf den herausragenden Wert für >WAR< in
K1 (1037 Nennungen) zurückzuführen ist. Über das Thema Drogen
ist hingegen in K2 am häufigsten berichtet worden (245 Nennungen).
6.4.5.5 Die Wortgruppe „Al-Qaida“ in den drei Subkorpora von
K1
Das Terrornetzwerk, das als Al-Qaida bezeichnet wird, findet sich
ausschließlich in den Zeitungsartikeln, die nach dem 20. September
erschienen sind. Es handelt sich dabei um einen Lehnwort aus dem
Arabischen, das infolge des 11. September in den Wortschatz der
nicht arabisch-sprechenden Welt aufgenommen wurde.
Die Al-Qaida wurde ursprünglich als eine Kontaktgruppe für
arabische Freiwillige aufgestellt, die dem afghanischen Widerstand
beitreten wollten (Townshend 2002, S.110).
Für die Weltöffentlichkeit war dieser Begriff zum ersten Mal im
Rahmen der Rede des amerikanischen Präsidenten Bush vor dem
amerikanischen Kongress am 20.09.2001 zu vernehmen. Bis auf eine
Ausnahme sind alle der in K1 vorkommenden 376 Formen mit dem
arabischen Artikel >AL< versehen, mal mit, mal ohne Bindestrich. Im
Arabischen Wörterbuch für die Schriftsprache der Gegenwart (Wehr
1985, S. 1045) finden wir den folgenden Eintrag:
‫ ة‬qā’ida pl. ‫ دعاوق‬qawā’id Grundlage; Basis; Fundament;
Grundlinie (geom.); Sockel, Fußgestell, Fuß, Piedestal; Stützpunkt
(mil.); …
Laut Görlach (1999, S. 143) haben Lehnwörter den folgenden Nutzen:
Sie dienen zur Bezeichnung fremder Gegenstände und Sachverhalte
aus einer Fremdsprache, in diesem Fall Arabisch, für deren
183
Umschreibung Begriffe der heimischen Sprache zu umständlich oder
missverständlich wären. Außerdem füllen Lehnwörter Lücken für
bekannte, bisher nicht bezeichnete Inhalte, erlauben eine feinere
Differenzierung, und dienen der Internationalität des Wortschatzes.
Wir können hier noch einen weiteren Grund anführen, dass sie zur
Marginalisierung von Gruppen oder zum Verfestigen eines
Feindbildes beitragen können, was besonders in Kriegszeiten üblich
ist (die Tommys, der Ivan, the krauts, the huns, etc.).
In der folgenden Liste wurden diesmal nur die Kopfwörter
aufgelistet, ungeachtet des Artikels und der Bindestriche. Es sind auch
die Genitiv-Formen mit Apostroph aufgeführt.
Nr.
1.
2.
3.
4.
5.
6.
7.
Σ
Independent.
Guardian.
Times.
2001.danach
2001.danach
2001.danach
(26.11.-11.12.2001)
(25.10.-9.11.2001)
(12..9.–24.10.20 01)
Word
Freq.
QAEDA
QAEDA'S
QA'IDA
QA’IDA’S
QAIDA
QAIDA’S
QAI’DA
%
Freq.
110 0,04
1
5
5
-
100
2
-
%
121
102
Freq.
-
0,04
-
138
7
8
153
stand. Wert %
69 0,03
4
4
77
Tab. 43: Verwendung des Wortes >AL-QAEDA< und dessen
Schreibvarianten
In den verwendeten drei britischen Zeitungen finden wir dieses
Lehnwort in unterschiedlichen Schreibvarianten. Je weiter das
Subkorpus vom Ereignis 9/11 entfernt liegt, desto häufiger wird das
Wort AL-QAEDA in seinen unterschiedlichen Schreibvarianten
verwendet. Es muss jedoch berücksichtigt werden, dass es erst rund
zehn Tage nach den Anschlägen zum ersten Mal verwendet wurde.
In Times.2001.danach sind es insgesamt 153 Formen aus dieser
Wortgruppe, der standardisierte Wert beträgt 77. Vier der 153
Formen schreiben sich ohne Bindestrich.
In Guardian.2001.danach sind es insgesamt 102 Nennungen, alle mit
Bindestrich geschrieben, in Independent.2001.danach sind es 121,
fünf davon ohne Bindestrich, eine Form ohne den Artikel >AL<.
Es wird deutlich, dass die drei betrachteten Zeitungen unterschiedliche
Varianten bevorzugen. The Times verwendet fast ausschließlich die
184
Form >QAEDA< (138-mal; sowie siebenmal mit Apostroph-S), The
Guardian >QAIDA< (100-mal) und The Independent bevorzugt
>QA’IDA< (110-mal), jeweils versehen mit der vorangestellten Form
des arabischen Artikels >AL<.
Zusätzlich ist in Times.2001.danach siebenmal die Form
>QAEDA’S< enthalten, in Guardian.2001.danach zweimal die
Form >QAIDA’S< und in Independent.2001.danach finden sich die
Formen >QAI’DA< (5x) und >QA’IDA’S< (1x).
Wir finden diverse Komposita bzw. Nominalphrasen, die eine der
Wortformen enthält, und das in allen drei Subkorpora. Die häufigsten
Formen sind: >AL-QAEDA FIGHTERS<, >AL-QAEDA
TERRORIST<,
>AL-QAEDA
BASES<,
>AL-QAEDA
NETWORK<,
>AL-QAEDA
CELL<,
>AL-QAEDA
MEMBERS<,
>AL-QAEDA
FORCES<,
>AL-QA’IDA
OPERATIVES<, u.v.a.
In The Independent sind 68 % der Formen Bestandteile von
Komposita. In The Guardian sind es 40 % und in The Times 57 %.
Die Terrororganisation >AL-QAEDA< wird zum ersten Mal in dem
Artikel Bush address to Congress erwähnt (The Times vom
21.09.2001). Darin ist die historische Rede des Präsidenten Bush in
editierter Form wiedergegeben. Hier lesen wir den Satz:
“Americans are asking,"Who attacked our country?" The evidence
we have gathered all points to a collection of loosely affiliated
terrorist organisations known as al-Qaeda.”
Damit waren die Schuldigen für die Terroranschläge vom 11.
September benannt.
Später fällt im Zusammenhang mit Al-QAEDA der Begriff
APPEASEMENT, der bisher historisch belegt war und für die Politik
des Britischen Außenministers Chamberlain gegenüber dem 3. Reich
im Rahmen der Annexion der Tschechoslowakei stand:
“The appeasement of al-Qaeda or any of its allied networks, most
especially by Muslim rulers fearful of being branded "traitors" to
Islam, will prolong the conflict unleashed on September 11 and add
to its dangers for Muslims as well as the West”
(The Times, The trouble when two priorities become three,
12.10.2001).
Doch es verstärkt sich der Eindruck, dass die führenden Politiker
Schwierigkeiten hatten, die Verantwortlichen von 9/11 genau zu
185
benennen, ob es ausschließlich die kleine Gruppe von Selbstmördern
war oder ob ein weltweit agierendes Terrornetzwerk verantwortlich
ist. Die erste Möglichkeit wurde schnell verworfen. Am 26.10.2001
schreibt Jack Straw, Foreign Secretary, in The Guardian:
“We tried hard to deal with the Taliban/al-Qaida nexus through
non-military means.”
(Building will follow the bombing).
In diesem Beispielsatz finden wir ein Zwillingskompositum, das eine
Gedankenbrücke herstellt. Durch diese Wortkombination wird ein
komplexer Sachverhalt, der Zusammenhang von Al-Qaeda und
Taliban, vereinfacht ausgedrückt (siehe auch: 6.5.2.1, Miller 1992,
S.140/41). Vielleicht sind sie ein weiterer Beleg für die
Kommunikationsprobleme, die nach dem 11. September in Anbetracht
der Katastrophe in weiten Teilen der Medien und der Öffentlichkeit
vorherrschten.
6.5 Morphologische Analysen: Ausgewählte Komposita
Dieses Unterkapitel beschäftigt sich mit der Kompositabildung in den
durch die Hauptkorpora repräsentierten Untersuchungszeiträumen.
Vorangestellt sei hier ein semantischer Exkurs, speziell über die
Sonderstellung von Homonymen, für die zum Teil dasselbe gilt wie
für Komposita: Eine computergestützte Bedeutungsanalyse ist nicht
möglich, ebenso nicht das Orten zusammengehöriger Formen.
6.5.1 Das Problem der Erkennung von Komposita und
Homonymie
Beim Durchsehen der Wortlisten werden wir fortwährend mit dem
Problem der Homonymie konfrontiert, das ist die Tatsache, dass
Lexemen zwar die gleiche Form haben, sich jedoch in ihrer
Bedeutungen unterscheiden (Lyons 1985, S.35). Wenn in der
herkömmlichen Häufigkeitsliste ein bestimmtes Wort erscheint, z.B.
>PLANT<, >FRONT<, >MAJOR<, >PRESS<, >NORMAN<, etc.,
so lässt sich daraus primär nicht erkennen, welche Bedeutung
186
intendiert ist. Wir erschließen den Bedeutungstyp erst, wenn wir in die
Kollokationsliste sehen, in der die Wortumgebungen des gesuchten
Wortes auf die tatsächliche Bedeutung hinweisen. Es lässt sich
feststellen, dass trotz derselben graphemischen Repräsentation mal ein
Nomen und mal ein Verb aufgelistet wurde, wie das Beispiel für
>PRESS< verdeutlicht, das der 216 Einträge starken Konkordanzliste
von K1 entnommen wurde.
N
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
Concordance
ly informed at 5pm. The press knew before the s
ylum-seekers. He must press ahead urgently w
appeared in the Iranian press. Israel cancelled
ident George Bush is to press US allies to outla
es were unduly late, the press corps would have
ave warned they would press charges if the thie
l workers dominated the press conference by Ari
rsue legal action. At a press conference in Lon
tic rebuff came at a joint press conference in Da
papers and the Catholic press in which he insiste
lar briefings for the Arab press at Downing Street
le story for the popular press, with daily twists
le story for the popular press, with daily twists
mber talking to an MoD press officer after the
rt by the Afghan Islamic Press said that Ms Ridle
ellation of a presidential press event yesterday af
Word No.
File
%
786.383
216.484
112.900
658.800
157.161
624.759
499.377
79.764
636.446
539.101
408.759
916.392
917.448
307.498
163.971
904.936
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
e:\k1.txt
78
22
11
65
16
62
50
8
63
54
41
91
91
31
16
90
*
*
*
Abb.: 14: Konkordanzliste von >PRESS< (Auszug, 16 von
insgesamt 216 Einträgen). Die Verben sind mit einem Asterisk
gekennzeichnet.
Neben dem Erkennen von Homonymen ist das Orten der Komposita
ein gravierendes Problem. Im Englischen werden Komposita entweder
auseinander oder durch einen Bindestrich verbunden oder zusammen
geschrieben, z.B. >ASYLUM SEEKERS< vs. >ASYLUMSEEKERS< vs. >ASYLUMSEEKERS<. Für viele Komposita gibt
es eine Standardversion, für andere gibt es keine Konvention (Seely
2004, S.32).
Diese Tatsache wird von „Wordsmith“ nicht erkannt und folglich
werden die Komposita aufgebrochen, jede Konstituente wird in den
Wortlisten separat aufgeführt, es sei denn, dass beide Formen
zusammengeschrieben sind. Nur mit Hilfe der Kollokationslisten oder
der Suchfunktion, in die das ganze Kompositum als eine Wortkette
eingegeben wird, lassen sich diese Wörter ausfindig machen. Deshalb
finden wir in den Wortlisten die folgenden Bezeichnungen nicht:
187
>NEW YORK<, >POLL TAX<, >ASYLUM SEEKERS<, >GULF
WAR<, >UNITED STATES<, >PRIME MINISTER<, etc. Das
birgt Schwierigkeiten, da diese Termini zusammen gehören und
separat ihre Gesamtbedeutung verlieren. Die Komposita gehen im
Gesamtkorpus auf, die Elemente besitzen einzeln eine andere
Bedeutung als in der zusammengesetzten Form.
Sowohl das Problem der Homonymie als auch das der Registrierung
der Komposita lässt sich nur umgehen, wenn annotierte
Vergleichskorpora mit Listen von Homonymen mit ihren
Kollokationen verwendet werden, oder auf der anderen Seite Listen
mit allen gängigen Komposita, diese ebenfalls annotiert. Dieses hätte
in Form von so genannten „parallel alligned corpora“ bzw.
„parallel corpora“ (Oakes 2003, S.135) zu geschehen, also parallel
angeordnete Vergleichskorpora. Das Annotieren bzw. Taggen der
betreffenden Wörter wäre wohl unumgänglich, es kommt ganz auf die
Vorgehensweise eines etwaigen Projektleiters an. Die Software
Wordsmith ist für einen solchen Vergleich jedoch nicht geeignet.
Was für Homonyme und Komposita gilt, trifft auch zu auf Metaphern,
Phrasal
Verbs,
Redewendungen
und
viele
andere
zusammengehörenden Wortketten, die als Ganzes betrachtet werden
sollen. Wir müssen deshalb alle Bestandteile des Kompositums als
Suchwort ins Eingabefeld der Funktion Concord einfügen, um die
dazugehörige Konkordanzliste zu erhalten.
6.5.2 Analyse ausgewählter Komposita
Wir widmen uns in den nächsten beiden Unterkapiteln einer Reihe
von Komposita mit Bestandteilen aus den Wortgruppen „Arabisch“,
„islamische Welt“ und „Terror“. Die Wortgruppen „Arabisch“ und
„islamische Welt“ wurden dabei zusammengefasst.
188
6.5.2.1 Komposita mit Bestandteilen aus den Wortgruppen
„Arabisch“ und „Islamische Welt“
Im Folgenden ist eine Auswahl von Komposita aufgeführt, die auf den
folgenden sieben Wortformen basieren: >ARAB<, >ARABIC<,
>ISLAM<, >ISLAMIC<, >ISLAMIST<, >MUSLIM< und
>MUSLIMS<.
Wie bereits angesprochen besitzt Wordsmith keine spezielle
Suchfunktion für Komposita. Deshalb mussten die sieben
Konkordanzlisten einzeln durchgesehen werden. Die drei Spalten der
folgenden Tabelle sind alphabetisch und nicht nach den Kopfwörtern
der Komposita sortiert. Hier wurden sowohl die Formen mit
Bindestrich als auch die zusammengeschriebenen berücksichtigt, aber
keine auseinander geschriebenen Formen, so dass Verwechslungen
mit Nominalphrasen vermieden werden konnten.
Die Verwendung von Bindestrichen im Englischen (hyphenation) ist
vollkommen willkürlich (Bauer 1995, S.101). Deshalb sind für
mehrere Formen zwei Schreibweisen gefunden worden.
Komposita, die ein Kopfwort besitzen, nennen sich endocentric
compounds. Ferner gilt in der englischen Sprache die right-hand
head rule, RHR (Katamba 1993, S.311). Diese Regel besagt, dass
sich das Kopfwort eines Kompositums auf der rechten Seite befindet.
Das ist bei den meisten hier analysierten Komposita der Fall, mit
Ausnahme von wenigen exocentric compounds, bei denen kein
Element als Kopfwort fungiert (z.B.: >FATWA-ISLAMIC<). Es sind
ferner copulative compounds (>WESTERN-ARAB<) enthalten. Für
die aufgeführten noun compounds (>FELLOW-MUSLIMS<) und
verbal compounds (>ARABIC-SPEAKING<) gilt die RHR.
189
Nr.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
Komposita K1
ANTI-ARAB
ANTI-ISLAMIC
ANTI-MUSLIM
ARAB-AMERICAN
ARAB-DOMINATED
ARAB-ISRAELI
ARAB-OWNED
INTRA-MUSLIM
Fq
1
2
1
1
1
7
1
1
ISLAMIC-NATIONALIST 1
2
MUSLIM-CROAT
1
MUSLIM-RELATED
3
NON-MUSLIM
1
NON-MUSLIMS
1
PRO-ISLAMIST
2
UN-ISLAMIC
Kompositum K2
ALL-MUSLIMS
ARABIC-SPEAKING
Σ
N=15
N=4
26
Fq
1
1
ISLAMIST-DOMINATED 1
1
MUSLIM-CROAT
4
Nr.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
Kompositum K3
ARAB-JEWISH
AD-DAWA-ARABIC
AL-ARAB
AL-MUSLIMEEN
ANTI-ARAB
ANTI-MUSLIM
ARAB-AMERICAN
ARAB-CANADIANS
ARAB-ISLAMIC
ARAB-ISRAELI
ARAB-OWNED
EL-ARAB
FATWA-ISLAMIC
Fq
3
1
23
4
3
1
2
1
1
9
1
1
1
FELLOW-MUSLIMS 1
INTER-ARAB
3
1
ISLAMIC-STYLE
ISRAELI-ARAB
1
1
MUSLIM-HINDU
NON-ARAB
1
2
NON-MUSLIM
1
NON-MUSLIMS
PAN-ARAB
14
PRO-ARAB
2
1
PRO-ISLAM
SHATT-AL-ARAB
2
1
UN-ISLAMIC
US-ARAB
1
WESTERN-ARAB
2
N=28
Tab. 44.: Komposita der Wortgruppen >ISLAM< (fettgedruckt)
und >Arabisch< in K1, K2 und K3.
In K1 sind 15 verschiedene Komposita insgesamt 26-mal enthalten.
Im doppelt so großen Korpus K3 kommen 28 verschiedene
Komposita 85-mal vor. Berücksichtigen wir die unterschiedlichen
Korpusgrößen enthält K3 die größte Gesamtzahl an Komposita, K1
hingegen die meisten verschiedenen Komposita aus dieser Gruppe.
In K2 finden sich insgesamt nur vier verschiedene Komposita je
einmal
(>ALL-MUSLIMS<,
>ARABIC-SPEAKING<,
>ISLAMIST-DOMINATED<, >MUSLIM-CROAT<).
Das lässt sich damit begründen, dass in das Range des Presse-Korpus
K2 kein Konflikt mit der arabischen Welt fällt, anders als in den
190
85
anderen beiden Textsammlungen K1 und K3 (K1: War on Terror,
K3: Crisis in Kuwait).
Betrachten wir die Komposita im Detail, so stoßen wir auf positiv
bzw. neutral belegte Konstruktionen wie >INTER-ARAB<, >PANARAB< oder >ARAB-SPEAKING<. Auf der anderen Seite finden
wir stark simplifizierende Zusammensetzungen wie >ANTIMUSLIM<, >ANTI-ARAB<, >ANTI-ISLAMIC<, >INTRAMUSLIM< oder >MUSLIM-RELATED<.
Es sind mehrere Gegensatzpaare zu lokalisieren, die u.U. als dvanda
compounds (Bauer 1995, S.36) aufgefasst werden können: >ARABISRAELI< (16 x), >WESTERN-ARAB< (2 x), >US-ARAB< (1 x),
>ARAB-AMERICAN< (1 x), >ISRAELI-ARAB< (1 x), u.a.
Wir finden überaus häufig Formen, bei denen Präfixe durch
Bindestrich vom Kopfwort abgetrennt sind (>ANTI-ARAB<, >NONMUSLIM<, >UN-ISLAMIC<, >INTRA-MUSLIM<, >PROISLAM<, >INTER-ARAB<, etc.). Diese Wortbildungsmuster sind
typisch für Pressesprache bzw. Pressephonologie und finden sich
häufig in den Schlagzeilen der Boulevardpresse. Auf diese Art und
Weise wird versucht, komplexe Sachverhalte sprachlich zu
vereinfachen.
Komposition zur Kennzeichnung bestimmter Sachverhalte ist speziell
in Fachsprachen üblich (Mesthrie et. al, 2001, S.257), z.B. >BLOOD
CLOTTING FACTOR<, aber auch als Wortformierungsmöglichkeit
bei englischen Pidgin-Sprachen (Mesthrie et al. 2001, S. 537). Das
sind zumeist Bereiche, in denen wissenschaftliche Neuerungen
beschreibbar gemacht werden müssen, oder, im Falle des Pidgin,
Sprecher unterschiedlicher Sprachen in Kontakt treten und neue
Wortschöpfungen in Form von Komposita benötigen (z.B. >MINAPALMA<, small palmtree, Arends et al. 1994, S. 195).
Die Verwendung von Komposita kann ein Zeichen für sprachliche
Kreativität sein, andererseits helfen diese Wortkombinationen, einen
mehr oder weniger komplexen Sachverhalt vereinfacht zu benennen,
indem sie Gedankenbrücken herstellen und Themengebiete
miteinander verknüpfen. Bei Pressesprache insbesondere in
Überschriften erzeugen sie eine Art Telegrammstil. Sie werden häufig
genutzt, wenn syntaktische Standardbewegungen nicht ausführbar
sind. Sie vermögen zu klassifizieren und ersparen das Paraphrasieren.
Diese Methode ist kurz und prägnant. Das geschieht manchmal auf
191
Kosten des sprachlichen Ausdrucks wie etwa bei der Szene- oder
Anti-Sprache. (siehe 6.4.5.5, Miller 1992, S.140/41). Es lässt sich
sagen, dass es sowohl 2001 als auch 1990 diskriminierende
Sprachverwendungen in Form von Komposita aus den oben
untersuchten Begriffsgruppen gab (>MUSLIM-RELATED<,
>ANTI-ISLAMIC<), jedoch 2001 stärker als in 1990.
6.5.2.2 Komposita mit Bestandteilen aus der Wortgruppe
„Terror“
Zu der Wortform >TERRORISM< finden wir in den drei Korpora
u.A.
folgende
Komposita:
>STATE
TERRORISM<,
>TERRORISM
ACT<,
>TERRORISM
ANGST<,
>TERRORISM CRISIS<, >TERRORISM LEGISLATION< und
>TERRORISM CASES<.
Je nach Betrachtungsweise können diese Kombinationen als
Nominalphrasen oder als Komposita (compound nouns) aufgefasst
werden (Katamba 1993, S. 307, u.a.), auch wenn diese N-Komposita
letztendlich selbst ein Typ von Nominalphrase sind.
Dasselbe gilt für die Type >TERROR<: >TERROR BLITZ<,
>TERROR
SUSPECTS<,
>TERROR
NETWORK<,
>ANTHRAX TERROR<, >TERROR GROUP<, >TERROR
ATTACKS<. Zu >TERRORIST< sind es Wortverbindungen wie
>MIDDLE EAST TERRORIST<, >SAUDI TERRORIST<.
In der folgenden Stichprobe wollen wir uns ausschließlich auf die
zusammengeschriebenen Komposita und diese mit Bindestrich
beschränken.
In K1 finden wir aus der in Augenschein genommenen Gruppe 18
verschiedene Komposita mit insgesamt 190 Nennungen:
192
Nr. Kompositum in K1
Fq
Kompositum in K2
Fq
Kompositum in K3
Fq
1.
ANTI-TERROR
20
ANTI-TERRORISM
1
ANTI-TERROR
1
2.
ANTI-TERRORISM
50
ANTI-TERRORIST
9
ANTI-TERRORIST
29
3.
ANTI-TERRORIST
56
BIO-TERRORISM
1
COUNTER-TERROR
1
4.
BIOTERROR
3
COUNTER-TERRORISM
1
COUNTER-TERRORISM 1
5.
BIOTERRORISM
15
COUNTERTERRORIST
1
COUNTER-TERRORIST 3
6.
BIO-TERRORISM
1
DRUG-TERRORISM
1
7.
BIOTERRORIST
8
NARCO-TERRORIST
1
8.
COUNTERTERRORISM
1
NON-TERRORIST
1
9.
COUNTER-TERRORISM
13
TERRORIST-RELATED 2
10. COUNTERTERRORIST
1
TERRORIST-RIDDEN
1
11. COUNTER-TERRORIST
10
12. SUPER-TERRORIST
2
13. TERRORIST-FREE
1
14. TERRORIST-RELATED
2
N=10
41
15. TERRORIST-SPONSORING 2
16. TERRORIST-TRACKING
1
17. TERROR-RIDDEN
1
18. TERROR-SUPPORTING
3
Σ
190
N=18
N=5
13
Tab. 45: Komposita aus der Wortgr. “Terror” in K1, K2 und K3
Mit 56 Nennungen ist >ANTI-TERRORIST< die deutlich häufigste
Form, gefolgt von >ANTI-TERRORISM< (50 Nennungen) und
>ANTI-TERROR< mit 20 Nennungen. In K2 sind es hingegen nur
fünf Komposita aus dieser Gruppe mit insgesamt 13 Nennungen. Die
häufigste Form ist >ANTI-TERRORIST< mit neun Nennungen.
In K3 finden wir zehn Komposita aus dieser Wortgruppe mit 41
Nennungen. Auch hier ist die Verbindung >ANTI-TERRORIST<
quantitativ am bedeutensten (29 Nennungen).
Speziell die Formen mit >ANTI…<, >BIO…< und >COUNTER…<
sind ab dem 12.09.01 zu geläufigen und häufig verwendeten
Standardformen avanciert.
In der Morphologie existieren geteilte Meinungen darüber, ob die
Kompositabildung das Ergebnis eines morphologischen oder eines
syntaktischen Prozesses ist oder beides (Bauer 1995, S.100). Auf der
einen Seite wird argumentiert, dass durch Komposition neue
Sinneinheiten bzw. Lexeme geschaffen werden. Auf der anderen Seite
193
gelten Komposita als Sequenzen von Lexemen, die im linguistischen
Teilgebiet Syntax abzuhandeln sind (Bauer, 1995, S. 102).
Vergleichen wir schließlich die Tabellen für die Wortgruppen
„Arabisch/ Islamische Welt“ und „Terror“, so stellen wir fest, dass
für erstere die meisten Komposita in K3 zu finden sind, für die
Wortgruppe „Terror“ jedoch in K1. In beiden Fällen sind für K2
vergleichsweise wenig Formen zu verzeichnen.
Vergleichen wir jedoch die Befunde der Analyse der Wortgruppe
„Islamische Welt“ mit denen für die Komposita (in Tab. 44
fettgedruckt), so stellen wir ein Ungleichgewicht fest. Die Anzahl der
Komposita beträgt 15 für K1 und 15 für K3. Die Wortgruppe
„Islamische Welt“ ist hingegen in K1 (847 Token) fast dreimal so
stark wie in K3 (588, stand. Wert 295). Das Verhältnis von Komposita
mit einem Bestandteil aus der Wortgruppe „Arabisch“ ist hingegen
11 (K1) zu 71 (K3). Der Umfang der Wortgruppe „Arabisch“
beträgt insgesamt 235 in K1 vs. 975 (st. Wert 488) in K3. Das ist ein
Indiz dafür, dass eine Auseinandersetzung explizit mit der arabischen
Welt nach 9/11 vermieden wurde.
Des Weiteren ist zu bemerken, dass einige Formen eher dazu
prädestiniert sind, Angst zu erzeugen als diese zu verhindern, z.B. der
Komplex >BIOTERROR…< mit insgesamt 27 Nennungen. Ferner
muss der Wert von 190 Komposita in K1 mit einem Bestandteil der
Wortgruppe „Terror“ als außerordentlich hoch bezeichnet werden.
6.6 Weitere Analysedaten
In einem letzten Analyseschritt werden Berechnungen im Rahmen des
Zipfschen Gesetzes und die Entropie vorgenommen.
6.6.1 Anwendung des Zipfschen Gesetzes
Wenn wir die Textstatistiken miteinander vergleichen, so können wir
hinterfragen, ob das Zipfsche Gesetz für die Gruppierungen der
Wortlängen zutrifft. Dieses Gesetz besagt, dass kürzere Wörter
häufiger verwendet werden als längere, oder anders ausgedrückt: je
194
größer ein Wort von der Länge her, desto wenig häufig wird es
verwendet (Zipf 1965, S.22).
Für jedes einzelne der drei Hauptkorpora trifft das Zipfsche Gesetz zu,
auch wenn als Ausnahme die Wörter, die aus einem einzigen
Buchstaben bestehen, unterrepräsentiert sind. Zipf bezieht seine
Beobachtungen nicht explizit auf die Anzahl der Buchstaben, sondern
auf Silben und phonemische Einheiten. Wordsmith ermittelt hingegen
die Anzahl der Buchstaben.
Die Kategorie „Wörter aus zwei Buchstaben“ (2-letter-words) ist im
Vergleich zu dem am stärksten vertretenen Wert (3-letter-words)
geringfügig kleiner. Dieses liegt daran, dass es im Englischen sehr
viele Wörter gibt, die zwar aus nur einer Silbe bestehen, jedoch aus
drei Buchstaben, wie >THE<, >AND< und >FOR<.
Fassen wir K1 und K2 zu einem Großkorpus für 2001 zusammen und
vergleichen die Worthäufigkeiten für 2001 und 1990, indem wir die
Anzahl der Buchstaben pro Wort als Kategorien nehmen, so stellen
wir fest, dass im Korpus von 1990 ein Überhang existiert, was längere
Wörter anbetrifft, also Wörter ab einer Größe von sechs Buchstaben:
(K1 + K2)
1-letter words
58.533
2-letter words
338.574
3-letter words
395.480
4-letter words
322.848
5-letter words
224.315
6-letter words
184.526
7-letter words
171.729
8-letter words
124.218
9-letter words
91.277
10-letter words
53.384
11-letter words
28.870
12-letter words
14.534
13-letter words
7.766
14(+)-letter words
2.940
K3
55.113
342.545
387.468
303.438
216.448
185.055
175.738
128.695
102.882
60.709
31.358
17.584
9.155
3.405
Tab. 46: Anzahl der Wörter nach Wortgröße in (K1 + K2) und K3
(Die höheren Werte im Vergleich sind fettgedruckt.)
Dieselben Werte lassen sich in einem Balkendiagramm darstellen:
195
or
ds
3le
tte
rw
or
ds
5le
tte
rw
or
ds
7le
tte
rw
or
ds
9le
tte
rw
or
11
ds
-le
tte
rw
or
13
ds
-le
tte
rw
or
ds
K1+K2
K3
1le
tte
rw
Anzahl der Wörter/ Wortlänge
450.000
400.000
350.000
300.000
250.000
200.000
150.000
100.000
50.000
0
Wortlänge
Grafik 7: Darstellung der unterschiedlichen Wortlängen bei
(K1+K2) und K3
Wir erkennen anhand des Balkendiagramms, dass in den Korpora trotz
geringer Schwankungen dieselbe Tendenz zu erkennen ist.
Bis einschließlich der Kategorie 5-Letter-Words ist ein Überhang bei
K1+K2 zu finden, mit Ausnahme der Kategorie 2-Letter-Words. Hier
ist die Wert für K3 geringfügig größer. Ein Inspizieren der
Häufigkeitslisten ergab, das die Verteilung der Type >MR< dafür
verantwortlich ist (K1+K2: 9162 Token; K3: 13 581 Token, siehe
auch 6.2.3). Ab der Kategorie 6-Letter-Words ist wieder ein Überhang
der Werte in K3 zu verzeichnen. Das weist eindeutig auf einen Trend
zur bevorzugten Verwendung von kürzeren Wörtern in 2001 hin, mit
Ausnahme der Gebräuchlichkeit der oben erwähnten Type >MR<.
In einer weitere Feinabstimmung können die Häufigkeit bei den
Wortlängen für K1 und K2 festhalten werden, um weitere
Veränderungen, verursacht durch 9/11, aufzuspüren.
Wir können anhand der folgenden Tabelle erkennen, dass der Trend
zu einer fortschreitenden Verkürzung der Wörter, in diesem Fall der
zunehmenden Verwendung von kürzeren Wörtern, nach dem 11.
September 2001 eine geringfügig rückläufige Tendenz hatte.
196
K1
1-letter words
28.128
2-letter words
170.671
3-letter words
196.963
4-letter words
158.947
5-letter words
111.625
6-letter words
91.246
7-letter words
87.498
8-letter words
62.798
9-letter words
47.333
10-letter words
26.777
11-letter words
14.786
12-letter words
7.387
13-letter words
3.928
14(+)-letter words 1.494
K2
30.405
167.903
198.517
163.901
112.690
93.280
84.231
61.420
43.944
26.607
14.084
7.147
3.838
1.446
Tab. 47.: Anzahl der Wörter nach Wortgröße in K1 und K2 (höhere
Werte fettgedruckt.)
Mit Ausnahme der 2-Letter-Words sind in den Kategorien 1-LetterWords bis zu den 6-Letter-Words die höheren Häufigkeiten in K2 zu
finden. Eine Überprüfung der höchsten Eingänge für die 2-LetterWords in den beiden Korpora ergab, dass der Zahlenwert in K1
hauptsächlich durch die Typen >US< und >AL< verursacht wurde.
>US< erreicht in K1 2186 Token, in K2 nur 742.28 Der arabische
Artikel >AL< bringt es in K1 auf 549 Nennungen, in K2 nur auf 44.
Ab einer Größe von sieben Buchstaben sind mehr Wörter in K1 zu
finden als in K2. Ist dies vielleicht ein Indiz für eine
Verkomplizierung von Sprache und Ausdrucksweise nach den
Terroranschlägen? Um ein abschließendes Urteil treffen zu können,
müssten weitere Zeitintervalle und Korpora gebildet werden.
Zur besseren Veranschaulichung sei ein Histogramm verwendet:
28
In K3 fungiert >US< zu 78 % als Abkürzung von United States, in K2 zu 49 % und in K1 zu 81 %. In den
restlichen Fällen ist >US< ein Personalpronomen.
197
200.000
150.000
K1
K2
100.000
50.000
0
1le
t
2- ter
le wo
tt
3- er rds
le wo
t
4- ter rds
le wo
t
5- ter rds
le wo
tt
6- er rds
le wo
t
7- ter rds
le wo
t
8- ter rds
le wo
t
9- ter rds
le w
10 tter ord
-le w s
11 tter ord
-le w s
12 tte ord
-le r w s
13 tter ord
14 -le wo s
(+ tte rd
)-l r w s
et
te ord
rw s
or
ds
Anzahl der Worter/ Wortlänge
250.000
Wortlänge
Grafik 8: Anzahl der Wörter nach Wortgröße in K1 und K2
Das Balkendiagramm verdeutlicht, dass es nur zu geringfügigen
Veränderungen gekommen ist.
6.6.2 Die Entropie der Typen
Mit den von Wordsmith erzeugten Daten lässt sich jede nur
erdenkliche mathematischen Spielereien durchführen. Abschließend
sei hier auf die Entropie, den mittleren Informationsgehalt, verwiesen.
Die Entropie zählt zu den formalen Aspekten der Medienrealität
(Jarren/ Bonfadelli 2001, S. 393).
Wordsmith ermittelt für die Anzahl der Typen recht divergierende
Werte (siehe Punkt 6.1.1). In K1 sind es 35 307 Typen bei rund einer
Mio Wörtern, in K2 sind es 36 467 Typen bei rund einer Mio Wörtern
und in K3 finden sich 48 738 Typen bei rund zwei Mio. Wörtern.
Für diese Werte lässt sich die Entropie, d.h. der mittlere
Informationsgehalt berechnen. Er errechnet sich aus dem logarithmus
dualis (ld) der Anzahl aller verwendeten Zeichen. In der folgenden
Berechnung ist die Anzahl der Typen mit der Anzahl der verwendeten
Zeichen gleichgesetzt. Für die drei Korpora ergaben sich daraus die
folgenden Werte:
198
Korpus K1 hat eine Entropie von 15,11 Bit, Korpus K2 hat eine
Entropie von 15,15 Bit, und K3 15,57 Bit. Der Informationsgehalt ist
demnach in K3 am höchsten und in K1 am geringsten.
Es gibt Theorieansätze, bei denen die Type-Token Relation als
Indikator für den individuellen Wortschatzumfang, die verbale
Kreativität und die Intelligenz des Verfassers gilt (siehe 6.1.2). Das
kann unter Abstrichen auch für die Entropie in Bezug auf die Anzahl
der Typen behauptet werden. Laut Lewandowski (1990, S.1200)
können speziell schichtspezifische Unterschiede aus der Anzahl der
verschiedenen Wörter ersichtlich werden. Doch aufgrund des HaloEffekts sagen uns beide Größen, sowohl TTR als auch Entropie relativ
wenig, solange wir nicht wissen, wie viele verschiedene Journalisten
insgesamt Artikel zu der Erhebung beigesteuert haben.
7. KAPITEL: Schlussbetrachtung (Zusammenfassung, Kritik und
Ausblick)
Abschließend ist an dieser Stelle zu betonen, dass die gewonnenen
Daten sehr umfangreich sind, so dass bei der Zusammenfassung der
Ergebnisse eine sinnvolle Selektion vorgenommen werden musste.
Die im 6. Kapitel dargelegten Auswertungen zeigen nur einen
Ausschnitt aus unzähligen weiteren möglichen AnalyseKonstellationen. Es ließen sich diverse andere Fragestellungen finden,
die letztendlich den Rahmen der Arbeit gesprengt hätten. Speziell die
Möglichkeiten im Bereich der Zusammenstellung von Wortgruppen
und Konkordanzen mit Kontextwörtern sind nahezu unerschöpflich.
Diese Methodik war unumgänglich, um beweiskräftiges Material für
die Beantwortung der Frage zu sammeln, ob es bei britischen
Qualitätszeitungen zu Qualitätsveränderungen gekommen ist.
Die weiteren Punkte dieses Schlusskapitels bestehen aus einer
kritischen Betrachtung der Korpuslinguistik und einem Ausblick auf
die Zukunft dieser noch vergleichsweise jungen linguistischen
Disziplin.
Diese Arbeit kann als Pilotstudie gesehen werden, die sondieren
soll, was die wesentlichen Veränderungen in der Pressesprache am
Ende des 20. und am Beginn des 21. Jahrhunderts sind. Letztendlich
zeigt sich, dass die von Wordsmith erstellten Korpusstatistiken und
199
die Keywordlisten die aufschlussreichsten Ergebnisse liefern, was
sprachliche Veränderungen betrifft. Die Häufigkeits- und die
Konkordanzlisten hingegen liefern riesige Mengen an Daten bzw.
Detailinformationen, bei denen vieles übersehen, aber auch vieles
ungewollt in den Vordergrund gedrängt werden kann.
7.1 Zusammenfassung der Ergebnisse
Im Folgenden sind die Ergebnisse der Korpusanalyse thesenartig
zusammengefasst:
1. Die durchschnittliche Satzlänge hat sich von 1990 bis 2001
verringert, stieg nach dem 11. September wieder leicht an.
2. Die Type-Token Relation hat sich zwischen 1990 und 2001
verringert, stieg nach dem 11. September wieder leicht an.
3. Die Tendenz, dass gemäß dem Zipfschen Gesetz kürzere Wörter
häufiger verwendet werden als die längeren Wörter, hat sich von
1990 bis 2001 verstärkt, jedoch wurde diese Tendenz nach dem 11.
September geringfügig umgekehrt.
4. Die durchschnittliche Artikellänge hat sich zwischen 1990 und
2001 stark erhöht. Nach dem 11. September ist es zu einem
erneuten Anstieg der Artikellänge gekommen.
5. Die Auswertungen von Konkordanzlisten hat ergeben, dass
Bestandteile der Wortgruppe „Terror” häufig eine Kollokation aus
der Wortgruppe „Islamische Welt” erhalten, seltener aus der
Wortgruppe „ Arabisch.”
6. Die Auswertung der Keyword-Listen zeigt, dass es zu einer
verstärkten Verwendung von Pronomina in 2001 gegenüber 1990
gekommen ist, bei einer gleichzeitigen Zunahme der Verwendung
von Namen (>BUSH<, >BLAIR<, >BIN LADEN<), was als
Indikator für eine Boulevardisierung gewertet werden kann.
7. 1990 rangierten vorrangig Bezeichnungen für Orte des politischen
Geschehens als Schlüsselbegriffe.
8. Die Verwendung der Begriffe >ISLAMIC< und >MUSLIM<
in K1 kann als „nahezu diskriminierend“ betrachtet werden.
9. Die lexikalische Dichte und die Entropie der Korpora haben sich
seit 1990 von Korpus zu Korpus verringert.
200
10. Es ist zu einem starken Anstieg der Präsenz der Wortgruppe
>TERROR< nach 9/11 gekommen. Das Gleiche gilt für eine
Reihe anderer Begriffe aus diesem Themenkomplex.
11. Die Summe der Anredeformen (>MR<, >MRS< und
>MS<) hat sich von 1990 zu 2001 deutlich verringert.
12. Die Keyness-Werte sind in K3 verglichen mit (K1 + K2) am
höchsten.
13. Bei der Berichterstattung über den 11. September handelt es sich
um Beitragswellen, die beim Rezipienten einen nicht der Realität
entsprechenden Eindruck einer Häufung bestimmter Ereignisse
vermitteln.
14. Im Korpus von 1990 wurde deutlich häufiger mit
Prozentwerten operiert als in den Korpora von 2001. Das Gleiche
gilt für die Verwendung von Altersangaben mit Hilfe der
NP-Apposition >AGED<. Das lässt auf Veränderungen bei der
journalistischen Arbeit schließen.
7.1.1 Gründe für die Veränderungen des Wortschatzes
Es sind unterschiedliche Gründe für die Veränderungen des in
Zeitungen verwendeten Wortschatzes aufzuführen. Zum einen kann
angenommen werden, dass in den Verlagshäusern der Zeitungen ein
Generationswechsel stattgefunden hat, dass neue Redakteure eine
andere sprachliche Kompetenz einbringen, was von deren
Sozialisationsweg abhängig ist. Ein weiterer Punkt ist die Tatsache,
dass sich politische Systeme verändern, andere Parteien an die Macht
gelangen und neue Regierungen gewählt werden. Drittens können sich
neue Arbeitstechniken wie neue Formen der Texterstellung, neue
Recherchemethoden durch das Medium Internet und eine damit
einhergehende Umwälzung des Redaktionsalltages in der von den
Redakteuren verwendeten Sprache niederschlagen. Viertens erfordert
der Lauf der Zeit neue Begriffe: neue Ideologien, Erfindungen und
Gesetze spiegeln sich in den Zeitungen wider, in denen immer noch
mehr Text verwendet wird als in den Nachrichtensendungen. Für die
Beschreibung dieser Vorgänge sind ständig neue politische, technischwissenschaftliche Termini erforderlich. Last but not least ist die
Wortwahl maßgeblich abhängig von den in den Zeitungen
201
reflektierten Themen. Ein Negativereignis wie Nine-Eleven löst
zwangsläufig eine Ereigniskette aus, die massive Veränderungen in
der Presseberichterstattung zur Folge hat. Die Sprache in den
Zeitungen ist immer ein Reflex auf die vorangegangenen und
bevorstehenden Ereignisse und den dazugehörigen Fachwortschatz.
Doch auch eine zunehmende Boulevardisierung spielt eine wichtige
Rolle, die als Qualitätsverlust gewertet werden kann. Die
verschiedenen medienrelevanten Akteure gewinnen auf Kosten der
Themenvielfalt immer mehr an Publizität.
Seit dem Aufkommen des Internet wurde dieses neue Medium
zunehmend attraktiver. Durch neues Textdesign und Pressefotos
gestalten sich die Online-Zeitungen immer farbenprächtiger, was auf
das Printprodukt zurückwirkt.
Die Tatsache, dass 1990 noch viel häufiger mit Prozentwerten in den
Zeitungsartikeln operiert wurde als 2001, lässt darauf schließen, dass
die neuen Recherchemethoden des Internet andere Sichtweisen zu
etablieren vermochten. Das gilt auch für die NP-Apposition >AGED
…<, die 1990 deutlich häufiger verwendet wurde. Das Alter der
Medienakteure wird zunehmend zu einem Tabuthema.
7.1.2. Sprachliche Veränderungen durch die Internet-Einführung
Laut Bucher (1999) wirken veränderte Rezeptionsgewohnheiten, die
aus der Internetnutzung resultieren, zurück auf das Printprodukt.
Wenn wir in einigen Fällen die Kohärenz innerhalb von Texten
betrachten, fällt auf, dass in 2001 viele Artikel im Verlauf des Textes
vom Thema der Überschrift abweichen. Das ist ein Hinweis auf den
neuen Designer-Journalismus.
Inwieweit abgesehen von den direkten Auswirkungen des neuen
Textdesigns und Veränderungen bei der Verwendung von Begriffen
wie >PER CENT< und >AGED< auch andere Veränderungen von
1990 bis 2001 aus der Einführung des Internet resultieren, wie z.B. die
Verkürzung der durchschnittlichen Satzlänge, kann nicht mit
Sicherheit beantwortet werden. Fakt ist, dass das Internet das
journalistische Arbeiten revolutioniert und das Denken verändert hat.
Das Verwenden kürzerer Zeitungsartikel und kürzerer Sätze kann auf
die Delinearisierungstendenzen in den Printmedien zurückgeführt
202
werden, die als Reflex auf die neue Form der Online-Zeitung zu
verstehen sind (siehe 4.10). Die automatische Vorgabe von Artikelund Zeilenlänge kann dabei eine entscheidende Rolle gespielt haben.
Ferner erwartet die neue Welt der Online-Kommunikation kürzere
Sätze, ob im Chat, in Emails oder Newsgroups. Wer sich nicht kurz
und bündig ausdrückt, läuft Gefahr, als langatmig zu gelten. Das kann
sich auch auf die Arbeit der Journalisten ausgewirkt haben.
Ob veränderte Häufigkeiten bei den „Naming“-Strategien, bei
Pronomina wie (>I<, >SHE<, >HE<, >HER<, >HIS<) oder auf der
anderen Seite bei der Schlüsselwortfunktion von Orten des politischen
Geschehens tatsächlich durch die neuen Arbeitsbedingungen des
Internet verursacht wurden, kann in der hier vorliegenden Arbeit nicht
mit Sicherheit beantwortet werden.
Es kann sein, dass die Allgegenwart von Prominenten im Internet auf
die Zeitungsberichterstattung einwirkte, so dass im neuen Millennium
zunächst Personen eine wichtigere Rolle spielten als Sachthemen, bis
der 11. September einen Paradigmenwechsel einleitete und fortan der
„War on Terror“ die Agenda prägte. Wenn wir die Boulevardisierung
ebenso als Folge der Delinearisierung betrachten - viele OnlineZeitungen tendieren zu einer Art Boulevardvariante - so können wir
auch die Veränderungen bei der Verwendung von Anredeformeln und
Pronomina hinzuzählen.
Es ist nicht auszuschließen, dass Veränderungen im Rahmen des
Zipfschen Gesetzes, der TTR und der lexikalischen Dichte auf den
neuen Kommunikationsgewohnheiten basieren.
Viele Vermutungen lassen sich erst bekräftigen, wenn die Mitarbeiter
der Redaktionen mit Hilfe von Fragebogen zu Details der InternetEinführung befragt würden oder die Sprachprofile einzelner
Journalisten vor und nach der Einführung miteinander verglichen
wurden. In den hier vorliegenden Korpora sind die individuellen
Sprachprofile aufgrund des Halo-Effekts irrelevant (siehe 7.1.5).
Es ist festzuhalten, dass das Nachholbedürfnis in technischen Fragen,
verursacht durch die Einführung von Internet und Online-Zeitungen,
offensichtlich auf Kosten der Hinwendung zu Sachthemen geschah
(cultural lag, knowledge gap, Kunczik, Zipfel, 2001, S. 384 ff.),
denn die Keyness-Listen belegen eine Einschränkung der
Themenvielfalt in 2001 gegenüber 1990. Das kann als weitere
Qualitätseinbuße gewertet werden.
203
7.1.3 Emotionsneutrale Datenauswertung durch den Rechner
Sprachliche Veränderungen wie die infolge des 11. September können
im Rahmen einer computergestützten Korpusanalyse adäquat
aufgedeckt werden, weil Computer nüchtern und unspektakulär die
fokussierten Artikel analysieren. Korpusanalyseprogramme können
erfolgreich angewendet werden, ohne dass eine etwaige emotionale
Blockade, Trauer, Depression oder gar Rachsucht die Analyse
verfälschen. Speziell die horrorfilmähnlichen Bilder wie die des
Einschlagens der Passagierflugzeuge in die beiden Türme des "World
Trade Centers", die brennenden Türme, die aus dem Gebäude
springenden Menschen, die Panik auf den Straßen und schließlich das
Zusammenstürzen der beiden Wolkenkratzer, können unter
Umständen "Anxiety Disorder", "Post Traumatic Stress Disorder"
und "Memory Disorders" auslösen (siehe: Baddeley et al. 1995,
S.618), so dass eine intellektuelle Auseinandersetzung mit diesem
Thema
unter
Umständen
formalen,
inhaltlichen
und
ausdrucksbedingten Verzerrungen unterliegt. Für den Computer sind
diese Bilder und deren Begleitumstände irrelevant, er verarbeitet alle
von ihm verwertbaren Texte technisch gleich. Die Begleitumstände
und Inhalte werden zum verschwindenden Moment (Holzkamp 1985,
S.311).
Auch wenn Computer nur wenige Formen der Textanalyse
durchzuführen vermögen, so tun sie es mit emotionaler Neutralität.
Ein Mensch hingegen kann bei der Datensammlung, der Bedienung
der Software und der Datenauswertung Fehler begehen.
7.1.4 Der Umgang mit dem Thema Terror
Zweifelsohne ist der Terrorismus eines der schrecklichsten und
unangenehmsten
politischen
Probleme.
Terroristen
sind
Schwerstkriminelle und keine religiösen Menschen. Die Attentäter
von New York waren zwar Araber, werden in der Berichterstattung
jedoch nicht als solche benannt. Im Zusammenhang mit dem 11.
September nutzen sowohl die Terroristen und ihre Peripherie die
Religion für ihre niederen politischen Ziele aus als auch mehrere
Führungspersönlichkeiten der westlichen Welt, die Schlagwörter wie
204
West vs. Islam, Christianity against Islam oder crusade auf die
Agenda setzen. Die westlichen Medien verhindern diese fatale
Verbindung zwischen Terror und Religion nicht, und begünstigen
damit den Aufbau eines neuen Feindbildes.
Was die Zeitungsberichterstattung nach 9/11 anbetrifft, erhalten
Wörter wie >TERROR<, >TERRORIST< und >TERRORISM< in
fast fahrlässiger Weise die Konnotation >ISLAMIC< oder
>MUSLIM<. Dadurch wird ein Kampf der Kulturen
heraufbeschworen, der bereits zu Krieg geführt hat.
Die von Wordsmith erstellten Konkordanzlisten sind ein
ausgezeichnetes
Mittel,
um
diese
Schwächen
der
Zeitungsberichterstattung aufzuspüren.
Was die Verwendungen von Typen aus den Wortgruppen Arabisch
und islamische Welt anbetrifft, so ist hier zu vermerken, dass obwohl
15 der 19 Attentäter des 11. September saudi-arabische Staatsbürger
waren, Ausdrücke wie >ISLAMIC< und >MUSLIM< im Rahmen
der Berichterstattung über die Folgen dieses Verbrechens der
Verwendung >ARAB< und >ARABIC< vorgezogen wurden. Auch
das häufig besser geeignete Wort >ISLAMIST< kommt
verhältnismäßig selten vor. Das ist sowohl auf die Ausnahmesituation
in den Zeitungshäusern nach 9/11 als auch auf das mangelnde
Fachwissen (Knowledge-Gap, siehe 5.7) bezüglich des
Themenkomplexes Terror zurückzuführen.
Was die Verwendung von Komposita aus dem Bezugsrahmen
Terrorismus-Arabisch-Islamische Welt anbetrifft, ist festzuhalten,
dass der Telegrammstil, der durch diese Wortverbindungen erzeugt
werden kann, nach Nine-Eleven nur verstärkt für Bestandteile der
Wortgruppe „Terror“ (in K1: 190 Komposita) zu verzeichnen ist
(Kap. 6.5.2.2), nicht aber für Elemente der Wortgruppen „Islamische
Welt“ (K1: 15 Komposita) und „Arabisch“ (K1:11); (Kap. 6.5.2.1).
Mehr als jedes zehnte Wort der Wortgruppe „Terror“ (insg. 1808
Nennungen) aus K1 ist ein Kompositum, in K3, zu Zeiten der KuwaitKrise, bei deutlich kleinerer Gruppengröße sogar fast jedes neunte
Wort. Diese Proportion wird in den anderen mitanalysierten
Wortgruppen nur von der Gruppe „Arabisch“ in K3 erreicht.
Ferner wirken einige Wortkombinationen eher angsterzeugend, dazu
zählen undurchsichtige Formulierungen wie >BIOTERRORISM<,
>COUNTER-TERRORISM< oder >ANTI-TERRORIST<.
205
7.1.5 Halo-Effect und Primacy-Recency-Effect
Ein weiterer zu berücksichtigender Faktor ist die Tatsache, dass die
analysierten Artikel nur von wenigen Journalisten geschrieben
wurden. Dennoch stehen diese stellvertretend für die Pressesprache
eines ganzen Landes, für die Sprache der Qualitätszeitungen während
des festgehaltenen Zeitraumes. Dieser Halo-Effect (Trautner 1997,
S.439) kann mit dem Satz „Write once, read many times“
umschrieben werden.
Ferner wird ein einzelnes Exemplar von mehr als einer Person
gelesen. Ob die Reduzierung der Type-Token Relation von 1990 zu
2001 eventuell mit der Tatsache zusammenhängt, dass 1990 in den
verwendeten Zeitungen mehr Redakteure angestellt waren als 2001,
konnten im Rahmen dieser Analyse nicht überprüft werden.
Der Primacy-Recency-Effect der ursprünglich
angesetzten
Korpusgrenzen konnte umgangen werden, indem eine Korpusgrenze
direkt auf den 11. September gelegt wurde. Sonst wäre erstens die
sprachliche Veränderung durch den 11. September weniger ersichtlich
geworden. Zweitens konnte das Korpus von 1990 sowohl mit einem
Korpus von 2001 ohne den Effekt des 11.9. verglichen werden als
auch mit einem Korpus, das maßgeblich von diesem Ereignis
beeinflusst wurde.
Ein weiterer Primacy-Recency-Effect ist durch die Einführung des
Internet messbar, obwohl dieses im Gegensatz zu 9/11 kein
schlagartiger Prozess war. Dieses neue Medium brauchte fast ein
halbes Jahrzehnt, um sich zu etablieren, und die Fortentwicklung ist
noch nicht abgeschlossen.
7.2 Korpuslinguistische Methoden kritisch betrachtet
Trotz der Fülle an Ergebnissen, die im Rahmen dieser Dissertation
gefunden wurden, soll an dieser Stelle nicht unerwähnt bleiben, dass
der Einsatz von Wordsmith eine ganze Reihe von Problemen mit sich
bringt, die z.T. auch bei anderer Korpusanalyse-Software nicht zu
vermeiden gewesen wären. Diese Probleme stehen im Zusammenhang
mit der technischen Verarbeitung von Sprache generell. Dazu zählen
206
sowohl Satz- und Wortgrenzenerkenung als auch das Erkennen von
Synonymen, Homonymen, Polysemie und Komposita.
Wäre beispielsweise das Programm in der Lage zu differenzieren, dass
mit >BUSH< 1990 eine andere Person gemeint war als 2001, so
wären die Namen als Schlüsselbegriffe in Keyness-Listen sehr viel
weiter oben zu verzeichnen gewesen. Die Tokenzahlen heben sich
jedoch in den Keyness-Listen bei identischer Schreibweise
gegenseitig auf.
Wenn wir das Wort >ALLIANCE< als Schlüsselwort entdecken,
müssen wir bedenken, dass damit zum einen die Allianz gegen den
Terror gemeint sein kann, zum anderen die Northern Alliance der
Taliban. Wir brauchen deshalb detailiertes Hintergrundwissen, wenn
wir Zuordnungsfehler vermeiden wollen.
Die Defizite bei der Satz- und Wortgrenzenerkennung lassen sich auf
die unterschiedlichen Ursprungsmedien der Zeitungsartikel
zurückführen, die häufig kein einheitliches Textlayout zur Verfügung
stellen.
Ferner werden Wörter, die 14 Buchstaben und mehr beinhalten
(14(+)-letter-words) in den Korpusstatistiken zu einer Kategorie
zusammengefasst. Das hat wiederum geringe Konsequenzen für
Zählungen im Zusammenhang mit dem Zipfschen Gesetz.
In den Konkordanzlisten werden Satzgrenzen nicht berücksichtigt, so
dass unter Umständen Kollokationen oder Kontextwörter einem
anderen Satz angehören als das Suchwort. Des Weiteren sei an die
Tatsache erinnert, dass es bereits bei einer Korpusgröße von einer Mio
Wörtern zu einer ungenauen Berechnung der durchschnittlichen
Satzlänge kommen kann.
Wenn wir uns ebenso dieser Probleme bewusst sind, wie der
Gesetzmäßigkeiten des erfolgreichen Korpusdesigns, so kann eine
Korpusanalyse fruchtbare Ergebnisse liefern.
7.2.1 Schlüsselwort ungleich Inhalt
Bei korpuslinguistischen Verfahren sollte stets bedacht werden, dass
ein betrachtetes Schlüsselwort nicht stellvertretend für den Inhalt von
Texten steht. Wenn Begriffe besonders häufig aufgelistet werden, so
ist dieses lediglich ein Indiz dafür, dass das Bezeichnete häufig
207
berichtenswert erschien; ob es in einem positiven oder negativen
Zusammenhang verwendet wird, bleibt im Verborgenen, bis entweder
die Quelltexte gelesen oder die Konkordanzlisten analysiert wurden.
Die Konkordanzen geben immer nur einen sehr kurzen Ausschnitt von
einer Zeilenlänge preis. Anders ist es bei Schlüsselbegriffen wie
>TERRORISM<. Die Korpusdaten nach dem 11. September lassen
auf eine Katastrophe schließen, >TERRORISM< hat stets eine
negative Konnotation. Doch auch hier stehen die Details im
Hintergrund. Der genaue Inhalt, die vielen beschriebenen
Einzelschicksale, sind den Daten nicht zu entnehmen, sondern nur den
Quelltexten, die wiederum nur einen kleinen Ausschnitt der Realität
abdecken können. Auf der anderen Seite wird mit den vielen
Mutmaßungen in Zeitungsartikeln so verfahren, wie mit den
eindeutigen Fakten: beides wird objektiv vom Computer analysiert.
Dass einige Wörter polysem sind oder einen weit gefächerten
Bedeutungsspielraum haben, muss ebenso berücksichtigt werden wie
die Tatsache, dass es weitere Synonyme gibt, die ein und dieselbe
Sache bezeichnen, dass Fremdwörter verwendet werden oder dass
Rechtschreibfehler vorliegen, die ein Wort an anderer Stelle der Liste
aufrufen oder zumindest eine einheitliche Zuordnung erschweren.
Neben den Rechtschreib-, Ausdrucks-, Wortverwendungsfehlern,
Schreibvarietäten etc. gibt es eine nicht zu unterschätzende Anzahl an
technischen Fehlern wie fehlerhafte Autokorrekturen, typografische
Fehler, Satzfehler, Textverarbeitungsfehler, Layoutfehler, Trennfehler,
die bei der technischen Erstellung der Texte entstehen. Diese Art von
Fehlern vermag Wordsmith technisch nicht aufzuspüren. Ein
Fachmann, der ausschließlich auf die Korpusstatistiken und Wortlisten
zurückgreifen kann, ist zwar in der Lage, ein Urteil über die lexikogrammatikalische Einordnung eines Textes zu treffen, jedoch nur
unter Vorbehalt über den Inhalt. Vergleichskorpora helfen dann nur
bedingt weiter. Diese sind zwar in der Lage, Textkorpora
gegeneinander
„aufzurechnen“,
jedoch
nur
aus
einer
korpuslinguistischen Warte und nicht aus einer hermeneutischen.
Mikro- und Makro-Ebene der verwendeten Texte können anhand der
Analysedaten nur erahnt werden. Bei einer Korpusanalyse werden die
Texte in ihre Bestandteile zerlegt, die wiederum in Wortlisten und
Statistiken neu arrangiert werden, aber auch in Form von
208
Kollokationslisten. Der ursprüngliche Textzusammenhang, die
Bindung oder Kohärenz der einzelnen Glieder geht verloren.
Das abschließende Urteil dieser Dissertation muss deshalb
zurückhaltend formuliert werden. Die Sprache des Journalismus ist
nicht schlechter geworden, jedoch hat die technische Revolution im
Computersektor als längerfristiger Prozess Spuren hinterlassen,
ebenso wie das durch den 11. September ausgelöste Trauma als
Schlüsselereignis in der westlichen Zivilisation, gespiegelt in der
globalen Medienlandschaft.
7.2.2 Wie sinnvoll ist der Einsatz der Korpuslinguistik?
Wie die Auswertungen in Kapitel 6 gezeigt haben, ist die
Korpuslinguistik ein sinnvolles Instrument der statistischen
Textanalyse. Sie wertet die Daten emotionsneutral aus. Dennoch kann
es, wie wir am Beispiel der Auszählungen der durchschnittlichen
Satzlängen gesehen haben, zu Rechen- oder Zählfehlern kommen, die
auf eine unzureichende Erkennung der Satzgrenzen zurückzuführen
sind. Eine Korpusanalyse ist immer nur so gut wie die Mischung aus
Fähigkeiten des Analyseprogramms, ausgewogenem Korpusdesign
und Fachwissen des Korpusanalytikers.
Es sind speziell die Konkordanzlisten, die uns die neuralgischen
Punkte der Berichterstattung nach 9/11 aufzeigen können, indem das
bisher Berichtete mit Hilfe von Kontextwörtern neu sortiert wurde. Es
sind die Politkerreden und die unterstützenden Stellungnahmen der
Journalisten, die den Verlautbarungsjournalismus zu etablieren
vermochten. Das neue Feindbild Islam wurde, wie diese Dissertation
zeigt, von der britischen Presse mitgetragen. Und es wurde vermieden,
den Westen und den arabischen Raum in einen Gegensatz zu stellen.
Stattdessen wurden der Islam und der Westen in Opposition gestellt.
Eine Abgrenzung von Islam und dem arabischen Raum kommt jedoch
an den entscheidenden Stellen der Berichterstattung zu kurz. Die
Konfrontation der Religionen wurde damit heraufbeschworen, die
später in den Mohhammed-Karikaturenstreit mündete.
209
7.3 Rückschlüsse auf die Qualität von Texten mittels quantitativer
Analysen
Zunächst lässt sich nicht von quantitativen Veränderungen bei
Zeitungstexten, ob anhand der durchschnittlichen Artikellänge,
Artikelmenge, Satzlänge, Wortlänge, Worthäufigkeiten, der Stärke
ausgewählter Wortgruppen oder der Type-Token Relation auf
qualitative Veränderungen der Zeitungssprache schließen. Dieses
geschieht primär durch die Beurteilung der ausformulierten Sätze und
Texte im dazugehörigen Kontext.
Im Rahmen von Korpusanalysen hingegen lassen sich bestimmte
Detailfragen eines logisch und homogen gestalteten Presse-Korpus
gezielt fokussieren, um zunächst quantitative Aussagen über
Zeitungstexte zu ermöglichen. Zu diesen Detailfragen, bei denen
quantitative Analysen lohnenswerte Ergebnisse zur Beurteilung von
Qualität liefern, gehören quantitative Veränderungen bei den
Höflichkeitsformen und die Kürze oder Prägnanz von Texten. Dazu
zählen ferner Häufigkeiten von emotional negativ beladenen
Ausdrücken,
Themen,
Kontextwörter,
Schlüsselwörter,
Beitragswellen, Verdrängung von Themenkomplexen, die anhand von
Keyness-Listen und Wortgruppen festgestellt werden können,
Pressephonologie, uneinheitliche Rechtschreibkonventionen oder
Boulevardisierungstendenzen.
Das fachmännische Wissen des geschulten Linguisten ermöglicht es,
aus den Korpusdaten die Aspekte herauszugreifen, die Rückschlüsse
auf Qualitätsveränderungen ermöglichen. Wenn ein sprachliches
Gleichgewicht durch gesellschaftliche Veränderungen oder sogar
Terroranschläge in ein Ungleichgewicht überführt wurde, ist dieses
feststellbar, sobald Häufigkeiten oder Relationen nicht mehr dem
erwarteten Bild entsprechen. Wenn negativ beladene Kontextwörter
signifikant häufig verwendet werden (>ISLAMIC TERROR<),
obwohl ein neutraler Terminus erforderlich ist, kann dieses in
Konkordanzlisten dargestellt werden.
Finden wir auf diesem Weg Hinweise auf eine fragwürdige
journalistische Praxis - und das Errichten von Feindbildern und
Stigmatisieren von religiösen Gruppen gehört dazu - so haben wir eine
weitere Schnittstelle zwischen quantitativer und qualitativer Analyse
gefunden.
210
Qualitativ hochwertiger Journalismus ist anhand bestimmter Kriterien
messbar,
wie
etwa
durch
die
Berücksichtigung
von
Nachrichtenfaktoren
und
journalistischen
Qualitätskriterien.
Offenbaren die Keynesslisten, dass bestimmte Themen und deren
Schlüsselwörter über einen längeren Zeitraum bevorzugt oder
vernachlässigt wurden, so lässt sich vermuten, dass Kriterien wie z.B.
„Fairness“, „Transparenz“ und „Richtigkeit“ (Kunczik, Zipfel 2001,
S. 276) nicht ausreichend umgesetzt wurden.
Was die Bewertung von Zeitungsartikeln anbetrifft, gibt es sicher
unterschiedliche Standpunkte, ob eher kurze oder lange Artikel und
Sätze bevorzugt werden und welche Wortwahl als adäquat empfunden
wird. Doch erst breit gefächerte quantitative Analysen geben
Anhaltspunkte, ob sich im großen Maßstab etwas verändert hat. Die
Feststellung beispielsweise, dass sich die Artikellänge von K3 zu K2
zu K1 fortwährend reduziert hat, kann nicht als bloße quantitative
Veränderung festgestellt werden, ebenso wie die Verringerung der
Verwendung der Type >MR< oder der TTR von K3 zu K2.
Auch die Boulevardisierung als qualitative Größe kann anhand von
Naming-Listen quantitativ messbar gemacht werden. Ferner stellt sich
die Frage, welche Konsequenzen es hat, dass in 2001 deutlich weniger
mit Prozentwerten operiert wurde als 1990.
Zu den denkbaren Ursachen der sprachlichen Veränderungen seit
1990 zählen technische Umwälzungen in den Redaktionen inklusive
neuer Recherchemethoden, politischer Systemwandel, Neuerungen im
Mediensystem
oder
restriktive
Maßnahmen
infolge
der
Terroranschläge. Sprachliche Veränderungen, die nach 9/11 zu
verzeichnen sind, so z.B. die wiederholte Bindung der Wortgruppe
„Terror“ an Religionszugehörigkeit, sind quantitativ belegbar. Die
ausgewählten Textpassagen zeigen sowohl, dass neue Feindbilder
errichtet, als auch, dass politische Stellungnahmen von
Führungspersönlichkeiten kritiklos übernommen wurden.
Sogar Untersuchungen im Rahmen des Zipfschen Gesetzes können
stichhaltige Ergebnisse beisteuern: nach 9/11 waren die Journalisten
stärker gefordert als zuvor, das zeigt sich in der Elaboriertheit der
Sprache des Krisenjournalismus. Ferner ist das Verhältnis von
Funktions- zu Inhaltswörtern, lexikalische Dichte genannt, nicht nur
eine quantitative Relation. Durch die Veränderungen dieser Größe
lässt sich die Homogenität des untersuchten Wortschatzes beurteilen.
211
8. LITERATURLISTE:
- ARENDS, J.: Pidgins and Creoles: An Introduction, Amsterdam,
Benjamins, 1994.
- ARMSTRONG, S. (ed.): Using Large Corpora, Cambridge,
Mass.; London, England; MIT Press, 1994.
- BADDELEY, A.: Handbook of Memory Disorders, Chichester, John
Wiley and Sons, 1995.
- BADDELEY, A.: Human Memory, Hove, New York, Psychology
Press, 2003.
- BAKER, M. (ed.): Routledge Encyclopedia of Translation Studies,
London, New York, Routledge, 1998.
- BARTHES, R.: Die helle Kammer, Frankfurt a.M. Suhrkamp, 1989.
- BAUER, L.: Introducing Linguistic Morphology, Edinburgh,
Edinburgh University Press, 1995.
- BERTELSMANN ATLAS INTERNATIONAL, Gütersloh,
Bertelsmann Lexikathek Verlag, 1984.
- BEUTHNER, M.: Wie wenig Zeit braucht guter Journalismus?
Echtzeitjournalismus zwischen Aktualitätsdruck, Sorgfaltspflicht und
Bilderflut, in: Bilder des Terrors – Terror der Bilder?
Krisenberichterstattung am und nach dem 11. September, Köln,
Herbert von Halem Verlag, 2003.
- BIBER, D., CONRAD, S., REPPEN, R.: Corpus linguistics:
investigating language structure and use, Cambridge, Cambridge
Univ. Press, 1998.
- BIBER, D.: Using Register-Diversified Corpora for general
Language Studies, in: ARMSTRONG, S. (ed.): Using large Corpora,
Cambridge/ Mass., London, Engl., MIT Press, 1994.
- BIGNELL, J.: Media Semiotics, An Introduction, Manchester,
Manchester University Press, 1997.
- BORTZ, J.: Statistik für Human- und Sozialwissenschaftler, Berlin
u.a., Springer, 2005.
- BUCHER, H.-J.: Die Zeitung als Hypertext, in: LOBIN, H.:
Texte in digitalen Medien, Opladen, Westdeutscher Verlag, 1999.
- BUCHER, H.-J.: Vom Textdesign zum Hypertext – Gedruckte und
elektronische Zeitungen als nicht-lineare Medien, in: HOLLY,
BIERE: Medien im Wandel: Opladen, Wiesbaden, Westdeutscher
Verlag, 1998.
212
- CARSTENSEN, EBERT; ENDRISS; JEKAT; KLABENDE;
LANGER (ed.): Computerlinguistik und Sprachtechnologie,
Heidelberg, Berlin, Spektrum Lehrbuch, 2001.
- CHOMSKY, N.: Essays on Form and Interpretation, New York,
Amsterdam, Oxford, North-Holland, 1979.
- CHOMSKY, N.: Thesen zur Theorie der generativen Grammatik,
Studienbuch Linguistik, Weinheim, Beltz-Athenäum, 1995.
- CRYSTAL, D.: The Cambridge Encyclopedia of Language,
Cambridge, Cambridge University Press 1997.
- DE BEAUGRANDE, DRESSLER: Einführung in die Textlinguistik,
Tübingen, Niemeyer Verlag, 1981.
- DE HAAN, P.: The Optimum Corpus Sample Size? in: LEITNER;
G. (ed.): New Directions in English Language Corpora, Mouton de
Gruyter, Berlin, New York, 1992.
- DITTMAR, N.: Sozialer Umbruch und Sprachwandel am Beispiel
der Modalpartikel >halt< und >eben< in der berliner
Kommunikationsgemeinschaft nach der „Wende“, in: Auer, P.,
Hausendorf, H.: Kommunikation in gesellschaftlichen
Umbruchsituationen, Tübingen, Max Niemeyer Verlag, 2000.
- DÖLLING, E.: Multimediale Texte: Multimodalität und
Multicodalität, in Hess-Lüttich (Hrsg.): Medien, Texte und
Maschinen, Angewandte Semiotik, Westdeutscher Verlag 2001.
- ELBEDOUR, S.: The Abusive Behaviours of Teachers in Bedouin
Schools in Israel, in: School Psychology International, London, Sage
Publications, Vol. 18, Aug. 1997.
- FAIRCLOUGH, N.: New Labour, New Language? London, New
York, Routledge, 2000.
- FAULSTICH, W.: Grundwissen Medien, Fink, München, 2004.
- FISCHER, R.: Lexical Change in Present-Day English, A
Corpus-based Study of the Motivation, Institutionalization, and
Productivity of Creative Neologism, Tübingen, Gunter Narr Verlag,
Reihe: Language in Performance 17 (LIP), 1998.
- FRIES, C. C.: The Structure of English, London, Longmans, 1952.
- FRITZ, G.: Historische Semantik, Stuttgart, Weimar, Sammlung
Metzler, Band 313, 1998.
- GALPERIN, P. Y.: Stages in the Development of Mental Acts, in: A
Handbook of Contemporary Soviet Psychology, New York, London,
Cole/ Maltzman, 1969.
213
- GECKELER, H.: Strukturelle Wortfeldforschung heute, in:
LUTZEIER, P. R.: Studien zur Wortfeldtheorie, Tübingen,
Niemeyer, 1993.
- GOLDHAGEN, D. J.: Hitlers willige Vollstrecker, München,
Goldmann Verlag, 2000.
- GÖRLACH, M.: Einführung in die Englische Sprachgeschichte,
Wiesbaden, UTB Quelle und Meyer, 1999.
- GRICE, H. P.: Studies in the way of words, Cambridge, Mass.,
London, Engl., Harvard University Press, 1991.
- HABERMAS, J.: Theorie und Praxis, Sozialphilosophische Studien.
Frankfurt a.M., Suhrkamp, 1982.
- HACKER, W.: Allgemeine Arbeitspsychologie, Schriften zur
Arbeitspsychologie Band 58) Bern, Verlag Hans Huber, 2005.
- HALLIDAY, M.A.K.: An Introduction to Functional Grammar,
London, New York, Arnold Publishers, 2004.
- HALLIDAY, M.A.K.: Language as social semiotic, London, Arnold,
1984.
- HANSEN, S./TEICH, E.: „Kontrastive Analyse von
Übersetzungskorpora: ein funktionales Modell.“ In: GIPPERT, J.
(Hrsg.): Multilinguale Corpora: Codierung, Strukturierung, Analyse.
11. Jahrestagung der GLDV, Prag: enigma corporation. S. 311322, 1999.
- HOLZKAMP, K.: Grundlegung der Psychologie, Frankfurt a.M.,
New York, Campus, 1985.
- HRUSKA, V.: Die Zeitungsnachricht – Information hat Vorrang,
Bonn, ZV Zeitungs-Verlag, 1999.
- JARREN, O., BONFADELLI, H.(eds.): Einführung in die
Publizistikwissenschaft, Bern, Stuttgart, Wien, UTB, 2001.
- JELLOUN, T.B.: Trennt Religion und Politik, in: AMIS, M.,
AUSTER, P., BEGLEY, L. et al.: Dienstag 11. September 2001,
Reinbek bei Hamburg, Rowohlt, 2001.
- KATAMBA, F.: Morphology, Houndmills, Mcmillan Press, 1993.
- KENNEDY, G.: An Introduction to Corpus Linguistic, London,
New York, Longman, 1998.
- KINTSCH, W., VAN DIJK, T.: Strategies of Discourse
Comprehension, New York, Academic Press, 1983.
- KLEIN, E.: Konditionalität in englischen und deutschen
Leitartikeln, in: Forum angewandte Linguistik 26, 1994.
214
- KLEINSTEUBER, H.J.: Terrorismus und Feindbilder. Zur visuellen
Konstruktion von Feinden am Beispiel Osama Bin Laden und
Saddam Hussein, in: Bilder des Terrors – Terror der Bilder?
Krisenberichterstattung am und nach dem 11. September, Köln,
Herbert von Halem Verlag, 2003.
- KROTZ, F.: Krieg als transkultureller Konflikt in der globalisierten
Gesellschaft und die Rolle der Medien, in: Bilder des Terrors –
Terror der Bilder? Krisenberichterstattung am und nach dem 11.
September, Köln, Herbert von Halem Verlag, 2003.
- KUNCZIK, M., ZIPFEL, A. (eds.): Publizistik. Ein
Studienhandbuch, Böhlau, UTB, 2001.
- LEECH, G., RAYSON, P., WILSON, A.: Word Frequencies in
Written and Spoken English, Harlow, London, Longman, 2001.
- LEHR, A.: Kollokationen und maschinenlesbare Korpora, Tübingen,
Niemeyer, 1996.
- LEWANDOWSKI, T.: Linguistisches Wörterbuch 3, Wiesbaden,
UTB Quelle und Meyer, 1990.
- LILIENTHAL, B.: Hypertextartige Strukturen in der Regionalpresse
und neue Möglichkeiten in der Gestaltung von Online-Zeitungen, in:
Forum Angewandte Linguistik, Bd. 34., Europ. Verlag der
Wissenschaften, Berlin, Bern, Frankfurt a.M., 1998.
- LYONS, J.: Semantics I und II, Cambridge, Cambridge Univ. Press,
1985.
- MAST, C., POPP, M., THEILMANN, R.: Journalisten auf der
Datenautobahn, Qualifikationsprofile im Multimediazeitalter,
Konstanz, UKV Medien, 1997.
- MCENERY, T., WILSON, A.: Corpus Linguistics, Edinburgh
University Press, 2001.
- MESTHRIE, R. et al.: Concise Encyclopedia of Sociolinguistics,
Amsterdam, Elsevier, 2001.
- MILLER, G.A.: Wörter, Heidelberg, Berlin, New York, Spektrum,
Akamemischer Verlag, 1992
- MÜLLER, H.: Terror und Trauma, in: Spektrum der
Wissenschaft, Heidelberg, November 2001.
- MURPHY,A.C.: Markers of attribution in English and Italian
opinion articles: A comparative corpus-based study, in: ICAMEJournal No. 29, S.131-150, April 2005.
- NERLICH, B. et al.: Polysemy – Flexible patterns of meaning in
215
mind and language, Berlin, New York, Mouton de Gruyter, 2003.
- NEVERLA, I.: Zäsur und Kompezenz. Thesen zur journalistischen
Krisenberichterstattung, in: Bilder des Terrors – Terror der
Bilder? Krisenberichterstattung am und nach dem 11. September,
Köln, Herbert von Halem Verlag, 2003.
- NOELLE-NEUMANN, E. (ed.): Fischer Lexikon Publizistik
Massenkommunikation, Frankfurt a.M., Fischer Taschenbuch
Verlag, 2002.
- OAKES, M.P.: Statistics for corpus linguistics, Edinburgh,
Edinburgh University Press, 2003.
- OXFORD COLLOCATIONS DICTIONARY FOR STUDENTS OF
ENGLISH, Oxford, Oxford University Press 2003.
- OXFORD ENGLISH DICTIONARY (OED), Oxford, Oxford
University Press 1991.
- PINKER, S.: Der Sprachinstinkt, München, Kindler Verlag, 1996.
- QUIRK, R., GREENBAUM, S.: A comprehensive Grammar of the
English Language, London, Longman, 2004.
- RADEMANN, T.: Using online electronic newspapers in modern
English-Language press corpora: Benefits and pittfalls, in: ICAMEJournal No. 22, S.49-71, April 1998.
- RADLMAIER, S.: Der Nürnberger Lernprozess – Von Kriegsverbrechern und Starreportern, Frankfurt a.M., Eichborn AG, 2001.
- REAH, D.: The Language of Newspapers, London, New York,
Routledge, 1998.
- ROMAINE, S.: Bilingualism, Oxford, Basil Blackwell Ltd., 1989.
- SCHLÜSSELWÖRTER DER WENDEZEIT (Wörter-Buch zum
öffentlichen Sprachgebrauch 1989/ 90), Berlin, de Gruyter, 1997.
- SCHMIDT, S. J. (ed.): Gedächtnis: Probleme und Perspektiven der
interdisziplinären Gedächtnisforschung, Frankfurt a.M., Suhrkamp,
1991.
- SCHNEIDER, P.: Verschon mein Haus, zünd andere an, in: AMIS,
M., AUSTER, P., BEGLEY, L. et al.: Dienstag 11. September 2001,
- SCHWARZ, M., CHUR, J.: Semantik – Ein Arbeitsbuch, Tübingen,
Gunter Narr Verlag, 1993.
- SCOTT, M.: Wordsmith Tools Manual Version 3.0, Oxford,
Oxford University Press 1998.
- SEARLE, J. R.: Ist der menschliche Geist ein Computerprogramm?
216
in: Spektrum der Wissenschaft, Heidelberg, März 1990.
- SEELY, J.: Oxford A-Z of Grammar and Punctuation, Oxford,
Oxford University Press, 2004.
- SEMINO, E., SHORT, M.: Corpus stylistics, Routledge, London,
New York, 2004.
- SHANNON, C. E., WEAVER, W.: Mathematische Grundlagen der
Informationstheorie, München, R. Oldenbourg Verlag, 1976.
- SINCLAIR, J.: Corpus Concordance Collocation, Oxford, Oxford
- SINCLAIR, J.: Korpustypologie. Ein Klassifikationsrahmen, in :
TEUBERT, W. (ed.): Neologie und Korpus, Tübingen, Narr, 1998.
- SOUEIF, A.: Durch die Augen der Enteigneten, in: AMIS, M.,
AUSTER, P., BEGLEY, L. et al.: Dienstag 11. September 2001,
- SPOLSKY, B.: Sociolinguistics, Oxford, New York, Oxford
- STORRER, A.: Kohärenz in Text und Hypertext, in: LOBIN, H.:
Texte in digitalen Medien, Opladen, Westdeutscher Verlag, 1999.
- STSCHERBAK, J.: Protokolle einer Katastrophe, Frankfurt a.M.,
Athenäum, 1988.
- STUBBS, M.: Text and Corpus Analysis, Oxford, Blackwell, 1996.
- SVARTVIK, J. (ed.), GREENBAUM, S.: The London-Lund Corpus
of Spoken English, Lund, Lund University Press, 1990.
- TESAK, J.: Einführung in die Aphasiologie, Stuttgart, New York,
Thieme, 1997.
- THOMPSON, G.: Introducing Functional Grammar, London,
Arnold, 2004.
- TODD, E.: Weltmacht USA - Ein Nachruf, München, Zürich, Piper,
2002.
- TOGNINI-BONELLI, E.: Corpus Linguistics at work, Amsterdam/
Philadelphia, John Benjamins Publishing Company, 2001.
- TOWNSHEND, C.: Terrorism – A very short Introduction,
Oxford, Oxford University Press, 2002.
- TRAUTNER, H. M.: Lehrbuch der Entwicklungspsychologie,
Göttingen u.a., Verlag für Psychologie Hogrefe, 1997.
- VATER, H.: Einführung in die Sprachwissenschaft, München UTB,
1999.
- VESTER, F.: Denken, Lernen, Vergessen; Stuttgart, DTV217
Taschenbuch, 1976.
- VYGOTSKY, L. S.: Thought and Language; Cambridge, Mass.,
M.I.T. Press, 1962.
- WEHR, H.: Arabisches Wörterbuch für die Schriftsprache der
Gegenwart, Wiesbaden, Otto-Harrossowitz-Verlag, 1985.
- WESTIN, I., GEISLER, C.: A multi-dimensional study of diachronic
variation in British newspaper editorials, in: ICAME-Journal No. 26,
S.133-152, April 2002.
- WICHTER, S.: Zur Computerwortschatzausbreitung in die
Gemeinsprache, Frankfurt a.M., Bern, New York, Paris, Peter Lang
Verlag, 1991.
- ZIPF, G.K.: The Psycho-Biology of Language, Cambridge, Mass.,
MIT Press, 1965.
Zeitschriften, Zeitungen, Broschüren etc.
- Audit Bureau of Circulations.
- Berliner Zeitung, 01.11.2001.
- Frankfurter Allgemeine Zeitung, 30.08.2001
- ICAME-Journal No. 18, April 1994.
- Neue Zürcher Zeitung, 28.8.2001
- TENCH, P., Press Phonology (Poster), Centre of Language and
Communication, University of Cardiff, UK, 1990.
- Der Spiegel-Spezial (29.6.2004): Der Krieg des 21. Jahrhunderts.
- Der Spiegel 36/ 2006
- Süddeutsche Zeitung, 26.07.2001
- The Independent, 02.12.2001.
- The Times, 19.11.2001.
- Time, 10.04.2006.
218
Literaturnachweis der Korpusquellen:
The Guardian CD-Rom 1990.
The Guardian CD-Rom 2001.
The Independent CD-Rom 1990.
The Times CD-Rom 1990.
Online Zeitung von The Guardian vom 26.11. bis 11.12.2001
(www.guardian.co.uk).
Online Zeitung von The Independent vom 26.11. bis 11.12.2001
(www.independent.co.uk).
Online Zeitung von The Times vom 2.8. bis 15.10.2001
(www.thetimes.co.uk).
Electronic Database des British Council
(www.britishcouncil.de).
Beilage:
CD-Rom mit drei Versionen der Korpora:
1. Die drei Hauptkorpora
2. Die neun Subkorpora
3. Das Superkorpus
219
Danksagung
Ich danke den betreuenden Professoren des Doktorandenkolloquiums des Instituts für Semiotik der Technischen
Universität Berlin, Frau Dölling und Herrn Posner.
Ich bedanke mich ferner beim Englischen Seminar der ChristianAlbrechts-Universität Kiel und dessen Bibliothekarinnen für
deren freundliche Unterstützung und Erteilung einer
Seminarkarte.
Bei den Mitarbeitern des „British Council“ in Berlin bedanke ich
mich, dass sie mir die benötigten Zeitungs-CD-Roms überlassen
haben. Ebenso danke ich den Mitarbeitern des Zentrums für
Fremdsprachenausbildung IT- und Medieneinsatz (ZFIM) der
CAU für die Einrichtung eines Nutzer-Accounts im ZFIM-Pool.
Ein besonderer Dank gilt meinem Doktorvater, dem emeritierten
Prof. Braun, der mich in vielen Einzelgesprächen in meinem
Anliegen unterstützte.
Danke an meine Familie, sowie an Heribert Rüther und Maria
Kiesbye fürs Korrekturlesen.
220

K2 - DepositOnce

Transcrição

Documentos relacionados

Naechstelink

Nutzungsvereinbarung für das Korpus `Skandinavische

Freitagsgedanken 19.08. - Der Islam in einer Identitätskrise? Ich

Lesenswertes

08 04 2011 Güzel Ahlak Deutsch

Bibliographie

Birgit Kelle zur Schoduvel-Absage

7.Übung zur Vorlesung Künstliche Intelligenz

Presse-Information - Studienkreis für Tourismus und Entwicklung

Gemeinsames Literaturverzeichnis