here - Department of English and Linguistics

Сomentários

Transcrição

here - Department of English and Linguistics
PREPRINT – JANUARY 2012
– please do not cite without permission
1
-
Sprachwandel im 20.Jahrhundert. Veränderungen im Gebrauch der englischen
und deutschen Modalverben der Obligation und Notwendigkeit
Verena Jäger
Johannes Gutenberg-Universität Mainz
Schon vor mehr als 30 Jahren ging Dwight Bolinger davon aus, dass eine Umorganisation im
System der englischen Modalverben stattfindet (1980:6). Vor allem im vergangenen Jahrzehnt
konnte diese Behauptung dank der Entwicklung elektronischer Korpora, die eine Analyse großer
Datenmengen ermöglichen, untermauert werden (z.B. Krug 2000, Leech 2003, 2011, Millar
2009). Historische Sprachwandelprozesse wurden intensiv untersucht, auch mit besonderem
Blick auf die Grammatikalisierung von Modalverben (z.B. Traugott 1989). Neben Tendenzen
zum Bedeutungswandel konnten zudem Veränderungen in der Häufigkeit des Gebrauchs von
Modalverben beobachtet werden, in historischen Korpora (z.B: Biber et al. 1998) wie auch im
20. Jahrhundert. So wurde gezeigt, dass in der zweiten Hälfte des letzten Jahrhunderts die
meisten der sog. zentralen Modalverben (z.B. must und should) im Gebrauch abnahmen, während
einige der oft als semi-modal oder periphrastisch bezeichneten Verben (Biber et al. 1999:484),
insbesondere jene, die dem Bedeutungsfeld der Obligation und Notwendigkeit angehören – das
im Folgenden untersucht wird – verstärkt Verwendung fanden (z.B. Leech 2003).
Die Entstehung des Google Books Korpus (2011) ermöglicht es nun, die Entwicklung dieser
Verben in einer gigantischen Textmenge zu untersuchen, die alle bisherigen Korpora an Größe
übertrifft. Als Zeitraum wurde dafür eine Periode von 100 Jahren (1900–1999) gewählt. Als
Vergleich bzw. zur Ergänzung wird überdies das Corpus of Historical American English
verwendet, das eine registerdifferenzierte Betrachtung ermöglicht. Ob es ähnliche Entwicklungen
auch im Deutschen gibt, wird anhand des deutschen Teils des Google Books Korpus und des
digitalen Wörterbuch der deutschen Sprache untersucht.
1. FORSCHUNGSÜBERLICK
„The modals ARE declining“ ist der Titel eines jüngst veröffentlichen Artikels (Dez. 2011) von
Geoffrey Leech, der die Aktualität der Frage nach Häufigkeitsveränderungen im Gebrauch von
englischen Modalverben im 20. Jahrhundert widerspiegelt. In dieser Replik zu Neil Millar (2009)
zeigt Leech anhand von Daten der Familie der britischen Brown-Korpora, die Texte aus den
Jahren 1901, 1931, 1961, 1991 und 2006 enthalten, und des Corpus of Historical American
English, dass die Verwendung von will, should, must, might, shall, ought und need(n’t)
signifikant abgenommen hat. Er bekräftigt damit seine These aus dem Jahr 2003, als er bei einem
Vergleich von Korpora des britischen und amerikanischen Englisch aus den Jahren 1961 und
1991/92 angesichts des Rückgangs im Gebrauch der meisten zentralen Modalverben
schlussfolgerte, es liege nahe, dass es sich hierbei um einen allgemeinen, langanhaltenden Trend
handele (235). Biber et al., die Modalverben im ARCHER Korpus (A Representative Corpus of
Historical English Registers) untersuchen, sprechen ebenfalls von einem leichten Schwund im
20. Jahrhundert (1998:208). Millar stellt bei seiner Untersuchung des Time Magazine Korpus eine
Abnahme von must, should und ought, insgesamt jedoch eine Zunahme im Gebrauch der
Modalverben fest (2009:199). Diese Unterschiede, so Leech und Millar, sind wahrscheinlich auf
PREPRINT – JANUARY 2012
– please do not cite without permission
2
die Textkomposition der verschiedenen Korpora zurückzuführen: während Millar nur das Time
Magazine untersucht, speisen sich die Brown-Korpora neben Pressetexten aus general prose und
learned fiction. Die Diskussion wirft die Frage auf, welche Rolle verschiedene Texttraditionen
beim Sprachwandel spielen und inwieweit Korpora repräsentativ für eine Sprache sind. Auf
Letzteres wird später noch einmal eingegangen.
Viele Studien zeigen, dass im Gegensatz zu den zentralen Modalverben einige semi-modale
Verben in der zweiten Hälfte 20. Jahrhunderts im Gebrauch zunehmen (Leech 2003:28, Biber
2004:118-119, Müller 2008:5, Millar 2009:196), den Rückgang der hochfrequenten zentralen
Modalverben aber nur zu einem kleinen Teil kompensieren. Manfred Krug ist der Ansicht, dass
wir der Herausbildung einer neuen Klasse von emerging modals beiwohnen, zu der im engeren
Sinne be going to, have to, have got to und want to gehören. Im weiteren Sinne zählt er auch need
to, ought to und dare to hinzu; ihr Gebrauch, so Krug, nehme allerdings nicht zu, sondern bleibe
stabil bzw. nehme ab (2000:3-5).1 Einige Autoren vermuten einen Zusammenhang zwischen der
Kolloquialisierung der geschriebenen Sprache und der Zunahme im Gebrauch der semi-modalen
Verben (z.B. Leech 2003, Millar 2009), die in der gesprochenen Sprache öfter als in Schriften
verwendet werden (vgl. Biber et al. 1999:487-490). Auch John Myhills Beobachtung, dass die
‚alten‘ zentralen Modalverben mit hierarchischen Strukturen, starren gesellschaftlichen Regeln
und universellen Prinzipien assoziiert werden, während die neuen Modalformen ausgeglichenere
Machtverhältnisse voraussetzen und Kooperationen und Interaktionen zwischen den
Gesprächspartnern in den Vordergrund stellen (1995:157-160), wird von zahlreichen Autoren
(Leech 2003, Müller 2008, Millar 2009) zusammen mit der These der Demokratisierung des
Diskurses (vgl. Fairclough 1992: 201-203) als Ansatz zur Erklärung der Veränderungen im
System Modalität aufgegriffen; relevant scheint er insbesondere für das Bedeutungsfeld von
Verpflichtungen und Notwendigkeiten, zu dem must, should, have (got) to, need, ought to (Quirk
et al. 1985:221) sowie u.a. need to gehören. Diese Verben, die den Gegenstand der nachfolgenden
Untersuchung bilden, sind insgesamt seltener als die Modalverben anderer Bedeutungsgruppen
(Biber et al. 1999: 493-494). Sie werden zum Ausdruck epistemischer und insbesondere auch
nicht-epistemischer Bedeutungen verwendet (vgl. Palmer 1990).
In der Forschung zur Modalität im Deutschen besteht allgemeiner Konsens darüber, dass dürfen,
können, mögen, müssen, sollen und wollen Modalverben sind. Die Zugehörigkeit von brauchen
und werden sowie insbesondere von möchten und lassen zu dieser Kategorie, die je nach Autor
auf semantischen, syntaktischen oder einer Kombination aus beiden Kriterien basiert, ist
umstritten (vgl. Johnen 2006: 284-290). Einige Autoren unterscheiden Modalverben von
Halbmodalen (z.B. Eisenberg 1999: 352-353) und Modalitätsverben (Engel 2004). Nur wenige
dieser Verben gehören dem Bedeutungsfeld der Verpflichtung und Notwendigkeit an. Dazu
zählen haben (zu) und sein (zu) (vgl. Fritz 1997:17), deren Einbeziehung in diese Studie aber nur
bei einer manueller Untersuchung möglich gewesen wäre, die angesichts der Korpusgrößen nicht
zu leisten war.
In diachronen Beschreibungen stehen oft die semantische und morphologische Entwicklung
sowie die Grammatikalisierung der deutschen Modalverben im Vordergrund (z.B. Fritz 1997,
Diewald 1999, Reis 2007). Fritz klagt jedoch über „große Lücken in der empirischen
1.
1
In vielen Studien und Grammatiken wird ought to, dessen Gebrauch in der 2. Hälfte des 20. Jhdts
deutlich abnimmt (vgl. Leech 2003, Müller 2008), hingegen als marginal modal / auxiliary (Biber et
al. 1999: 484) betrachtet und damit als den zentralen Modalverben ähnlicher als z.B. have (got) to
(Quirk et al. 1985: 137).
PREPRINT – JANUARY 2012
– please do not cite without permission
3
Bestandsaufnahme für einzelne Autoren, Textsorten und Zeitstufen“ (1997:8). Nur vereinzelt
werden Aussagen über Häufigkeiten im Neuhochdeutschen, insbesondere im letzten Jahrhundert,
gemacht. So gibt Reinhold Glas im Anhang zu seiner Studie von sollen die Frequenzen der
Modalverben im LIMAS Korpus (1973) an (vgl. Tab. 1). Dieses Korpus mit Texten aus den
Jahren 1970/71 – die deutsche Entsprechung zum amerikanischen Brown-Korpus – besteht aus
500 Texten mit je mind. 2000 Textwörtern aus den „verschiedensten Sachgebieten und
Textsorten“ (Glas 1984:121) und enthält 1 062 624 laufende Wortformen (tokens) sowie 110 837
Types (Hausser 2000:317).
Modalverb
Frequenz pro 100 Wörter
können
0,511
müssen
0,238
sollen
0,187
wollen
0,107
dürfen
0,059
mögen
0,039
brauchen
0,021
Tabelle 1: Frequenzen der Modalverben im LIMAS Korpus (Glas 1984:122)
Weit verbreitet ist auch die Angabe von Häufigkeiten in Relation zur Gesamtmenge der
Modalverben (z.B. Brünner & Redder 1983). Diewald (1999:7-11) stellt beispielsweise bei einer
Untersuchung von 105 Seiten aus dem Magazin Der Spiegel (11/1996) folgende Verteilungen
fest: können (38,4% der 448 untersuchten Modalverben), wollen (20,3%), müssen (15,9%), sollen
(13,2%), mögen (6,3%) und dürfen (5,6%). Diese Werte sind, wie Diewald angibt, nicht als
statistisch relevante Angaben intendiert (1999:8) und bieten nur eingeschränkt
Vergleichsmöglichkeiten. Im Folgenden werden die Frequenzen der untersuchten Verben in
Wörtern pro Millionen angegeben.
2. VERWENDETE KORPORA
Als Datengrundlage wurden die Teile „amerikanisches Englisch“ und „Deutsch“ des neuen
Google Books Korpus verwendet, das auf der Basis der mehr als 15 Millionen von Google
digitalisierten Bücher geschaffen wurde. Die meisten dieser Bücher stammen aus über 40
Universitäts-bibliotheken weltweit, ab 2004 wurden auch viele von Verlagen beigesteuert, sodass
die Zusammensetzung der Daten sich deutlich veränderte. Aus diesem Grund verwenden Michel
et al. keine Daten des 21. Jahrhunderts in der Publikation (2011a), in der sie das Korpus
vorstellen. Die Auswahl der 5 195 769 digitalisierten (~4% aller je veröffentlichten) Bücher für
das Korpus erfolgte anhand der Qualität der Zeichenerkennung und der Metadaten. Es enthält
Amerikanisches
insgesamt mehr als 500 Billionen Wörter, davon Korpusteil
Deutsch
Englisch
155 Billionen im amerikanischen Englisch und
16.Jhdt.
18 974
891 341
37 Billionen im Deutschen. Zur Wahrung des
17.Jhdt.
881
396
4
830 321
Copyrights der Autoren werden im Google
18.Jhdt.
55 864 117
39 884 018
Books N-Gram Viewer nur Sequenzen von 1 bis
5 leerzeichenlosen Buchstaben- oder Zeichenfol19.Jhdt.
5 812 359 978
22 926 851 420
gen, die mindestens 40 Mal vorkommen, an20.Jhdt.
24 084 313 167 107 683 819 692
gezeigt. Beispiele für diese sog. n-grams sind
Tabelle 2. Anzahl der 1-grams in den Teilen ‚Deutsch‘
„stock market“ (2-gram) und „3.14159“ (1und ‚amerikanisches Englisch‘ des Google Books Korpus
gram) (Michel et al. 2011a:176).
Michel et al. betonen, dass das Korpus die Möglichkeit zur quantitativen Untersuchung
kultureller Entwicklungen bietet. Sie verwenden für diese Form der Analyse von
Hochdurchsatzdatenbasen das Schlagwort Culturomics. Bücher, so die Autoren, seien nur der
Anfang; Zeitungen, Pläne, Kunstwerke und eine Vielzahl anderer menschlicher Produkte müssten
noch einbezogen werden (2011a:181). Auch gesprochene Sprache, die den Großteil menschlicher
PREPRINT – JANUARY 2012
– please do not cite without permission
4
Kommunikation ausmacht, wird nicht erfasst. Ein weiterer Nachteil ist, dass die Zusammensetzung des Korpus von der Aquisitionspraxis der teilnehmenden Universitätsbibliotheken
abhängig ist und somit deutliche Änderungen bei Schwerpunktverlagerungen entstehen können
(vgl. Michel et al. 2011b:16).
Der im Google Books N-gram Viewer bietet Nutzern nur eingeschränkte Suchmöglichkeiten
(z.B. keine Berücksichtigung von Satzzeichen und kein Part-of-Speech Tagging). Im Mai 2011
schaltete Mark Davies (Brigham Young University) eine Benutzeroberfläche frei, die es hingegen
möglich macht, im Teil „amerikanisches Englisch“ des Korpus u.a. nach Lemmata, Synonymen
und Kollokationen zu suchen. Diese Oberfläche wurde hier für die Auswertung des
amerikanischen Englisch verwendet. Für das Deutsche wurden die im N-Gram Viewer
angezeigten Zeit-Wortfrequenz-Graphen (smoothing=0) für jede einzelne Wortform ausgelesen
und aufaddiert. Als Ergänzung wurden darüber hinaus ein deutsches und ein englisches
Referenzkorpus verwendet: das Kernkorpus des Digitalen Wörterbuches der deutschen Sprache
(DWDS) und das Corpus of Historical American English (COHA).
Das DWDS wurde von der Berlin-Brandenburgischen Akademie der Wissenschaften mit dem
Ziel geschaffen, möglichst ausgewogen und „hinreichend groß“ zu sein, um für den deutschen
Wortschatzes des 20. Jahrhunderts repräsentativ zu sein (vlg. Homepage des DWDS). Derzeit
besteht das online-Kernkorpus (ohne den Teil ‚gesprochene Sprache’) aus ca. 101 Millionen
Wörtern aus Zeitungen (27,9%), Belletristik (26%), Wissenschaft (22%) und Gebrauchsliteratur
(24%). Letztere speist sich u.a. aus Werbe- und Gesetzestexten, Kochbüchern und Reiseführern
(vgl. Geyken 2009). Die Anzahl der Wörter pro Dekade liegt zwischen 8,7 Mio. (Dekade 7) und
11,2 Mio. Wörtern (Dekade 3). Die „ideale” Verteilung, so heißt es auf der DWDS-Homepage,
sei momentan noch nicht erreicht, da drei Dekaden noch unter der geplanten Größe liegen.
Das COHA (1810-2009) umfasst mehr als 400 Millionen Wörter aus Zeitungen, populären
Magazinen sowie den Bereichen fiction (Belletristik) und non-fiction books. Eine Balance von
Texten aus verschiedenen Registern und Subregistern wird beibehalten und sorgt dafür, so heißt
es auf der Webseite des COHA, dass Forscher hinreichend sicher sein können, dass die Daten
tatsächliche Veränderungen in der ‚realen Welt‘ reflektieren anstatt nur Produkte von Veränderungen der Korpuszusammensetzung zu sein. Wie repräsentativ ein Korpus ist, hängt davon ab,
inwiefern er die volle Bandbreite an Variabilität in der Zielgruppe widerspiegelt, die er
repräsentieren soll. Dafür maßgeblich ist zum einen die Berücksichtigung unterschiedlicher
Textsorten, zum anderen, dass das gesamte Spektrum verschiedener sprachlicher Charakteristika
in diesen Texten und Textarten widergegeben wird (vgl. Biber 1993:243). Da auch der Gebrauch
von Modalverben je nach Register sehr unterschiedlich ist, werden nachfolgend neben dem
Google Books Korpus, dessen genaue Zusammensetzung nicht bekannt ist, das COHA und das
DWDS untersucht, um zu sehen, welche Veränderungen es im Zeitraum von 1900 bis 1999 in
verschiedenen Textsorten im Deutschen und amerikanischen Englisch gibt.
3. ERGEBNISSE
a) Zentrale Modalverben und semi-modale Verben im amerikanischen Englisch
Wie die Ergebnisse von Leech (2011) und Millar (2009) zeigen, ist es unumstritten, dass der
Gebrauch der zentralen Modalverben der Obligation und Notwendigkeit im 20. Jahrhundert
abnimmt (s.o.). Wie in den Brown-Korpora und dem Time Magazine Korpus ist der Rückgang
PREPRINT – JANUARY 2012
– please do not cite without permission
5
auch im Google Books Korpus sichtbar. Tabelle 3 zeigt die Frequenzen von should, must, ought
to und dem modalen need2 in Wörtern pro Millionen (W/M). Ihre Abnahme zwischen den 1900er
und 1990er Jahren ist höchst signifikant (χ2=690, 592, 596, 73; p<0,001%., d.f.=1). In allen
Fällen besteht eine starke negative Korrelation zwischen den Zeitperioden und den Frequenzen
(τ<-0,8). Ought to und need, die bisweilen schon als totgeweiht betrachtet werden (Leech spricht
z.B. vom Ende ihres „useful life“, 2003:236), werden dabei deutlich seltener gebraucht als must
und should, insbesondere am Ende des Jahrhunderts.
1910s
1910s
1920s 1930s 1940s 1950s 1960s 1970s 1980s 1990s
should
1054,3
1092,1
1084,5
989,9
972,5
933,3
848,2
834,3
794,4
732,1
-30,6%
must3
869,4
909,6
896,3
841,6
843,0
816,8
794,9
722,9
651,4
596,5
-31,4%
ought to
108,4
94,8
88,8
77,4
65,1
61,4
60,5
48,0
36,4
32,2
-70,3%
37,0
36,4
35,1
31,7
31,4
32,3
31,8
28,6
24,0
19,1
-48,5%
need
Differenz
Korrelationseffizienten (Zeit~ Frequenz): should: p=3,0e-05, τ= -0,91,
must: p=1,2e-04, τ= -0,86;
ought to: p=5,5e-07 τ= -1;
need: p=3,6 e-04 τ= -0,82
graue Schrift: Die Nullhypothese (die Abweichung zwischen der grau markierten und der vorausgehenden Frequenz
ist eine Zufallsvariation) kann nicht abgelehnt werden (p>5%, d.f.=1).
Tabelle 3. Frequenzen ausgewählter zentraler Modalverben im Google Books Korpus (BYU), in W/M
Im COHA, das auch Texte aus
Zeitungen und Zeitschriften enthält,
stellt sich die Abnahme im
Gebrauch von should (1900s/ 1990s:
207/ 100 W/M, -36%) must (199/ 96
W/M, -54%), ought to (147/ 42
W/M, -72%) und need (50/ 13 W/M,
-75%) drastischer dar als im Google
Books
Korpus.
Dank
der
Möglichkeit, die Frequenzen für
einzelne
Jahre
im
COHA
(Gesamtkorpus) zu ermitteln, ergibt
sich ein differenziertes Bild, das
verdeutlicht, wie sehr der Gebrauch
dieser Verben von Jahr zu Jahr
schwankt. Abb. 1 zeigt die
Entwicklung von must im Google
Books Korpus (in Dekaden) sowie
im COHA (in Jahren).
Abb. 1. Frequenzen von must im COHA und im Google Books
American English Korpus (BYU)
2.
2
Da das modale need im Gegensatz zum semi-modalen need to nur in nicht-assertiven Kontexten auftritt, wurde
im Google Books Korpus und im COHA nach needn’t / need not und nach need direkt gefolgt von Infinitiven
[vvi*] gesucht. Da das POS-Tagging sich im Falle von need help (z.B. I need help!:Anthology, Science of Mind
Publ., 1977) überwiegend als nicht korrekt erwies, wurden diese Fälle herausgerechnet. Mit weiteren
Ungenauigkeiten durch die Unzuverlässigkeit des POS-Taggings muss gerechnet werden.
3. 3 schließt Fälle von must als Substantiv ein (kein POS-Tagging)
PREPRINT – JANUARY 2012
– please do not cite without permission
6
Auf der Grundlage dieser Daten wurde ein variability-based neighbor clustering für alle vier
Modalverben durchgeführt. Bei dieser Methode werden Daten aus zeitlich aufeinanderfolgenden
Perioden (hier: Jahren), die einander ähnlich sind, gruppiert. Nacheinander werden die Werte mit
dem jeweils geringsten Unterschied (gemessen in der Standardabweichung) in Clustern zusammengefasst, bis am Ende nur noch ein Cluster übrigbleibt (vgl. Gries und Hilpert 2009 sowie
Hilpert und Gries 2012). Dieser Vorgang kann mithilfe eines Dendrogramms – eines Baumdiagramms, das die einzelnen Verzweigungen zeigt – visualisiert werden (vgl. Abb. 2 rechts). Ein
sog. scree plot zeigt dann die Distanz zwischen den zusammengefassten Datensätzen in umgekehrter Reihenfolge an. An dieser Art der Darstellung lässt sich ablesen, wie viel Information bei
einer Annahme von 1,2,3 oder mehr Clustern transportiert wird. Ziel ist dabei, so wenige Cluster
wie möglich zu haben, aber auch möglichst nahe an der x-Achse zu sein. Im Falle von must im
COHA besteht ein großer Abstand zwischen einem, zwei und drei Clustern (vgl. Abb. 2 links),
die Abstände werden danach aber deutlich geringer. Daher ist es sinnvoll, grob drei Zeitintervalle
beim Rückgang im Gebrauch von must zu unterscheiden, die im Dendrogramm durch blaue
Linien angezeigt werden: von 1900 bis zu Beginn der 1920er Jahre (die Frequenz war 1923 mit
1289 W/M so hoch wie nie), von den 1920er Jahren bis Mitte der 1970er Jahre (1976 sank die
Frequenz erstmals unter 700 W/M) und eine letzte Phase bis 1999.
Abb. 2. Scree plot und Dendrogramm der Frequenzen von must im COHA
Auch bei den VNC-Auswertungen von ought to, should und need in COHA zeigt sich, dass von
einer ersten Periode bis zu den frühen 1920er Jahren ausgegangen werden kann. Während bei
grober Betrachtung im Falle von should und need nur noch eine zweite Phase geringeren
Gebrauchs bis zum Jahrhundertende angenommen werden kann, ist bei ought to eine stärkere
Differenzierung sinnvoll: eine zweite Phase reicht bis zum Beginn der 1950er Jahre, die letzte bis
1999. Auch die VNC-Analyse der Google Books Durchschnittsfrequenzen pro Dekade zeigt, dass
bei einer Annahme von jeweils 4 Clustern bei must, ought to und need eine erste Periode bis zu
den 1920er Jahren (einschließlich) angenommen werden kann. Somit kristallisiert sich dieser
Zeitraum für alle untersuchten zentralen Modalverben klar als (letzte) Hochphase des Gebrauchs
im 20. Jahrhundert heraus.
PREPRINT – JANUARY 2012
– please do not cite without permission
7
Der Gebrauch der zentralen Modalverben nimmt – mit Ausnahme von need in non-fiction books
– in allen Korpusteilen des COHA ab.
Während should und must am häufigsten
in non-fiction books vorkommen und
die Frequenz von ought to in fiction am
höchsten ist, bietet sich bei need bietet
ein gemischtes Bild: bis zu den 1930er
Jahren findet es am stärksten in fiction
Verwendung, ab den 1950er Jahren in
non-fiction books.
Im Gebrauch von must in fiction ist (wie
in magazine ab den 1910er Jahren) ein
konstanter Rückgang zu beobachten
(vgl. Abb. 3). In Zeitungen wird must
und should insbesondere in den 1910er
Jahren häufig verwendet. Must erreicht
Abb. 3. Frequenzen von must in den verschiedenen Korpusteilen
einen weiteren Höhepunkt in den
des COHA sowie von should im Zeitungsteil
1940er Jahren, should in den 1950er
Jahren.
Da in Zeitungen schneller als in anderen Registern auf soziale und kulturelle Entwicklungen
reagiert wird (vgl. Mair 2006:188), ist es denkbar, dass diese Entwicklungen soziopolitische
Ursachen haben. Millar weist darauf hin, dass must als unmissverständlich deutlicher Ausdruck
deontischer Modalität während des Zweiten Weltkriegs besonders beliebt gewesen sein könnte
(2009:213). Zudem könnte man vermuten, dass should äußerst gut in die 1950er Jahre passte, die
Kaledin als das Jahrzehnt soziologischer Entdeckungen und Kulturanalysen bezeichnet, in
demeinige Zeitschriften sogar ihre Leser aufforderten, über die Ziele der Nation nachzudenken
(2000:152). Erklärungsansätze dieser Art sind jedoch angesichts der Komplexität historischer und
kultureller Zusammenhänge mit Vorsicht zu betrachten.
Im Gegensatz zu den zentralen Modalverben nimmt der Gebrauch von have to, want to4 und need
to, die von Krug (2000) als emerging modals klassifiziert werden, im Laufe des Jahrhunderts im
Google Books Korpus signifikant zu. Bei have got to kann ein marginaler Rückgang beobachtet
werden (von 1,3 auf 0,7 W/M), es kann jedoch nicht ausgeschlossen werden, dass es sich um eine
zufällige Variation handelt (χ2=3,54, p>5%, d.f.=1). Die Verwendung von gotta nimmt mit
Ausnahme der 1950er und 1960er stark zu (1970er / 1990er J.: 1,9 / 3,8 W/M), im COHA kommt
es hingegen nur drei Mal vor.
1900s
1910s
1920s 1930s 1940s 1950s 1960s 1970s 1980s 1990s
Differenz
have to
76,2
94,8
103,7
115,9
138,7
141,2
140,4
151,9
164,2
187,8
+146%
need to
14,8
17,9
21,8
25,4
31,6
41,9
48,9
67,8
98,0
149,1
+907%
want to
24,7
30,9
35,7
40,5
48,9
47,5
44,7
52,3
65,5
91,2
+286%
Korrelationseffizienten (Zeit~Frequenz): have to: p=5,5e-06, τ= 0,95; need to: p=5,5e-07 τ= 1; want to: p=1,2e-04 τ= 0,86
graue Schrift: Die Nullhypothese (die Abweichung zwischen der grau markierten und der vorausgehenden Frequenz
ist eine Zufallsvariation) kann nicht abgelehnt werden (p>5%, d.f.=1).
4.
4
Want to (inkl. der Form wanna) wird aufgrund seiner morphosyntaktischen Verwandtschaft und seiner Fähigkeit,
neben volitiven auch deontische Bedeutungen auszudrücken (vgl. Krug 2000:148), mit untersucht.
PREPRINT – JANUARY 2012
– please do not cite without permission
8
Tabelle 4. Frequenzen ausgewählter semi-modaler Verben im Google Books Korpus (BYU), in W/M
Im Vergleich zum Google Books Korpus ist have got to ist deutlich öfter im COHA zu finden, wo
es insbesondere, wenn auch mit abnehmender Tendenz (τ=-0,6; p=0,02), im fiction-Teil
verwendet wird (1900er/1990er J.: 72/ 53W/M, vgl. mit non-fiction: 1/ 5W/M). Der Gebrauch
von have to verdoppelt sich auch im COHA in der ersten Jahrhunderthälfte fast (1900er/ 1950er
J.: 397/ 801 W/M), steigt danach aber nur langsam an (1990er J.: 838W/M). VNC-Analysen
zeigen, dass in beiden Korpora bei have to vier grobe Phasen unterschieden werden können: von
1900 bis ca. 1910, bis zu den 1930er Jahren sowie bis Mitte der 1950er Jahre (COHA) bzw. bis
Ende der 1980er Jahre (Google Books).
Abb. 4. Frequenzen von have to und need to im COHA und im Google Books Korpus (BYU)
Bei einem Vergleich der beiden Korpora werden jedoch auch große Frequenzunterschiede
sichtbar. So wird have to im Durchschnitt 4,6 bis 5,8 Mal so oft im COHA wie im Google Books
Korpus verwendet (vlg. Abb. 4). Bei dem seltener gebrauchten need to, das zum Jahrhundertende
hin einen rasanten Aufschwung in beiden Korpora erlebt, ist die Differenz mit einer Relation von
1,3 – 2,8 deutlich geringer.
Es liegt nahe, dass diese Abweichungen sich zumindest teilweise aus der unterschiedlichen
Zusammensetzung der beiden Korpora ergeben. Während anzunehmen ist, dass ein Großteil der
Google Books wissenschaftlichen Charakter haben und ein deutlich kleinerer Teil Belletristik und
Gebrauchsliteratur ist, hat der COHA einen sehr hohen Anteil an fiction-Texten (48-53% pro
Dekade), in denen have to häufiger gebraucht wird als z.B. in non-fiction books (1,8–2 Mal so
oft). Auch in den Zeitschriften und Zeitungen (29-41% der Wörter pro Dekade) findet have to
stärkere Verwendung als in non-fiction books. Dies deckt sich mit der Beobachtung von Biber et
al., dass have to in fiction häufiger als in Zeitungen und am seltensten in wissenschaftlichen
Texten vorkommt. Da Belletristik oft Dialoge enthält, bestehen gewisse Gemeinsamkeiten mit
der gesprochenen Sprache, in der have to besonders stark verwendet wird (1999:490). Krug, der
eine deutliche Zunahme im Gebrauch von have to zwischen 1800-49 und 1950-90 in ARCHER
beobachtet, ist der Ansicht, dass die Sprache in fiction sich der gesprochenen Sprache schon stark
angepasst hat, während die Pressesprache, die von Hundt und Mair als agiles und für sprachliche
Veränderungen sehr empfängliches Genre betrachtet wird (1999:234-236), sich noch im Wandel
PREPRINT – JANUARY 2012
– please do not cite without permission
9
befindet (2000:86). In der Tat nimmt der Gebrauch von have to und want to im COHA insgesamt
am stärksten im Zeitschriftenteil, der von need to im Zeitungsteil zu. Auch die Frequenz von
want to, das, wie have to, im COHA deutlich häufiger (6–12 Mal so oft) verwendet wird als im
Google Books Korpus, ist in fiction 3–9 Mal so hoch wie in non-fiction books. Need to wird
hingegen am häufigsten in non-fiction books und ab den 1930er Jahren am seltensten in fiction
verwendet. Hier bestehen auch keine so großen Unterschiede zwischen den Häufigkeiten in den
einzelnen Registern.
Abb. 5. Frequenzen von have to und need to in den verschiedenen Korpusteilen des COHA
VNC-Analysen zeigen, dass die Phasen, die bei der Zunahme im Gebrauch von semi-modalen
Verben unterschieden werden können, sich überwiegend nicht mit denen des Rückgangs im
Gebrauch der zentralen Modalverben decken (s.o.). Bei have to können beispielsweise 4 Phasen
angenommen werden, die bis zum Ende der 1910er Jahre, zur Mitte der 1930er Jahre und zur
Mitte der 1950er Jahre reichen, und auch bei want to ist eine Phasierung bis zur Mitte der 1930er
Jahre sinnvoll. Bei einer Annahme von 3 Clustern kann im Falle von need to von einer langen
Periode bis zur Mitte der 1970er Jahre, gefolgt von zwei kurzen Phasen bis zum Ende der 1980er
bzw. 1990er Jahre gesprochen werden, wohingegen die Abnahme von need in grob zwei Phasen
bis zur Mitte der 1920er Jahre bzw. bis 1999 stattfindet.
b) Deutsche Modalverben
Im Vergleich zu den englischen werden die deutschen Modalverben viel häufiger gebraucht. Wie
bei den englischen Modalverben, kann auch bei müssen, sollen, brauchen und wollen im DWDS
ein Gebrauchsrückgang beobachtet werden (vgl. Tab. 5), wenn auch ein deutlich geringerer. Der
Unterschied zwischen den 1900er und 1990er Jahren ist bei allen Verben statistisch signifikant
(χ2=62, 12, 9, 278; p<1%, d.f.=1), allerdings besteht nur bei wollen eine signifikante Korrelation
zwischen der Zeit und den Frequenzen (τ=-0,6; p=0,2%).
PREPRINT – JANUARY 2012
– please do not cite without permission
10
1900s 1910s 1920s 1930s 1940s
müssen
2229
2495
2663
2340
2332
sollen
1712
15,6
1910
16,2
1732
19,9
1565
16,5
1789
18,7
1781
2229
1881
1654 18260
brauchen5
wollen
1950s
1960s
1970s
1980s
1990s
Diff.
-7,4%
2537
2389
2095
2151
2064
2075
18,9
2307
15,0
(37,2)
1591
13,6
(40,9)
1867
13,4
(35,5)
1710
11,0
(27,2)
-0,1%
-30%
1589
1215
1323
1572
1476
-17%
Korrelationseffizienten (Zeit~Frequenz):
müssen: p=0,11, τ= -0,42; sollen: p=0,86, τ=-0,07; brauchen: p=0,07, τ= -0,46; wollen: p=0,002, τ= -0,6
graue Schrift: Die Nullhypothese (die Abweichung zwischen der grau markierten und der vorausgehenden Frequenz
ist eine Zufallsvariation) kann nicht abgelehnt werden (p>5%, d.f.=1).
Tabelle 5. Frequenzen von müssen, sollen, brauchen und wollen im DWDS-Kernkorpus (in W/M)
Abb. 6 zeigt, dass der Gebrauch von müssen und sollen in den verschiedenen Dekaden im DWDS
großen Schwankungen unterzogen ist. Auch im Google Books Korpus ist sollen am Ende der
1930er Jahre besonders selten (1935, 1936, 1938 und 1940 liegt die Frequenz bei knapp unter
1100 W/M), während die Frequenz etwa zwischen 1919 und 1921 sowie zwischen 1961 und
1973 bei mehr als 1200 W/M liegt. Müssen wird auch um das Jahr 1920 und zu Beginn der
1940er Jahre besonders häufig verwendet. Eine VNC-Analyse der Frequenzen im Google Books
Korpus zeigt ebenfalls, dass (bei der Annahme von 7 Clustern) eine kurze Hochphase von ca.
1940 bis 1945 sowie nachfolgend und vorausgehend zwei Phasen starken Gebrauchs (von ca.
1915 bzw. bis Mitte der 1960er Jahre) unterschieden werden können.
Abb. 6. Frequenzen von müssen und sollen im DWDS und im Google Books Korpus
Insgesamt kann im Google Books Korpus zwischen den 1910er und 1990er Jahren ein Rückgang
um 11,4% im Gebrauch von müssen beobachtet werden (bei einer höchst signifikanten, negativen
Korrelation zwischen der Zeit und den Frequenzen, τ=-0,42; p=4e-10), bei sollen hingegen eine
leichte Zunahme um 3% (τ=0,12; p=0,09).
5.
5
Es wurde nach allen Formen von B/brauchen und, mit max. 6 Wörtern Abstand, einem Infinitiv mit zu gesucht.
Die Ergebnisse einer zweiten Suche nach B/brauchen und einem Infinitiv (mit max. 6 Wörtern Abstand) in den
1960er bis 1990er Jahren wurden manuell analysiert. Da aufgrund rechtlicher Nutzungsvereinbarungen nur 49–
64% aller Treffer einer Suche angezeigt wurden, handelt es sich bei den angegebenen Werten um Hochrechungen.
PREPRINT – JANUARY 2012
– please do not cite without permission
11
Interessant ist auch der Vergleich zu den von Glas (1984) ermittelten Häufigkeiten im LIMAS
Korpus (1971/72): im DWDS ist die Frequenz von müssen und sollen in den 1970er Jahren
niedriger (2380>2095| 1870>1591). Bei müssen kann sich diese Differenz (neben Unterschieden
in der Korpuszusammensetzung) daraus ergeben, dass im DWDS in den Wert für die 1970er
Jahre auch die Jahre 1973 bis 1979 eingerechnet werden, in denen der Gebrauch im Rückgang
begriffen zu sein scheint. Bei wollen ist der Fall wohl genau umgekehrt (LIMAS: 1070 W/M).
Ein Vergleich mit Diewalds Auswertung kann allerdings nur bedingt hergestellt werden: Während
das Verhältnis von sollen zu müssen in den 1990er Jahren im Zeitungsteil des DWDS, das auch
Magazine und Illustrierte enthält (vgl. Geyken 2009), ähnlich wie bei Diewald (0,83) bei 0,79
liegt, ist wollen in Diewalds Spiegel-Korpus, anders als im DWDS, das meistbenutzte Modalverb.
Abb. 7. Frequenzen von müssen und sollen in den verschiedenen Korpusteilen des DWDS-Kernkorpus
Abb. 7 zeigt die Verwendung von müssen und sollen in den verschiedenen Korpusteilen des
DWDS. In wissenschaftlicher Literatur sind beide Verben fast durchgehend am seltensten; eine
Ausnahme bilden nur die 1960er Jahre, in denen ihr Gebrauch, wie bei must, should, und have to
auffällig hoch ist. Wie should wird auch sollen in den 1950er Jahren verstärkt verwendet (vgl.
Abb. 3; alle Frequenzunterschiede zwischen den einzelnen Dekaden in Wissenschaft und Zeitung
sind statistisch signifikant χ2>4, p>5%, d.f.=1). Es liegt daher nahe, dass hier es sich um eine
besondere Phase in der Wissenschaftsliteratur im deutschen und amerikanischen Sprachraum
handelt.
4. DISKUSSION
Der Vergleich des Gebrauchs von Modalverben im Deutschen und im amerikanischen Englisch
innerhalb des letzten Jahrhunderts ist in vielerlei Hinsicht aufschlussreich. Er zeigt zum einen,
dass im Englischen viel mehr modale bzw. semi-modale Verben zum Ausdruck von
Notwendigkeit und Verpflichtung benutzt werden können als im Deutschen; zum anderen, dass
die deutschen Modalverben müssen und sollen deutlich öfter verwendet werden als alle ihre hier
untersuchten englischen Entsprechungen zusammen. Der Gebrauch von müssen, brauchen und
wollen geht zwar insgesamt leicht zurück (bei sollen nur im DWDS), im Verlaufe des
Jahrhunderts sind jedoch keine so klaren Trends zur Ab- bzw. Zunahme wie bei den englischen
PREPRINT – JANUARY 2012
– please do not cite without permission
12
zentralen Modalverben bzw. semi-modalen Verben erkennbar. Der Gebrauch von must, should,
ought to und need halbiert sich fast, während have to, want to und insbesondere need to deutlich
zunehmen. VNC-Analysen zeigen jedoch, dass die Phasen, die beim Rückgang im Gebrauch der
zentralen Modalverben unterschieden werden können, sich größtenteils nicht mit denen im
Gebrauch der semi-modalen Verben im amerikanischen Englisch decken. Der interessanten
Frage, inwiefern Veränderungen im Verhältnis von nicht-epistemischen und epistemischen
Bedeutungen in diesem Zusammenhang bedeutsam sind, konnte hier aufgrund der Größe der
Textmengen leider nicht nachgegangen werden. Auch die Frage nach anderen Ursachen muss an
dieser Stelle unbeantwortet bleiben. Für die These des kulturellen Wandels spricht indes u.a., dass
auch der Gebrauch einiger bedeutungsverwandter Ausdrücke abnimmt (z.B. notwendig, das; be
necessary to/that, vgl. auch Jäger 2012).
Der Vergleich zwischen den beiden Referenzkorpora und dem Google Books Korpus spiegelt
die Bedeutung der Möglichkeit einer registerdifferenzierten Betrachtung wider. Wie bei der
Analyse im COHA und im DWDS deutlich wurde, variieren die Häufigkeiten der untersuchten
Verben in den verschiedenen Registern, die für sprachliche Veränderungen in unterschiedlichem
Maße empfänglich sind, z.T. sehr stark. So zeigen einige Verben eine Präferenz für den Gebrauch
in fiction (z.B. want to, have to, ought to), während andere insbesondere in non-fiction books
(should, must und – ab den 1930er Jahren – need) bzw. der Gebrauchsliteratur (müssen, sollen)
verwendet werden. Im Falle des Google Books Korpus, das zwar die Möglichkeit bietet, bisher
ungekannte Größen an Datenmengen zu untersuchen, es ist hingegen angesichts der Unklarheit,
zu welchen Anteilen verschiedene Register wie wissenschaftliche Literatur, Belletristik oder
Gebrauchsliteratur enthalten sind, schwierig, zuverlässig Rückschlüsse auf Veränderungen in
einzelnen Registern oder gar der gesamten Sprache zu ziehen. Dem Anspruch, mit dem Korpus
Einblicke in kulturelle Entwicklungen zu geben (Michel et al. 2011:176), wird hingegen
sicherlich dadurch Rechnung getragen, dass einige Textsorten, wie z.B. Gesetze oder Verträge,
zwar von einer kleinen Personenzahl verfasst werden, jedoch zum Teil große kulturelle
Bedeutung haben (Biber 1993:245). Auch kann vermutet werden, dass der Großteil der Bücher
von vielen Nutzern der Universitätsbibliotheken und der Google Bücher-Suche im Internet (seit
2004) rezipiert werden. Die Häufigkeit dieser Textrezeption quantifizierbar zu machen, liegt
jedoch außerhalb des Bereichs des Möglichen. Die große Herausforderung liegt somit, im Google
Books Korpus wie auch im DWDS und COHA, in der Bestimmung der Bedeutung der
gewonnenen Daten, sowohl als Zeugnisse sprachlichen Wandels als auch kultureller
Veränderung.
Anmerkungen
Mein Dank gilt Dr. Martin Hilpert vom Freiburg Institute for Advanced Studies (FRIAS) für die
Bereitstellung des VNC-Scripts in einem R-Workspace, durch das diese Form der Analyse erst
möglich wurde.
BIBLIOGRAPHIE
Biber, Douglas, Susan Conrad & Randi Reppen. 1998. Corpus linguistics:
Investigating language structure and use. Cambridge: CUP.
Biber, Douglas. 1993. Representativeness in Corpus Design. Literary and Linguistic
Computing 8(4). 243-257.
Biber, Douglas. 2004. Historical patterns for the grammatical marking of stance. A
cross-register comparison. Journal of Historical Pragmatics 5(1). 107-136.
Biber, Douglas, Johansson, Stig, Leech, Geoffrey; Conrad, Susan & Edward
Finegan, 1999. The Longman Grammar of Spoken and Written English, London:
Longman.
Bolinger, Dwight L. 1980. Language: The Loaded Weapon. London: Longman.
Brünner, Gisela & Angelika Redder. 1983. Studien zur Verwendung der Modalverben
(Studien zur deutschen Grammatik 19). Tübingen: Narr.
Davies, Mark. (2010–) The Corpus of Historical American English (400 million
words, 1810-2009). http://corpus.byu.edu/coha/. (15 February 2012.)
Davies, Mark. (2011–) Google Books (American English) Corpus (155 billion
words, 1810-2009). http://googlebooks.byu.edu/. (15 February 2012.)
Digitales Wörterbuch der deutschen Sprache des 20. Jahrhunderts, BerlinBrandenburgische
Akademie
der
Wissenschaften,
Berlin
http://www.dwds.de/resource/kerncorpus/. (15 February 2012.)
Diewald, Gabriele. 1999. Die Modalverben im Deutschen: Grammatikalisierung und
Polyfunktionalität. Tübingen: Niemeyer.
Eisenberg, Peter. 1999. Grundriß der deutschen Grammatik. Bd. 2: Der Satz.
Stuttgart: Metzler.
Engel, Ulrich. 2004. Deutsche Grammatik. Neubearbeitung. München: Iudicium.
Fairclough, Norman. 1992. Discourse and Social Change, Cambridge: Polity Press.
Fritz, Gerd. 1997. Historische Semantik der Modalverben. Problemskizze –
Exemplarische Analysen – Forschungsüberblick. In Fritz, Gerd & Thomas
Gloning (eds.) Untersuchungen zur semantischen Entwicklungsgeschichte der
Modalverben im Deutschen (Germanistische Linguistik 187), 1-157. Tübingen:
Max Niemeyer.
Geyken, Alexander. 2009. Automatische Wortschatzerschließung großer Textkorpora
am Beispiel des DWDS. Linguistik online 39(3).
Glas, Reinhold. 1984. ‚sollen‘ im heutigen Deutsch: Bedeutung und Gebrauch in der
Schriftsprache. Studien zur deutschen Grammatik 27. Tübingen: Gunter Narr.
Gries, Stefan Th. & Martin Hilpert. Erscheint 2012. Statistical clustering techniques
in historical English linguistics. In Terttu Nevalainen & Elizabeth Closs Traugott
(eds.), Handbook on the history of English: rethinking approaches to the history
of English. Oxford: OUP.
Hausser, Roland. 2000. Grundlagen der Computerlinguistik: Mensch – Maschine Kommunikation in natürlicher Sprache. Berlin: Springer.
Hilpert, Martin & Stefan Th. Gries. 2009. Assessing frequency changes in diachronic
corpora. Literary and Linguistic Computing 24(4). 385-401.
Hundt, Marianne & Christian Mair. 1999. 'Agile' and 'Uptight' Genres: The CorpusBased Approach of Language Change in Progress”. International Journal of
Corpus Linguistics 4(2). 221-242.
14
Jäger, Verena. Erscheint 2012. Modality and Beyond: Expressions of Obligation and
Necessity in Spoken American English. Épilogos. Université de Rouen:
Publications électroniques de l'ERIAC,
Johnen, Thomas. 2006. Zur Herausbildung der Kategorie Modalverb in der
Grammatikographie des Deutschen (und des Portugiesischen). Pandaemonium
germanicum 10. 283-338.
Kaledin, Eugenia. 2000. Daily life in the United States, 1940-1959: shifting worlds.
(Daily life through history). Westport: Greenwood Press.
Krug, Manfred G. 2000. Emerging English Modals: A Corpus-Based Study of
Grammaticalization. Berlin: Mouton de Gruyter.
Leech, Geoffrey N. 2003. Modality on the Move : The English Auxiliaries 19611992. In Facchinetti, Roberta; Krug, Manfred G. & Frank R. Palmer (eds.)
Modality in Contemporary English, 223-240. Berlin: Mouton de Gruyter.
Leech, Geoffrey N. 2011. The Modals ARE Declining. International Journal of
Corpus Linguistics 16(4): 547-564.
Mair, Christian. 2006. Twentieth-Century English: History, Variation and
Standardization (Studies in English Language). Cambridge: CUP.
Michel, Jean-Baptiste; Shen, Yuan Kui; Aiden, Aviva Presser; Veres, Adrian; Gray,
Matthew K., The Google Books Team; Pickett, Joseph P.; Hoiberg, Dale; Clancy,
Dan; Norvig, Peter; Orwant, Jon; Pinker, Steven; Nowak, Martin A.; Aiden, Erez
Lieberman. 2011a. Quantitative Analysis of Culture Using Millions of Digitized
Books. Science 331: 176-182. DOI: 10.1126/science.1199644 (online am
16.12.2010 veröffentlicht) and Supporting Online Material. 2011b. Corrected
March
11,
2011
<http://www.sciencemag.org/content/suppl/2010/12/16/science.1199644.DC1/Mi
chel.SOM.revision.2.pdf>.
Millar, Neil. 2009. Modal verbs in TIME: Frequency changes 1923-2006.
International Journal of Corpus Linguistics 14(2). 191-220.
Müller, Friederike. 2008. Analysing corpora of present day spoken English: Current
changes in the English Modals. Postgraduate Conference at Aston University,
Birmingham.
http://acorn.aston.ac.uk/conf_papers/paper%20%20Friederike%20Mueller.pdf. (15 February 2012.)
Myhill, John. 1995. Change and continuity in the functions of the American English
modals. Linguistics 33. 157-211.
Palmer, Frank Robert. 1990. Modality and the English modals. London: Longman.
Quirk, Randolph, Greenbaum, Sidney, Leech, Geoffrey N. & Jan Svartvik. 151985. A
Comprehensive Grammar of the English. London: Longman.
Reis, Marga. 2007. Modals, so-called semi-modals, and grammaticalization in
German. IJGLSA 12(1). 1-57.
Traugott, Elizabeth Closs. 1989. On the rise of epistemic meaning in English: An
example of subjectification in semantic change. Language 65. 31-55.

Documentos relacionados