here - Department of English and Linguistics
Transcrição
here - Department of English and Linguistics
PREPRINT – JANUARY 2012 – please do not cite without permission 1 - Sprachwandel im 20.Jahrhundert. Veränderungen im Gebrauch der englischen und deutschen Modalverben der Obligation und Notwendigkeit Verena Jäger Johannes Gutenberg-Universität Mainz Schon vor mehr als 30 Jahren ging Dwight Bolinger davon aus, dass eine Umorganisation im System der englischen Modalverben stattfindet (1980:6). Vor allem im vergangenen Jahrzehnt konnte diese Behauptung dank der Entwicklung elektronischer Korpora, die eine Analyse großer Datenmengen ermöglichen, untermauert werden (z.B. Krug 2000, Leech 2003, 2011, Millar 2009). Historische Sprachwandelprozesse wurden intensiv untersucht, auch mit besonderem Blick auf die Grammatikalisierung von Modalverben (z.B. Traugott 1989). Neben Tendenzen zum Bedeutungswandel konnten zudem Veränderungen in der Häufigkeit des Gebrauchs von Modalverben beobachtet werden, in historischen Korpora (z.B: Biber et al. 1998) wie auch im 20. Jahrhundert. So wurde gezeigt, dass in der zweiten Hälfte des letzten Jahrhunderts die meisten der sog. zentralen Modalverben (z.B. must und should) im Gebrauch abnahmen, während einige der oft als semi-modal oder periphrastisch bezeichneten Verben (Biber et al. 1999:484), insbesondere jene, die dem Bedeutungsfeld der Obligation und Notwendigkeit angehören – das im Folgenden untersucht wird – verstärkt Verwendung fanden (z.B. Leech 2003). Die Entstehung des Google Books Korpus (2011) ermöglicht es nun, die Entwicklung dieser Verben in einer gigantischen Textmenge zu untersuchen, die alle bisherigen Korpora an Größe übertrifft. Als Zeitraum wurde dafür eine Periode von 100 Jahren (1900–1999) gewählt. Als Vergleich bzw. zur Ergänzung wird überdies das Corpus of Historical American English verwendet, das eine registerdifferenzierte Betrachtung ermöglicht. Ob es ähnliche Entwicklungen auch im Deutschen gibt, wird anhand des deutschen Teils des Google Books Korpus und des digitalen Wörterbuch der deutschen Sprache untersucht. 1. FORSCHUNGSÜBERLICK „The modals ARE declining“ ist der Titel eines jüngst veröffentlichen Artikels (Dez. 2011) von Geoffrey Leech, der die Aktualität der Frage nach Häufigkeitsveränderungen im Gebrauch von englischen Modalverben im 20. Jahrhundert widerspiegelt. In dieser Replik zu Neil Millar (2009) zeigt Leech anhand von Daten der Familie der britischen Brown-Korpora, die Texte aus den Jahren 1901, 1931, 1961, 1991 und 2006 enthalten, und des Corpus of Historical American English, dass die Verwendung von will, should, must, might, shall, ought und need(n’t) signifikant abgenommen hat. Er bekräftigt damit seine These aus dem Jahr 2003, als er bei einem Vergleich von Korpora des britischen und amerikanischen Englisch aus den Jahren 1961 und 1991/92 angesichts des Rückgangs im Gebrauch der meisten zentralen Modalverben schlussfolgerte, es liege nahe, dass es sich hierbei um einen allgemeinen, langanhaltenden Trend handele (235). Biber et al., die Modalverben im ARCHER Korpus (A Representative Corpus of Historical English Registers) untersuchen, sprechen ebenfalls von einem leichten Schwund im 20. Jahrhundert (1998:208). Millar stellt bei seiner Untersuchung des Time Magazine Korpus eine Abnahme von must, should und ought, insgesamt jedoch eine Zunahme im Gebrauch der Modalverben fest (2009:199). Diese Unterschiede, so Leech und Millar, sind wahrscheinlich auf PREPRINT – JANUARY 2012 – please do not cite without permission 2 die Textkomposition der verschiedenen Korpora zurückzuführen: während Millar nur das Time Magazine untersucht, speisen sich die Brown-Korpora neben Pressetexten aus general prose und learned fiction. Die Diskussion wirft die Frage auf, welche Rolle verschiedene Texttraditionen beim Sprachwandel spielen und inwieweit Korpora repräsentativ für eine Sprache sind. Auf Letzteres wird später noch einmal eingegangen. Viele Studien zeigen, dass im Gegensatz zu den zentralen Modalverben einige semi-modale Verben in der zweiten Hälfte 20. Jahrhunderts im Gebrauch zunehmen (Leech 2003:28, Biber 2004:118-119, Müller 2008:5, Millar 2009:196), den Rückgang der hochfrequenten zentralen Modalverben aber nur zu einem kleinen Teil kompensieren. Manfred Krug ist der Ansicht, dass wir der Herausbildung einer neuen Klasse von emerging modals beiwohnen, zu der im engeren Sinne be going to, have to, have got to und want to gehören. Im weiteren Sinne zählt er auch need to, ought to und dare to hinzu; ihr Gebrauch, so Krug, nehme allerdings nicht zu, sondern bleibe stabil bzw. nehme ab (2000:3-5).1 Einige Autoren vermuten einen Zusammenhang zwischen der Kolloquialisierung der geschriebenen Sprache und der Zunahme im Gebrauch der semi-modalen Verben (z.B. Leech 2003, Millar 2009), die in der gesprochenen Sprache öfter als in Schriften verwendet werden (vgl. Biber et al. 1999:487-490). Auch John Myhills Beobachtung, dass die ‚alten‘ zentralen Modalverben mit hierarchischen Strukturen, starren gesellschaftlichen Regeln und universellen Prinzipien assoziiert werden, während die neuen Modalformen ausgeglichenere Machtverhältnisse voraussetzen und Kooperationen und Interaktionen zwischen den Gesprächspartnern in den Vordergrund stellen (1995:157-160), wird von zahlreichen Autoren (Leech 2003, Müller 2008, Millar 2009) zusammen mit der These der Demokratisierung des Diskurses (vgl. Fairclough 1992: 201-203) als Ansatz zur Erklärung der Veränderungen im System Modalität aufgegriffen; relevant scheint er insbesondere für das Bedeutungsfeld von Verpflichtungen und Notwendigkeiten, zu dem must, should, have (got) to, need, ought to (Quirk et al. 1985:221) sowie u.a. need to gehören. Diese Verben, die den Gegenstand der nachfolgenden Untersuchung bilden, sind insgesamt seltener als die Modalverben anderer Bedeutungsgruppen (Biber et al. 1999: 493-494). Sie werden zum Ausdruck epistemischer und insbesondere auch nicht-epistemischer Bedeutungen verwendet (vgl. Palmer 1990). In der Forschung zur Modalität im Deutschen besteht allgemeiner Konsens darüber, dass dürfen, können, mögen, müssen, sollen und wollen Modalverben sind. Die Zugehörigkeit von brauchen und werden sowie insbesondere von möchten und lassen zu dieser Kategorie, die je nach Autor auf semantischen, syntaktischen oder einer Kombination aus beiden Kriterien basiert, ist umstritten (vgl. Johnen 2006: 284-290). Einige Autoren unterscheiden Modalverben von Halbmodalen (z.B. Eisenberg 1999: 352-353) und Modalitätsverben (Engel 2004). Nur wenige dieser Verben gehören dem Bedeutungsfeld der Verpflichtung und Notwendigkeit an. Dazu zählen haben (zu) und sein (zu) (vgl. Fritz 1997:17), deren Einbeziehung in diese Studie aber nur bei einer manueller Untersuchung möglich gewesen wäre, die angesichts der Korpusgrößen nicht zu leisten war. In diachronen Beschreibungen stehen oft die semantische und morphologische Entwicklung sowie die Grammatikalisierung der deutschen Modalverben im Vordergrund (z.B. Fritz 1997, Diewald 1999, Reis 2007). Fritz klagt jedoch über „große Lücken in der empirischen 1. 1 In vielen Studien und Grammatiken wird ought to, dessen Gebrauch in der 2. Hälfte des 20. Jhdts deutlich abnimmt (vgl. Leech 2003, Müller 2008), hingegen als marginal modal / auxiliary (Biber et al. 1999: 484) betrachtet und damit als den zentralen Modalverben ähnlicher als z.B. have (got) to (Quirk et al. 1985: 137). PREPRINT – JANUARY 2012 – please do not cite without permission 3 Bestandsaufnahme für einzelne Autoren, Textsorten und Zeitstufen“ (1997:8). Nur vereinzelt werden Aussagen über Häufigkeiten im Neuhochdeutschen, insbesondere im letzten Jahrhundert, gemacht. So gibt Reinhold Glas im Anhang zu seiner Studie von sollen die Frequenzen der Modalverben im LIMAS Korpus (1973) an (vgl. Tab. 1). Dieses Korpus mit Texten aus den Jahren 1970/71 – die deutsche Entsprechung zum amerikanischen Brown-Korpus – besteht aus 500 Texten mit je mind. 2000 Textwörtern aus den „verschiedensten Sachgebieten und Textsorten“ (Glas 1984:121) und enthält 1 062 624 laufende Wortformen (tokens) sowie 110 837 Types (Hausser 2000:317). Modalverb Frequenz pro 100 Wörter können 0,511 müssen 0,238 sollen 0,187 wollen 0,107 dürfen 0,059 mögen 0,039 brauchen 0,021 Tabelle 1: Frequenzen der Modalverben im LIMAS Korpus (Glas 1984:122) Weit verbreitet ist auch die Angabe von Häufigkeiten in Relation zur Gesamtmenge der Modalverben (z.B. Brünner & Redder 1983). Diewald (1999:7-11) stellt beispielsweise bei einer Untersuchung von 105 Seiten aus dem Magazin Der Spiegel (11/1996) folgende Verteilungen fest: können (38,4% der 448 untersuchten Modalverben), wollen (20,3%), müssen (15,9%), sollen (13,2%), mögen (6,3%) und dürfen (5,6%). Diese Werte sind, wie Diewald angibt, nicht als statistisch relevante Angaben intendiert (1999:8) und bieten nur eingeschränkt Vergleichsmöglichkeiten. Im Folgenden werden die Frequenzen der untersuchten Verben in Wörtern pro Millionen angegeben. 2. VERWENDETE KORPORA Als Datengrundlage wurden die Teile „amerikanisches Englisch“ und „Deutsch“ des neuen Google Books Korpus verwendet, das auf der Basis der mehr als 15 Millionen von Google digitalisierten Bücher geschaffen wurde. Die meisten dieser Bücher stammen aus über 40 Universitäts-bibliotheken weltweit, ab 2004 wurden auch viele von Verlagen beigesteuert, sodass die Zusammensetzung der Daten sich deutlich veränderte. Aus diesem Grund verwenden Michel et al. keine Daten des 21. Jahrhunderts in der Publikation (2011a), in der sie das Korpus vorstellen. Die Auswahl der 5 195 769 digitalisierten (~4% aller je veröffentlichten) Bücher für das Korpus erfolgte anhand der Qualität der Zeichenerkennung und der Metadaten. Es enthält Amerikanisches insgesamt mehr als 500 Billionen Wörter, davon Korpusteil Deutsch Englisch 155 Billionen im amerikanischen Englisch und 16.Jhdt. 18 974 891 341 37 Billionen im Deutschen. Zur Wahrung des 17.Jhdt. 881 396 4 830 321 Copyrights der Autoren werden im Google 18.Jhdt. 55 864 117 39 884 018 Books N-Gram Viewer nur Sequenzen von 1 bis 5 leerzeichenlosen Buchstaben- oder Zeichenfol19.Jhdt. 5 812 359 978 22 926 851 420 gen, die mindestens 40 Mal vorkommen, an20.Jhdt. 24 084 313 167 107 683 819 692 gezeigt. Beispiele für diese sog. n-grams sind Tabelle 2. Anzahl der 1-grams in den Teilen ‚Deutsch‘ „stock market“ (2-gram) und „3.14159“ (1und ‚amerikanisches Englisch‘ des Google Books Korpus gram) (Michel et al. 2011a:176). Michel et al. betonen, dass das Korpus die Möglichkeit zur quantitativen Untersuchung kultureller Entwicklungen bietet. Sie verwenden für diese Form der Analyse von Hochdurchsatzdatenbasen das Schlagwort Culturomics. Bücher, so die Autoren, seien nur der Anfang; Zeitungen, Pläne, Kunstwerke und eine Vielzahl anderer menschlicher Produkte müssten noch einbezogen werden (2011a:181). Auch gesprochene Sprache, die den Großteil menschlicher PREPRINT – JANUARY 2012 – please do not cite without permission 4 Kommunikation ausmacht, wird nicht erfasst. Ein weiterer Nachteil ist, dass die Zusammensetzung des Korpus von der Aquisitionspraxis der teilnehmenden Universitätsbibliotheken abhängig ist und somit deutliche Änderungen bei Schwerpunktverlagerungen entstehen können (vgl. Michel et al. 2011b:16). Der im Google Books N-gram Viewer bietet Nutzern nur eingeschränkte Suchmöglichkeiten (z.B. keine Berücksichtigung von Satzzeichen und kein Part-of-Speech Tagging). Im Mai 2011 schaltete Mark Davies (Brigham Young University) eine Benutzeroberfläche frei, die es hingegen möglich macht, im Teil „amerikanisches Englisch“ des Korpus u.a. nach Lemmata, Synonymen und Kollokationen zu suchen. Diese Oberfläche wurde hier für die Auswertung des amerikanischen Englisch verwendet. Für das Deutsche wurden die im N-Gram Viewer angezeigten Zeit-Wortfrequenz-Graphen (smoothing=0) für jede einzelne Wortform ausgelesen und aufaddiert. Als Ergänzung wurden darüber hinaus ein deutsches und ein englisches Referenzkorpus verwendet: das Kernkorpus des Digitalen Wörterbuches der deutschen Sprache (DWDS) und das Corpus of Historical American English (COHA). Das DWDS wurde von der Berlin-Brandenburgischen Akademie der Wissenschaften mit dem Ziel geschaffen, möglichst ausgewogen und „hinreichend groß“ zu sein, um für den deutschen Wortschatzes des 20. Jahrhunderts repräsentativ zu sein (vlg. Homepage des DWDS). Derzeit besteht das online-Kernkorpus (ohne den Teil ‚gesprochene Sprache’) aus ca. 101 Millionen Wörtern aus Zeitungen (27,9%), Belletristik (26%), Wissenschaft (22%) und Gebrauchsliteratur (24%). Letztere speist sich u.a. aus Werbe- und Gesetzestexten, Kochbüchern und Reiseführern (vgl. Geyken 2009). Die Anzahl der Wörter pro Dekade liegt zwischen 8,7 Mio. (Dekade 7) und 11,2 Mio. Wörtern (Dekade 3). Die „ideale” Verteilung, so heißt es auf der DWDS-Homepage, sei momentan noch nicht erreicht, da drei Dekaden noch unter der geplanten Größe liegen. Das COHA (1810-2009) umfasst mehr als 400 Millionen Wörter aus Zeitungen, populären Magazinen sowie den Bereichen fiction (Belletristik) und non-fiction books. Eine Balance von Texten aus verschiedenen Registern und Subregistern wird beibehalten und sorgt dafür, so heißt es auf der Webseite des COHA, dass Forscher hinreichend sicher sein können, dass die Daten tatsächliche Veränderungen in der ‚realen Welt‘ reflektieren anstatt nur Produkte von Veränderungen der Korpuszusammensetzung zu sein. Wie repräsentativ ein Korpus ist, hängt davon ab, inwiefern er die volle Bandbreite an Variabilität in der Zielgruppe widerspiegelt, die er repräsentieren soll. Dafür maßgeblich ist zum einen die Berücksichtigung unterschiedlicher Textsorten, zum anderen, dass das gesamte Spektrum verschiedener sprachlicher Charakteristika in diesen Texten und Textarten widergegeben wird (vgl. Biber 1993:243). Da auch der Gebrauch von Modalverben je nach Register sehr unterschiedlich ist, werden nachfolgend neben dem Google Books Korpus, dessen genaue Zusammensetzung nicht bekannt ist, das COHA und das DWDS untersucht, um zu sehen, welche Veränderungen es im Zeitraum von 1900 bis 1999 in verschiedenen Textsorten im Deutschen und amerikanischen Englisch gibt. 3. ERGEBNISSE a) Zentrale Modalverben und semi-modale Verben im amerikanischen Englisch Wie die Ergebnisse von Leech (2011) und Millar (2009) zeigen, ist es unumstritten, dass der Gebrauch der zentralen Modalverben der Obligation und Notwendigkeit im 20. Jahrhundert abnimmt (s.o.). Wie in den Brown-Korpora und dem Time Magazine Korpus ist der Rückgang PREPRINT – JANUARY 2012 – please do not cite without permission 5 auch im Google Books Korpus sichtbar. Tabelle 3 zeigt die Frequenzen von should, must, ought to und dem modalen need2 in Wörtern pro Millionen (W/M). Ihre Abnahme zwischen den 1900er und 1990er Jahren ist höchst signifikant (χ2=690, 592, 596, 73; p<0,001%., d.f.=1). In allen Fällen besteht eine starke negative Korrelation zwischen den Zeitperioden und den Frequenzen (τ<-0,8). Ought to und need, die bisweilen schon als totgeweiht betrachtet werden (Leech spricht z.B. vom Ende ihres „useful life“, 2003:236), werden dabei deutlich seltener gebraucht als must und should, insbesondere am Ende des Jahrhunderts. 1910s 1910s 1920s 1930s 1940s 1950s 1960s 1970s 1980s 1990s should 1054,3 1092,1 1084,5 989,9 972,5 933,3 848,2 834,3 794,4 732,1 -30,6% must3 869,4 909,6 896,3 841,6 843,0 816,8 794,9 722,9 651,4 596,5 -31,4% ought to 108,4 94,8 88,8 77,4 65,1 61,4 60,5 48,0 36,4 32,2 -70,3% 37,0 36,4 35,1 31,7 31,4 32,3 31,8 28,6 24,0 19,1 -48,5% need Differenz Korrelationseffizienten (Zeit~ Frequenz): should: p=3,0e-05, τ= -0,91, must: p=1,2e-04, τ= -0,86; ought to: p=5,5e-07 τ= -1; need: p=3,6 e-04 τ= -0,82 graue Schrift: Die Nullhypothese (die Abweichung zwischen der grau markierten und der vorausgehenden Frequenz ist eine Zufallsvariation) kann nicht abgelehnt werden (p>5%, d.f.=1). Tabelle 3. Frequenzen ausgewählter zentraler Modalverben im Google Books Korpus (BYU), in W/M Im COHA, das auch Texte aus Zeitungen und Zeitschriften enthält, stellt sich die Abnahme im Gebrauch von should (1900s/ 1990s: 207/ 100 W/M, -36%) must (199/ 96 W/M, -54%), ought to (147/ 42 W/M, -72%) und need (50/ 13 W/M, -75%) drastischer dar als im Google Books Korpus. Dank der Möglichkeit, die Frequenzen für einzelne Jahre im COHA (Gesamtkorpus) zu ermitteln, ergibt sich ein differenziertes Bild, das verdeutlicht, wie sehr der Gebrauch dieser Verben von Jahr zu Jahr schwankt. Abb. 1 zeigt die Entwicklung von must im Google Books Korpus (in Dekaden) sowie im COHA (in Jahren). Abb. 1. Frequenzen von must im COHA und im Google Books American English Korpus (BYU) 2. 2 Da das modale need im Gegensatz zum semi-modalen need to nur in nicht-assertiven Kontexten auftritt, wurde im Google Books Korpus und im COHA nach needn’t / need not und nach need direkt gefolgt von Infinitiven [vvi*] gesucht. Da das POS-Tagging sich im Falle von need help (z.B. I need help!:Anthology, Science of Mind Publ., 1977) überwiegend als nicht korrekt erwies, wurden diese Fälle herausgerechnet. Mit weiteren Ungenauigkeiten durch die Unzuverlässigkeit des POS-Taggings muss gerechnet werden. 3. 3 schließt Fälle von must als Substantiv ein (kein POS-Tagging) PREPRINT – JANUARY 2012 – please do not cite without permission 6 Auf der Grundlage dieser Daten wurde ein variability-based neighbor clustering für alle vier Modalverben durchgeführt. Bei dieser Methode werden Daten aus zeitlich aufeinanderfolgenden Perioden (hier: Jahren), die einander ähnlich sind, gruppiert. Nacheinander werden die Werte mit dem jeweils geringsten Unterschied (gemessen in der Standardabweichung) in Clustern zusammengefasst, bis am Ende nur noch ein Cluster übrigbleibt (vgl. Gries und Hilpert 2009 sowie Hilpert und Gries 2012). Dieser Vorgang kann mithilfe eines Dendrogramms – eines Baumdiagramms, das die einzelnen Verzweigungen zeigt – visualisiert werden (vgl. Abb. 2 rechts). Ein sog. scree plot zeigt dann die Distanz zwischen den zusammengefassten Datensätzen in umgekehrter Reihenfolge an. An dieser Art der Darstellung lässt sich ablesen, wie viel Information bei einer Annahme von 1,2,3 oder mehr Clustern transportiert wird. Ziel ist dabei, so wenige Cluster wie möglich zu haben, aber auch möglichst nahe an der x-Achse zu sein. Im Falle von must im COHA besteht ein großer Abstand zwischen einem, zwei und drei Clustern (vgl. Abb. 2 links), die Abstände werden danach aber deutlich geringer. Daher ist es sinnvoll, grob drei Zeitintervalle beim Rückgang im Gebrauch von must zu unterscheiden, die im Dendrogramm durch blaue Linien angezeigt werden: von 1900 bis zu Beginn der 1920er Jahre (die Frequenz war 1923 mit 1289 W/M so hoch wie nie), von den 1920er Jahren bis Mitte der 1970er Jahre (1976 sank die Frequenz erstmals unter 700 W/M) und eine letzte Phase bis 1999. Abb. 2. Scree plot und Dendrogramm der Frequenzen von must im COHA Auch bei den VNC-Auswertungen von ought to, should und need in COHA zeigt sich, dass von einer ersten Periode bis zu den frühen 1920er Jahren ausgegangen werden kann. Während bei grober Betrachtung im Falle von should und need nur noch eine zweite Phase geringeren Gebrauchs bis zum Jahrhundertende angenommen werden kann, ist bei ought to eine stärkere Differenzierung sinnvoll: eine zweite Phase reicht bis zum Beginn der 1950er Jahre, die letzte bis 1999. Auch die VNC-Analyse der Google Books Durchschnittsfrequenzen pro Dekade zeigt, dass bei einer Annahme von jeweils 4 Clustern bei must, ought to und need eine erste Periode bis zu den 1920er Jahren (einschließlich) angenommen werden kann. Somit kristallisiert sich dieser Zeitraum für alle untersuchten zentralen Modalverben klar als (letzte) Hochphase des Gebrauchs im 20. Jahrhundert heraus. PREPRINT – JANUARY 2012 – please do not cite without permission 7 Der Gebrauch der zentralen Modalverben nimmt – mit Ausnahme von need in non-fiction books – in allen Korpusteilen des COHA ab. Während should und must am häufigsten in non-fiction books vorkommen und die Frequenz von ought to in fiction am höchsten ist, bietet sich bei need bietet ein gemischtes Bild: bis zu den 1930er Jahren findet es am stärksten in fiction Verwendung, ab den 1950er Jahren in non-fiction books. Im Gebrauch von must in fiction ist (wie in magazine ab den 1910er Jahren) ein konstanter Rückgang zu beobachten (vgl. Abb. 3). In Zeitungen wird must und should insbesondere in den 1910er Jahren häufig verwendet. Must erreicht Abb. 3. Frequenzen von must in den verschiedenen Korpusteilen einen weiteren Höhepunkt in den des COHA sowie von should im Zeitungsteil 1940er Jahren, should in den 1950er Jahren. Da in Zeitungen schneller als in anderen Registern auf soziale und kulturelle Entwicklungen reagiert wird (vgl. Mair 2006:188), ist es denkbar, dass diese Entwicklungen soziopolitische Ursachen haben. Millar weist darauf hin, dass must als unmissverständlich deutlicher Ausdruck deontischer Modalität während des Zweiten Weltkriegs besonders beliebt gewesen sein könnte (2009:213). Zudem könnte man vermuten, dass should äußerst gut in die 1950er Jahre passte, die Kaledin als das Jahrzehnt soziologischer Entdeckungen und Kulturanalysen bezeichnet, in demeinige Zeitschriften sogar ihre Leser aufforderten, über die Ziele der Nation nachzudenken (2000:152). Erklärungsansätze dieser Art sind jedoch angesichts der Komplexität historischer und kultureller Zusammenhänge mit Vorsicht zu betrachten. Im Gegensatz zu den zentralen Modalverben nimmt der Gebrauch von have to, want to4 und need to, die von Krug (2000) als emerging modals klassifiziert werden, im Laufe des Jahrhunderts im Google Books Korpus signifikant zu. Bei have got to kann ein marginaler Rückgang beobachtet werden (von 1,3 auf 0,7 W/M), es kann jedoch nicht ausgeschlossen werden, dass es sich um eine zufällige Variation handelt (χ2=3,54, p>5%, d.f.=1). Die Verwendung von gotta nimmt mit Ausnahme der 1950er und 1960er stark zu (1970er / 1990er J.: 1,9 / 3,8 W/M), im COHA kommt es hingegen nur drei Mal vor. 1900s 1910s 1920s 1930s 1940s 1950s 1960s 1970s 1980s 1990s Differenz have to 76,2 94,8 103,7 115,9 138,7 141,2 140,4 151,9 164,2 187,8 +146% need to 14,8 17,9 21,8 25,4 31,6 41,9 48,9 67,8 98,0 149,1 +907% want to 24,7 30,9 35,7 40,5 48,9 47,5 44,7 52,3 65,5 91,2 +286% Korrelationseffizienten (Zeit~Frequenz): have to: p=5,5e-06, τ= 0,95; need to: p=5,5e-07 τ= 1; want to: p=1,2e-04 τ= 0,86 graue Schrift: Die Nullhypothese (die Abweichung zwischen der grau markierten und der vorausgehenden Frequenz ist eine Zufallsvariation) kann nicht abgelehnt werden (p>5%, d.f.=1). 4. 4 Want to (inkl. der Form wanna) wird aufgrund seiner morphosyntaktischen Verwandtschaft und seiner Fähigkeit, neben volitiven auch deontische Bedeutungen auszudrücken (vgl. Krug 2000:148), mit untersucht. PREPRINT – JANUARY 2012 – please do not cite without permission 8 Tabelle 4. Frequenzen ausgewählter semi-modaler Verben im Google Books Korpus (BYU), in W/M Im Vergleich zum Google Books Korpus ist have got to ist deutlich öfter im COHA zu finden, wo es insbesondere, wenn auch mit abnehmender Tendenz (τ=-0,6; p=0,02), im fiction-Teil verwendet wird (1900er/1990er J.: 72/ 53W/M, vgl. mit non-fiction: 1/ 5W/M). Der Gebrauch von have to verdoppelt sich auch im COHA in der ersten Jahrhunderthälfte fast (1900er/ 1950er J.: 397/ 801 W/M), steigt danach aber nur langsam an (1990er J.: 838W/M). VNC-Analysen zeigen, dass in beiden Korpora bei have to vier grobe Phasen unterschieden werden können: von 1900 bis ca. 1910, bis zu den 1930er Jahren sowie bis Mitte der 1950er Jahre (COHA) bzw. bis Ende der 1980er Jahre (Google Books). Abb. 4. Frequenzen von have to und need to im COHA und im Google Books Korpus (BYU) Bei einem Vergleich der beiden Korpora werden jedoch auch große Frequenzunterschiede sichtbar. So wird have to im Durchschnitt 4,6 bis 5,8 Mal so oft im COHA wie im Google Books Korpus verwendet (vlg. Abb. 4). Bei dem seltener gebrauchten need to, das zum Jahrhundertende hin einen rasanten Aufschwung in beiden Korpora erlebt, ist die Differenz mit einer Relation von 1,3 – 2,8 deutlich geringer. Es liegt nahe, dass diese Abweichungen sich zumindest teilweise aus der unterschiedlichen Zusammensetzung der beiden Korpora ergeben. Während anzunehmen ist, dass ein Großteil der Google Books wissenschaftlichen Charakter haben und ein deutlich kleinerer Teil Belletristik und Gebrauchsliteratur ist, hat der COHA einen sehr hohen Anteil an fiction-Texten (48-53% pro Dekade), in denen have to häufiger gebraucht wird als z.B. in non-fiction books (1,8–2 Mal so oft). Auch in den Zeitschriften und Zeitungen (29-41% der Wörter pro Dekade) findet have to stärkere Verwendung als in non-fiction books. Dies deckt sich mit der Beobachtung von Biber et al., dass have to in fiction häufiger als in Zeitungen und am seltensten in wissenschaftlichen Texten vorkommt. Da Belletristik oft Dialoge enthält, bestehen gewisse Gemeinsamkeiten mit der gesprochenen Sprache, in der have to besonders stark verwendet wird (1999:490). Krug, der eine deutliche Zunahme im Gebrauch von have to zwischen 1800-49 und 1950-90 in ARCHER beobachtet, ist der Ansicht, dass die Sprache in fiction sich der gesprochenen Sprache schon stark angepasst hat, während die Pressesprache, die von Hundt und Mair als agiles und für sprachliche Veränderungen sehr empfängliches Genre betrachtet wird (1999:234-236), sich noch im Wandel PREPRINT – JANUARY 2012 – please do not cite without permission 9 befindet (2000:86). In der Tat nimmt der Gebrauch von have to und want to im COHA insgesamt am stärksten im Zeitschriftenteil, der von need to im Zeitungsteil zu. Auch die Frequenz von want to, das, wie have to, im COHA deutlich häufiger (6–12 Mal so oft) verwendet wird als im Google Books Korpus, ist in fiction 3–9 Mal so hoch wie in non-fiction books. Need to wird hingegen am häufigsten in non-fiction books und ab den 1930er Jahren am seltensten in fiction verwendet. Hier bestehen auch keine so großen Unterschiede zwischen den Häufigkeiten in den einzelnen Registern. Abb. 5. Frequenzen von have to und need to in den verschiedenen Korpusteilen des COHA VNC-Analysen zeigen, dass die Phasen, die bei der Zunahme im Gebrauch von semi-modalen Verben unterschieden werden können, sich überwiegend nicht mit denen des Rückgangs im Gebrauch der zentralen Modalverben decken (s.o.). Bei have to können beispielsweise 4 Phasen angenommen werden, die bis zum Ende der 1910er Jahre, zur Mitte der 1930er Jahre und zur Mitte der 1950er Jahre reichen, und auch bei want to ist eine Phasierung bis zur Mitte der 1930er Jahre sinnvoll. Bei einer Annahme von 3 Clustern kann im Falle von need to von einer langen Periode bis zur Mitte der 1970er Jahre, gefolgt von zwei kurzen Phasen bis zum Ende der 1980er bzw. 1990er Jahre gesprochen werden, wohingegen die Abnahme von need in grob zwei Phasen bis zur Mitte der 1920er Jahre bzw. bis 1999 stattfindet. b) Deutsche Modalverben Im Vergleich zu den englischen werden die deutschen Modalverben viel häufiger gebraucht. Wie bei den englischen Modalverben, kann auch bei müssen, sollen, brauchen und wollen im DWDS ein Gebrauchsrückgang beobachtet werden (vgl. Tab. 5), wenn auch ein deutlich geringerer. Der Unterschied zwischen den 1900er und 1990er Jahren ist bei allen Verben statistisch signifikant (χ2=62, 12, 9, 278; p<1%, d.f.=1), allerdings besteht nur bei wollen eine signifikante Korrelation zwischen der Zeit und den Frequenzen (τ=-0,6; p=0,2%). PREPRINT – JANUARY 2012 – please do not cite without permission 10 1900s 1910s 1920s 1930s 1940s müssen 2229 2495 2663 2340 2332 sollen 1712 15,6 1910 16,2 1732 19,9 1565 16,5 1789 18,7 1781 2229 1881 1654 18260 brauchen5 wollen 1950s 1960s 1970s 1980s 1990s Diff. -7,4% 2537 2389 2095 2151 2064 2075 18,9 2307 15,0 (37,2) 1591 13,6 (40,9) 1867 13,4 (35,5) 1710 11,0 (27,2) -0,1% -30% 1589 1215 1323 1572 1476 -17% Korrelationseffizienten (Zeit~Frequenz): müssen: p=0,11, τ= -0,42; sollen: p=0,86, τ=-0,07; brauchen: p=0,07, τ= -0,46; wollen: p=0,002, τ= -0,6 graue Schrift: Die Nullhypothese (die Abweichung zwischen der grau markierten und der vorausgehenden Frequenz ist eine Zufallsvariation) kann nicht abgelehnt werden (p>5%, d.f.=1). Tabelle 5. Frequenzen von müssen, sollen, brauchen und wollen im DWDS-Kernkorpus (in W/M) Abb. 6 zeigt, dass der Gebrauch von müssen und sollen in den verschiedenen Dekaden im DWDS großen Schwankungen unterzogen ist. Auch im Google Books Korpus ist sollen am Ende der 1930er Jahre besonders selten (1935, 1936, 1938 und 1940 liegt die Frequenz bei knapp unter 1100 W/M), während die Frequenz etwa zwischen 1919 und 1921 sowie zwischen 1961 und 1973 bei mehr als 1200 W/M liegt. Müssen wird auch um das Jahr 1920 und zu Beginn der 1940er Jahre besonders häufig verwendet. Eine VNC-Analyse der Frequenzen im Google Books Korpus zeigt ebenfalls, dass (bei der Annahme von 7 Clustern) eine kurze Hochphase von ca. 1940 bis 1945 sowie nachfolgend und vorausgehend zwei Phasen starken Gebrauchs (von ca. 1915 bzw. bis Mitte der 1960er Jahre) unterschieden werden können. Abb. 6. Frequenzen von müssen und sollen im DWDS und im Google Books Korpus Insgesamt kann im Google Books Korpus zwischen den 1910er und 1990er Jahren ein Rückgang um 11,4% im Gebrauch von müssen beobachtet werden (bei einer höchst signifikanten, negativen Korrelation zwischen der Zeit und den Frequenzen, τ=-0,42; p=4e-10), bei sollen hingegen eine leichte Zunahme um 3% (τ=0,12; p=0,09). 5. 5 Es wurde nach allen Formen von B/brauchen und, mit max. 6 Wörtern Abstand, einem Infinitiv mit zu gesucht. Die Ergebnisse einer zweiten Suche nach B/brauchen und einem Infinitiv (mit max. 6 Wörtern Abstand) in den 1960er bis 1990er Jahren wurden manuell analysiert. Da aufgrund rechtlicher Nutzungsvereinbarungen nur 49– 64% aller Treffer einer Suche angezeigt wurden, handelt es sich bei den angegebenen Werten um Hochrechungen. PREPRINT – JANUARY 2012 – please do not cite without permission 11 Interessant ist auch der Vergleich zu den von Glas (1984) ermittelten Häufigkeiten im LIMAS Korpus (1971/72): im DWDS ist die Frequenz von müssen und sollen in den 1970er Jahren niedriger (2380>2095| 1870>1591). Bei müssen kann sich diese Differenz (neben Unterschieden in der Korpuszusammensetzung) daraus ergeben, dass im DWDS in den Wert für die 1970er Jahre auch die Jahre 1973 bis 1979 eingerechnet werden, in denen der Gebrauch im Rückgang begriffen zu sein scheint. Bei wollen ist der Fall wohl genau umgekehrt (LIMAS: 1070 W/M). Ein Vergleich mit Diewalds Auswertung kann allerdings nur bedingt hergestellt werden: Während das Verhältnis von sollen zu müssen in den 1990er Jahren im Zeitungsteil des DWDS, das auch Magazine und Illustrierte enthält (vgl. Geyken 2009), ähnlich wie bei Diewald (0,83) bei 0,79 liegt, ist wollen in Diewalds Spiegel-Korpus, anders als im DWDS, das meistbenutzte Modalverb. Abb. 7. Frequenzen von müssen und sollen in den verschiedenen Korpusteilen des DWDS-Kernkorpus Abb. 7 zeigt die Verwendung von müssen und sollen in den verschiedenen Korpusteilen des DWDS. In wissenschaftlicher Literatur sind beide Verben fast durchgehend am seltensten; eine Ausnahme bilden nur die 1960er Jahre, in denen ihr Gebrauch, wie bei must, should, und have to auffällig hoch ist. Wie should wird auch sollen in den 1950er Jahren verstärkt verwendet (vgl. Abb. 3; alle Frequenzunterschiede zwischen den einzelnen Dekaden in Wissenschaft und Zeitung sind statistisch signifikant χ2>4, p>5%, d.f.=1). Es liegt daher nahe, dass hier es sich um eine besondere Phase in der Wissenschaftsliteratur im deutschen und amerikanischen Sprachraum handelt. 4. DISKUSSION Der Vergleich des Gebrauchs von Modalverben im Deutschen und im amerikanischen Englisch innerhalb des letzten Jahrhunderts ist in vielerlei Hinsicht aufschlussreich. Er zeigt zum einen, dass im Englischen viel mehr modale bzw. semi-modale Verben zum Ausdruck von Notwendigkeit und Verpflichtung benutzt werden können als im Deutschen; zum anderen, dass die deutschen Modalverben müssen und sollen deutlich öfter verwendet werden als alle ihre hier untersuchten englischen Entsprechungen zusammen. Der Gebrauch von müssen, brauchen und wollen geht zwar insgesamt leicht zurück (bei sollen nur im DWDS), im Verlaufe des Jahrhunderts sind jedoch keine so klaren Trends zur Ab- bzw. Zunahme wie bei den englischen PREPRINT – JANUARY 2012 – please do not cite without permission 12 zentralen Modalverben bzw. semi-modalen Verben erkennbar. Der Gebrauch von must, should, ought to und need halbiert sich fast, während have to, want to und insbesondere need to deutlich zunehmen. VNC-Analysen zeigen jedoch, dass die Phasen, die beim Rückgang im Gebrauch der zentralen Modalverben unterschieden werden können, sich größtenteils nicht mit denen im Gebrauch der semi-modalen Verben im amerikanischen Englisch decken. Der interessanten Frage, inwiefern Veränderungen im Verhältnis von nicht-epistemischen und epistemischen Bedeutungen in diesem Zusammenhang bedeutsam sind, konnte hier aufgrund der Größe der Textmengen leider nicht nachgegangen werden. Auch die Frage nach anderen Ursachen muss an dieser Stelle unbeantwortet bleiben. Für die These des kulturellen Wandels spricht indes u.a., dass auch der Gebrauch einiger bedeutungsverwandter Ausdrücke abnimmt (z.B. notwendig, das; be necessary to/that, vgl. auch Jäger 2012). Der Vergleich zwischen den beiden Referenzkorpora und dem Google Books Korpus spiegelt die Bedeutung der Möglichkeit einer registerdifferenzierten Betrachtung wider. Wie bei der Analyse im COHA und im DWDS deutlich wurde, variieren die Häufigkeiten der untersuchten Verben in den verschiedenen Registern, die für sprachliche Veränderungen in unterschiedlichem Maße empfänglich sind, z.T. sehr stark. So zeigen einige Verben eine Präferenz für den Gebrauch in fiction (z.B. want to, have to, ought to), während andere insbesondere in non-fiction books (should, must und – ab den 1930er Jahren – need) bzw. der Gebrauchsliteratur (müssen, sollen) verwendet werden. Im Falle des Google Books Korpus, das zwar die Möglichkeit bietet, bisher ungekannte Größen an Datenmengen zu untersuchen, es ist hingegen angesichts der Unklarheit, zu welchen Anteilen verschiedene Register wie wissenschaftliche Literatur, Belletristik oder Gebrauchsliteratur enthalten sind, schwierig, zuverlässig Rückschlüsse auf Veränderungen in einzelnen Registern oder gar der gesamten Sprache zu ziehen. Dem Anspruch, mit dem Korpus Einblicke in kulturelle Entwicklungen zu geben (Michel et al. 2011:176), wird hingegen sicherlich dadurch Rechnung getragen, dass einige Textsorten, wie z.B. Gesetze oder Verträge, zwar von einer kleinen Personenzahl verfasst werden, jedoch zum Teil große kulturelle Bedeutung haben (Biber 1993:245). Auch kann vermutet werden, dass der Großteil der Bücher von vielen Nutzern der Universitätsbibliotheken und der Google Bücher-Suche im Internet (seit 2004) rezipiert werden. Die Häufigkeit dieser Textrezeption quantifizierbar zu machen, liegt jedoch außerhalb des Bereichs des Möglichen. Die große Herausforderung liegt somit, im Google Books Korpus wie auch im DWDS und COHA, in der Bestimmung der Bedeutung der gewonnenen Daten, sowohl als Zeugnisse sprachlichen Wandels als auch kultureller Veränderung. Anmerkungen Mein Dank gilt Dr. Martin Hilpert vom Freiburg Institute for Advanced Studies (FRIAS) für die Bereitstellung des VNC-Scripts in einem R-Workspace, durch das diese Form der Analyse erst möglich wurde. BIBLIOGRAPHIE Biber, Douglas, Susan Conrad & Randi Reppen. 1998. Corpus linguistics: Investigating language structure and use. Cambridge: CUP. Biber, Douglas. 1993. Representativeness in Corpus Design. Literary and Linguistic Computing 8(4). 243-257. Biber, Douglas. 2004. Historical patterns for the grammatical marking of stance. A cross-register comparison. Journal of Historical Pragmatics 5(1). 107-136. Biber, Douglas, Johansson, Stig, Leech, Geoffrey; Conrad, Susan & Edward Finegan, 1999. The Longman Grammar of Spoken and Written English, London: Longman. Bolinger, Dwight L. 1980. Language: The Loaded Weapon. London: Longman. Brünner, Gisela & Angelika Redder. 1983. Studien zur Verwendung der Modalverben (Studien zur deutschen Grammatik 19). Tübingen: Narr. Davies, Mark. (2010–) The Corpus of Historical American English (400 million words, 1810-2009). http://corpus.byu.edu/coha/. (15 February 2012.) Davies, Mark. (2011–) Google Books (American English) Corpus (155 billion words, 1810-2009). http://googlebooks.byu.edu/. (15 February 2012.) Digitales Wörterbuch der deutschen Sprache des 20. Jahrhunderts, BerlinBrandenburgische Akademie der Wissenschaften, Berlin http://www.dwds.de/resource/kerncorpus/. (15 February 2012.) Diewald, Gabriele. 1999. Die Modalverben im Deutschen: Grammatikalisierung und Polyfunktionalität. Tübingen: Niemeyer. Eisenberg, Peter. 1999. Grundriß der deutschen Grammatik. Bd. 2: Der Satz. Stuttgart: Metzler. Engel, Ulrich. 2004. Deutsche Grammatik. Neubearbeitung. München: Iudicium. Fairclough, Norman. 1992. Discourse and Social Change, Cambridge: Polity Press. Fritz, Gerd. 1997. Historische Semantik der Modalverben. Problemskizze – Exemplarische Analysen – Forschungsüberblick. In Fritz, Gerd & Thomas Gloning (eds.) Untersuchungen zur semantischen Entwicklungsgeschichte der Modalverben im Deutschen (Germanistische Linguistik 187), 1-157. Tübingen: Max Niemeyer. Geyken, Alexander. 2009. Automatische Wortschatzerschließung großer Textkorpora am Beispiel des DWDS. Linguistik online 39(3). Glas, Reinhold. 1984. ‚sollen‘ im heutigen Deutsch: Bedeutung und Gebrauch in der Schriftsprache. Studien zur deutschen Grammatik 27. Tübingen: Gunter Narr. Gries, Stefan Th. & Martin Hilpert. Erscheint 2012. Statistical clustering techniques in historical English linguistics. In Terttu Nevalainen & Elizabeth Closs Traugott (eds.), Handbook on the history of English: rethinking approaches to the history of English. Oxford: OUP. Hausser, Roland. 2000. Grundlagen der Computerlinguistik: Mensch – Maschine Kommunikation in natürlicher Sprache. Berlin: Springer. Hilpert, Martin & Stefan Th. Gries. 2009. Assessing frequency changes in diachronic corpora. Literary and Linguistic Computing 24(4). 385-401. Hundt, Marianne & Christian Mair. 1999. 'Agile' and 'Uptight' Genres: The CorpusBased Approach of Language Change in Progress”. International Journal of Corpus Linguistics 4(2). 221-242. 14 Jäger, Verena. Erscheint 2012. Modality and Beyond: Expressions of Obligation and Necessity in Spoken American English. Épilogos. Université de Rouen: Publications électroniques de l'ERIAC, Johnen, Thomas. 2006. Zur Herausbildung der Kategorie Modalverb in der Grammatikographie des Deutschen (und des Portugiesischen). Pandaemonium germanicum 10. 283-338. Kaledin, Eugenia. 2000. Daily life in the United States, 1940-1959: shifting worlds. (Daily life through history). Westport: Greenwood Press. Krug, Manfred G. 2000. Emerging English Modals: A Corpus-Based Study of Grammaticalization. Berlin: Mouton de Gruyter. Leech, Geoffrey N. 2003. Modality on the Move : The English Auxiliaries 19611992. In Facchinetti, Roberta; Krug, Manfred G. & Frank R. Palmer (eds.) Modality in Contemporary English, 223-240. Berlin: Mouton de Gruyter. Leech, Geoffrey N. 2011. The Modals ARE Declining. International Journal of Corpus Linguistics 16(4): 547-564. Mair, Christian. 2006. Twentieth-Century English: History, Variation and Standardization (Studies in English Language). Cambridge: CUP. Michel, Jean-Baptiste; Shen, Yuan Kui; Aiden, Aviva Presser; Veres, Adrian; Gray, Matthew K., The Google Books Team; Pickett, Joseph P.; Hoiberg, Dale; Clancy, Dan; Norvig, Peter; Orwant, Jon; Pinker, Steven; Nowak, Martin A.; Aiden, Erez Lieberman. 2011a. Quantitative Analysis of Culture Using Millions of Digitized Books. Science 331: 176-182. DOI: 10.1126/science.1199644 (online am 16.12.2010 veröffentlicht) and Supporting Online Material. 2011b. Corrected March 11, 2011 <http://www.sciencemag.org/content/suppl/2010/12/16/science.1199644.DC1/Mi chel.SOM.revision.2.pdf>. Millar, Neil. 2009. Modal verbs in TIME: Frequency changes 1923-2006. International Journal of Corpus Linguistics 14(2). 191-220. Müller, Friederike. 2008. Analysing corpora of present day spoken English: Current changes in the English Modals. Postgraduate Conference at Aston University, Birmingham. http://acorn.aston.ac.uk/conf_papers/paper%20%20Friederike%20Mueller.pdf. (15 February 2012.) Myhill, John. 1995. Change and continuity in the functions of the American English modals. Linguistics 33. 157-211. Palmer, Frank Robert. 1990. Modality and the English modals. London: Longman. Quirk, Randolph, Greenbaum, Sidney, Leech, Geoffrey N. & Jan Svartvik. 151985. A Comprehensive Grammar of the English. London: Longman. Reis, Marga. 2007. Modals, so-called semi-modals, and grammaticalization in German. IJGLSA 12(1). 1-57. Traugott, Elizabeth Closs. 1989. On the rise of epistemic meaning in English: An example of subjectification in semantic change. Language 65. 31-55.