Ich gebe es gleich zu: Auf die in der Überschrift gestellte Frage habe ich keine Antwort. Bisher kann ich nur sagen zu ersterem taugt Ngram definitiv, für das zweitere muss es sich noch beweisen. Nun aber erstmal zu grundlegenderen Fragen: Was ist eigentlich Ngram? (Teaser: ich verspreche sogar ausnahmsweise farbige Bilder im Beitrag!)
Ohne meinen täglichen Lesebesuch auf Sociological Images hätte ich Ngram vielleicht erst in ein paar Jahren entdeckt. Gestern wurde dort unter dem Titel „Database on Linguistic Trends in Books“ ein Beitrag zu Ngram veröffentlicht.
Ngram ermöglicht es etwas 5 Millionen Bücher (die von Google gescannte Database) nach Wörtern oder Phrasen zu durchsuchen und die Anzahl der Suchergebnisse in einem Graph (die X-Achse stellt die Zeit (Jahreszahlen) da) darzustellen. Dabei kann man in auch mehrer Graphen vergleichend betrachten und so Entwicklungen vergleichen. Sociological Images versuchte sich zum Beispiel an „man“ vs. „woman“. Neben dem einzuschränkenden Zeitrahmen kann man auch den Sprachkorpus, in dem man suchen möchte auswählen. Alle Informationen darüber und dazu, wie Google bei Ngram methodisch vorgeht, findet ihr hier.
Wie versprochen, nun farbige Bilder. Ich habe mal vergleichen lassen, wie die Nutzung der Wörter „race“, „class“ und „gender“ sich im Amerikanischen und Britischen Englisch verhält. Et voilà:
Was fällt sofort ins Auge? „Class“ ist seit den 1840igern auf einem starken Vormarsch im Gebrauch. „Race“ wird im Amerikanischen Englisch seit den 1960iger häufiger genutzt als im Britischen Englisch. Gut lässt sich auch der Aufstieg des Begriffes „Gender“ beobachten. Natürlich wäre es fatal allein aus diesen Graphen irgendwelche großen Schlussfolgerungen zu ziehen, aber sie scheinen doch eine nette Illustration verschiedener Phänomene zu sein und/oder ein toller Anfangspunkt für Überlegungen. Spannend wird es dann auch, wenn man schaut, welche Bücher denn durch die Suchbegriffe gefunden wurden (dies ist immer unter dem Graph möglich), dann fällt z.B. auf das sehr viele Bücher, die zwischen 1800 und 1840 erschienen und das Wort „race“ beinhalten, sich mit Tieren auseinandersetzen.
So zum Abschluss noch ein schöner Graph:
So nun aber erstmal gut, ich gehe weiter spielen…