Dieser Beitrag ist Teil eines Projekts, das Daten aus Bürgermedien auswertet. Dazu arbeitet RuNet Echo mit dem Maryland Institute for Technology in the Humanities zusammen. Alle Beiträge dieser Reihe sind auf Deutsch in unserem Dossier “Alle Tweets der Präsidenten” nachzulesen.
Als wir letzten Oktober damit anfingen, unsere Twitterdaten zu erheben, waren wir primär daran interessiert, was Russen und Ukrainer über ihre Präsidenten zu sagen haben. Aber wir entschieden uns dazu, ein größeres Netz auszuwerfen und sammelten alle Tweets, die die Nachnamen der Staatsoberhäupter auf Russisch (Путин und Порошенко), Ukrainisch (Путін und Порошенко) und Englisch (Putin und Poroshenko) enthalten. Damit kamen wir zu über sechs Millionen Twitternachrichten, 6.342.294, um genau zu sein.
Als wir unsere Daten hatten, standen wir vor einem Problem: Wie können wir erkennen, wann ein Russe oder ein Ukrainer über Putin oder Poroshenko twittert und wann ein Brite oder Koreaner? Tweets und Twitterkonten verfügen über verschiedene Merkmale, die auf das Land und die Sprache des jeweiligen Nutzers hinweisen können. Zunächst ist da einmal der Ort, den ein Nutzer anwählt und zu seinem Profil hinzufügt. Dann richtet ein Nutzer die Sprache für das Konto und die Benutzeroberfläche ein. Drittens verfügt jeder Tweet über eine Sprachanzeige, die sich aus den Einstellungen der Tastatur und des Inhalts der Nachricht ergibt. Und schließlich aktivieren einige Nutzer auf ihren Smartphones die Funktion Ortsbestimmung (Geolocation). Damit gehören dann zu jedem Tweet Angaben zu den Koordinaten, die den Ort beschreiben, von dem aus der Tweet gesendet wurde. Diese Ortsangaben können auf einer Karte markiert werden.
Keine dieser Optionen kann uns natürlich mit hundertprozentiger Sicherheit die Nationalität eines Nutzers verraten. Aber jede von ihnen bietet uns hilfreiche Informationen. In dieser Ausgabe betrachten wir den Gebrauch der Sprachen, die in den Tweets unserer Datensammlung verwendet werden. Die Ortsbestimmung und länderspezifische Twitternachrichten untersuchen wir im nächsten Beitrag.
Dies ist die Aufschlüsselung unseres sechs Millionen starken Twitternachrichtenarchivs.
Zahl der Tweets pro Sprache. Die Stichprobe besteht aus 6.342.294 Twitternachrichten, die zwischen dem 12. Oktober 2014 und dem 30. November 2014 gesammelt wurden. In allen Tweets kommt mindestens eins der folgenden Stichwörter vor: Poroshenko, Putin, порошенко, путин, путін.
Es ist unmittelbar ersichtlich, dass Tweets auf Russisch dominieren und mehr als die Hälfte aller Twitternachrichten des Datensatzes ausmachen. Aber Twitternutzer, die auf Russisch schreiben, sind nicht nur Russen, sondern auch Ukrainer; Kasachen, Moldauer und Bürger anderer ehemals sowjetischer Staaten. Russischsprechende Einwanderer von überall, von Italien bis Australien, tragen ebenfalls zur massiven Präsenz der Sprache in unserem Datensatz bei.
Auch wenn Russisch an der Spitze steht, twittern viele Ukraine zeitweise auf Russisch oder Ukrainisch, so dass es keine Korrelation zwischen der Anzahl der Tweets auf Russisch und Ukrainisch und der Anzahl der Twitternutzer in Russland (über acht Millionen 2014) und in der Ukraine (über 600.000 im Juli 2014) existiert. Wir müssen außerdem davon ausgehen, dass sich Russen und Ukrainer auch oft einer anderen als ihrer Muttersprache bedienen, beispielsweise Englisch oder Französisch. Das ist in politischen Umbruchsituationen besonderns offenkundig und stimmt mit dem Twitterverhalten überein, dass Poell und Darmoni in ihrer Studie zur tunesischen Revolution 2012 beobachtet haben. Twitternutzer schrieben damals auf Englisch, um die westlichen Massenmedien und englischsprechende Nutzer miteinzubeziehen.
Dass sowohl Hashtags mit lateinischem als auch nicht lateinischem Alphabet in ein und denselben Tweets verwendet werden, erschwert die Sprachanalyse zusätzlich. Katerena Kuksenok beobachtete in ihrer Auswertung einer Millionen Tweets während der Euromaidan-Proteste in der Ukraine, dass “eine große Anzahl von Tweets entsprechende Hashtags in verschiedenen Sprachen verwendeten” (beispielsweise “#Євромайдан #Евромайдан #Euromaidan”), scheinbar um die Sichtbarkeit der Botschaften des Tweets zu maximieren. Während Russisch und Ukrainisch an der Spitze der Sprachentabelle leicht zu erklären sind, scheinen andere Sprachen, die ebenfalls vertreten sind, weniger selbstverständlich. Sie werden in einem noch höheren Maße erklärungsbedürftig, wenn wir die Ergebnisse der Stichprobe mit der Statistik zu den meistverwendeten Sprachen auf Twitter vergleichen.
Die Top 10 der Sprachen auf Twitter. Semiocast (Marktforschungsunternehmen) (Sprachen und Tweets pro Land bei einer Stichprobe von 10 Prozent, September 2013) und Twitter.
* Jeder “andere” Sprache macht weniger als 1 Prozent aus.
Die Popularität von Englisch leuchtet ein, da englischsprechende Nutzer nicht nur aus Ländern wie den USA und Großbritannien kommen, sondern aus Ländern aus aller Welt. Spanisch ist generell beliebt auf Twitter und das scheint sich in unserer Stichprobe wiederzuspiegeln.
Französisch dagegen ist weniger populär und Deutsch noch viel weniger und doch sind sie in unserer Stichprobe deutlich vertreten. Möglicherweise liegt das daran, dass Frankreich und Deutschland direkt an den Verhandlungen zwischen der Ukraine und Russland im Konflikt in der Ostukraine beteiligt sind und daher Nutzer sozialer Medien und Netzwerke der beiden Länder überdurchschnittlich an Poroshenko und Putin interessiert sind.
Das Gleiche mag auch im Fall der türkisch- und italienischsprachigen Twitternutzer zutreffen. Die Zahl der türkischsprachigen Tweets, in denen mindestens einer der beiden Präsidenten erwähnt wird, entspricht fast der Anzahl der Tweets auf Deutsch. Auch die italienischsprachigen Twitternachrichten liegen da nicht weit zurück. Die Aufmerksamkeit bezüglich des Schicksals der Nachbarn ist bei diesen beiden Ländern daher möglicherweise ebenfalls erhöht.
Es ist bemerkenswert, dass in unserer Stichprobe nur sehr wenige japanischsprachige Tweets dabei sind, wo doch 16 Prozent der Nachrichten auf Twitter auf Japanisch verfasst werden. Arabisch, Malaiisch und Portugiesisch sind ebenfalls mit einem sehr geringen Anteil an Tweets zu dem russischen oder dem ukrainischen Präsidenten vertreten, während indonesischsprechende Twitternutzer sich offensichtlich mehr für das Thema zu interessieren scheinen.
Während sich die Welt also scheinbar dafür interessiert, was die Staatsführer der Ukraine und Russlands so tun, konzentriert sich doch eine überwältigende Mehrheit der Nachrichten auf die russischsprachige Twittersphäre und das ukrainische Gegenstück dazu. Wir werden weiter in unseren Daten wühlen und rechnen damit, neue Einblicke zur politischen Debatte und Diskussion über das RuNet hervorzubringen und damit zu einem differenzierten Verständnis beizutragen, was die Personen Vladimir Putin und Petro Poroshenko für die Twitternutzer der Ukraine und Russland bedeuten.