Von Juni bis September wurden Twitter-Interaktionen mit deutschen Politikern des 18. deutschen Bundestags und bundespolitisch relevanten Politikern der FDP und AfD "mitgeschnitten" und als Open Data Datensatz für weitere Analysen aufbereitet. Insgesamt wurden die Accounts von 364 Politikern verfolgt. Im Rahmen dessen wurden etwa 120.000 Twitter User erfasst, die gemeinsam über 1.2 Mio. Tweets erzeugt haben. Dies entspricht einer Stichprobe von etwa 5% des tatsächlichen Traffics auf Twitter. Die Gesamtmenge der erfassten Daten beträgt ca. 10 GB. Der Vortrag stellt erste Erkenntnisse vor, die in diesem Datensatz zu finden sind. Dabei wird einigen Fragen nachgegangen, z.B. ob es "laute" und "leise" Parteien auf Twitter gibt? Lässt sich die politische Nähe von Twitter Nutzern zu Parteien ableiten? Eignet sich Twitter als Instrument für die Meinungsforschung? Und vor allem: War das Wahlergebnis bereits im Vorfeld absehbar?
Der Bundestagswahlkampf 2017 auf Twitter - War der Ausgang abzusehen?
1. Prof. Dr. Nane Kratzke
WAR DER AUSGANG
ABZUSEHEN?
1
Der Bundestagswahlkampf 2017 auf Twitter
CoSA-Seminar, 23.10.2017 Nane Kratzke
2. Prof. Dr. Nane Kratzke
EINLEITUNG
• Februar: Nach Trump reden alle über Meinungsbots und deren
Einfluss. Automatisierung des Twitter Accounts @empoerator, um
rauszufinden, wie gut „Bot-Detektoren“ sind (z.B.
https://botometer.iuni.iu.edu). Nach einer Woche führt der Bot
(schwachsinnige) Diskussionen und wird von Menschen nicht als
Bot erkannt! Zweifel am Turing Test erwachen ...
• Erkenntnis: Bots sind extrem leicht zu tarnen und @empoerator
wird sicherheitshalber eingestellt ...
• März: Suche nach Datensätzen für Machine/Deep Learning
Verfahren (keine deutschsprachigen Twitter-Datensätze gefunden).
• April: Erkenntnis zur #BTW17: Eine Gelegenheit, die nur alle vier
Jahre wieder kommt!
• Juni bis September: Recording von 364 Politiker aller
Bundestagsfraktionen plus FDP und AfD Politiker mit
bundespolitischer Bedeutung (ca. 50% aller Politiker haben auf
offiziellen Webseiten einen Twitter-Account angeben, in den USA
sind es 100%, aber das nur nebenbei)
Twitter Streaming API liefert ca. 10 GBan Daten (ca. 1% bis 10%
Sample) und das kam dabei raus …
2
3. Prof. Dr. Nane Kratzke
TWITTER AKTIVITÄT
im Verlaufe der #BTW17
3
Wahltag
TV-Duell(e)
Ehe für alle G20 Ausschreitungen
Kanzler-Duell
TV-Duell der „kleinen“ Parteien
4. Prof. Dr. Nane Kratzke
TWITTERINTERAKTIONEN
als gerichteter Multi-Kanten Graph
Anton: Das Wetter ist gut. (STATUS)
Ben: @Anton Bei uns leider nicht. (REPLY)
Ben: @Anton Aber das Essen ist gut. (REPLY)
Clara: (RETWEET)
@Anton: Das Wetter ist gut.
Dora: Immer Diskussionen über das Wetter. (QUOTE)
@Anton: „Das Wetter ist gut“
Dora: Oder das Essen. (QUOTE)
@Ben: @Anton Aber das Essen ist gut.
4
Kantenrichtung entspricht der festgestellten Kommunikationsrichtung.
5. Prof. Dr. Nane Kratzke
RESULTAT
Ziemlich komplexe Graphen
5
Knoten: 121.098
Kanten: 1.210.904
Degree: 9.9994
Rohdatengröße: ca. 10 GB
Graphgröße (NetworkX, binär): ca. 300 MB
6. Prof. Dr. Nane Kratzke
WIE WIRD GETWITTERT?
6
94% aller Interaktionen auf Twitter beschäftigen sich mit Tweets,
nur etwa 6% sind (Original-)tweets.
7. Prof. Dr. Nane Kratzke
WIE WIRD GETWITTERT?
Verhältnisse sind (meist) erstaunlich konstant
7
Was ist das? Fehler in der Matrix?
Oder Ereignisse von Bedeutung?
8. Prof. Dr. Nane Kratzke
WIE WIRD GETWITTERT?
Plötzlich die Ehe für Alle
8
14. Prof. Dr. Nane Kratzke
TWITTER ALS GLASKUGEL?
Vergleich mit der Sonntagsfrage von infratest dimap (ARD)
14
Aufgezeichnet sind die Retweets (relativer Anteil)
der jeweiligen Parteien.
Idee: Je mehr Retweets, desto mehr Bürger stehen
hinter Parteipositionen und desto mehr Bürger
„erreichen“ Politiker auf Twitter.
Die Verlaufskurven sind im Einzelfall sicher
spannend, eigenen sich aber kaum zur Prognose.
15. Prof. Dr. Nane Kratzke
ES GIBT LAUTE PARTEIEN
Das wird man ja wohl noch messen dürfen …
15
10% allerTwitter Accounts sind für 30% aller Retweets verantwortlich.
16. Prof. Dr. Nane Kratzke
WARUM/WIE ERZEUGT MAN LAUTSTÄRKE?
Algorithmen springen auf Lautstärke (Retweets) an
16
17. Prof. Dr. Nane Kratzke
REICHWEITEN VON PARTEIEN
Retweets
17
Politiker Follower
Follower
von
Followern
Bis auf die AfD konnte keine Partei ihr rechnerisches Potenzial überproportional
ausschöpfen.
18. Prof. Dr. Nane Kratzke
REICHWEITE VON POLITIKERN
Ein paar interessante Graph-Pattern
18
19. Prof. Dr. Nane Kratzke
REICHWEITE VON POLITIKERN
Wer wird am häufigsten geteilt?
19
1
9
44
20. Prof. Dr. Nane Kratzke
REICHWEITE VON POLITIKERN
Wie viele Accounts (Netzknoten) verbreiten Inhalte?
20
2
4
L
21. Prof. Dr. Nane Kratzke
REICHWEITE VON POLITIKERN
Wie erhält am meisten Antworten?
21
2
8
17
22. Prof. Dr. Nane Kratzke
REICHWEITE VON POLITIKERN
Wer hat die meisten antwortenden Accounts?
2
5
34
23. Prof. Dr. Nane Kratzke
REICHWEITE VON POLITIKERN
Wer gibt die meisten Antworten?
1
7
17
24. Prof. Dr. Nane Kratzke
REICHWEITE VON POLITIKERN
Wer erreicht die meisten Accounts mit Antworten?
1
4
17
25. Prof. Dr. Nane Kratzke
TOP 50 - ZUSAMMENFASSUNG
Wie viele Politiker schaffen es in die TOP 50?
Kategorie
CDU
CSU
SPD AfD FDP LINKE Grüne
Wer wird am häufigsten geteilt 5 7 7 4 14 13
Wie viele Accounts verbreiten Inhalte 6 8 7 3 12 14
Wer erhält am meisten Antworten 8 12 7 3 9 11
Wer hat die meisten antwortenden Accounts 8 11 7 3 10 11
Wer gibt die meisten Antworten 13 12 1 5 9 9
Wer erreicht die meisten Accounts mit Antworten 13 13 1 5 10 8
25
26. Prof. Dr. Nane Kratzke
WAS WÄRE WENN …
die Nr. 4 der meist retweeteten Politiker das Netz verlässt?
26
Erreichte
Anhänger
Ohne
Petry
Mit
Petry
27. Prof. Dr. Nane Kratzke
WAS WÄRE WENN …
@MartinSchulz hingeschmissen hätte?
27
Erreichte
Anhänger
Ohne
Schulz
Mit
Schulz
Martin Schulz ist für das Netzwerk
der SPD wichtiger als Frauke Petry
es für das Netzwerk der AfD war.
28. Prof. Dr. Nane Kratzke
WAS WÄRE WENN …
@FraukePetry der CDU/CSU beitreten würde?
28
0,00%
5,00%
10,00%
15,00%
20,00%
25,00%
Rechnerisch durch
Politiker erreichbare
Accounts
Durch Politiker
tatsächlich erreichte
Accounts
Insgesamt erreichte
Accounts
CDU/CSU CDU/CSU (mit Petry) AFD AFD (ohne Petry)
Auch hier sind die negativen Effekte für die AfD begrenzt. Die CDU könnte immerhin die direkt
durch Politiker erreichbaren Accounts verbessern. Bei den insgesamt erreichten Accounts
hätte das aber dennoch nur wenig Auswirkungen.
29. Prof. Dr. Nane Kratzke
EIN WENIG ZUM NACHDENKEN …
Mythos Wechselwähler
29
Die „Lehrbuchstrategie“ aus
den Obama Kampagnen:
Wechselwähler identifizieren und
zielgerichtet (z.B. mittels
Microtargeting) informieren.
Aber: Der „Wechselwähler“ tritt
auf Twitter kaum in Erscheinung.
P.S.: Angeblich war eine Strategie derTrump-Kampagne, Clinton-Anhänger zu demobilisieren. Vielleicht weil
Anhänger einfacher zu identifizieren sind, als Hin- und Hergerissene?
30. Prof. Dr. Nane Kratzke
EIN WENIG ZUM NACHDENKEN …
Gläserner Bürger – oder kurzsichtige Analysen?
30
Fantastisch/Panik: Mittels
der Auswertung von
Retweets lassen sich 50%
aller erfassten Accounts
einer Partei zuordnen.
Daten sind das neue Gold!
Daten sind böse!
Doch von ca. 75%dieser Accounts sind nicht
mehr als drei Interaktionen bekannt! Für Microtargeting
im deutschen Wahlsystem eigentlich wertlos.
31. Prof. Dr. Nane Kratzke
LEHREN ...
Über Scheinriesen und Scheinzwerge
• Parteien im linken politischen Spektrum nutzen Twitter intensiver.
• Populistische Parteien nutzen Twitter sogar noch intensiver.
• Die Twitternutzung ist nicht repräsentativ und daher für Wahlprognosen
kaum zu gebrauchen.
• Wechselwähler sind auf Twitter schwer zu identifizieren.
• Heißt es Microtargeting weil für 75% aller Accounts zu wenig Daten
vorliegen?
• Retweetnetzwerke erzeugen „Lautstärke“. Algorithmen springen auf
Lautstärke an. Die AfD erscheint damit vermutlich größer als sie wirklich ist
(Scheinriese).
• Die SPD schlägt die CDU/CSU auf Twitter um Längen (gebracht hat es
nichts).
• Die CDU/CSU findet auf Twitter kaum statt (Scheinzwerg).
• Von J. Kahrs (SPD) kann man lernen, wie sich Twitter als Medium für den
Dialog nutzen lässt. Die Grünen (z.B. Beck, Künast) sind da auch stark, aber
auch M. Grosse-Brömer (CDU) macht das, ebenso wie C. Linder (FDP).
• Von der FDP kann man ferner lernen, wie man Distribution (Pflicht) und
Dialog (Kür) kombinieren kann. Die AfD kann nur Distribution.
• Das gleiche gilt übrigens für @MartinSchulz
31
32. Prof. Dr. Nane Kratzke
Artikel: Treue Gefolgschaft – so twittert die AfD (Artikelserie)
Medium: Netzpolitik.org, 10.04.2017, 20.04.2017, 28.04.2017, 02.05.2017
URL: https://netzpolitik.org/tag/so-twittert-die-afd
Artikel: Social Media und Microtargeting in Deutschland
Medium: Informatik Spektrum (Gesellschaft für Informatik), Band 40, Heft 4, August 2017
URL: https://link.springer.com/article/10.1007/s00287-017-1051-4
Artikel: How Obama‘s Team Used Big Data to Rally Voters
Medium: MIT Technology Review, 19.12.2012
URL: https://www.technologyreview.com/s/509026/how-obamas-team-used-big-data-to-rally-voters
Artikel: Clinton‘s campaign relied on an algorithm called Ada? What didn‘t she see?
Medium: The Washington Post, 09.11.2016
URL: http://wapo.st/2yUCmuD
Artikel: Voter Suppression is the Only Way Donald Trump Can Win
Medium: The Nation, 09.05.2016
URL: https://www.thenation.com/article/voter-suppression-is-the-only-way-donald-trump-can-win
ZUM SELBER LESEN …
32
Das Datum stimmt tatsächlich!
33. Prof. Dr. Nane Kratzke 33
Dataset: The #BTW17 Twitter Dataset
Platform: Zenodo (Size: 1GB zipped, unzipped: 10 GB)
DOI: 10.5281/zenodo.835734
URL: https://doi.org/10.5281/zenodo.835734
Dataset Descriptor:
Journal: Data (MDPI, Zürich)
DOI: to be done
URL: to be done
ZUM SELBER ANALYSIEREN …
34. Prof. Dr. Nane Kratzke
ABOUT
Nane Kratzke (nane.kratzke@fh-luebeck.de)
34
CoSA: http://cosa.fh-luebeck.de/en/contact/people/n-kratzke
Blog: http://www.nkode.io
Twitter: @NaneKratzke
GooglePlus: +NaneKratzke
LinkedIn: https://de.linkedin.com/in/nanekratzke
GitHub: https://github.com/nkratzke
ResearchGate: https://www.researchgate.net/profile/Nane_Kratzke
SlideShare: http://de.slideshare.net/i21aneka
35. Prof. Dr. Nane Kratzke
PICTURE REFERENCE
35
Reichstag Von Felix Mittermeyer – CC0
https://pixabay.com/de/bundestag-kuppel-reichstag-2463248
Johannes Kars Von Cosmicgirl - CC BY 3.0,
https://commons.wikimedia.org/w/index.php?curid=5396738
Beatrix von Storch Von Superbass - CC-BY-SA 4.0,
https://commons.wikimedia.org/w/index.php?curid=53221811
Christian Linder Von Olaf Kosinsky - CC BY-SA 3.0 de,
https://commons.wikimedia.org/w/index.php?curid=59380666
Martin Schulz Von Raimond (via Wikimedia Commons), CC-BY-SA 4.0,
https://commons.wikimedia.org/w/index.php?curid=59266216
Scheinriese Tur Tur Aus: Jim Knopf und Lukas der Lokomotivführer von Michael Ende
und F. J. Tripp (Illustrator), 1960, Carlsen Verlag
Transportflugzeuge Pixabay.com, CCO