Gatewatching 9: ‘Real’ News and ‘Fake’ News: Fact-Checking and Media Literacy
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data‘ in der Kommunikationsforschung
1. Neue Öffentlichkeiten auf
Social-Media-Plattformen:
Zur Nutzung von ‚Big Data‘ in
der Kommunikationsforschung
Associate Professor Axel Bruns
Queensland University of Technology
Brisbane, Australia
@snurb_dot_info | http://mappingonlinepublics.net/
2. ‚BIG DATA‘
• Soziale Medien und ‚Big Data‘:
– Erhebliches Wachstum der Social-Media-Nutzung
– Nutzeraktivitäten produzieren Daten und Metadaten
– Weitreichend verfügbar über APIs
– Neue Tools zur Verarbeitung und Visualisierung von Big Data in großem
Maßstab
• Social Media Analytics als neues Feld:
– Großflächige Erfassung von öffentlichen Nutzeraktivitäten
– ‚Trending Topics‘, Nutzersentiment, einflußreiche Teilnehmer
– Wissenschaftliche und kommerzielle Forschung
– Ein ‚computational Turn‘ zu den ‚digital Humanities‘ (David Berry)
– Ethische Fragen zu User Profiling und Urheberrecht für Daten
3. BIG DATA UND ÖFFENTLICHKEIT(EN)
• Neue Forschungsmethoden:
– Empirische, großflächige, Echtzeitforschung
– Datengetriebene, vollständige Auswertung statt kleinerer Fallbeispiele
öffentlicher Kommunikation
– Aber auch: kombiniert qualitativ/quantitative Ansätze
– Keine Internetstudien, sondern Gesellschaftsstudien mit dem Internet
(Richard Rogers)
• Neue Öffentlichkeitsideen:
– Public Spherules, Issue Publics, persönliche Öffentlichkeiten (Jan Schmidt):
vielerlei miteinander verbundene Räume innerhalb einer komplexen
Medienökologie
4. WARUM TWITTER?
• Twitter-Forschung:
– Wichtiges weltweites Netzwerk
– ~ 500 Millionen Accounts (aber wie viele davon aktiv?)
• Australien: ~ 2.2 Millionen Accounts
• Deutschland: ~ 825.000 aktive, deutschsprachige Accounts (?)
– Diverse Nutzungsverhalten: über ‚Listening‘ (Kate Crawford) und
phatische Kommunikation bis zu politischer und Krisenkoordination
– Gut entwickeltes Ökosystem von Drittanbietern (bislang)
– Starke Tradition von Nutzerinnovation: @replies, #hashtags
– Flache, offene Netzwerkstruktur:
nichtreziprokes Following, Profile öffentlich als Grundeinstellung
– Gutes API zur Erfassung (großer) Forschungsdatensätze
– Ethische Fragen begrenzt
5. NEW MEDIA AND PUBLIC COMMUNICATION:
MAPPING AUSTRALIAN USER-CREATED
CONTENT IN ONLINE SOCIAL NETWORKS
• Australian Research Council (ARC) Discovery Projekt (2010-13) – $410.000
– Queensland University of Technology, Brisbane
– Assoc. Prof. Axel Bruns, Assoc. Prof Jean Burgess
– Erste großflächige Studie australischer Social-Media-Nutzung
– Computergestützte kulturwissenschaftliche Analyse: blogs, Twitter, YouTube als vernetzte
Öffentlichkeiten
– ‚Big Data‘ und disziplinärer Wandel in der Medien-, Kultur-, und Kommunikationswissen-
schaft – Entwicklung von ‚natively digital methods‘ (Richard Rogers)
http://mappingonlinepublics.net/
6. TWITTER-FORSCHUNGSTOOLS
• Datenerfassung:
– yourTwapperkeeper + Eigenentwicklungen
• Datenverarbeitung:
– Gawk – Open-Source-, Multiplattform-, programmierbares Tool zur Verarbeitung von CSV-Dokumenten
• Statistik:
– Excel – Standard-Spreadsheetsoftware mit beschränkter Unterstützung für große Datensätze
– Tableau – kommerzielle Windowssoftware mit Optimierung für (sehr) große Datensätze
• Textanalyse:
– Leximancer – kommerzielle Multiplattformsoftware: Erfassung von Kernkonzepten aus großen Textkorpora,
Untersuchung und Visualisierung von Kookkurenz
– WordStat – kommerzielle Windowssoftware: Textanalyse und Kookurrenzdaten, die zur Visualisierung
exportier werden können
• Visualisierung:
– Gephi – Open-Source-, Multiplattformsoftware zur Netzwerkvisualisierung
8. #HASHTAGS ALS ÖFFENTLICHKEITEN
• #hashtags:
– ‚#‘ + Schlüsselwort hilft, Themen leicht erkenn- und findbar zu machen
– z.B. #ausvotes, #qldfloods, #royalwedding, #DSDS, #euro2012, #wahl2013
• Öffentlichkeiten (Publics, oft Issue Publics):
– Befassen sich mit Themen öffentlichen Interesses mit gewisser gegenseitiger Bewußtheit
– Unterschiedliche Intensität und Existenzzeiträume
– Veränderlich und durch Diskurs und Affekt der Teilnehmer konstituiert
• #hashtag-Öffentlichkeiten:
– Nicht alle Hashtags stellen Öffentlichkeiten dar;
Öffentlichkeiten werden nicht durch Twitter begrenzt
– Welche Dynamiken gelten für verschiedene Hashtag-Öffentlichkeiten?
– Was macht die Unterschiede zwischen ihnen aus?
9. #SPILL: 23. JUNI 2010, 18:00-19:00 AEST
http://mappingonlinepublics.net/2010/12/30/visualising-twitter-dynamics-in-gephi-part-2/
14. HASHTAGÖFFENTLICHKEITEN
• Forschungsfragen zur Analyse von Hashtagöffentlichkeiten:
– Ad hoc entstehende Themen und Öffentlichkeiten:
• Wie formen sich Online-Öffentlichkeiten, und wie lösen sie sich wieder auf?
• Wie interagieren sie, und welche Strukturen formen sich dabei?
• Woher beziehen sie ihre Informationen? Was teilen sie einander mit?
• Sind es immer die einschlägigen Teilnehmer?
• Wie isoliert oder vernetzt sind Online-Öffentlichkeiten?
– Hashtagöffentlichkeiten im größeren Kontext:
• Wie vergleichbar sind verschiedene Hashtag-Events?
• Gibt es grundlegende Gesetzmäßigkeiten bei der Entwicklung von Hashtags und Öffentlichkeiten?
• Wie groß/wichtig/einflußreich sind sie?
• Welche Themen führen zur Entstehung von Öffentlichkeiten auf Twitter?
• Welche Community-Strukturen entwickeln sich?
15. STATISTISCHE DATENAUSWERTUNG
• Unterscheidung von Tweet-Typen:
– Originaltweets: weder @reply noch Retweet
– Retweets: enthalten RT @user (oder ähnlich), Button-Retweets
– Echte @replies: enthalten @user, aber nicht in Retweet-Form
– URL-Tweets: enthalten URLs
• Mögliche Nutzung:
– Aktivitätsmetriken pro Hashtag
– Aktivitätsmetriken pro Zeitabschnitt (Tag, Stunde, Minute, Sekunde, ...)
– Aktivitätsmetriken pro Nutzer (oder Gruppe von Nutzern)
– ...
(Bruns & Stieglitz, 2012; 2013)
19. EINE TYPOLOGIE DER TWITTERNUTZUNG
• Wie werden Hashtags bei akuten Ereignissen genutzt?
– Gatewatching:
• Informationen zu aktuellen Entwicklungen finden und weiterleiten
(bevor die Massenmedien es tun?)
• Ad hoc-Öffentlichkeiten: viele URLs, viele Retweets
– Audiencing:
• Gemeinsame Teilnahme an großen (vorhersehbaren) Ereignissen
• Gefühlte Gemeinschaft von Teilnehmern: wenige URLs, beschränktes Retweeting
– Welche anderen Nutzungsformen gibt es?
• Fortlaufende Diskussionen (#auspol, #bundesliga, ...)
• Memes (#ghettohurricanenames, ...)
• Emotionsmarkierende Hashtags (#fail, #win, #headdesk, ...)
• Gilt dies alles gleichermaßen auch für Schlüsselworte statt Hashtags?
20. JENSEITS VON HASHTAGS
Mehrere überlappende Öffentlichkeiten / Netzwerke
– Was bestimmt ihre Formierung und Wiederauflösung?
– Wie interagieren und verweben sie sich?
– Wie sind sie mit der weiteren Medienökology verwoben?
– Welche plattformübergreifenden Öffentlichkeiten bilden sie auf Twitter ab?
• Ad Hoc-Öffentlichkeiten,
oft schnell formiert
und wieder aufgelöst
macro:
#hashtags
• persönliche Öffentlichkeiten,
langsam angesammelt
und üblicherweise stabil
meso:
follower networks
• zwischenmenschliche
Kommunikation,
ephemeral
micro:
@replies
(Bruns & Moe, 2013)
22. DER WEITERE AUSTRALISCHE KONTEXT
• Wie lassen sich einzelne Hashtagöffentlichkeiten verstehen?
– Welchen Teil der gesamten Nutzerschaft repräsentieren sie?
– Sind ihre Aktivitäten breit (viele Teilnehmer) und/oder tief (hohes Volumen)?
– Welchen Anteil am Gesamtaufkommen an australischen Tweets haben sie?
– Unterhalten sich hier schon vorher (als Follower) vernetzte Nutzer, oder schafft
der Hashtag neue Verbindungen?
• Das australische Twitter-Netzwerk:
– Snowball network crawl, ausgehend von Hashtagdatensätzen
– Australische Teilnehmer durch Zeitzonenangabe im Profil identifiziert
(sowie Textangaben zum Ort, wo sinnvoll)
– Sehr langwierige Erfassung – Profil- und Netzwerkabgriff für Millionen Nutzer
– Bisher ~ 1,06 Millionen australische Accounts identifiziert (~ 50%?)
– Netzwerkvisualisierung der Follower-Verbindungen durch Gephi
31. WEITERE FORSCHUNGSMÖGLICHKEITEN
• Erhebungen zu bekannten / vorhersehbaren Themen:
– Hashtags und Schlüsselworte
– Interaktionen (Tweets und @Replies) um bekannte Accounts: Account-
Name als Schlüsselwort
– Verbreitung von Links: Domain als Schlüsselwort
‚biggish data‘: groß für Kommunikationswissenschaftler, aber begrenzt
• Wirkliche ‚Big Data‘-Forschung:
– Fortlaufende Erfassung der öffentlichen Aktivitäten vieler oder aller jetzt
bekannten australischen Accounts
– Nutzung der Twitter-Firehose zur fortlaufenden Erfassung aller
anfallenden Tweets
– (sehr) teuer, und äußerst speicher- und rechenintensiv
34. BIG BIG DATA: DIE ERSTE MILLION TWITTER-IDS
Twitter IDs 1-1.000.000 (48.000 Accounts weiterhin existent)
Graphen: Darryl Woodford –
http://mappingonlinepublics.net/2013/04/08/the-first-million-ids-on-twitter/
37. EINE NEUE MILLION
• 1 Million neue Account-IDs (~ 422.000 existente Accounts)
• Neu registriert am 18./19. März 2013, 16:00-01:00 UTC ( 1-1,5M neue Nutzer/Tag)
http://mappingonlinepublics.net/2013/04/05/whos-joining-twitter-a-look-at-1-million-recent-ids/
38. TWITTER-ÖFFENTLICHKEITEN
• #hashtags und andere Einzelöffentlichkeiten:
– Koordinationsmechanismus für Kerndiskussion
– Relativ einfach zu erfassen und auszuwerten
– Nur ein Bruchteil der Gesamtkommunikation zum Thema
– Nützlich als Fallstudien, aber sehr wenig vergleichende Perspektiven
• Nationale / globale Twitter-Erhebungen:
– Wichtiger Kontext und Hintergrund für Hashtag-Fallstudien
– Langsame und arbeitsintensive Erfassung, nie abgeschlossen
– Sehr langfristige Perspektive, für Einzelprojekte kaum machbar / finanzierbar
– Unabdingbar für die Untersuchung von Twitter als öffentlicher
Kommunikationsraum
39. ‚BIG DATA‘ UND DIE DIGITAL HUMANITIES
• Entstehende Bedürfnisse in der Twitter-Forschung:
– Einheitliche, kompatible Methoden und Metriken für die Twitter-Analyse
Tools und Ansätze bei http://mappingonlinepublics.net/ dokumentiert
– Leistungsfähige Infrastruktur für langfristige, hochvolumige Erfassung öffentlicher
Kommunikation auf Twitter
Datenzugriffskosten erfordern starke finanzielle Unterstützung
– Möglichkeiten zur langfristigen Speicherung und Archivierung von Daten
Wichtige Rollen für Nationalbibliotheken und –archive
– Integration mit anderen Datensätzen (z.B. Massenmedieninhalten)
Fragen der Interoperabilität sind noch zu lösen
• Twitter als Testfall für Digital-Humanities-Forschung an sich:
– Weitverbreitete, offene, öffentliche Plattform für Alltagskommunikation
– Hilfsmittel zur Beobachtung gesellschaftlicher Aktivitäten in großem Maßstab durch
Internetforschung
40. ‚BIG DATA‘ UND AKADEMISCHE AUSBILDUNG
• Studenten brauchen interdisziplinäre Fähigkeiten:
– Medien und Kommunikation zum Verständnis der Medienwelt
– Mathematik und Statistik zum Umgang mit ‚Big Data‘
– Computerwissenschaft zur Entwicklung der Auswertungstools
– Kommunikationsdesign zur Entwicklung effektiver Visualisierungen
– ...
– Wo findet man Studenten mit solchen Fähigkeiten?
• Wer hat schon eine solche Kombination von Fertigkeiten?
– Wie können ihre Aktivitäten durch Institute unterstützt werden?
• So vieles ist noch im Entstehen begriffen
– Wie gehen wir mit der Kurzlebigkeit einzelner Forschungsobjekte um?
• APIs, Tools, Plattformen ändern sich oft schnell und unerwartet