1. Konferenz-Tweets:
Ansätze zur Analyse wissenschaftlicher
Kommunikation bei Twitter
Dr. Katrin Weller, M.A.
Vortrag an der Karl-Franzens-Universität Graz
09. Mai 2011
2. Fragestellung 1
Wie kann wissenschaftliche
Kommunikation bei Twitter
vermessen werden?
3. Fragestellung 2
Wie twittern
Wissenschaftler während
Fach-Konferenzen?
4. Microblogging mit Twitter
Max.
Follower 140
Zeichen
Retweet (RT)
Hash- Retweets
tags # (RT)
@-message
direct
@-
messages messag Hashtag
e
5. Einsatzbereiche von Twitter / Untersuchungsszenarien
Wissensmanagement & Naturereignisse &
Unternehmenskommunikation Katastrophen
Wahlen & Politik Werbung & Marketing
6. Einsatzbereiche von Twitter / Untersuchungsszenarien
Kanada #iranElection #EkitiElection NRW-Wahl #egypt
Wahlen & Politik
7. Einsatzbereiche von Twitter / Untersuchungsszenarien
Oklahoma
#qldfloods red river grass fire #SoCal Japan
Naturereignisse &
Katastrophen
9. Microblogging in der Wissenschaft?
Wie lassen sich wissenschaftliche Tweets erkennen?
Inhaltsbezogen
• Was sind wissenschaftliche Inhalte bei Twitter?
• Automatische Identifikation nicht möglich.
Personenbezogen
• Was ist ein Wissenschaftler?
• Wie findet man diese bei Twitter?
Formatbezogen
• Identifikation über Hashtags.
• Verlust muss in Kauf genommen werden.
10. Forschungsstand
• Untersuchungen zu Twitter in der Wissenschaft sind
i.d.R. auf Hashtags aufgebaut, insbesondere eignen
sich Konferenzhashtags.
TweetDeck
Foto:
http://www.zephoria.org/thoughts/archives/2009/11/24/spectacle_at_we.html
11. Twitter-Nutzung bei Konferenzen
Es beteiligen sich Konferenzteilnehmer und
Externe an Konferenz-Hashtag-Diskussionen.
Getwittert wird vor, während und nach der
Konferenz.
Kostenloses W-Lan und offizielle Konferenz-
Hashtags sind nicht immer verfügbar.
12. Vorgehensweise: Konferenz-Tweets auswerten
• Auswahl der Konferenzen
• Sammlung der Tweets anhand von
Datensammlung Konferenzhashtags (über
www.twapperkeeper.com)
• z.B.
Automatische • Zeitverläufe
Auswertung • Aktive Nutzer
• Nutzer-Netze
• Beurteilung von Tweet-Arten
Manuelle • Kernfrage: beziehen sich Tweets auf
Auswertung fachliche Inhalte der Konferenz?
• Verweise auf externe Web-Inhalte
13. Auswahl der Konferenzen
Konferenz World Wide Dublin Core Modern Tagung d.
Web and Language Institute for
Conference Metadata Association Enabling Geo-
Conference spatial
Scholarship
Hashtag #www2010 #dcmi2009 #mla09 #geoinst
Ort Raleigh, Seoul, Philadelphia, Charlottesville,
NC, USA Südkorea PA, USA VA, USA
Konferenz- 26.- 12. - 27. - 25. -
daten 30.04.2010 16.10.2009 30.12.2009 27.05.2010
Fachbereich Informatik Informatik (Digital) Digital
Humanities Humanities
Teilnehmer >1.000 < 500 > 1.000 < 500
Untersuchungs- 13.04.- 12.10.- 15.12.2009- 11.05.-
zeitraum 14.05.2010 23.10.2009 14.01.2010 09.06.2010
16. Beispiel für einen Zeitverlauf: #mla09
Anzahl der Tweets pro Stunde
Zeitachse: Messung in Stunden
Graphik von Cornelius Puschmann
17. Beispiel für ein Personennetzwerk basierend
auf RTs: #mla09
Graphik von Cornelius Puschmann
18. Beispiel für Retweet-Netze im Zeitverlauf
Daten für die Digital Humanities Conference 2010 (7-10 July 2010), Quelle: Puschmann, C., Weller, K., & Dröge, E. (2011). Studying
Twitter conversations as (dynamic) graphs: visualization and structural comparison. Presented at General Online Research, 14-16 March
2011, Düsseldorf, Germany. Retrieved from http://ynada.com/posters/gor11.pdf.
19. Anzahl Tweets
0
40
80
20
60
140
180
100
120
160
200
BoraZ
futureweb2010
fabien_gandon
olgag
tommyh
smalljones
apisanty
LaTerribleLiz
www2010 + WWW2010
UNCpublichealth
karenchurch
neumarcx
@boraz als „Liveticker“
juansequeda
waynesutton
mamund
gaedke
kegill
rtroncy
kevinmarks
alisohani
• Hat am meisten getwittert.
lysander07
hastac (HASTAC? 16)
munmun10
theRab
frankolken
mstrohm
xeeliz
YahooLabs
JANNAQ
ed80
ImagineInternet
jahendler
secoresearch
Tweet nicht so häufig weiterverbreitet wurde.
stevedave_l
aamonnz
aspyker
azaroth42
Beispiel für Personeninformationen: #www2010
stuwrigley
tadejtadej
w3cbrasil
Aktivität einzelner Personen: Tweetanzahl (#www2010)
clauwa
joshsh
krisztianbalog
mattroweshow
aleboz
nitya
RobVesse
tamingdata
• Bekam dadurch insgesamt viele Retweets, obwohl jeder einzelne
tksakaki
junszhao
ruby
JeniT
LocalTechWire
mantruc
vagnerdiniz
21. Personeninformationen: Beispiel #mla09
Aktivität einzelner Personen: @-Nachrichten (#mla09)
Beispiel: Brian Croxalls Abwesenheit
• Croxall konnte nicht an der Konferenz teilnehmen.
• Verfasste dazu einen Kommentar, der für viel Resonanz auf Twitter sorgte.
40
Anzahl @-Nachrichten
35
30
25
20
15
10
5
0
@-Nachrichten gesendet @-Nachrichten empfangen
23. Manuelle Auswertung: Tweets
Kategorisierungsschema für Tweet-Inhalte
1. Ebene: Inhalt 2. Ebene: Zweck
1.1 Bezug auf fachliche 2.1 Kommunikation, Kontakt
Themen der Konferenz [YES] zu anderen [COM]
1.2 Kein Bezug auf fachliche 2.2 Konferenzbezogene
Themen der Konferenz [NO] Tweets [CONF]
1.3 Nicht definierbar 2.3 Selbstbezogene Tweets
[NA] [ME]
2.4 Retweets [RT]
(nicht weiter kategorisiert)
2.5 Externe Links
[URL]
2.6 Nicht definierbar
[NA]
24. Kategorisierungsbeispiele (1. Ebene)
“#www2010 by Danah Boyd on "Privacy and
Publicity in the Context of Big Data",
http://www.danah.org/
papers/talks/2010/WWW2010.html”
“Anyone form UNC North Carolina here
today? what about lunch together tomorrow at
Convetion Center? (Alumni MA1994, Poli
Scie) #www2010”
25. Kategorisierungsbeispiele (2. Ebene)
“Good luck to all the TW people at #www2010
and #websci2010”
“the 'official' tag for Dublin Core conference in
Seoul is now #dcmi2009”
“managed to change my flights. let's hope the
cloud doesn't stand in the way now... #www2010
#w4a #ashtag”
“Very good summary! RT @pgroth: blog post up:
two themes from #www2010 -
http://wp.me/pm8cF-3c”
26. Erste Ergebnisse
Beziehen sich die Tweets auf fachliche Inhalte der
Konferenz? (ohne RTs)
2500
keine Angabe Nein Ja
Anteil an den Konferenz-Tweets
2000
155
(ohne RTs)
1500
105 938
1000
1.002
500
953
308
0
#mla09 #www2010
27. Erste Ergebnisse
Welche Arten von Tweets beziehen sich auf fachliche
Inhalte der Konferenz? (#mla09)
(ohne reine RTs, ohne f remdsprachliche Tweets)
400
350
Anzahl der Tweets (#mla09)
Fachlicher Bezug nicht beurteilbar
300
Kein fachlicher Bezug vorhanden
250
Fachlicher Bezug vorhanden
200
150
100
50
0
28. Erste Ergebnisse
Welche Arten von Tweets beziehen sich auf fachliche
Inhalte der Konferenz? (#www2010)
700
(ohne reine RTs, ohne f remdsprachliche Tweets)
Fachlicher Bezug nicht beurteilbar
Anzahl der Tweets (#www2010)
600
Kein fachlicher Bezug vorhanden
500
Fachlicher Bezug vorhanden
400
300
200
100
0
29. Erste Ergebnisse
Welchem Anteil der gesamten Tweets einer Konferenz wurden
die folgenden Kategorien zugewiesen? (Vergabe von mehreren
Kategorien pro Tweet möglich)
Anteil an den Tweets einer Konferenz
60
53,8 %
50
#www2010
(ohne Retweets) in %
#mla09
40
% 30,9 31
% %
30 27 27,3 %
21 %
20 17,8 %
15,5 % 15,4%
1098
382
439
630
386
220
428
364
10
5%
218
101
0
CONF URL COM ME NA
31. Zitationen und Referenzen
• Dokument A zitiert Dokument B = es enthält eine Referenz auf B..
• Es fließen Informationen von B nach A.
• Dokument B erhält eine Zitation und damit Reputation.
Zitierendes
Dokument A Zitiertes
Dokument B
Reputation
Zitat: „[…] alles wird
gut!“ Deshalb sage ich:
alles wird gut!
Referenz: siehe M.
Muster. In: Dokument Information
B., S. 55.
32. Zitationen und Referenzen in Twitter?
URLs im Tweet
• Referenzen nach außen („external citations“)
• Worauf wird verwiesen?
Retweets
• Zitationen – Referenzen („internal citations“)
• Fehlende Standardisierung
@-mentions
• „Just read an interesting paper by @sampleuser”
• Schwer zu identifizieren
33. URLs im Tweet
Verschiedene Zählweisen sind möglich
#www2010 #mla09
Number (and %) of tweets 1,338 (39.85%) 525 (27.22%)
including at least one URL
Number of total URLs 1,460 551
Number of unique URLs 574 199
34. Häufigkeiten von URLs: #www2010
Distribution of URLs from #www2010
45
Frequency of URL on rank n
40
#www2010
35
30
25
20
15
10
5
0
121
151
181
211
241
271
301
331
361
391
541
421
451
481
511
1
31
61
91
URL on rank n (ranked by frequency)
35. Häufigkeiten von URLs: #mla09
Distribution of URLs from #mla09
30
Frequency of URL on rank n
25 #mla09
20
15
10
5
0
113
129
145
161
177
105
121
137
153
169
185
9
1
25
41
57
65
73
81
89
97
17
33
49
URL on rank n (ranked by frequency)
36. URL Kategorisierung
Blog Conference Error Media
Press Project Publication Slides
Twitter Other
40. Retweets
Verschiedene Zählweisen
#www2010 #mla09
Automatically detected RTs: Number and 1,121 (33.38% of 414 (21.46% of
percentage of RTs in entire conference 3,358) 1,929)
dataset
∅ RTs per twitterer (automatically detected 1.24 1.12
RTs, entire conference dataset)
Retweets including at least one URL 530 207
Manually detected RTs: Number and 1,318 (39.25% of 514 (26.65% of
percentage of RTs in entire conference 3,358) 1,929)
dataset
Manually detected RTs: Number and 828 (34.13% of 269 (30.6% of 1,206)
percentage of retweets in subdataset of 2,426)
tweets during actual conference days
41. Probleme bei der Auswertung
Verschachtelte Retweets („encapsulated retweets“)
RT@kwelle RT @rene_kaiser RT @MartineDurrant:
How 20 popular websites looked when they launched -
Telegraph http://tinyurl.com/mray5q
Format RT@user ist nicht die einzige Möglichkeit:
• via@user
• Nur Text ohne Verfasser
42. Retweets nach Personen
Top 3 der viel-zitierten und viel-zitierenden Twitterer
#www2010 #www2010 #mla09 #mla09
RTs given RTs received RTs given RTs received
laterribleliz (46) boraz (85) newfacmajority (25) samplereality (49)
uncpublichealth (42) apisanty (61) ryancordell (20) briancroxall (35)
olgag (30) futureweb2010 (51) jcmeloni (13) nowviskie (33)
43. Retweet-Verteilung: #www2010
Distribution of given and received retweets for
#www2010
number of RTs recieved for or given by
90
80 RTs received
70
RTs given
person on rank n
60
50
40
30
20
10
0
1 51 101 151 201 251 301 351 401 451 501 551
person on rank n
44. Retweet-Verteilung: #mla09
Distribution of given and received retweets for #mla09
number of RTs recieved for or given by
60
50 RTs received
person on rank n
40 RTs given
30
20
10
0
1 21 41 61 81 101 121 141 161 181
person on rank n
45. Viel-zitierte Tweets: #www2010
Tweet text and ID From User RTs
a delegação brasileira presente na #www2010 acaba de w3cbrasil 24
receber a notícia: a cidade do Rio de Janeiro sediará a
Conferência #WWW2013 (ID: 13206448810)
twitter roomstreams for every conference room at #www2010 mstrohm 16
can be found at http://bit.ly/bRfE69 #302C (ID: 12881760468)
Summary of Twitter papers presented at #www2010 alisohani 11
http://is.gd/bRqBF (ID: 13268676873)
46. Viel-zitierte Tweets: #mla09
Tweet text and ID From User RTs
Hey, guys, I've blogged about "the amandafrench 18
amplification of scholarly communication":
URL No. 1 Twitter, #MLA09, @briancroxall, & such:
http://bit.ly/7SRgqZ (ID: 7221520139)
New at ProfHacker: “Academics and Social profhacker 17
Media: #mla09 and Twitter,” by
URL No. 5 @GeorgeOnline (and a bunch of you):
http://wp.me/pAGUw-19K (ID: 7566711357)
"Monopolies of Invention:" text of my #MLA09 nowviskie 16
talk on labor & IP issues in humanities
URL No. 3 collaboration: http://is.gd/5Gckz (ID:
7185970970)
47. Fazit
Erste Erkenntnisse zum Twitter-Verhalten auf wissenschaftlichen
Konferenzen.
• Twitter dient nicht ausschließlich (und nicht vorwiegend) zur Fach-
Diskussion.
• Unterschiedliche Verhaltensmuster bei verschiedenen Konferenzen.
• Meist hohe Anteile an RTs und Verweise auf URLs.
Verfeinerung und Ausweitung der Analysemethoden ist notwendig.
Vergleiche mit Twitterdaten aus anderen Anwendungsbereichen
geplant.
Diskussion erwünscht!
48. Ausblick / Fortsetzung
Work in Progress:
• Überarbeitung des Kategorisierungsschemas
• Auswertung von Tweets für als Wissenschaftler identifizierte
Personen
Mögliche weitere Forschungsbereiche:
• Identifikation von „Nutzertypen“, Netzwerkanalyse
• Analyse weiterer Konferenzen (verschiedene Fachbereiche)
• Untersuchung zusätzlicher Hashtags pro Konferenz
• Einbeziehung von Hintergrundinformationen
50. Beste Grüße aus Düsseldorf!
Dr. Katrin Weller
Abteilung für Informationswissenschaft
Institut für Sprache und Information
Heinrich-Heine-Universität Düsseldorf
Universitätsstr. 1, Geb. 23.21.04.68, 40225 Düsseldorf
E-Mail: weller@uni-duesseldorf.de
Twitter: @kwelle
Vielen Dank an die Kollegen:
@coffee001 @free5pirit @knuurps @ParrPar
Cornelius Julia Evelyn Parinaz #iwhhu #nfgwin
Puschmann Verbina Dröge Maghferat
51. Literatur (Auszüge)
• Boyd, D., Golder, S., Lotan, G.: Tweet, tweet, retweet: Conversational aspects of retweeting on Twitter. In R. H.
Sprague (Ed.), Proceedings of the 43rd Conference on System Sciences (HICSS 10), Honolulu, Hawaii, USA.
Piscataway, NJ: IEEE (2010)
• Dröge, E., Maghferat, P., Puschmann, C., Verbina, J., & Weller, K. (2011). Konferenz-Tweets: Ein Ansatz zur
Analyse der Twitter-Kommunikation bei wissenschaftlichen Konferenzen. In Proceedings of ISI 2011: Internationales
Symposium der Informationswissenschaft 2011, Hildesheim, Germany.
• Ebner, M., & Reinhardt, W. (2009). Social networking in scientific conferences: Twitter as tool for strengthen a
scientific community. In U. Cress; V. Dimitrova, & M. Specht (Eds.), Learning in the Synergy of Multiple
Disciplines.4th European Conference on Technology Enhanced Learning, EC-TEL 2009 Nice, France. Berlin:
Springer.
• Letierce, J., Passant, A., Decker, S., & Breslin, J. G. (2010). Understanding how Twitter is used to spread scientific
messages. In Proceedings of the Web Science Conference (WebSci10): Extending the Frontiers of Society On-Line,
Raleigh, NC, USA.
• Priem, J., & Costello, K. L. (2010). How and why scholars cite on Twitter. In C. Marshall; E. Toms, & A. Grove (Eds.),
Proceedings of the 73rd ASIS&T Annual Meeting on Navigating Streams in an Information Ecosystem, Pittsburgh,
PA, USA (pp. Article No. 75). New York, NY: ACM.
• Puschmann, C., Weller, K., & Dröge, E. (2011). Studying Twitter conversations as (dynamic) graphs: Visualization
and structural comparison. Poster presented at General Online Research (GOR 11), 14-16 March 2011, Düsseldorf,
Germany. Retrieved from http://ynada.com/posters/gor11.pdf.
• Ross, C., Terras, M., Warwick, C., & Welsh, A. (2011). Enabled backchannel: Conference Twitter use by digital
humanists. Journal of Documentation, 67(2), 214–237.
• Weller, K., Dröge, E., & Puschmann, C. (2011, to appear). Citation Analysis in Twitter. Approaches for Defining and
Measuring Information Flows within Tweets during Scientific Conferences. In Proceedings of the Making Sense of
Microposts Workshop (#MSM2011) at the Extended Semantic Web Conference (ESWC 2011), Crete, Greece.