SlideShare ist ein Scribd-Unternehmen logo
Twitter-Daten in der
sozialwissenschaftlichen Forschung:
Möglichkeiten und Herausforderungen
7. Oktober 2013, 13:00-18:00
8. Oktober, 9:30-15:00
GESIS Workshop, Köln

Dr. Katrin Weller, katrin.weller@gesis.org, @kwelle
Aufbau des Workshops
Ziele
• Twitter als Datenquelle kennenlernen
• Einschätzen lernen, was mit Twitter-Daten möglich ist, und was nicht
• Überblick über Herangehensweisen, Methoden, Stand der Forschung,
Schwierigkeiten
Aufbau des Workshops
1. Einführung in Twitter (mit Übung)
2. Stand der Twitter-Forschung – Ein Überblick
3. Twitter-Tools
4a. Ein erster Blick in die Twitter-Daten
4b. Twitter-Datensätze unter der Lupe
5. Studien planen – was geht, was geht nicht?
6. Übung: Studien planen
7. Diskussion: Datenqualität, Forschungsethik, rechtlicher Rahmen
Unterrichtsmaterialien
• Folien werden online zur Verfügung gestellt: http://katrinweller.net
• Weiterführende Informationen:
http://kwelle.wordpress.com/2013/08/14/some-useful-resources-forstarting-twitter-research/#more-100
• Test-Datensätze bitte nicht weitergeben!
Vorstellung
• Interessen, Forschungshintergrund
• Erwartungen
• Konkrete Pläne mit Twitterdaten?
1. Twitter – Eine Einführung

Jack Dorsey (2000): “twttr sketch”. http://www.flickr.com/photos/jackdorsey/182613360/
gegründet in 2006,
eigenständige Plattform seit
2007

Jack Dorsey (2000): “twttr sketch”. http://www.flickr.com/photos/jackdorsey/182613360/
Twitter 2013
Twitter in Zahlen
• March 2012: 140 million active users and 340 million Tweets a day
• December 2012: more than 200 million users

• USA, 2012: 15% of online adults use Twitter
• Germany, 2012: 4% of population
ARD/ZDF online Studie
http://www.ard-zdfonlinestudie.de/fileadmin
/Online12/07082012_Busemann_Gscheidl
e.pdf

@twitter:
https://twitter.c
om/twitter/stat
us/2810516522
35087872

PEW Internet:
http://www.pewinte
rnet.org/Reports/201
2/Twitter-Use2012.aspx

Twitter Blog:
http://blog.twit
ter.com/2012/0
3/twitter-turnssix.html
Twitter vs. Facebook

In Deutschland
Facebook: 72.1% (aller Internetnutzer)
Twitter: 10.5% (aller Internetnutzer)

German Social Media Consumer Report:
http://www.socialmediathinklab.com/wpcontent/uploads/2013/02/WWU_SocialMedia-Consumer-Report_0213_Ansicht.pdf

10
Randnotizen
https://2012.twitter.com/de/golden-tweets.html

• Trends 2012:
Olympics, Wahlen
in USA.
• Twitter-Nutzer mit
den meisten
Followern?
• Die meisten
Retweets:
March, 2013, http://twittercounter.com/pages/100
Und wie funktioniert das?
Tweet = max. 140 Zeichen
Followers / Followees
Kwak, H., Lee, C., Park, H., & Moon, S. (2010). What is Twitter, a Social Network or a News Media? In Proceedings of
the 19th International World Wide Web (WWW) Conference, April 26-30, 2010, Raleigh NC, USA.
Timeline
Retweet (RT)
Kooti, F., Yang, H., Cha, M., Gummadi, K.P. & Mason, W.A. (2012). The Emergence of Conventions in Online Social Networks. Proceedings of the
International Conference on Weblogs and Social Media (ICWSM 2012), Dublin.
@message (@mention)
≠ direct message
#hashtags
#hashtags

19 März 2013

6 Oktober 2013
URLs
Fotos
Nutzerprofile
Übung
Übung 1: Suchen
• Nach Tweets:
– mit und ohne Hashtag
• Nach Personen
– nach dem offiziellen Account der eigenen Institution
– nach einem verifizierten Account
• (Suchen ohne Login: https://twitter.com/search-home)
Übung 2: Account anlegen
Wer keinen eigenen Account anlegen möchte:
Twitter Test-Account: [aus den Folien gelöscht]
Passwort: [aus den Folien gelöscht]
Übung 3: Folgen
• 2-3 interessante Accounts aussuchen und diesen folgen
• Min. einem anderen Kursteilnehmer folgen
• Zurück-folgen!
Übung 4: Tweets schreiben
•
•
•
•

zuerst einen ‚normalen‘ Tweet
dann einen mit Hashtag
und dann eine @message an einen anderen Kursteilnehmer
und nun noch ein Retweet
Übung 5: Hashtag auswählen
• Einen gemeinsamen Hashtag für den Workshop festlegen
Übung 6: Trending topics
• Die Trending Topics ansehen
– Für Deutschland
– Weltweit
– Für ein anderes Land oder für die eigene Heimatstadt
Übung 7: Direct message schreiben
• Einem anderen Teilnehmer eine direct message schicken.
Fragen?
2. Stand der Forschung
Entwicklung der Twitter-Forschung
Twitter vs. Facebook

Scopus (TITLE-ABS-KEY(Twitter) AND PUBYEAR > 2006)
(TITLE-ABS-KEY(Facebook) AND PUBYEAR > 2006)
Scopus: Publikationen aus 70 Ländern

36
pointless babble?
Frühe Twitter-Forschung
• Java et al. (2007) identifizieren einen Großteil an Tweets als “daily
chatter”.

• Pear Analytics study: 40% of tweets are pointless babble (Kelly, 2009).

Java, A., Song, X., Finin, T., & Tseng, B. (2007). Why we twitter: understanding microblogging usage and communities. In
Proceedings of the 9th WebKDD and 1st SNA-KDD 2007 workshop on Web mining and social network analysis
(WebKDD/SNA-KDD ’07). ACM, New York, NY, USA, 56-65. DOI=10.1145/1348549.1348556
http://doi.acm.org/10.1145/1348549.1348556
Kelly, R. (2009). Twitter Study. Pear Analytics, retrieved from http://www.pearanalytics.com/wpcontent/uploads/2012/12/Twitter-Study-August-2009.pdf
Twitter Evolution
• Kommunikation bei Twitter entwickelt sich weiter
• @-Symbol für Antworten (Honeycutt & Herring, 2009)
• Retweets
 Neue Studien untersuchen Kommunikationsstruktur und Netzwerke

Honeycutt, C., and Herring, Susan C. (2009). Beyond microblogging: Conversation and collaboration via Twitter. Proceedings of the
Forty-Second Hawaii International Conference on System Sciences.Los Alamitos, CA IEEE Press.
De-benalizing Twitter!

Rogers, R. (2014). Debanalizing Twitter: The transformation of an object of study. In: K. Weller, A. Bruns, J.
Burgess, M. Mahrt, C. Puschmann. (Eds.): Twitter and Society (pp. ix-xxvi). New York et al.: Peter Lang.
Was wird erforscht?
Was wird erforscht?
Ausgewählte Forschungsbereiche
Politikwissenschaft
•
•
•
•

Kommunikationsverhalten v.a. im Wahlkampf
Stimmungen im Wahlkampf
Interaktionen zwischen Parteien
eDemocracy

44
Ausgewählte Forschungsbereiche
Kommunikations- und Medienwissenschaft
•
•
•
•
•

Übertragung von Methoden der Medienanalyse
Brand communication
Crisis communication
Verschiedene Zielgruppen, verschiedene Kommunikationssituationen
Rolle von @messages, RTs etc.

45
Ausgewählte Forschungsbereiche
Informatik / Informationswissenschaft
•
•
•
•

Information Retrieval in Tweets
Informationsflüsse
Netzwerke
Zitationsanalysen

46
Twitter in der sozialwissenschaftlichen
Forschung?
Weller, K. (2013). What you can get from Twitter – and what not. Presentation at ISSC’s World Social Science Forum (WSSF) 2013. Montreal, Canada. Slides: http://de.slideshare.net/katrinweller/wellerwssf-2013presentation . Extended Abstract: http://kwelle.files.wordpress.com/2013/10/wssf2013_weller_what-do-we-get-from-twitter.pdf
Publication
Huberman, B. A., Romero, D. M., & Wu, F. (2009). Social networks that matter: Twitter under the microscope. First Monday,
14(1). Retrieved from http://firstmonday.org/ojs/index.php/fm/article/view/2317/2063

[2]

Weller, K. (2013). What you can get from Twitter – and what not. Presentation at ISSC’s World Social Science Forum
(WSSF) 2013. Montreal, Canada. Slides: http://de.slideshare.net/katrinweller/weller-wssf-2013presentation .
Extended Abstract: http://kwelle.files.wordpress.com/2013/10/wssf2013_weller_what-do-we-get-from-twitter.pdf

No.
[1]

Citations
155

Data
309740 Twitter users (with followers and
tweets)

Marwick, A. E., & boyd, d. (2011). I tweet honestly, I tweet passionately: Twitter users, context collapse, and the imagined
audience. New Media & Society, 13(1), 114–133. doi:10.1177/1461444810365313

77

Interviews with 181 Twitter users

[3]

Junco, R., Heiberger, G., & Loken, E. (2011). The effect of Twitter on college student engagement and grades. Journal of
Computer Assisted Learning, 27(2), 119–132. doi:10.1111/j.1365-2729.2010.00387.x

55

Experiment with 125 students.

[4]

Yardi, S., Romero, D., Schoenebeck, G., & boyd, d. (2010). Detecting spam in a Twitter network. First Monday, 15(1). Retrieved
from http://firstmonday.org/ojs/index.php/fm/article/view/2793/2431

28

17,803 tweets from 8,616 users + 1st degree
network (3,048,360 directed edges, 631,416
unique followers, and 715,198 unique friends)

[5]

Ritter, A., Cherry, C., & Dolan, B. (2010). Unsupervised modeling of Twitter conversations. In HTL'10 Human Language
Technologies. The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics
(pp. 172–180). Stroudsburg, Pa: Association for Computational Linguistics (ACL). Retrieved from
http://dl.acm.org/citation.cfm?id=1858019

27

1.3 million Twitter conversations, with each
conversation containing between 2 and 243
posts

[6]

Petrovic, S., Osborne, M., & Lavrenko, V. (2010). Streaming first story detection with application to Twitter. In HTL'10 Human
Language Technologies. The 2010 Annual Conference of the North American Chapter of the Association for Computational
Linguistics (pp. 181–189). Stroudsburg, Pa: Association for Computational Linguistics (ACL). Retrieved from
http://dl.acm.org/citation.cfm?id=1858020

26

163,500,000 tweets

[7]

Jiang, L., Yu, M., Zhou, M., Liu, X., & Zhao, T. (2011). Target-dependent Twitter sentiment classification. In HLT '11 Proceedings
of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies:. Short papers Volume 2 (pp. 151–160). Retrieved from http://dl.acm.org/citation.cfm?id=2002492

22

20,000 tweets

[8]

Han, B., & Baldwin, T. (2011). Lexical normalisation of short text messages: makn sens a #twitter. In HLT '11 Proceedings of the
49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies. Short papers - Volume 2
(pp. 368–378). Retrieved from http://dl.acm.org/citation.cfm?id=2002520

22

449 tweets sampled from 1.5 GB of Twitter data

[9]

Gimpel, K., Schneider, N., O'Connor, B., Das, D., Mills, D., Eisenstein, J., Heilmann, M., … (2011). Part-of-speech tagging for
Twitter: Annotation, features, and experiments. In HLT '11 Proceedings of the 49th Annual Meeting of the Association for
Computational Linguistics: Human Language Technologies. Short papers - Volume 2 (pp. 42–47). Retrieved from
http://dl.acm.org/citation.cfm?id=2002747

21

1,827 annotated tweets

[10]

Schultz, F., Utz, S., & Göritz, A. (2011). Is the medium the message? Perceptions of and reactions to crisis communication via
twitter, blogs and traditional media. Public Relations Review, 37(1), 20–27. doi:10.1016/j.pubrev.2010.12.001

19

Experiment with 1677 participants

[11]

Barbosa, L., & Feng, J. (2010). Robust sentiment detection on twitter from biased and noisy data. In COLING '10 Proceedings of
the 23rd International Conference on Computational Linguistics (pp. 36–44).

19

200,000 annotated tweets

[12]

Davidov, D., Tsur, O., & Rappoport, A. (2010). Enhanced sentiment lerarning using Twitter hashtags and smileys. In COLING '10
Proceedings of the 23rd International Conference on Computational Linguistics (pp. 241–249). Retrieved from
http://dl.acm.org/citation.cfm?id=1944566.1944594

19

475,000,000 tweets

[13]

Hargittai, E., & Litt, E. (2011). The tweet smell of celebrity success: Explaining variation in Twitter adoption among a diverse
group of young adults. New Media & Society, 13(5), 824–842. doi:10.1177/1461444811405805

18

Survey with 505 young American adults

[14]

Zhou, X., Lee, W.-C., Peng, W.-C., Xie, X., Lee, R., & Sumiya, K. Measuring geographical regularities of crowd behaviors for
Twitter-based geo-social event detection, 1. doi:10.1145/1867699.1867701

18

21,623,947 geo-tagged tweets

[15]

Gruzd, A., Wellman, B., & Takhteyev, Y. (2011). Imagining Twitter as an Imagined Community. American Behavioral Scientist,
55(10), 1294–1318. doi:10.1177/0002764211409378

17

One person’s Twitter network (652 followers,
114 followings).
3,112 tweets.

[16]

Johnson, K. A. (2011). The effect of Twitter posts on students’ perceptions of instructor credibility. Learning, Media and
Technology, 36(1), 21–38. doi:10.1080/17439884.2010.534798

16

Experiments with 120 undergrad students

[17]

Alina Mungiu-Pippidi, & Igor Munteanu. (2009). Moldova's "Twitter Revolution". Journal of Democracy, 20(3), 136–142.
doi:10.1353/jod.0.0102

16

none

[18]

Larsson, A. O., & Moe, H. (2012). Studying political microblogging: Twitter users in the 2010 Swedish election campaign. New
Media & Society, 14(5), 729–747. doi:10.1177/1461444811422894

15

99,832 tweets

[19]

Lasorsa, D. L., Lewis, S. C., & Holton, A. E. (2012). Normalizing Twitter: Journalism practice in an emerging communication
space. Journalism Studies, 13(1), 19–36. doi:10.1080/1461670X.2011.571825

15

22,248 tweets

[20]

Takhteyev, Y., Gruzd, A., & Wellman, B. (2012). Geography of Twitter networks. Social Networks, 34(1), 73–81.
doi:10.1016/j.socnet.2011.05.006

14

481,248 tweets, 1,953 user pairs
Methoden?
Angewandte Methoden in den meistzitierten Publikationen:
• Interviews mit Twitter-Nutzern,
• Experimente,
• Quantitative Analysen von Tweets und deren Eigenschaften,
• Netzwerkananlysen,
• Linguistische Analysen, z.B. word clustering, event detection,
sentiment analysis,
• Inhaltsanalysen von Tweets.
 Bisher eher selten mehrere in Kombination
Methoden
In der Forschung: viele Case Studies, wenig methodische Standards.
Standard-Metriken?
• Anzahl der Tweets
• Anzahl der Nutzer mit min. einem Tweet
• Tweets pro Nutzer

• Structural Analysis of Tweets:
– Original tweets, RTs, (modified RTs), @message
– Tweets mit URLs

Bruns, A., & Stieglitz, S. (2012). Quantitative Approaches to Comparing Communication Patterns on Twitter. Journal
of Technology in Human Services, 30(3-4), 160–185. doi:10.1080/15228835.2012.744249
52
Anzahl der Tweets pro Stunde

Beispiel für einen Zeitverlauf:
#mla09

Zeitachse: Messung in Stunden
Graphik von Cornelius Puschmann
Beispiel für ein Personennetzwerk
basierend auf RTs – im Zeitverlauf

Puschmann, C., Weller, K., Dröge, E. (2011):
Studying Twitter Conversations as
(Dynamic) Graphs: Visualization and
Structural Comparison. Poster at General
Online Research (GOR 11), Düsseldorf.
http://ynada.com/posters/gor11.pdf
Beispiel für Personeninformationen:
#www2010

Anzahl Tweets

Aktivität einzelner Personen: Tweetanzahl (#www2010)
200
180
160
140
120
100
80
60
40
20
0

Dröge, E., Maghferat, P., Puschmann, C., Verbina, J., & Weller, K. (2011). Konferenz-Tweets. Ein Ansatz zur Analyse der TwitterKommunikation bei wisseschaftlichen Konferenzen. In J. Griesbaum, T. Mandl, C. Womser-Hacker (Eds.), Information und Wissen:
global, sozial und frei? Proceedings des 12. Internationalen Symposiums für Informationswissenchaft (pp. 98–110). Boizenburg: VWH.
Personeninformationen
Aktivität einzelner Personen: @-Nachrichten (#mla09)

Anzahl @-Nachrichten

40

35
30
25
20
15
10
5
0
@-Nachrichten gesendet

@-Nachrichten empfangen
Inhaltsanalyse
• CAQDAS Computer-Assisted Qualitative Data AnalysiS
– (z.B. MAXQDA, QDAMiner, ATLAS.ti, Qualrus, Nvivo)
– Speech Act Analyse
– Statistische Auswertungen

Einspänner, J., Dang-Anh, M., & Thimm, C. (2014). Computer-assisted content analysis of Twitter data. In: K. Weller,
A. Bruns, J. Burgess, M. Mahrt, C. Puschmann. (Eds.): Twitter and Society (pp. 97-108). New York et al.: Peter Lang.

57
Sentiment Analyse
Automatische Berechnung von emotionalen Tonalitäten von
Tweets.
Benötigt werden Wörterbücher mit Sentiment-Werten, z.B. ANEW.
 Generell mit Vorsicht zu betrachten.
 Für deutsche Tweets besonders kritisch.

Thelwall, M. (2014). Sentiment analysis and time series with Twitter. In: K. Weller, A. Bruns, J. Burgess, M.
Mahrt, C. Puschmann. (Eds.): Twitter and Society (pp. 83-96). New York et al.: Peter Lang.

58
Besondere Fallstudien
The Australian Twitter-Sphere

Von Axel Bruns:
http://www.cci.edu.au/node/1362
60
Rhythm of a City

Siehe http://engineering.twitter.com/2012/06/studying-rapidly-evolving-user.html
61
Stimmungen in US-Tweets

Pulse of the Nation: http://www.ccs.neu.edu/home/amislove/twittermood/

62
63

http://www.jeuneafrique.com/Article/ARTJAWEB20130215165826/int
ernet-libreville-accra-addis-abebareseaux-sociaux-les-capitalesafricaines-de-twitter-quartier-par-quartier.html#Tunis
Siehe:
Bruns, Axel; Weller, Katrin; Harrington, Stephen (2014): Twitter and Sports: Football Fandom in Emerging and Established Markets. In:
80000
Weller, Katrin; Bruns, Axel; Burgess, Jean; Mahrt, Merja; Puschmann, Cornelius (Hrsg.): Twitter and Society, New Yort et al.: Peter Lang,
S. 263-280
Weller, Katrin; Bruns, Axel (2013): Das Spiel dauert 140 Zeichen: Wie deutsche Fußballvereine Twitter für Marketing und Fan70000
Kommunikation entdecken. In: Griesbaum, Joachim; Heuwing, Ben; Ruppenhofer, Josef; Werner, Katrin (Hrsg.): HiER 2013. Proceedings

BVB Dortmund 09 II (@BVB)

des 8. Hildesheimer Evaluierungs- und Retrievalworkshop, Hildesheim: Universität Hildesheim, S. 119-131

60000
FC Bayern München (@BayMuenchen)

number of followers

50000

40000

SV Werder Bremen II (@werderbremen)

Hamburger SV (@HSV)
30000
FC Schalke 04 II (@s04, official)
1. FC Köln (@fckoeln)
20000

SV Werder Bremen I (@Werder_Bremen)
Borussia Mönchengladbach
(@VfLBorussia)

FC Schalke 04 I (@FCSchalke04, inofficial)
10000

0

Jun 11

Jul 11

Aug 11

Sep 11

Oct 11

Nov 11

Dec 11

Jan 12

Feb 12

Mar 12

Apr 12

May 12

Jun 12

month

1. FC Augsburg (@FCAugsburg)
1. FC Nürnberg (@1_fc_nuernberg)
Bayer 04 Leverkusen (@bayer04fussball)
BVB Dortmund 09 II (@BVB)
FC Schalke 04 I (@FCSchalke04, inofficial)
Hannover 96 II (@hannover96)
SV Werder Bremen I (@Werder_Bremen)

1. FC Kaiserslautern (@Rote_Teufel)*
1. FSV Mainz 05 (1FSVMainz05)
Borussia Mönchengladbach (@VfLBorussia)
FC Bayern München (@BayMuenchen)
Hamburger SV (@HSV)
Hertha BSC Berlin (@HerthaBSC)*
SV Werder Bremen II (@werderbremen)

1. FC Köln (@fckoeln)
1899 Hoffenheim (achtzehn99)
BVB Dortmund 09 I (@BVBDortmund09)
FC Schalke 04 II (@s04, official)
Hannover 96 I (@ichbin96)
SC Freiburg (@sc_freiburg)
64
VfB Stuttgart (@VfB)
Bilder auf Twitter

http://www.guardian.co.uk/uk/2011/dec/07/twitter-riots-how-news-spread
Siehe auch: Vis, F., Faulkner, S., Parry, K., Manyukhina, Y., & Evans, L. (2014). Twitpic-ing the news. Analysing images
shared during the 2011 U.K. Riots. In: K. Weller, A. Bruns, J. Burgess, M. Mahrt, C. Puschmann (Eds), Twitter and Society
(pp. 385-398). New York et al: Peter Lang.

65
Bruns, A., & Burgess, J. (2012). Notes towards the scientific study of Twitter. In Tokar, A., Beurskens, M., Keuneke,
S., Mahrt, M., Peters, I., Puschmann, C., van Treeck, T., & Weller, K. (Eds.). (2012). Science and the Internet (pp. 159169). Düsseldorf: Düsseldorf University Press http://nfgwin.uni-duesseldorf.de/sites/default/files/Bruns.pdf

66
Diskussion
Welche Themenbereiche/Methoden interessieren besonders?
Eigene Erfahrungen/ Anknüpfungspunkte?
3. Tools
TweetDeck
https://about.twitter.com/products/tweetdeck
Tweetdeck online
http://www.tweetdeck.com/
TOPSY
Übung
http://topsy.com
- Bei Topsy suchen nach a) einem Nutzer, b) einem Stichwort, c) einem
Hashtag.
- Bei Topsy Analytics zwei Nutzer und zwei Hashtags vergleichen.
- Auffälligkeiten?
Vorsicht: Aktivitätskennwerte
•
•
•
•
•

Klout (siehe Abbildung)
Tweetstats.com
Twitalyzer
Twittercounter
…
Co-tweeting * follower recommendation * automatic tweets *
twitterwalls * data visualization * URL monitoring * follower
visualization * communities * hashtag meanings * trends
Twitter Walls
Foto: http://www.zephoria.org/thoughts/archives/2009/11/24/spectacle_at_we.html
Tools zur Datensammlung
Wie erhält man die Daten?

API
https://dev.twitter.com/docs/api/1.1
https://dev.twitter.com/blog
79
Datensammlung?
Herausforderungen:

Archivierung in Echtzeit

Eingeschränkte Anteile

80
Twitter APIs
•
•
•
•

API = Application Programming Interface
Zugang, um Daten für Anwendungen/Apps zu verwenden
Nicht explizit für die wissenschaftliche Nutzung vorgesehen
Streaming API, Rest APIs, Search API

Gaffney, D., & Puschmann, C. (2014). Data collection on Twitter. In A. Bruns, K. Weller, J. Burgess, M. Mahrt
& C. Puschmann (Eds.), Twitter and Society (pp. 55-67). New York, NY: Peter Lang.
81
Twitter APIs
STREAMING API
- push-basiert, Live-Stream
- Public stream vs. User stream
- Forscher brauchen Tools, die eine Verbindung zu diesem Stream aufrecht
erhalten.

82
Twitter APIs
REST API
• Eingeschränkte Anzahl Anfragen pro Stunde
• Social graph data (wer folgt wem)
• Trending topics
• Und vieles mehr

https://dev.twitter.com/docs/using-search
83
Twitter APIs
•
•
•


Nicht explizit für Wissenschaftler entwickelt
Nicht rückwirkend zugänglich
Nicht vollständig
Änderungen möglich
https://dev.twitter.com/console

Eigene User-ID finden:
http://www.idfromuser.com/
Twitter-Daten erheben?
•
•
•
•
•
•

YourTwapperkeeper
Per RSS-Feed (z.B. Google reader, Thunderbird)
Drittanbieter ($)
Desktopbasierte Programme
Eigene Programme schreiben
Gnip / DataSift
YourTwapperkeeper
http://134.99.116.228/yourtwapperkeeper (Password protected)
YourTwapperkeeper
Tweet Archivist
TweetArchivist
Übung:
Verschiedene Suchen ausprobieren:
http://www.tweetarchivist.com/SetLanguage
NodeXL

http://nodexl.codeplex.com/
NodeXL
GNIP
Rechtlicher Rahmen

Twitter‘s
Nutzungsbedingungen

Datenschutzbestimmungen
Rechtlicher Rahmen
• Terms of Services: https://twitter.com/tos
• Twitter Privacy Policy: https://twitter.com/privacy
• Developer’s Rules of the Road: https://dev.twitter.com/terms/api-terms
„Lessons learnt“
1.

Man muss die TwitterDynamik kennen, um
mit Twitter-Daten
arbeiten zu können.
2.
Twitter als Moving
Target: alles kann sich
verändern!
3.
Ideal: Erst die
Forschungsfrage, dann
die Datenerhebung.
4.
Aber: Twitter-Daten
immer rechtzeitig
(live) erheben!
5.
Man erhält i.d.R. nur
einen Ausschnitt aus
Twitter
Diskussion
• Erste Selbsteinschätzung: wo könnten sich Twitter-Daten für meine
Forschungsfrage lohnen?
• Was muss ich noch wissen, bevor ich tatsächlich entscheiden kann, ob ich
mit Twitter-Daten arbeiten möchte?
Allgemein:
• Fragen / Wünsche / Anregungen
4. Twitter Daten unter der Lupe
Was kommt zuerst?
• Forschungsfrage?
• Daten?
Fallstudie: Twitter bei der
Landtagswahl NRW
Übung:
- Notieren, welche Fragestellungen in diesem Zusammenhang interessant
sein könnten.
- Überlegen, welche Daten dafür benötigt werden würden.
Dateien
#ltwnrw tweets
Was fällt auf?
5. Studien planen
Forschungsablauf

Studie
planen

Daten
erheben

Daten
auswerten

(Daten
archivieren)
Studien planen
•
•
•
•

Was soll untersucht werden?
Warum brauche ich dafür Twitter-Daten?
Welche Art Twitter-Daten benötige ich?
Vorab-Recherche!
Kriterien zur Datenerhebung
Typischerweise:
- Tweets eines bestimmten Nutzers
- Tweets, die einen Nutzer erwähnen
- Tweets, die ein Wort (Zeichenkette) oder ein Hashtag enthalten
Diverse weitere, z.B.
- Anzahl und Namen der Follower eines Accounts
- Tweets, die eine bestimmte URL (domain) enthalten

115
Datensammlung

Nutzerbezogen

Themenbezogen
Probleme
•
•
•
•

Wie lange sollen Daten gesammelt werden?
Mit welcher Technik sollen Daten gesammelt werden?
Mit welchen Suchkriterien sollen Daten gesammelt werden?
Wie sollen die Daten später ausgewertet werden?
Auswertung

Inhaltsanalysen

Quantitative
Analysen
Technische Feinheiten
•
•
•
•
•

Manuelle vs. Button Retweets
URLs erkennen und auflösen
@messages vs. @mentions
Informationen über einzelne Twitter-Nutzer herausfinden
Hashtag vs. Volltextsuche
Datenbereinigung
• Mehrere Datensätze zusammenfügen und dabei Dubletten entfernen.
• ‚False positives‘ entfernen (z.B. bvb)
• Ggf. Dateiformate für die Bearbeitung in Analysetools anpassen
Datenmanagement
• Versionierung – Metadaten
• Dokumentation des Erhebungs- und Bereinigungsprozesses
• Sicherungskopien
6. Übung: Studien planen
Studiendesign
Entweder bereits vorhandene Fragestellung – oder gemeinsam Fragen
erarbeiten.
• Ausgehend von Fragestellung: welche Daten werden benötigt, wie können
diese erhoben werden, was muss beachtet werden?
• Welche Probleme können auftreten?
 Kurzpräsentation des eigenen Ansatzes
7. Diskussion
Big Data vs. Sinnvolle
Forschungsfragen

125
Was ist ein Link, Follower,
Tweet etc. wert?
 Wie kann man NutzerAktionen interpretieren?
126
Repräsentativität?
beeinflusst von:
• Nutzerzahlen
• Zeitpunkt/Dauer der Datenerhebung
• Datenauswahl

127
Verlässlichkeit
• Verifizierte Accounts
• Verifizierte Inhalte?
• (Datenausfälle)

128
129
Forschungsethik
• Anonymisierung/Pseudonymisierung möglich bzw. nötig?
• Richtlinien für den Umgang mit Personendaten?
Aktuelle Hinweise
• So wenig personenbezogene Daten wie möglich teilen
• Tweet-Sammlungen nicht öffentlich zur Verfügung stellen
today vs. tomorrow

131
Reproduzierbarkeit


Die gleichen Daten zweimal erheben?



Mit bestehenden Datensätzen arbeiten?

132
Fazit?
Danke für die Teilnahme!

Weitere ähnliche Inhalte

Was ist angesagt?

interview skills ppt
interview skills pptinterview skills ppt
interview skills ppt
Ambrish Rai
 
Introduction to Facebook
Introduction to FacebookIntroduction to Facebook
Introduction to Facebook
Sophia Guevara
 
Twitter presentation
Twitter presentationTwitter presentation
Twitter presentation
Maria Pitsaki
 
Effective interviewing techniques
Effective interviewing techniquesEffective interviewing techniques
Effective interviewing techniques
kamranlearning
 

Was ist angesagt? (20)

Twitter 101 - an introduction to Twitter
Twitter 101  - an introduction to TwitterTwitter 101  - an introduction to Twitter
Twitter 101 - an introduction to Twitter
 
Easy Talk 4 Teens - Advanced : Elevator Speech
Easy Talk 4 Teens - Advanced : Elevator SpeechEasy Talk 4 Teens - Advanced : Elevator Speech
Easy Talk 4 Teens - Advanced : Elevator Speech
 
Social Media Training
Social Media Training Social Media Training
Social Media Training
 
Twitexpose
TwitexposeTwitexpose
Twitexpose
 
Social Media
Social MediaSocial Media
Social Media
 
interview skills ppt
interview skills pptinterview skills ppt
interview skills ppt
 
Social Media & Networking - Boon or Bane?
Social Media & Networking - Boon or Bane?Social Media & Networking - Boon or Bane?
Social Media & Networking - Boon or Bane?
 
The Importance of Social Media in Today's Environment
The Importance of Social Media in Today's EnvironmentThe Importance of Social Media in Today's Environment
The Importance of Social Media in Today's Environment
 
Introduction to Facebook
Introduction to FacebookIntroduction to Facebook
Introduction to Facebook
 
Twitter: For Beginners
Twitter: For BeginnersTwitter: For Beginners
Twitter: For Beginners
 
Social Media for Research Communication
Social Media for Research CommunicationSocial Media for Research Communication
Social Media for Research Communication
 
Social Networks - The Good and the Bad
Social Networks - The Good and the BadSocial Networks - The Good and the Bad
Social Networks - The Good and the Bad
 
Twitter
TwitterTwitter
Twitter
 
Persuasion in Social Media
Persuasion in Social MediaPersuasion in Social Media
Persuasion in Social Media
 
Twitter presentation
Twitter presentationTwitter presentation
Twitter presentation
 
Social networking
Social networkingSocial networking
Social networking
 
Social Networking: Use & Impact
Social Networking: Use & ImpactSocial Networking: Use & Impact
Social Networking: Use & Impact
 
Social Media101
Social Media101Social Media101
Social Media101
 
How to prepare for an interview
How to prepare for an interview How to prepare for an interview
How to prepare for an interview
 
Effective interviewing techniques
Effective interviewing techniquesEffective interviewing techniques
Effective interviewing techniques
 

Andere mochten auch

Andere mochten auch (6)

Twitter-Daten in der sozialwissenschaftlichen Forschung – Möglichkeiten und H...
Twitter-Daten in der sozialwissenschaftlichen Forschung – Möglichkeiten und H...Twitter-Daten in der sozialwissenschaftlichen Forschung – Möglichkeiten und H...
Twitter-Daten in der sozialwissenschaftlichen Forschung – Möglichkeiten und H...
 
Twitter research overview
Twitter research overviewTwitter research overview
Twitter research overview
 
"Die Vögel" - Ein Twitter Vortrag, Bjoern Eichstaedt
"Die Vögel" - Ein Twitter Vortrag, Bjoern Eichstaedt"Die Vögel" - Ein Twitter Vortrag, Bjoern Eichstaedt
"Die Vögel" - Ein Twitter Vortrag, Bjoern Eichstaedt
 
Studie "Intranet – Marktübersicht und Trends 2015"
Studie "Intranet – Marktübersicht und Trends 2015"Studie "Intranet – Marktübersicht und Trends 2015"
Studie "Intranet – Marktübersicht und Trends 2015"
 
Die richtige Forschungsfrage finden
Die richtige Forschungsfrage findenDie richtige Forschungsfrage finden
Die richtige Forschungsfrage finden
 
2017 Digital Yearbook
2017 Digital Yearbook2017 Digital Yearbook
2017 Digital Yearbook
 

Ähnlich wie Twitter-Daten in der sozialwissenschaftlichen Forschung

Quantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media DatenQuantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media Daten
Katrin Weller
 
Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...
Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...
Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...
Kathi Woitas
 
Social Media im pädagogischen Alltag
Social Media im pädagogischen AlltagSocial Media im pädagogischen Alltag
Social Media im pädagogischen Alltag
Jakob Steinschaden
 
SocialMedia Schnittstellenmeeting
SocialMedia Schnittstellenmeeting SocialMedia Schnittstellenmeeting
SocialMedia Schnittstellenmeeting
Jonas Konrad
 

Ähnlich wie Twitter-Daten in der sozialwissenschaftlichen Forschung (20)

Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herau...
Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herau...Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herau...
Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herau...
 
Das Web als Infrastruktur und Werkzeugkasten für die Wissenschaft
Das Web als Infrastruktur und  Werkzeugkasten für die WissenschaftDas Web als Infrastruktur und  Werkzeugkasten für die Wissenschaft
Das Web als Infrastruktur und Werkzeugkasten für die Wissenschaft
 
Forschungsjournale im Netz: neue Publikations- und Kommunikationswege über Tw...
Forschungsjournale im Netz: neue Publikations- und Kommunikationswege über Tw...Forschungsjournale im Netz: neue Publikations- und Kommunikationswege über Tw...
Forschungsjournale im Netz: neue Publikations- und Kommunikationswege über Tw...
 
eVideo Online-Konferenz 2009: Twitter & Co.
eVideo Online-Konferenz 2009: Twitter & Co.eVideo Online-Konferenz 2009: Twitter & Co.
eVideo Online-Konferenz 2009: Twitter & Co.
 
Socialmedia für die Recherche 2018
Socialmedia für die Recherche 2018Socialmedia für die Recherche 2018
Socialmedia für die Recherche 2018
 
Interaktion und Partizipation in digitalen Räumen in der Hochschullehre
Interaktion und Partizipation in digitalen Räumen in der HochschullehreInteraktion und Partizipation in digitalen Räumen in der Hochschullehre
Interaktion und Partizipation in digitalen Räumen in der Hochschullehre
 
Unsere forschungskultur neu denken
Unsere forschungskultur neu denkenUnsere forschungskultur neu denken
Unsere forschungskultur neu denken
 
Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...
Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...
Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...
 
Social Software in Forschung und Lehre
Social Software in Forschung und LehreSocial Software in Forschung und Lehre
Social Software in Forschung und Lehre
 
Quantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media DatenQuantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media Daten
 
Impulsstatement barcamp wissenschaft 20_forschung neu denken
Impulsstatement barcamp wissenschaft 20_forschung neu denkenImpulsstatement barcamp wissenschaft 20_forschung neu denken
Impulsstatement barcamp wissenschaft 20_forschung neu denken
 
Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...
Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...
Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...
 
Kommunikationswissenschaftliche Onlineforschung
Kommunikationswissenschaftliche OnlineforschungKommunikationswissenschaftliche Onlineforschung
Kommunikationswissenschaftliche Onlineforschung
 
Schneller, Besser, Weiter - Social Media in der Forschung nutzen
Schneller, Besser, Weiter - Social Media in der Forschung nutzenSchneller, Besser, Weiter - Social Media in der Forschung nutzen
Schneller, Besser, Weiter - Social Media in der Forschung nutzen
 
Social Media im pädagogischen Alltag
Social Media im pädagogischen AlltagSocial Media im pädagogischen Alltag
Social Media im pädagogischen Alltag
 
Soziale Medien in der Wissenschaftskommunikation
Soziale Medien in der WissenschaftskommunikationSoziale Medien in der Wissenschaftskommunikation
Soziale Medien in der Wissenschaftskommunikation
 
Vortrag digiPH Twitter
Vortrag digiPH TwitterVortrag digiPH Twitter
Vortrag digiPH Twitter
 
SocialMedia Schnittstellenmeeting
SocialMedia Schnittstellenmeeting SocialMedia Schnittstellenmeeting
SocialMedia Schnittstellenmeeting
 
Wissenschaft 2.0 und offene Forschungsmethoden vermitteln: Der MOOC Science 2...
Wissenschaft 2.0 und offene Forschungsmethoden vermitteln: Der MOOC Science 2...Wissenschaft 2.0 und offene Forschungsmethoden vermitteln: Der MOOC Science 2...
Wissenschaft 2.0 und offene Forschungsmethoden vermitteln: Der MOOC Science 2...
 
Social Media Analytics und individualisierte Kommunikation
Social Media Analytics und individualisierte KommunikationSocial Media Analytics und individualisierte Kommunikation
Social Media Analytics und individualisierte Kommunikation
 

Mehr von Katrin Weller

Mehr von Katrin Weller (20)

Weller pleasures+perils social media
Weller pleasures+perils social mediaWeller pleasures+perils social media
Weller pleasures+perils social media
 
Weller social media as research data_psm15
Weller social media as research data_psm15Weller social media as research data_psm15
Weller social media as research data_psm15
 
Fail ir16 intro
Fail ir16 introFail ir16 intro
Fail ir16 intro
 
Fail! workshop introduction at Web Science Conference
Fail! workshop introduction at Web Science ConferenceFail! workshop introduction at Web Science Conference
Fail! workshop introduction at Web Science Conference
 
Challenges in-archiving-twitter
Challenges in-archiving-twitterChallenges in-archiving-twitter
Challenges in-archiving-twitter
 
The digital traces of user generated content
The digital traces of user generated contentThe digital traces of user generated content
The digital traces of user generated content
 
The Hidden Data of Social Media Rearch_CSS-winter-symposium
The Hidden Data of Social Media Rearch_CSS-winter-symposiumThe Hidden Data of Social Media Rearch_CSS-winter-symposium
The Hidden Data of Social Media Rearch_CSS-winter-symposium
 
Publishing with impact
Publishing with impactPublishing with impact
Publishing with impact
 
"I always feel it must be great to be a hacker"
"I always feel it must be great to be a hacker" "I always feel it must be great to be a hacker"
"I always feel it must be great to be a hacker"
 
Hidden Data of Social Media Research
Hidden Data of Social Media ResearchHidden Data of Social Media Research
Hidden Data of Social Media Research
 
Big data - Gewinnung, Auswertung und Darstellung großer Mengen onlinegenerier...
Big data - Gewinnung, Auswertung und Darstellung großer Mengen onlinegenerier...Big data - Gewinnung, Auswertung und Darstellung großer Mengen onlinegenerier...
Big data - Gewinnung, Auswertung und Darstellung großer Mengen onlinegenerier...
 
What’s new in social media research?
What’s new in social media research?What’s new in social media research?
What’s new in social media research?
 
Social Media Research Methods
Social Media Research MethodsSocial Media Research Methods
Social Media Research Methods
 
The pleasures and perils of studying Twitter
The pleasures and perils of studying TwitterThe pleasures and perils of studying Twitter
The pleasures and perils of studying Twitter
 
Friends or Followers. German Soccer Clubs and Their Fans on Twitter
Friends or Followers. German Soccer Clubs and Their Fans on TwitterFriends or Followers. German Soccer Clubs and Their Fans on Twitter
Friends or Followers. German Soccer Clubs and Their Fans on Twitter
 
What do we get from Twitter - and what not?
What do we get from Twitter - and what not?What do we get from Twitter - and what not?
What do we get from Twitter - and what not?
 
Tweeting the news
Tweeting the news Tweeting the news
Tweeting the news
 
Diata12 opening: Twitter research in Düsseldorf
Diata12 opening: Twitter research in DüsseldorfDiata12 opening: Twitter research in Düsseldorf
Diata12 opening: Twitter research in Düsseldorf
 
Twitter tipps online11
Twitter tipps online11Twitter tipps online11
Twitter tipps online11
 
Diata11_opening
Diata11_openingDiata11_opening
Diata11_opening
 

Twitter-Daten in der sozialwissenschaftlichen Forschung

  • 1. Twitter-Daten in der sozialwissenschaftlichen Forschung: Möglichkeiten und Herausforderungen 7. Oktober 2013, 13:00-18:00 8. Oktober, 9:30-15:00 GESIS Workshop, Köln Dr. Katrin Weller, katrin.weller@gesis.org, @kwelle
  • 2. Aufbau des Workshops Ziele • Twitter als Datenquelle kennenlernen • Einschätzen lernen, was mit Twitter-Daten möglich ist, und was nicht • Überblick über Herangehensweisen, Methoden, Stand der Forschung, Schwierigkeiten
  • 3. Aufbau des Workshops 1. Einführung in Twitter (mit Übung) 2. Stand der Twitter-Forschung – Ein Überblick 3. Twitter-Tools 4a. Ein erster Blick in die Twitter-Daten 4b. Twitter-Datensätze unter der Lupe 5. Studien planen – was geht, was geht nicht? 6. Übung: Studien planen 7. Diskussion: Datenqualität, Forschungsethik, rechtlicher Rahmen
  • 4. Unterrichtsmaterialien • Folien werden online zur Verfügung gestellt: http://katrinweller.net • Weiterführende Informationen: http://kwelle.wordpress.com/2013/08/14/some-useful-resources-forstarting-twitter-research/#more-100 • Test-Datensätze bitte nicht weitergeben!
  • 5. Vorstellung • Interessen, Forschungshintergrund • Erwartungen • Konkrete Pläne mit Twitterdaten?
  • 6. 1. Twitter – Eine Einführung Jack Dorsey (2000): “twttr sketch”. http://www.flickr.com/photos/jackdorsey/182613360/
  • 7. gegründet in 2006, eigenständige Plattform seit 2007 Jack Dorsey (2000): “twttr sketch”. http://www.flickr.com/photos/jackdorsey/182613360/
  • 9. Twitter in Zahlen • March 2012: 140 million active users and 340 million Tweets a day • December 2012: more than 200 million users • USA, 2012: 15% of online adults use Twitter • Germany, 2012: 4% of population ARD/ZDF online Studie http://www.ard-zdfonlinestudie.de/fileadmin /Online12/07082012_Busemann_Gscheidl e.pdf @twitter: https://twitter.c om/twitter/stat us/2810516522 35087872 PEW Internet: http://www.pewinte rnet.org/Reports/201 2/Twitter-Use2012.aspx Twitter Blog: http://blog.twit ter.com/2012/0 3/twitter-turnssix.html
  • 10. Twitter vs. Facebook In Deutschland Facebook: 72.1% (aller Internetnutzer) Twitter: 10.5% (aller Internetnutzer) German Social Media Consumer Report: http://www.socialmediathinklab.com/wpcontent/uploads/2013/02/WWU_SocialMedia-Consumer-Report_0213_Ansicht.pdf 10
  • 11. Randnotizen https://2012.twitter.com/de/golden-tweets.html • Trends 2012: Olympics, Wahlen in USA. • Twitter-Nutzer mit den meisten Followern? • Die meisten Retweets:
  • 13. Und wie funktioniert das? Tweet = max. 140 Zeichen
  • 14. Followers / Followees Kwak, H., Lee, C., Park, H., & Moon, S. (2010). What is Twitter, a Social Network or a News Media? In Proceedings of the 19th International World Wide Web (WWW) Conference, April 26-30, 2010, Raleigh NC, USA.
  • 15.
  • 17. Retweet (RT) Kooti, F., Yang, H., Cha, M., Gummadi, K.P. & Mason, W.A. (2012). The Emergence of Conventions in Online Social Networks. Proceedings of the International Conference on Weblogs and Social Media (ICWSM 2012), Dublin.
  • 21. URLs
  • 22. Fotos
  • 25. Übung 1: Suchen • Nach Tweets: – mit und ohne Hashtag • Nach Personen – nach dem offiziellen Account der eigenen Institution – nach einem verifizierten Account • (Suchen ohne Login: https://twitter.com/search-home)
  • 26. Übung 2: Account anlegen Wer keinen eigenen Account anlegen möchte: Twitter Test-Account: [aus den Folien gelöscht] Passwort: [aus den Folien gelöscht]
  • 27. Übung 3: Folgen • 2-3 interessante Accounts aussuchen und diesen folgen • Min. einem anderen Kursteilnehmer folgen • Zurück-folgen!
  • 28. Übung 4: Tweets schreiben • • • • zuerst einen ‚normalen‘ Tweet dann einen mit Hashtag und dann eine @message an einen anderen Kursteilnehmer und nun noch ein Retweet
  • 29. Übung 5: Hashtag auswählen • Einen gemeinsamen Hashtag für den Workshop festlegen
  • 30. Übung 6: Trending topics • Die Trending Topics ansehen – Für Deutschland – Weltweit – Für ein anderes Land oder für die eigene Heimatstadt
  • 31. Übung 7: Direct message schreiben • Einem anderen Teilnehmer eine direct message schicken.
  • 33. 2. Stand der Forschung
  • 35. Twitter vs. Facebook Scopus (TITLE-ABS-KEY(Twitter) AND PUBYEAR > 2006) (TITLE-ABS-KEY(Facebook) AND PUBYEAR > 2006)
  • 36. Scopus: Publikationen aus 70 Ländern 36
  • 37.
  • 39. Frühe Twitter-Forschung • Java et al. (2007) identifizieren einen Großteil an Tweets als “daily chatter”. • Pear Analytics study: 40% of tweets are pointless babble (Kelly, 2009). Java, A., Song, X., Finin, T., & Tseng, B. (2007). Why we twitter: understanding microblogging usage and communities. In Proceedings of the 9th WebKDD and 1st SNA-KDD 2007 workshop on Web mining and social network analysis (WebKDD/SNA-KDD ’07). ACM, New York, NY, USA, 56-65. DOI=10.1145/1348549.1348556 http://doi.acm.org/10.1145/1348549.1348556 Kelly, R. (2009). Twitter Study. Pear Analytics, retrieved from http://www.pearanalytics.com/wpcontent/uploads/2012/12/Twitter-Study-August-2009.pdf
  • 40. Twitter Evolution • Kommunikation bei Twitter entwickelt sich weiter • @-Symbol für Antworten (Honeycutt & Herring, 2009) • Retweets  Neue Studien untersuchen Kommunikationsstruktur und Netzwerke Honeycutt, C., and Herring, Susan C. (2009). Beyond microblogging: Conversation and collaboration via Twitter. Proceedings of the Forty-Second Hawaii International Conference on System Sciences.Los Alamitos, CA IEEE Press.
  • 41. De-benalizing Twitter! Rogers, R. (2014). Debanalizing Twitter: The transformation of an object of study. In: K. Weller, A. Bruns, J. Burgess, M. Mahrt, C. Puschmann. (Eds.): Twitter and Society (pp. ix-xxvi). New York et al.: Peter Lang.
  • 44. Ausgewählte Forschungsbereiche Politikwissenschaft • • • • Kommunikationsverhalten v.a. im Wahlkampf Stimmungen im Wahlkampf Interaktionen zwischen Parteien eDemocracy 44
  • 45. Ausgewählte Forschungsbereiche Kommunikations- und Medienwissenschaft • • • • • Übertragung von Methoden der Medienanalyse Brand communication Crisis communication Verschiedene Zielgruppen, verschiedene Kommunikationssituationen Rolle von @messages, RTs etc. 45
  • 46. Ausgewählte Forschungsbereiche Informatik / Informationswissenschaft • • • • Information Retrieval in Tweets Informationsflüsse Netzwerke Zitationsanalysen 46
  • 47. Twitter in der sozialwissenschaftlichen Forschung? Weller, K. (2013). What you can get from Twitter – and what not. Presentation at ISSC’s World Social Science Forum (WSSF) 2013. Montreal, Canada. Slides: http://de.slideshare.net/katrinweller/wellerwssf-2013presentation . Extended Abstract: http://kwelle.files.wordpress.com/2013/10/wssf2013_weller_what-do-we-get-from-twitter.pdf
  • 48.
  • 49. Publication Huberman, B. A., Romero, D. M., & Wu, F. (2009). Social networks that matter: Twitter under the microscope. First Monday, 14(1). Retrieved from http://firstmonday.org/ojs/index.php/fm/article/view/2317/2063 [2] Weller, K. (2013). What you can get from Twitter – and what not. Presentation at ISSC’s World Social Science Forum (WSSF) 2013. Montreal, Canada. Slides: http://de.slideshare.net/katrinweller/weller-wssf-2013presentation . Extended Abstract: http://kwelle.files.wordpress.com/2013/10/wssf2013_weller_what-do-we-get-from-twitter.pdf No. [1] Citations 155 Data 309740 Twitter users (with followers and tweets) Marwick, A. E., & boyd, d. (2011). I tweet honestly, I tweet passionately: Twitter users, context collapse, and the imagined audience. New Media & Society, 13(1), 114–133. doi:10.1177/1461444810365313 77 Interviews with 181 Twitter users [3] Junco, R., Heiberger, G., & Loken, E. (2011). The effect of Twitter on college student engagement and grades. Journal of Computer Assisted Learning, 27(2), 119–132. doi:10.1111/j.1365-2729.2010.00387.x 55 Experiment with 125 students. [4] Yardi, S., Romero, D., Schoenebeck, G., & boyd, d. (2010). Detecting spam in a Twitter network. First Monday, 15(1). Retrieved from http://firstmonday.org/ojs/index.php/fm/article/view/2793/2431 28 17,803 tweets from 8,616 users + 1st degree network (3,048,360 directed edges, 631,416 unique followers, and 715,198 unique friends) [5] Ritter, A., Cherry, C., & Dolan, B. (2010). Unsupervised modeling of Twitter conversations. In HTL'10 Human Language Technologies. The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics (pp. 172–180). Stroudsburg, Pa: Association for Computational Linguistics (ACL). Retrieved from http://dl.acm.org/citation.cfm?id=1858019 27 1.3 million Twitter conversations, with each conversation containing between 2 and 243 posts [6] Petrovic, S., Osborne, M., & Lavrenko, V. (2010). Streaming first story detection with application to Twitter. In HTL'10 Human Language Technologies. The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics (pp. 181–189). Stroudsburg, Pa: Association for Computational Linguistics (ACL). Retrieved from http://dl.acm.org/citation.cfm?id=1858020 26 163,500,000 tweets [7] Jiang, L., Yu, M., Zhou, M., Liu, X., & Zhao, T. (2011). Target-dependent Twitter sentiment classification. In HLT '11 Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies:. Short papers Volume 2 (pp. 151–160). Retrieved from http://dl.acm.org/citation.cfm?id=2002492 22 20,000 tweets [8] Han, B., & Baldwin, T. (2011). Lexical normalisation of short text messages: makn sens a #twitter. In HLT '11 Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies. Short papers - Volume 2 (pp. 368–378). Retrieved from http://dl.acm.org/citation.cfm?id=2002520 22 449 tweets sampled from 1.5 GB of Twitter data [9] Gimpel, K., Schneider, N., O'Connor, B., Das, D., Mills, D., Eisenstein, J., Heilmann, M., … (2011). Part-of-speech tagging for Twitter: Annotation, features, and experiments. In HLT '11 Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies. Short papers - Volume 2 (pp. 42–47). Retrieved from http://dl.acm.org/citation.cfm?id=2002747 21 1,827 annotated tweets [10] Schultz, F., Utz, S., & Göritz, A. (2011). Is the medium the message? Perceptions of and reactions to crisis communication via twitter, blogs and traditional media. Public Relations Review, 37(1), 20–27. doi:10.1016/j.pubrev.2010.12.001 19 Experiment with 1677 participants [11] Barbosa, L., & Feng, J. (2010). Robust sentiment detection on twitter from biased and noisy data. In COLING '10 Proceedings of the 23rd International Conference on Computational Linguistics (pp. 36–44). 19 200,000 annotated tweets [12] Davidov, D., Tsur, O., & Rappoport, A. (2010). Enhanced sentiment lerarning using Twitter hashtags and smileys. In COLING '10 Proceedings of the 23rd International Conference on Computational Linguistics (pp. 241–249). Retrieved from http://dl.acm.org/citation.cfm?id=1944566.1944594 19 475,000,000 tweets [13] Hargittai, E., & Litt, E. (2011). The tweet smell of celebrity success: Explaining variation in Twitter adoption among a diverse group of young adults. New Media & Society, 13(5), 824–842. doi:10.1177/1461444811405805 18 Survey with 505 young American adults [14] Zhou, X., Lee, W.-C., Peng, W.-C., Xie, X., Lee, R., & Sumiya, K. Measuring geographical regularities of crowd behaviors for Twitter-based geo-social event detection, 1. doi:10.1145/1867699.1867701 18 21,623,947 geo-tagged tweets [15] Gruzd, A., Wellman, B., & Takhteyev, Y. (2011). Imagining Twitter as an Imagined Community. American Behavioral Scientist, 55(10), 1294–1318. doi:10.1177/0002764211409378 17 One person’s Twitter network (652 followers, 114 followings). 3,112 tweets. [16] Johnson, K. A. (2011). The effect of Twitter posts on students’ perceptions of instructor credibility. Learning, Media and Technology, 36(1), 21–38. doi:10.1080/17439884.2010.534798 16 Experiments with 120 undergrad students [17] Alina Mungiu-Pippidi, & Igor Munteanu. (2009). Moldova's "Twitter Revolution". Journal of Democracy, 20(3), 136–142. doi:10.1353/jod.0.0102 16 none [18] Larsson, A. O., & Moe, H. (2012). Studying political microblogging: Twitter users in the 2010 Swedish election campaign. New Media & Society, 14(5), 729–747. doi:10.1177/1461444811422894 15 99,832 tweets [19] Lasorsa, D. L., Lewis, S. C., & Holton, A. E. (2012). Normalizing Twitter: Journalism practice in an emerging communication space. Journalism Studies, 13(1), 19–36. doi:10.1080/1461670X.2011.571825 15 22,248 tweets [20] Takhteyev, Y., Gruzd, A., & Wellman, B. (2012). Geography of Twitter networks. Social Networks, 34(1), 73–81. doi:10.1016/j.socnet.2011.05.006 14 481,248 tweets, 1,953 user pairs
  • 50. Methoden? Angewandte Methoden in den meistzitierten Publikationen: • Interviews mit Twitter-Nutzern, • Experimente, • Quantitative Analysen von Tweets und deren Eigenschaften, • Netzwerkananlysen, • Linguistische Analysen, z.B. word clustering, event detection, sentiment analysis, • Inhaltsanalysen von Tweets.  Bisher eher selten mehrere in Kombination
  • 51. Methoden In der Forschung: viele Case Studies, wenig methodische Standards.
  • 52. Standard-Metriken? • Anzahl der Tweets • Anzahl der Nutzer mit min. einem Tweet • Tweets pro Nutzer • Structural Analysis of Tweets: – Original tweets, RTs, (modified RTs), @message – Tweets mit URLs Bruns, A., & Stieglitz, S. (2012). Quantitative Approaches to Comparing Communication Patterns on Twitter. Journal of Technology in Human Services, 30(3-4), 160–185. doi:10.1080/15228835.2012.744249 52
  • 53. Anzahl der Tweets pro Stunde Beispiel für einen Zeitverlauf: #mla09 Zeitachse: Messung in Stunden Graphik von Cornelius Puschmann
  • 54. Beispiel für ein Personennetzwerk basierend auf RTs – im Zeitverlauf Puschmann, C., Weller, K., Dröge, E. (2011): Studying Twitter Conversations as (Dynamic) Graphs: Visualization and Structural Comparison. Poster at General Online Research (GOR 11), Düsseldorf. http://ynada.com/posters/gor11.pdf
  • 55. Beispiel für Personeninformationen: #www2010 Anzahl Tweets Aktivität einzelner Personen: Tweetanzahl (#www2010) 200 180 160 140 120 100 80 60 40 20 0 Dröge, E., Maghferat, P., Puschmann, C., Verbina, J., & Weller, K. (2011). Konferenz-Tweets. Ein Ansatz zur Analyse der TwitterKommunikation bei wisseschaftlichen Konferenzen. In J. Griesbaum, T. Mandl, C. Womser-Hacker (Eds.), Information und Wissen: global, sozial und frei? Proceedings des 12. Internationalen Symposiums für Informationswissenchaft (pp. 98–110). Boizenburg: VWH.
  • 56. Personeninformationen Aktivität einzelner Personen: @-Nachrichten (#mla09) Anzahl @-Nachrichten 40 35 30 25 20 15 10 5 0 @-Nachrichten gesendet @-Nachrichten empfangen
  • 57. Inhaltsanalyse • CAQDAS Computer-Assisted Qualitative Data AnalysiS – (z.B. MAXQDA, QDAMiner, ATLAS.ti, Qualrus, Nvivo) – Speech Act Analyse – Statistische Auswertungen Einspänner, J., Dang-Anh, M., & Thimm, C. (2014). Computer-assisted content analysis of Twitter data. In: K. Weller, A. Bruns, J. Burgess, M. Mahrt, C. Puschmann. (Eds.): Twitter and Society (pp. 97-108). New York et al.: Peter Lang. 57
  • 58. Sentiment Analyse Automatische Berechnung von emotionalen Tonalitäten von Tweets. Benötigt werden Wörterbücher mit Sentiment-Werten, z.B. ANEW.  Generell mit Vorsicht zu betrachten.  Für deutsche Tweets besonders kritisch. Thelwall, M. (2014). Sentiment analysis and time series with Twitter. In: K. Weller, A. Bruns, J. Burgess, M. Mahrt, C. Puschmann. (Eds.): Twitter and Society (pp. 83-96). New York et al.: Peter Lang. 58
  • 60. The Australian Twitter-Sphere Von Axel Bruns: http://www.cci.edu.au/node/1362 60
  • 61. Rhythm of a City Siehe http://engineering.twitter.com/2012/06/studying-rapidly-evolving-user.html 61
  • 62. Stimmungen in US-Tweets Pulse of the Nation: http://www.ccs.neu.edu/home/amislove/twittermood/ 62
  • 64. Siehe: Bruns, Axel; Weller, Katrin; Harrington, Stephen (2014): Twitter and Sports: Football Fandom in Emerging and Established Markets. In: 80000 Weller, Katrin; Bruns, Axel; Burgess, Jean; Mahrt, Merja; Puschmann, Cornelius (Hrsg.): Twitter and Society, New Yort et al.: Peter Lang, S. 263-280 Weller, Katrin; Bruns, Axel (2013): Das Spiel dauert 140 Zeichen: Wie deutsche Fußballvereine Twitter für Marketing und Fan70000 Kommunikation entdecken. In: Griesbaum, Joachim; Heuwing, Ben; Ruppenhofer, Josef; Werner, Katrin (Hrsg.): HiER 2013. Proceedings BVB Dortmund 09 II (@BVB) des 8. Hildesheimer Evaluierungs- und Retrievalworkshop, Hildesheim: Universität Hildesheim, S. 119-131 60000 FC Bayern München (@BayMuenchen) number of followers 50000 40000 SV Werder Bremen II (@werderbremen) Hamburger SV (@HSV) 30000 FC Schalke 04 II (@s04, official) 1. FC Köln (@fckoeln) 20000 SV Werder Bremen I (@Werder_Bremen) Borussia Mönchengladbach (@VfLBorussia) FC Schalke 04 I (@FCSchalke04, inofficial) 10000 0 Jun 11 Jul 11 Aug 11 Sep 11 Oct 11 Nov 11 Dec 11 Jan 12 Feb 12 Mar 12 Apr 12 May 12 Jun 12 month 1. FC Augsburg (@FCAugsburg) 1. FC Nürnberg (@1_fc_nuernberg) Bayer 04 Leverkusen (@bayer04fussball) BVB Dortmund 09 II (@BVB) FC Schalke 04 I (@FCSchalke04, inofficial) Hannover 96 II (@hannover96) SV Werder Bremen I (@Werder_Bremen) 1. FC Kaiserslautern (@Rote_Teufel)* 1. FSV Mainz 05 (1FSVMainz05) Borussia Mönchengladbach (@VfLBorussia) FC Bayern München (@BayMuenchen) Hamburger SV (@HSV) Hertha BSC Berlin (@HerthaBSC)* SV Werder Bremen II (@werderbremen) 1. FC Köln (@fckoeln) 1899 Hoffenheim (achtzehn99) BVB Dortmund 09 I (@BVBDortmund09) FC Schalke 04 II (@s04, official) Hannover 96 I (@ichbin96) SC Freiburg (@sc_freiburg) 64 VfB Stuttgart (@VfB)
  • 65. Bilder auf Twitter http://www.guardian.co.uk/uk/2011/dec/07/twitter-riots-how-news-spread Siehe auch: Vis, F., Faulkner, S., Parry, K., Manyukhina, Y., & Evans, L. (2014). Twitpic-ing the news. Analysing images shared during the 2011 U.K. Riots. In: K. Weller, A. Bruns, J. Burgess, M. Mahrt, C. Puschmann (Eds), Twitter and Society (pp. 385-398). New York et al: Peter Lang. 65
  • 66. Bruns, A., & Burgess, J. (2012). Notes towards the scientific study of Twitter. In Tokar, A., Beurskens, M., Keuneke, S., Mahrt, M., Peters, I., Puschmann, C., van Treeck, T., & Weller, K. (Eds.). (2012). Science and the Internet (pp. 159169). Düsseldorf: Düsseldorf University Press http://nfgwin.uni-duesseldorf.de/sites/default/files/Bruns.pdf 66
  • 67. Diskussion Welche Themenbereiche/Methoden interessieren besonders? Eigene Erfahrungen/ Anknüpfungspunkte?
  • 71. TOPSY
  • 72.
  • 73.
  • 74. Übung http://topsy.com - Bei Topsy suchen nach a) einem Nutzer, b) einem Stichwort, c) einem Hashtag. - Bei Topsy Analytics zwei Nutzer und zwei Hashtags vergleichen. - Auffälligkeiten?
  • 75. Vorsicht: Aktivitätskennwerte • • • • • Klout (siehe Abbildung) Tweetstats.com Twitalyzer Twittercounter …
  • 76. Co-tweeting * follower recommendation * automatic tweets * twitterwalls * data visualization * URL monitoring * follower visualization * communities * hashtag meanings * trends
  • 79. Wie erhält man die Daten? API https://dev.twitter.com/docs/api/1.1 https://dev.twitter.com/blog 79
  • 81. Twitter APIs • • • • API = Application Programming Interface Zugang, um Daten für Anwendungen/Apps zu verwenden Nicht explizit für die wissenschaftliche Nutzung vorgesehen Streaming API, Rest APIs, Search API Gaffney, D., & Puschmann, C. (2014). Data collection on Twitter. In A. Bruns, K. Weller, J. Burgess, M. Mahrt & C. Puschmann (Eds.), Twitter and Society (pp. 55-67). New York, NY: Peter Lang. 81
  • 82. Twitter APIs STREAMING API - push-basiert, Live-Stream - Public stream vs. User stream - Forscher brauchen Tools, die eine Verbindung zu diesem Stream aufrecht erhalten. 82
  • 83. Twitter APIs REST API • Eingeschränkte Anzahl Anfragen pro Stunde • Social graph data (wer folgt wem) • Trending topics • Und vieles mehr https://dev.twitter.com/docs/using-search 83
  • 84. Twitter APIs • • •  Nicht explizit für Wissenschaftler entwickelt Nicht rückwirkend zugänglich Nicht vollständig Änderungen möglich
  • 86.
  • 87.
  • 88. Twitter-Daten erheben? • • • • • • YourTwapperkeeper Per RSS-Feed (z.B. Google reader, Thunderbird) Drittanbieter ($) Desktopbasierte Programme Eigene Programme schreiben Gnip / DataSift
  • 92.
  • 93.
  • 97. GNIP
  • 99. Rechtlicher Rahmen • Terms of Services: https://twitter.com/tos • Twitter Privacy Policy: https://twitter.com/privacy • Developer’s Rules of the Road: https://dev.twitter.com/terms/api-terms
  • 101. 1. Man muss die TwitterDynamik kennen, um mit Twitter-Daten arbeiten zu können.
  • 102. 2. Twitter als Moving Target: alles kann sich verändern!
  • 103. 3. Ideal: Erst die Forschungsfrage, dann die Datenerhebung.
  • 105. 5. Man erhält i.d.R. nur einen Ausschnitt aus Twitter
  • 106. Diskussion • Erste Selbsteinschätzung: wo könnten sich Twitter-Daten für meine Forschungsfrage lohnen? • Was muss ich noch wissen, bevor ich tatsächlich entscheiden kann, ob ich mit Twitter-Daten arbeiten möchte? Allgemein: • Fragen / Wünsche / Anregungen
  • 107. 4. Twitter Daten unter der Lupe
  • 108.
  • 109. Was kommt zuerst? • Forschungsfrage? • Daten?
  • 110. Fallstudie: Twitter bei der Landtagswahl NRW Übung: - Notieren, welche Fragestellungen in diesem Zusammenhang interessant sein könnten. - Überlegen, welche Daten dafür benötigt werden würden.
  • 114. Studien planen • • • • Was soll untersucht werden? Warum brauche ich dafür Twitter-Daten? Welche Art Twitter-Daten benötige ich? Vorab-Recherche!
  • 115. Kriterien zur Datenerhebung Typischerweise: - Tweets eines bestimmten Nutzers - Tweets, die einen Nutzer erwähnen - Tweets, die ein Wort (Zeichenkette) oder ein Hashtag enthalten Diverse weitere, z.B. - Anzahl und Namen der Follower eines Accounts - Tweets, die eine bestimmte URL (domain) enthalten 115
  • 117. Probleme • • • • Wie lange sollen Daten gesammelt werden? Mit welcher Technik sollen Daten gesammelt werden? Mit welchen Suchkriterien sollen Daten gesammelt werden? Wie sollen die Daten später ausgewertet werden?
  • 119. Technische Feinheiten • • • • • Manuelle vs. Button Retweets URLs erkennen und auflösen @messages vs. @mentions Informationen über einzelne Twitter-Nutzer herausfinden Hashtag vs. Volltextsuche
  • 120. Datenbereinigung • Mehrere Datensätze zusammenfügen und dabei Dubletten entfernen. • ‚False positives‘ entfernen (z.B. bvb) • Ggf. Dateiformate für die Bearbeitung in Analysetools anpassen
  • 121. Datenmanagement • Versionierung – Metadaten • Dokumentation des Erhebungs- und Bereinigungsprozesses • Sicherungskopien
  • 123. Studiendesign Entweder bereits vorhandene Fragestellung – oder gemeinsam Fragen erarbeiten. • Ausgehend von Fragestellung: welche Daten werden benötigt, wie können diese erhoben werden, was muss beachtet werden? • Welche Probleme können auftreten?  Kurzpräsentation des eigenen Ansatzes
  • 125. Big Data vs. Sinnvolle Forschungsfragen 125
  • 126. Was ist ein Link, Follower, Tweet etc. wert?  Wie kann man NutzerAktionen interpretieren? 126
  • 127. Repräsentativität? beeinflusst von: • Nutzerzahlen • Zeitpunkt/Dauer der Datenerhebung • Datenauswahl 127
  • 128. Verlässlichkeit • Verifizierte Accounts • Verifizierte Inhalte? • (Datenausfälle) 128
  • 129. 129
  • 130. Forschungsethik • Anonymisierung/Pseudonymisierung möglich bzw. nötig? • Richtlinien für den Umgang mit Personendaten? Aktuelle Hinweise • So wenig personenbezogene Daten wie möglich teilen • Tweet-Sammlungen nicht öffentlich zur Verfügung stellen
  • 132. Reproduzierbarkeit  Die gleichen Daten zweimal erheben?  Mit bestehenden Datensätzen arbeiten? 132
  • 133. Fazit?
  • 134. Danke für die Teilnahme!