Anzeige
Anzeige

Más contenido relacionado

Anzeige

Similar a Twitter-Daten in der sozialwissenschaftlichen Forschung(20)

Anzeige

Twitter-Daten in der sozialwissenschaftlichen Forschung

  1. Twitter-Daten in der sozialwissenschaftlichen Forschung: Möglichkeiten und Herausforderungen 7. Oktober 2013, 13:00-18:00 8. Oktober, 9:30-15:00 GESIS Workshop, Köln Dr. Katrin Weller, katrin.weller@gesis.org, @kwelle
  2. Aufbau des Workshops Ziele • Twitter als Datenquelle kennenlernen • Einschätzen lernen, was mit Twitter-Daten möglich ist, und was nicht • Überblick über Herangehensweisen, Methoden, Stand der Forschung, Schwierigkeiten
  3. Aufbau des Workshops 1. Einführung in Twitter (mit Übung) 2. Stand der Twitter-Forschung – Ein Überblick 3. Twitter-Tools 4a. Ein erster Blick in die Twitter-Daten 4b. Twitter-Datensätze unter der Lupe 5. Studien planen – was geht, was geht nicht? 6. Übung: Studien planen 7. Diskussion: Datenqualität, Forschungsethik, rechtlicher Rahmen
  4. Unterrichtsmaterialien • Folien werden online zur Verfügung gestellt: http://katrinweller.net • Weiterführende Informationen: http://kwelle.wordpress.com/2013/08/14/some-useful-resources-forstarting-twitter-research/#more-100 • Test-Datensätze bitte nicht weitergeben!
  5. Vorstellung • Interessen, Forschungshintergrund • Erwartungen • Konkrete Pläne mit Twitterdaten?
  6. 1. Twitter – Eine Einführung Jack Dorsey (2000): “twttr sketch”. http://www.flickr.com/photos/jackdorsey/182613360/
  7. gegründet in 2006, eigenständige Plattform seit 2007 Jack Dorsey (2000): “twttr sketch”. http://www.flickr.com/photos/jackdorsey/182613360/
  8. Twitter 2013
  9. Twitter in Zahlen • March 2012: 140 million active users and 340 million Tweets a day • December 2012: more than 200 million users • USA, 2012: 15% of online adults use Twitter • Germany, 2012: 4% of population ARD/ZDF online Studie http://www.ard-zdfonlinestudie.de/fileadmin /Online12/07082012_Busemann_Gscheidl e.pdf @twitter: https://twitter.c om/twitter/stat us/2810516522 35087872 PEW Internet: http://www.pewinte rnet.org/Reports/201 2/Twitter-Use2012.aspx Twitter Blog: http://blog.twit ter.com/2012/0 3/twitter-turnssix.html
  10. Twitter vs. Facebook In Deutschland Facebook: 72.1% (aller Internetnutzer) Twitter: 10.5% (aller Internetnutzer) German Social Media Consumer Report: http://www.socialmediathinklab.com/wpcontent/uploads/2013/02/WWU_SocialMedia-Consumer-Report_0213_Ansicht.pdf 10
  11. Randnotizen https://2012.twitter.com/de/golden-tweets.html • Trends 2012: Olympics, Wahlen in USA. • Twitter-Nutzer mit den meisten Followern? • Die meisten Retweets:
  12. March, 2013, http://twittercounter.com/pages/100
  13. Und wie funktioniert das? Tweet = max. 140 Zeichen
  14. Followers / Followees Kwak, H., Lee, C., Park, H., & Moon, S. (2010). What is Twitter, a Social Network or a News Media? In Proceedings of the 19th International World Wide Web (WWW) Conference, April 26-30, 2010, Raleigh NC, USA.
  15. Timeline
  16. Retweet (RT) Kooti, F., Yang, H., Cha, M., Gummadi, K.P. & Mason, W.A. (2012). The Emergence of Conventions in Online Social Networks. Proceedings of the International Conference on Weblogs and Social Media (ICWSM 2012), Dublin.
  17. @message (@mention) ≠ direct message
  18. #hashtags
  19. #hashtags 19 März 2013 6 Oktober 2013
  20. URLs
  21. Fotos
  22. Nutzerprofile
  23. Übung
  24. Übung 1: Suchen • Nach Tweets: – mit und ohne Hashtag • Nach Personen – nach dem offiziellen Account der eigenen Institution – nach einem verifizierten Account • (Suchen ohne Login: https://twitter.com/search-home)
  25. Übung 2: Account anlegen Wer keinen eigenen Account anlegen möchte: Twitter Test-Account: [aus den Folien gelöscht] Passwort: [aus den Folien gelöscht]
  26. Übung 3: Folgen • 2-3 interessante Accounts aussuchen und diesen folgen • Min. einem anderen Kursteilnehmer folgen • Zurück-folgen!
  27. Übung 4: Tweets schreiben • • • • zuerst einen ‚normalen‘ Tweet dann einen mit Hashtag und dann eine @message an einen anderen Kursteilnehmer und nun noch ein Retweet
  28. Übung 5: Hashtag auswählen • Einen gemeinsamen Hashtag für den Workshop festlegen
  29. Übung 6: Trending topics • Die Trending Topics ansehen – Für Deutschland – Weltweit – Für ein anderes Land oder für die eigene Heimatstadt
  30. Übung 7: Direct message schreiben • Einem anderen Teilnehmer eine direct message schicken.
  31. Fragen?
  32. 2. Stand der Forschung
  33. Entwicklung der Twitter-Forschung
  34. Twitter vs. Facebook Scopus (TITLE-ABS-KEY(Twitter) AND PUBYEAR > 2006) (TITLE-ABS-KEY(Facebook) AND PUBYEAR > 2006)
  35. Scopus: Publikationen aus 70 Ländern 36
  36. pointless babble?
  37. Frühe Twitter-Forschung • Java et al. (2007) identifizieren einen Großteil an Tweets als “daily chatter”. • Pear Analytics study: 40% of tweets are pointless babble (Kelly, 2009). Java, A., Song, X., Finin, T., & Tseng, B. (2007). Why we twitter: understanding microblogging usage and communities. In Proceedings of the 9th WebKDD and 1st SNA-KDD 2007 workshop on Web mining and social network analysis (WebKDD/SNA-KDD ’07). ACM, New York, NY, USA, 56-65. DOI=10.1145/1348549.1348556 http://doi.acm.org/10.1145/1348549.1348556 Kelly, R. (2009). Twitter Study. Pear Analytics, retrieved from http://www.pearanalytics.com/wpcontent/uploads/2012/12/Twitter-Study-August-2009.pdf
  38. Twitter Evolution • Kommunikation bei Twitter entwickelt sich weiter • @-Symbol für Antworten (Honeycutt & Herring, 2009) • Retweets  Neue Studien untersuchen Kommunikationsstruktur und Netzwerke Honeycutt, C., and Herring, Susan C. (2009). Beyond microblogging: Conversation and collaboration via Twitter. Proceedings of the Forty-Second Hawaii International Conference on System Sciences.Los Alamitos, CA IEEE Press.
  39. De-benalizing Twitter! Rogers, R. (2014). Debanalizing Twitter: The transformation of an object of study. In: K. Weller, A. Bruns, J. Burgess, M. Mahrt, C. Puschmann. (Eds.): Twitter and Society (pp. ix-xxvi). New York et al.: Peter Lang.
  40. Was wird erforscht?
  41. Was wird erforscht?
  42. Ausgewählte Forschungsbereiche Politikwissenschaft • • • • Kommunikationsverhalten v.a. im Wahlkampf Stimmungen im Wahlkampf Interaktionen zwischen Parteien eDemocracy 44
  43. Ausgewählte Forschungsbereiche Kommunikations- und Medienwissenschaft • • • • • Übertragung von Methoden der Medienanalyse Brand communication Crisis communication Verschiedene Zielgruppen, verschiedene Kommunikationssituationen Rolle von @messages, RTs etc. 45
  44. Ausgewählte Forschungsbereiche Informatik / Informationswissenschaft • • • • Information Retrieval in Tweets Informationsflüsse Netzwerke Zitationsanalysen 46
  45. Twitter in der sozialwissenschaftlichen Forschung? Weller, K. (2013). What you can get from Twitter – and what not. Presentation at ISSC’s World Social Science Forum (WSSF) 2013. Montreal, Canada. Slides: http://de.slideshare.net/katrinweller/wellerwssf-2013presentation . Extended Abstract: http://kwelle.files.wordpress.com/2013/10/wssf2013_weller_what-do-we-get-from-twitter.pdf
  46. Publication Huberman, B. A., Romero, D. M., & Wu, F. (2009). Social networks that matter: Twitter under the microscope. First Monday, 14(1). Retrieved from http://firstmonday.org/ojs/index.php/fm/article/view/2317/2063 [2] Weller, K. (2013). What you can get from Twitter – and what not. Presentation at ISSC’s World Social Science Forum (WSSF) 2013. Montreal, Canada. Slides: http://de.slideshare.net/katrinweller/weller-wssf-2013presentation . Extended Abstract: http://kwelle.files.wordpress.com/2013/10/wssf2013_weller_what-do-we-get-from-twitter.pdf No. [1] Citations 155 Data 309740 Twitter users (with followers and tweets) Marwick, A. E., & boyd, d. (2011). I tweet honestly, I tweet passionately: Twitter users, context collapse, and the imagined audience. New Media & Society, 13(1), 114–133. doi:10.1177/1461444810365313 77 Interviews with 181 Twitter users [3] Junco, R., Heiberger, G., & Loken, E. (2011). The effect of Twitter on college student engagement and grades. Journal of Computer Assisted Learning, 27(2), 119–132. doi:10.1111/j.1365-2729.2010.00387.x 55 Experiment with 125 students. [4] Yardi, S., Romero, D., Schoenebeck, G., & boyd, d. (2010). Detecting spam in a Twitter network. First Monday, 15(1). Retrieved from http://firstmonday.org/ojs/index.php/fm/article/view/2793/2431 28 17,803 tweets from 8,616 users + 1st degree network (3,048,360 directed edges, 631,416 unique followers, and 715,198 unique friends) [5] Ritter, A., Cherry, C., & Dolan, B. (2010). Unsupervised modeling of Twitter conversations. In HTL'10 Human Language Technologies. The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics (pp. 172–180). Stroudsburg, Pa: Association for Computational Linguistics (ACL). Retrieved from http://dl.acm.org/citation.cfm?id=1858019 27 1.3 million Twitter conversations, with each conversation containing between 2 and 243 posts [6] Petrovic, S., Osborne, M., & Lavrenko, V. (2010). Streaming first story detection with application to Twitter. In HTL'10 Human Language Technologies. The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics (pp. 181–189). Stroudsburg, Pa: Association for Computational Linguistics (ACL). Retrieved from http://dl.acm.org/citation.cfm?id=1858020 26 163,500,000 tweets [7] Jiang, L., Yu, M., Zhou, M., Liu, X., & Zhao, T. (2011). Target-dependent Twitter sentiment classification. In HLT '11 Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies:. Short papers Volume 2 (pp. 151–160). Retrieved from http://dl.acm.org/citation.cfm?id=2002492 22 20,000 tweets [8] Han, B., & Baldwin, T. (2011). Lexical normalisation of short text messages: makn sens a #twitter. In HLT '11 Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies. Short papers - Volume 2 (pp. 368–378). Retrieved from http://dl.acm.org/citation.cfm?id=2002520 22 449 tweets sampled from 1.5 GB of Twitter data [9] Gimpel, K., Schneider, N., O'Connor, B., Das, D., Mills, D., Eisenstein, J., Heilmann, M., … (2011). Part-of-speech tagging for Twitter: Annotation, features, and experiments. In HLT '11 Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies. Short papers - Volume 2 (pp. 42–47). Retrieved from http://dl.acm.org/citation.cfm?id=2002747 21 1,827 annotated tweets [10] Schultz, F., Utz, S., & Göritz, A. (2011). Is the medium the message? Perceptions of and reactions to crisis communication via twitter, blogs and traditional media. Public Relations Review, 37(1), 20–27. doi:10.1016/j.pubrev.2010.12.001 19 Experiment with 1677 participants [11] Barbosa, L., & Feng, J. (2010). Robust sentiment detection on twitter from biased and noisy data. In COLING '10 Proceedings of the 23rd International Conference on Computational Linguistics (pp. 36–44). 19 200,000 annotated tweets [12] Davidov, D., Tsur, O., & Rappoport, A. (2010). Enhanced sentiment lerarning using Twitter hashtags and smileys. In COLING '10 Proceedings of the 23rd International Conference on Computational Linguistics (pp. 241–249). Retrieved from http://dl.acm.org/citation.cfm?id=1944566.1944594 19 475,000,000 tweets [13] Hargittai, E., & Litt, E. (2011). The tweet smell of celebrity success: Explaining variation in Twitter adoption among a diverse group of young adults. New Media & Society, 13(5), 824–842. doi:10.1177/1461444811405805 18 Survey with 505 young American adults [14] Zhou, X., Lee, W.-C., Peng, W.-C., Xie, X., Lee, R., & Sumiya, K. Measuring geographical regularities of crowd behaviors for Twitter-based geo-social event detection, 1. doi:10.1145/1867699.1867701 18 21,623,947 geo-tagged tweets [15] Gruzd, A., Wellman, B., & Takhteyev, Y. (2011). Imagining Twitter as an Imagined Community. American Behavioral Scientist, 55(10), 1294–1318. doi:10.1177/0002764211409378 17 One person’s Twitter network (652 followers, 114 followings). 3,112 tweets. [16] Johnson, K. A. (2011). The effect of Twitter posts on students’ perceptions of instructor credibility. Learning, Media and Technology, 36(1), 21–38. doi:10.1080/17439884.2010.534798 16 Experiments with 120 undergrad students [17] Alina Mungiu-Pippidi, & Igor Munteanu. (2009). Moldova's "Twitter Revolution". Journal of Democracy, 20(3), 136–142. doi:10.1353/jod.0.0102 16 none [18] Larsson, A. O., & Moe, H. (2012). Studying political microblogging: Twitter users in the 2010 Swedish election campaign. New Media & Society, 14(5), 729–747. doi:10.1177/1461444811422894 15 99,832 tweets [19] Lasorsa, D. L., Lewis, S. C., & Holton, A. E. (2012). Normalizing Twitter: Journalism practice in an emerging communication space. Journalism Studies, 13(1), 19–36. doi:10.1080/1461670X.2011.571825 15 22,248 tweets [20] Takhteyev, Y., Gruzd, A., & Wellman, B. (2012). Geography of Twitter networks. Social Networks, 34(1), 73–81. doi:10.1016/j.socnet.2011.05.006 14 481,248 tweets, 1,953 user pairs
  47. Methoden? Angewandte Methoden in den meistzitierten Publikationen: • Interviews mit Twitter-Nutzern, • Experimente, • Quantitative Analysen von Tweets und deren Eigenschaften, • Netzwerkananlysen, • Linguistische Analysen, z.B. word clustering, event detection, sentiment analysis, • Inhaltsanalysen von Tweets.  Bisher eher selten mehrere in Kombination
  48. Methoden In der Forschung: viele Case Studies, wenig methodische Standards.
  49. Standard-Metriken? • Anzahl der Tweets • Anzahl der Nutzer mit min. einem Tweet • Tweets pro Nutzer • Structural Analysis of Tweets: – Original tweets, RTs, (modified RTs), @message – Tweets mit URLs Bruns, A., & Stieglitz, S. (2012). Quantitative Approaches to Comparing Communication Patterns on Twitter. Journal of Technology in Human Services, 30(3-4), 160–185. doi:10.1080/15228835.2012.744249 52
  50. Anzahl der Tweets pro Stunde Beispiel für einen Zeitverlauf: #mla09 Zeitachse: Messung in Stunden Graphik von Cornelius Puschmann
  51. Beispiel für ein Personennetzwerk basierend auf RTs – im Zeitverlauf Puschmann, C., Weller, K., Dröge, E. (2011): Studying Twitter Conversations as (Dynamic) Graphs: Visualization and Structural Comparison. Poster at General Online Research (GOR 11), Düsseldorf. http://ynada.com/posters/gor11.pdf
  52. Beispiel für Personeninformationen: #www2010 Anzahl Tweets Aktivität einzelner Personen: Tweetanzahl (#www2010) 200 180 160 140 120 100 80 60 40 20 0 Dröge, E., Maghferat, P., Puschmann, C., Verbina, J., & Weller, K. (2011). Konferenz-Tweets. Ein Ansatz zur Analyse der TwitterKommunikation bei wisseschaftlichen Konferenzen. In J. Griesbaum, T. Mandl, C. Womser-Hacker (Eds.), Information und Wissen: global, sozial und frei? Proceedings des 12. Internationalen Symposiums für Informationswissenchaft (pp. 98–110). Boizenburg: VWH.
  53. Personeninformationen Aktivität einzelner Personen: @-Nachrichten (#mla09) Anzahl @-Nachrichten 40 35 30 25 20 15 10 5 0 @-Nachrichten gesendet @-Nachrichten empfangen
  54. Inhaltsanalyse • CAQDAS Computer-Assisted Qualitative Data AnalysiS – (z.B. MAXQDA, QDAMiner, ATLAS.ti, Qualrus, Nvivo) – Speech Act Analyse – Statistische Auswertungen Einspänner, J., Dang-Anh, M., & Thimm, C. (2014). Computer-assisted content analysis of Twitter data. In: K. Weller, A. Bruns, J. Burgess, M. Mahrt, C. Puschmann. (Eds.): Twitter and Society (pp. 97-108). New York et al.: Peter Lang. 57
  55. Sentiment Analyse Automatische Berechnung von emotionalen Tonalitäten von Tweets. Benötigt werden Wörterbücher mit Sentiment-Werten, z.B. ANEW.  Generell mit Vorsicht zu betrachten.  Für deutsche Tweets besonders kritisch. Thelwall, M. (2014). Sentiment analysis and time series with Twitter. In: K. Weller, A. Bruns, J. Burgess, M. Mahrt, C. Puschmann. (Eds.): Twitter and Society (pp. 83-96). New York et al.: Peter Lang. 58
  56. Besondere Fallstudien
  57. The Australian Twitter-Sphere Von Axel Bruns: http://www.cci.edu.au/node/1362 60
  58. Rhythm of a City Siehe http://engineering.twitter.com/2012/06/studying-rapidly-evolving-user.html 61
  59. Stimmungen in US-Tweets Pulse of the Nation: http://www.ccs.neu.edu/home/amislove/twittermood/ 62
  60. 63 http://www.jeuneafrique.com/Article/ARTJAWEB20130215165826/int ernet-libreville-accra-addis-abebareseaux-sociaux-les-capitalesafricaines-de-twitter-quartier-par-quartier.html#Tunis
  61. Siehe: Bruns, Axel; Weller, Katrin; Harrington, Stephen (2014): Twitter and Sports: Football Fandom in Emerging and Established Markets. In: 80000 Weller, Katrin; Bruns, Axel; Burgess, Jean; Mahrt, Merja; Puschmann, Cornelius (Hrsg.): Twitter and Society, New Yort et al.: Peter Lang, S. 263-280 Weller, Katrin; Bruns, Axel (2013): Das Spiel dauert 140 Zeichen: Wie deutsche Fußballvereine Twitter für Marketing und Fan70000 Kommunikation entdecken. In: Griesbaum, Joachim; Heuwing, Ben; Ruppenhofer, Josef; Werner, Katrin (Hrsg.): HiER 2013. Proceedings BVB Dortmund 09 II (@BVB) des 8. Hildesheimer Evaluierungs- und Retrievalworkshop, Hildesheim: Universität Hildesheim, S. 119-131 60000 FC Bayern München (@BayMuenchen) number of followers 50000 40000 SV Werder Bremen II (@werderbremen) Hamburger SV (@HSV) 30000 FC Schalke 04 II (@s04, official) 1. FC Köln (@fckoeln) 20000 SV Werder Bremen I (@Werder_Bremen) Borussia Mönchengladbach (@VfLBorussia) FC Schalke 04 I (@FCSchalke04, inofficial) 10000 0 Jun 11 Jul 11 Aug 11 Sep 11 Oct 11 Nov 11 Dec 11 Jan 12 Feb 12 Mar 12 Apr 12 May 12 Jun 12 month 1. FC Augsburg (@FCAugsburg) 1. FC Nürnberg (@1_fc_nuernberg) Bayer 04 Leverkusen (@bayer04fussball) BVB Dortmund 09 II (@BVB) FC Schalke 04 I (@FCSchalke04, inofficial) Hannover 96 II (@hannover96) SV Werder Bremen I (@Werder_Bremen) 1. FC Kaiserslautern (@Rote_Teufel)* 1. FSV Mainz 05 (1FSVMainz05) Borussia Mönchengladbach (@VfLBorussia) FC Bayern München (@BayMuenchen) Hamburger SV (@HSV) Hertha BSC Berlin (@HerthaBSC)* SV Werder Bremen II (@werderbremen) 1. FC Köln (@fckoeln) 1899 Hoffenheim (achtzehn99) BVB Dortmund 09 I (@BVBDortmund09) FC Schalke 04 II (@s04, official) Hannover 96 I (@ichbin96) SC Freiburg (@sc_freiburg) 64 VfB Stuttgart (@VfB)
  62. Bilder auf Twitter http://www.guardian.co.uk/uk/2011/dec/07/twitter-riots-how-news-spread Siehe auch: Vis, F., Faulkner, S., Parry, K., Manyukhina, Y., & Evans, L. (2014). Twitpic-ing the news. Analysing images shared during the 2011 U.K. Riots. In: K. Weller, A. Bruns, J. Burgess, M. Mahrt, C. Puschmann (Eds), Twitter and Society (pp. 385-398). New York et al: Peter Lang. 65
  63. Bruns, A., & Burgess, J. (2012). Notes towards the scientific study of Twitter. In Tokar, A., Beurskens, M., Keuneke, S., Mahrt, M., Peters, I., Puschmann, C., van Treeck, T., & Weller, K. (Eds.). (2012). Science and the Internet (pp. 159169). Düsseldorf: Düsseldorf University Press http://nfgwin.uni-duesseldorf.de/sites/default/files/Bruns.pdf 66
  64. Diskussion Welche Themenbereiche/Methoden interessieren besonders? Eigene Erfahrungen/ Anknüpfungspunkte?
  65. 3. Tools
  66. TweetDeck https://about.twitter.com/products/tweetdeck
  67. Tweetdeck online http://www.tweetdeck.com/
  68. TOPSY
  69. Übung http://topsy.com - Bei Topsy suchen nach a) einem Nutzer, b) einem Stichwort, c) einem Hashtag. - Bei Topsy Analytics zwei Nutzer und zwei Hashtags vergleichen. - Auffälligkeiten?
  70. Vorsicht: Aktivitätskennwerte • • • • • Klout (siehe Abbildung) Tweetstats.com Twitalyzer Twittercounter …
  71. Co-tweeting * follower recommendation * automatic tweets * twitterwalls * data visualization * URL monitoring * follower visualization * communities * hashtag meanings * trends
  72. Twitter Walls Foto: http://www.zephoria.org/thoughts/archives/2009/11/24/spectacle_at_we.html
  73. Tools zur Datensammlung
  74. Wie erhält man die Daten? API https://dev.twitter.com/docs/api/1.1 https://dev.twitter.com/blog 79
  75. Datensammlung? Herausforderungen: Archivierung in Echtzeit Eingeschränkte Anteile 80
  76. Twitter APIs • • • • API = Application Programming Interface Zugang, um Daten für Anwendungen/Apps zu verwenden Nicht explizit für die wissenschaftliche Nutzung vorgesehen Streaming API, Rest APIs, Search API Gaffney, D., & Puschmann, C. (2014). Data collection on Twitter. In A. Bruns, K. Weller, J. Burgess, M. Mahrt & C. Puschmann (Eds.), Twitter and Society (pp. 55-67). New York, NY: Peter Lang. 81
  77. Twitter APIs STREAMING API - push-basiert, Live-Stream - Public stream vs. User stream - Forscher brauchen Tools, die eine Verbindung zu diesem Stream aufrecht erhalten. 82
  78. Twitter APIs REST API • Eingeschränkte Anzahl Anfragen pro Stunde • Social graph data (wer folgt wem) • Trending topics • Und vieles mehr https://dev.twitter.com/docs/using-search 83
  79. Twitter APIs • • •  Nicht explizit für Wissenschaftler entwickelt Nicht rückwirkend zugänglich Nicht vollständig Änderungen möglich
  80. https://dev.twitter.com/console Eigene User-ID finden: http://www.idfromuser.com/
  81. Twitter-Daten erheben? • • • • • • YourTwapperkeeper Per RSS-Feed (z.B. Google reader, Thunderbird) Drittanbieter ($) Desktopbasierte Programme Eigene Programme schreiben Gnip / DataSift
  82. YourTwapperkeeper http://134.99.116.228/yourtwapperkeeper (Password protected)
  83. YourTwapperkeeper
  84. Tweet Archivist
  85. TweetArchivist Übung: Verschiedene Suchen ausprobieren: http://www.tweetarchivist.com/SetLanguage
  86. NodeXL http://nodexl.codeplex.com/
  87. NodeXL
  88. GNIP
  89. Rechtlicher Rahmen Twitter‘s Nutzungsbedingungen Datenschutzbestimmungen
  90. Rechtlicher Rahmen • Terms of Services: https://twitter.com/tos • Twitter Privacy Policy: https://twitter.com/privacy • Developer’s Rules of the Road: https://dev.twitter.com/terms/api-terms
  91. „Lessons learnt“
  92. 1. Man muss die TwitterDynamik kennen, um mit Twitter-Daten arbeiten zu können.
  93. 2. Twitter als Moving Target: alles kann sich verändern!
  94. 3. Ideal: Erst die Forschungsfrage, dann die Datenerhebung.
  95. 4. Aber: Twitter-Daten immer rechtzeitig (live) erheben!
  96. 5. Man erhält i.d.R. nur einen Ausschnitt aus Twitter
  97. Diskussion • Erste Selbsteinschätzung: wo könnten sich Twitter-Daten für meine Forschungsfrage lohnen? • Was muss ich noch wissen, bevor ich tatsächlich entscheiden kann, ob ich mit Twitter-Daten arbeiten möchte? Allgemein: • Fragen / Wünsche / Anregungen
  98. 4. Twitter Daten unter der Lupe
  99. Was kommt zuerst? • Forschungsfrage? • Daten?
  100. Fallstudie: Twitter bei der Landtagswahl NRW Übung: - Notieren, welche Fragestellungen in diesem Zusammenhang interessant sein könnten. - Überlegen, welche Daten dafür benötigt werden würden.
  101. Dateien #ltwnrw tweets Was fällt auf?
  102. 5. Studien planen
  103. Forschungsablauf Studie planen Daten erheben Daten auswerten (Daten archivieren)
  104. Studien planen • • • • Was soll untersucht werden? Warum brauche ich dafür Twitter-Daten? Welche Art Twitter-Daten benötige ich? Vorab-Recherche!
  105. Kriterien zur Datenerhebung Typischerweise: - Tweets eines bestimmten Nutzers - Tweets, die einen Nutzer erwähnen - Tweets, die ein Wort (Zeichenkette) oder ein Hashtag enthalten Diverse weitere, z.B. - Anzahl und Namen der Follower eines Accounts - Tweets, die eine bestimmte URL (domain) enthalten 115
  106. Datensammlung Nutzerbezogen Themenbezogen
  107. Probleme • • • • Wie lange sollen Daten gesammelt werden? Mit welcher Technik sollen Daten gesammelt werden? Mit welchen Suchkriterien sollen Daten gesammelt werden? Wie sollen die Daten später ausgewertet werden?
  108. Auswertung Inhaltsanalysen Quantitative Analysen
  109. Technische Feinheiten • • • • • Manuelle vs. Button Retweets URLs erkennen und auflösen @messages vs. @mentions Informationen über einzelne Twitter-Nutzer herausfinden Hashtag vs. Volltextsuche
  110. Datenbereinigung • Mehrere Datensätze zusammenfügen und dabei Dubletten entfernen. • ‚False positives‘ entfernen (z.B. bvb) • Ggf. Dateiformate für die Bearbeitung in Analysetools anpassen
  111. Datenmanagement • Versionierung – Metadaten • Dokumentation des Erhebungs- und Bereinigungsprozesses • Sicherungskopien
  112. 6. Übung: Studien planen
  113. Studiendesign Entweder bereits vorhandene Fragestellung – oder gemeinsam Fragen erarbeiten. • Ausgehend von Fragestellung: welche Daten werden benötigt, wie können diese erhoben werden, was muss beachtet werden? • Welche Probleme können auftreten?  Kurzpräsentation des eigenen Ansatzes
  114. 7. Diskussion
  115. Big Data vs. Sinnvolle Forschungsfragen 125
  116. Was ist ein Link, Follower, Tweet etc. wert?  Wie kann man NutzerAktionen interpretieren? 126
  117. Repräsentativität? beeinflusst von: • Nutzerzahlen • Zeitpunkt/Dauer der Datenerhebung • Datenauswahl 127
  118. Verlässlichkeit • Verifizierte Accounts • Verifizierte Inhalte? • (Datenausfälle) 128
  119. 129
  120. Forschungsethik • Anonymisierung/Pseudonymisierung möglich bzw. nötig? • Richtlinien für den Umgang mit Personendaten? Aktuelle Hinweise • So wenig personenbezogene Daten wie möglich teilen • Tweet-Sammlungen nicht öffentlich zur Verfügung stellen
  121. today vs. tomorrow 131
  122. Reproduzierbarkeit  Die gleichen Daten zweimal erheben?  Mit bestehenden Datensätzen arbeiten? 132
  123. Fazit?
  124. Danke für die Teilnahme!
Anzeige