SlideShare ist ein Scribd-Unternehmen logo
Social Media Daten als Grundlage
sozialwissenschaftlicher Forschung:
Chancen und Herausforderungen
Kassel, 11.06.2014
Dr. Katrin Weller, katrin.weller@gesis.org, @kwelle
http://katrinweller.net
Dr. Katrin Weller
GESIS – Leibniz Institut für Sozialwissenschaften
Datenarchiv für Sozialwissenschaften
2006-2012: Heinrich-Heine-Universität Düsseldorf,
Promotion in Informationswissenschaft
Weller, K., Bruns, A., Burgess, J., Mahrt, M., & Puschmann, C. (Eds.) (2014).
Twitter and Society. New York et al.: Peter Lang.
Fragen & Kommentare
Slides: http://de.slideshare.net/katrinweller
Hintergrund / Forschungsstand
5
http://www.conversationprism.com//
© Statista
Von welchen der folgenden Netzwerke und Plattformen haben Sie schon gehört?
Umfrage zur Bekanntheit von Social Media Plattformen in Deutschland (2012)
30
40
55
56
58
62
67
68
69
71
72
80
87
96
Yappy
Flickr
Xing
Lokalisten
MeinVZ
MyVideo
MySpace
SchülerVZ
StudiVZ
Stayfriends
Wer-kennt-…
Twitter
YouTube
Facebook
0 20 40 60 80 100 120
Anteil der Befragten in %
Quelle: PwC, Entwicklung sozialer Medien im Vergleich, Seite 11 ID 76144
http://de.statista.com/statistik/daten/studie/76144/umfrage/umfrage-zur-bekanntheit-von-social-media-plattformen-in-deutschland/
Social Media Forschung in (Publikations)zahlen
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
Anzahl an Publikationen in Scopus
(TITLE-ABS-KEY("social media") OR TITLE-ABS-KEY("social web") OR TITLE-ABS-KEY("social
software") OR TITLE-ABS-KEY("web 2.0")) AND PUBYEAR > 1999 [ März 2014]
Publikationen nach Fachgebieten (Scopus)
10650; 36%
5542; 19%
2384
2288
2151
1535
773
772
65 Computer Science
Social Sciences
Engineering
Medicine
Business, Management and Accounting
Mathematics
Arts and Humanities
Decision Sciences
Psychology
Nursing
Economics, Econometrics and Finance
Biochemistry, Genetics and Molecular Biology
Health Professions
Environmental Science
Earth and Planetary Sciences
Agricultural and Biological Sciences
Pharmacology, Toxicology and Pharmaceutics
Physics and Astronomy
Materials Science
Multidisciplinary
Neuroscience
Immunology and Microbiology
Chemical Engineering
Veterinary
Dentistry
Chemistry
Energy
http://kwelle.wordpress.com/2014/04/07/bibliometric-analysis-of-social-media-research/#more-149
Forschungsthemen
pointless babble?
Top Thema: Wahlen
#egypt
Dauerthemen
E-Learning Marketing
Marktforschung /
Nutzerstudien
Journalismus
Trends?
Vorhersagen Gesundheit Big Data
Was wird erforscht?
• Nutzergruppen
• Ereignisse
• Zielgruppen
• Nutzungspraxis
• Informationsflüsse
• Einfluss
• Meinungen und Stimmungen
• Netzwerke
• Interaktionen
• …
Social Media Daten
Social Media Daten
• Texte
• Bilder
• Videos
• Multimedia
• Verbindungen I (Freunde, Follower)
• Verbindungen II (Links/URLs)
• Verbindungen/Aktionen (Likes, Favs, Kommentare, Downloads)
Beispiel: Twitter Daten
Datenzugang? Twitter APIs
• Nicht explizit für Wissenschaftler entwickelt
• Nicht rückwirkend zugänglich
• Nicht vollständig
Änderungen möglich
https://dev.twitter.com/console
EigeneUser-IDfinden:
http://www.idfromuser.com/
2013: Twitter und Wahlen
No. of Tweets No. Of publications (2013)
0-500 3
501-1.000 4
1.001-5.000 1
5.001-10.000 1
10.001-50.000 7
50.001-100.000 4
100.001-500.000 5
500.001-1.000.000. 3
1.000.001-5.000.000 3
mehr als 5.000.000 3
mehr als 100.000.000 1
mehr als 1.000.000.000 1
keine/ungenaue Angabe 13
Weller, K. (im Druck): Twitter und Wahlen: Zwischen 140 Zeichen und Milliarden von Tweets. Erscheint im R. Reichert:Big
Data. http://www.transcript-verlag.de/978-3-8376-2592-9/big-data
Chancen
Top 4: Chancen
#1
Beobachtung von spontanen
Interaktionen und flüchtiger
Kommunikation
#2
Daten sind für eine Vielzahl von
Ereignissen, Kontexten und
Fragestellungen verfügbar.
#3
„Rich data“: Multimedia plus
Netzwerke plus Interaktionen
#4
Interdisziplinäres Forschungsumfeld;
Möglichkeit, neue Methoden
auszuprobierne und zu kombinieren
Methoden & Tools
Methoden
Content Analysis
(qual. / quant.)
Umfrage / Interview)
Experiment /
Feldforschung
Mehr Methoden?
34
Methoden (in der sozialw. Twitter Forschung)
Weller, K. (2014). What do we get from Twitter – and what not? A close look at Twitter research in the social sciences. Knowledge
Organization 41(3), 238-248.
TOOLS
• Datensammlung
• Analyse
Data collection
• dapper: http://open.dapper.net/
• SocSciBot “Web crawler and link analyser for the social sciences and
humanities http://socscibot.wlv.ac.uk
• Chorus: http://www.chorusanalytics.co.uk/
• SODATO (Copenhagen Business School):
http://cssl.cbs.dk/software/sodato/
• NVivo 10 (eigenltich Tool für qualitative Inhaltsanalyse), jetzt mit
Import von Tweets, Facebook Posts, YouTube Daten, LinkedIn.
• YourTwapperkeeper – für Twitter
• Python Packages, z.B. für Wikipedia
36
Social Network Analysis
• NodeXL (mit Datenimport-Funktion)
• ORA (http://www.casos.cs.cmu.edu/projects/ora), a
social network analysis (SNA) software package, for
basic manipulations and visualization of the network
data
• UCINET (http://www.analytictech.com/ucinet)
37
Digital Methods Initiative
• https://wiki.digitalmethods.net/Dmi/ToolDatabase
GNIP
TOPSY
YourTwapperkeeper
NodeXL
Network Analysis – basierend auf Excel.
Integrierte Funktion zur Sammlung von Daten aus u.a.:
• Facebook
• Twitter
• YouTube
• Flickr
• Wikipedia
NodeXL
NodeXL
Gephi
Gephi
46
Stephen Wolfram
Daten: Facebook
http://blog.stephenwolfram.com/2013/04/data-science-of-the-facebook-world/
47
Alternative: Crowdsourcing
48
Sentiment Analysis
Dictionaries:
z.B. ANEW
NLP / Sentiment Analysis
• Discover text: http://discovertext.com/
• Twitter NLP: http://www.ark.cs.cmu.edu/TweetNLP/
• Internet Community Text Analyzer (ICTA)
http://textanalytics.net
• Twitter NLP and Part-of-Speech Tagging:
http://www.ark.cs.cmu.edu/TweetNLP/
• SentiStrength http://sentistrength.wlv.ac.uk/
• Sentiment analysis of Danish texts (by Copenhagen Business
School):
http://130.226.34.13/dh/sentiment_workshop/demo.php 50
Tool-Klassiker
• Nicht auf Social Media spezialisierte Tools, die man
aus der klassischen Methoden-Arbeit kennt.
51
Inhaltsanalyse
52
CAQDAS Computer-Assisted Qualitative Data AnalysiS
– (z.B. MAXQDA, QDAMiner, ATLAS.ti, Qualrus, Nvivo)
– Speech Act Analyse
– Statistik
 Data Science?
Oxford Internet Institute
Methoden-Guidelines: http://microsites.oii.ox.ac.uk/tidsr/welcome
Wichtig: Hintergrundwissen
54
Herausforderungen
Top 4: Herausforderungen
#1
Mangel an Theorie
Ende der Theorie?
58
because it’s there?
Big Data vs. Found Data
Ende der Theorie?
Sozialwissenschaften
1. Problem
2. Forschungsfrage/
Hypothesen
3. Theorien
4. Methoden
5. Daten
6. Analyse
7. Ergebnispräsentation
Typische Big Data-Analyse
1. Methoden
2. Daten
3. Analyse
4. Ergebnispräsentation
5. Problem
Korrelation vs. Kausalität
Pfeffer, J. (2013). Big data, big research? Opportunities and constraints for computer supported social science.
Keynote zur „Digital methods“-Tagung der DGPuK-Fachgruppe Computervermittelte Kommunikation, Wien.
Abgerufen von http://www.pfeffer.at/slides/DigitalMethods-BigData.pdf
Anfang der Theorie?
“The interesting point is that these limitations can (and have to)
be addressed by theory guided research that is typically
conducted by social scientists. Accordingly, opportunities emerge
for those social and behavioral scientists who are willing to
collaborate with the Big Data researchers in the natural,
engineering, and computer sciences.”
60
Snijders, C., Matzat, U., & Reips, U.-D. (2012). ‘Big Data’: Big gaps of knowledge in the field of Internet. International
Journal of Internet Science, 7, 1-5. Retrieved from http://www.ijis.net/ijis7_1/ijis7_1_editorial.html
#2
„data haves“ vs. „data have-nots“
boyd, danah and Kate Crawford. (2012).
“Critical Questions for Big Data”
Technische Herausforderungen
• Zugänglichkeit
• Data Sharing
• Änderungen
• Manipulation (z.B. Twitter Bomb) & Spam
• Personalisierte Ergebnisse
•  Fehlende Reproduzierbarkeit und
Nachvollziehbarkeit
62
#3
Representativität?
Local Following
Repräsentativität
“The core challenge is that most big data that have
received popular attention are not the output of
instruments designed to produce valid and reliable
data amenable for scientific analysis.“
Lazer, D., Kennedy, R., King, G., & Vespignani, A. (2014). The parable of Google Flu: Traps
in big data analysis. Science, 343(6176), 1203-1205.
Blank, G. (2014). Who uses Twitter? Representativeness of Twitter Users. Presentation at General Online Research GOR 14.
Retrieved from: http://conftool.gor.de/conftool14/index.php?page=downloadPaper&filename=Blank-
Who_uses_Twitter_Representativeness-119.pptx&form_id=119&form_version=final
34
26
8
12
18
14
10
17
12
23
28
3330
35
0
20
40
60
80
100
InterestPolitical activities
Interest
in politics
Send
political
message
Contact
MP online
Re-post
political
news
Political
comment
on SNS
Find
political
facts
Sign
online
petition
OxIS current users: 2013 N=1,613
Figure 6: Political Activities of Twitter Users
Twitter user Non-user
Repräsentativitätsprobleme auf
mehreren Ebenen
“About a third of all UK Internet users have a twitter profile; a
subset of that group are the active tweeters who produce the
bulk of content; and then a tiny subset of that group (about
1%) geocode their tweets (essential information if you want to
know about where your information is coming from).”
Graham M. (2012). Big data and the end of theory?". The Guardian. Retrieved from:
http://www.theguardian.com/news/datablog/2012/mar/09/big-data-theory
Gefahren durch fehlende Repräsentativität
• Diskussion: Menschen, die
durch Big Data nicht
repräsentiert sind
http://streetbump.org
Siehe auch: http://www.wired.com/2014/03/potholes-big-data-
crowdsourcing-way-better-government/
#4
Interdisziplinarität und
methodische Standards
Fazit
• Spannendes Forschungsfeld mit viel
Pioniergeist
• Beginnende Professionalisierung im Bereich
Methoden und Standards
Literatur• Literaturliste zum Thema Big Data in den Sozialwissenschaften:
http://kwelle.wordpress.com/2014/04/12/big-data-links-and-literature/
Literaturempfehlungen
• Ackland, R. (2013). Web Social Science. Los Angeles et al: SAGE.
• Boyd, D., & Crawford, K. (2012). Critical questions for big data: Provocations for a cultural,
technological, and scholarly phenomenon. Information, Communication, & Society, 15(5), 662-679.
• Bruns, A. (2013). Faster than the speed of print: Reconciling ‘big data’ social media analysis and
academic scholarship. First Monday 10(18). Available
http://firstmonday.org/ojs/index.php/fm/article/view/4879
• Giglietto, F., Rossi, L., & Bennato, D. (2012). The Open Laboratory: Limits and Possibilities of Using
Facebook, Twitter, and YouTube as a Research Data Source. Journal of Technology in Human Services,
30(3-4), 145–159.
• Karpf, D. (2012). Social science research methods in internet time. Information, Communication &
Society, 5(15), 639-661.
• Weller, K., Bruns, A., Burgess, J., Mahrt, M., & Puschmann, C. (2014). Twitter and Society. New York et
al.: Peter Lang.
• Williams, S. A., Terras, M. M., Warwick, C. (2013). What do people study when they study Twitter?
Classifying Twitter related academic papers. Journal of Documentation, 69(3), 384-410.
Grüße aus Köln!
73
Fragen und Feedback:
Dr. Katrin Weller
GESIS Leibniz Institute for the Social
Sciences
katrin.weller@gesis.org
@kwelle
http://katrinweller.net
74

Weitere ähnliche Inhalte

Ähnlich wie Social-Media-Forschung

Social Software in Forschung und Lehre
Social Software in Forschung und LehreSocial Software in Forschung und Lehre
Social Software in Forschung und Lehre
Katrin Weller
 
Social Media Analytics und individualisierte Kommunikation
Social Media Analytics und individualisierte KommunikationSocial Media Analytics und individualisierte Kommunikation
Social Media Analytics und individualisierte Kommunikation
Thomas Pleil
 
Kooperation und social media in der forschung
Kooperation und social media in der forschungKooperation und social media in der forschung
Kooperation und social media in der forschung
dpscheida
 
Einführung in Social Media
Einführung in Social Media Einführung in Social Media
Einführung in Social Media
Marco Jakob
 
Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...
Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...
Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...
Mareike König
 
Einführung in Social Media Wintersemester 1213
Einführung in Social Media Wintersemester 1213Einführung in Social Media Wintersemester 1213
Einführung in Social Media Wintersemester 1213
Marco Jakob
 
Social Media im pädagogischen Alltag
Social Media im pädagogischen AlltagSocial Media im pädagogischen Alltag
Social Media im pädagogischen AlltagJakob Steinschaden
 
Seminar Social Media Marketing WS11/12
Seminar Social Media Marketing WS11/12Seminar Social Media Marketing WS11/12
Seminar Social Media Marketing WS11/12
Marco Jakob
 
Kommunikationswissenschaftliche Onlineforschung
Kommunikationswissenschaftliche OnlineforschungKommunikationswissenschaftliche Onlineforschung
Kommunikationswissenschaftliche Onlineforschung
Jan Schmidt
 
Neue Öffentlichkeiten im Social Web
Neue Öffentlichkeiten im Social WebNeue Öffentlichkeiten im Social Web
Neue Öffentlichkeiten im Social Web
Jan Schmidt
 
Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...
Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...
Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...Kathi Woitas
 
Soziale Medien als Intermediäre der Meinungsbildung und Nachrichtenvermittlung
Soziale Medien als Intermediäre der Meinungsbildung und NachrichtenvermittlungSoziale Medien als Intermediäre der Meinungsbildung und Nachrichtenvermittlung
Soziale Medien als Intermediäre der Meinungsbildung und Nachrichtenvermittlung
Jan Schmidt
 
Face the facebook: Social Media Market Research
Face the facebook: Social Media Market Research Face the facebook: Social Media Market Research
Face the facebook: Social Media Market Research
Holger Lütters
 
Ergebnisse BVCM-Studie: Social-Media und Community Management in D-A-CH
Ergebnisse BVCM-Studie: Social-Media und Community Management in D-A-CHErgebnisse BVCM-Studie: Social-Media und Community Management in D-A-CH
Ergebnisse BVCM-Studie: Social-Media und Community Management in D-A-CH
BVCM
 
Wissensmanagement studierender mit social network werkzeugen 4
Wissensmanagement studierender mit social network werkzeugen 4 Wissensmanagement studierender mit social network werkzeugen 4
Wissensmanagement studierender mit social network werkzeugen 4
Kai Sostmann
 
Warum Forschungseinrichtungen Social Media nutzen (sollten)
Warum Forschungseinrichtungen Social Media nutzen (sollten)Warum Forschungseinrichtungen Social Media nutzen (sollten)
Warum Forschungseinrichtungen Social Media nutzen (sollten)Alexander Stocker
 
Big data - Gewinnung, Auswertung und Darstellung großer Mengen onlinegenerier...
Big data - Gewinnung, Auswertung und Darstellung großer Mengen onlinegenerier...Big data - Gewinnung, Auswertung und Darstellung großer Mengen onlinegenerier...
Big data - Gewinnung, Auswertung und Darstellung großer Mengen onlinegenerier...
Katrin Weller
 
Neue Öffentlichkeiten Hürth 2009 Print
Neue Öffentlichkeiten Hürth 2009 PrintNeue Öffentlichkeiten Hürth 2009 Print
Neue Öffentlichkeiten Hürth 2009 Print
Jan Schmidt
 
Orientierung in Öffentlichkeiten des Social Web
Orientierung in Öffentlichkeiten des Social WebOrientierung in Öffentlichkeiten des Social Web
Orientierung in Öffentlichkeiten des Social Web
Jan Schmidt
 

Ähnlich wie Social-Media-Forschung (20)

Social Software in Forschung und Lehre
Social Software in Forschung und LehreSocial Software in Forschung und Lehre
Social Software in Forschung und Lehre
 
Social Media Analytics und individualisierte Kommunikation
Social Media Analytics und individualisierte KommunikationSocial Media Analytics und individualisierte Kommunikation
Social Media Analytics und individualisierte Kommunikation
 
Kooperation und social media in der forschung
Kooperation und social media in der forschungKooperation und social media in der forschung
Kooperation und social media in der forschung
 
Einführung in Social Media
Einführung in Social Media Einführung in Social Media
Einführung in Social Media
 
Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...
Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...
Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...
 
Einführung in Social Media Wintersemester 1213
Einführung in Social Media Wintersemester 1213Einführung in Social Media Wintersemester 1213
Einführung in Social Media Wintersemester 1213
 
Social Media im pädagogischen Alltag
Social Media im pädagogischen AlltagSocial Media im pädagogischen Alltag
Social Media im pädagogischen Alltag
 
Seminar Social Media Marketing WS11/12
Seminar Social Media Marketing WS11/12Seminar Social Media Marketing WS11/12
Seminar Social Media Marketing WS11/12
 
Kommunikationswissenschaftliche Onlineforschung
Kommunikationswissenschaftliche OnlineforschungKommunikationswissenschaftliche Onlineforschung
Kommunikationswissenschaftliche Onlineforschung
 
Neue Öffentlichkeiten im Social Web
Neue Öffentlichkeiten im Social WebNeue Öffentlichkeiten im Social Web
Neue Öffentlichkeiten im Social Web
 
Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...
Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...
Soziale Netzwerke für die Wissenschaften - Vernetzen, informieren und up-to-d...
 
Soziale Medien als Intermediäre der Meinungsbildung und Nachrichtenvermittlung
Soziale Medien als Intermediäre der Meinungsbildung und NachrichtenvermittlungSoziale Medien als Intermediäre der Meinungsbildung und Nachrichtenvermittlung
Soziale Medien als Intermediäre der Meinungsbildung und Nachrichtenvermittlung
 
Face the facebook: Social Media Market Research
Face the facebook: Social Media Market Research Face the facebook: Social Media Market Research
Face the facebook: Social Media Market Research
 
Ergebnisse BVCM-Studie: Social-Media und Community Management in D-A-CH
Ergebnisse BVCM-Studie: Social-Media und Community Management in D-A-CHErgebnisse BVCM-Studie: Social-Media und Community Management in D-A-CH
Ergebnisse BVCM-Studie: Social-Media und Community Management in D-A-CH
 
Social Media Workshop
Social Media WorkshopSocial Media Workshop
Social Media Workshop
 
Wissensmanagement studierender mit social network werkzeugen 4
Wissensmanagement studierender mit social network werkzeugen 4 Wissensmanagement studierender mit social network werkzeugen 4
Wissensmanagement studierender mit social network werkzeugen 4
 
Warum Forschungseinrichtungen Social Media nutzen (sollten)
Warum Forschungseinrichtungen Social Media nutzen (sollten)Warum Forschungseinrichtungen Social Media nutzen (sollten)
Warum Forschungseinrichtungen Social Media nutzen (sollten)
 
Big data - Gewinnung, Auswertung und Darstellung großer Mengen onlinegenerier...
Big data - Gewinnung, Auswertung und Darstellung großer Mengen onlinegenerier...Big data - Gewinnung, Auswertung und Darstellung großer Mengen onlinegenerier...
Big data - Gewinnung, Auswertung und Darstellung großer Mengen onlinegenerier...
 
Neue Öffentlichkeiten Hürth 2009 Print
Neue Öffentlichkeiten Hürth 2009 PrintNeue Öffentlichkeiten Hürth 2009 Print
Neue Öffentlichkeiten Hürth 2009 Print
 
Orientierung in Öffentlichkeiten des Social Web
Orientierung in Öffentlichkeiten des Social WebOrientierung in Öffentlichkeiten des Social Web
Orientierung in Öffentlichkeiten des Social Web
 

Mehr von Katrin Weller

Weller pleasures+perils social media
Weller pleasures+perils social mediaWeller pleasures+perils social media
Weller pleasures+perils social media
Katrin Weller
 
Weller social media as research data_psm15
Weller social media as research data_psm15Weller social media as research data_psm15
Weller social media as research data_psm15
Katrin Weller
 
Fail ir16 intro
Fail ir16 introFail ir16 intro
Fail ir16 intro
Katrin Weller
 
Fail! workshop introduction at Web Science Conference
Fail! workshop introduction at Web Science ConferenceFail! workshop introduction at Web Science Conference
Fail! workshop introduction at Web Science Conference
Katrin Weller
 
Challenges in-archiving-twitter
Challenges in-archiving-twitterChallenges in-archiving-twitter
Challenges in-archiving-twitter
Katrin Weller
 
The digital traces of user generated content
The digital traces of user generated contentThe digital traces of user generated content
The digital traces of user generated content
Katrin Weller
 
The Hidden Data of Social Media Rearch_CSS-winter-symposium
The Hidden Data of Social Media Rearch_CSS-winter-symposiumThe Hidden Data of Social Media Rearch_CSS-winter-symposium
The Hidden Data of Social Media Rearch_CSS-winter-symposium
Katrin Weller
 
Publishing with impact
Publishing with impactPublishing with impact
Publishing with impact
Katrin Weller
 
"I always feel it must be great to be a hacker"
"I always feel it must be great to be a hacker" "I always feel it must be great to be a hacker"
"I always feel it must be great to be a hacker"
Katrin Weller
 
Hidden Data of Social Media Research
Hidden Data of Social Media ResearchHidden Data of Social Media Research
Hidden Data of Social Media Research
Katrin Weller
 
What’s new in social media research?
What’s new in social media research?What’s new in social media research?
What’s new in social media research?
Katrin Weller
 
Social Media Research Methods
Social Media Research MethodsSocial Media Research Methods
Social Media Research Methods
Katrin Weller
 
Quantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media DatenQuantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media DatenKatrin Weller
 
The pleasures and perils of studying Twitter
The pleasures and perils of studying TwitterThe pleasures and perils of studying Twitter
The pleasures and perils of studying Twitter
Katrin Weller
 
Friends or Followers. German Soccer Clubs and Their Fans on Twitter
Friends or Followers. German Soccer Clubs and Their Fans on TwitterFriends or Followers. German Soccer Clubs and Their Fans on Twitter
Friends or Followers. German Soccer Clubs and Their Fans on Twitter
Katrin Weller
 
What do we get from Twitter - and what not?
What do we get from Twitter - and what not?What do we get from Twitter - and what not?
What do we get from Twitter - and what not?
Katrin Weller
 
Twitter research overview
Twitter research overviewTwitter research overview
Twitter research overview
Katrin Weller
 
Tweeting the news
Tweeting the news Tweeting the news
Tweeting the news
Katrin Weller
 
Diata12 opening: Twitter research in Düsseldorf
Diata12 opening: Twitter research in DüsseldorfDiata12 opening: Twitter research in Düsseldorf
Diata12 opening: Twitter research in Düsseldorf
Katrin Weller
 
Twitter tipps online11
Twitter tipps online11Twitter tipps online11
Twitter tipps online11
Katrin Weller
 

Mehr von Katrin Weller (20)

Weller pleasures+perils social media
Weller pleasures+perils social mediaWeller pleasures+perils social media
Weller pleasures+perils social media
 
Weller social media as research data_psm15
Weller social media as research data_psm15Weller social media as research data_psm15
Weller social media as research data_psm15
 
Fail ir16 intro
Fail ir16 introFail ir16 intro
Fail ir16 intro
 
Fail! workshop introduction at Web Science Conference
Fail! workshop introduction at Web Science ConferenceFail! workshop introduction at Web Science Conference
Fail! workshop introduction at Web Science Conference
 
Challenges in-archiving-twitter
Challenges in-archiving-twitterChallenges in-archiving-twitter
Challenges in-archiving-twitter
 
The digital traces of user generated content
The digital traces of user generated contentThe digital traces of user generated content
The digital traces of user generated content
 
The Hidden Data of Social Media Rearch_CSS-winter-symposium
The Hidden Data of Social Media Rearch_CSS-winter-symposiumThe Hidden Data of Social Media Rearch_CSS-winter-symposium
The Hidden Data of Social Media Rearch_CSS-winter-symposium
 
Publishing with impact
Publishing with impactPublishing with impact
Publishing with impact
 
"I always feel it must be great to be a hacker"
"I always feel it must be great to be a hacker" "I always feel it must be great to be a hacker"
"I always feel it must be great to be a hacker"
 
Hidden Data of Social Media Research
Hidden Data of Social Media ResearchHidden Data of Social Media Research
Hidden Data of Social Media Research
 
What’s new in social media research?
What’s new in social media research?What’s new in social media research?
What’s new in social media research?
 
Social Media Research Methods
Social Media Research MethodsSocial Media Research Methods
Social Media Research Methods
 
Quantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media DatenQuantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media Daten
 
The pleasures and perils of studying Twitter
The pleasures and perils of studying TwitterThe pleasures and perils of studying Twitter
The pleasures and perils of studying Twitter
 
Friends or Followers. German Soccer Clubs and Their Fans on Twitter
Friends or Followers. German Soccer Clubs and Their Fans on TwitterFriends or Followers. German Soccer Clubs and Their Fans on Twitter
Friends or Followers. German Soccer Clubs and Their Fans on Twitter
 
What do we get from Twitter - and what not?
What do we get from Twitter - and what not?What do we get from Twitter - and what not?
What do we get from Twitter - and what not?
 
Twitter research overview
Twitter research overviewTwitter research overview
Twitter research overview
 
Tweeting the news
Tweeting the news Tweeting the news
Tweeting the news
 
Diata12 opening: Twitter research in Düsseldorf
Diata12 opening: Twitter research in DüsseldorfDiata12 opening: Twitter research in Düsseldorf
Diata12 opening: Twitter research in Düsseldorf
 
Twitter tipps online11
Twitter tipps online11Twitter tipps online11
Twitter tipps online11
 

Social-Media-Forschung

  • 1. Social Media Daten als Grundlage sozialwissenschaftlicher Forschung: Chancen und Herausforderungen Kassel, 11.06.2014 Dr. Katrin Weller, katrin.weller@gesis.org, @kwelle http://katrinweller.net
  • 2. Dr. Katrin Weller GESIS – Leibniz Institut für Sozialwissenschaften Datenarchiv für Sozialwissenschaften 2006-2012: Heinrich-Heine-Universität Düsseldorf, Promotion in Informationswissenschaft Weller, K., Bruns, A., Burgess, J., Mahrt, M., & Puschmann, C. (Eds.) (2014). Twitter and Society. New York et al.: Peter Lang.
  • 3. Fragen & Kommentare Slides: http://de.slideshare.net/katrinweller
  • 6. © Statista Von welchen der folgenden Netzwerke und Plattformen haben Sie schon gehört? Umfrage zur Bekanntheit von Social Media Plattformen in Deutschland (2012) 30 40 55 56 58 62 67 68 69 71 72 80 87 96 Yappy Flickr Xing Lokalisten MeinVZ MyVideo MySpace SchülerVZ StudiVZ Stayfriends Wer-kennt-… Twitter YouTube Facebook 0 20 40 60 80 100 120 Anteil der Befragten in % Quelle: PwC, Entwicklung sozialer Medien im Vergleich, Seite 11 ID 76144 http://de.statista.com/statistik/daten/studie/76144/umfrage/umfrage-zur-bekanntheit-von-social-media-plattformen-in-deutschland/
  • 7. Social Media Forschung in (Publikations)zahlen 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Anzahl an Publikationen in Scopus (TITLE-ABS-KEY("social media") OR TITLE-ABS-KEY("social web") OR TITLE-ABS-KEY("social software") OR TITLE-ABS-KEY("web 2.0")) AND PUBYEAR > 1999 [ März 2014]
  • 8. Publikationen nach Fachgebieten (Scopus) 10650; 36% 5542; 19% 2384 2288 2151 1535 773 772 65 Computer Science Social Sciences Engineering Medicine Business, Management and Accounting Mathematics Arts and Humanities Decision Sciences Psychology Nursing Economics, Econometrics and Finance Biochemistry, Genetics and Molecular Biology Health Professions Environmental Science Earth and Planetary Sciences Agricultural and Biological Sciences Pharmacology, Toxicology and Pharmaceutics Physics and Astronomy Materials Science Multidisciplinary Neuroscience Immunology and Microbiology Chemical Engineering Veterinary Dentistry Chemistry Energy
  • 16. Was wird erforscht? • Nutzergruppen • Ereignisse • Zielgruppen • Nutzungspraxis • Informationsflüsse • Einfluss • Meinungen und Stimmungen • Netzwerke • Interaktionen • …
  • 18. Social Media Daten • Texte • Bilder • Videos • Multimedia • Verbindungen I (Freunde, Follower) • Verbindungen II (Links/URLs) • Verbindungen/Aktionen (Likes, Favs, Kommentare, Downloads)
  • 20. Datenzugang? Twitter APIs • Nicht explizit für Wissenschaftler entwickelt • Nicht rückwirkend zugänglich • Nicht vollständig Änderungen möglich
  • 22.
  • 23.
  • 24. 2013: Twitter und Wahlen No. of Tweets No. Of publications (2013) 0-500 3 501-1.000 4 1.001-5.000 1 5.001-10.000 1 10.001-50.000 7 50.001-100.000 4 100.001-500.000 5 500.001-1.000.000. 3 1.000.001-5.000.000 3 mehr als 5.000.000 3 mehr als 100.000.000 1 mehr als 1.000.000.000 1 keine/ungenaue Angabe 13 Weller, K. (im Druck): Twitter und Wahlen: Zwischen 140 Zeichen und Milliarden von Tweets. Erscheint im R. Reichert:Big Data. http://www.transcript-verlag.de/978-3-8376-2592-9/big-data
  • 27. #1 Beobachtung von spontanen Interaktionen und flüchtiger Kommunikation
  • 28. #2 Daten sind für eine Vielzahl von Ereignissen, Kontexten und Fragestellungen verfügbar.
  • 29. #3 „Rich data“: Multimedia plus Netzwerke plus Interaktionen
  • 30. #4 Interdisziplinäres Forschungsumfeld; Möglichkeit, neue Methoden auszuprobierne und zu kombinieren
  • 32. Methoden Content Analysis (qual. / quant.) Umfrage / Interview) Experiment / Feldforschung
  • 34. 34 Methoden (in der sozialw. Twitter Forschung) Weller, K. (2014). What do we get from Twitter – and what not? A close look at Twitter research in the social sciences. Knowledge Organization 41(3), 238-248.
  • 36. Data collection • dapper: http://open.dapper.net/ • SocSciBot “Web crawler and link analyser for the social sciences and humanities http://socscibot.wlv.ac.uk • Chorus: http://www.chorusanalytics.co.uk/ • SODATO (Copenhagen Business School): http://cssl.cbs.dk/software/sodato/ • NVivo 10 (eigenltich Tool für qualitative Inhaltsanalyse), jetzt mit Import von Tweets, Facebook Posts, YouTube Daten, LinkedIn. • YourTwapperkeeper – für Twitter • Python Packages, z.B. für Wikipedia 36
  • 37. Social Network Analysis • NodeXL (mit Datenimport-Funktion) • ORA (http://www.casos.cs.cmu.edu/projects/ora), a social network analysis (SNA) software package, for basic manipulations and visualization of the network data • UCINET (http://www.analytictech.com/ucinet) 37
  • 38. Digital Methods Initiative • https://wiki.digitalmethods.net/Dmi/ToolDatabase
  • 39. GNIP
  • 40. TOPSY
  • 42. NodeXL Network Analysis – basierend auf Excel. Integrierte Funktion zur Sammlung von Daten aus u.a.: • Facebook • Twitter • YouTube • Flickr • Wikipedia
  • 45. Gephi
  • 48. 48
  • 50. NLP / Sentiment Analysis • Discover text: http://discovertext.com/ • Twitter NLP: http://www.ark.cs.cmu.edu/TweetNLP/ • Internet Community Text Analyzer (ICTA) http://textanalytics.net • Twitter NLP and Part-of-Speech Tagging: http://www.ark.cs.cmu.edu/TweetNLP/ • SentiStrength http://sentistrength.wlv.ac.uk/ • Sentiment analysis of Danish texts (by Copenhagen Business School): http://130.226.34.13/dh/sentiment_workshop/demo.php 50
  • 51. Tool-Klassiker • Nicht auf Social Media spezialisierte Tools, die man aus der klassischen Methoden-Arbeit kennt. 51
  • 52. Inhaltsanalyse 52 CAQDAS Computer-Assisted Qualitative Data AnalysiS – (z.B. MAXQDA, QDAMiner, ATLAS.ti, Qualrus, Nvivo) – Speech Act Analyse – Statistik  Data Science?
  • 53. Oxford Internet Institute Methoden-Guidelines: http://microsites.oii.ox.ac.uk/tidsr/welcome
  • 58. Ende der Theorie? 58 because it’s there? Big Data vs. Found Data
  • 59. Ende der Theorie? Sozialwissenschaften 1. Problem 2. Forschungsfrage/ Hypothesen 3. Theorien 4. Methoden 5. Daten 6. Analyse 7. Ergebnispräsentation Typische Big Data-Analyse 1. Methoden 2. Daten 3. Analyse 4. Ergebnispräsentation 5. Problem Korrelation vs. Kausalität Pfeffer, J. (2013). Big data, big research? Opportunities and constraints for computer supported social science. Keynote zur „Digital methods“-Tagung der DGPuK-Fachgruppe Computervermittelte Kommunikation, Wien. Abgerufen von http://www.pfeffer.at/slides/DigitalMethods-BigData.pdf
  • 60. Anfang der Theorie? “The interesting point is that these limitations can (and have to) be addressed by theory guided research that is typically conducted by social scientists. Accordingly, opportunities emerge for those social and behavioral scientists who are willing to collaborate with the Big Data researchers in the natural, engineering, and computer sciences.” 60 Snijders, C., Matzat, U., & Reips, U.-D. (2012). ‘Big Data’: Big gaps of knowledge in the field of Internet. International Journal of Internet Science, 7, 1-5. Retrieved from http://www.ijis.net/ijis7_1/ijis7_1_editorial.html
  • 61. #2 „data haves“ vs. „data have-nots“ boyd, danah and Kate Crawford. (2012). “Critical Questions for Big Data”
  • 62. Technische Herausforderungen • Zugänglichkeit • Data Sharing • Änderungen • Manipulation (z.B. Twitter Bomb) & Spam • Personalisierte Ergebnisse •  Fehlende Reproduzierbarkeit und Nachvollziehbarkeit 62
  • 65. Repräsentativität “The core challenge is that most big data that have received popular attention are not the output of instruments designed to produce valid and reliable data amenable for scientific analysis.“ Lazer, D., Kennedy, R., King, G., & Vespignani, A. (2014). The parable of Google Flu: Traps in big data analysis. Science, 343(6176), 1203-1205.
  • 66. Blank, G. (2014). Who uses Twitter? Representativeness of Twitter Users. Presentation at General Online Research GOR 14. Retrieved from: http://conftool.gor.de/conftool14/index.php?page=downloadPaper&filename=Blank- Who_uses_Twitter_Representativeness-119.pptx&form_id=119&form_version=final 34 26 8 12 18 14 10 17 12 23 28 3330 35 0 20 40 60 80 100 InterestPolitical activities Interest in politics Send political message Contact MP online Re-post political news Political comment on SNS Find political facts Sign online petition OxIS current users: 2013 N=1,613 Figure 6: Political Activities of Twitter Users Twitter user Non-user
  • 67. Repräsentativitätsprobleme auf mehreren Ebenen “About a third of all UK Internet users have a twitter profile; a subset of that group are the active tweeters who produce the bulk of content; and then a tiny subset of that group (about 1%) geocode their tweets (essential information if you want to know about where your information is coming from).” Graham M. (2012). Big data and the end of theory?". The Guardian. Retrieved from: http://www.theguardian.com/news/datablog/2012/mar/09/big-data-theory
  • 68. Gefahren durch fehlende Repräsentativität • Diskussion: Menschen, die durch Big Data nicht repräsentiert sind http://streetbump.org Siehe auch: http://www.wired.com/2014/03/potholes-big-data- crowdsourcing-way-better-government/
  • 70.
  • 71. Fazit • Spannendes Forschungsfeld mit viel Pioniergeist • Beginnende Professionalisierung im Bereich Methoden und Standards
  • 72. Literatur• Literaturliste zum Thema Big Data in den Sozialwissenschaften: http://kwelle.wordpress.com/2014/04/12/big-data-links-and-literature/ Literaturempfehlungen • Ackland, R. (2013). Web Social Science. Los Angeles et al: SAGE. • Boyd, D., & Crawford, K. (2012). Critical questions for big data: Provocations for a cultural, technological, and scholarly phenomenon. Information, Communication, & Society, 15(5), 662-679. • Bruns, A. (2013). Faster than the speed of print: Reconciling ‘big data’ social media analysis and academic scholarship. First Monday 10(18). Available http://firstmonday.org/ojs/index.php/fm/article/view/4879 • Giglietto, F., Rossi, L., & Bennato, D. (2012). The Open Laboratory: Limits and Possibilities of Using Facebook, Twitter, and YouTube as a Research Data Source. Journal of Technology in Human Services, 30(3-4), 145–159. • Karpf, D. (2012). Social science research methods in internet time. Information, Communication & Society, 5(15), 639-661. • Weller, K., Bruns, A., Burgess, J., Mahrt, M., & Puschmann, C. (2014). Twitter and Society. New York et al.: Peter Lang. • Williams, S. A., Terras, M. M., Warwick, C. (2013). What do people study when they study Twitter? Classifying Twitter related academic papers. Journal of Documentation, 69(3), 384-410.
  • 74. Fragen und Feedback: Dr. Katrin Weller GESIS Leibniz Institute for the Social Sciences katrin.weller@gesis.org @kwelle http://katrinweller.net 74