SlideShare ist ein Scribd-Unternehmen logo
1 von 27
Downloaden Sie, um offline zu lesen
Digitale Methoden in den Sozial- und
Geisteswissenschaften: Chancen und
         Herausforderungen

                  Dr. Cornelius Puschmann
     Berlin School of Library and Information Science /
        Humboldt Institute for Internet and Society
          Göttingen Center for Digital Humanities
             Ringvorlesung „Internet & Society“
                    17. Dezember 2012
Inhalt

            #1
„Digitale Methoden“ -- ein
   Einordnungsversuch

                              #2
            Analysen anhand von Social Media-Daten

           #3
Potentiale und Probleme
  digitaler Methoden
„Internetforschung?“

                              Netz als Datenquelle


                       Netz als Gegenstand


      Netz als Forschungsinfrastruktur
Text- und Korpusananalyse

                                 Netzwerkanalyse
Bildanalyse


               „Digitale Methoden“


Sentimentanalyse                     Visualisierung

                   Maschinenlernverfahren
Durch das Internet und die steigende Beliebtheit von
Social Media-Diensten gewinnen Forschungsansätze für
den Umgang mit digitalen Kommunikationsdaten an
Relevanz:
• digital methods (Rogers, 2009)
• cultural analytics (Manovich, 2007)
• computational social science (Lazer et al, 2009)
Issue Crawler (Rogers et al)
ImagePlot (Manovich/Software Studies Initiative)
„Digitale Methoden“

Software                   Datenquellen
• open source              • große Zahl von Quellen
• benutzerfreundlich   +
                             unterschiedlicher Daten
• leistungsstark           • Netz-nativ und
                             digitalisiert
                           • größtenteils öffentlich
Quelle: http://socialmediainbusiness.com
Web 1.0
• kaum nutzergenerierte
  Inhalte
• kein einfacher Zugriff auf
  Daten (scraping)



                       Web 2.0
                       • große Menge nutzergenerierter
                         Inhalte
                       • besserer Zugriff auf Daten über
                         Programmierschnittstellen (APIs)
Zugang                           Kontrolle




TOS                                                     API
“law”    regeln Umgang   Daten   ermöglicht Zugriff   “code”




        Besitz                     Interpretation
Was sind die Implikationen von „Big Data“?

“There are also significant questions of truth, control, and
power in Big Data studies: researchers have the tools and the
access, while social media users as a whole do not. Their data
were created in highly context-sensitive spaces, and it is entirely
possible that some users would not give permission for their
data to be used elsewhere.”
(boyd & Crawford, 2012, p.12)
Beispiel Twitter


• Mikroblog/Online-Kurznachrichtendienst,
  gestartet 2006
• inzwischen 500 Millionen aktive Benutzer
• wird für die Verbreitung von Nachrichten,
  öffentliche Kommunikation genutzt
• Daten größtenteils über API öffentlich
  zugänglich
Daten aus Twitter extrahieren

HTTP request
           liefere alle Daten eines bestimmten Users/von einem
                             bestimmten Ort/...


                Application Programming
                     Interface (API)



                                                                 Daten*
Archivieren von Tweets via yourTwapperKeeper
Software

Sammeln:

 •   The Archivist (Windows)

 •   yourTwapperKeeper (erfordert Webserver)

 •   140kit.com (web-basierte Plattform)
Analysieren:

 •   Excel, Open Office Calc, SPSS, R, Google Docs..
Visualisieren:

 •   (Excel, OO Calc, R), Gephi, NodeXL
Rechtliche und ethische
            Hürden
• Daten dürfen nicht weitergegeben werden
  (Twitter Terms of Service)
• Datenschutzrichtlinien müssen eingehalten
  werden (etwa European Data Protection
  Directive)
• ethische Fragen stellen sich auch dann,
  wenn die Daten öffentlich sind!
Beispiel: eine Untersuchung der akademischen
Blogplattform hypotheses.org
0   500   1000   1500




2004−01
2004−02
2004−03
2004−04
2004−05
2004−06
2004−07
2004−08
2004−09
2004−10
2004−11
2004−12
2005−01
2005−02
2005−03
2005−04
2005−05
2005−06
2005−07
2005−08
2005−09
2005−10
2005−11
2005−12
2006−01
2006−02
2006−03
2006−04
2006−05
2006−06
2006−07
2006−08
2006−09
2006−10
2006−11
2006−12
2007−01
2007−02
2007−03
2007−04
2007−05
2007−06
2007−07
2007−08
2007−09
2007−10
2007−11
2007−12
2008−01
2008−02
2008−03
2008−04
2008−05
2008−06
2008−07
2008−08
2008−09
2008−10
2008−11
2008−12
                                              Posts per 2004 - 2004−01




2009−01
2009−02
2009−03
2009−04
                                  Aktivität Januar month startingJuli 2012




2009−05
2009−06
2009−07
2009−08
2009−09
2009−10
2009−11
2009−12
2010−01
2010−02
                                                                             Blogplattform hypotheses.org




2010−03
2010−04
2010−05
2010−06
2010−07
2010−08
2010−09
2010−10
2010−11
2010−12
2011−01
2011−02
2011−03
2011−04
2011−05
2011−06
2011−07
2011−08
2011−09
2011−10
2011−11
2011−12
2012−01
2012−02
2012−03
2012−04
2012−05
2012−06
2012−07
Blogplattform hypotheses.org
                                                                  Aktivste Blogs10nach Beiträgen (n=45.528)
                                                                              Top  Blogs by numer of posts (n=45528)
6000
5000
4000
3000
2000
1000
0




       Indústrias Culturais   Criminocorpus Radar   Veille énergie climat   Veille sur la Corée   Le Cresson veille   Corps et Médecine   URFIST Info   No Mundo dos Museus   Nuevo Mundo radar   Blog de l'IRHiS
Blogplattform hypotheses.org
           Sprachen
Blogplattform hypotheses.org
    Verlinkungen externer Webseiten
Offene Fragen:
• Wem gehören die Daten?
• Wie wird die Privatsphäre der Nutzer gewahrt?
• Wer sichert die Qualität der Daten?
• Wie reproduzierbar sind die Ergebnisse?
• Über welche Art von Prozesse lassen sich
  Aussagen treffen?
• Wie generalisierbar sind Einzelstudien?
Potentielle Probleme:
• Wettlauf um Kompetenzen und Ressourcen
  (zwischen Fachbereichen, Wissenschaft/
  Industrie), um komplexe Phänomene
  untersuchen zu können
• Wandel der Forschungsfragen
• Stärkerer Druck zu Team- und
  Verbundforschung
Vielen Dank für Ihre Aufmerksamkeit!

Weitere ähnliche Inhalte

Was ist angesagt?

Wenn Studierende und Lehrende “zwitschern” - Einsatz von Microblogging in Leh...
Wenn Studierende und Lehrende “zwitschern” - Einsatz von Microblogging in Leh...Wenn Studierende und Lehrende “zwitschern” - Einsatz von Microblogging in Leh...
Wenn Studierende und Lehrende “zwitschern” - Einsatz von Microblogging in Leh...
Marion R. Gruber
 

Was ist angesagt? (19)

Soziale Medien in der Wissenschaftskommunikation
Soziale Medien in der WissenschaftskommunikationSoziale Medien in der Wissenschaftskommunikation
Soziale Medien in der Wissenschaftskommunikation
 
Life Sciences 2.0
Life Sciences 2.0Life Sciences 2.0
Life Sciences 2.0
 
Potentiale dunkle seiten_web20
Potentiale dunkle seiten_web20Potentiale dunkle seiten_web20
Potentiale dunkle seiten_web20
 
Open Access
Open AccessOpen Access
Open Access
 
Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...
Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...
Soziale Medien in den Geisteswissenschaften: über die Wandlung unserer Forsch...
 
Sichten auf Informationskompetenz
Sichten auf InformationskompetenzSichten auf Informationskompetenz
Sichten auf Informationskompetenz
 
Informationskompetenz in sich ständig verändernden Informationsumgebungen - z...
Informationskompetenz in sich ständig verändernden Informationsumgebungen - z...Informationskompetenz in sich ständig verändernden Informationsumgebungen - z...
Informationskompetenz in sich ständig verändernden Informationsumgebungen - z...
 
2015.03.05 blogs als wissensorte der forschung
2015.03.05 blogs als wissensorte der forschung2015.03.05 blogs als wissensorte der forschung
2015.03.05 blogs als wissensorte der forschung
 
Freie Bildungsmaterialien - warum sind diese auch in Österreich relevant?
Freie Bildungsmaterialien - warum sind diese auch in Österreich relevant?Freie Bildungsmaterialien - warum sind diese auch in Österreich relevant?
Freie Bildungsmaterialien - warum sind diese auch in Österreich relevant?
 
Impulsstatement barcamp wissenschaft 20_forschung neu denken
Impulsstatement barcamp wissenschaft 20_forschung neu denkenImpulsstatement barcamp wissenschaft 20_forschung neu denken
Impulsstatement barcamp wissenschaft 20_forschung neu denken
 
Digitales Publizieren
Digitales PublizierenDigitales Publizieren
Digitales Publizieren
 
Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim
Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim
Bibliotheken und Linked Open Data - Erfahrungen und Ideen aus der UB Mannheim
 
Social-Media-Forschung
Social-Media-ForschungSocial-Media-Forschung
Social-Media-Forschung
 
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertGoogle Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
 
Informations-/Literaturrecherche und Informations-/Literaturverwaltung im (So...
Informations-/Literaturrecherche und Informations-/Literaturverwaltung im (So...Informations-/Literaturrecherche und Informations-/Literaturverwaltung im (So...
Informations-/Literaturrecherche und Informations-/Literaturverwaltung im (So...
 
Auf den Schultern von Riesen - zur Rolle des Zitierens in der wissenschaftl...
Auf den Schultern von Riesen   - zur Rolle des Zitierens in der wissenschaftl...Auf den Schultern von Riesen   - zur Rolle des Zitierens in der wissenschaftl...
Auf den Schultern von Riesen - zur Rolle des Zitierens in der wissenschaftl...
 
Die Infrastrukturkrise in der Wissenschaft
Die Infrastrukturkrise in der WissenschaftDie Infrastrukturkrise in der Wissenschaft
Die Infrastrukturkrise in der Wissenschaft
 
Zukunft der Wissenschaftskommunikation
Zukunft der WissenschaftskommunikationZukunft der Wissenschaftskommunikation
Zukunft der Wissenschaftskommunikation
 
Wenn Studierende und Lehrende “zwitschern” - Einsatz von Microblogging in Leh...
Wenn Studierende und Lehrende “zwitschern” - Einsatz von Microblogging in Leh...Wenn Studierende und Lehrende “zwitschern” - Einsatz von Microblogging in Leh...
Wenn Studierende und Lehrende “zwitschern” - Einsatz von Microblogging in Leh...
 

Ähnlich wie Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herausforderungen

Quantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media DatenQuantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media Daten
Katrin Weller
 
Social Media Mining für Journalisten - Das Content Evaluation System (CES) by...
Social Media Mining für Journalisten - Das Content Evaluation System (CES) by...Social Media Mining für Journalisten - Das Content Evaluation System (CES) by...
Social Media Mining für Journalisten - Das Content Evaluation System (CES) by...
nextmedia_haw
 
Social Media in Wissenschaft und Bibliothek
Social Media in Wissenschaft und BibliothekSocial Media in Wissenschaft und Bibliothek
Social Media in Wissenschaft und Bibliothek
TIB Hannover
 

Ähnlich wie Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herausforderungen (20)

Opendata
OpendataOpendata
Opendata
 
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
 
Horizon Report 2015 Library Edition
Horizon Report 2015 Library EditionHorizon Report 2015 Library Edition
Horizon Report 2015 Library Edition
 
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
 
Anforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic WebAnforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic Web
 
Perspektiven eines Open Web Index
Perspektiven eines Open Web IndexPerspektiven eines Open Web Index
Perspektiven eines Open Web Index
 
Wie Suchmaschinen die Inhalte des Web interpretieren
Wie Suchmaschinen die Inhalte des Web interpretierenWie Suchmaschinen die Inhalte des Web interpretieren
Wie Suchmaschinen die Inhalte des Web interpretieren
 
Was bringt die Analyse von Facebook und Twitter für die politische Diskussion?
Was bringt die Analyse von Facebook und Twitter für die politische Diskussion?Was bringt die Analyse von Facebook und Twitter für die politische Diskussion?
Was bringt die Analyse von Facebook und Twitter für die politische Diskussion?
 
Soziale Netzwerke in der Unternehmenskommunikation
Soziale Netzwerke in der UnternehmenskommunikationSoziale Netzwerke in der Unternehmenskommunikation
Soziale Netzwerke in der Unternehmenskommunikation
 
Wissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebWissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic Web
 
Unsere forschungskultur neu denken
Unsere forschungskultur neu denkenUnsere forschungskultur neu denken
Unsere forschungskultur neu denken
 
Quantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media DatenQuantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media Daten
 
Promotion 2.0
Promotion 2.0Promotion 2.0
Promotion 2.0
 
Trends und Herausforderungen für Bibliotheken – von der Theorie zur Praxis
Trends und Herausforderungen für Bibliotheken – von der Theorie zur PraxisTrends und Herausforderungen für Bibliotheken – von der Theorie zur Praxis
Trends und Herausforderungen für Bibliotheken – von der Theorie zur Praxis
 
Wissenschaft 2.0 und offene Forschungsmethoden vermitteln: Der MOOC Science 2...
Wissenschaft 2.0 und offene Forschungsmethoden vermitteln: Der MOOC Science 2...Wissenschaft 2.0 und offene Forschungsmethoden vermitteln: Der MOOC Science 2...
Wissenschaft 2.0 und offene Forschungsmethoden vermitteln: Der MOOC Science 2...
 
Social Media Mining für Journalisten - Das Content Evaluation System (CES) by...
Social Media Mining für Journalisten - Das Content Evaluation System (CES) by...Social Media Mining für Journalisten - Das Content Evaluation System (CES) by...
Social Media Mining für Journalisten - Das Content Evaluation System (CES) by...
 
Social Media in der Wissenschaft
Social Media in der WissenschaftSocial Media in der Wissenschaft
Social Media in der Wissenschaft
 
Social Media in Wissenschaft und Bibliothek
Social Media in Wissenschaft und BibliothekSocial Media in Wissenschaft und Bibliothek
Social Media in Wissenschaft und Bibliothek
 
Web-Index-Workshop 2014
Web-Index-Workshop 2014Web-Index-Workshop 2014
Web-Index-Workshop 2014
 
Open Science: Flickschusterei in der digitalen Steinzeit
Open Science: Flickschusterei in der digitalen SteinzeitOpen Science: Flickschusterei in der digitalen Steinzeit
Open Science: Flickschusterei in der digitalen Steinzeit
 

Mehr von Cornelius Puschmann

Beyond the stars: Interpreting discourse cohesion in Twitter as an indicator ...
Beyond the stars: Interpreting discourse cohesion in Twitter as an indicator ...Beyond the stars: Interpreting discourse cohesion in Twitter as an indicator ...
Beyond the stars: Interpreting discourse cohesion in Twitter as an indicator ...
Cornelius Puschmann
 
(Academic) Community Management in the Humanities and Social Sciences for Pub...
(Academic) Community Management in the Humanities and Social Sciences for Pub...(Academic) Community Management in the Humanities and Social Sciences for Pub...
(Academic) Community Management in the Humanities and Social Sciences for Pub...
Cornelius Puschmann
 
Studying Twitter conversations as (dynamic) graphs: visualization and structu...
Studying Twitter conversations as (dynamic) graphs: visualization and structu...Studying Twitter conversations as (dynamic) graphs: visualization and structu...
Studying Twitter conversations as (dynamic) graphs: visualization and structu...
Cornelius Puschmann
 
Hourly Twitter activity under the #Jan25 hashtag
Hourly Twitter activity under the #Jan25 hashtagHourly Twitter activity under the #Jan25 hashtag
Hourly Twitter activity under the #Jan25 hashtag
Cornelius Puschmann
 
Elektronisches Publizieren und Open Access für Geistes- und Sozialwissenschaf...
Elektronisches Publizieren und Open Access für Geistes- und Sozialwissenschaf...Elektronisches Publizieren und Open Access für Geistes- und Sozialwissenschaf...
Elektronisches Publizieren und Open Access für Geistes- und Sozialwissenschaf...
Cornelius Puschmann
 

Mehr von Cornelius Puschmann (20)

Collecting Twitter Data
Collecting Twitter DataCollecting Twitter Data
Collecting Twitter Data
 
A Tale of Two Platforms: Emerging communicative patterns in two scientific bl...
A Tale of Two Platforms: Emerging communicative patterns in two scientific bl...A Tale of Two Platforms: Emerging communicative patterns in two scientific bl...
A Tale of Two Platforms: Emerging communicative patterns in two scientific bl...
 
Twitter as a data source for (socio)linguistic research
Twitter as a data source for (socio)linguistic researchTwitter as a data source for (socio)linguistic research
Twitter as a data source for (socio)linguistic research
 
Form and Function of Digital Genres of Scholarly Communication: Results of th...
Form and Function of Digital Genres of Scholarly Communication: Results of th...Form and Function of Digital Genres of Scholarly Communication: Results of th...
Form and Function of Digital Genres of Scholarly Communication: Results of th...
 
Vernetzung, Sichtbarkeit, Information: Nutzungsmotive informeller digitaler K...
Vernetzung, Sichtbarkeit, Information: Nutzungsmotive informeller digitaler K...Vernetzung, Sichtbarkeit, Information: Nutzungsmotive informeller digitaler K...
Vernetzung, Sichtbarkeit, Information: Nutzungsmotive informeller digitaler K...
 
The Pragmatics of Retweeting
The Pragmatics of RetweetingThe Pragmatics of Retweeting
The Pragmatics of Retweeting
 
Data Access, Ownership and Control in Social Web Services: Issues for Twitter...
Data Access, Ownership and Control in Social Web Services: Issues for Twitter...Data Access, Ownership and Control in Social Web Services: Issues for Twitter...
Data Access, Ownership and Control in Social Web Services: Issues for Twitter...
 
Knowledge or Credit? The (Un)changing Face of Academic Publishing from the Ph...
Knowledge or Credit? The (Un)changing Face of Academic Publishing from the Ph...Knowledge or Credit? The (Un)changing Face of Academic Publishing from the Ph...
Knowledge or Credit? The (Un)changing Face of Academic Publishing from the Ph...
 
Wissenschaftliche Blogs: Schnittstelle zur Öffentlichkeit oder virtueller Elf...
Wissenschaftliche Blogs: Schnittstelle zur Öffentlichkeit oder virtueller Elf...Wissenschaftliche Blogs: Schnittstelle zur Öffentlichkeit oder virtueller Elf...
Wissenschaftliche Blogs: Schnittstelle zur Öffentlichkeit oder virtueller Elf...
 
Beyond the stars: Interpreting discourse cohesion in Twitter as an indicator ...
Beyond the stars: Interpreting discourse cohesion in Twitter as an indicator ...Beyond the stars: Interpreting discourse cohesion in Twitter as an indicator ...
Beyond the stars: Interpreting discourse cohesion in Twitter as an indicator ...
 
(Academic) Community Management in the Humanities and Social Sciences for Pub...
(Academic) Community Management in the Humanities and Social Sciences for Pub...(Academic) Community Management in the Humanities and Social Sciences for Pub...
(Academic) Community Management in the Humanities and Social Sciences for Pub...
 
Doing A Small-Scale Diachronic Twitter User Study
Doing A Small-Scale Diachronic Twitter User StudyDoing A Small-Scale Diachronic Twitter User Study
Doing A Small-Scale Diachronic Twitter User Study
 
Social data: what it is, who owns it, and why you should care
Social data: what it is, who owns it, and why you should careSocial data: what it is, who owns it, and why you should care
Social data: what it is, who owns it, and why you should care
 
Twitter zwischen Nachrichtenkanal und Mikronarrativ
Twitter zwischen Nachrichtenkanal und MikronarrativTwitter zwischen Nachrichtenkanal und Mikronarrativ
Twitter zwischen Nachrichtenkanal und Mikronarrativ
 
#www2010 user activity chart
#www2010 user activity chart#www2010 user activity chart
#www2010 user activity chart
 
#s21 user activity chart
#s21 user activity chart#s21 user activity chart
#s21 user activity chart
 
Studying Twitter conversations as (dynamic) graphs: visualization and structu...
Studying Twitter conversations as (dynamic) graphs: visualization and structu...Studying Twitter conversations as (dynamic) graphs: visualization and structu...
Studying Twitter conversations as (dynamic) graphs: visualization and structu...
 
Hourly Twitter activity under the #Jan25 hashtag
Hourly Twitter activity under the #Jan25 hashtagHourly Twitter activity under the #Jan25 hashtag
Hourly Twitter activity under the #Jan25 hashtag
 
Elektronisches Publizieren und Open Access für Geistes- und Sozialwissenschaf...
Elektronisches Publizieren und Open Access für Geistes- und Sozialwissenschaf...Elektronisches Publizieren und Open Access für Geistes- und Sozialwissenschaf...
Elektronisches Publizieren und Open Access für Geistes- und Sozialwissenschaf...
 
Mehr Offenheit, bitte! Wikipedia und Creative Commons an der Schnittstelle zw...
Mehr Offenheit, bitte! Wikipedia und Creative Commons an der Schnittstelle zw...Mehr Offenheit, bitte! Wikipedia und Creative Commons an der Schnittstelle zw...
Mehr Offenheit, bitte! Wikipedia und Creative Commons an der Schnittstelle zw...
 

Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herausforderungen

  • 1. Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herausforderungen Dr. Cornelius Puschmann Berlin School of Library and Information Science / Humboldt Institute for Internet and Society Göttingen Center for Digital Humanities Ringvorlesung „Internet & Society“ 17. Dezember 2012
  • 2. Inhalt #1 „Digitale Methoden“ -- ein Einordnungsversuch #2 Analysen anhand von Social Media-Daten #3 Potentiale und Probleme digitaler Methoden
  • 3. „Internetforschung?“ Netz als Datenquelle Netz als Gegenstand Netz als Forschungsinfrastruktur
  • 4. Text- und Korpusananalyse Netzwerkanalyse Bildanalyse „Digitale Methoden“ Sentimentanalyse Visualisierung Maschinenlernverfahren
  • 5. Durch das Internet und die steigende Beliebtheit von Social Media-Diensten gewinnen Forschungsansätze für den Umgang mit digitalen Kommunikationsdaten an Relevanz: • digital methods (Rogers, 2009) • cultural analytics (Manovich, 2007) • computational social science (Lazer et al, 2009)
  • 8. „Digitale Methoden“ Software Datenquellen • open source • große Zahl von Quellen • benutzerfreundlich + unterschiedlicher Daten • leistungsstark • Netz-nativ und digitalisiert • größtenteils öffentlich
  • 10. Web 1.0 • kaum nutzergenerierte Inhalte • kein einfacher Zugriff auf Daten (scraping) Web 2.0 • große Menge nutzergenerierter Inhalte • besserer Zugriff auf Daten über Programmierschnittstellen (APIs)
  • 11. Zugang Kontrolle TOS API “law” regeln Umgang Daten ermöglicht Zugriff “code” Besitz Interpretation
  • 12. Was sind die Implikationen von „Big Data“? “There are also significant questions of truth, control, and power in Big Data studies: researchers have the tools and the access, while social media users as a whole do not. Their data were created in highly context-sensitive spaces, and it is entirely possible that some users would not give permission for their data to be used elsewhere.” (boyd & Crawford, 2012, p.12)
  • 13. Beispiel Twitter • Mikroblog/Online-Kurznachrichtendienst, gestartet 2006 • inzwischen 500 Millionen aktive Benutzer • wird für die Verbreitung von Nachrichten, öffentliche Kommunikation genutzt • Daten größtenteils über API öffentlich zugänglich
  • 14.
  • 15.
  • 16. Daten aus Twitter extrahieren HTTP request liefere alle Daten eines bestimmten Users/von einem bestimmten Ort/... Application Programming Interface (API) Daten*
  • 17. Archivieren von Tweets via yourTwapperKeeper
  • 18. Software Sammeln: • The Archivist (Windows) • yourTwapperKeeper (erfordert Webserver) • 140kit.com (web-basierte Plattform) Analysieren: • Excel, Open Office Calc, SPSS, R, Google Docs.. Visualisieren: • (Excel, OO Calc, R), Gephi, NodeXL
  • 19. Rechtliche und ethische Hürden • Daten dürfen nicht weitergegeben werden (Twitter Terms of Service) • Datenschutzrichtlinien müssen eingehalten werden (etwa European Data Protection Directive) • ethische Fragen stellen sich auch dann, wenn die Daten öffentlich sind!
  • 20. Beispiel: eine Untersuchung der akademischen Blogplattform hypotheses.org
  • 21. 0 500 1000 1500 2004−01 2004−02 2004−03 2004−04 2004−05 2004−06 2004−07 2004−08 2004−09 2004−10 2004−11 2004−12 2005−01 2005−02 2005−03 2005−04 2005−05 2005−06 2005−07 2005−08 2005−09 2005−10 2005−11 2005−12 2006−01 2006−02 2006−03 2006−04 2006−05 2006−06 2006−07 2006−08 2006−09 2006−10 2006−11 2006−12 2007−01 2007−02 2007−03 2007−04 2007−05 2007−06 2007−07 2007−08 2007−09 2007−10 2007−11 2007−12 2008−01 2008−02 2008−03 2008−04 2008−05 2008−06 2008−07 2008−08 2008−09 2008−10 2008−11 2008−12 Posts per 2004 - 2004−01 2009−01 2009−02 2009−03 2009−04 Aktivität Januar month startingJuli 2012 2009−05 2009−06 2009−07 2009−08 2009−09 2009−10 2009−11 2009−12 2010−01 2010−02 Blogplattform hypotheses.org 2010−03 2010−04 2010−05 2010−06 2010−07 2010−08 2010−09 2010−10 2010−11 2010−12 2011−01 2011−02 2011−03 2011−04 2011−05 2011−06 2011−07 2011−08 2011−09 2011−10 2011−11 2011−12 2012−01 2012−02 2012−03 2012−04 2012−05 2012−06 2012−07
  • 22. Blogplattform hypotheses.org Aktivste Blogs10nach Beiträgen (n=45.528) Top Blogs by numer of posts (n=45528) 6000 5000 4000 3000 2000 1000 0 Indústrias Culturais Criminocorpus Radar Veille énergie climat Veille sur la Corée Le Cresson veille Corps et Médecine URFIST Info No Mundo dos Museus Nuevo Mundo radar Blog de l'IRHiS
  • 24. Blogplattform hypotheses.org Verlinkungen externer Webseiten
  • 25. Offene Fragen: • Wem gehören die Daten? • Wie wird die Privatsphäre der Nutzer gewahrt? • Wer sichert die Qualität der Daten? • Wie reproduzierbar sind die Ergebnisse? • Über welche Art von Prozesse lassen sich Aussagen treffen? • Wie generalisierbar sind Einzelstudien?
  • 26. Potentielle Probleme: • Wettlauf um Kompetenzen und Ressourcen (zwischen Fachbereichen, Wissenschaft/ Industrie), um komplexe Phänomene untersuchen zu können • Wandel der Forschungsfragen • Stärkerer Druck zu Team- und Verbundforschung
  • 27. Vielen Dank für Ihre Aufmerksamkeit!