Lehrstuhl für Informatik 5 – Informationssysteme
                                           RWTH Aachen


TeLLNet
    GALA                     Social Media Analytics –
                            Aktuelle Herausforderungen

                                                    Ralf Klamma
                                                   RWTH Aachen


                                     Gesellschaft für Informatik Regionalgruppe Köln
                                               Themenabend 06.07.2011
                                            „Social Media, Social Networks“
Lehrstuhl Informatik 5
(Informationssysteme)
   Prof. Dr. M. Jarke
  I5-KL-111010-1
Motivation
                            Große Datenbestände aus dem Betrieb sozialer Medien
TeLLNet                     Algorithmen zur Datenanalyse
    GALA                     – Statistische Analyse (z.B. kontextbewusste Nutzungsstatistiken)
                             – Soziale Netzwerkanalyse (SNA)
                            Visualisierungstechniken
                             – Statistische Diagramme (z.B. Box/Pie Chart, Timeline)
                             – Geografische Karten (z.B. Google Maps 2D, Google Earth 3D)
                             – Graph Visualisierungen (Fluss & Formation)
                            Web Technologien
                             – HTML, CSS, JavaScript + Rahmenwerke (z.B. jQuery, dojo, sencha, etc.)
                             – Web Widgets (OpenSocial, W3C)

                         Wie können Analyseergebnisse in Wikis, Blogs und Foren präsentiert
                         werden, so dass sie dem Anwender zusätzlichen Nutzen bringen?
Lehrstuhl Informatik 5
(Informationssysteme)
   Prof. Dr. M. Jarke
  I5-KL-111010-2
Ablauf

TeLLNet
    GALA




Lehrstuhl Informatik 5
(Informationssysteme)
   Prof. Dr. M. Jarke
  I5-KL-111010-3
Welche Interaktionen sind nutzbar?
                            Dienstnutzung
TeLLNet
                              – Dienstaufrufe
    GALA
                              – Kontextinformationen (physisch, technisch, sozial, etc.)
                            Organisation von Nutzern in Communities
                              – Entstehung & Entwicklung von (überlappenden) Communities
                              – Entwicklung von internen und übergreifenden Nutzerrollen
                            Kollaboration zwischen Nutzern und Communities
                              – Gemeinsame Erstellung & Bearbeitung von Resourcen & Metadaten
                              – Social Media Operationen (Bewerten, Taggen, Kommentieren, etc.)
                            Kommunikation zwischen Nutzern und Communities
                              – Asynchron (Blogs, RSS Feeds, Foren, Mailinglisten, etc.)
                              – Synchron/Echtzeit (Instant Messaging, Multiuser Chats, Konferenzen, etc.)
Lehrstuhl Informatik 5
(Informationssysteme)
   Prof. Dr. M. Jarke
  I5-KL-111010-4
Aktuelle Forschung am I5 –
                         Systeme, Datenbestände & Analyse
                            Netzwerkanalyse
TeLLNet                       – Digitale Bibliothek (AERCS)
                                  – > 800.000 Autoren, >1.4 Mio Aufsätze, >3700 Konferenzserien der Informatik
    GALA
                                  – Datensätze von DBLP & CiteSeerX
                              – Web 2.0 Artefakte (MediaBase)
                                  – >730 Blogs & Mailinglisten, >330.000 Einträge
                                  – Internationale Blogs & Mailinglisten
                              – Chat (MobSOSX & Socrates XMPP)
                                  – >230 Nutzer, >40.000 Chat-Interaktionen in >1700 Sessions
                                  – XMPP Kommunikation (Instant Messaging, Multiuser Chat, etc.)

                            Statistische Analyse
                              – Nutzung & Qualität von Web Diensten (MobSOS)
                                  – >1,3 Mio Anfragen von >200 Nutzern aus >20 Communities an >40 Dienste
                                  – Sessions, Benutzer, Communities, Dienste, Kontext, Fehler
Lehrstuhl Informatik 5
(Informationssysteme)
   Prof. Dr. M. Jarke
  I5-KL-111010-5
Welche Informationen sind aus der
                             statistischen Analyse gewinnbar?

TeLLNet
    GALA



                            Kontextbewusste Nutzungsstatistiken
                               Nutzer, Communities, Ressourcen, Dienste
                               Ort, Zeit, Genutzte Technologien
                               Frequenz, Dichte, Verteilung, Muster
                            Werkzeugqualität
                               Performanz, Stabilität, etc.
                               Fehleraufkommen/quellen
                          Empfehlungen für Nutzer
Lehrstuhl Informatik 5
                          Eigen- & Community-Bewusstheit
                          Gemeinschaftliche Anforderungen
(Informationssysteme)
   Prof. Dr. M. Jarke
  I5-KL-111010-6
Welche Informationen sind aus der
                               Netzwerkanalyse gewinnbar?
                            Identifikation von Rollen
TeLLNet                       – Experten
                                  – Empfang und Verbreitung von Information
    GALA
                                  – Zentralitätsmaße [Wasserman & Faust, 1997]
                              – Innovation Stars (Boundary-Spanner, Broker)
                                  – Community-interne & übergreifende Kommunikation
                                  – Betweenness Zentralität [Burt, 2005]

                            Einflüsse
                              – Wer oder was beeinflusst Nutzer oder Communities?
                              – Influence networks [Lewis, 2008]
                            Identifikation von Communities
                              – Welchen Communities gehört ein User an?
                              – Community mining [Clauset et al., 2004]

Lehrstuhl Informatik 5
                          Eigen- & Community-Bewusstheit (Struktur & Entwicklung)
(Informationssysteme)
   Prof. Dr. M. Jarke
  I5-KL-111010-7
                          Empfehlungen für den Nutzer
Wie können Analyseergebnisse für
                              den Nutzer visualisiert werden?

TeLLNet
    GALA



                         Web Widget Technologien (z.B. OpenSocial, W3C Widgets)
                            Widget: Kleines UI Element mit beschränkter, wohldefinierter Funktionalität
                              – Metadaten: XML
                              – Logik: HTML5, JS/AJAX, CSS & entsprechende Frameworks (z.B. jQuery)
                              Grundbaustein für interaktive Visualisierungen von Analyseergebnissen
                            Widget Renderer: Rendering von Widgets unter Angabe der Widget URL
                            Widget Container: Anordnung eines oder mehrerer Widgets auf einer Seite
                              Zusammenstellung von Widgets aus verschiedenen Quellen via Widget URL
Lehrstuhl Informatik 5        Visualisierungs-Dashboards & Integration in beliebige Webseiten via iframe
(Informationssysteme)
   Prof. Dr. M. Jarke
  I5-KL-111010-8              OS Lösungen: OpenSocial  Apache Shindig; W3C Widgets  Apache Wookie
Widget-basierte Visualisierung –
                             Zero-Config Dashboard in iGoogle

TeLLNet
    GALA




Lehrstuhl Informatik 5   Integration beliebiger konfigurationsloser Visualisierungs-Widgets in iGoogle Seiten
(Informationssysteme)
   Prof. Dr. M. Jarke
  I5-KL-111010-9
Widget-basierte Visualisierung –
                                  Interaktive Dashboards
                                                      3. Visualisierungen passen
                         1. Auswahl einer Datenbank
TeLLNet
                                                         sich an Filter an

    GALA




                          2. Auswahl selbst
                             definierter Filter




Lehrstuhl Informatik 5
(Informationssysteme)
   Prof. Dr. M. Jarke
 I5-KL-111010-10
Integration von Visualisierungen
                              in beliebige Webseiten

TeLLNet
    GALA




                                          Einbettung in beliebige
                                         Webseiten mittels iframes
Lehrstuhl Informatik 5
(Informationssysteme)
   Prof. Dr. M. Jarke
 I5-KL-111010-11
Autorenumgebung für
                                      Visualisierungs-Widgets

TeLLNet                                     4. Angabe von Metadaten              3. Widget Voransicht
    GALA




                         5. Automatische Generierung
                            von Widget Quellcode                         2. Auswahl & Parametrisierung
                                                                            der Visualisierung


Lehrstuhl Informatik 5
(Informationssysteme)
   Prof. Dr. M. Jarke
                                                                      1. Angabe einer Datenbankanfrage
 I5-KL-111010-12
Zusammenfassung & Ausblick
                            Zusammenfassung
TeLLNet
                             –   Ablauf der Erstellung/Einbettung von Visualisierungen Sozialer Mediennutzung
    GALA
                             –   Überblick über nutzbare Informationen
                             –   Überblick über Analysetechniken
                             –   Visualisierung mit Web Widgets (Dashboards & Einbettung)
                             –   Autorenumgebung für Visualisierungs-Widgets
                            Ausblick
                             – Web Technologien (HTML5) + Cloud Technologien + Echtzeitprotokolle
                             – Cloud-basierte Analyse- & Visualisierungsalgorithmen
                             – Darstellung in Echtzeit mit XMPP
                                  – XMPP-fähige Widgets
                                  – Nutzung der Publish-Subscribe XEP & HTML5 WebSocket


Lehrstuhl Informatik 5
(Informationssysteme)
   Prof. Dr. M. Jarke
 I5-KL-111010-13

Social Media Analytics – Aktuelle Herausforderung

  • 1.
    Lehrstuhl für Informatik5 – Informationssysteme RWTH Aachen TeLLNet GALA Social Media Analytics – Aktuelle Herausforderungen Ralf Klamma RWTH Aachen Gesellschaft für Informatik Regionalgruppe Köln Themenabend 06.07.2011 „Social Media, Social Networks“ Lehrstuhl Informatik 5 (Informationssysteme) Prof. Dr. M. Jarke I5-KL-111010-1
  • 2.
    Motivation  Große Datenbestände aus dem Betrieb sozialer Medien TeLLNet  Algorithmen zur Datenanalyse GALA – Statistische Analyse (z.B. kontextbewusste Nutzungsstatistiken) – Soziale Netzwerkanalyse (SNA)  Visualisierungstechniken – Statistische Diagramme (z.B. Box/Pie Chart, Timeline) – Geografische Karten (z.B. Google Maps 2D, Google Earth 3D) – Graph Visualisierungen (Fluss & Formation)  Web Technologien – HTML, CSS, JavaScript + Rahmenwerke (z.B. jQuery, dojo, sencha, etc.) – Web Widgets (OpenSocial, W3C) Wie können Analyseergebnisse in Wikis, Blogs und Foren präsentiert werden, so dass sie dem Anwender zusätzlichen Nutzen bringen? Lehrstuhl Informatik 5 (Informationssysteme) Prof. Dr. M. Jarke I5-KL-111010-2
  • 3.
    Ablauf TeLLNet GALA Lehrstuhl Informatik 5 (Informationssysteme) Prof. Dr. M. Jarke I5-KL-111010-3
  • 4.
    Welche Interaktionen sindnutzbar?  Dienstnutzung TeLLNet – Dienstaufrufe GALA – Kontextinformationen (physisch, technisch, sozial, etc.)  Organisation von Nutzern in Communities – Entstehung & Entwicklung von (überlappenden) Communities – Entwicklung von internen und übergreifenden Nutzerrollen  Kollaboration zwischen Nutzern und Communities – Gemeinsame Erstellung & Bearbeitung von Resourcen & Metadaten – Social Media Operationen (Bewerten, Taggen, Kommentieren, etc.)  Kommunikation zwischen Nutzern und Communities – Asynchron (Blogs, RSS Feeds, Foren, Mailinglisten, etc.) – Synchron/Echtzeit (Instant Messaging, Multiuser Chats, Konferenzen, etc.) Lehrstuhl Informatik 5 (Informationssysteme) Prof. Dr. M. Jarke I5-KL-111010-4
  • 5.
    Aktuelle Forschung amI5 – Systeme, Datenbestände & Analyse  Netzwerkanalyse TeLLNet – Digitale Bibliothek (AERCS) – > 800.000 Autoren, >1.4 Mio Aufsätze, >3700 Konferenzserien der Informatik GALA – Datensätze von DBLP & CiteSeerX – Web 2.0 Artefakte (MediaBase) – >730 Blogs & Mailinglisten, >330.000 Einträge – Internationale Blogs & Mailinglisten – Chat (MobSOSX & Socrates XMPP) – >230 Nutzer, >40.000 Chat-Interaktionen in >1700 Sessions – XMPP Kommunikation (Instant Messaging, Multiuser Chat, etc.)  Statistische Analyse – Nutzung & Qualität von Web Diensten (MobSOS) – >1,3 Mio Anfragen von >200 Nutzern aus >20 Communities an >40 Dienste – Sessions, Benutzer, Communities, Dienste, Kontext, Fehler Lehrstuhl Informatik 5 (Informationssysteme) Prof. Dr. M. Jarke I5-KL-111010-5
  • 6.
    Welche Informationen sindaus der statistischen Analyse gewinnbar? TeLLNet GALA  Kontextbewusste Nutzungsstatistiken  Nutzer, Communities, Ressourcen, Dienste  Ort, Zeit, Genutzte Technologien  Frequenz, Dichte, Verteilung, Muster  Werkzeugqualität  Performanz, Stabilität, etc.  Fehleraufkommen/quellen  Empfehlungen für Nutzer Lehrstuhl Informatik 5  Eigen- & Community-Bewusstheit  Gemeinschaftliche Anforderungen (Informationssysteme) Prof. Dr. M. Jarke I5-KL-111010-6
  • 7.
    Welche Informationen sindaus der Netzwerkanalyse gewinnbar?  Identifikation von Rollen TeLLNet – Experten – Empfang und Verbreitung von Information GALA – Zentralitätsmaße [Wasserman & Faust, 1997] – Innovation Stars (Boundary-Spanner, Broker) – Community-interne & übergreifende Kommunikation – Betweenness Zentralität [Burt, 2005]  Einflüsse – Wer oder was beeinflusst Nutzer oder Communities? – Influence networks [Lewis, 2008]  Identifikation von Communities – Welchen Communities gehört ein User an? – Community mining [Clauset et al., 2004] Lehrstuhl Informatik 5  Eigen- & Community-Bewusstheit (Struktur & Entwicklung) (Informationssysteme) Prof. Dr. M. Jarke I5-KL-111010-7  Empfehlungen für den Nutzer
  • 8.
    Wie können Analyseergebnissefür den Nutzer visualisiert werden? TeLLNet GALA Web Widget Technologien (z.B. OpenSocial, W3C Widgets)  Widget: Kleines UI Element mit beschränkter, wohldefinierter Funktionalität – Metadaten: XML – Logik: HTML5, JS/AJAX, CSS & entsprechende Frameworks (z.B. jQuery)  Grundbaustein für interaktive Visualisierungen von Analyseergebnissen  Widget Renderer: Rendering von Widgets unter Angabe der Widget URL  Widget Container: Anordnung eines oder mehrerer Widgets auf einer Seite  Zusammenstellung von Widgets aus verschiedenen Quellen via Widget URL Lehrstuhl Informatik 5  Visualisierungs-Dashboards & Integration in beliebige Webseiten via iframe (Informationssysteme) Prof. Dr. M. Jarke I5-KL-111010-8  OS Lösungen: OpenSocial  Apache Shindig; W3C Widgets  Apache Wookie
  • 9.
    Widget-basierte Visualisierung – Zero-Config Dashboard in iGoogle TeLLNet GALA Lehrstuhl Informatik 5 Integration beliebiger konfigurationsloser Visualisierungs-Widgets in iGoogle Seiten (Informationssysteme) Prof. Dr. M. Jarke I5-KL-111010-9
  • 10.
    Widget-basierte Visualisierung – Interaktive Dashboards 3. Visualisierungen passen 1. Auswahl einer Datenbank TeLLNet sich an Filter an GALA 2. Auswahl selbst definierter Filter Lehrstuhl Informatik 5 (Informationssysteme) Prof. Dr. M. Jarke I5-KL-111010-10
  • 11.
    Integration von Visualisierungen in beliebige Webseiten TeLLNet GALA Einbettung in beliebige Webseiten mittels iframes Lehrstuhl Informatik 5 (Informationssysteme) Prof. Dr. M. Jarke I5-KL-111010-11
  • 12.
    Autorenumgebung für Visualisierungs-Widgets TeLLNet 4. Angabe von Metadaten 3. Widget Voransicht GALA 5. Automatische Generierung von Widget Quellcode 2. Auswahl & Parametrisierung der Visualisierung Lehrstuhl Informatik 5 (Informationssysteme) Prof. Dr. M. Jarke 1. Angabe einer Datenbankanfrage I5-KL-111010-12
  • 13.
    Zusammenfassung & Ausblick  Zusammenfassung TeLLNet – Ablauf der Erstellung/Einbettung von Visualisierungen Sozialer Mediennutzung GALA – Überblick über nutzbare Informationen – Überblick über Analysetechniken – Visualisierung mit Web Widgets (Dashboards & Einbettung) – Autorenumgebung für Visualisierungs-Widgets  Ausblick – Web Technologien (HTML5) + Cloud Technologien + Echtzeitprotokolle – Cloud-basierte Analyse- & Visualisierungsalgorithmen – Darstellung in Echtzeit mit XMPP – XMPP-fähige Widgets – Nutzung der Publish-Subscribe XEP & HTML5 WebSocket Lehrstuhl Informatik 5 (Informationssysteme) Prof. Dr. M. Jarke I5-KL-111010-13