BIG DATA & PREDICTIVE ANALYTICS
Einführung für Verlage
Prof. Tim Bruysten
richtwert GmbH | Mediadesign Hochschule
Foto:Achim Lammerts
Das ist alles erst der Anfang*
* do not play dominated strategies
Vorgeschichte
1 2
Szenarien
3
Praxis
Begriff Big Data
Die Analyse und Interpretation von Daten, die

a) in sehr großer Menge vorliegen

b) sehr heterogen (in Struktur und Qualität) sein können

c) aus verschiedenen Quellen stammen können
Big Data bezeichnet die Analyse großer Datenmengen aus
vielfältigen Quellen in hoher Geschwindigkeit mit dem Ziel,
wirtschaftlichen Nutzen zu erzeugen.
Bitkom, 2012
Begriff Predictive Analytics
Interpretation von Daten zum Zweck der Vorhersage

a) von Ereignissen

b) von Übereinstimmungen (z.B.: Produkt <=> Kunde)

c) von Risiken
Big Data & Predictive Analytics
Quelle: BITKOM; Leitfaden BigData, 2012
Vorgeschichte
1
„640kb should
be enough for
anybody…“
„640kb should
be enough for
anybody…“
Bill Gates, 1981
Über 50%: im Bett Über 40%: im Bad Über 30%: beim Essen
Und manche
im Regen…
Foto: Mario Sixtus
Exabyte
1018 Byte

1 Trillion Byte

555.555.555.555.556 Normseiten

ca. 1.388.888.888.889 gedruckte Bücher

Deren Stapel würde 185x zum Mond reichen

!
Die Gesamtheit aller gedruckten Werke wird auf 0,2 EB geschätzt*
*Quelle: Wikipedia
Quelle: BITKOM; Leitfaden BigData, 2012 / Experton Group 2012
Quelle: BITKOM; Leitfaden BigData, 2012
Big Data
Von 2000 bis 2002 sind mehr Daten generiert
worden, als in den 40.000 Jahren davor.

!
Von 2003 bis 2005 hat sich diese Datenmenge
wiederum vervierfacht.
Quelle: BITKOM; Leitfaden BigData, 2012
Merke 1:
Mehr Daten führen nicht zwangsläufig zu einer höheren
Aussagekraft einer Statistik.
Loading Digitalization…
1% Finished
Szenarien für Sensoren & Devices
2
http://vimeo.com/23164779
https://www.youtube.com/watch?v=4yT2zrIUDjM
http://vimeo.com/64389936
Trend of Convenience
Smart TV Smart WatchesTablets
Szenario:
All Situations Digital
There’s an App for that
Jedes „Ding“ wird zu einem „Device“. Inkl. App-Store.
Context Awareness
Jede Situation wird erkannt und antizipiert
Öffentlichkeit & Privatsphäre
Verändern sich dramatisch
https://www.youtube.com/watch?v=aBCVlIGQ0B4
https://www.youtube.com/watch?v=sUIqfjpInxY
https://www.youtube.com/watch?v=RhIa4KtrqqU
http://www.cs.rochester.edu/hci/pubs/pdfs/FoodMood.pdf
Augmented Reality Augmented Environments Augmented Platforms
Trend of Augmentation
Augmented Bodies
Szenario:
The World is not enough
Neue Kooperationen
Games + Recht & Risk + AppDev (Beispiel: EU-Projekt)
Neue Spieler und neue Spielfelder z.B. im Geldmarkt
Bezahlen an der Tankstelle mit iTunes?
Silent Information
Wearables geben unsichtbares Feedback…
… machen die Datenwelt körperlich spürbar
https://www.youtube.com/watch?v=4FunXnJQxYU
https://www.facebook.com/f8
http://vimeo.com/87522764
Trend of Platformication
Wallet Garden Platforms Open Web Platforms Everything as a Platform
Szenario:
Finite and Infinite Games
Plattform War
Wer wird die (neuen) Standards setzen?
- für Informationsaustausch
- für Geld-Austausch
- für Lernen und Lehren
Blue Ocean!
Keine Idee ist zu abwegig…
http://www.dailykos.com/story/2013/05/15/1209284/-Tesla-at-war-with-sleazy-auto-dealershttps://www.youtube.com/watch?v=QweNsLesMrM
https://www.youtube.com/watch?v=6ZdSMAG90Rs
Connecting Retail & Consumer Connecting Factory & Consumer
Trend of Proximity
Connecting Everything
Szenario:
Reinvention of Infrastructure
Immer weniger Filialgeschäft
Öffnungszeiten-Alarm
Neue Nutzungssituationen
Was macht man in selbstfahrenden Autos?
https://www.youtube.com/watch?v=76lIQtE8oDY
https://www.youtube.com/watch?v=rNRDc714W5I
http://www-05.ibm.com/de/pov/watson/index.html http://www.youtube.com/watch?v=Qv5JVRfYGnU
Brain Reading
Trend of Singularity
Brain Writing Artificial Intelligence
Szenario:
Ästhetische Welt
Das Gehirn als Passwort
Computer to Brain Interfaces
Artificial Enterprises
Software as an Enterprise
Merke 2:
Gegen Komplexität kann man nicht protestieren.

(Niklas Luhmann)
Praxis
3
Einführung
zwei Herausforderungen
Zwei Herausforderungen
Woher weiß ein Unternehmen, was es für
Daten besitzt?

!
Wie können diese Daten am besten
genutzt werden?
Am Anfang…
Datenquellen
- finden

- bewerten

- vernetzen

- visualisieren

- integrieren
Daten finden
Mitarbeiter fragen

Kunden fragen

Dienstleister fragen

Experten fragen
Daten bewerten
Mitarbeiter fragen

Kunden fragen

Dienstleister fragen

Experten fragen
Daten vernetzen
Wer braucht welche Daten:

- an welchem Ort

- zu welcher Zeit

- für welchen Zweck

- in welchem Kontext

- in welchem Format
Daten visualisieren
Visualisierung…

- des Datensatzes selbst

- der Netzwerke um einen Datensatzes

- der Verwendung/Historie eines Datensatzes
Daten integrieren
Integration in…

- die Prozesse der Nutzer

- die tech. Umgebung der Nutzer

- die soziale Umgebung der
Nutzungssituation
Einführung
Informationsarchitektur
„Taxonomie (v. griech. táxis „Ordnung“, -nómos „Gesetz“) ist primär die
sprachwissenschaftliche Klassifikation aller Gegenstände (Entitäten) und
Ereignisse in begriffliche Taxa (Sing.: Taxon) (Gruppen) bzw. in Kategorien.
Anthropologische Untersuchungen zeigen, dass Taxonomien in örtliche,
kulturelle und soziale Systeme eingebettet sind und verschiedenen sozialen
Zwecken dienen.“
http://de.wikipedia.org/wiki/Taxonomie
Taxonomie
Monodimensionale Taxonomie
Ist ein guter Ausgangspunkt, führt aber oft zu Problemen bei der
Einordnung, da es oft keine wirklich präzise Einordnung gibt, oder
aber mehrere gleichwertige Einordnungen möglich sind.
Monodimensionale Taxonomie
Beispiel: Napoleon
!
Ist er ein Imperator? Ein Feldherr? Ein General? Ein
Staatsmann? Ein Kaiser? Ein Korse? Ein Franzose?
Ein Mann? Ein Held? Ein Tyrann?
Monodimensionale Taxonomie
Beispiel: Napoleon
!
Ist er ein Imperator? Ein Feldherr? Ein General? Ein
Staatsmann? Ein Kaiser? Ein Korse? Ein Franzose?
Ein Mann? Ein Held? Ein Tyrann?
!
Problem: Unsicherheiten bei der Eingabe führen zu
Unwohlsein beim Benutzer: Man möchte nichts
falsch machen, schon gar nicht, wenn es „alle“
online sehen können.
!
Ergo: Das System wird oft gemieden.
Polydimensionale Taxonomie
c
f
d
a
b
e
Pragmatische Erweiterung der
monodimensionalen Taxonomie.
Polydimensionale Taxonomie
Beispiel: Napoleon
Napoleon
Imperatoren
Alexander 

der Große
Berühmt
Coco Chanel
Frankreich
Polydimensionale Taxonomie
Beispiel: Napoleon
Es gibt verschiedene Typen von Knoten
Person:
Napoleon
Beruf:
Imperator
Person:
Alexander 

der Große
Eigenschaft:
Berühmt
Person:
Coco Chanel
Ort:
Frankreich
Graph
Beispiel: Napoleon
Es gibt Informationen zu den Kanten
Person:
Napoleon
Person:
Coco Chanel
Ort:
Frankreich
beherrschtgeboren
Graph
Beispiel: Napoleon
Kanten können Richtungen haben
Person:
Napoleon
Person:
Coco Chanel
Ort:
Frankreich
beherrschtgeboren
Graph
Beispiel: Napoleon
Kantismus
Person:
Albert
Einstein
Photo-
elektrischer
Effekt
schreibt über
Entdecker
Vertiefung
Pipeline
Begriff Sensor
Im Folgenden sehr allgemein verwendet.

!
Ein Sensor generiert Daten, zum Beispiel:

a) Physik/Umwelt: Temperatur, Beschleunigung, Lage, Kompass, …

b) Bio/Health: Puls, Fingerabdruck, Gehirnströme, …

c) Feeds/Algorithmen: Social Media Ereignisse, Alerts, …
Begriff Speicher
Sollte differenziert betrachtet werden:

!
a) Physikalischer Speicher: HDD / SSD

b) Anbindung: z.B.: NAS / Cloud

c) Logischer Speicher: Dateien, MySQL, No-SQL, …
Begriff Interpreter
Sollte sehr differenziert betrachtet werden:

!
a) Lineare Datenfeeds

b) Komplexe Datenintepretation

c) Künstliche Intelligenz

d) Allgemeine künstliche Intelligenz
Pipeline
Sensor Speicher Interpreter Ereignis Zweck
Big Data
Pipeline
Sensor Speicher Interpreter Ereignis Zweck
Big Data
Input Output
Pipeline
Sensor Speicher Interpreter Ereignis Zweck
Big Data
Predictive Analytics
Pipeline
Sensor Speicher Interpreter Ereignis Zweck
Big Data
Predictive AnalyticsInduktion Deduktion
Workshop
Digital Pipeline
Pipeline (Verlage)
Sensor Speicher Interpreter Ereignis Zweck
Innen!
• Redaktions
• CRM
• Newsletter
• Website
!
Außen!
• Abo / Leser
• POS / POI
• News / Alerts
• Social Media im
Netzwerk
• Wikipedia
!
Überaußen!
• Wetter
• restl. SM
• Konkurrenz
Physisch!
• local HDD / SSD
• NAS
• Cloud
!
Organisatorisch!
• Filesystem
• Intranet
• Wiki / Blog
• Datawarehouse
!
Logisch!
• einzeln
• relational
• graph
Linear!
• nur strukturelle
Interpretation
• z.B.: Sammlung &
Bereitstellung: RSS
!
Semantisch!
• inhaltliche
Verknüpfung
• z.B.: Tagging /
erweiterte Tags /
Taxonomien,
Ontologien
!
KI!
• z.B.: IBM Watson
!
Date, Time, Place!
• Wann
• Wo
• Wo genau?
!
Netzwerk!
• Wer
• Wer noch?
!
Vektor!
• Warum
(motivational)
• Thema
Nutzenfunktion!
• Wozu (intentional)
• Wie
• Format
!
Marke!
• Vertrauen
• Loyalität
• Verständnis
• Kohärenz
• Akzeptanz
• Integration
Use Case
Marketing
Person 1 Person 2
männlich männlich
Engländer Engländer
geboren 1948 geboren 1948
zum 2. Mal verheiratet zum 2. Mal verheiratet
2 Kinder 2 Kinder
Wohlhabend Wohlhabend
Im Winter oft in den Alpen Im Winter oft in den Alpen
Mag Hunde Mag Hunde
Prominent Prominent
Klassische Marktforschung…
ATTENTION INTEREST DESIRE ACTION
?Kritik: Das Leben ist keine reibungslose Sammlung von Erfolgen
Customer Journey
Customer JourneyAIDA
1. Akt 2. Akt 3. Akt
Mentor
Schwellenhüter
Verbündete
Feinde
Elixier
Rückkehr
Neue WeltAlte Welt
Prüfung
Verführung Bestätigung & Support Befriedigung
Workshop
Digital Customer Journey & User Taxonomy
Use Case
Mobile
Begriffe
!
Push Notifications
Kontext-Abhängigkeit
Lesemodi
Situationsbezogen
Begriffe: Push Notifications
!
Gibt es wichtige News…
…direkt an den User senden.
Begriffe: Kontext Abhängigkeit
!
Was ist in der Umgebung?
Welcher Termin ist als nächstes im Kalender?
Begriffe: Lesemodi
!
Tag / Nacht
Leise / Laut
Privat / Öffentlicht
…
Begriffe: Situationsbezogen (1)
!
Länge
Pendeln in der Bahn - 2 - 10 Minuten
Warten am Flughafen: 5 - 15 Minuten
In Flight/Train: 30 Minuten bis 2 Stunden
…
Begriffe: Situationsbezogen (2)
!
Format
Boardmeeting: Powerpoint / Keynote
Messe: Video / PDF
Meeting beim Lunch: iPad / QR-Code
!
Neue, digitale Produkte
!
• Claiming des POS/POI auch in digitalen Netzwerken (Foursquare/Swarm, Google Maps)
• Nutzung der Netzwerke der Besucher eines Ortes (CRM Integration)
• Monitoring der Nutzerreaktionen in diesen Netzwerken (CRM Integration)
• Aktive Gestaltung und Angebot von Informationen (Text, Bild, Videos, Links, …) für (individuelle)
Besucher eines Ortes “Location Based Services” (CP, Marketing, …)
• In-Store Verhaltensanalyse (iBeacons, Internet of Things, …)
• Definition von KPIs für Kommunikationen in diesen Netzwerken
• Integration von Nutzern in Kreationsprozesse

(Social Innovation)
Workshop
Digital Product Design
Nutzer-Klassifizierung
Klassifizierung der Beziehung eines Nutzers zu einem Netzwerk.
!
Merke: Ein Nutzer kann in verschiedenen Netzwerken,
verschiedene Rollen inne haben.
Dialog-Klassifizierung
Commonalities Complements Discurses Conflicts
destruktive Destruction Cell Conflict War
coordinative Planning Dialog Argument Attack
cooperative Prayer Conversation Debate Maneuver
collaborative Project Product Change Process
co-creativ Vision Procreation Society Discovery
disruptive Utopy Creation Divorce Dystopy
Herausforderungen / Risiken
IT nicht skalierbar genug / IT-Investitionszyklen zu groß

Herkömmliche Datenspeicher (SQL-based) im Einsatz

Management + Mitarbeiter nicht “digitalisiert”

Wert von Daten wird falsch eingeschätzt

Keine angemessenen Werkzeuge für Management + Mitarbeiter

Juristische Fragen (Datenschutz usw.) nicht geklärt

IT-Sicherheit nicht, oder nicht ausreichend
Das ist alles erst der Anfang*
* do not play dominated strategies
Prof. Tim Bruysten
bruysten@richtwert.eu
!
www.bruysten.com
xing.com/profile/Tim_Bruysten
facebook.com/bruysten
de.linkedin.com/in/bruysten
twitter.com/timbruysten
!
Danke!
richtwert GmbH
www.richtwert.eu
!
Mediadesign Hochschule
www.mediadesign.de

Big Data & Predictive Analytics – Eine Einführung für Verlage