Unternehmen haben in den vergangenen Jahren eine enorme Menge an Daten (Big Data) angesammelt. Daraus zukunftsentscheidende Schlüsse zu ziehen ist Gold wert. Doch die klassischen Informatiker und Statistiker sind mit Anfragen der Fachabteilung überfordert, beispielsweise mit dieser: „Nimm diese 300TB und hole mir 10 Kunden daraus, mit denen wir in den kommenden Jahren den meisten Umsatz machen.“ Analysen von Big Data vermitteln richtungsweisende und teilweise revolutionäre Erkenntnisse für Produktoptimierung, Kreierung neuer Produkte, Markenwahrnehmung oder Financial Forecasting.
Nur der Data Scientist ist in der Lage, Big Data effektiv zu verarbeiten. Er übernimmt das Organisieren der Daten und das Bauen analytischer Modelle im Rahmen eines Projektes. Unternehmen, die von den enorm großen Datenvolumina proitieren wollen, brauchen künftig speziisch ausgebildete Datenwissenschaftler. Laut dem IT-Analysten Gartner werden bis 2015 durch Big Data 4,4 Millionen neue Jobs entstehen.
Dieses EUROFORUM-Whitepaper mit Fallstudien aus IT (Microsoft) und Logistik (Fraport) sowie Automobilindustrie (Mercedes), Handel (OTTO), dem Gesundheitssektor (Charité Berlin) und weiteren Branchen beweist: Data Science ist DAS branchenübergreifende Zukunfts-Thema der Wirtschaft.
http://www.euroforum.de/veranstaltungen/data_science_november2014
„DATA SCIENTIST – DIE KARRIERE DER ZUKUNFT“ - WIE DIE ANALYSE VON DATEN DIE WIRTSCHAFT PRÄGT
1. WHITEPAPER
„DATA SCIENTIST – DIE KARRIERE DER ZUKUNFT“
WIE DIE ANALYSE VON DATEN DIE WIRTSCHAFT PRÄGT
Mit Beiträgen von
Branchenführern
wie Otto, Siemens,
Mercedes u.v.m.
– Auf über 170 Seiten –
2. Data Science Best Practices
Unternehmen haben in den vergangenen Jahren eine enorme Menge an
Daten (Big Data) angesammelt. Daraus zukunftsentscheidende Schlüsse
zu ziehen ist Gold wert. Doch die klassischen Informatiker und Statisti-
ker sind mit Anfragen der Fachabteilung überfordert, beispielsweise mit
dieser: „Nimm diese 300TB und hole mir 10 Kunden daraus, mit denen
wir in den kommenden Jahren den meisten Umsatz machen.“ Analy-
sen von Big Data vermitteln richtungsweisende und teilweise revoluti-
onäre Erkenntnisse für Produktoptimierung, Kreierung neuer Produkte,
Markenwahrnehmung oder Financial Forecasting.
Nur der Data Scientist ist in der Lage, Big Data effektiv zu verarbeiten.
Er übernimmt das Organisieren der Daten und das Bauen analytischer
Modelle im Rahmen eines Projektes. Unternehmen, die von den enorm
großen Datenvolumina proitieren wollen, brauchen künftig speziisch
ausgebildete Datenwissenschaftler. Laut dem IT-Analysten Gartner
werden bis 2015 durch Big Data 4,4 Millionen neue Jobs entstehen.
Dieses EUROFRUM-Whitepaper mit Fallstudien aus IT (Microsoft) und
Logistik(Fraport)sowie Automobilindustrie(Mercedes), Handel(OTTO),
dem Gesundheitssektor (Charité Berlin) und weiteren Branchen be-
weist: Data Science ist DAS branchenübergreifende Zukunfts-Thema
der Wirtschaft.
Inhaltsverzeichnis
Absatzprognosen im Versandhandel – Otto Group 3
Big Data verändert den Einzelhandel – Sutterlüty 20
Logistik und Passagierbewegungen – Fraport 38
Big Data im Gesundheitssektor – Charité 64
Big Data in der Finanzwirtschaft – Kreditech 87
Sensordatenanalyse – Siemens 115
Echtzeitauswertung von Messdaten – Mercedes 126
Sonstige Beispiele – Capgemini 140
Big Data Architekturen – Microsoft 159
3. BIG Data & Predictive Analytics –
der Nutzen von Daten für präzise Prognosen
und Entscheidungen in der Zukunft
BIG Data Europe in Zürich, 28.08.2012
Otto (GmbH & Co. KG)
Michael Sinn
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
4. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 1
Das vielfältige Portfolio der Otto Group
Die Geschäftstätigkeit der Otto Group
erstreckt sich auf die drei Segmente:
• Multichannel-Einzelhandel –
mit Kataloggeschäft, E-Commerce
und stationärem Einzelhandel.
• Finanzdienstleistungen –
mit handelsnahen Finanzdienst-
leistungen entlang der Wert-
schöpfungskette.
• Service –
mit dem kompletten Portfolio an
Handelsdienstleistungen entlang
der Wertschöpfungskette sowie
Reisedienstleistungen.
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
5. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 2
Mit vielfältigen Marken zum Erfolg
Multichannel-Einzelhandel
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
6. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 3
Was hat ein Algorithmus aus der Teilchenphysik mit
Versandhandel zu tun?
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
7. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 4
Große Datenmengen und eine Vielzahl von Einflussfaktoren
prägen heutige Entscheidungssituationen
Online
Produkt M-Commerce
Anstoßkette
Kunde
Wettbewerb
Social Media
Internationalisierung
Einflussfaktoren Entscheidungssituationen
Immense
Datenmengen
Determinanten für Unternehmenserfolg
Hoher Zeitdruck
Permanenter
Entscheidungsbedarf
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
8. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 5
Herkömmliche Verfahren werden den gestiegenen
Anforderungen an die Artikelprognose nicht mehr gerecht
Szenario 1 Szenario 2
zu wenig
gekauft
zu viel
gekauft
Auswirkung Dispositionsentscheidungen
Szenario 1: zu wenig gekauft
Umsatzausfall
Erhöhte Beschaffungskosten
Kundenverärgerung
Erhöhte Kontaktkosten Callcenter
Szenario 2: zu viel gekauft
Erhöhte Lagerkosten
Kapitalbindung
Verwertungsverluste
Ist-Bedarf
Es besteht eine permanente Herausforderung, die richtigen Mengen
zu identifizieren
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
9. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 6
Forschungsauftrag an ein Experten-Team, ein Prognoseverfahren zur
Abbildung der heutigen und zukünftigen Komplexität des Geschäfts-
modells zu entwickeln
Eine maßgebliche Verbesserung ist nur durch grundsätzlich
neue Methoden zu erreichen
Klassische StatistikY
X
z.B. nichtlineare Regression
Trendmethode / Dreisatz Klassische Statistik Neuer Ansatz?
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
10. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 7
Nach Evaluierung von 13 Prognosetools international
ausgerichteter Softwareanbieter hat sich die NeuroBayes®
Technologie von durchgesetzt
Style
Farbe
Marke
Preis
Onlineplatzierung
Seitenanteil
Auflage
Response
Bisheriger Saison-
absatz
…….
200 Inputvariablen
HistorischeDaten
WahrscheinlichkeitP
Ausprägung X
(Bedarf in Stück)
E(X)
Daten-
satz
16 Saisons
Prognose je Artikel, Farbe, Größe, Promotion und Woche jeweils für
Ansprache, Brutto-, Nettoabsatz und Retouren
AktuelleDaten
…
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
11. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 8
Eine Gegenüberstellung der Prognoseverfahren zeigt die
deutliche Verbesserung durch NeuroBayes ®
Prognose mit NeuroBayes ®
Entstehendes
Absatzrisiko
-20%
1000
20%
500
-0%-100% 100% 200%
absoluteHäufigkeit
Prognoseabweichung
Entstehendes
Überhangrisiko
Klassische Verfahren
Klassische Verfahren
63% der Artikel
Abweichung > +/- 20%
NeuroBayes®
11% der Artikel
Abweichung > +/- 20%
Ergebnis NeuroBayes®: Deutlich positive Wirkung auf Lieferbereitschaft
und Restevolumen
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
12. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 9
Die Artikelprognosen bilden die Basis für
Kaufentscheidungen und Bestandsmanagement
Prognosedatum
Hochr.-Bruttoabsatz/Stück
0
3000
6000
9000
Phi-t
OTTO
Ist-Bedarf
NeuroBayes®
Klassische
Verfahren
NeuroBayes ®: Deutlich bessere Prognosen für sämtliche
Artikelpositionen, d.h. für Farbe, Größe und Angebotsträger
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
13. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 10
Die größten Optimierungspotenziale können bei Online-
Prognosen gehoben werden
klassische Verfahren
NeuroBayes
Zeit
AbsoluteStückabweichung
Vorsaison
NeuroBayes® um 9%
genauer
Saison-
start
Bereits vor Saisonstart können Prognosewerte mit NeuroBayes® valide
berechnet werden
Saisonstart
NeuroBayes® um 20%
genauer
Saisonverlauf
NeuroBayes® um 31%
genauer
Vorsaison:
06.04.
Saisonstart:
21.06.
Saisonverlauf:
30.08.
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
14. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 11
NeuroBayes® ist ein lernendes System, bei dem die
Prognosegüte im Zeitablauf permanent besser wird
300 Millionen
Datensätze pro Woche
135 GB historische
Daten
> 1 Milliarde Einzel-
prognosen pro Jahr
Input Output
Ab Q3 2012 erfolgt die Umstellung der Lieferung von Prognosedaten
von wöchentlich auf täglich
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
15. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 12
Die Weiterentwicklung des Prognosetools zu einem
Dispotool basiert auf einem Warenmanagementsystem
Bedarfs-
prognose
Warenmanagement-
system
Artikel mit Handlungsbedarf
Dispositionsvorschlag
Ziel:
„automatisierte“
Disposition
Dispositionsvorschlägen liegen Vorgaben und Kostenfunktionen für
Lieferbereitschaft und Restevolumen zugrunde
Produktionszeit Transportzeit
Bestände Kostenfunktionen
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
16. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 13
Otto gewinnt den „Retail Technology Award Europe“ in der
Kategorie „Best Enterprise Solutions“
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
17. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 14
Treffsichere Prognosen unterstützen verantwortungs-
volles und nachhaltiges Wirtschaften
Bedarfsgerechte Produktion
• Die punktgenaue Produktion von Waren reduziert den
Ressourcenverbrauch.
• Die Vermeidung von Überproduktion verringert die
Entsorgungsmengen deutlich.
Zielgerichtete Verteilung
• Durch die Vermeidung/Optimierung von Transporten
wird ein relevanter Beitrag zur CO2-Reduzierung
geleistet.
Predictive Analytics als ein Schlüsselfaktor
für Corporate Social Responsibility
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
18. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 15
Basierend auf der NeuroBayes®-Technologie lassen sich
Grundsatzfragestellungen des Distanzhandels besser lösen
*Mittlere absolute Prognose-Abweichung in Stück auf Artikel-Promotion-Größen-Ebene; MAD
Artikelbedarf Kundenbonität
Werbemittelausstattung Recommendation Engine
Copyright: Michael Sinn, Otto GmbH & CoKG. Stand: 28.08.2012. Exemplar für Henning Haake.
19. BIG Data & Predictive Analytics - der Nutzen von Daten für präzise Prognosen und Entscheidungen in der Zukunft – 28.08.2012
Seite 16
Vielen Dank für Ihre Aufmerksamkeit!
Michael Sinn
Direktor Angebots- und Category Management Support, Otto (GmbH & Co. KG)
Email: michael.sinn@otto.de
Tel: (040) 6461-6570
20. Wie Big Data den Einzelhandel verändert
Next Generation Retail
Big Data 27. August 2013
Mag. Philipp Giselbrecht
Leiter Marketing, Sutterlüty Handels GmbH
Dr. Thorben Keller
Gründer & CEO, Cosibon AG
Copyright: Philipp Giselbrecht;Thorben Keller. Stand: 27.08.2013. Exemplar für Henning Haake.Copyright: Philipp Giselbrecht;Thorben Keller. Stand: 27.08.2013. Exemplar für Henning Haake.
21. Sutterlüty in Vorarlberg
Anzahl Sutterlüty Geschäfte: 22
Anzahl Sutterlüty Mitarbeiter: 700
Umsatz Sutterlüty Gruppe 2012: 109 Mio. Euro
Copyright: Philipp Giselbrecht;Thorben Keller. Stand: 27.08.2013. Exemplar für Henning Haake.
25. Herausforderungen im CRM eines
stationären Lebensmittelhändlers
• Anzahl digitaler Werbekanäle explodiert
• Marketingbudget bleibt unverändert
• Sinn einer physischen Kundenkarte
• Smartphone-App als Kundenbindungsinstrument
• Steigerung der Bedarfsdeckungsquote
• Wie bewerten die Kunden unsere Produkte, welche Empfehlungen
sprechen Sie aus
• Wie schaffe ich eine Interaktion mit dem Kunden
• Einsparungen in der 1:1 Kommunikation
• Echter Mehrwert eines Apps für Kunden
• Ka ei App die Welt ei we ig „grü er“ zu ache
• Messung der Werbewirksamkeit
• Erhöhung von Markenkontaktpunkten
Copyright: Philipp Giselbrecht;Thorben Keller. Stand: 27.08.2013. Exemplar für Henning Haake.
26. Bedürfnisse eines Kunden im
Lebensmitteleinzelhandel
• Herkunft von Produkten
• Kassenzettel als Kontrollinstrument
• Bequeme Einkaufslisten-Erstellung
• Persönlicher Beitrag zum Umweltschutz
• Gesunde Ernährung
• Übersicht der Lebensmmittel-Ausgaben
• Information über Angebote
• Produktempfehlungen anderer Kunden
Copyright: Philipp Giselbrecht;Thorben Keller. Stand: 27.08.2013. Exemplar für Henning Haake.
28. Kundenkarte als Mittel zur
Informationsgewinnung
1 Messbarer Kundenkontakt pro Einkauf
Ort und Zeit des Einkaufs
Gekaufte Produkte
Copyright: Philipp Giselbrecht;Thorben Keller. Stand: 27.08.2013. Exemplar für Henning Haake.
29. Kundenkarte als Mittel zur
Informationsgewinnung
Aber was passiert in der Zwischenzeit?
Copyright: Philipp Giselbrecht;Thorben Keller. Stand: 27.08.2013. Exemplar für Henning Haake.
30. Der Kunde ist nicht untätig
Aktuelle Angebote,
Rabatte, Trends
Informationen über
Produkte, Hersteller,
Gütesiegel
Austausch mit Freunden
und Bekannten
Unternehmen haben jedoch keinen Einblick
Copyright: Philipp Giselbrecht;Thorben Keller. Stand: 27.08.2013. Exemplar für Henning Haake.
35. ? ? Einkauf
3
Einkauf
2
Einkauf
1
Aktuelles
Angebot
angeschaut
Einkaufs
Liste
erstellt
Über Ländle
Gütesiegel
informiert
Seine
Einkaufs
Statistiken
angeschaut
Freund hat
Milka
Schoko +
Keks
empfohlen
Über
Almdudler
Limonade
informiert
Trophäen
angeschaut
Einfluss?
1. Alle Produkte gekauft?
2. Wenn nein, was nicht?
3. Was zusätzlich (spontan)
Almdudler gekauft?
Milka Schokolade gekauft?
Angebot
angenommen?
Einfluss?
Einfluss?
Copyright: Philipp Giselbrecht;Thorben Keller. Stand: 27.08.2013. Exemplar für Henning Haake.
36. Big Data mit Cosibon
(Kleine Auswahl)
1. Welchen Einfluss haben aktuelle Angebote auf welche Kundensegmente?
(In der App sogar A/B Test möglich!)
2. Über welche Produkte informieren sich welche Segmente?
3. Welche Produkte sind für Kunden interessant, aber nicht im aktuellen Sortiment?
4. Einfluss von Empfehlungen aus dem sozialen Netzwerk
5. Welche Produkte schreiben sich Kunden auf die Einkaufsliste? In welcher
Reihenfolge? Was kaufen sie dann, was nicht?
6. Einfluss von zusätzlichen Informationen (z.B. Gütesiegel) auf die Kaufentscheidung?
7. Konsumsteuerung durch Gamification möglich? Wenn ja bei welchen Segmenten?
8. Einfluss von Feedback zum Einkauf (z.B. Anteil Ländleprodukte)?
Kontinuierliche Auswertung über die Zeit ermöglicht Modell um stetig höherer
Nutzerakzeptanz und immer bessere Kaufberatung/Konsumsteuerung zu ermöglichen.
Bestes Modell für «Erziehung» von Kunden im Sinne des Unternehmens ist ableitbar.
Bei Sutterlüty zum Beispiel: Regionale und gesunder Ernährung.
Copyright: Philipp Giselbrecht;Thorben Keller. Stand: 27.08.2013. Exemplar für Henning Haake.
38. Big Data bei der Fraport AG
Köln, 25. November 2013
Stefan Sabatzki
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
39. Inhaltsverzeichnis
Unternehmensporträt, April 2013
Chart 2
– Fraport auf einen Blick
– Big Data bei Fraport
– Historie der BI-Umgebung
– Use Case Passagierflüsse
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
40. Fraport auf einen Blick
Chart 3
Unternehmensporträt, April 2013
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
41. Unsere Historie
Chart 4
Unternehmensporträt, April 2013
Vom Flughof Manager 1924...
...zum Manager internationaler Drehkreuze und Airports.
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
42. Umsatzträger sind unsere Kerngeschäftsfelder
Chart 5
Unternehmensporträt, April 2013
Umsätze im Gesamtkonzern nach Segmenten 2012
Aviation Ground
Handling
External
Activities &
Services
Retail &
Real Estate
823,4 Mio. Euro
33,7% 26,6% 18,5% 21,2%
649,3 Mio. Euro 452,9 Mio. Euro 516,4 Mio. Euro
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
43. Frankfurt Airport – Zahlen und Fakten
Unternehmensporträt, April 2013
Chart 6
– 21 km2 Fläche
– bis zu 94 Flugbewegungen/Std.
– 2 Start- und Landebahnen
– 1 Startbahn, 1 Landebahn
– 2 Fluggast-Terminals und
– 1 AIRail Terminal (ICE-Bahnhof)
– 154 Gates; 204 Positionen
– AirCargo Gleisanschluss
An einem Tag*:
– 158.000 Passagiere
– 78.000 Stück Abfluggepäck
– 5.800 Tonnen Cargo
– 397 Züge an den Flughafen-
Bahnhöfen (Fahrplan 2010)
*durchschnittliche Angaben aus 2012
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
44. Big Data bei Fraport
Chart 7
Unternehmensporträt, April 2013
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
45. Eine Definition (von vielen)
Seite 8
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
46. Big Data
Seite 9
Velocity (Geschwindigkeit)
Abfragegeschwindigkeit
Time to Market neuer Lösungen
Verschiedene Ladezyklen
Variety (Vielfalt)
Anzahl Datenquellen
Unstrukturierte Daten
Volume
Nicht Datengröße sondern Menge von Messages
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
47. Historie der BI-Umgebung
Chart 10
Unternehmensporträt, April 2013
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
48. Hintergrund
Seite 11
Inbetriebnahme des „Business Intelligence Architecture Framework“, der BI-
Umgebung für operative Daten im Jahr 2005
Ziel: Ganzheitliche Sicht auf Betriebszustände für das operative Management
mittels
historischer Berichte
online Reports
Nutzerkreis erweitert sich um Disponenten, Betriebsleiter, Mitarbeiter der
Betriebssteuerung
BIAF wird nicht mehr nur rein informativ unterstützend, sondern für die
betriebliche Steuerung genutzt
2013 wird BIAF in die Liste der betriebskritischen, sogenannten „Prio 1 Systeme“
aufgenommen
Die Verfügbarkeit des Systems wirkt sich auf die Qualität der operativen
Prozesse aus. Bei Ausfall des Systems stehen wichtige Informationen zum
„Systemzustand“ Flughafen Frankfurt nicht mehr zur Verfügung.
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
49. Systemüberblick SAS 9.4 + Greenplum
Seite 12
Primary Data Center Secondary Data Center
Greenplum
Appliance
Historical Data
PROD
Backup Daily restore
for DR
mirrored
SAS Visual Analytics +
High Performance Analytics
Greenplum (software-only)
Operational Data
Greenplum
Appliance
DEV, TEST and
Desaster Recovery
GRID
Node2
GRID
Node2
Meta
Srv1
opsDB
Master
GRID
Node1
SAS
Mid 1
opsDB
Second
Greenplum (software-only)
Operational Data
Shared FS Shared FS
Meta
Srv3
SAS
Mid1
SAS
Mid 2
BIAF
Mid
BIAF
Mid
Meta
Srv2
Meta
Srv2
SAS
Mid 2
Meta
Srv1
GRID
Node1
Meta
Srv3
ESRS
Gtwy1
ESRS
Gtwy2
ESRS
Policy
SAS Visual Analytics +
High Performance Analytics
DEV/TEST
PROD
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
51. Use Case Passagierflüsse
Chart 14
Unternehmensporträt, April 2013
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
52. Motivation
Kundenseitig
Kostendruck der Airlines
Optimierung von Wartezeiten der Passagiere
Infrastruktur
Platzmangel für weitere Kontrollstellen
Kapazitätsengpässe aufgrund von Baustellen
Dezentralisierung von Kontrollstellen
Komplexe Passagierflüsse aufgrund kompexer Topologien
Bedarf nach höherer Servicequalität
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
53. 7. LA PAARIS 09.07.2009, R. Frost, A. Hofmann
Seite 16
Architektur
Seite 16
Prognose der
Anzahl der Paxe
für jeden Flug an
jedem Gate
Simulation der
Passagierbewegung
im Terminal
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
54. Training des statistischen Modells
Flirt
INFO
Decision
Tree
Regression
Model
Combination of INFOplus
flight plan data with Flirt passenger
data incl. data cleansing
Multiple
Imputation
Holidays, Events
Federal States
Page 17
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
55. Passagier Prognose
Flight plan with
passenger prognosis
Model
Determination of „best“
input flight plan
MuWo
BestMatch
Saison
OPS
Aus-
Liste
New
Flights
Score
Page 18
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
57. Passagierfluss Simulation
• Die Simulation eines Tages erzeugt ~ 1.5 Millionen Ereignisse (Ein-, Austritte)
• Die Daten werden in der Datenbank in ~ 450.000 Datensätzen abgelegt
• 34 MB an Daten werden so pro 24h-Simulation generiert
• Bei einer Simulation, die alle 5-Minuten gestartet wird und stets den gesamten
Tage simuliert, werden täglich 130 Millionen Datensätze und 9.7 GB an Daten
generiert
• Stresstest im Cluster mit 24 Simulationen gleichzeitig erfolgreich
Seite 20
Zwischenstand Implementierung PAARIS Phase 4
Ergebnisse
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
58. Status Quo und Vision
Seite 21
Passagierprognose pro Flugnummer
Ist
Für jeden Flug der am Frankfurter Flughafen geplant ist,
wird eine Prognose der Total on Board Passagiere und der
Umsteiger mit der Zieldestination vorgenommen, der
Prognose Lauf dauert im Moment ca. 7 Stunden und wird
für unterschiedliche Prognosezeiträume angewandt.
Ziel
Reduktion der Prognoseläufe in den einstelligen
Minutenbereich, um die Kurzfristprognose für den
operativen Einsatz in der Passagierflusssteuerung qualitativ
zu verbessern.
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
59. Vielen Dank für Ihre
Aufmerksamkeit!
Vielen Dank für Ihre Aufmerksamkeit!
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
60. BACKUP
Neue Anforderungen an die Architektur
Seite 23
Höhere Ausfallsicherheit und Disaster Recovery Fähigkeit
Kein Datenverlust bei Ausfall des Rechenzentrums Wahrung der
Datenkonsistenz
Steigerung der Performance im Bereich der Analytics, im speziellen der
„freien“ Analysefähigkeit (unberechenbarer Workload)
Priorisierung von Diensten und Nutzergruppen (Abbildung der
Serviceklassen operational BI vs. classic BI)
Einfache Skalierbarkeit
Die neue Architektur soll in der Lage sein, heutige und anstehende
Probleme lösen zu können, ohne dass es notwendig ist, die
Herausforderung an die Hardwareleistung anzupassen.
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
61. BACKUP
Informationsfluss
Wer ist Nutzer der PFA?
Zur Zeit ca. 250 Nutzer in den Bereichen:
• § 5 Luftsicherheitskontrollen (Bundespolizei und Fraport Konzern)
• Grenzkontrollstellen (Bundespolizei)
• IVK Steuerung (Fraport Konzern)
• Betriebssteuerung (Fraport)
Einsatzleiter
Passagierflusssteuerung
(EPS)
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
62. BACKUP
Umsetzung (Simulation)
Seite 25
Zwischenstand Implementierung PAARIS Phase 4
• Aufbau einer Ereignis-Diskreten-Simulation unter
Anwendung eines Pedestrian Models
(agentenbasiertes Verhalten) und Verwendung
des Terminallayouts als Navigationsgrundlage
• Pedestrian Model in drei Detailstufen SocialForce Modell, Trajectory Modell,
Simple Modell
• Ermittlung verschiedener Bedienzeitenverteilungen z.B. weibull, normal,
uniform (manuelle Zählungen oder aus Systemen wie BCBP)
• Aufbau eines betrieblichen Netzplans (Terminal Layout) und einer Vektor-
Liste zur Navigation der Passagiere innerhalb der Simulation
• Konzeption einer Simulations-Farm
Umsetzung
Copyright: Stefan Sabatzki, AirITSystems GmbH c/o Fraport AG. Stand: 25.11.2013. Exemplar für Henning Haake.
63. BACKUP
Pax Navigation (Simulation)
Seite 26
Zwischenstand Implementierung PAARIS Phase 4
• Als Grundlage dient das Terminal Layout aus dem
sich implizit ein Netzplan ergibt
• Eine Vektorliste beschreibt die laut Beschilderung
möglichen Routen
• Auf einer Kante (Fläche) bewegt sich der Passagier
selbständig. Er interagiert mit seiner näheren
Umgebung, geht anderen Passagieren aus dem Weg
und sucht den kürzesten Weg zur nächsten
Prozesstelle (Knoten). Er nutzt Elemente des
Ebenwechsels nach eigenem ermessen.
• Nach jeder Prozesstelle entscheidet der Passagier
erneut, welche Kante als nächstes zu benutzen ist.
Stehen mehrere Kanten zur Auswahl, entscheidet eine
Wahrscheinlichkeit über den Ausgang (z.B. ZUS-B
40% / 60%)
• Fehlen Verbindungen (Kanten) entscheidet der
Passagier autark und sucht sich den kürzesten Weg
Umsetzung
Primär Route
Alternativ Route
Zusteiger B
B-Ost ZKSB-West ZKS
B-Zentral Ausreise
B10 B20 B33 B43
C1
40% 60%
B1
andere Netzplan Routen
Netzplan
Wege von C1 nach B33
64. U N I V E R S I T Ä T S M E D I Z I N B E R L I NU N I V E R S I T Ä T S M E D I Z I N B E R L I N
BIG Data im Gesundheitswesen –
am Beispiel der Charité
28. August 2012
Martin Peuker
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
65. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
Agenda
• Charité und Herausforderungen IT (BD)
• Integrierte Systemwelten
• Lösungsbeispiel:
– Massendatenauswertungen
– (Ansatz mobile Lösungen)
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
66. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
Charité – Universitätsmedizin Berlin
Campus Buch
Campus
Charité Mitte
Campus
Benjamin Franklin
Campus
Virchow-Klinikum
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
67. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
Vier Berliner Standorte mit einer Nutzfläche von 607.200 m²
14.500 Mitarbeiter
darunter 3.736 Wissenschaftler und Ärzte,
4.065 Schwestern und Pfleger, 778 Verwaltungsmitarbeiter,
227 Professorinnen und Professoren 7,265 students
3,213 Betten mit einer durchschnittliche Verweildauer pro Fall 6.4 Tage
1,3 Milliarde Euro Jahresumsatz
Kennzahlen
Indicators IST 2008 IST 2009 IST 2010 IST 2011
Δ 2011 -
2008 %
Casemix (Punkte) 181.890 186.786 192.910 198.229 16.339 9,0%
Stationäre Fälle 130.453 133.117 136.490 139.142 8.689 6,7%
Verweildauer (Tage) 7,40 6,67 6,56 6,41 -0,99 -13,4%
Ambulante Fälle 530.238 573.966 563.433 593.614 63.376 12,0%
Drittmittel (Mio. Euro) 126 131 149 158,2 32 26%
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
68. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
Klinische Ziele
(Massendaten Auszug)
• Unterstützung personalisierte Therapien
• Erforschung medizinisch-linguistischer Texterschließung
(Arztbriefe, Befunde, Epikrisen, Verlegungsberichte…)
• Entwicklung kommerzieller Studiensoftware
• Sekundäre Datennutzung für Machbarkeitsanalysen klinischer
Studien
• Sekundäre Datennutzung für Studienrekrutierung
• Vorfüllung von Case Report Forms (eCRFs) für klinische Studien
• Retrospektive Analysen
(Qualitätssicherung SGB V 135a / 137c , Pharmakovigilanz,
Data Mining, „eigene Forschung der Kliniken“)
… Beitrag zum Senatsziel „Gesundheitsmetropole Berlin“ (BFG)
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
69. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
• Viele Medienbrüche (noch immer papiergestützte
Dokumentation notwendig?)
• Unstrukturierte Daten
• Anwenderorientierte Oberflächen.
• Daten müssen vollständig und in Echtzeit vorliegen.
– Personalisierte Medizin
• Daten müssen überall (mobil) verfügbar sein.
• Datensicherheit muss durchgehend gewährleistet
sein.
IT Herausforderungen (BD)
(Digitale Klinik)
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
70. VI. Entscheidungsunterstützung
(wissensbasierte System-Funktionen)
V. Automation (klinische Pfade)
IV. Prozess- / Workfloworientierung
III. Daten sammeln und bereitstellen
II. Abteilungslösungen / Insellösungen
I. Papiergestützte Datenerfassung
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
71. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
Realität!?
(Digitale Klinik)
Papiergestütztes Datenmanagement
(für medizinische & administrative Prozesse)
Workflow?
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
72. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
8
SAP HANA
InMemory Technologie
8
BIG Data Technologieansatz (in Memory)
• Massendatenverarbeitung in Echtzeit
(Vorhersage)
• Echtzeitsuche in Texten (auch
unstrukturiert)
• Ziel Ausbau: Genetik und
Systembiologie
• IT Test am Bsp. „HANA
Medical Explorer“ erfolgt
• Projekt zum SAP BW Upgrade auf
SAP HANA (Standard)
• Enabler für diverse Anforderungen des
klinischen Alltags und Forschung
• „neue“ Qualität analytischer
Anwendungen
• Basis für Funktionserweiterungen im
Zusammenspiel mobiler und
cloudbasierter Dienste
Source Gartner – BIG Data HypeCycle 2012
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
73. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
IT architecture at Charité
User Access InMemory Applications
Add Departmental
Systems
Telemonitoring / Patient
Biobank
Death Registry
Tumor
Documentation
Translational Research
Translational
Research
Genome
Transkriptome
Proteome
Metabolism
Clinical Data
Clinical
Diagnostic
Therapeutic
Pathology
Medical Device Data
Public Databases
e.g. Druglists e.g. Genom Atlas e.g. PubMed e.g. HapMap
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
74. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
Medizinisches DataWarehouse
Bsp. Charité
Anzahl Nutzer DWH Datenbankgröße in Terabyte
0
100
200
300
400
500
600
700
800
900
2007 2008 2009 2010 2011 2012
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
2007 2008 2009 2010 2011 2012
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
75. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
in addition to clinical data:
Genome Data
- 3.000.000 data points
Transcriptome Data
- 600.000 data points
Drug Screening
- 1.000 data points
Massendaten – Big Data
Scenarios (for Research issues)
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
76. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
Massendaten – Big Data
Scenarios (for Research issues) - Medical Explorer
In-Memory Technology as key-enabler for real-timeanalysis of tumor data in
seconds instead of hours
In-Memory enables join of third-party data to improve analysis results
Information available at your fingertips: In-Memory Technology on mobile devices
(iPad)
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
77. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
Massendaten (InMemory) – Big Data
Medical Explorer (for Research issues) -Fuzzy Search
Ad-hoc Analysis of heterogeneous tumor data for cancer research
• Medical records of decades of tens of thousands of patients
• Structured and unstructured data (records, time series, free text, etc.)
Solution
• Integration into condensed but
exhaustive view
• On-the-fly analyses
(e.g. Kaplan-Meier estimation, cohort statistics)
• Attributes can be native, views,
freetext-extracted, calculated
Handling of unstructured data
• Any free text attribute is indexed
• Native support of typo-tolerant matching
(using different string comparison methods)
• Native support of synonym tables
(automatic retrieval of German/English
records)
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
78. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
BigData Herausforderungen Charité
Erschließung von Wissen:
Medizinisches Modellwissen (Ontologien)
zur Aufdeckung von Zusammenhängen und Disambiguierung
Ontologieausschnitt Akutes Koronarsyndrom
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
79. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
BigData Herausforderungen Charité
Textbeispiel aus Aufnahmeprotokoll
[Der Patient] [wird] [aus dem Heim] [vorgestellt] [wegen [einer [seit dem
Vorabend] bestehenden Sehstörung], [apraktischen Fehlhandlungen]
[sowie [intermittierender Wesensveränderung] [mit
[zeitlicher Desorientierung] und [visuellen Verkennungen]]]].
Zweiter Lösungsschritt:
Morphosyntaktische Analyse und semantische Annotation
012345: Verwirrtheit
012345: Desorientiertheit
012345: Desorientierung
543210: temporal
543210: zeitlich
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
80. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
BigData Herausforderungen Charité
• Vielgestaltiger medizinischer Sprachgebrauch
(Insult, Apoplex, Schlaganfall, Stroke, Läsion Arteria cerebri media…)
• Komplexer Skopus, Abkürzungen, Homonyme, Schreibfehler
(HWI, 5 mg 1-1-1, 5m, 5 m, Herzinfekt
• „Unscharfe Beschreibungen“
(flaue Flusssignale; mottenfraßähnliche, walnußgroße…)
• Schwierige zeitliche Zuordnung der Symptome, Diagnosen und
Maßnahmen
• Unterscheidung von akuten und chronischen Zuständen
• Gültigkeit und Wertigkeit von Befunden
• Datenschutz und Berechtigungen
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
81. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
• Anforderungen an bereits strukturierte Daten
• Verbesserung der Datenverfügbarkeit bei
Kassenverhandlungen, diverse BenchmarkSzenarios
• Verbesserte ERP Prozesse
• Abrechnungs- und Mahnlaufperformance
• Verbesserung der Qualitätskennzahlen (Realtime)
• Bsp.: Echzeitverarbeitung Tracking OP Siebe
• “Echte Vorschungsunterstützung Bsp. Tumorzentrum durch
In-silico (machine-learning based)
• Datensupport für Pharmakooperationen
BigData Ausblick Charité
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
82. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
Literatur
[Bit12] Bitkom: AK Big Data: Vorläufiges Programm 2012: in: http://www.bitkom.org/files/
documents/Programm_AK_Big_Data_2012.pdf; zugegriffen am: 14..4.2012.
[Bra10] Bradley P, Kaplan J: Turning hospital data into dollars. Health Finance Management. 2010
Feb;64(2):64-8.
[Bux11] Buxton, Ima: Echtzeitanalyse mit In-Memory: Mit iPad und ohne Handbuch unterwegs; in:
Computerwoche vom 11.05.2011, www.computerwoche.de, zugegriffen am 13.4.2012.
[Cha10] Charité: SAP-Verfahrensdokumentation: Anlage zur Verfahrensmeldung SAP-03
„Grundsätze der Systemführung und der Zusammenarbeit“, Version 1.1, 14.6.201, Charité
2010.
[Fer10] Ferranti JM, Langman MK, Tanaka D, McCall J, Ahmad A : Bridging the gap: leveraging
business intelligence tools in support of patient safety and financial effectiveness. J Am Med
Inform Assoc. 2010 Mar-Apr;17(2):136-43.
[ISR11] IS-Report: SAP HANA im Einsatz bei der Charité Berlin, in: isreport, 9/2011, S. 28-29,
www.isreport.de, zugegriffen am 12.4.2012.
[McC10] McCormack J : Number crunching. Predictive analytics helps Presbyterian Healthcare
analyze financial data. Health Data Manag. 2010 Mar;18(3):99.
[Nes12] Nessler, Susanne: Oncolyzer für Patientendaten – Mobile IT zur personalisierten
Krebstherapie; in: Deutschlandradio Kultur, 27.02.2012, www.dradio.de, zugegriffen am
12.4.2012.
[TSy12] T-Systems: Whitepaper „SAP Innovationen“, 2012. T-Systems International GmbH,
Frankfurt am Main, März 2012.
[WHO10] World Health Organisation: World Health Report 2010. Health systems financing. The path
to universal coverage.
[ZPl10] Zeier A, Plattner H: In-Memory Data Management: An Inflection Point for Enterprise
Applications, Springer 2010
Zusammenfassung / Quellen
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
83. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
Fragen?
Martin Peuker
martin.peuker@charite.de
Charité Universitätsmedizin Berlin
Charitéplatz 1
10117 Berlin
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
84. Neuer Ansatz – mittels sorgfältig ausgewählter IT-Komponenten
– Keine direkte Interaktion mit dem zentralen (back-end) KIS
– Mobile Komponenten zeigen (nur!) die relevanten Informationen
– Zentraler Pool medizinischer Assistenten, um die Ärzte von administrativen
Tätigkeiten zu entlasten und Spracherkennung
mobile
elektronische
Diktate
Arbeitsplatzabhängige iPad-Applikationen
Zentrales
back-end KIS
Stationsärzte
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
85. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
U N I V E R S I T Ä T S M E D I Z I N B E R L I N
21
Bsp. ePA Mobil
Copyright: Martin Peuker, Charité Berlin. Stand: 28.08.2012. Exemplar für Henning Haake.
86. U N I V E R S I T Ä T S M E D I Z I N B E R L I N
U N I V E R S I T Ä T S M E D I Z I N B E R L I N
22
Bsp. ePA Mobil
87. What is big data?
• Quantity of data available
• Relevance
• Timely
• Complete & Accurate
• Is available when a decision
needs to be made
27.11.2013 1
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
88. Big Data as new paradigm
in the Financial Industry / Scoring
featured on
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
89. 3
1. Big Data In Financial Industry
2. Big Data As Scoring Paradigm
3. Kreditech
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
90. Total data volume from
first data ever recorded till
2010: 0,18 Zettabyte
or 180.000.000.000 Gigabyte
Data volume from
2010 to 2011:
1,62 Zettabyte
• Data aggregation (map reduce)
• Machine Learning (artificial
intelligence)
Smarter Algorithms:
Cheaper Computational Power:
• Cloud computing
• In-memory databases
What is big data?
900% additional data per year in
comparison to all data in human history.
4
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
91. How is big data being used?
27.11.2013 5
2
800
FBI Credit Bureaus
100%
3%
FBI Financial Industry
Billion of records on private individuals % of data used
Source: Analytics: The reak-world use of big data, a collaborative research study by the IBM
Institute for Business Value and the Said Business School at the University of Oxford.
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
92. How do banks use big data?
Customer-
centric
outcomes; 55%
Operational
optimization;
4%
Rsik/financial
management;
23%
New business
model; 15%
Employee
colaboration;
2%
HOW DO BANKS SEE POTENTIAL IN BIG
DATA?
Big Data offers much more, than raw information. It‘s the foundation of new strategies.
Have not begun
Big Data
activities; 26%
Planning Big
Data activities;
47%
Pilot and
implementation
of big data
activities; 27%
STATUS OF PROJECTS
27.11.2013 6
Source: Analytics: The reak-world use of big data, a collaborative research study by the IBM
Institute for Business Value and the Said Business School at the University of Oxford.
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
93. Current Chances & Challenges
27.11.2013 7
Chances Challenges
- Generate more data (by Big
Data Technologies)
- Analyze more data (e.g.
Zalando vs. Shore store)
- Faster / Leaner/ Cheaper
processes
- New revenue streams
- Developing innovative
products
- Custom tailored solutions
and offers
- Structural Change
- Channel-switch form Offline
to Online
- Security & Data protection
- Regulation
- Cannibalization of „old
business models
- Technological Resources
Source: Bigstockphoto
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
94. Window of Opportunity:
High-Street Banks will Lose Dominance of Lending Market
27.11.2013 8
Exemplary: Consumer credit market development in
the U“ the orld s iggest o su er redit arket
100
104 107 109 112 114
100
110
121
134
147
162
100
120
140
160
180
2011 2012 2013F 2014F 2015F 2016F
%
Total credit volume Online credit volume
Customers' preferred channels for banking
activities worldwide
[CATEGORY
NAME]
[VALUE]
[CATEGORY
NAME]
[VALUE]
Online Branch Visit
Online loans are growing 500% faster than traditional loans.
High potential not only in emerging markets but also developed markets.
“our e: The usto er takes o trol - Global Consumer Banking Survey 2012 by E&Y;
Consumer Credit - G.19 report by Federal Reserve (US)
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
95. 70%
81%
73% 72% 70%
86% 90%
68%
30%
19%
27% 28% 30%
14% 10%
32%
0%
20%
40%
60%
80%
100%
World Brazil Canada China EU India South Africa US
Would You be Willing to Provide Your Bank with More Information About
Yourself if it Helped to Deliver a Better Service?
Yes No
What does this mean for the industry
27.11.2013 9
“our e: The usto er takes o trol - Global Consumer Banking Survey 2012 by E&Y;
Consumer Credit - G.19 report by Federal Reserve (US)
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
96. What does this mean for the industry
3 possible end games
27.11.2013 10
Banks get disrupted / shift in supply
chain and market shares
Banks as innovaters and innovation
driven entities
Banks as gatekeepers /
Infrastructure provides
Analogy: Print Industry Analogy: Photography Industry
Banks e o e the „itu es“ for
financial services
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
97. 11
1. Big Data In Financial Industry
2. Big Data As Scoring Paradigm
3. Kreditech
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
98. How can we use Big Data for Scoring?
Using Big Data
Relevant to the decision
Complete & Accurate
Timely
Available when a decision is
being made
Credit Bureau use of Big Data
×No access to really useful info.
×Alot of missing information
×Old and out of date
×Information not collected when
decision is made
27.11.2013 12
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
99. 5 usto ers do t ha e a credit score
“our e: World Ba k “tatisti s, ; The atio al redit ureau: A key e a ler of
fi a ial i frastru ture a d le di g i de elopi g ou tries a study y M Ki sey. 27.11.2013 13
87%
77% 74%
61%
55% 52%
38%
Spain Ukraine World Kazakhstan Russia EU Brazil
% of population with no credit scoring
history (selected countries)
Biggest market potential lies in emerging markets with no / very poor credit bureau data availability.
Credit Bureau
shares
historic
information
Bank makes
decision
Bank reports
bad /good
(rare) cases to
credit bureau
Credit bureau
updates
information
How Banks (still) make credit decisions
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
100. GIGO Model – Garbage in, garbage out
What makes up a FICO credit score?
35%
30%
15%
10%
10% Payment history
Amounts owed
Length of credit history
New credit accounts
Types of credit used
Germany: Insufficient Schufa Information
63%
28%
1%
8%
Korrekte Daten
FehlendeDaten
Falsche Daten
Veraltete Daten
27.11.2013 14
in % (Schufa-Information of 89 proband)
- Backward looking
- Clustered into „risk groups
- No previous credit means you re lesls creditworthy
Correct
DataMissing Data
Wrong Data
Outdated Data
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
101. Since Current Solutions are Insufficient
27.11.2013 15
Credit Bureau
Check
Customer has no record
• No record for 74% of world population
• No record means no information
• No information means no decisions
Customer has a record
• Cumbersome collection
• Information is backwards looking
• Decisions use 5 factor model (FICO)
?
Wrong decisionsLess customers
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
102. Why not use online data – country and credit
bureau independent?
27.11.2013 16
New Data Sources
New Technologies
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
103. Get more data!
27.11.2013 17
Credit
bureaus
Location
Data
Device
Data
Behaviour
Data
Social
Networks
Web Usage
Data
Financial
Data
Public
Data
E-commerce
Data
Mobile
App Data?
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
104. Location and Environmental Data
27.11.2013 18
Home
Work
IP
Last Check in
Distance
Surounding
Microgeographical
Composition
Coherency of
Information Economic Indicators: Rent
level, purchasing po er …
Business
environment
Geolocation
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
105. Social Network Data
27.11.2013 19
Size of
network
Edgerank
Interactions
and Intensity
Coherence within
networks
Profile
Content
Likes and
interests
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
106. Device and Behavioural Data
27.11.2013 20
Browsing
Behaviour
Typing
Patterns
Website
Usage
Customer
Journey
Device
Information
Browser
Fingerprint
Applications
Network
connection
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
107. More Data is better.
27.11.2013 21
The big data approach can be seen as mosaic picture: the individual datapoint only has marginal influence
?Traditional Approach
Scoring:
5 datapoints
Big Data Approach
Scoring:
8,000 data points
?
Individual
Datapoints
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
108. 22
1. Big Data In Financial Industry
2. Big Data As Scoring Paradigm
3. Kreditech
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
109. Automated Microloans Based on Scoring
Tech
1. Fast, convenient microloans
• 7 – 45 Days; installments recently launched
• 50 – 2.500 EUR (in local currency)
• Maximum of transparency, convenience and speed
2. High customer value
• 24/7 open (no credit bureaus needed)
• Instant decision, real time pay-out (in 10 min on bank account)
• No signature, scans / docs, calls etc. required
3. Automated, scalable operations
• No variable cost besides external query costs and transfer costs
• Scalability (revenue grew by 150 % to 7-digit p.a. with same
headcount / fixed costs)
• Minimized errors and 24/7 operations
27.11.2013 23
Online loans enable maximum learning (volume) at minimum capital risk (low amount) in minimum time (short duration).
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
110. BIG DATA vs. Credit Bureau Data.
27.11.2013 24
70%
20%
7%
Default Rates
Default rates Poland 2013
Baseline Credit Bureau BIG DATA
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
111. BIG DATA vs. Credit Bureau Data.
27.11.2013 25
Products & Development
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
112. Profitable, Automated, Scalable Operations
Profitable, easy to scale operations across the globe
27.11.2013 26
Short-term loans generate rapidly growing cash flows and serve as data basis for constantly re-iterated scoring
technology, which will be gradually rolled out to longer durations
Highly profitable operations
• All live countries are profitable on a unit
economics basis
• No local presence required (only legal
entity + virtual office)
• Automated operations
• Fast, efficient expansion (~ 4 months,
15k per new country)
• Emerging markets show highest demand,
margins and market potential
Defendable USP
• Technology & data allows to launch
countries with virtually no competition at
all (for lack of credit bureaus)
• High degree of proprietary tech
Live Ramp-Up + 3 more (2014)
Poland (08/2012)
Spain (01/2013)
Mexico (09/2013)
Argentina (2014)
Ukraine (2014)
Australia (2013)
Russia (05/2013)
Czech Republic (01/2013)
Peru (2014)
PE
Copyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
113. Kreditech Key Facts
As per November 2013
• 1,200% Growth in 2013 in revenue
• Profitable in core market Poland
• 20 mn USD issued loans in 2013
• Default rate less 10% (group wide)
• Over 250,000 applications till 10/2013
• >1,000 applications / day
• Company Valuation > 70mn EUR
• 10mn EUR raised from Samwers, Silicon Valley,
Team Europe, Heiko Hubertz, Michael Brehm,
Stefan Glaenzer, etc.
27.11.2013 27
Kreditech
Holding
SSL GmbH
First Loan
Issued
Aug 2012
Team
65 FTE
# of Scored
Applications
to Date
350,000
New Loans
Issued 2013
(run rate)
> EUR 14m
p.a.
Capital raised
(Equity + Debt)
EUR 10mn
Contribution
Margin
(after COGS
and writeoffs)
90%Highly Experienced
Management Team
Revenue Run Rate
(Interest + Fees only)
> EUR 5 mn p.a.
Avg. Loss
Rate Steady
State**
̴7%
* Run Rate = Oct 2013 x 12;
** Avg overdue rate Poland (most established market) on loans issued
in August: c. 16% minus c. 55% recoveries = c. 7% loss rateCopyright: Sebastian Diemer, Kreditech Holding SSL GmbH. Stand: 28.11.2013. Exemplar für Henning Haake.
114. Contact
27.11.2013 28
Sebastian Diemer
Founder & CEO of Kreditech
eMail: sebastian@kreditech.com
LinkedIn: www.linkedin.com/in/sebastiandiemer
Website: www.kreditech.com
Twitter: @kreditech
Facebook: www.facebook.com/kreditech
126. Im Takt des Motors - SAP HANA im
Prüffeld bei der Mercedes-AMG GmbH
Dirk Zeller, Mercedes-AMG & Dr. Hagen Radowski, MHP
Handelsblatt Jahrestagung Strategisches IT Management, Januar 2014
Copyright: Hagen Radowski, Mieschke Hofmann und Partner Gesellschaft für Management- und IT-Beratung mbH, A Porsche Company. Stand: 29.01.2014. Exemplar für Henning Haake.Copyright: Hagen Radowski, Mieschke Hofmann und Partner Gesellschaft für Management- und IT-Beratung mbH, A Porsche Company. Stand: 29.01.2014. Exemplar für Henning Haake.
127. Copyright: Hagen Radowski, Mieschke Hofmann und Partner Gesellschaft für Management- und IT-Beratung mbH, A Porsche Company. Stand: 29.01.2014. Exemplar für Henning Haake.
128. Copyright: Hagen Radowski, Mieschke Hofmann und Partner Gesellschaft für Management- und IT-Beratung mbH, A Porsche Company. Stand: 29.01.2014. Exemplar für Henning Haake.
129. Copyright: Hagen Radowski, Mieschke Hofmann und Partner Gesellschaft für Management- und IT-Beratung mbH, A Porsche Company. Stand: 29.01.2014. Exemplar für Henning Haake.
130. • Höhere Effizienz und Zeitgewinn bei
der Analyse großer Datenmengen
• Verbesserung der Reaktions-
geschwindigkeit
• Einfache Erschließung komplexer
Zusammenhänge
• Automatisierte Nutzung bereits
vorhandener Erkenntnisse
In Memory DB und Echtzeit-Analyse als
strategischer Ansatz bei der Mercedes-AMG
GmbH
5 Im Takt des Motors - SAP HANA im Prüffeld bei Mercedes-AMG, Dirk Zeller, Mercedes-AMG GmbH, Dr. Hagen Radowski, MHP, Januar 2014
BusinessDemand
Copyright: Hagen Radowski, Mieschke Hofmann und Partner Gesellschaft für Management- und IT-Beratung mbH, A Porsche Company. Stand: 29.01.2014. Exemplar für Henning Haake.
131. • Eine vertikale Plattform für
Prozessinnovation
• In Memory Computing ist der
Innovationsschwerpunkt
• SAP Suite ist die Integrationsplattform
• Redundanzfreie Analysefunktionen
ersetzen das vorhandene BI System
6
BusinessDemand
ITArchitektur
Im Takt des Motors - SAP HANA im Prüffeld bei Mercedes-AMG, Dirk Zeller, Mercedes-AMG GmbH, Dr. Hagen Radowski, MHP, Januar 2014
In Memory DB und Echtzeit-Analyse als
strategischer Ansatz bei der Mercedes-AMG
GmbH
Copyright: Hagen Radowski, Mieschke Hofmann und Partner Gesellschaft für Management- und IT-Beratung mbH, A Porsche Company. Stand: 29.01.2014. Exemplar für Henning Haake.
132. • Verfügbarkeit von SAP HANA als
Basis für SAP Suite (POC durchlaufen)
• Echtzeit-BI auf Basis von ERP on
HANA ermöglicht schnelle,
redundanzfreie Analyse
• Die technische Architektur ist in die
RZ-Strategie und -Prozesse
integrierbar
7
Technologie-Enabler
BusinessDemand
ITArchitektur
Im Takt des Motors - SAP HANA im Prüffeld bei Mercedes-AMG, Dirk Zeller, Mercedes-AMG GmbH, Dr. Hagen Radowski, MHP, Januar 2014
In Memory DB und Echtzeit-Analyse als
strategischer Ansatz bei der Mercedes-AMG
GmbH
Copyright: Hagen Radowski, Mieschke Hofmann und Partner Gesellschaft für Management- und IT-Beratung mbH, A Porsche Company. Stand: 29.01.2014. Exemplar für Henning Haake.
133. Innovationsansatz
Big Data
Kernprozess
Realtime & Predictive
8 Im Takt des Motors - SAP HANA im Prüffeld bei Mercedes-AMG, Dirk Zeller, Mercedes-AMG GmbH, Dr. Hagen Radowski, MHP, Januar 2014Copyright: Hagen Radowski, Mieschke Hofmann und Partner Gesellschaft für Management- und IT-Beratung mbH, A Porsche Company. Stand: 29.01.2014. Exemplar für Henning Haake.
134. Qualitätssicherung in Echtzeit
• Unterstützt den Kernprozess
Motorenentwicklung/-
erprobung
• Big Data Computing /
Echtzeitanalyse
• Nutzung von predictive
Funktionen zur
Effizienzsteigerung
Echtzeit-Auswertung von Messdaten aus
Gütesicherungsläufen von High Performance AMG-
Motoren auf der Datenbanktechnologie SAP HANA
9 Im Takt des Motors - SAP HANA im Prüffeld bei Mercedes-AMG, Dirk Zeller, Mercedes-AMG GmbH, Dr. Hagen Radowski, MHP, Januar 2014Copyright: Hagen Radowski, Mieschke Hofmann und Partner Gesellschaft für Management- und IT-Beratung mbH, A Porsche Company. Stand: 29.01.2014. Exemplar für Henning Haake.
135. 10
Das Resultat: Geschäftsprozessinnovation
Eine durchgängige Echtzeit-Plattform für Forschung, Entwicklung und Produktion
Vollumfängliche und flexible Echtzeit-Erfassung aller polytechnischen Motorendaten:
von den Prüfständen über die Teststrecke bis zum Dauerläufertest auf der Straße
Echtzeit-Gütesicherung für die Produktion und Echtzeit-Erprobung
Phase 1
Motor auf dem
Prüfstand
Phase 2
Entwicklungsfahrzeu
ge auf Teststrecken
Phase 3
Dauerlauferprobung,
Reifegradabsicherun
g
Phase 4
Kundenfahrzeuge
Im Takt des Motors - SAP HANA im Prüffeld bei Mercedes-AMG, Dirk Zeller, Mercedes-AMG GmbH, Dr. Hagen Radowski, MHP, Januar 2014
SOPEntwicklung, Erprobung und
Gütesicherung
Car IT
Copyright: Hagen Radowski, Mieschke Hofmann und Partner Gesellschaft für Management- und IT-Beratung mbH, A Porsche Company. Stand: 29.01.2014. Exemplar für Henning Haake.
136. Die AMG Real-Time Quality Assurance Lösung
(RQA)
11
RQA ist eine leistungsfähige, skalierbare Plattform für die Optimierung von Primärprozessen
mit polytechnischen Daten als „Big Data“
Basiert auf dem internationalen Standard ASAM/ODS, ist im Matrizenkern flexibel
konfigurierbar und passt so auf andere „Big Data“ Bereiche wie Windkanal,
Crashtests oder Virtual Engineering sowie alle Prüfstände (Getriebe, Bremsen …)
Kombiniert drei Innovationen: HANA, Mobile, Predictive Analysis.
Kann als Stand-Alone Lösung an SAP ERP angeschlossen werden
Reduziert z.B. die Laufzeit bei Auffälligkeiten im Prüffeld von 50 Min.
(bisher Standard) auf wenige Minuten (Neu) durch Sofortabbruch in Echtzeit
Im Takt des Motors - SAP HANA im Prüffeld bei Mercedes-AMG, Dirk Zeller, Mercedes-AMG GmbH, Dr. Hagen Radowski, MHP, Januar 2014Copyright: Hagen Radowski, Mieschke Hofmann und Partner Gesellschaft für Management- und IT-Beratung mbH, A Porsche Company. Stand: 29.01.2014. Exemplar für Henning Haake.
137. RQA technische Architektur „All-in-One“
12
…
Sensordaten über SAP BO Data Services Real-Time ETL
10 Hz
Repository in HANA
SAPHANAXL+4TB
SAPBusinessSuiteQualityManagement
Mobile Access
all Devices via XS Engine
(w/HANA SP 6 Bidirectional)
SAP BO Plattform
4.0 WebI / Dashboards
Repository in HANA
SAP BO Analysis
for MS Office und
Predictive Analysis
oData/HTML5 Universes BICS RQA
Connect
Prüflose
Testzertifikate
RQA
Appli-
cation
Flexible
Wiring
Diagrams
DATA MODEL
w/real-time data matrices
PAL-/R-functions
and rule base
ASAM ODS Client
Im Takt des Motors - SAP HANA im Prüffeld bei Mercedes-AMG, Dirk Zeller, Mercedes-AMG GmbH, Dr. Hagen Radowski, MHP, Januar 2014Copyright: Hagen Radowski, Mieschke Hofmann und Partner Gesellschaft für Management- und IT-Beratung mbH, A Porsche Company. Stand: 29.01.2014. Exemplar für Henning Haake.
138. 13
Schnelle Analysefunktionen wirken auf vor- und
nachgelagerte Prozesse
Phase 1
Motor auf dem
Prüfstand
Phase 2
Entwicklungsfahrzeu
ge auf Teststrecken
Phase 3
Dauerlauferprobung,
Reifegradabsicherun
g
Verbesserte Analysedaten
bessere Datenqualität
Simulationstechnologien
Reifegradverbesserung vor
der ersten Erprobung
schnellere Analysen
effizienter Zugriff auf Vergleichswerte
Ausbau und Verfeinerung der
Predictive-Funktionen
Driving Performance
Im Takt des Motors - SAP HANA im Prüffeld bei Mercedes-AMG, Dirk Zeller, Mercedes-AMG GmbH, Dr. Hagen Radowski, MHP, Januar 2014Copyright: Hagen Radowski, Mieschke Hofmann und Partner Gesellschaft für Management- und IT-Beratung mbH, A Porsche Company. Stand: 29.01.2014. Exemplar für Henning Haake.
139. 14 Im Takt des Motors - SAP HANA im Prüffeld bei Mercedes-AMG, Dirk Zeller, Mercedes-AMG GmbH, Dr. Hagen Radowski, MHP, Januar 2014
140. Big Data & Business Analytics
Capgemini @ Big Data Europe, Zürich
Jürgen Düvel
Copyright: Jürgen Düvel, Capgemini AG. Stand: 28.08.2012. Exemplar für Henning Haake.Copyright: Jürgen Düvel, Capgemini AG. Stand: 28.08.2012. Exemplar für Henning Haake.
159. Copyright: Stephan Pepersack;Daniel Weinmann. Stand: 20.11.2012. Exemplar für Henning Haake.Copyright: Stephan Pepersack;Daniel Weinmann. Stand: 20.11.2012. Exemplar für Henning Haake.
160. 2
A NEW SET OF QUESTIONS
What’s the social
sentiment for my
brand or products
How do I better
predict future
outcomes?
How do I optimize my
fleet based on weather
and traffic patterns?
Copyright: Stephan Pepersack;Daniel Weinmann. Stand: 20.11.2012. Exemplar für Henning Haake.
161. 3
Increases ad revenue by
processing 3.5 billion events per
day
Massive Volumes
Processes 464 billion rows per
quarter, with average query time
under 10 secs.
Measures and ranks online user
influence by processing 3 billion
signals per day
Cloud Connectivity
Connects across 15 social networks
via the cloud for data and API
access
Uses product/ usage analysis and
reseller fraud detection for its
services
Real-Time Insight
Improves operational decision
making for IT managers and
users
Copyright: Stephan Pepersack;Daniel Weinmann. Stand: 20.11.2012. Exemplar für Henning Haake.
162. 4
GAIN COMPETITIVE ADVANTAGE BY MOVING FIRST AND FAST IN YOUR INDUSTRY
Web app
optimization
Smart meter
monitoring
Equipment
monitoring
Advertising
analysis
Life sciences
research
Fraud
detection
Healthcare
outcomes
Weather
forecasting
Natural resource
exploration
Social network
analysis
Churn
analysis
Traffic flow
optimization
IT infrastructure
optimization
Legal
discovery
Copyright: Stephan Pepersack;Daniel Weinmann. Stand: 20.11.2012. Exemplar für Henning Haake.
165. 7
Enterprise class security, HA & management
Seamlessly integrated with Microsoft BI tools
Windows Simplicity and Manageability
Provisioned in minutes on Windows Azure
Copyright: Stephan Pepersack;Daniel Weinmann. Stand: 20.11.2012. Exemplar für Henning Haake.
170. 12
Parallel Data Warehouse
PowerPivot
Power View
Microsoft HDInsight Server
HDInsight Service
Copyright: Stephan Pepersack;Daniel Weinmann. Stand: 20.11.2012. Exemplar für Henning Haake.
171. 13
FastLoad
Source Systems
Historical Data
(Beyond Active Window)
Summarize &
Load
Big Data Sources
(Raw,
Unstructured)
Alerts, Notifications
Data & Compute
Intensive Application
ERP CRM LOB APPS
Integrate/Enrich
SQL Server
StreamInsight
Enterprise ETL with
SSIS, DQS, MDS
Hadoop on
Windows Azure
Hadoop on
Windows Server
SQL Server FTDW
Data Marts
SQL Server
Reporting Services
SQL Server Analysis
Server
Business
Insights
Interactive
Reports
Performance
Scorecards
Crawlers
Bots
Devices
Sensors
SQL Server Parallel
Data Warehouse
3.
Streaming:
Real-time data
processing
4.
Business Analytics:
Interaction
with data
1.
Data Warehousing:
Storing and
analysis of
structured data
2.
Map/Reduce:
Storing and
processing of
unstructured data
Copyright: Stephan Pepersack;Daniel Weinmann. Stand: 20.11.2012. Exemplar für Henning Haake.
172. 14
• LEARN MORE
• Microsoft Big Data Solution: www.microsoft.de/bigdata
• Windows Azure: www.windowsazure.de
• TRY NOW
• Preview of the Windows Azure HDInsight Service:
https://www.hadooponazure.com
• Developer CTP of Microsoft HDInsight Server for Windows
Server: http://www.microsoft.com/bigdata
Gewinnen Sie ein Microsoft Surface.
Jetzt hier am Microsoft Stand registrieren.
Copyright: Stephan Pepersack;Daniel Weinmann. Stand: 20.11.2012. Exemplar für Henning Haake.