Was ist die Basis für erfolgreiche Projekte mit Predictive Analysis?
Datenberge können mit Hilfe von Algorithmen nutzbar gemacht werden. Dabei ist die Vorbereitung der Daten essentiell. Diese durchaus zeitintensive Aufgabe ist die Basis für erfolgreiche Analysen mit SAP Predictive Analysis. Wir zeigen verschiedene Methodiken der Aufbereitung, geben Einblicke in die strukturierte Aufbereitung der Merkmale für Algorithmen und zurück. Erst durch die erfolgreiche Umwandlung wird eine Auswertung der Ergebnisse möglich.
2. Nr. Thema
1 Kurzvorstellung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-Prozess
4 Datenvorbereitung und deren Mehrwert
5 Fazit
6 Fragen & Antworten
Seite 2
Agenda
3. CONOGY GmbH
Gründung 2007
65 Mitarbeiter
Standorte in Berlin & Düsseldorf
Leistungsspektrum
Dienstleistungen im Bereich Business Intelligence,
Data Science und S/4HANA
Von der strategischen Beratung bis zum Betrieb von Business
Intelligence Anwendungen
Buchhaltung, Controlling, Logistik, HR, Vertrieb u.a.
Partner
Langjährige, erfolgreiche Kooperation mit IBsolution
Enge Kooperation mit der SAP im Bereich Predictive Analytics
und Schulungen sowie Recognized-Expertise-Partner im Bereich
BusinessObjects
Seite 3
CONOGY
Überblick
4. Seite 4
CONOGY
Überblick Kompetenzen
Toolauswahl
Architektur
Schulungen
Governance
BI Strategie
Embedded Planning
S/4HANA Analytics
S/4HANA Migration
Fiori
S/4HANA
2nd & 3rd Level
Support
Hotline /
Service Desk
Monitoring
Pflege / Wartung
Application
Management
Dynamic Tiering
Datenmodellierung
Basis Administration
HANA
(BW/4HANA, Native, …)
Data Warehousing
UI5 / Web Dynpro
BusinessObjects
Planung
BO Cloud / Mobile
Analytics
Reporting &
Planung
Datengetriebene
Planung
Data Science
Methodologie
Big Data Szenarien
Data Science
Predictive Analytics
5. Nr. Thema
1 Kurzeinführung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-Prozess
4 Datenvorbereitung und deren Mehrwert
5 Fazit
6 Fragen & Antworten
Seite 5
Agenda
7. Seite 7
Kurzeinführung Predictive Analytics
Use Cases
Brand
Sentiment
Network
Optimization
Predictive
Maintenance
Price
Optimization
Inventory
Control
Analysis of Churn
Rates
Risk Management,
Risk Migitation
Product
Recommendation
Personalized
Care
Customer Analytics: 360°
Customer View
Fraud Detection
Real-time Demand/
Supply Forecast
PUBLIC
SECTOR
MANU-
FACTURING
RETAIL CPG
HEALTH-
CARE
BANKING UTILITIES TELCO
MARKETING
SALES
FINANCE
OPERATIONS
HR
SERVICE
IT
SUPPLY
CHAIN
FRAUD / RISK
25+
Industries
11+ LoB
8. Seite 8
Kurzeinführung Predictive Analytics
Die vier Dimensionen von Big Data
VOLUME
Volumen
Terabytes bis Exabytes an
Daten müssen verarbeitet
werden
VELOCITY
Geschwindigkeit
Nur wenige Millisekunden bis
Sekunden, um auf neue und
geänderte Daten zu reagieren
VARIETY
Vielfalt
Strukturierte, halb-
strukturierte, unstrukturierte
Daten (Zahlen, Text, Bilder,
Sprache, …)
VERACITY
Richtigkeit
Inkonsistente und
unvollständige Daten, Latenz,
Mehrdeutigkeit
9. Definition
Systematische Anwendung statistischer Methoden zur Erkennung
von Mustern, Trends oder Zusammenhängen in Datenbeständen
Selektive Datenanalyse zur Bestätigung von vordefinierten
Hypothesen
Data Mining ist nicht die Extraktion, Transformation und
Auswertung von Daten!
Im Kontext Big Data
Data Mining häufig bei großen Datenmengen im Einsatz
Seite 9
Kurzeinführung Predictive Analytics
Data Mining Abgrenzung
10. Häufige genutzte Methoden
Regressionsanalyse
Zeitreihenanalyse
Klassifikation
Clustering
Assoziationsanalyse
Entscheidungsbäume
Weitere Methoden
Simulation
Ausreißer-Analyse
Netzwerkanalyse
Lineare & Dynamische Optimierungen
Text Mining
Social und Web Mining
…
Seite 10
Kurzeinführung Predictive Analytics
Wichtige Data Mining-Techniken
Regression Zeitreihen Klassifikation Clustering
Ausreißer Neuronale Netze
Entscheidungs-
bäume
Assoziation
11. Nr. Thema
1 Kurzeinführung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-Prozess
4 Datenvorbereitung und deren Mehrwert
5 Fazit
6 Fragen & Antworten
Seite 11
Agenda
12. Business Understanding
Welche Frage soll beantwortet werden?
Welche Parameter (Daten) sind relevant?
Data Understanding
Was sind die Datenquellen?
Wie hoch ist die Datenqualität?
Gibt es systematische Fehler?
Data Preparation
Daten in auswertbares Format bringen / transformieren
Z. B. Ausreißer oder überflüssige Daten eliminieren
Modeling
Methoden/Techniken anwenden und Ergebnisse auswertbar machen
Evaluation
Güte/Verlässlichkeit des Modells testen
Deployment
Seite 12
Einordnung Datenvorbereitung in den Data-Mining-Prozess
Cross-Industry Standard Process for Data Mining (CRISP-DM)
Business
Understanding
Data
Understanding
Data
Preparation
ModelingEvaluation
Deployment
DATA
13. Seite 13
Einordnung Datenvorbereitung in den Data-Mining-Prozess
Phase 3 des CRISP-DM
Fachliches
Verständnis
Daten-
verständnis
Daten-
vorbereitung
Modellierung Bewertung
Operationa-
lisierung
Datenauswahl
Datenbereinigung
Konstruktion von Data Sets
Datenintegration
Datenformatierung
Begründung für Inklusion /
Exklusion
Data-Cleaning-Report
Abgeleitete Attribute
Zusammenführung von
Daten
Syntax der Daten
Data Set Data Set Beschreibung
Neu erzeugte Daten
Aufgaben
Ergebnis
14. Nr. Thema
1 Kurzeinführung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-Prozess
4 Datenvorbereitung und deren Mehrwert
5 Fazit
6 Fragen & Antworten
Seite 14
Agenda
15. Warum müssen Daten vorbereitet werden
Schlechte Datenqualität
Irrelevante Daten
Unterschiedliche Datensatzstrukturen
Sehr unterschiedlicher Stichprobenumfang
Fehlende Werte
Ausreißer
Geringe Anzahl von Datensätzen
Seite 15
Datenvorbereitung und deren Mehrwert
Typische Gründe für die Datenvorbereitung
16. Data Cleaning
Verfahren zum Entfernen und Korrigieren von Datenfehlern
Seite 16
Datenvorbereitung und deren Mehrwert
Methoden zur Datenaufbereitung – Ein Überblick
Data Integration
Zusammenführung verschiedener Datenbestände (aus unter-
schiedlichen Datenstrukturen) in eine gemeinsame einheitliche
Datenstruktur
Data Reduction
Ausschließliche Verwendung von relevanten Daten
Data Transformation
Restrukturierung, Formatierung und Harmonierung von
Datenbeständen
-2, 32, 100 -0.02, 0.32, 1
17. Einfach Wahl des richtigen
Algorithmus:
Entscheidungsbäume, Neuronale
Netze, etc.
Seite 17
Datenvorbereitung und deren Mehrwert
Mehrwert vom automatisierten Modellierungsansatz
Daten
Fachliche
Fragestellungen
Erstellen des zu
analysierenden Data Sets Vorbereiten der Daten Erstellen des Modells
Traditioneller
Ansatz
Automatisierter Ansatz mit
SAP Predictive Analytics
(automated)
SQL manuell zu erstellen
SQL Code schreiben
Regelmäßiges Ausführen
des SQL Codes
SQL mit GUI zu erstellen
Benutzerfreundliches Interface
Automatisiertes Ausführen des
SQL Codings (einplanbar)
Auswahl der richtigen Technik
Fehlende Werte behandeln
Ausreißer und Wechsel-wirkungen
identifizieren
Behandlung voll automatisiert
Eigenständige Wahl des richtigen
Algorithmus mit den richtigen
Parametern:
Entscheidungsbäume, Neuronale
Netze, etc.
?
18. Seite 18
Datenvorbereitung und deren Mehrwert
Aufwandstreiber bei der Datenvorbereitung
Bis zu
90%
Zeitersparnis bei der
Erstellung neuer
Modelle
Vor
Automatisierung
Nach
Automatisierung
Modellüberwachung
Modellentwicklung
Modellerstellung
Datenvorbereitung
Problem
Analysis
Aufwand
19. Nr. Thema
1 Kurzeinführung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-Prozess
4 Datenvorbereitung und deren Mehrwert
5 Fazit
6 Fragen & Antworten
Seite 19
Agenda
20. Zusammenfassung
SAP Predicitive Analytics mehr als nur Buzzword
Datenvorbereitung immer wichtiger im technologischen Kontext
Verbesserte Auswertbarkeit der Informationen mit lohnendem
Ergebnis
ABER sehr aufwändig (beansprucht 70-80% des
Gesamtaufwandes)
Empfehlung
Nutzung von SAP Predictive Analytics (Automated)
Seite 20
Fazit
„[Datenaufbereitung ist der] Schlüssel, um
(verteilte) Daten effizienter für die Optimierung der
Geschäftsprozesse nutzen zu können oder um
neue, innovative Geschäftsmodelle überhaupt erst
zu ermöglichen.“
BARC Report Juni 2017
21. Nr. Thema
1 Kurzeinführung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-Prozess
4 Datenvorbereitung und deren Mehrwert
5 Fazit
6 Fragen & Antworten
Seite 21
Agenda
23. Übersicht zum Buch
Unser SAPPRESS-Buch zum Thema Predictive Analytics
Mit diesem Buch lernen Sie, wie Sie Ihre Daten mit SAP Predictive
Analytics analysieren, um bisher unentdeckte Zusammenhänge
aufzuspüren und Trends vorhersagen zu können.
Inhalte
Einführung und Mehrwerte von SAP Predictive Analytics
Einführung in SAP Predictive Analytics
Automated vs. Expert Analytics Mode
Daten vorbereiten, auswerten und visualisieren
Integration mit SAP Predictive Analysis Library, SAP HANA und
R
SAP Predictive Analytics Buchdaten
440 Seiten, gebunden, erschienen Juli 2017
Buch | E-Book | Bundle
ISBN 978-3-8362-4415-2
Buchansicht und Leseprobe beim Rheinwerk Verlag
Buchansicht und Leseprobe bei Amazon
SAP Predictive Analytics
Buchvorstellung
24. CONOGY GmbH
Martin Verleger
E-Mail: verleger@conogy.de
Tel: 030 - 488 289 800
Seite 24
Ihr Kontakt für mehr Predictive Analytics
Die Unterlagen finden Sie nach dem Webinar unter:
https://www.youtube.com/CONOGYGmbH
https://www.slideshare.net/CONOGY
25. Die in dieser Publikation enthaltene Information ist Eigentum der CONOGY GmbH. Weitergabe und Vervielfältigung dieser Publikation oder von Teilen daraus sind – zu
welchem Zweck und in welcher Form auch immer – nur mit ausdrücklicher schriftlicher Genehmigung durch die CONOGY GmbH gestattet.
Die Angaben im Text sind unverbindlich und dienen lediglich zu Informationszwecken. CONOGY übernimmt keine Haftung für Fehler oder Auslassungen in dieser
Publikation. Des Weiteren übernimmt CONOGY keine Garantie für die Exaktheit oder Vollständigkeit der Informationen, Texte, Grafiken, Links und sonstigen in dieser
Publikation enthaltenen Elementen. Diese Publikation wird ohne jegliche Gewähr, weder ausdrücklich noch stillschweigend, bereitgestellt. Dies gilt u. a., aber nicht
ausschließlich, hinsichtlich der Gewährleistung der Marktgängigkeit und der Eignung für einen bestimmten Zweck sowie für die Gewährleistung der Nichtverletzung
geltenden Rechts.
CONOGY haftet nicht für entstandene Schäden. Dies gilt u. a. und uneingeschränkt für konkrete, besondere und mittelbare Schäden oder Folgeschäden, die aus der
Nutzung dieser Materialien entstehen können. Diese Einschränkung gilt nicht bei Vorsatz oder grober Fahrlässigkeit.
Die gesetzliche Haftung bei Personenschäden oder Produkthaftung bleibt unberührt. Die Informationen, auf die Sie möglicherweise über die in diesem Material
enthaltenen Links zugreifen, unterliegen nicht dem Einfluss von CONOGY, und CONOGY unterstützt nicht die Nutzung von Internetseiten Dritter durch Sie und gibt
keinerlei Gewährleistungen oder Zusagen über Internetseiten Dritter ab.
Microsoft®, WINDOWS®, NT®, EXCEL®, Word®, PowerPoint® und SQL Server® sind eingetragene Marken der Microsoft Corporation.
IBM, DB2, DB2 Universal Database, Informix und PowerPC sind Marken oder eingetragene Marken der IBM Corporation.
Adobe, das Adobe Logo, Acrobat, PostScript und Reader sind Marken oder eingetragene Marken von Adobe Systems Inc. in den USA und/oder anderen Ländern.
ORACLE® ist eine eingetragene Marke der ORACLE Corporation.
UNIX®, X/Open®, OSF/1® und Motif® sind eingetragene Marken der Open Group.
Citrix®, das Citrix-Logo, ICA®, Program Neighborhood®, MetaFrame®, WinFrame®, VideoFrame®, MultiWin® und andere hier erwähnte Namen von Citrix-
Produkten sind Marken von Citrix Systems, Inc.
HTML, DHTML, XML, XHTML sind Marken oder eingetragene Marken des W3C®, World WideWeb Consortium, Massachusetts Institute of Technology.
JAVA® ist eine eingetragene Marke der Sun Microsystems, Inc.
JAVASCRIPT® ist eine eingetragene Marke der Sun Microsystems, Inc., verwendet unter der Lizenz der von Netscape entwickelten und implementierten Technologie.
MaxDB ist eine Marke von MySQL AB, Schweden.
SAP, HANA, BusinessObjects, R/3, mySAP, mySAP.com, xApps, xApp, SAP NetWeaver, und weitere im Text erwähnte SAP-Produkte und -Dienstleistungen sowie die
entsprechenden Logos sind Marken oder eingetragene Marken der SAP AG in Deutschland und anderen Ländern weltweit. Alle anderen Namen von Produkten und
Dienstleistungen sind Marken der jeweiligen Firmen.
Copyright 2017 CONOGY GmbH
Alle Rechte vorbehalten
Seite 25