SlideShare ist ein Scribd-Unternehmen logo
1 von 25
Downloaden Sie, um offline zu lesen
Datenvorbereitung für erfolgreiche
Analysen mit SAP Predictive Analytics
21. November 2017
Webinar
CONOGY GmbH
Nr. Thema
1 Kurzvorstellung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-Prozess
4 Datenvorbereitung und deren Mehrwert
5 Fazit
6 Fragen & Antworten
Seite 2
Agenda
CONOGY GmbH
 Gründung 2007
 65 Mitarbeiter
 Standorte in Berlin & Düsseldorf
Leistungsspektrum
 Dienstleistungen im Bereich Business Intelligence,
Data Science und S/4HANA
 Von der strategischen Beratung bis zum Betrieb von Business
Intelligence Anwendungen
 Buchhaltung, Controlling, Logistik, HR, Vertrieb u.a.
Partner
 Langjährige, erfolgreiche Kooperation mit IBsolution
 Enge Kooperation mit der SAP im Bereich Predictive Analytics
und Schulungen sowie Recognized-Expertise-Partner im Bereich
BusinessObjects
Seite 3
CONOGY
Überblick
Seite 4
CONOGY
Überblick Kompetenzen
Toolauswahl
Architektur
Schulungen
Governance
BI Strategie
Embedded Planning
S/4HANA Analytics
S/4HANA Migration
Fiori
S/4HANA
2nd & 3rd Level
Support
Hotline /
Service Desk
Monitoring
Pflege / Wartung
Application
Management
Dynamic Tiering
Datenmodellierung
Basis Administration
HANA
(BW/4HANA, Native, …)
Data Warehousing
UI5 / Web Dynpro
BusinessObjects
Planung
BO Cloud / Mobile
Analytics
Reporting &
Planung
Datengetriebene
Planung
Data Science
Methodologie
Big Data Szenarien
Data Science
Predictive Analytics
Nr. Thema
1 Kurzeinführung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-Prozess
4 Datenvorbereitung und deren Mehrwert
5 Fazit
6 Fragen & Antworten
Seite 5
Agenda
Rohdaten
Bereinigte
Daten
Standard-
berichte
Analytische,
multidimensionale
Berichte
Prediktive
Modellierung
Optimierung
Multivariate
Analyse
Wahrnehmen und reagieren Vorhersagen und agieren
Analytische Reife
Wettbewerbsvorteil
Was ist passiert?
Warum ist es passiert?
Was wird passieren?
Was ist das beste,
das passieren könnte?
Kurzeinführung Predictive Analytics
Einordnung von Predictive Analytics
Seite 7
Kurzeinführung Predictive Analytics
Use Cases
Brand
Sentiment
Network
Optimization
Predictive
Maintenance
Price
Optimization
Inventory
Control
Analysis of Churn
Rates
Risk Management,
Risk Migitation
Product
Recommendation
Personalized
Care
Customer Analytics: 360°
Customer View
Fraud Detection
Real-time Demand/
Supply Forecast
PUBLIC
SECTOR
MANU-
FACTURING
RETAIL CPG
HEALTH-
CARE
BANKING UTILITIES TELCO
MARKETING
SALES
FINANCE
OPERATIONS
HR
SERVICE
IT
SUPPLY
CHAIN
FRAUD / RISK
25+
Industries
11+ LoB
Seite 8
Kurzeinführung Predictive Analytics
Die vier Dimensionen von Big Data
VOLUME
Volumen
Terabytes bis Exabytes an
Daten müssen verarbeitet
werden
VELOCITY
Geschwindigkeit
Nur wenige Millisekunden bis
Sekunden, um auf neue und
geänderte Daten zu reagieren
VARIETY
Vielfalt
Strukturierte, halb-
strukturierte, unstrukturierte
Daten (Zahlen, Text, Bilder,
Sprache, …)
VERACITY
Richtigkeit
Inkonsistente und
unvollständige Daten, Latenz,
Mehrdeutigkeit
Definition
 Systematische Anwendung statistischer Methoden zur Erkennung
von Mustern, Trends oder Zusammenhängen in Datenbeständen
 Selektive Datenanalyse zur Bestätigung von vordefinierten
Hypothesen
Data Mining ist nicht die Extraktion, Transformation und
Auswertung von Daten!
Im Kontext Big Data
 Data Mining häufig bei großen Datenmengen im Einsatz
Seite 9
Kurzeinführung Predictive Analytics
Data Mining Abgrenzung
Häufige genutzte Methoden
 Regressionsanalyse
 Zeitreihenanalyse
 Klassifikation
 Clustering
 Assoziationsanalyse
 Entscheidungsbäume
Weitere Methoden
 Simulation
 Ausreißer-Analyse
 Netzwerkanalyse
 Lineare & Dynamische Optimierungen
 Text Mining
 Social und Web Mining
 …
Seite 10
Kurzeinführung Predictive Analytics
Wichtige Data Mining-Techniken
Regression Zeitreihen Klassifikation Clustering
Ausreißer Neuronale Netze
Entscheidungs-
bäume
Assoziation
Nr. Thema
1 Kurzeinführung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-Prozess
4 Datenvorbereitung und deren Mehrwert
5 Fazit
6 Fragen & Antworten
Seite 11
Agenda
Business Understanding
 Welche Frage soll beantwortet werden?
 Welche Parameter (Daten) sind relevant?
Data Understanding
 Was sind die Datenquellen?
 Wie hoch ist die Datenqualität?
 Gibt es systematische Fehler?
Data Preparation
 Daten in auswertbares Format bringen / transformieren
 Z. B. Ausreißer oder überflüssige Daten eliminieren
Modeling
 Methoden/Techniken anwenden und Ergebnisse auswertbar machen
Evaluation
 Güte/Verlässlichkeit des Modells testen
Deployment
Seite 12
Einordnung Datenvorbereitung in den Data-Mining-Prozess
Cross-Industry Standard Process for Data Mining (CRISP-DM)
Business
Understanding
Data
Understanding
Data
Preparation
ModelingEvaluation
Deployment
DATA
Seite 13
Einordnung Datenvorbereitung in den Data-Mining-Prozess
Phase 3 des CRISP-DM
Fachliches
Verständnis
Daten-
verständnis
Daten-
vorbereitung
Modellierung Bewertung
Operationa-
lisierung
Datenauswahl
Datenbereinigung
Konstruktion von Data Sets
Datenintegration
Datenformatierung
Begründung für Inklusion /
Exklusion
Data-Cleaning-Report
Abgeleitete Attribute
Zusammenführung von
Daten
Syntax der Daten
Data Set Data Set Beschreibung
Neu erzeugte Daten
Aufgaben
Ergebnis
Nr. Thema
1 Kurzeinführung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-Prozess
4 Datenvorbereitung und deren Mehrwert
5 Fazit
6 Fragen & Antworten
Seite 14
Agenda
Warum müssen Daten vorbereitet werden
 Schlechte Datenqualität
 Irrelevante Daten
 Unterschiedliche Datensatzstrukturen
 Sehr unterschiedlicher Stichprobenumfang
 Fehlende Werte
 Ausreißer
 Geringe Anzahl von Datensätzen
Seite 15
Datenvorbereitung und deren Mehrwert
Typische Gründe für die Datenvorbereitung
Data Cleaning
 Verfahren zum Entfernen und Korrigieren von Datenfehlern
Seite 16
Datenvorbereitung und deren Mehrwert
Methoden zur Datenaufbereitung – Ein Überblick
Data Integration
 Zusammenführung verschiedener Datenbestände (aus unter-
schiedlichen Datenstrukturen) in eine gemeinsame einheitliche
Datenstruktur
Data Reduction
 Ausschließliche Verwendung von relevanten Daten
Data Transformation
 Restrukturierung, Formatierung und Harmonierung von
Datenbeständen
-2, 32, 100 -0.02, 0.32, 1
Einfach Wahl des richtigen
Algorithmus:
Entscheidungsbäume, Neuronale
Netze, etc.
Seite 17
Datenvorbereitung und deren Mehrwert
Mehrwert vom automatisierten Modellierungsansatz
Daten
Fachliche
Fragestellungen
Erstellen des zu
analysierenden Data Sets Vorbereiten der Daten Erstellen des Modells
Traditioneller
Ansatz
Automatisierter Ansatz mit
SAP Predictive Analytics
(automated)
SQL manuell zu erstellen
 SQL Code schreiben
 Regelmäßiges Ausführen
des SQL Codes
SQL mit GUI zu erstellen
 Benutzerfreundliches Interface
 Automatisiertes Ausführen des
SQL Codings (einplanbar)
Auswahl der richtigen Technik
 Fehlende Werte behandeln
 Ausreißer und Wechsel-wirkungen
identifizieren
Behandlung voll automatisiert
Eigenständige Wahl des richtigen
Algorithmus mit den richtigen
Parametern:
Entscheidungsbäume, Neuronale
Netze, etc.
?
Seite 18
Datenvorbereitung und deren Mehrwert
Aufwandstreiber bei der Datenvorbereitung
Bis zu
90%
Zeitersparnis bei der
Erstellung neuer
Modelle
Vor
Automatisierung
Nach
Automatisierung
Modellüberwachung
Modellentwicklung
Modellerstellung
Datenvorbereitung
Problem
Analysis
Aufwand
Nr. Thema
1 Kurzeinführung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-Prozess
4 Datenvorbereitung und deren Mehrwert
5 Fazit
6 Fragen & Antworten
Seite 19
Agenda
Zusammenfassung
 SAP Predicitive Analytics mehr als nur Buzzword
 Datenvorbereitung immer wichtiger im technologischen Kontext
 Verbesserte Auswertbarkeit der Informationen mit lohnendem
Ergebnis
 ABER sehr aufwändig (beansprucht 70-80% des
Gesamtaufwandes)
Empfehlung
 Nutzung von SAP Predictive Analytics (Automated)
Seite 20
Fazit
„[Datenaufbereitung ist der] Schlüssel, um
(verteilte) Daten effizienter für die Optimierung der
Geschäftsprozesse nutzen zu können oder um
neue, innovative Geschäftsmodelle überhaupt erst
zu ermöglichen.“
BARC Report Juni 2017
Nr. Thema
1 Kurzeinführung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-Prozess
4 Datenvorbereitung und deren Mehrwert
5 Fazit
6 Fragen & Antworten
Seite 21
Agenda
Seite 22
Fragen & Antworten
Übersicht zum Buch
 Unser SAPPRESS-Buch zum Thema Predictive Analytics
 Mit diesem Buch lernen Sie, wie Sie Ihre Daten mit SAP Predictive
Analytics analysieren, um bisher unentdeckte Zusammenhänge
aufzuspüren und Trends vorhersagen zu können.
Inhalte
 Einführung und Mehrwerte von SAP Predictive Analytics
 Einführung in SAP Predictive Analytics
 Automated vs. Expert Analytics Mode
 Daten vorbereiten, auswerten und visualisieren
 Integration mit SAP Predictive Analysis Library, SAP HANA und
R
SAP Predictive Analytics Buchdaten
 440 Seiten, gebunden, erschienen Juli 2017
 Buch | E-Book | Bundle
 ISBN 978-3-8362-4415-2
 Buchansicht und Leseprobe beim Rheinwerk Verlag
 Buchansicht und Leseprobe bei Amazon
SAP Predictive Analytics
Buchvorstellung
CONOGY GmbH
Martin Verleger
E-Mail: verleger@conogy.de
Tel: 030 - 488 289 800
Seite 24
Ihr Kontakt für mehr Predictive Analytics
Die Unterlagen finden Sie nach dem Webinar unter:
https://www.youtube.com/CONOGYGmbH
https://www.slideshare.net/CONOGY
Die in dieser Publikation enthaltene Information ist Eigentum der CONOGY GmbH. Weitergabe und Vervielfältigung dieser Publikation oder von Teilen daraus sind – zu
welchem Zweck und in welcher Form auch immer – nur mit ausdrücklicher schriftlicher Genehmigung durch die CONOGY GmbH gestattet.
Die Angaben im Text sind unverbindlich und dienen lediglich zu Informationszwecken. CONOGY übernimmt keine Haftung für Fehler oder Auslassungen in dieser
Publikation. Des Weiteren übernimmt CONOGY keine Garantie für die Exaktheit oder Vollständigkeit der Informationen, Texte, Grafiken, Links und sonstigen in dieser
Publikation enthaltenen Elementen. Diese Publikation wird ohne jegliche Gewähr, weder ausdrücklich noch stillschweigend, bereitgestellt. Dies gilt u. a., aber nicht
ausschließlich, hinsichtlich der Gewährleistung der Marktgängigkeit und der Eignung für einen bestimmten Zweck sowie für die Gewährleistung der Nichtverletzung
geltenden Rechts.
CONOGY haftet nicht für entstandene Schäden. Dies gilt u. a. und uneingeschränkt für konkrete, besondere und mittelbare Schäden oder Folgeschäden, die aus der
Nutzung dieser Materialien entstehen können. Diese Einschränkung gilt nicht bei Vorsatz oder grober Fahrlässigkeit.
Die gesetzliche Haftung bei Personenschäden oder Produkthaftung bleibt unberührt. Die Informationen, auf die Sie möglicherweise über die in diesem Material
enthaltenen Links zugreifen, unterliegen nicht dem Einfluss von CONOGY, und CONOGY unterstützt nicht die Nutzung von Internetseiten Dritter durch Sie und gibt
keinerlei Gewährleistungen oder Zusagen über Internetseiten Dritter ab.
Microsoft®, WINDOWS®, NT®, EXCEL®, Word®, PowerPoint® und SQL Server® sind eingetragene Marken der Microsoft Corporation.
IBM, DB2, DB2 Universal Database, Informix und PowerPC sind Marken oder eingetragene Marken der IBM Corporation.
Adobe, das Adobe Logo, Acrobat, PostScript und Reader sind Marken oder eingetragene Marken von Adobe Systems Inc. in den USA und/oder anderen Ländern.
ORACLE® ist eine eingetragene Marke der ORACLE Corporation.
UNIX®, X/Open®, OSF/1® und Motif® sind eingetragene Marken der Open Group.
Citrix®, das Citrix-Logo, ICA®, Program Neighborhood®, MetaFrame®, WinFrame®, VideoFrame®, MultiWin® und andere hier erwähnte Namen von Citrix-
Produkten sind Marken von Citrix Systems, Inc.
HTML, DHTML, XML, XHTML sind Marken oder eingetragene Marken des W3C®, World WideWeb Consortium, Massachusetts Institute of Technology.
JAVA® ist eine eingetragene Marke der Sun Microsystems, Inc.
JAVASCRIPT® ist eine eingetragene Marke der Sun Microsystems, Inc., verwendet unter der Lizenz der von Netscape entwickelten und implementierten Technologie.
MaxDB ist eine Marke von MySQL AB, Schweden.
SAP, HANA, BusinessObjects, R/3, mySAP, mySAP.com, xApps, xApp, SAP NetWeaver, und weitere im Text erwähnte SAP-Produkte und -Dienstleistungen sowie die
entsprechenden Logos sind Marken oder eingetragene Marken der SAP AG in Deutschland und anderen Ländern weltweit. Alle anderen Namen von Produkten und
Dienstleistungen sind Marken der jeweiligen Firmen.
Copyright 2017 CONOGY GmbH
Alle Rechte vorbehalten
Seite 25

Weitere ähnliche Inhalte

Ähnlich wie Webinarunterlagen: Datenvorbereitung für erfolgreiche Analysen mit SAP Predictive Analytics

worldiety GmbH - Datenanalyse
worldiety GmbH - Datenanalyse worldiety GmbH - Datenanalyse
worldiety GmbH - Datenanalyse worldiety GmbH
 
Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...
Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...
Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...Christian Schieder
 
Big Data - Die große Innovation?
Big Data - Die große Innovation?Big Data - Die große Innovation?
Big Data - Die große Innovation?BARC GmbH
 
Erfolgreiche Datenstrategien für PIM & MDM entwerfen
Erfolgreiche Datenstrategien für PIM & MDM entwerfenErfolgreiche Datenstrategien für PIM & MDM entwerfen
Erfolgreiche Datenstrategien für PIM & MDM entwerfenDatentreiber
 
BI und ECM - Verbindung von strukturierten und unstrukturierten Daten
BI und ECM - Verbindung von strukturierten und unstrukturierten DatenBI und ECM - Verbindung von strukturierten und unstrukturierten Daten
BI und ECM - Verbindung von strukturierten und unstrukturierten DatenBARC GmbH
 
Webinar Slides: SharePoint als Drehscheibe fuer ihr Unternehmenswissen
Webinar Slides: SharePoint als Drehscheibe fuer ihr UnternehmenswissenWebinar Slides: SharePoint als Drehscheibe fuer ihr Unternehmenswissen
Webinar Slides: SharePoint als Drehscheibe fuer ihr UnternehmenswissenB-S-S Business Software Solutions GmbH
 
TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...
TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...
TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...SQL Projekt AG
 
Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018
Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018
Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018Digital Analytics Institute
 
Aktuelle Trends in der Visualisierung von Informationen
Aktuelle Trends in der Visualisierung von InformationenAktuelle Trends in der Visualisierung von Informationen
Aktuelle Trends in der Visualisierung von InformationenBARC GmbH
 
SEO-Controlling und SEO-Kennzahlen
SEO-Controlling und SEO-KennzahlenSEO-Controlling und SEO-Kennzahlen
SEO-Controlling und SEO-KennzahlenHanns Kronenberg
 
SEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes Kunze
SEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes KunzeSEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes Kunze
SEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes Kunzetakevalue Consulting GmbH
 
Schulug Grundlagen SAP BI / BW
Schulug Grundlagen SAP BI / BWSchulug Grundlagen SAP BI / BW
Schulug Grundlagen SAP BI / BWA. LE
 
Big Data Governance
Big Data GovernanceBig Data Governance
Big Data GovernanceCapgemini
 
Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...
Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...
Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...Thomas Jenewein
 
Der Markt für Planungs- und Controlling-Systeme
Der Markt für Planungs- und Controlling-SystemeDer Markt für Planungs- und Controlling-Systeme
Der Markt für Planungs- und Controlling-SystemeBARC GmbH
 
Erfolgsfaktoren einer datengetriebenen Customer-Care-Optimierung
Erfolgsfaktoren einer datengetriebenen Customer-Care-OptimierungErfolgsfaktoren einer datengetriebenen Customer-Care-Optimierung
Erfolgsfaktoren einer datengetriebenen Customer-Care-Optimierunginovex GmbH
 
ÖBB - Bahnstrombedarfsprognose- mit Advanced Analytics
ÖBB - Bahnstrombedarfsprognose- mit Advanced Analytics ÖBB - Bahnstrombedarfsprognose- mit Advanced Analytics
ÖBB - Bahnstrombedarfsprognose- mit Advanced Analytics Microsoft Österreich
 
Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)
Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)
Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)Praxistage
 

Ähnlich wie Webinarunterlagen: Datenvorbereitung für erfolgreiche Analysen mit SAP Predictive Analytics (20)

worldiety GmbH - Datenanalyse
worldiety GmbH - Datenanalyse worldiety GmbH - Datenanalyse
worldiety GmbH - Datenanalyse
 
Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...
Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...
Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...
 
Big Data - Die große Innovation?
Big Data - Die große Innovation?Big Data - Die große Innovation?
Big Data - Die große Innovation?
 
Erfolgreiche Datenstrategien für PIM & MDM entwerfen
Erfolgreiche Datenstrategien für PIM & MDM entwerfenErfolgreiche Datenstrategien für PIM & MDM entwerfen
Erfolgreiche Datenstrategien für PIM & MDM entwerfen
 
BI und ECM - Verbindung von strukturierten und unstrukturierten Daten
BI und ECM - Verbindung von strukturierten und unstrukturierten DatenBI und ECM - Verbindung von strukturierten und unstrukturierten Daten
BI und ECM - Verbindung von strukturierten und unstrukturierten Daten
 
Webinar Slides: SharePoint als Drehscheibe fuer ihr Unternehmenswissen
Webinar Slides: SharePoint als Drehscheibe fuer ihr UnternehmenswissenWebinar Slides: SharePoint als Drehscheibe fuer ihr Unternehmenswissen
Webinar Slides: SharePoint als Drehscheibe fuer ihr Unternehmenswissen
 
TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...
TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...
TRANSCONNECT® als Integrationslayer in einem Master-Data-Management-Projekt (...
 
Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018
Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018
Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018
 
Aktuelle Trends in der Visualisierung von Informationen
Aktuelle Trends in der Visualisierung von InformationenAktuelle Trends in der Visualisierung von Informationen
Aktuelle Trends in der Visualisierung von Informationen
 
SEO-Controlling und SEO-Kennzahlen
SEO-Controlling und SEO-KennzahlenSEO-Controlling und SEO-Kennzahlen
SEO-Controlling und SEO-Kennzahlen
 
2010 09 29 13-30 michael gniffke
2010 09 29 13-30 michael gniffke2010 09 29 13-30 michael gniffke
2010 09 29 13-30 michael gniffke
 
SEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes Kunze
SEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes KunzeSEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes Kunze
SEO Campixx 2015 | ETL & BI für SEO Analysen und Reportings von Johannes Kunze
 
Analytics für Einsteiger
Analytics für EinsteigerAnalytics für Einsteiger
Analytics für Einsteiger
 
Schulug Grundlagen SAP BI / BW
Schulug Grundlagen SAP BI / BWSchulug Grundlagen SAP BI / BW
Schulug Grundlagen SAP BI / BW
 
Big Data Governance
Big Data GovernanceBig Data Governance
Big Data Governance
 
Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...
Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...
Digitales Talentmanagement: Überblick und Erfahrungen aus einem MOOC mit über...
 
Der Markt für Planungs- und Controlling-Systeme
Der Markt für Planungs- und Controlling-SystemeDer Markt für Planungs- und Controlling-Systeme
Der Markt für Planungs- und Controlling-Systeme
 
Erfolgsfaktoren einer datengetriebenen Customer-Care-Optimierung
Erfolgsfaktoren einer datengetriebenen Customer-Care-OptimierungErfolgsfaktoren einer datengetriebenen Customer-Care-Optimierung
Erfolgsfaktoren einer datengetriebenen Customer-Care-Optimierung
 
ÖBB - Bahnstrombedarfsprognose- mit Advanced Analytics
ÖBB - Bahnstrombedarfsprognose- mit Advanced Analytics ÖBB - Bahnstrombedarfsprognose- mit Advanced Analytics
ÖBB - Bahnstrombedarfsprognose- mit Advanced Analytics
 
Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)
Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)
Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)
 

Webinarunterlagen: Datenvorbereitung für erfolgreiche Analysen mit SAP Predictive Analytics

  • 1. Datenvorbereitung für erfolgreiche Analysen mit SAP Predictive Analytics 21. November 2017 Webinar CONOGY GmbH
  • 2. Nr. Thema 1 Kurzvorstellung CONOGY 2 Kurzeinführung Predictive Analytics 3 Einordnung Datenvorbereitung in den Data-Mining-Prozess 4 Datenvorbereitung und deren Mehrwert 5 Fazit 6 Fragen & Antworten Seite 2 Agenda
  • 3. CONOGY GmbH  Gründung 2007  65 Mitarbeiter  Standorte in Berlin & Düsseldorf Leistungsspektrum  Dienstleistungen im Bereich Business Intelligence, Data Science und S/4HANA  Von der strategischen Beratung bis zum Betrieb von Business Intelligence Anwendungen  Buchhaltung, Controlling, Logistik, HR, Vertrieb u.a. Partner  Langjährige, erfolgreiche Kooperation mit IBsolution  Enge Kooperation mit der SAP im Bereich Predictive Analytics und Schulungen sowie Recognized-Expertise-Partner im Bereich BusinessObjects Seite 3 CONOGY Überblick
  • 4. Seite 4 CONOGY Überblick Kompetenzen Toolauswahl Architektur Schulungen Governance BI Strategie Embedded Planning S/4HANA Analytics S/4HANA Migration Fiori S/4HANA 2nd & 3rd Level Support Hotline / Service Desk Monitoring Pflege / Wartung Application Management Dynamic Tiering Datenmodellierung Basis Administration HANA (BW/4HANA, Native, …) Data Warehousing UI5 / Web Dynpro BusinessObjects Planung BO Cloud / Mobile Analytics Reporting & Planung Datengetriebene Planung Data Science Methodologie Big Data Szenarien Data Science Predictive Analytics
  • 5. Nr. Thema 1 Kurzeinführung CONOGY 2 Kurzeinführung Predictive Analytics 3 Einordnung Datenvorbereitung in den Data-Mining-Prozess 4 Datenvorbereitung und deren Mehrwert 5 Fazit 6 Fragen & Antworten Seite 5 Agenda
  • 6. Rohdaten Bereinigte Daten Standard- berichte Analytische, multidimensionale Berichte Prediktive Modellierung Optimierung Multivariate Analyse Wahrnehmen und reagieren Vorhersagen und agieren Analytische Reife Wettbewerbsvorteil Was ist passiert? Warum ist es passiert? Was wird passieren? Was ist das beste, das passieren könnte? Kurzeinführung Predictive Analytics Einordnung von Predictive Analytics
  • 7. Seite 7 Kurzeinführung Predictive Analytics Use Cases Brand Sentiment Network Optimization Predictive Maintenance Price Optimization Inventory Control Analysis of Churn Rates Risk Management, Risk Migitation Product Recommendation Personalized Care Customer Analytics: 360° Customer View Fraud Detection Real-time Demand/ Supply Forecast PUBLIC SECTOR MANU- FACTURING RETAIL CPG HEALTH- CARE BANKING UTILITIES TELCO MARKETING SALES FINANCE OPERATIONS HR SERVICE IT SUPPLY CHAIN FRAUD / RISK 25+ Industries 11+ LoB
  • 8. Seite 8 Kurzeinführung Predictive Analytics Die vier Dimensionen von Big Data VOLUME Volumen Terabytes bis Exabytes an Daten müssen verarbeitet werden VELOCITY Geschwindigkeit Nur wenige Millisekunden bis Sekunden, um auf neue und geänderte Daten zu reagieren VARIETY Vielfalt Strukturierte, halb- strukturierte, unstrukturierte Daten (Zahlen, Text, Bilder, Sprache, …) VERACITY Richtigkeit Inkonsistente und unvollständige Daten, Latenz, Mehrdeutigkeit
  • 9. Definition  Systematische Anwendung statistischer Methoden zur Erkennung von Mustern, Trends oder Zusammenhängen in Datenbeständen  Selektive Datenanalyse zur Bestätigung von vordefinierten Hypothesen Data Mining ist nicht die Extraktion, Transformation und Auswertung von Daten! Im Kontext Big Data  Data Mining häufig bei großen Datenmengen im Einsatz Seite 9 Kurzeinführung Predictive Analytics Data Mining Abgrenzung
  • 10. Häufige genutzte Methoden  Regressionsanalyse  Zeitreihenanalyse  Klassifikation  Clustering  Assoziationsanalyse  Entscheidungsbäume Weitere Methoden  Simulation  Ausreißer-Analyse  Netzwerkanalyse  Lineare & Dynamische Optimierungen  Text Mining  Social und Web Mining  … Seite 10 Kurzeinführung Predictive Analytics Wichtige Data Mining-Techniken Regression Zeitreihen Klassifikation Clustering Ausreißer Neuronale Netze Entscheidungs- bäume Assoziation
  • 11. Nr. Thema 1 Kurzeinführung CONOGY 2 Kurzeinführung Predictive Analytics 3 Einordnung Datenvorbereitung in den Data-Mining-Prozess 4 Datenvorbereitung und deren Mehrwert 5 Fazit 6 Fragen & Antworten Seite 11 Agenda
  • 12. Business Understanding  Welche Frage soll beantwortet werden?  Welche Parameter (Daten) sind relevant? Data Understanding  Was sind die Datenquellen?  Wie hoch ist die Datenqualität?  Gibt es systematische Fehler? Data Preparation  Daten in auswertbares Format bringen / transformieren  Z. B. Ausreißer oder überflüssige Daten eliminieren Modeling  Methoden/Techniken anwenden und Ergebnisse auswertbar machen Evaluation  Güte/Verlässlichkeit des Modells testen Deployment Seite 12 Einordnung Datenvorbereitung in den Data-Mining-Prozess Cross-Industry Standard Process for Data Mining (CRISP-DM) Business Understanding Data Understanding Data Preparation ModelingEvaluation Deployment DATA
  • 13. Seite 13 Einordnung Datenvorbereitung in den Data-Mining-Prozess Phase 3 des CRISP-DM Fachliches Verständnis Daten- verständnis Daten- vorbereitung Modellierung Bewertung Operationa- lisierung Datenauswahl Datenbereinigung Konstruktion von Data Sets Datenintegration Datenformatierung Begründung für Inklusion / Exklusion Data-Cleaning-Report Abgeleitete Attribute Zusammenführung von Daten Syntax der Daten Data Set Data Set Beschreibung Neu erzeugte Daten Aufgaben Ergebnis
  • 14. Nr. Thema 1 Kurzeinführung CONOGY 2 Kurzeinführung Predictive Analytics 3 Einordnung Datenvorbereitung in den Data-Mining-Prozess 4 Datenvorbereitung und deren Mehrwert 5 Fazit 6 Fragen & Antworten Seite 14 Agenda
  • 15. Warum müssen Daten vorbereitet werden  Schlechte Datenqualität  Irrelevante Daten  Unterschiedliche Datensatzstrukturen  Sehr unterschiedlicher Stichprobenumfang  Fehlende Werte  Ausreißer  Geringe Anzahl von Datensätzen Seite 15 Datenvorbereitung und deren Mehrwert Typische Gründe für die Datenvorbereitung
  • 16. Data Cleaning  Verfahren zum Entfernen und Korrigieren von Datenfehlern Seite 16 Datenvorbereitung und deren Mehrwert Methoden zur Datenaufbereitung – Ein Überblick Data Integration  Zusammenführung verschiedener Datenbestände (aus unter- schiedlichen Datenstrukturen) in eine gemeinsame einheitliche Datenstruktur Data Reduction  Ausschließliche Verwendung von relevanten Daten Data Transformation  Restrukturierung, Formatierung und Harmonierung von Datenbeständen -2, 32, 100 -0.02, 0.32, 1
  • 17. Einfach Wahl des richtigen Algorithmus: Entscheidungsbäume, Neuronale Netze, etc. Seite 17 Datenvorbereitung und deren Mehrwert Mehrwert vom automatisierten Modellierungsansatz Daten Fachliche Fragestellungen Erstellen des zu analysierenden Data Sets Vorbereiten der Daten Erstellen des Modells Traditioneller Ansatz Automatisierter Ansatz mit SAP Predictive Analytics (automated) SQL manuell zu erstellen  SQL Code schreiben  Regelmäßiges Ausführen des SQL Codes SQL mit GUI zu erstellen  Benutzerfreundliches Interface  Automatisiertes Ausführen des SQL Codings (einplanbar) Auswahl der richtigen Technik  Fehlende Werte behandeln  Ausreißer und Wechsel-wirkungen identifizieren Behandlung voll automatisiert Eigenständige Wahl des richtigen Algorithmus mit den richtigen Parametern: Entscheidungsbäume, Neuronale Netze, etc. ?
  • 18. Seite 18 Datenvorbereitung und deren Mehrwert Aufwandstreiber bei der Datenvorbereitung Bis zu 90% Zeitersparnis bei der Erstellung neuer Modelle Vor Automatisierung Nach Automatisierung Modellüberwachung Modellentwicklung Modellerstellung Datenvorbereitung Problem Analysis Aufwand
  • 19. Nr. Thema 1 Kurzeinführung CONOGY 2 Kurzeinführung Predictive Analytics 3 Einordnung Datenvorbereitung in den Data-Mining-Prozess 4 Datenvorbereitung und deren Mehrwert 5 Fazit 6 Fragen & Antworten Seite 19 Agenda
  • 20. Zusammenfassung  SAP Predicitive Analytics mehr als nur Buzzword  Datenvorbereitung immer wichtiger im technologischen Kontext  Verbesserte Auswertbarkeit der Informationen mit lohnendem Ergebnis  ABER sehr aufwändig (beansprucht 70-80% des Gesamtaufwandes) Empfehlung  Nutzung von SAP Predictive Analytics (Automated) Seite 20 Fazit „[Datenaufbereitung ist der] Schlüssel, um (verteilte) Daten effizienter für die Optimierung der Geschäftsprozesse nutzen zu können oder um neue, innovative Geschäftsmodelle überhaupt erst zu ermöglichen.“ BARC Report Juni 2017
  • 21. Nr. Thema 1 Kurzeinführung CONOGY 2 Kurzeinführung Predictive Analytics 3 Einordnung Datenvorbereitung in den Data-Mining-Prozess 4 Datenvorbereitung und deren Mehrwert 5 Fazit 6 Fragen & Antworten Seite 21 Agenda
  • 22. Seite 22 Fragen & Antworten
  • 23. Übersicht zum Buch  Unser SAPPRESS-Buch zum Thema Predictive Analytics  Mit diesem Buch lernen Sie, wie Sie Ihre Daten mit SAP Predictive Analytics analysieren, um bisher unentdeckte Zusammenhänge aufzuspüren und Trends vorhersagen zu können. Inhalte  Einführung und Mehrwerte von SAP Predictive Analytics  Einführung in SAP Predictive Analytics  Automated vs. Expert Analytics Mode  Daten vorbereiten, auswerten und visualisieren  Integration mit SAP Predictive Analysis Library, SAP HANA und R SAP Predictive Analytics Buchdaten  440 Seiten, gebunden, erschienen Juli 2017  Buch | E-Book | Bundle  ISBN 978-3-8362-4415-2  Buchansicht und Leseprobe beim Rheinwerk Verlag  Buchansicht und Leseprobe bei Amazon SAP Predictive Analytics Buchvorstellung
  • 24. CONOGY GmbH Martin Verleger E-Mail: verleger@conogy.de Tel: 030 - 488 289 800 Seite 24 Ihr Kontakt für mehr Predictive Analytics Die Unterlagen finden Sie nach dem Webinar unter: https://www.youtube.com/CONOGYGmbH https://www.slideshare.net/CONOGY
  • 25. Die in dieser Publikation enthaltene Information ist Eigentum der CONOGY GmbH. Weitergabe und Vervielfältigung dieser Publikation oder von Teilen daraus sind – zu welchem Zweck und in welcher Form auch immer – nur mit ausdrücklicher schriftlicher Genehmigung durch die CONOGY GmbH gestattet. Die Angaben im Text sind unverbindlich und dienen lediglich zu Informationszwecken. CONOGY übernimmt keine Haftung für Fehler oder Auslassungen in dieser Publikation. Des Weiteren übernimmt CONOGY keine Garantie für die Exaktheit oder Vollständigkeit der Informationen, Texte, Grafiken, Links und sonstigen in dieser Publikation enthaltenen Elementen. Diese Publikation wird ohne jegliche Gewähr, weder ausdrücklich noch stillschweigend, bereitgestellt. Dies gilt u. a., aber nicht ausschließlich, hinsichtlich der Gewährleistung der Marktgängigkeit und der Eignung für einen bestimmten Zweck sowie für die Gewährleistung der Nichtverletzung geltenden Rechts. CONOGY haftet nicht für entstandene Schäden. Dies gilt u. a. und uneingeschränkt für konkrete, besondere und mittelbare Schäden oder Folgeschäden, die aus der Nutzung dieser Materialien entstehen können. Diese Einschränkung gilt nicht bei Vorsatz oder grober Fahrlässigkeit. Die gesetzliche Haftung bei Personenschäden oder Produkthaftung bleibt unberührt. Die Informationen, auf die Sie möglicherweise über die in diesem Material enthaltenen Links zugreifen, unterliegen nicht dem Einfluss von CONOGY, und CONOGY unterstützt nicht die Nutzung von Internetseiten Dritter durch Sie und gibt keinerlei Gewährleistungen oder Zusagen über Internetseiten Dritter ab. Microsoft®, WINDOWS®, NT®, EXCEL®, Word®, PowerPoint® und SQL Server® sind eingetragene Marken der Microsoft Corporation. IBM, DB2, DB2 Universal Database, Informix und PowerPC sind Marken oder eingetragene Marken der IBM Corporation. Adobe, das Adobe Logo, Acrobat, PostScript und Reader sind Marken oder eingetragene Marken von Adobe Systems Inc. in den USA und/oder anderen Ländern. ORACLE® ist eine eingetragene Marke der ORACLE Corporation. UNIX®, X/Open®, OSF/1® und Motif® sind eingetragene Marken der Open Group. Citrix®, das Citrix-Logo, ICA®, Program Neighborhood®, MetaFrame®, WinFrame®, VideoFrame®, MultiWin® und andere hier erwähnte Namen von Citrix- Produkten sind Marken von Citrix Systems, Inc. HTML, DHTML, XML, XHTML sind Marken oder eingetragene Marken des W3C®, World WideWeb Consortium, Massachusetts Institute of Technology. JAVA® ist eine eingetragene Marke der Sun Microsystems, Inc. JAVASCRIPT® ist eine eingetragene Marke der Sun Microsystems, Inc., verwendet unter der Lizenz der von Netscape entwickelten und implementierten Technologie. MaxDB ist eine Marke von MySQL AB, Schweden. SAP, HANA, BusinessObjects, R/3, mySAP, mySAP.com, xApps, xApp, SAP NetWeaver, und weitere im Text erwähnte SAP-Produkte und -Dienstleistungen sowie die entsprechenden Logos sind Marken oder eingetragene Marken der SAP AG in Deutschland und anderen Ländern weltweit. Alle anderen Namen von Produkten und Dienstleistungen sind Marken der jeweiligen Firmen. Copyright 2017 CONOGY GmbH Alle Rechte vorbehalten Seite 25