Successfully reported this slideshow.
Datenvorbereitung für erfolgreiche
Analysen mit SAP Predictive Analytics
21. November 2017
Webinar
CONOGY GmbH
Nr. Thema
1 Kurzvorstellung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining...
CONOGY GmbH
 Gründung 2007
 65 Mitarbeiter
 Standorte in Berlin & Düsseldorf
Leistungsspektrum
 Dienstleistungen im Be...
Seite 4
CONOGY
Überblick Kompetenzen
Toolauswahl
Architektur
Schulungen
Governance
BI Strategie
Embedded Planning
S/4HANA ...
Nr. Thema
1 Kurzeinführung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-...
Rohdaten
Bereinigte
Daten
Standard-
berichte
Analytische,
multidimensionale
Berichte
Prediktive
Modellierung
Optimierung
M...
Seite 7
Kurzeinführung Predictive Analytics
Use Cases
Brand
Sentiment
Network
Optimization
Predictive
Maintenance
Price
Op...
Seite 8
Kurzeinführung Predictive Analytics
Die vier Dimensionen von Big Data
VOLUME
Volumen
Terabytes bis Exabytes an
Dat...
Definition
 Systematische Anwendung statistischer Methoden zur Erkennung
von Mustern, Trends oder Zusammenhängen in Daten...
Häufige genutzte Methoden
 Regressionsanalyse
 Zeitreihenanalyse
 Klassifikation
 Clustering
 Assoziationsanalyse
 E...
Nr. Thema
1 Kurzeinführung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-...
Business Understanding
 Welche Frage soll beantwortet werden?
 Welche Parameter (Daten) sind relevant?
Data Understandin...
Seite 13
Einordnung Datenvorbereitung in den Data-Mining-Prozess
Phase 3 des CRISP-DM
Fachliches
Verständnis
Daten-
verstä...
Nr. Thema
1 Kurzeinführung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-...
Warum müssen Daten vorbereitet werden
 Schlechte Datenqualität
 Irrelevante Daten
 Unterschiedliche Datensatzstrukturen...
Data Cleaning
 Verfahren zum Entfernen und Korrigieren von Datenfehlern
Seite 16
Datenvorbereitung und deren Mehrwert
Met...
Einfach Wahl des richtigen
Algorithmus:
Entscheidungsbäume, Neuronale
Netze, etc.
Seite 17
Datenvorbereitung und deren Meh...
Seite 18
Datenvorbereitung und deren Mehrwert
Aufwandstreiber bei der Datenvorbereitung
Bis zu
90%
Zeitersparnis bei der
E...
Nr. Thema
1 Kurzeinführung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-...
Zusammenfassung
 SAP Predicitive Analytics mehr als nur Buzzword
 Datenvorbereitung immer wichtiger im technologischen K...
Nr. Thema
1 Kurzeinführung CONOGY
2 Kurzeinführung Predictive Analytics
3 Einordnung Datenvorbereitung in den Data-Mining-...
Seite 22
Fragen & Antworten
Übersicht zum Buch
 Unser SAPPRESS-Buch zum Thema Predictive Analytics
 Mit diesem Buch lernen Sie, wie Sie Ihre Daten m...
CONOGY GmbH
Martin Verleger
E-Mail: verleger@conogy.de
Tel: 030 - 488 289 800
Seite 24
Ihr Kontakt für mehr Predictive Ana...
Die in dieser Publikation enthaltene Information ist Eigentum der CONOGY GmbH. Weitergabe und Vervielfältigung dieser Publ...
Nächste SlideShare
Wird geladen in …5
×

Datenvorbereitung für erfolgreiche Analysen mit SAP Predictive Analytics

82 Aufrufe

Veröffentlicht am

Inhalt:
Datenberge können mit Hilfe von Algorithmen nutzbar gemacht werden. Dabei ist die Vorbereitung der Daten essentiell. Diese durchaus zeitintensive Aufgabe ist die Basis für erfolgreiche Analysen mit SAP Predictive Analysis. Wir zeigen verschiedene Methodiken der Aufbereitung, geben Einblicke in die strukturierte Aufbereitung der Merkmale für Algorithmen und zurück. Erst durch die erfolgreiche Umwandlung wird eine Auswertung der Ergebnisse möglich.

Dieses Webinar eignet sich für:
- Alle, die sich für das Thema Data Mining interessieren sowie diejenigen, die sich die Möglichkeiten von SAP Predictive Analysis aufzeigen lassen wollen.

In diesem Webinar erhalten Sie:
- Einen Einblick in die Thematik der Datenvorbereitung
- Einen Überblick über den wichtigsten Vorbereitungsschritt, bevor mit den Daten überhaupt gearbeitet werden kann

Agenda:
1. Einordnung der Thematik in den Kontext
2. Datenvorbereitung – Herangehensweise und Herausforderungen
3. Zusammenfassung

Veröffentlicht in: Technologie
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Datenvorbereitung für erfolgreiche Analysen mit SAP Predictive Analytics

  1. 1. Datenvorbereitung für erfolgreiche Analysen mit SAP Predictive Analytics 21. November 2017 Webinar CONOGY GmbH
  2. 2. Nr. Thema 1 Kurzvorstellung CONOGY 2 Kurzeinführung Predictive Analytics 3 Einordnung Datenvorbereitung in den Data-Mining-Prozess 4 Datenvorbereitung und deren Mehrwert 5 Fazit 6 Fragen & Antworten Seite 2 Agenda
  3. 3. CONOGY GmbH  Gründung 2007  65 Mitarbeiter  Standorte in Berlin & Düsseldorf Leistungsspektrum  Dienstleistungen im Bereich Business Intelligence, Data Science und S/4HANA  Von der strategischen Beratung bis zum Betrieb von Business Intelligence Anwendungen  Buchhaltung, Controlling, Logistik, HR, Vertrieb u.a. Partner  Langjährige, erfolgreiche Kooperation mit IBsolution  Enge Kooperation mit der SAP im Bereich Predictive Analytics und Schulungen sowie Recognized-Expertise-Partner im Bereich BusinessObjects Seite 3 CONOGY Überblick
  4. 4. Seite 4 CONOGY Überblick Kompetenzen Toolauswahl Architektur Schulungen Governance BI Strategie Embedded Planning S/4HANA Analytics S/4HANA Migration Fiori S/4HANA 2nd & 3rd Level Support Hotline / Service Desk Monitoring Pflege / Wartung Application Management Dynamic Tiering Datenmodellierung Basis Administration HANA (BW/4HANA, Native, …) Data Warehousing UI5 / Web Dynpro BusinessObjects Planung BO Cloud / Mobile Analytics Reporting & Planung Datengetriebene Planung Data Science Methodologie Big Data Szenarien Data Science Predictive Analytics
  5. 5. Nr. Thema 1 Kurzeinführung CONOGY 2 Kurzeinführung Predictive Analytics 3 Einordnung Datenvorbereitung in den Data-Mining-Prozess 4 Datenvorbereitung und deren Mehrwert 5 Fazit 6 Fragen & Antworten Seite 5 Agenda
  6. 6. Rohdaten Bereinigte Daten Standard- berichte Analytische, multidimensionale Berichte Prediktive Modellierung Optimierung Multivariate Analyse Wahrnehmen und reagieren Vorhersagen und agieren Analytische Reife Wettbewerbsvorteil Was ist passiert? Warum ist es passiert? Was wird passieren? Was ist das beste, das passieren könnte? Kurzeinführung Predictive Analytics Einordnung von Predictive Analytics
  7. 7. Seite 7 Kurzeinführung Predictive Analytics Use Cases Brand Sentiment Network Optimization Predictive Maintenance Price Optimization Inventory Control Analysis of Churn Rates Risk Management, Risk Migitation Product Recommendation Personalized Care Customer Analytics: 360° Customer View Fraud Detection Real-time Demand/ Supply Forecast PUBLIC SECTOR MANU- FACTURING RETAIL CPG HEALTH- CARE BANKING UTILITIES TELCO MARKETING SALES FINANCE OPERATIONS HR SERVICE IT SUPPLY CHAIN FRAUD / RISK 25+ Industries 11+ LoB
  8. 8. Seite 8 Kurzeinführung Predictive Analytics Die vier Dimensionen von Big Data VOLUME Volumen Terabytes bis Exabytes an Daten müssen verarbeitet werden VELOCITY Geschwindigkeit Nur wenige Millisekunden bis Sekunden, um auf neue und geänderte Daten zu reagieren VARIETY Vielfalt Strukturierte, halb- strukturierte, unstrukturierte Daten (Zahlen, Text, Bilder, Sprache, …) VERACITY Richtigkeit Inkonsistente und unvollständige Daten, Latenz, Mehrdeutigkeit
  9. 9. Definition  Systematische Anwendung statistischer Methoden zur Erkennung von Mustern, Trends oder Zusammenhängen in Datenbeständen  Selektive Datenanalyse zur Bestätigung von vordefinierten Hypothesen Data Mining ist nicht die Extraktion, Transformation und Auswertung von Daten! Im Kontext Big Data  Data Mining häufig bei großen Datenmengen im Einsatz Seite 9 Kurzeinführung Predictive Analytics Data Mining Abgrenzung
  10. 10. Häufige genutzte Methoden  Regressionsanalyse  Zeitreihenanalyse  Klassifikation  Clustering  Assoziationsanalyse  Entscheidungsbäume Weitere Methoden  Simulation  Ausreißer-Analyse  Netzwerkanalyse  Lineare & Dynamische Optimierungen  Text Mining  Social und Web Mining  … Seite 10 Kurzeinführung Predictive Analytics Wichtige Data Mining-Techniken Regression Zeitreihen Klassifikation Clustering Ausreißer Neuronale Netze Entscheidungs- bäume Assoziation
  11. 11. Nr. Thema 1 Kurzeinführung CONOGY 2 Kurzeinführung Predictive Analytics 3 Einordnung Datenvorbereitung in den Data-Mining-Prozess 4 Datenvorbereitung und deren Mehrwert 5 Fazit 6 Fragen & Antworten Seite 11 Agenda
  12. 12. Business Understanding  Welche Frage soll beantwortet werden?  Welche Parameter (Daten) sind relevant? Data Understanding  Was sind die Datenquellen?  Wie hoch ist die Datenqualität?  Gibt es systematische Fehler? Data Preparation  Daten in auswertbares Format bringen / transformieren  Z. B. Ausreißer oder überflüssige Daten eliminieren Modeling  Methoden/Techniken anwenden und Ergebnisse auswertbar machen Evaluation  Güte/Verlässlichkeit des Modells testen Deployment Seite 12 Einordnung Datenvorbereitung in den Data-Mining-Prozess Cross-Industry Standard Process for Data Mining (CRISP-DM) Business Understanding Data Understanding Data Preparation ModelingEvaluation Deployment DATA
  13. 13. Seite 13 Einordnung Datenvorbereitung in den Data-Mining-Prozess Phase 3 des CRISP-DM Fachliches Verständnis Daten- verständnis Daten- vorbereitung Modellierung Bewertung Operationa- lisierung Datenauswahl Datenbereinigung Konstruktion von Data Sets Datenintegration Datenformatierung Begründung für Inklusion / Exklusion Data-Cleaning-Report Abgeleitete Attribute Zusammenführung von Daten Syntax der Daten Data Set Data Set Beschreibung Neu erzeugte Daten Aufgaben Ergebnis
  14. 14. Nr. Thema 1 Kurzeinführung CONOGY 2 Kurzeinführung Predictive Analytics 3 Einordnung Datenvorbereitung in den Data-Mining-Prozess 4 Datenvorbereitung und deren Mehrwert 5 Fazit 6 Fragen & Antworten Seite 14 Agenda
  15. 15. Warum müssen Daten vorbereitet werden  Schlechte Datenqualität  Irrelevante Daten  Unterschiedliche Datensatzstrukturen  Sehr unterschiedlicher Stichprobenumfang  Fehlende Werte  Ausreißer  Geringe Anzahl von Datensätzen Seite 15 Datenvorbereitung und deren Mehrwert Typische Gründe für die Datenvorbereitung
  16. 16. Data Cleaning  Verfahren zum Entfernen und Korrigieren von Datenfehlern Seite 16 Datenvorbereitung und deren Mehrwert Methoden zur Datenaufbereitung – Ein Überblick Data Integration  Zusammenführung verschiedener Datenbestände (aus unter- schiedlichen Datenstrukturen) in eine gemeinsame einheitliche Datenstruktur Data Reduction  Ausschließliche Verwendung von relevanten Daten Data Transformation  Restrukturierung, Formatierung und Harmonierung von Datenbeständen -2, 32, 100 -0.02, 0.32, 1
  17. 17. Einfach Wahl des richtigen Algorithmus: Entscheidungsbäume, Neuronale Netze, etc. Seite 17 Datenvorbereitung und deren Mehrwert Mehrwert vom automatisierten Modellierungsansatz Daten Fachliche Fragestellungen Erstellen des zu analysierenden Data Sets Vorbereiten der Daten Erstellen des Modells Traditioneller Ansatz Automatisierter Ansatz mit SAP Predictive Analytics (automated) SQL manuell zu erstellen  SQL Code schreiben  Regelmäßiges Ausführen des SQL Codes SQL mit GUI zu erstellen  Benutzerfreundliches Interface  Automatisiertes Ausführen des SQL Codings (einplanbar) Auswahl der richtigen Technik  Fehlende Werte behandeln  Ausreißer und Wechsel-wirkungen identifizieren Behandlung voll automatisiert Eigenständige Wahl des richtigen Algorithmus mit den richtigen Parametern: Entscheidungsbäume, Neuronale Netze, etc. ?
  18. 18. Seite 18 Datenvorbereitung und deren Mehrwert Aufwandstreiber bei der Datenvorbereitung Bis zu 90% Zeitersparnis bei der Erstellung neuer Modelle Vor Automatisierung Nach Automatisierung Modellüberwachung Modellentwicklung Modellerstellung Datenvorbereitung Problem Analysis Aufwand
  19. 19. Nr. Thema 1 Kurzeinführung CONOGY 2 Kurzeinführung Predictive Analytics 3 Einordnung Datenvorbereitung in den Data-Mining-Prozess 4 Datenvorbereitung und deren Mehrwert 5 Fazit 6 Fragen & Antworten Seite 19 Agenda
  20. 20. Zusammenfassung  SAP Predicitive Analytics mehr als nur Buzzword  Datenvorbereitung immer wichtiger im technologischen Kontext  Verbesserte Auswertbarkeit der Informationen mit lohnendem Ergebnis  ABER sehr aufwändig (beansprucht 70-80% des Gesamtaufwandes) Empfehlung  Nutzung von SAP Predictive Analytics (Automated) Seite 20 Fazit „[Datenaufbereitung ist der] Schlüssel, um (verteilte) Daten effizienter für die Optimierung der Geschäftsprozesse nutzen zu können oder um neue, innovative Geschäftsmodelle überhaupt erst zu ermöglichen.“ BARC Report Juni 2017
  21. 21. Nr. Thema 1 Kurzeinführung CONOGY 2 Kurzeinführung Predictive Analytics 3 Einordnung Datenvorbereitung in den Data-Mining-Prozess 4 Datenvorbereitung und deren Mehrwert 5 Fazit 6 Fragen & Antworten Seite 21 Agenda
  22. 22. Seite 22 Fragen & Antworten
  23. 23. Übersicht zum Buch  Unser SAPPRESS-Buch zum Thema Predictive Analytics  Mit diesem Buch lernen Sie, wie Sie Ihre Daten mit SAP Predictive Analytics analysieren, um bisher unentdeckte Zusammenhänge aufzuspüren und Trends vorhersagen zu können. Inhalte  Einführung und Mehrwerte von SAP Predictive Analytics  Einführung in SAP Predictive Analytics  Automated vs. Expert Analytics Mode  Daten vorbereiten, auswerten und visualisieren  Integration mit SAP Predictive Analysis Library, SAP HANA und R SAP Predictive Analytics Buchdaten  440 Seiten, gebunden, erschienen Juli 2017  Buch | E-Book | Bundle  ISBN 978-3-8362-4415-2  Buchansicht und Leseprobe beim Rheinwerk Verlag  Buchansicht und Leseprobe bei Amazon SAP Predictive Analytics Buchvorstellung
  24. 24. CONOGY GmbH Martin Verleger E-Mail: verleger@conogy.de Tel: 030 - 488 289 800 Seite 24 Ihr Kontakt für mehr Predictive Analytics
  25. 25. Die in dieser Publikation enthaltene Information ist Eigentum der CONOGY GmbH. Weitergabe und Vervielfältigung dieser Publikation oder von Teilen daraus sind – zu welchem Zweck und in welcher Form auch immer – nur mit ausdrücklicher schriftlicher Genehmigung durch die CONOGY GmbH gestattet. Die Angaben im Text sind unverbindlich und dienen lediglich zu Informationszwecken. CONOGY übernimmt keine Haftung für Fehler oder Auslassungen in dieser Publikation. Des Weiteren übernimmt CONOGY keine Garantie für die Exaktheit oder Vollständigkeit der Informationen, Texte, Grafiken, Links und sonstigen in dieser Publikation enthaltenen Elementen. Diese Publikation wird ohne jegliche Gewähr, weder ausdrücklich noch stillschweigend, bereitgestellt. Dies gilt u. a., aber nicht ausschließlich, hinsichtlich der Gewährleistung der Marktgängigkeit und der Eignung für einen bestimmten Zweck sowie für die Gewährleistung der Nichtverletzung geltenden Rechts. CONOGY haftet nicht für entstandene Schäden. Dies gilt u. a. und uneingeschränkt für konkrete, besondere und mittelbare Schäden oder Folgeschäden, die aus der Nutzung dieser Materialien entstehen können. Diese Einschränkung gilt nicht bei Vorsatz oder grober Fahrlässigkeit. Die gesetzliche Haftung bei Personenschäden oder Produkthaftung bleibt unberührt. Die Informationen, auf die Sie möglicherweise über die in diesem Material enthaltenen Links zugreifen, unterliegen nicht dem Einfluss von CONOGY, und CONOGY unterstützt nicht die Nutzung von Internetseiten Dritter durch Sie und gibt keinerlei Gewährleistungen oder Zusagen über Internetseiten Dritter ab. Microsoft®, WINDOWS®, NT®, EXCEL®, Word®, PowerPoint® und SQL Server® sind eingetragene Marken der Microsoft Corporation. IBM, DB2, DB2 Universal Database, Informix und PowerPC sind Marken oder eingetragene Marken der IBM Corporation. Adobe, das Adobe Logo, Acrobat, PostScript und Reader sind Marken oder eingetragene Marken von Adobe Systems Inc. in den USA und/oder anderen Ländern. ORACLE® ist eine eingetragene Marke der ORACLE Corporation. UNIX®, X/Open®, OSF/1® und Motif® sind eingetragene Marken der Open Group. Citrix®, das Citrix-Logo, ICA®, Program Neighborhood®, MetaFrame®, WinFrame®, VideoFrame®, MultiWin® und andere hier erwähnte Namen von Citrix- Produkten sind Marken von Citrix Systems, Inc. HTML, DHTML, XML, XHTML sind Marken oder eingetragene Marken des W3C®, World WideWeb Consortium, Massachusetts Institute of Technology. JAVA® ist eine eingetragene Marke der Sun Microsystems, Inc. JAVASCRIPT® ist eine eingetragene Marke der Sun Microsystems, Inc., verwendet unter der Lizenz der von Netscape entwickelten und implementierten Technologie. MaxDB ist eine Marke von MySQL AB, Schweden. SAP, HANA, BusinessObjects, R/3, mySAP, mySAP.com, xApps, xApp, SAP NetWeaver, und weitere im Text erwähnte SAP-Produkte und -Dienstleistungen sowie die entsprechenden Logos sind Marken oder eingetragene Marken der SAP AG in Deutschland und anderen Ländern weltweit. Alle anderen Namen von Produkten und Dienstleistungen sind Marken der jeweiligen Firmen. Copyright 2017 CONOGY GmbH Alle Rechte vorbehalten Seite 25

×