Information über IBM Watson Analytics und Import der durch SPSS generierten Prognosen, und eine Darstellung der Ergebnisse in repräsentativen Dashboards.
Für alle Fragen stehe ich ihnen gerne zur Verfügung unter: http://www.ibm.com/connect/ibm/de/de/resources/clara_ogwuazor_mbamalu/
2. Cognitive Computing
• Systeme werden trainiert,
NICHT programmiert
• Lernen durch Interaktion
und Erfahrung
• Schlussfolgern – neue Daten
erschließen
• Mit uns Menschen
kommunizieren
3. wesentlichen Bausteine von Watson
99%
60%
10%
Verständnis
von natürlicher
menschlicher
Sprache (NLP)
Lernt und
verbessert sich
ständig über
Feedback und
neue Daten
Findet und bewertet
Hypothesen um
Antworten zu liefern
3
2
1
Sprachbarriere
zwischen Mensch
und Computer durch
Verständnis der
menschlichen
Sprache brechen
Wissen wird iterativ durch
jede Interaktion verbessert
Ermittelt
wahrscheinliche
Antworten, bewertet
und begründet diese
4. Mögliche Einstiegspunkte in die Watson Technologie
Watson
Core
Watson
Solutions
Watson
Foundation
§ Forschung & Entwicklung
§ Medizinische Systeme
§ Technologischer Cloudkern
§ Natürlich sprachliche Dialoge
(Q&A Systeme)
§ Cloud Systeme (SaaS)
§ Englischsprachig
§ Analytische Lösungen
§ Heute im Praxiseinsatz
§ Mehrsprachig (Deutsch)
§ On Premise / SaaS
§ Watson-Powered-Apps für Bluemix
§ Offenes Watson-System in der Cloud (PaaS)
§ Developer Program
Watson
Eco-system
Watson
Analytics
5. Kognitive Wertschöpfung Schritt für Schritt
Erkennung von linguistischen Mustern,
Abstraktion von Konzepten,
Korrelationen, Abweichungen &
Zusammenhänge erkennen und nutzen
Suchen, visualisieren, explorieren
von Informationen:
Anwendungs-übergreifend,
Domänen-übergreifende 360°Blicke
auf Information
Kognitive Anwendungen:
Zusammenhänge verstehen und
Menschen beraten,
Maschine Learning &
Selbstlernende Algorithmen
Search & Explore Analyze&Correlate InterpretManage
Daten und Dokumente
verwalten:
Wo sind welche Informationen
Güte, Laufzeit, Ownership,
Sicherheit, …
Curation
Watson
Solutions
Watson
Foundation
Kognitive Assistenz (Advisor) Cloud-Lösungen
Wissensbasierte Informations-Findung
6. Kognitiv: analysiert mögliche Fragestellungen,
reagiert auf Fragen und schlägt Antwortmöglichkeiten
vor.
• Cloud-Lösung mit umfassenden Analysefunktionen
• Ad-hoc-Analyse für jedermann
• Fragestellung in natürlicher Sprache möglich
• enthält kognitive Funktionen
Watson Analytics? – SPSS?
Predictive Analytics
• vollwertiges Werkzeug für Data Mining oder Statistik
• Umfangreiche Einflussmöglichkeiten
• Für Data Scientists
• Integration in Prozesse, Wiederkehrend
8. IBM Watson Analytics
Bessere Daten
Geschäfts-
verständnis
Zusammenhänge
Kommunikation
Enthaltene Dienste liefern Datenzugriff und –
verfeinerung ohne Modellungsaufwand
9. IBM Watson Analytics
Bessere Daten
Geschäfts-
verständnis
Zusammenhänge
Kommunikation
Automatisierte Intelligenz beschleunigt den
Erkenntnisgewinn
10. IBM Watson Analytics
Bessere Daten
Geschäfts-
verständnis
Zusammenhänge
Kommunikation
Automatisierte Erkennung von wesentlichen
Treibern in den Daten
11. IBM Watson Analytics
Bessere Daten
Geschäfts-
verständnis
Zusammenhänge
Kommunikation
Visualisierung und teilen von Erkenntnissen
und Entscheidungen
12. Watson Analytics – Editionen und Preise
Edition Free Plus Professional Watson Analytics for
Social Media
Users 1 user 1 user 1 or more users Addition to one
existing subscription
Rows per data set 100.000 1.000.000 10.000.000
Columns per data set 50 256 500
Storage 500MB 2 GB (+) 100 GB (+)
Upload Files & MS Excel Files & MS Excel Files & MS Excel
Direct access Several databases (on-prem /
cloud)
Twitter
Several databases (on-prem / cloud)
Twitter
IBM Cognos reports
Twitter, Blogs, Forums
Additional functionality Share data sets, explorations,
Refined data sets, predictions and
views
Prepackaged access
and analytics for social
media
Price (per Month) 0,00 30 USD (per User) 80 USD (per User) 2.000 USD (per Tenant)
14. Demoleitfaden (1/2)
• ! Alle Data sets, Explorationen, predicitions und dashboards sind unter dem Nutzer Jamie Tan (wapro_bastien_tan@yopmail.com / ours1n11) im Tenant von Marc
abgelegt!
• Start: „Setting the Stage“
• Wir sind in einem Handelsunternehmen und haben Informationen aus verschiedenen Quellen extrahiert und in einem Excel konsolidiert bekommen
• Zeige die Excel-Datei „Kundendaten_Gesamt mit Regionen und Scoring.xls“
• Upload und Refine
• Upload der Datei (Slide 18)
• während des Uploads über die Arbeit von WA im Hintergrund sprechen (Erkennen von Spalten, Zusammenhängen, Aufbau Datenmodell, Datenqualität usw)
• Twitter als Datenquelle zeigen (Slide 19)
• Die verschiedenen WA Editions sprechen (Slide 20, auf dem Dashboard zeigen)
• Refine öffnen (Ergebnisse von WA zeigen, Qualitätsscore), schließen (Slide 21)
• Explore:
• Auf das Data Set klicken und „How to ask a question“ diskutieren (Slide 22)
• Zurück und auf explore, frage eingeben: „what is umsatz_total by geschlecht” - macht keinen Sinn, da Umsatz aufsummiert wird, Durchschnitt ist besser (Slide 23,24)
• Neue seite, „what is average umsatz_total by geschlecht” (Slide 25)
• Darstellung erweitern: “Columns” öffnen und die Spalte “Alter” als “Color by” wählen (Slide 26) – zu viele Werte, unklar!
• Neue Datagroup erzeugen und “Altersgruppen” (gleichmäßig 10 Bereiche) definieren (Slide 27)
• Statt “Alter” “Altersgruppen” für “color by” auswählen – immer noch sehr unklar (Slide 28)
• Grafiktyp ändern: Treemap in den Spalten Altergruppe und Geschlecht tauschen (slide 29) – Auffälligkeit bei Altersgruppe 26-33, also dort Drill
• Beide Geschlechter markieren und rechte Maustaste und dann Navigate nach Familienstand (Slide 30)
• Ergebnis: Junge Verheiratete (Slide 31)
• WA macht Vorschläge für weitere Analysen: “Highest Umsatz_tot for Bonität gut”, Auswählen und Anzeigen (Slide 32)
• “sind das schlechte Regionen hier??” – neue Seite “what is average umsatz_total by state” (Slide 33)
• Wir wollen nur die ID sehen, die auch gekündigt haben: Filter (Slide 34)
• Und nun auf die Karte noch die Anzahl der Kündiger (Slide 35)
15. Demoleitfaden (2/2)
• Predict
• Start mit Churn als Ziel (WA erkennt mögliche Kandidaten) (Slide 36)
• Nur Bildschirm zeigen, Demo dauert zu lange; Ergebnis steht im „Shared“ Ordner „was treibt Churn“
• Oberen Bildschirm (insbes. Associations) diskutieren
• Zeigen 1 Einflussfaktor (Slide 37) und Details (Slide 38)
• 2 Einflussfaktoren (Slide 39) und Details (Slide 40)
• alle Einflussfaktoren (Slide 41) und Details (Slide 42)
• Dashboard:
• Hinweis: WA kann nicht nur interne, hochgeladene Daten nutzen, sondern auch Daten aus Twitter oder anderen Quellen heranziehen
• Erstens:
• Erinnerung Daten aus Twitter hatten wir vorhin kurz
• Dann das Dataset, was ich vorher angelegt habe
• Dann das Dashboard, Seite 1 (Slide 43)
• NUR WENN NOCH ZEIT BLEIBT: SOCIAL MEDIA ANALYTICS
• Social Media: nur den Dialog zeigen (direkt unter dem Nutzer Marc Bastien!) und das Ergebnis (Slide 44, bzw. 45-47), DATASET unbedingt vorher nochmal
testen!!!
Damit endet die erste Demo und der SPSS-Teil kommt
Zweite Demo (15 Min)
• Ausgangssituation: SPSS hat jetzt mit den Daten “was” gemacht und die möglichen Churn-Werte errechnet, diese werden jetzt in einem Dashboard dargestellt
• Dashboard 1: ganz viele Filter, mit denen die Ausgabe beeinflusst werden kann, wenn man die untere Leiste nach oben zieht, kann man ganz rechts
(scrollen!) auch die Churnwahrscheinlichkeit einstellen, und die Liste wird eingeschränkt (Slide 48)