(Big Data) Predictive Analytics -
Chancen für die Medizin
Prof. Dr. Michael Feindt
Professor für Physik, Karlsruher Instit...
Exponential increase in data volume
►  Transaction-based data stored through the years
►  Unstructured data streaming in f...
Wirklich?
Die Welt verläuft nicht deterministisch.
Vorhersagekraft prinzipiell begrenzt durch
Quantenphysik und deterministisches Ch...
Wo ist Predictive Analytics
einzuordnen?
Lotterie
(purer Zufall)
Pendel
(deterministisch)
0%
100%Predictive Analytics
Indi...
Für reale Systeme kann man mit Predictive Analytics
individuelle Wahrscheinlichkeitsaussagen machen
Lotterie
(purer Zufall...
Lotterie
(purer Zufall)
Pendel
(deterministisch)
Individuelle Vorhersagbarkeit
0%
100%
z.B. Zuschauerzahlen z.B. Abverkäuf...
Lotterie
(purer Zufall)
Pendel
(deterministisch)
Individuelle Vorhersagbarkeit
0%
100%
z.B. Verkehrsunfälle z.B. Verkehrss...
BIG
Technologietreiber Elementarteilchenphysik
LHC:
27km Umfang
Photos: CERN, Blue Yonder
Gigantischer technologischer Aufwand:
nur möglich in weltweiter Zusammenarbeit von sehr vielen Experten:
höchste Energien,...
Grid Computing:
Globales Teilen von Speicher und CPU
BIG: 1 PetaByte / Sek. = 1015 Byte / Sek.
Wenn 1 Bit
einem Blatt
entspricht
entspricht 1 PByte
allen Blättern auf der Erde
SMART
PREDICTIVE: NeuroBayes®
Ein High-Tech-Algorithmus aus der experimentellen Elementarteilchenphysik kann
komplexe Zusammenhä...
NeuroBayes in real Big Data:
Der LHCb-Trigger
Am LHC (CERN) enstehen pro Experiment:
40 000 000 Ereignisse pro Sekunde, da...
Seite	
  21	
  
Alle 5 Nanosekunden eine intelligente
Entscheidung, ob die Daten wichtig genug
sind, um ausgelesen, gesend...
Extrem schnelle intelligente Entscheidungen direkt am Sensor.
Für Belle II-Experiment in Japan. Auch für Industrie 4.0, In...
Kahneman-Zitat
(Nobelpreisträger für Behavioural Economics)
Der Mensch ist nicht in der Lage, statistisch-
quantitative En...
•  Der Mensch ist denkfaul, die meisten Entscheidungen werden vom schnellen intuitiven System(1) gefällt.
•  Nachher versu...
Der Schlüssel zum Besseren sind
bessere Entscheidungen.
Der Schlüssel zu besseren
Entscheidungen sind (statistisch
relevan...
(Big Data) Predictive Analytics:
Aus eigenen und anderen Datenquellen möglichst
viel Information über möglichst viele Einz...
Prognose ist nicht nur eine Zahl ...
sondern komplette Wahrscheinlichkeitsdichte
Individualisierte Prognosen in Form von
Wahrscheinlichkeitsverteilungen
aufgrund möglichst vieler objektiver Daten
(Statis...
(Big Data) Prescriptive Analytics:
Nutze die Prognosen, um Entscheidungen zu treffen.
Mathematisch optimal. Vollautomatisch...
99% aller operativen
Entscheidungen in Unternehmen
(Forschung, Kliniken) können
automatisiert werden.
Und in oft ähnlich
w...
Das Dilemma vieler strategischer
Entscheidungen:
Ziel 1
Profitabilität
Ziel 2
Marktanteil
Verbesserung in Ziel 1 ist mit
V...
Die Macht des “und“:
Ziel 2
Ziel 1
Was wir wirklich wollen:
Verbesserung in Ziel 1 UND
Verbesserung in Ziel 2
Ist das mögl...
Zauberwort „Individualisierung“
Ziel 1
Ziel 2
Ja, durch Individualisierung!
Nicht eine globale Entscheidung, sondern
indiv...
Prescriptive analytics automatisiert
sogar Arbeit von 400 Forschungs-Physikern :
Wertschöpfung > +100%
Photo: CERN
Ø  Arb...
Scheinbar unvereinbare Ziele vereinbaren
mit Hilfe von individualisierten Prognosen / Tarifen / Entscheidungen
Beispiel Pr...
Scheinbar unvereinbare Ziele vereinbaren
mit Hilfe von individualisierten Prognosen / Tarifen / Entscheidungen
Beispiel au...
Forward Demand Accurate daily and
weekly demand forecasts, using historic
sales, pricing and promotion data
Replenishment Optimization KPI-
based optimization (Out of stock, write-
off reduction) using demand forecasts
►  20,213m	
  EUR.	
  	
  Abschri(enreduk.on  im  Frischebereich	
  
►  	
  4,570m	
  EUR.	
  	
  Effizienzverbesserung  dur...
Dynamic Pricing Iterative optimization
of profit and margin in E-Commerce
based on base price-demand patterns
Individuelles Pricing mit Predictive
•  Zehntausende Preisänderungen/Tag
•  für e-Commerce-Angebote
► 	
  0	
  	
  Beschwe...
Was	
  wäre,	
  
wenn…	
  
Just –in-Time Lager und Logistik:
Nachfrage – Prognosen und
automatische Disposition
…alle Part...
Industrial Data combining machine
data with master data for energy
efficiency, maintenance and spare parts.
Was wäre wenn ein großer Händler
genau wissen würde wie viel Obst von
welcher Sorte an welchem Tag verkauft
wird?
Maschine...
Prognostiziere Gasturbinen-Start-ups
►  Goal: Increase turbine availability & reliability – Predict
probability and durati...
Einblicke in versteckte Zusammenhänge in Daten
Zusammenhänge in Daten lassen sich mit modernen Methoden aufdecken
auch kom...
Möglichkeiten im Pharma-Bereich
Optimale Auswertung von
medizinischen Tests:
INDIVIDUALISIERTE
Analyse zur Wirksamkeit
von...
Mögliche Anwendungen:
Präklinische Studien
Klinische Prüfungen
Phase I
Phase II
Phase III
Phase IV
Idee: Monitore bei Stud...
Mögliche Zielgrößen, auf die
NeuroBayes®-Training angewendet
werden kann:
--> Krankheitsbild nach 1 Woche,
1 Monat etc.
--...
Viele Input-Größen:
Alter, Geschlecht, andere Diagnosen,
andere eingenommene Medikamente,
Blutwerte, Cholesterinspiegel, G...
Was Blue Yonder- Technologien für Pharma-Studien leisten kann:
--> NeuroBayes® kann alle statistischen Größen berechnen,
u...
Personalisierte Medizin am Beispiel von
Diabetes Typ 2
+	
  
	
  	
  	
  	
  	
  	
  	
  	
  Known/Historical	
  Data	
  +...
KV-Leistungsbeträge in vorgegebenem Zeitraum
alles andere als normalverteilt
NeuroBayes® bietet die Lösung für schwierige ...
f (t | ) = (1− P( ))⋅δ(t)+ P( )⋅ f (t | t > 0, )
(Krankenversicherung:) NeuroBayes® berechnet für jeden Einzelfall x
die i...
Individuelle Schadenprognose
ID	
  TV	
  Teil	
  3120489	
  
Frau,	
  38,	
  Tarif	
  EKN1000	
  
Tarifalter	
  7	
  Monat...
Predictive Analytics im Vergleich zu klassischen
Methoden
Anwendungsbeispiele: PKV – Schadenhöhenprognose
Kundenindividuel...
Risikozuschläge in privater
Krankenversicherung – aus Anamnese
NeuroBayes®
Experten
Ø  Expertenentscheidungen sind besten...
Medizinforschung auf
Versicherungsdatenbanken:
Einzeldaten„nicht qualitätsgesichert“ ?
Aber Millionen Fälle über Jahrzehnt...
Kombination von verschiedenen
Datenquellen.
Oft großer Mehrwert
DNA + Blutwerte + indiv. Historie + ...
Der wissenschaftli...
Teile Deine Daten,
lerne und profitiere von vielen!
Modernste Verfahren können auch verteilt lernen
(mit wenig Kommunikati...
2018 werden
ein Drittel der 20 Marktführer bedeutende
Marktanteile verlieren (“disrupted”).
Viele Industrien werden“amazon...
Was sind die Treiber?
Viele der Gewinner sind
“Silicon Valley-style entrepreneurial
technology companies”.
Mehr als nur Google
Die Meute ist unterwegs
LYFT
Revolution im privaten Transport
Mehr als nur Google
Und was wurde aus myTaxi?
Mehr als nur Google
WONGA
Kreditvergabe innerhalb von 5 Minuten
Mehr als nur Google
The Climate Corporation
Versicherungen für die Landwirtschaft – 100% datenbasiert
Mehr als nur Google
Das Quantified Self Movement
Zähneputzen als Technologiemarkt?
Mehr als nur Google
Online-Supermärkte
Belächelt von den Lebensmittelketten. Nicht mehr. Ocado ist 100% Daten.
Mehr als nur Google
Musikgeschäft
Bereits vollständig durch digitale Geschäftsmodelle ausgehebelt
Mehr als nur Google
German Angst: Wir tun fast nichts…
www.datascienceacademy.eu
Hilft, Sie erfolgreich
in die digitale Zukunft zu führen
Future is now
(Big Data) Predictive Analytics - Chancen für die Medizin
(Big Data) Predictive Analytics - Chancen für die Medizin
(Big Data) Predictive Analytics - Chancen für die Medizin
(Big Data) Predictive Analytics - Chancen für die Medizin
Nächste SlideShare
Wird geladen in …5
×

(Big Data) Predictive Analytics - Chancen für die Medizin

1.253 Aufrufe

Veröffentlicht am

Prof. Dr. Michael Feindt
Professor für Physik, Karlsruher Institut für Technologie KIT (on leave of absence)
Gründer & Chief Scientific Advisor, Blue Yonder GmbH
96. Deutscher Röntgenkongress – Technik für Menschen, Hamburg, 15. Mai 2015

Veröffentlicht in: Daten & Analysen
0 Kommentare
3 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

Keine Downloads
Aufrufe
Aufrufe insgesamt
1.253
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
19
Aktionen
Geteilt
0
Downloads
11
Kommentare
0
Gefällt mir
3
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

(Big Data) Predictive Analytics - Chancen für die Medizin

  1. 1. (Big Data) Predictive Analytics - Chancen für die Medizin Prof. Dr. Michael Feindt Professor für Physik, Karlsruher Institut für Technologie KIT (on leave of absence) Gründer & Chief Scientific Advisor, Blue Yonder GmbH 96. Deutscher Röntgenkongress – Technik für Menschen, Hamburg, 15. Mai 2015
  2. 2. Exponential increase in data volume ►  Transaction-based data stored through the years ►  Unstructured data streaming in from social media, etc ►  Sensor and machine-to-machine data being collected Volume Velocity Data streaming at unprecedented speed ►  RFID tags, sensors, smart metering, social media and internet-of-things are driving the need to deal with torrents of data in near-real time Variety Data today comes in all types of formats ►  Structured data in traditional databases ►  Information created from line-of-business applications ►  Unstructured text documents, email, video, audio, stock ticker data and financial transactions 48 28 11 2017 + 34% 20142012 Quelle: Gartner Trends Market Size ($bn) ► Big Data: Umgang mit riesigen Datenmengen (strukturiert und unstrukturiert) ► Marktwachstum für Big Data- Lösungen auf 48 Milliarden $ in 2017 erwartet. Big Data: Großer Markt mit starkem Wachstum CAGR + Value: Durch Prognosen und Entscheidungsautomatisierung Werte aus den großen Datenmengen schaffen V V V V
  3. 3. Wirklich?
  4. 4. Die Welt verläuft nicht deterministisch. Vorhersagekraft prinzipiell begrenzt durch Quantenphysik und deterministisches Chaos in komplexen Systemen. Aber sie verläuft auch nicht zufällig.
  5. 5. Wo ist Predictive Analytics einzuordnen? Lotterie (purer Zufall) Pendel (deterministisch) 0% 100%Predictive Analytics Individuelle Vorhersagbarkeit
  6. 6. Für reale Systeme kann man mit Predictive Analytics individuelle Wahrscheinlichkeitsaussagen machen Lotterie (purer Zufall) Pendel (deterministisch) Individuelle Vorhersagbarkeit 0% 100% z.B. zum Ausgang von Sportereignissen
  7. 7. Lotterie (purer Zufall) Pendel (deterministisch) Individuelle Vorhersagbarkeit 0% 100% z.B. Zuschauerzahlen z.B. Abverkäufe Für reale Systeme kann man mit Predictive Analytics individuelle Wahrscheinlichkeitsaussagen machen
  8. 8. Lotterie (purer Zufall) Pendel (deterministisch) Individuelle Vorhersagbarkeit 0% 100% z.B. Verkehrsunfälle z.B. Verkehrsstaus Für reale Systeme kann man mit Predictive Analytics individuelle Wahrscheinlichkeitsaussagen machen
  9. 9. BIG
  10. 10. Technologietreiber Elementarteilchenphysik LHC: 27km Umfang Photos: CERN, Blue Yonder
  11. 11. Gigantischer technologischer Aufwand: nur möglich in weltweiter Zusammenarbeit von sehr vielen Experten: höchste Energien, tiefste Temparaturen, bestes Vakuum, stärkste Magnetfelder, schnellste Elektronik, empfindlichste Sensoren, kleinste Sensoren, größte Genauigkeit, größte Datenmengen, schnellste Computer und Datennetze, detaillierteste Simulationsprogramme, komplexeste Mathematik cleverste Algorithmen kostet viel öffentliches Geld (Steuergelder) CERN-Betrieb: ca € 2,50 pro Bundesbürger /Jahr ist aber enorm effizient (Return on Investment besser als in der Industrie) Talent, Top-Ausbildung, Motivation, Begeisterung, wissenschaftliches Ethos
  12. 12. Grid Computing: Globales Teilen von Speicher und CPU
  13. 13. BIG: 1 PetaByte / Sek. = 1015 Byte / Sek. Wenn 1 Bit einem Blatt entspricht entspricht 1 PByte allen Blättern auf der Erde
  14. 14. SMART
  15. 15. PREDICTIVE: NeuroBayes® Ein High-Tech-Algorithmus aus der experimentellen Elementarteilchenphysik kann komplexe Zusammenhänge aus historischen Datenbanken von Firmen lernen und zur Prognose für die Zukunft nutzen. Basiert auf einem künstlichen neuronalen Netzwerk. Ist aber viel mehr. Äußerst hohe Generalisierungsfähigkeit (d.h. die Vorhersagen treffen innerhalb ihrer angegebenen Unsicherheiten auch ein.)
  16. 16. NeuroBayes in real Big Data: Der LHCb-Trigger Am LHC (CERN) enstehen pro Experiment: 40 000 000 Ereignisse pro Sekunde, das entspricht 1 PetaByte (1,000,000,000,000,000 Byte) pro Sekunde. Am LHCb-Experiment laufen 30 000 Instanzen von NeuroBayes und filtern real-time 24/7 die„interessanten“ Ereignisse. Photo: CERN Aber nur 1 PB interessante Daten pro Jahr können gespeichert werden. Online-Datenreduktion 1 : 10,000,000 nötig!
  17. 17. Seite  21   Alle 5 Nanosekunden eine intelligente Entscheidung, ob die Daten wichtig genug sind, um ausgelesen, gesendet, abgespeichert und verarbeitet zu werden. NeuroBayesExpert@Hardware - Chip R&D: KIT / Blue Yonder: Erste massiv parallele NeuroBayes-Hardware-Implementation mit 2 Gdec/sec läuft ! (2 Milliarden Entscheidungen pro Sekunde) Und auch das läuft heute schon für eine der modernsten im Bau befindlichen technischen Anlagen der Welt (Belle II-Experiment am KEK in Japan):
  18. 18. Extrem schnelle intelligente Entscheidungen direkt am Sensor. Für Belle II-Experiment in Japan. Auch für Industrie 4.0, Internet der Dinge: Intelligent entscheiden, bevor Big Data irgendeinen Computer erreicht.    
  19. 19. Kahneman-Zitat (Nobelpreisträger für Behavioural Economics) Der Mensch ist nicht in der Lage, statistisch- quantitative Entscheidungen permanent gut genug zu treffen und lässt sich häufig täuschen (meist durch Optimismus). Lange Liste von typischen Denkfehlern: http://en.wikipedia.org/wiki/List_of_cognitive_biases
  20. 20. •  Der Mensch ist denkfaul, die meisten Entscheidungen werden vom schnellen intuitiven System(1) gefällt. •  Nachher versucht das langsame, rationale System (2), die Entscheidung zu rechtfertigen. •  Das langsame, rationale System 2 benötigt viel mehr Energie als System 1. Deswegen wird es möglichst wenig genutzt, leider auch von Fachleuten in ihrem Fach. •  Menschen sind überoptimistisch (overconfidence bias). •  Menschen verdrängen / vergessen falsche Einschätzungen und passen sie sogar an, nachdem das Ereignis eingetroffen ist (hindsight bias). •  Menschen sind risikoavers und wägen Chancen und Risiken nicht objektiv ab.. •  Menschen leiden unter Kontrollillusion ( falsche Annahme, zufällige Ereignisse durch eigenes Verhalten kontrollieren zu können). •  Menschen haben die Neigung, Informationen so auszuwählen und zu interpretieren, dass sie den eigenen Erwartungen entsprechen (confirmation bias). •  Menschen haben die Neigung, Muster auch da zu erkennen, wo keine sind. •  Menschen sehen oft Kausalzusammenhänge, wo es keine gibt. •  ....... •  Die meisten Menschen, selbst Wissenschaftler, können schlecht mit komplexen Systemen umgehen: •  besonders, wenn es viele, korrelierte, nichtlineare Einflüsse auf Vorhersage-Ziel gibt. Der ,,rationale‘‘ Mensch...
  21. 21. Der Schlüssel zum Besseren sind bessere Entscheidungen. Der Schlüssel zu besseren Entscheidungen sind (statistisch relevante) objektive Daten. Und kluge Prognosealgorithmen.
  22. 22. (Big Data) Predictive Analytics: Aus eigenen und anderen Datenquellen möglichst viel Information über möglichst viele Einzelfälle gewinnen (z.B. Artikel, Kunden, Artikel in Laden am Tag, Patient, Gen, Virus, Krankheit, ...) Mit modernen Algorithmen Prognosen für die Zukunft für jeden individuellen Einzelfall machen. Inklusive Unsicherheit (Risiko), ganze Wahrscheinlichkeitsverteilung. Automatisch regelmäßig wieder. Oft im Laufe der Zeit immer besser.
  23. 23. Prognose ist nicht nur eine Zahl ... sondern komplette Wahrscheinlichkeitsdichte
  24. 24. Individualisierte Prognosen in Form von Wahrscheinlichkeitsverteilungen aufgrund möglichst vieler objektiver Daten (Statistik auf dem Einzelfall) ModusErwartungswert Standardabweichung (Volatilität) Abweichung von Normalverteilung (heavy tails)
  25. 25. (Big Data) Prescriptive Analytics: Nutze die Prognosen, um Entscheidungen zu treffen. Mathematisch optimal. Vollautomatisch. Auf Basis geeigneter Nutzen-/Kostenfunktionen. Heute möglich: Full Service als Software as a Service in der Cloud (in Europa, private Rechenzentren) . Mathematische und technische Komplexität komplett outsourcebar.
  26. 26. 99% aller operativen Entscheidungen in Unternehmen (Forschung, Kliniken) können automatisiert werden. Und in oft ähnlich wiederkehrenden Situationen viel schneller, zuverlässiger und besser als bisher getroffen werden.
  27. 27. Das Dilemma vieler strategischer Entscheidungen: Ziel 1 Profitabilität Ziel 2 Marktanteil Verbesserung in Ziel 1 ist mit Verschlechterung in Ziel 2 verbunden und umgekehrt
  28. 28. Die Macht des “und“: Ziel 2 Ziel 1 Was wir wirklich wollen: Verbesserung in Ziel 1 UND Verbesserung in Ziel 2 Ist das möglich?
  29. 29. Zauberwort „Individualisierung“ Ziel 1 Ziel 2 Ja, durch Individualisierung! Nicht eine globale Entscheidung, sondern individuelle Optimierung aller einzelnen operativen Entscheidungen! Jetzt kann man auf der neuen Kurve strategisch steuern.
  30. 30. Prescriptive analytics automatisiert sogar Arbeit von 400 Forschungs-Physikern : Wertschöpfung > +100% Photo: CERN Ø  Arbeit von“Künstlicher Intelligenz”und 3 Doktoranden Ø  entspricht ca. 500“normalen” Doktorarbeiten Ø  entspricht weiteren 10 Jahren Datennahme (Kosten ca. 700 M€) Meta-Analyse: Was macht ein exzellenter Wissenschaftler eigentlich in der Physik-Analyse von Daten eines Teilchenbeschleunigers? àAutomatisches hierarchisches Rekonstruktionssystem mit 72 NeuroBayes-Netzwerken rekonstruiert 1100 verschiedene Reaktionen mit Faktor 2 besserer Effizienz als alle bisherigen Analysen in 10 Jahren von weltweit 400 Physikern zusammen!
  31. 31. Scheinbar unvereinbare Ziele vereinbaren mit Hilfe von individualisierten Prognosen / Tarifen / Entscheidungen Beispiel Prämienhöhe in der Versicherungswirtschaft (BGV): u  3,5% mehr Neukunden bei gleichzeitiger Reduktion der Schadenquote um 15% Beispiel Einkaufsmenge eines Versandhandels (Otto): u  Erhöhung der Warenverfügbarkeit bei gleichzeitiger Reduktion von Restbeständen am Ende der Saison Ergebnis: Prognoseverbesserung um 40% Bestandsverbesserung im 2-stelligen Mio.-€-Bereich pro Jahr.
  32. 32. Scheinbar unvereinbare Ziele vereinbaren mit Hilfe von individualisierten Prognosen / Tarifen / Entscheidungen Beispiel aus dem Handel: u  Reduktion des Werbebudgets um 36% u  bei gleichzeitiger Erhöhung des Kundenaktivität um ca. 2,8% Selektion nach individualisiertem kausalen Einfluss des Katalog- Versands auf individuellen Kunden Klassische Selektion nach„Güte“: höherer Nutzen = höhere Kosten Niedrigere Kosten = niedriger Nutzen Ausstattungstiefe (Kosten) Kundenaktivität (Nutzen)
  33. 33. Forward Demand Accurate daily and weekly demand forecasts, using historic sales, pricing and promotion data
  34. 34. Replenishment Optimization KPI- based optimization (Out of stock, write- off reduction) using demand forecasts
  35. 35. ►  20,213m  EUR.    Abschri(enreduk.on  im  Frischebereich   ►   4,570m  EUR.    Effizienzverbesserung  durch    Op.mierung    im   Replenishmentprozess   ►   2,489m  EUR.    Reduk.on  von  gebundenem  Kapital  durch                                           Reduk.on  des  Lagerbestandes ►   10%.  Weniger  Out-­‐of-­‐Stock       •  30 Mrd. € Retailer: Big Data und datengetriebenes automatisches Replenishment mit Blue Yonder Prescriptive reduziert Verschwendung
  36. 36. Dynamic Pricing Iterative optimization of profit and margin in E-Commerce based on base price-demand patterns
  37. 37. Individuelles Pricing mit Predictive •  Zehntausende Preisänderungen/Tag •  für e-Commerce-Angebote ►   0    Beschwerden   ►   +++  Neukunden,  Marktanteile   ►   ++  Umsatz   ►   +  Profitabilität   ►   -­‐    Retouren  
  38. 38. Was  wäre,   wenn…   Just –in-Time Lager und Logistik: Nachfrage – Prognosen und automatische Disposition …alle Parteien einer Supply Chain immer das optimale Inventar hätten, KEIN out of stock, KEIN overstock
  39. 39. Industrial Data combining machine data with master data for energy efficiency, maintenance and spare parts.
  40. 40. Was wäre wenn ein großer Händler genau wissen würde wie viel Obst von welcher Sorte an welchem Tag verkauft wird? Maschinen, Industrieanlagen, Roboter, Autos, Flugzeuge erzeugen Daten. Individuelle lokale Intelligenz à Kommunikation mit Zentrale à von vielen ähnlichen Anlagen lernen à verbessertes Wissen an lokale Intelligenz zurücksenden à Jeder Einzelne wird von allen lernen à viel bessere statistische Basis Industrie 4.0 Mehr als 40.000 installierte Anlagen Milliarden von Sensordaten Planung von präventiven Wartungsmaßnahmen zur Reduktion von Ausfallzeiten Was wäre, wenn ein Betreiber von Windkraftanlagen wüsste, welche Anlage aus welchem Grund demnächst ausfällt?
  41. 41. Prognostiziere Gasturbinen-Start-ups ►  Goal: Increase turbine availability & reliability – Predict probability and duration of successful turbine start-up ►  Sensor data from 10 years usage history of 10 gas turbines, ~2000 sensors per turbine, 5-minute intervals The Story ►  Exploratory data analysis reveals data structure (distributions, peaks, variations, correlations, …) ►  Discovery of patterns, correlations, and exceptions ►  Assessment of data quality ►  Evaluation of forecastability ►  Identification of potential prediction targets Data Inspection -100.0000 -50.0000 0.0000 50.0000 100.0000 150.0000 200.0000 250.0000 300.0000 350.0000 400.0000 450.0000 500.0000 550.0000 600.0000 650.0000 700.0000 750.0000 800.0000 850.0000 900.0000 950.0000 1000.0000 1050.0000 1100.0000 1150.0000 1200.0000 1250.0000 1300.0000 1350.0000 1400.0000 1450.0000 1500.0000 1550.0000 1600.0000 1650.0000 1700.0000 1750.0000 1800.0000 1850.0000 1900.0000 1950.0000 Y -1400.0000 -1200.0000 -1000.0000 -800.0000 -600.0000 -400.0000 -200.0000 0.0000 200.0000 400.0000 600.0000 800.0000 1000.0000 1200.0000 1400.0000 1600.0000 1800.0000 2000.0000 2200.0000 2400.0000 2600.0000 2800.0000 3000.0000 Y 2009.12.0100:00 2009.12.0106:00 2009.12.0112:00 2009.12.0118:00 2009.12.0200:00 2009.12.0206:00 2009.12.0212:00 2009.12.0218:00 2009.12.0300:00 2009.12.0306:00 2009.12.0312:00 2009.12.0318:00 2009.12.0400:00 2009.12.0406:00 2009.12.0412:00 2009.12.0418:00 2009.12.0500:00 2009.12.0506:00 2009.12.0512:00 2009.12.0518:00 2009.12.0600:00 2009.12.0606:00 2009.12.0612:00 2009.12.0618:00 2009.12.0700:00 2009.12.0706:00 2009.12.0712:00 2009.12.0718:00 2009.12.0800:00 2009.12.0806:00 2009.12.0812:00 2009.12.0818:00 2009.12.0900:00 2009.12.0906:00 2009.12.0912:00 2009.12.0918:00 2009.12.1000:00 2009.12.1006:00 2009.12.1012:00 2009.12.1018:00 2009.12.1100:00 2009.12.1106:00 2009.12.1112:00 2009.12.1118:00 2009.12.1200:00 2009.12.1206:00 2009.12.1212:00 2009.12.1218:00 2009.12.1300:00 2009.12.1306:00 2009.12.1312:00 2009.12.1318:00 2009.12.1400:00 2009.12.1406:00 2009.12.1412:00 2009.12.1418:00 2009.12.1500:00 2009.12.1506:00 2009.12.1512:00 2009.12.1518:00 2009.12.1600:00 2009.12.1606:00 2009.12.1612:00 2009.12.1618:00 2009.12.1700:00 2009.12.1706:00 2009.12.1712:00 2009.12.1718:00 2009.12.1800:00 2009.12.1806:00 2009.12.1812:00 2009.12.1818:00 2009.12.1900:00 2009.12.1906:00 2009.12.1912:00 2009.12.1918:00 2009.12.2000:00 2009.12.2006:00 2009.12.2012:00 2009.12.2018:00 2009.12.2100:00 2009.12.2106:00 2009.12.2112:00 2009.12.2118:00 2009.12.2200:00 2009.12.2206:00 2009.12.2212:00 2009.12.2218:00 2009.12.2300:00 2009.12.2306:00 2009.12.2312:00 2009.12.2318:00 2009.12.2400:00 2009.12.2406:00 2009.12.2412:00 2009.12.2418:00 2009.12.2500:00 2009.12.2506:00 2009.12.2512:00 2009.12.2518:00 2009.12.2600:00 2009.12.2606:00 2009.12.2612:00 2009.12.2618:00 2009.12.2700:00 2009.12.2706:00 2009.12.2712:00 2009.12.2718:00 2009.12.2800:00 2009.12.2806:00 2009.12.2812:00 2009.12.2818:00 2009.12.2900:00 2009.12.2906:00 2009.12.2912:00 2009.12.2918:00 2009.12.3000:00 2009.12.3006:00 2009.12.3012:00 2009.12.3018:00 INSERT_TIME
  42. 42. Einblicke in versteckte Zusammenhänge in Daten Zusammenhänge in Daten lassen sich mit modernen Methoden aufdecken auch komplexe, nichtlineare, von vielen Variablen abhängige....
  43. 43. Möglichkeiten im Pharma-Bereich Optimale Auswertung von medizinischen Tests: INDIVIDUALISIERTE Analyse zur Wirksamkeit von Medikamenten: • Wirkung • Nebenwirkung • Wechselwirkung mit anderen Medikamenten
  44. 44. Mögliche Anwendungen: Präklinische Studien Klinische Prüfungen Phase I Phase II Phase III Phase IV Idee: Monitore bei Studien möglichst viele Parameter und untersuche Korrelationen dieser Werte zu Wirkung, Nebenwirkungen, Wechselwirkungen
  45. 45. Mögliche Zielgrößen, auf die NeuroBayes®-Training angewendet werden kann: --> Krankheitsbild nach 1 Woche, 1 Monat etc. --> Wahrscheinlichkeit von unerwünschten Nebenwirkungen --> Überlebensrate nach x Jahren --> Individualisierte Verteilung der Lebenserwartung mit/ohne Therapie --> Individualiserte Vorhersagen für individuelle Patienten möglich!
  46. 46. Viele Input-Größen: Alter, Geschlecht, andere Diagnosen, andere eingenommene Medikamente, Blutwerte, Cholesterinspiegel, Größe, Gewicht, ..., Genausprägungen,... Lebensgewohnheiten (Sport, Rauchen, Alkohol), Beruf, Nationalität, Wohnsitz (Stadt, Land), Familienstand, ... Behandlung: Medikament oder Placebo
  47. 47. Was Blue Yonder- Technologien für Pharma-Studien leisten kann: --> NeuroBayes® kann alle statistischen Größen berechnen, u.a. die in der Medizin üblichen ---- p-Wert ---- Konfidenzintervalle ---- relatives Risiko ---- relative Risikoreduktion ---- absolute Risikoreduktion ---- NNT (number needed to treat) ---- NNH (number needed to harm) Neueste Algorithmen sind oft in der Lage, Korrelation und Kausalität zu unterscheiden
  48. 48. Personalisierte Medizin am Beispiel von Diabetes Typ 2 +                  Known/Historical  Data  +  Medical  Indicators          NeuroBayes                                Probability  Density     Dosierung von Medikamenten
  49. 49. KV-Leistungsbeträge in vorgegebenem Zeitraum alles andere als normalverteilt NeuroBayes® bietet die Lösung für schwierige Verteilungen des Typs Viele Versicherte (Bruchteil 1-P) fordern gar keine Leistung ein € f (t) = (1− P)⋅ δ(t) + P⋅ f (t | t > 0) Wenn Kosten anfallen (Bruchteil P), sind diese entsprechend f(t|t>0) verteilt. Diese Verteilung hat “fat tails“ (extrem hohe Kosten). Mit klassischen Methoden sehr schwer zu behandeln t
  50. 50. f (t | ) = (1− P( ))⋅δ(t)+ P( )⋅ f (t | t > 0, ) (Krankenversicherung:) NeuroBayes® berechnet für jeden Einzelfall x die individualisierte Bayes‘sche Wahrscheinlichkeitsdichte. Versicherter x wird keinen Schaden einreichen mit 1-P(x) Wenn x mindestens einen Schaden einreicht, werden die Kosten f(t | t>0,x) verteilt sein t x x x x δ(t) = Dirac- delta- ,,Funktion‘‘ (Distribution) NeuroBayes® ist auch die Lösung für schwierige Verteilungen wie diese:
  51. 51. Individuelle Schadenprognose ID  TV  Teil  3120489   Frau,  38,  Tarif  EKN1000   Tarifalter  7  Monate   Wahscheinlichkeit  Kosten  >  0  im   Folgejahr:  21.2%   Kosten  in  diesem  Jahr:  4300  €   ID  TV  Teil  3136499   Frau,  41,  Tarif  CV3H250   Tarifalter  7  Monate   Wahscheinlichkeit  Kosten  >  0  im   Folgejahr:  47.1%   Kosten  in  diesem  Jahr:  2800  €   Mit moderner Technologie ist MEHR als nur eine vage Abschätzung der Kosten möglich (Beispiel: private Krankenversicherung) Ø Verschiedene Punktschätzer möglich Ø Auskunft über die Unsicherheit der zu erwartenen Kosten Ø Abschätzung darüber, wie hoch das Tail-Risiko ist, überdurchschnittlich hohe Kosten tragen zu müssen
  52. 52. Predictive Analytics im Vergleich zu klassischen Methoden Anwendungsbeispiele: PKV – Schadenhöhenprognose Kundenindividuelle Schadenhöhenverteilung NeuroBayes berechnet für jeden Kunden eine individuelle Wahrscheinlichkeitsdichte. Dies ermöglicht die Vorhersage von sämtlichen relevanten Quantilen und Schwellen. Sortierfähigkeit NeuroBayes trennt erfolgreich die Versicherungsnehmer auf Basis der prognostizierten mittleren Schadenhöhe NeuroBayes weist mit Abstand die beste Sortierfähigkeit auf. Der Rangkorrelationskoeffizient ist 3-mal höher als bei herkömmlichen (GLM)- Ansätzen. Die Wahrscheinlichkeitsverteilungen der Versicherungsnehmer können deutlich variieren. rsp: Rangkorrelationskoeffizient nach Spearman
  53. 53. Risikozuschläge in privater Krankenversicherung – aus Anamnese NeuroBayes® Experten Ø  Expertenentscheidungen sind bestenfalls zufällig – für Patienten mit langer Historie sogar systematisch falscher als zufällig. Ø  Predictive analytics kann Kosten besser vorhersagen und schlägt Experten bis über 10 Jahre in die Zukunft
  54. 54. Medizinforschung auf Versicherungsdatenbanken: Einzeldaten„nicht qualitätsgesichert“ ? Aber Millionen Fälle über Jahrzehnte, fantastische Statistik! Vergleiche verschiedene Behandlungen. Neue Kausalitätsalgorithmen (verallgemeinterte Stratifizierung) Individualisierte Statistik
  55. 55. Kombination von verschiedenen Datenquellen. Oft großer Mehrwert DNA + Blutwerte + indiv. Historie + ... Der wissenschaftliche Fortschritt könnte viel schneller sein.
  56. 56. Teile Deine Daten, lerne und profitiere von vielen! Modernste Verfahren können auch verteilt lernen (mit wenig Kommunikation zwischen Rechnern) Daten bleiben bei einzelnen Geräten. D: Datenschutz, Privacy Aber Digital Natives verschenken ihre Daten an Facebook, Google, Apple, Whats app. USA: viel schneller, chancenorientiert
  57. 57. 2018 werden ein Drittel der 20 Marktführer bedeutende Marktanteile verlieren (“disrupted”). Viele Industrien werden“amazoned” Quelle: IDC Predictions 2014: Battles for Dominance — and Survival — on the 3rd Platform, 2013 Analystenvorhersage
  58. 58. Was sind die Treiber? Viele der Gewinner sind “Silicon Valley-style entrepreneurial technology companies”.
  59. 59. Mehr als nur Google Die Meute ist unterwegs
  60. 60. LYFT Revolution im privaten Transport Mehr als nur Google
  61. 61. Und was wurde aus myTaxi? Mehr als nur Google
  62. 62. WONGA Kreditvergabe innerhalb von 5 Minuten Mehr als nur Google
  63. 63. The Climate Corporation Versicherungen für die Landwirtschaft – 100% datenbasiert Mehr als nur Google
  64. 64. Das Quantified Self Movement Zähneputzen als Technologiemarkt? Mehr als nur Google
  65. 65. Online-Supermärkte Belächelt von den Lebensmittelketten. Nicht mehr. Ocado ist 100% Daten. Mehr als nur Google
  66. 66. Musikgeschäft Bereits vollständig durch digitale Geschäftsmodelle ausgehebelt Mehr als nur Google
  67. 67. German Angst: Wir tun fast nichts…
  68. 68. www.datascienceacademy.eu Hilft, Sie erfolgreich in die digitale Zukunft zu führen
  69. 69. Future is now

×