SlideShare ist ein Scribd-Unternehmen logo
1 von 162
Downloaden Sie, um offline zu lesen
IKS-Thementag
16.8.2022
Autor: Jörg Vollmer
2 | 162
Agenda
Data Science und Machine Learning
Ideen aus dem Business
Aromatic: Ideen für das Business
Der Bahntracker
3 | 162
Agenda
Data Science und Machine Learning
Ideen aus dem Business
Aromatic: Ideen für das Business
Der Bahntracker
4 | 162
Am Anfang war das Bit
5 | 162
Datenvolumen
Byte = 8 Bit
Kibibyte (KiB) = 1024 Byte
Mebibyte (MiB) = 1.048.576 Byte
Gibibyte (GiB) = 1.073.741.824 Byte
Tebibyte (TiB) = 1.099.511.627.776 Byte
Pebibyte (PiB) = 1.125.899.906.842.624 Byte
Exbibyte (EiB) = 1.152.921.504.606.846.976 Byte
Zebibyte (ZiB) = 1.180.591.620.717.411.303.424 Byte
Yobibyte (YiB) = 1.208.925.819.614.629.174.706.176 Byte
· 2,5 (täglich)
· 54 (weltweit)
· 2 alle drei Jahre
Quelle: [DatenvolumenWeltweit1/2]
6 | 162
Das Internet ist nur ein Hype (Bill Gates 1993)
Quelle: [Internetverbrauch]
7 | 162
Der Wert von Daten
17.01.2020: Google-Mutterkonzern Alphabet knackt die Eine-Billion-Dollar-
Grenze [BoersenwertAlphabet]
28.6.2021: Facebook ist jetzt über eine Billion Dollar wert. [BoersenwertFacebook]
(Internet-)Suche nach den „großen Datenkraken“:
u Alphabet
u Meta (Facebook)
u Amazon
u Apple
u Microsoft
Quelle: [WertvollsteUnternehmen]
8 | 162
9 | 162
10 | 162
Data-Science-Methoden sind Verfahren, die aus
(Big) Data unbekannte, neuartige, nützliche und
wichtige Informationen „aufspüren“,
um Entscheidungen zu treffen oder
Vorhersagen zu machen –
verstärkt mithilfe von maschinellem Lernen.
11 | 162
Data Science: Implementiere die Berechnung
Input Output
(Big) Data
unbekannte, neuartige,
nützliche, wichtige
Information
?
Hist.
Info
Fachwissen
12 | 162
Data Science: Wettervorhersage
Input Output
unbekannte, neuartige,
nützliche, wichtige
Information
?
Hist.
Info
Datum: 18.8.2022
Uhrzeit: 12:00
Ort: Hilden
Temperatur: 22°C
Niederschlag: 60%
Luftfeuchte: 56%
Wind: 11 km/h
Wetter-Modell (125 PiB), 130 TB/Tag
Fachwissen
13 | 162
Galileos freier Fall
Zeit (t) Höhe (h)
0 0
1 5
2 20
3 45
4 80
5 125
6 210
Input Output
?
14 | 162
Ø-Gewicht im Alter von …
Input Output
?
Alter
Gewicht
Statistik
15 | 162
Trägt mein Baum Früchte?
Input Output
?
Alter, Sorte, Boden
ja / nein
Software
16 | 162
Handschrifterkennung
Input Output
?
ML-Verfahren
4
4
5
9
6
4
9
7
0
7
3
0
1
3
4
17 | 162
Algorithmische versus ML-Verfahren
Input Output
Software
Analyse
Input Output
Daten aus
(früheren)
Berechnungen
ML-Verfahren
Programmieren
Trainieren
Anforderungen
Beispiele
Parameter
18 | 162
19 | 162
20 | 162
Maschinelle Lernverfahren „programmieren“ sich
selbstständig anhand großer Datenmengen und sind in der
Lage Strukturen z. T. komplexer Natur zu erkennen.
21 | 162
Agenda
DataScience und Machine Learning
Ideen aus dem Business
Aromatic: Ideen für das Business
Der Bahntracker
22 | 162
Data Science und ML sind vielfältig einsetzbar
Kunde
Marketing
CRM
Prozess
Produktion
Wartung
Logistik
Produkt
Funktionalität
Qualität
23 | 162
Kundensegmente
Input Output
Datenbank Dateien
Services
Kundenstammdaten, Kaufverhalten
Termindisziplin, Nutzungshäufigkeit,
Reklamationen, Zahlungsmoral,
demo- & geographische Daten,
Scores, Preise, Konkurrenz, Trends
Kundensegement
ML-Verfahren
KN 4711
Peter Maier
Geschlecht: M
Schoßhund
24 | 162
Gezielte Werbung für einen Mann
Beispiel:
Schoßhunde wollen
nicht von Schoßhunden
beworben werden.
Quellen: [Segmentierung1],
[Segmentierung2],
[Segmentierung3].
Populäre
Bezeichnungen
im Marketing
25 | 162
Krankheiten diagnostizieren
Medikamente schneller entwickeln: DeepMind, Exscientia (DSP-1181), …
Behandlung personalisieren (z. B. Überwachung chronischer Krankheiten)
Sonstige
Data Science und KI der Medizin (Produkt)
Krebserkennung EKG Hautläsionen Retina
Quellen: [Medikamente1],
[Medikamente2].
26 | 162
Marketing & Vertrieb
u Kundensegmentierung
u Digitale Assistenten (ChatBot)
Fehleraufdeckung
u Falschabrechnungen
u Betrugsversuche
Spezialthema: Anrechenbare Vorerkrankungen
u Frage: Hat eine Erkrankung einen ursächlichen Zusammenhang zu einer vorherigen?
u Beispiel: Bandscheibenvorfall und Rückenschmerzen.
u Bislang Sachbearbeiter*innen => viele historische Daten vorhanden J
Data Science bei einer Krankenversicherung (Prozess)
27 | 162
ICD Schlüssel Vorerkran-
kungsgruppe
Zeitraum
von
Zeitraum
bis
Spondylose ? 12.06.2022 05.07.2022
Rückenschmerzen 5 09.05.2022 15.05.2022
Oberflächliche Verletzungen
der Hüfte und des Oberschenkels
8 03.12.2021 03.12.2021
Bronchitis 7 12.09.2021 19.09.2021
Bandscheibenvorfall 5 15.03.2021 07.04.2021
Rückenschmerzen 5 01.02.2021 05.02.2021
Anrechenbare Vorerkrankungen
KI-Aufgabe
28 | 162
Smart City
29 | 162
Ich
30 | 162
31 | 162
KI-Ampel-Steuerung beobachtet
auch Stau-Infos aus dem Internet
32 | 162
Intelligente, vorausschauende Ampelschaltungen
u KI ermittelt das beste Ampel-Schaltverhalten, um den Verkehrsfluss zu optimieren
u Hochauflösende Kamera- und Radarsensorik erfassen Verkehrsgeschehen
In Zukunft werden 5.200 Lichtsignalanlagen miteinander kommunizieren
(straßen.nrw)
u Schaltungen für eine solch hohe Dynamik lassen sich kaum noch programmieren,
sondern müssen erlernt werden.
Autonomes Fahren: Bei „Car 2 X“ kommuniziert das Fahrzeug mit z. B. auch
mit Ampeln
Vorteile
u Verbesserung des Verkehrsfluss um ca. 15 Prozent durch KI
u Verringern von Staus, Lärm und CO2-Belastung
Smarte Ampeln für den Verkehr
Quellen: [SmartCity1],
[SmartCity2].
33 | 162
34 | 162
Wasserverluste in öffentlichen Trinkwassernetzen
Quelle: [Wasserverluste]
35 | 162
115.000 km Trinkwasserleitungen
100.000 km Abwasserleitungen
Erwartete Lebensdauer ca. 50 Jahre
10 % - 15 % der Leitungen sind
sanierungsbedürftig
Leckagen in Bayerns Trinkwasserleitungen
Durchfluss- & Druckmessstelle
Quellen: [UniBielefeld],
[LebensraumWasser].
36 | 162
Normaler Wasserverbrauch
15.2.2020
16.2.2020
Quelle: [LeckagenmitKI]
37 | 162
Leckage erkennbar als Anomalie im Wasserverbrauch
Quelle: [LeckagenmitKI]
38 | 162
39 | 162
Machine Learning Group der Uni Bielefeld
u Leckagen-Erkennung anhand von Druckmessungen
u Erkennung von Sensor-Fehlern (!) mit KI
Fraunhofer-Instituts Projekt KI-MUSIK4.0
u Audio-Überwachung gegen Leckagen in pneumatischen Antrieben
RBS Wave GmbH
u Früherkennung und Vorortung von Leckagen mit KI-basierter Software
NL Accustics
u Our advanced machine learning-based algorithms provide you with easy-to-use diagnostics for intelligent
maintenance decisions.
Neuron Soundware
u Ausfälle voraussagen mit KI, IoT und Sound
Verwandte Forschung aktuell
Quellen: [UniBielefeld],
[Fraunhofer],
[LeckagenmitKI],
[Industr],
[Siemens],
[FHKiel],
[PipePredict].
40 | 162
KI wird kreativ
41 | 162
Natural Language Understanding (NLU)
u OpenAI
u DeepL
u Google BERT, Word2Vec, Glove, ELMO,
u Facebook XLM
u IBM Watson
GitHub Copilot
OpenAI MuseNet
OpenAI Dall·E, Google Imagen
DeepMind Agent Gato
Zeitenwende für neuronale Netzwerkmodelle
GPT3
42 | 162
OpenAIs Dall·E 2 Googles Imagen
KI-generierte Bilder Bilder
Toilettenauto Eine verchromte Ente mit goldenem
Schnabel streitet sich mit einer wü-
tenden Schildkröte in einem Wald
Quellen: [DallE2], [Imagen]
43 | 162
MuseNet – OpenAI
https://openai.com/blog/musenet/
Kann Musikstücke fortsetzen in
unterschiedlichsten Stilen
Transformer lernt anhand von Midi-Files
u selbstüberwacht
Technik
u verwendet Sparse Transformer mit
u 72 Schichten, 24 Attentionheads
u über einen Kontext von 4096 Tokens
44 | 162
Türkischer Marsch im Stile von Chopin
45 | 162
app.neuro-flash.com
Kann man Kunden besser verstehen und was treibt sie an? Die Sammlung, Aufbereitung und Analyse
von Daten – das ist die Kernaufgabe der Data Science. Durch den Einsatz von Methoden der Statistik,
der Wahrscheinlichkeitsrechnung und der maschinellen Lernverfahren können Unternehmen mehr über
ihre Kunden erfahren und herausfinden, was diese wirklich wollen. Data Science ist kein Hexenwerk,
sondern eine Kombination aus verschiedenen Disziplinen, die bereits seit Jahrzehnten erforscht werden.
Dennoch ist sie für viele etablierte Unternehmen neu und ungewohnt. Diese müssen sich erst einmal
daran gewöhnen, statt auf Bauchgefühl oder Intuition Daten als Grundlage für ihre Entscheidungen
heranzuziehen. Oft fehlt es etablierten Unternehmen an den richtigen Strukturen und Prozessen, um
Data Science erfolgreich einsetzen zu können. Zudem mangelt es oft an Experimentierfreude und
Risikobereitschaft. Dabei ist es gerade wichtig, neue Wege zu gehen und Fehler zu machen. Nur so
können sich Unternehmen weiterentwickeln und langfristig erfolgreich sein.
à „Data-Science“, Vortragstitel
Data Science – die neue Waffe im Kampf um die Kunden
à Einleitung für Vortrag
46 | 162
Agenda
Data Science und Machine Learning
Ideen aus dem Business
Aromatic: Ideen für das Business
Der Bahntracker
47 | 162
AROMATIC
Aromen, Heilkräuter und Gewürze
48 | 162
DataRobot
Aromatic-Control-Center
Prod-Überwachung
Chat Bot
Segmente / Cluster
Empfehlungssystem Portfolio
Neukundengewinnung
Zulieferer-Scan
Routenplanung
Recruiting
Betrugserkennung
WebSite-Optimierung
Sentiment-Analyse
Kostenplanung
AROMATIC
49 | 162
Kundensegmente
B2C
Datenbank:
Segmente 2022
Retouren ++ -- - +
Alter Ø 35 Ø 63 Ø 46 Ø 32 Ø 25
Umsätze ++ ++ + -
Einkäufe pro Jahr 8 6 2,8 7,2 3,5
Bevorz. Produkte Medizin Gewürze Aromen
Online-Affinität ++ - + ++
AROMATIC
50 | 162
Kundensegmente
B2C
Datenbank:
Segmente 2022
Online Luxus Business FamiIies Young
Retouren ++ -- - +
Alter Ø 35 Ø 63 Ø 46 Ø 32 Ø 25
Umsätze ++ ++ + -
Einkäufe pro Jahr 8 6 2,8 7,2 3,5
Bevorz. Produkte Medizin Gewürze Aromen
Online-Affinität ++ - + ++
AROMATIC
51 | 162
127 €
180 €
60 €
2020 2021
Kundensegmente
Online-
Shopper
Luxus
Business
Families
Young
373 €
346 €
Umsatz
Merkmal:
B2C
Datenbank:
Segmententwicklung
2022
Jahr
AROMATIC
52 | 162
Marketing-Budget-Verteilung
Online-
Shopper Luxus Business Families Young
Budget
für 09.22
Machine
Learning
CLV
2022
11.500
€
2021
2022
18.000
€
2021
AROMATIC
53 | 162
DataRobot
Aromatic-Control-Center
Prod-Überwachung
Chat Bot
Segmente / Cluster
Empfehlungssystem Portfolio
Neukundengewinnung
Zulieferer-Scan
Routenplanung
Recruiting
Betrugserkennung
WebSite-Optimierung
Sentiment-Analyse
Kostenplanung
AROMATIC
Kündigungsprävention
54 | 162
Kündigungsprävention
Input Output
Preise, Käufe, Reklamationen
Kündigungswahrscheinlichkeit
Datawarehouse
Statistik
55 | 162
Kündigungsprävention
Input Output
Datenbank Dateien
Services
Kundenstammdaten, Kaufverhalten
Termindisziplin, Nutzungshäufigkeit,
Reklamationen, Zahlungsmoral,
demo- & geographische Daten,
Scores, Preise, Konkurrenz, Trends, ...
Kündigungswahrscheinlichkeit
Statistik
56 | 162
Amazon Fraud Detector
u Schnellere Erkennung von mehr Online-Betrug mit maschinellem Lernen
Amazon Textract
u Problemloses Extrahieren von Text und Daten aus praktisch jedem Dokument
Google Natural Language API
u Informationen aus unstrukturiertem Text gewinnen
Amazon Lex
u Erstellen von Sprach- und Text-Chatbots
Amazon Lookout for Equipment
u Erkennen eines anormalen Geräteverhaltens durch Analysieren von Sensordate
Data Science as a (Cloud-)Service
57 | 162
Amazon Monitron
u Zustandsüberwachungssystem für Produktionsmaschinen
Amazon Comprehend Medical
u Amazon Comprehend Medical verwendet maschinelles Lernen, um Erkenntnisse
und Beziehungen aus medizinischem Text zu extrahieren.
Amazon HealthLake
u Gesundheitsdaten sinnvoll nutzen
AWS DeepLens
u Videokamera mit Deep Learning-Funktion
Google Vision AI
u Mit vortrainierten Modellen Emotionen und noch sehr viel mehr erkennen
Data Science as a (Cloud-)Service
58 | 162
Neues Projekt:
Kündigungsprävention
59 | 162
Der Data-Science-Lebenszyklus
Data Engineering
Data Analysis
Machine Learning
Data Science
Daten
sammeln
Daten
bereinigen
Explorative
Analyse
Model-
lierung
Deploy-
ment
60 | 162
Der Data-Science-Lebenszyklus
Data Engineering
Data Analysis
Machine Learning
Data Science
Daten
sammeln
Daten
bereinigen
Explorative
Analyse
Model-
lierung
Deploy-
ment
Anforderungs-
& Projekt-
Management
61 | 162
Der Data-Science-Lebenszyklus
Data Engineering
Data Analysis
Machine Learning
Data Science
Daten
sammeln
Daten
bereinigen
Explorative
Analyse
Model-
lierung
Deploy-
ment
Anforderungs-
& Projekt-
Management
Design
Thinking
Data
Thinking
62 | 162
Der Data-Science-Lebenszyklus
Data Engineering
Data Analysis
Machine Learning
Data Science
Daten
sammeln
Daten
bereinigen
Explorative
Analyse
Model-
lierung
Deploy-
ment
Anforderungs-
& Projekt-
Management
Data
Thinking
63 | 162
Der Data-Science-Lebenszyklus
Anforderungs-
& Projekt-
Management
Data
Thinking
64 | 162
Der Data-Science-Lebenszyklus
Daten
sammeln
Anforderungs-
& Projekt-
Management
Data
Thinking
Datenbank
Dateien Data Mining
Statistik
Services
Big Data Smart Data
IoT
Proof of Concept
Daten
bereinigen
Explorative
Analyse
Data Warehouse
Data Lake
Präparierte
Daten
Daten
visualisieren
Feedback
65 | 162
Der Data-Science-Lebenszyklus
Data Engineering
Data Analysis
Machine Learning
Data Science
Daten
sammeln
Anforderungs-
& Projekt-
Management
Data
Thinking
Daten
bereinigen
Explorative
Analyse
Model-
lierung
Deploy-
ment
Prototyp
66 | 162
Der Data-Science-Lebenszyklus
Data Engineering
Data Analysis
Machine Learning
Data Science
Daten
sammeln
Anforderungs-
& Projekt-
Management
Data
Thinking
Daten
bereinigen
Explorative
Analyse
Model-
lierung
Deploy-
ment
Qualitäts-
sicherung
MLOps
Produktion
67 | 162
Kündigungsprävention
Online-
Shopper Luxus Business Families Young
Termindisziplin
Kaufverhalten
Nutzungshäufigkeit
Reklamationen
Zahlungsmoral
Machine
Learning
2020
2021
2022
2020
2021
2022
Kundenstammdaten
demographische Daten
geographische Daten
Scores
Machine
Learning
AROMATIC
68 | 162
Kündigungsprävention
Kündigungswahrscheinlichkeit: 36%
1 Reklamation mit Kündigungsandrohung letzter Monat
4 Reklamationen aus gleicher Adresse in letzten 3 Monaten
Frühere Abo-Kündigung durch Abonnent
15 Jahre bisherige Abo-Laufzeit
Kunde bezieht Vollabo
Peter Baumgärtner
Alter: 54
Wohnort: Essen
Knd.Nr. 234554
AROMATIC
69 | 162
Kündigungsprävention
20-fach höher 0,02%
0,2%
2,2%
9,6%
57,4%
19,7%
5,0%
3,3%
2,6%
385 kritische Abonnenten
Aktion 1 Aktion 2 Aktion 3
20-fach niedriger
10-fach höher
5-fach höher
2-fach höher
Durchschnitt
2-fach niedriger
5-fach niedriger
10-fach niedriger
AROMATIC
70 | 162
Warum scheitern so viele Data-Science-Projekte?
schlechte, evtl. zu viele (€) Daten
Auch die Cloud allein bewirkt keine Wunder
rechtlich: Datenschutz!
Uni- bzw. Kursstoff
Viele neue Erfolge
Kostet nicht die meiste Zeit
Datenbeschaffung
technisch, organisatorisch,
Geschäftsidee &
-modell sind häufig
nicht ausgereift
10%
70%
10% 10%
Daten
sammeln
Anforderungs-
& Projekt-
Management
Data
Thinking
Daten
bereinigen
Explorative
Analyse
Model-
lierung
Deploy-
ment
Qualitäts-
sicherung
Wird gern
vergessen
71 | 162
Die Idee!
Data-Science-Team aufbauen (mit Draht zum Management)
u KI-Expertise hinzunehmen
Starten Sie mit einem Pilot-Projekt
u Geplante Zeit: ca. 3 – 6 Monate
u Ergebnisse messbar machen
Nicht jedes Rad neu erfinden:
u Es gibt wiederverwendbare Bausteine (Cloud)
u AutoML nutzen
Mittelfristig bzw. langfristig DS/KI-Strategie etablieren
u Es gibt viel zu klären: Technisches, Organisatorisches, Rechtliches
u DevOps bzw. MLOps frühzeitig etablieren
u Nehmen Sie den Change ERNST; auch hier dauert ALLES länger als gedacht!
Erfolgsfaktoren
72 | 162
Agenda
Data Science und Machine Learning
Ideen aus dem Business
Aromatic: Ideen für das Business
Der Bahntracker
73 | 162
Worüber haben sich Bahnfahrer*innen am meisten geärgert?
7%
2%
15%
4%
3%
11%
42%
9%
7%
Fehlende oder falsche Infos vor und während der Reise
Lange Wartezeit beim Umsteigen
Laute oder störende Mitreisende
Kein oder schlechtes WLAN
Teure Fahrkarte
Mängel im Zug (z.B. Klimatisierung, WC, Speisewagen)
Verspätung / verpasster Anschluss / Zugausfall
Schlechte Betreuung bei Problem (z.B. kurzfristig
geändertes Abfahrtsgleis)
Bahnreise gab keinen Grund zum Ärgern
Quelle: [Bahnfahrtaerger]
74 | 162
Meine Bahnfahrt von Düsseldorf nach Frömern
75 | 162
17.08.22
75
Eingabe
76 | 162
Erste Untersuchungen mit öffentlichen Bahndaten
dbf.finalrewind.org
Service
Daten
sammeln
Anforderungs-
& Projekt-
Management
Data
Thinking
„Data Lake“:
MongoDB
ca. ½ Mio. Datensätze
77 | 162
13 Bahnhöfe, 236 Züge, 1795 Zugnummern (ZN)
EC 114 EC 7 EC 9 FLX 30 IC 118 IC 119 IC 1916 IC 1949 IC 1952 IC 1959 IC 2003 IC 2010 IC 2011 IC 2012 IC 2013 IC 2015
IC 2040 IC 2042 IC 2043 IC 2044 IC 2045 IC 2046 IC 2047 IC 2048 IC 2049 IC 2152 IC 2155 IC 2156 IC 2157 IC 2210 IC 2212 IC 2216
IC 2223 IC 2224 IC 2225 IC 2226 IC 2227 IC 2228 IC 2229 IC 2310 IC 2318 IC 2319 IC 2320 IC 2321 IC 2322 IC 2323 IC 2324 IC 2325
IC 2326 IC 2327 IC 2328 IC 2341 IC 2440 IC 2441 IC 2442 IC 2443 IC 2444 IC 2445 IC 2446 ICE 100 ICE 101 ICE 1010 ICE 1011 ICE 1012
ICE 1013 ICE 1015 ICE 1022 ICE 1028 ICE 1050 ICE 1055 ICE 1151 ICE 1152 ICE 1222 ICE 1223 ICE 1224 ICE 1545 ICE 1621 ICE 1626 ICE 1627 ICE 204
ICE 22 ICE 228 ICE 229 ICE 23 ICE 26 ICE 27 ICE 28 ICE 29 ICE 2936 ICE 2941 ICE 2942 ICE 2944 ICE 513 ICE 514 ICE 515 ICE 516
ICE 517 ICE 518 ICE 519 ICE 523 ICE 524 ICE 525 ICE 526 ICE 527 ICE 528 ICE 529 ICE 541 ICE 542 ICE 543 ICE 544 ICE 545 ICE 546
ICE 547 ICE 548 ICE 549 ICE 552 ICE 553 ICE 554 ICE 555 ICE 556 ICE 557 ICE 558 ICE 559 ICE 610 ICE 611 ICE 612 ICE 613 ICE 614
ICE 615 ICE 616 ICE 617 ICE 618 ICE 619 ICE 620 ICE 622 ICE 624 ICE 626 ICE 640 ICE 641 ICE 642 ICE 643 ICE 644 ICE 645 ICE 646
ICE 650 ICE 651 ICE 652 ICE 653 ICE 654 ICE 655 ICE 656 ICE 657 ICE 713 ICE 714 ICE 717 ICE 752 ICE 759 ICE 812 ICE 813 ICE 840
ICE 842 ICE 843 ICE 844 ICE 845 ICE 846 ICE 847 ICE 848 ICE 849 ICE 853 ICE 854 ICE 855 ICE 856 ICE 857 ICE 858 ICE 859 ICE 912
ICE 913 ICE 914 ICE 918 ICE 919 ICE 920 ICE 921 ICE 928 ICE 929 ICE 940 ICE 941 ICE 942 ICE 943 ICE 944 ICE 945 ICE 946 ICE 947
ICE 948 ICE 949 ICE 950 ICE 951 ICE 952 ICE 953 ICE 954 ICE 955 ICE 956 ICE 957 RB 32 RB 40 RB 43 RB 50 RB 51 RB 52
RB 53 RB 54 RB 59 RB 91 RE 1 RE 11 RE 13 RE 16 RE 17 RE 3 RE 34989 RE 4 RE 57 RE 6 RE 7
RE 98079 RE 98505 RE 98531 S 1 S 2 S 4 S 5 S 8 S 9 THA 9412 THA 9424
THA 9459 THA 9471
Düsseldorf Hbf Duisburg Hbf Wuppertal Hbf Essen Hbf Dortmund Hbf
Do-Hörde Holzwickede Fröndenberg Hagen Hbf Schwerte/Ruhr
Unna Hamm Hbf Frömern
78 | 162
Erste Untersuchungen mit öffentlichen Bahndaten
dbf.finalrewind.org
Service
Daten
sammeln
Anforderungs-
& Projekt-
Management
Data
Thinking
Daten
bereinigen
„Data Lake“:
MongoDB
Präpariert:
MongoDB
ca. ½ Mio. Datensätze ca. 200.000 Fahrten
79 | 162
Date: 2022-06-08
Train: 26831, RE 1
Düsseldorf Hbf, Arrival: 18:19 Delay: 19, Delay-Infos: Bauarbeiten, Observation: 18:35
Düsseldorf Flugh.
Duisburg Hbf, Arrival: 18:36 Delay: 20, Delay-Infos: Bauarbeiten, Observation: 18:53
Mülheim(Ruhr)Hbf
Essen Hbf, Arrival: 18:51 Delay: 18, Delay-Infos: Bauarbeiten, Observation: 18:48
Wattenscheid
Bochum Hbf
Dortmund Hbf, Arrival: 19:15 Delay: 17, Delay-Infos: Bauarbeiten, Observation: 18:49
Dortmund-Kurl
Kamen-Methler
Kamen
Bönen-Nordbögge
Hamm Hbf, Arrival: 19:40 Delay: 17, Delay-Infos: Bauarbeiten, Observation: 18:52
Eine zusammengesetzte Fahrt
80 | 162
Erste Untersuchungen mit öffentlichen Bahndaten
dbf.finalrewind.org
Service
ca. ½ Mio. Datensätze ca. 200.000 Fahrten
Daten
sammeln
Anforderungs-
& Projekt-
Management
Data
Thinking
Daten
bereinigen
Explorative
Analyse
Daten
visualisieren
Data Mining
Statistik
Proof of Concept
„Data Lake“:
MongoDB
Präpariert:
MongoDB
81 | 162
Summe alle Verspätungen (Rhein/Ruhr)
Pfingsten
Fron-
leichnam
1.6.
Tornado
82 | 162
Meine Bahnfahrt von Düsseldorf nach Frömern
83 | 162
Intelligente Verarbeitung der Daten
84 | 162
85 | 162
Es existieren zahlreiche Fahrten
Hagen
Hörde Unna
Fröndenberg
Schwerte
Düsseldorf
Frömern
Start
Ziel
Dortmund
86 | 162
Schnellste Verbindung (V1)
17:12
18:19 18:32
Hörde
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
Gesamtfahrzeit: 1:27
Unna
18:39
Dortmund
87 | 162
Zweitschnellste Verbindung (V2)
18:15 18:41
Hörde
Schwerte Fröndenberg
Unna
Hagen
Gesamtfahrzeit: 1:55 (+0:28)
17:22
Frömern
Dortmund
Düsseldorf
19:17
19:09
19:05
88 | 162
Drittschnellste Verbindung (V3)
17:12
18:07 18:28
Hörde
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
Gesamtfahrzeit: 2:05 (+0:38)
Unna
18:37
19:17
19:09
Dortmund
89 | 162
{
V1
V2
V1
Auskunft der Bahn
{
{
kein V3!
90 | 162
Wir entscheiden uns zunächst für V1
17:12
18:19 18:32
Hörde
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
Gesamtfahrzeit: 1:27 h
Unna
18:39
Dortmund
91 | 162
Anstatt des Zugs
7 17:12
Hamm (Westf.)
Wuppertal - Hagen - Unna
+++ ca. 10 Min. später +++
RE 13
92 | 162
Ein typisches Szenario
7 17:12
Hamm (Westf.)
Wuppertal - Hagen - Unna
+++ ca. 15 Min. später +++
RE 13
93 | 162
18:32 (+0:13)
18:19
V1 ist nun problematisch
17:27 (+0:15)
17:12
Hörde Unna
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
19:32
Der Anschluss wird vsl. nicht erreicht
Gesamtfahrzeit: 2:27 (+1:00)
19:39
!
Dortmund
94 | 162
Auskunft der Bahn
V2
{
95 | 162
Der naive Bahnfahrer wählt demnach V2
18:15 18:41
19:09
Hörde
Schwerte Fröndenberg
Unna
Hagen
Gesamtfahrzeit: 1:55 (+0:28)
17:22
Düsseldorf
Frömern
19:17
19:05
Dortmund
96 | 162
Alles scheint ok
17:22
Hamm (Westf.)
Duisburg - Mülheim - Essen - Dortmund RE 1
17
97 | 162
Die Fahrt beginnt mit dem RE 1
18:15 18:41
Hörde
Schwerte Fröndenberg
Unna
Hagen
17:22
Frömern
Gesamtfahrzeit: 1:55 (+0:28)
19:17
Düsseldorf
19:09
19:05
Dortmund
98 | 162
Angekommen in Dortmund
18:15 18:41
Hörde
Schwerte Fröndenberg
Unna
Hagen
17:22
Düsseldorf
Frömern
Gesamtfahrzeit: 1:55 (+0:28)
19:17
19:09
19:05
Dortmund
99 | 162
Umstieg in den RE 57
18:15 18:41
Hörde
Schwerte Fröndenberg
Unna
Hagen
17:22
Düsseldorf
Frömern
Gesamtfahrzeit: 1:55 (+0:28)
19:17
19:09
19:05
Dortmund
100 | 162
Leichte Verspätung bis Hörde
18:15 18:41
Schwerte Fröndenberg
Unna
Hagen
17:22
Düsseldorf
Frömern
18:51 (+0:03)
18:48
Hörde
Gesamtfahrzeit: 1:55 (+0:28)
19:17
19:09
19:05
Dortmund
101 | 162
19:05
19:11 (+0:06)
Weitere Verspätung bis Fröndenberg
18:15 18:41
19:17
Schwerte Fröndenberg
Unna
Hagen
17:22
Düsseldorf
Frömern
18:51 (+0:03)
18:48
Hörde
Gesamtfahrzeit: 1:55 (+0:28)
Der Anschluss wird vsl. nicht erreicht !
19:09
Dortmund
102 | 162
19:05
19:11 (+0:06)
Gezwungen, den nächsten RB 54 zu nehmen
18:15 18:41
20:09
Schwerte Fröndenberg
Unna
Hagen
17:22
Düsseldorf
Frömern
18:51 (+0:03)
18:48
Hörde
20:17
Dortmund
Gesamtfahrzeit: 2:55 (+1:28)
103 | 162
Ein Verdopplung der Fahrzeit!
18:15 18:41
20:09
Schwerte Fröndenberg
Unna
Hagen
Gesamtfahrzeit: 2:55 (+1:28)
17:22
Düsseldorf
Frömern
18:51 (+0:03)
18:48
Hörde
20:17
19:05
19:11 (+0:06)
Dortmund
104 | 162
4
7
14
8
12
8
4 4
14
5
7 7
8
10
3
5
9
31
8
4
5 5
18
5
8
20
1
4
5
0
3 3 3
5
3
19
3
4
0 2
3
11
17
4
23
3 3
27
30
2
1
.
0
3
.
2
2
2
3
.
0
3
.
2
2
2
5
.
0
3
.
2
2
2
7
.
0
3
.
2
2
2
9
.
0
3
.
2
2
3
1
.
0
3
.
2
2
0
2
.
0
4
.
2
2
0
4
.
0
4
.
2
2
0
6
.
0
4
.
2
2
0
8
.
0
4
.
2
2
1
0
.
0
4
.
2
2
1
2
.
0
4
.
2
2
1
4
.
0
4
.
2
2
1
6
.
0
4
.
2
2
1
8
.
0
4
.
2
2
2
0
.
0
4
.
2
2
2
2
.
0
4
.
2
2
2
4
.
0
4
.
2
2
2
6
.
0
4
.
2
2
2
8
.
0
4
.
2
2
3
0
.
0
4
.
2
2
0
2
.
0
5
.
2
2
0
4
.
0
5
.
2
2
0
6
.
0
5
.
2
2
0
8
.
0
5
.
2
2
1
0
.
0
5
.
2
2
1
2
.
0
5
.
2
2
1
4
.
0
5
.
2
2
Verspätung > 3 Min: 65 %
Ø 7,55 Min / Median 5 Min
Verspätungen des RE 57 (10773) in Fröndenberg,
Abfahrt in Dortmund Hbf: 17:41 Uhr
105 | 162
Was ist das Problem?
Der Anschluss in Fröndenberg ist sehr knapp bemessen: 4 Min.
Umsteigezeit!
Die Verspätung tritt erst während der 2. Fahrt auf und wird bei Fahrtantritt
in Düsseldorf in der Bahn-App somit nicht angekündigt.
Nur als erfahrener Bahnfahrer weiß ich, dass diese Fahrt äußerst riskant ist.
DS-Frage: Könnte die Bahn-App diese Erfahrungswerte einrechnen?
Antwort: JA!
106 | 162
Den Autobahn-Tracker gibt es schon
107 | 162
18:32 (+0:13)
18:19
Hörde Unna
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
19:32
Gesamtfahrzeit: 2:27 (+1:00)
17:27 (+0:15)
17:12
19:39
Wären wir trotzdem in den RE 13 eingestiegen (V1)
!
Dortmund
108 | 162
18:29 (+0:10)
18:19
Bis Hagen bereits fünf Minuten aufgeholt
17:27 (+0:15)
17:12
Hörde Unna
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
19:32
18:09 (+0:10)
17:58
Gesamtfahrzeit: 2:27 (+1:00)
19:39
!
Dortmund
109 | 162
18:28 (+0:09)
18:19
Der RE 13 macht weitere Minuten gut
17:27 (+0:15)
17:12
Hörde Unna
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
Gesamtfahrzeit: 1:27 h
18:32
18:39
18:17 (+0:09)
18:08
18:09 (+0:10)
17:58
Dortmund
110 | 162
18:27 (+0:08)
18:19
Der Anschluss wird wider Erwarten erreicht
Hörde Unna
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
Gesamtfahrzeit: 1:27 h
18:32
17:27 (+0:15)
17:12
18:09 (+0:10)
17:58
18:17 (+0:09)
18:08
18:39
Dortmund
Ein Aufholen von 4 Min würde ausreichen.
111 | 162
Umstieg in den RB 54
Hörde Unna
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
Gesamtfahrzeit: 1:27 h
18:32
18:17 (+0:09)
18:08
18:09 (+0:10)
17:58
17:27 (+0:15)
17:12
18:39
18:27 (+0:08)
18:19
Dortmund
112 | 162
18:27 (+0:08)
18:19
Pünktlich trotz anfänglicher Verspätung
17:27 (+0:15)
17:12
Hörde Unna
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
Gesamtfahrzeit: 1:27 h
18:32
18:39
18:17 (+0:09)
18:08
18:09 (+0:10)
17:58
Dortmund
113 | 162
-15
-10
-5
0
5
10
15
20
25
30
Diagrammtitel
Aufholvermögen des RE13 um 17:12 ab Düsseldorf
Bei den um ≥ 5 Min verspäteten Fahrten machte der RE 13
in 67% der Fälle wieder Minuten gut: Ø 6,7 / Median 3,5
Verspätung in Düsseldorf (≥ 5 Min)
Verspätung in Unna
Differenz
114 | 162
18:32 (+0:13)
18:19
Hörde Unna
Dortmund
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
19:32
Gesamtfahrzeit: 2:27 (+1:00)
19:39
17:27 (+0:15)
17:12
Würde der Zug die Aufholjagd nicht schaffen…
Dortmund
115 | 162
18:34 (+0:15)
18:19
Hörde Unna
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
19:32
Gesamtfahrzeit: 2:27 (+1:00)
19:39
17:27 (+0:15)
17:12
Würde der Zug die Aufholjagd nicht schaffen…
18:13 (+0:15)
17:58
Dortmund
116 | 162
18:34 (+0:15)
18:19
… gäbe es die drittschnellste Verbindung (V3)
17:12
Hörde
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
Gesamtfahrzeit: 2:05 (+0:38)
Unna
19:09
19:17
18:37
18:13 (+0:15)
17:58 18:28
18:24 (+0:17)
18:07
Dortmund
117 | 162
V3 klappt auch bei 17 Min. Verspätung
17:12
Hörde
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
Gesamtfahrzeit: 2:05 (+0:38)
Unna
19:09
18:28
19:17
18:37
18:13 (+0:15)
17:58
Dortmund
118 | 162
V3: Genügend Umsteigezeit in Fröndenberg
17:12
Hörde
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
Gesamtfahrzeit: 2:05 (+0:38)
Unna
19:09
18:28
19:17
18:37
18:13 (+0:15)
17:58
Dortmund
119 | 162
18:13 (+0:15)
17:58
V3 ist die wesentlich bessere Wahl als V2
17:12
Hörde
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
Gesamtfahrzeit: 2:05 (+0:38)
Unna
19:09
18:37
18:28
19:17
Dortmund
120 | 162
{
V1
V2
V1
Auskunft der Bahn
{
{
121 | 162
Auskunft der Bahn
V1
V3
V1
{
{
{
122 | 162
Erste Untersuchungen mit öffentlichen Bahndaten
dbf.finalrewind.org
Service
ca. ½ Mio. Datensätze ca. 200.000 Fahrten
Daten
sammeln
Anforderungs-
& Projekt-
Management
Data
Thinking
Daten
bereinigen
Explorative
Analyse
Daten
visualisieren
Data Mining
Statistik
Proof of Concept
„Data Lake“:
MongoDB
Präpariert:
MongoDB
Ideation: Wie könnte man die BahnApp verbessern?
123 | 162
Die Bahntracker-App
Hey Bahntracker, ich möchte
jetzt gern nach Frömern.
Bahntracker
Lieber Fahrgast,
Du kannst mich mit Hey Bahntracker
ansprechen.
Wie kann ich Dir helfen?
124 | 162
Benutze den RE13 planmäßig um 17:12 Uhr
von Gleis 7. Ankunft um 18:40.
Achtung: Der Zug hat 12 Minuten
Verspätung. Der Anschluss in den RB 54 in
Unna wird voraussichtlich erreicht.
Alternative: Umstieg in Schwerte in den RE
57 mit einer Ankunft um 19:17 Uhr
Du wirst ggf. über den Umstieg in Schwerte
rechtzeitig von mir informiert.
Die Bahntracker-App
Hey Bahntracker, ich möchte
jetzt gern nach Frömern.
17:24
Falls Anschluss in Unna gefährdet:
Ticket kaufen
Ticket kaufen
Bahntracker
Du: „Ich möchte jetzt gern nach Frömern.“
Meine Empfehlung:
Gleis 7
Gleis 7
Schwerte
125 | 162
Anschluss wartet, bitte umsteigen
126 | 162
Von den ersten Untersuchungen…
dbf.finalrewind.org
Service
ca. ½ Mio. Datensätze ca. 200.000 Fahrten
Daten
sammeln
Anforderungs-
& Projekt-
Management
Data
Thinking
Daten
bereinigen
Explorative
Analyse
Daten
visualisieren
Data Mining
Statistik
Proof of Concept
„Data Lake“:
MongoDB
Präpariert:
MongoDB
127 | 162
… bis hin zu einem produktionsreifen System
Data Engineering
Data Analysis
Machine Learning
Data Science
Daten
sammeln
Anforderungs-
& Projekt-
Management
Data
Thinking
Daten
bereinigen
Explorative
Analyse
Model-
lierung
Deploy-
ment
Qualitäts-
sicherung
MLOps
Produktion
128 | 162
Die Bahntracker-App
Hey Bahntracker, ich möchte
jetzt gern nach Frömern.
Bahntracker
Lieber Fahrgast,
Du kannst mich mit Hey Bahntracker
ansprechen.
Wie kann ich Dir helfen?
129 | 162
Benutze den RE13 planmäßig um 17:12 Uhr
von Gleis 7. Ankunft um 18:40.
Achtung: Der Zug hat 12 Minuten
Verspätung. Der Anschluss in den RB 54 in
Unna wird voraussichtlich erreicht.
Alternative: Umstieg in Schwerte in den RE
57 mit einer Ankunft um 19:17 Uhr
Du wirst ggf. über den Umstieg in Schwerte
rechtzeitig von mir informiert.
Die Bahntracker-App
Hey Bahntracker, ich möchte
jetzt gern nach Frömern.
17:24
Falls Anschluss in Unna gefährdet:
Ticket kaufen
Ticket kaufen
Bahntracker
Du: „Ich möchte jetzt gern nach Frömern.“
Meine Empfehlung:
Gleis 7
Gleis 7
Schwerte
130 | 162
Ziel: Finde die beste Alternative: V1, V2, V3
131 | 162
V1: Bekomme ich voraussichtlich den Anschluss in Unna?
17:12
18:19 18:32
Hörde
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
Unna
18:39
Dortmund
?
132 | 162
V2: Bekomme ich voraussichtlich die Anschlüsse in
Dortmund und Fröndenberg?
18:15 18:41
Hörde
Schwerte Fröndenberg
Unna
Hagen
17:22
Frömern
Dortmund
Düsseldorf
19:17
19:09
19:05
?
?
133 | 162
V3: Bekomme ich voraussichtlich die Anschlüsse in
Schwerte und Fröndenberg?
17:12
18:07 18:28
Hörde
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
Unna
18:37
19:17
19:09
Dortmund
?
?
134 | 162
Anbindung an das Backend
Bahn-
daten
Bahntracker-Backend Bahntracker-App
ZN 20087
Unna
Min.
Vorher-
sagen
Abfahr-
ten
?
17:20:34
Filter
ZN 20087
Schwerte
ZN 10719
Fröndenberg
ZN 10773
Fröndenberg
Verspätung
ZN 26829
Dortmund
135 | 162
ZN Bahnhof Zeiten
20087 Düsseldorf 17:12 +12
Unna 18:19 +10
14859 Unna 18:32
Frömern 18:39
ZN Bahnhof Zeiten
26829 Düsseldorf 17:22 +3
Dortmund 18:15 +12
10773 Dortmund 18:41 +2
Fröndenberg 19:05 +6
14862 Fröndenberg 19:09
Frömern 19:19
ZN Bahnhof Zeiten
20087 Düsseldorf 17:12 +12
Schwerte 18:07 +10
10719 Schwerte 18:28 +2
Fröndenberg 18:37 +2
Fröndenberg 19:09
Frömern 19:19
V1
V2
V3
Prognosen
136 | 162
Anbindung an das Backend
Bahn-
daten
Bahntracker-Backend Bahntracker-App
ZN 20087
Unna
Min.
Vorher-
sagen
Abfahr-
ten
?
17:20:34
Filter
ZN 20087
Schwerte
ZN 10719
Fröndenberg
Verspätung
137 | 162
V1: Anschluss in Unna
18:19 18:32
Hörde
Schwerte
Hagen
Düsseldorf
Fröndenberg
Frömern
Gesamtfahrzeit: 1:27
Unna
18:39
Dortmund
ZN: 20087
ZN: 14859
17:24 (+0:12)
17:12
?
17:20:34
138 | 162
V1: Anschluss in Unna?
18:19 18:32
Düsseldorf
Unna
ZN: 20087
17:24 (+0:12)
17:12
?
17:20:34
139 | 162
V1: Anschluss in Unna?
Input Output
Information
Zugnummer
Bahnhof vorauss. Verspätung
ZN 20087
Unna
Düsseldorf
ZN: 20087
aktuelle Daten:
• Verspätung bei der Abfahrt
• Baustellen
• Auslastung
historische Daten: Ferienzeit
18:19 18:32
Unna
?
17:24 (+0:12)
17:12
17:20:34
10 Min. (67%)
140 | 162
Schnittstelle „Verspätungsprognose“
Output
vorauss. Verspätung
10 Min. (67%)
Düsseldorf
ZN: 20087
Unna
17:24 (+0:12)
17:12
17:20:34 18:29 (+0:10)
18:19 19:32
141 | 162
Schnittstelle „Verspätungsprognose“
Output
vorauss. Verspätung
11 Min. (70%)
Unna
17:24:21 18:30 (+0:11)
18:19 19:32
142 | 162
Schnittstelle „Verspätungsprognose“
Output
vorauss. Verspätung
10 Min. (73%)
Unna
17:28:31 18:29 (+0:10)
18:19 19:32
143 | 162
Schnittstelle „Verspätungsprognose“
Output
vorauss. Verspätung
10 Min. (75%)
Unna
17:32:28 18:29 (+0:10)
18:19 19:32
144 | 162
Schnittstelle „Verspätungsprognose“
Output
vorauss. Verspätung
10 Min. (77%)
Unna
17:36:25 18:29 (+0:10)
18:19 19:32
145 | 162
Aktuelle Verspätungen meiner Fahrt verfolgen
146 | 162
Schnittstelle „Verspätungsprognose“
Output
vorauss. Verspätung
9 Min. (79%)
Wuppertal
ZN: 20087
Unna
17:43 (+0:11)
17:32
17:40:35 18:28 (+0:09)
18:19 18:32
147 | 162
Entscheidung: Weiter mit dem RE 13 oder Umstieg?
148 | 162
Entscheidung: Weiter mit dem RE 13
Output
vorauss. Verspätung
8 Min. (95%)
Schwerte
ZN: 20087
Unna
18:16 (+0:08)
18:08
18:14:31 18:27 (+0:08)
18:19 18:32
149 | 162
Schnittstelle „Verspätungsprognose“
Output
vorauss. Verspätung
8 Min. (97%)
Unna
18:18:27 18:27 (+0:08)
18:19 18:32
150 | 162
Fast am Ziel …
Output
vorauss. Verspätung
8 Min. (99%)
Unna
18:24:33 18:27 (+0:08)
18:19 18:32
151 | 162
Zufrieden am Ziel …
152 | 162
Zufrieden am Ziel
153 | 162
[Bahnfahrtaerger]
https://www.test.de/Bahnfahren-Was-nervt-Sie-Was-finden-Sie-toll-5316019-0/
[BoersenwertAlphabet]
https://www.sueddeutsche.de/wirtschaft/google-alphabet-boersenwert-1.4760565
[BoersenwertFacebook]
https://www.business-punk.com/2021/06/facebook-ist-jetzt-ueber-eine-billionen-dollar-wert/
[DallE2]
https://openai.com/dall-e-2/
[DataMining]
https://novustat.com/statistik-blog/data-mining-methoden-ueberblick.html
[DatenvolumenWeltweit1] https://de.statista.com/statistik/daten/studie/267974/umfrage/prognose-zum-
weltweit-generierten-datenvolumen
[DatenvolumenWeltweit2]
https://www.wirtschaftsforum.de/expertenwissen/was-ist-denn-data-science/big-data-oder-viel-hilft-viel
Referenzen
154 | 162
[FHKiel]
https://kuenstliche-intelligenz.sh/de/anomalie-detektion
[Fraunhofer]
https://www.idmt.fraunhofer.de/de/institute/projects-products/projects/ki-musik4-0.html
[Imagen]
https://pbs.twimg.com/media/FQYzvNKXMAoMPgU?format=jpg
[Implantat]
https://me.engin.umich.edu/news-events/news/toward-smart-dental-implants/
[Industr]
https://www.industr.com/de/audio-ueberwachung-gegen-leckagen-in-pneumatischen-antrieben-
2653499
[Internetverbrauch]
https://de.statista.com/statistik/daten/studie/3564/umfrage/durchschnittliches-datenvolumen-pro-
anschluss-seit-2001
[KIMedizin]
https://global-uploads.webflow.com/5d3ec351b1eba4332d213004/
5d473cc1f0c5a7e8655a827f_AI_In_Diagnostics.png
Referenzen
155 | 162
[MobilesInternet]
https://de.statista.com/statistik/daten/studie/3506/umfrage/monatliches-datenvolumen-pro-
mobilfunknutzer-in-deutschland
[LebensraumWasser]
https://www.lebensraumwasser.com/wie-schau-auf-die-rohre-die-wasserversorgung-wahrnehmbar-
macht/
[LeckagenMitKI]
https://www.vulkan-shop.de/fruherkennung-und-vorortung-von-leckagen-mit-ki-basierter-software
[Medikamente1]
https://t3n.de/consent?redirecturl=%2Fnews%2Fvollstaendig-ki-entwickeltes-1248880%2F
[Medikamente2]
https://www.handelsblatt.com/technik/medizin/neue-medikamente-pharmaindustrie-nutzt-kuenstliche-
intelligenz-zur-arzneimittelforschung/28161478.html
Referenzen
156 | 162
[PipePredict]
https://www.fr.de/wirtschaft/hessischer-gruenderpreis-pipe-predict-mit-kuenstlicher-intelligenz-
rohrbruechen-vorbeugen-91074039.html
[Segmentierung1]
https://www.horizont.net/planung-analyse/nachrichten/Segmentierung---Gezielte-Kundenansprache-
statt-Giesskannenprinzip-152172
[Segmentierung2]
https://rp-online.de/leben/gesundheit/psychologie/welcher-typ-mann-bin-ich-schosshund-terrain-
markierer-oder-macho_aid-17660665
[Segmentierung3]
https://news.paradisi.de/thema/vom-macho-bis-zum-schosshund-studie-typologisiert-die-neuen-
rollenvorbilder-des-mannes-114380/
[Siemens]
https://new.siemens.com/de/de/unternehmen/stories/industrie/2021/va-syd-wasser-kunstliche-
intelligenz-ki-cloud-schweden.html
Referenzen
157 | 162
Referenzen
[SmartCity1]
https://www.fraunhofer.de/de/presse/presseinformationen/2022/februar-2022/kuenstliche-intelligenz-
steuert-ampelanlagen.html
[SmartCity2]
https://www.strassen.nrw.de/de/presse/meldungen/meldung/smarte-ampeln-fuer-den-verkehr-strassen-
nrw-beteiligt-sich-an-forschungsprojekt-zur-verbesserung-der-ampelschaltung-mit-kuenstli.html
[UniBielefeld]
https://pub.uni-bielefeld.de/record/2962650
[Wasserverluste]
https://www.hawle.com/de/hawle-knowledge/basiswissen/wasserverluste-in-rohrnetzen
[WertvollsteUnternehmen]
https://de.statista.com/infografik/25062/wertvollste-unternehmen-der-welt-nach-marktkapitalisierung/
Kapitel 1 | Kapitel 2 | Referenzen | Weiterführende Literatur | Ende
158 | 162
Bildernachweise
https://publicdomainvectors.org/de/kostenlose-vektorgrafiken/Handy-in-der-hand/81183.html
(S. 123/124, 128/129, 134/136)
https://pixabay.com/de/illustrations/tabelle-grau-schwarz-zeilen-reihen-341442/ (S. 14/15)
https://imgbin.com/download/d2K4ZMA8 (S. 17)
https://en.wikipedia.org/wiki/File:Linear-regression.svg (S. 126)
https://neurohive.io/wp-content/uploads/2019/01/dd-e1547642312239.jpg (S. 19)
https://imgbin.com/download/YtnaPtD2 (S. 30)
https://statistikguru.de/wp-content/uploads/mnist_zahlen.png (S. 18)
https://global-
uploads.webflow.com/5d3ec351b1eba4332d213004/5d473cc1f0c5a7e8655a827f_AI_In_Diagnosti
cs.png (S. 25)
https://www.flickr.com/photos/arselectronica/50373725108 (S. 28)
https://pixabay.com/de/illustrations/architektur-geb%C3%A4ude-krankenhaus-5749784/ (S. 47)
Kapitel 1 | Kapitel 2 | Referenzen | Weiterführende Literatur | Ende
159 | 162
Bildernachweise
https://imgbin.com/png/B8ZCtvNe/il-progressonline-voluntary-association-logo-black-png (S.
11-17, 23, 54, 55, 134, 139-144, 146, 148-150)
https://cdn.openai.com/research-covers/musenet/2x-no-mark.jpg (S. 43)
https://pixabay.com/de/photos/apple-imac-trackpad-homepod-mac-5951013/?download (S. 48-
53, 67-69)
https://en.wikipedia.org/wiki/File:TSP_tour_from_an_1832_book.svg (S. 57)
https://imgbin.com/download/tw1WUcYZ (S. 22)
https://imgbin.com/download/uEUGtb0Z (S. 22)
https://imgbin.com/download/UzVuuFA1 (S. 22)
Kapitel 1 | Kapitel 2 | Referenzen | Weiterführende Literatur | Ende
160 | 162
Impulsvorträge für Ihr Unternehmen
Überblick über das gesamte Angebot an Impulsvorträgen unter:
www.iks-gmbh.com/impulsvortraege
Ihr Nutzen:
u Unabhängiges, aktuelles Expertenwissen.
u Individuell auf Ihr Publikum und Ihr Unternehmen zugeschnittene Vorträge.
u Referenten mit langjähriger und branchenübergreifender Expertise in der IT-Beratung.
u Praxisnahe Vorträge, die aus Projektarbeit entstanden sind, frei von Produktwerbung.
u Ideale Ergänzung für Ihre Führungskräftetreffen, Abteilungsmeetings, Hausmessen,
Innovation Days, Konferenzen, Open Spaces, Kick-off-Meetings oder Zukunftsworkshops.
WWW.IKS-GMBH.COM
Thementag 2022 01 Verpassen Sie nicht den Anschluss.pdf

Weitere ähnliche Inhalte

Ähnlich wie Thementag 2022 01 Verpassen Sie nicht den Anschluss.pdf

User centered advertising - intellIAd Bid Management & Omnichannel Tracking
User centered advertising - intellIAd Bid Management & Omnichannel TrackingUser centered advertising - intellIAd Bid Management & Omnichannel Tracking
User centered advertising - intellIAd Bid Management & Omnichannel TrackingMischa Rürup
 
Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...
Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...
Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...Praxistage
 
Analytics - die 3 entscheidenden Faktoren
Analytics - die 3 entscheidenden FaktorenAnalytics - die 3 entscheidenden Faktoren
Analytics - die 3 entscheidenden FaktorenADVECTO
 
BAT40 CCSourcing Auge Zerndt Artificial Intelligence an der Kundenschnittstelle
BAT40 CCSourcing Auge Zerndt Artificial Intelligence an der KundenschnittstelleBAT40 CCSourcing Auge Zerndt Artificial Intelligence an der Kundenschnittstelle
BAT40 CCSourcing Auge Zerndt Artificial Intelligence an der KundenschnittstelleBATbern
 
Jan Christopher Brandt: Innovations- und Effizienzsprünge in der chemischen I...
Jan Christopher Brandt: Innovations- und Effizienzsprünge in der chemischen I...Jan Christopher Brandt: Innovations- und Effizienzsprünge in der chemischen I...
Jan Christopher Brandt: Innovations- und Effizienzsprünge in der chemischen I...InboundLabs (ex mon.ki inc)
 
Inventx - Präsentation Innovationstag Digital Banking Liechtenstein 2015
Inventx - Präsentation Innovationstag Digital Banking Liechtenstein 2015Inventx - Präsentation Innovationstag Digital Banking Liechtenstein 2015
Inventx - Präsentation Innovationstag Digital Banking Liechtenstein 2015Roman Dinkel
 
Process Mining: Konzept und Anwendung
Process Mining: Konzept und AnwendungProcess Mining: Konzept und Anwendung
Process Mining: Konzept und AnwendungMichael Groeschel
 
Das Erwachen der Roboter im Content Marketing.
Das Erwachen der Roboter im Content Marketing.Das Erwachen der Roboter im Content Marketing.
Das Erwachen der Roboter im Content Marketing.Michael Schmitt
 
Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018
Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018
Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018Digital Analytics Institute
 
Digitalisierung in deutschen Traditionsunternehmen
Digitalisierung in deutschen TraditionsunternehmenDigitalisierung in deutschen Traditionsunternehmen
Digitalisierung in deutschen Traditionsunternehmenintelligent-views-gmbh
 
advanced store connect workshop
advanced store connect workshopadvanced store connect workshop
advanced store connect workshopadvanced store
 
Verstehen Sie Ihre Kunden - Reife von Unternehmen
Verstehen Sie Ihre Kunden - Reife von UnternehmenVerstehen Sie Ihre Kunden - Reife von Unternehmen
Verstehen Sie Ihre Kunden - Reife von UnternehmenDigital Analytics Institute
 
Herausforderungen & Erfolgsfaktoren bei der Konzeption und Implementierung vo...
Herausforderungen & Erfolgsfaktoren bei der Konzeption und Implementierung vo...Herausforderungen & Erfolgsfaktoren bei der Konzeption und Implementierung vo...
Herausforderungen & Erfolgsfaktoren bei der Konzeption und Implementierung vo...Jan Rodig
 
Service Design - Gestaltung der Digitalen Transformation
Service Design - Gestaltung der Digitalen TransformationService Design - Gestaltung der Digitalen Transformation
Service Design - Gestaltung der Digitalen TransformationProf. Dr. Alexander Maedche
 
Smart Data Engineering: Erfolgsfaktor für die digitale Transformation
Smart Data Engineering: Erfolgsfaktor für die digitale TransformationSmart Data Engineering: Erfolgsfaktor für die digitale Transformation
Smart Data Engineering: Erfolgsfaktor für die digitale TransformationBoris Otto
 
Von der Wiege bis zur Bahre?
Von der Wiege bis zur Bahre?Von der Wiege bis zur Bahre?
Von der Wiege bis zur Bahre?Thomas Dietz
 
Digitaler Handel
Digitaler HandelDigitaler Handel
Digitaler Handel42medien
 
Online Marketing Konzept einer B2B Veranstaltungsreihe
Online Marketing Konzept einer B2B VeranstaltungsreiheOnline Marketing Konzept einer B2B Veranstaltungsreihe
Online Marketing Konzept einer B2B VeranstaltungsreiheMarco Remmel
 

Ähnlich wie Thementag 2022 01 Verpassen Sie nicht den Anschluss.pdf (20)

User centered advertising - intellIAd Bid Management & Omnichannel Tracking
User centered advertising - intellIAd Bid Management & Omnichannel TrackingUser centered advertising - intellIAd Bid Management & Omnichannel Tracking
User centered advertising - intellIAd Bid Management & Omnichannel Tracking
 
Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...
Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...
Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...
 
Analytics - die 3 entscheidenden Faktoren
Analytics - die 3 entscheidenden FaktorenAnalytics - die 3 entscheidenden Faktoren
Analytics - die 3 entscheidenden Faktoren
 
BAT40 CCSourcing Auge Zerndt Artificial Intelligence an der Kundenschnittstelle
BAT40 CCSourcing Auge Zerndt Artificial Intelligence an der KundenschnittstelleBAT40 CCSourcing Auge Zerndt Artificial Intelligence an der Kundenschnittstelle
BAT40 CCSourcing Auge Zerndt Artificial Intelligence an der Kundenschnittstelle
 
Jan Christopher Brandt: Innovations- und Effizienzsprünge in der chemischen I...
Jan Christopher Brandt: Innovations- und Effizienzsprünge in der chemischen I...Jan Christopher Brandt: Innovations- und Effizienzsprünge in der chemischen I...
Jan Christopher Brandt: Innovations- und Effizienzsprünge in der chemischen I...
 
Crmexpo 2014 stuttgart
Crmexpo 2014 stuttgartCrmexpo 2014 stuttgart
Crmexpo 2014 stuttgart
 
Inventx - Präsentation Innovationstag Digital Banking Liechtenstein 2015
Inventx - Präsentation Innovationstag Digital Banking Liechtenstein 2015Inventx - Präsentation Innovationstag Digital Banking Liechtenstein 2015
Inventx - Präsentation Innovationstag Digital Banking Liechtenstein 2015
 
Innovation in der Instandhaltung - Motor für die Zukunft
Innovation in der Instandhaltung - Motor für die ZukunftInnovation in der Instandhaltung - Motor für die Zukunft
Innovation in der Instandhaltung - Motor für die Zukunft
 
Process Mining: Konzept und Anwendung
Process Mining: Konzept und AnwendungProcess Mining: Konzept und Anwendung
Process Mining: Konzept und Anwendung
 
Das Erwachen der Roboter im Content Marketing.
Das Erwachen der Roboter im Content Marketing.Das Erwachen der Roboter im Content Marketing.
Das Erwachen der Roboter im Content Marketing.
 
Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018
Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018
Verstehen Sie Ihre Kunden Meetup Köln 08.10.2018
 
Digitalisierung in deutschen Traditionsunternehmen
Digitalisierung in deutschen TraditionsunternehmenDigitalisierung in deutschen Traditionsunternehmen
Digitalisierung in deutschen Traditionsunternehmen
 
advanced store connect workshop
advanced store connect workshopadvanced store connect workshop
advanced store connect workshop
 
Verstehen Sie Ihre Kunden - Reife von Unternehmen
Verstehen Sie Ihre Kunden - Reife von UnternehmenVerstehen Sie Ihre Kunden - Reife von Unternehmen
Verstehen Sie Ihre Kunden - Reife von Unternehmen
 
Herausforderungen & Erfolgsfaktoren bei der Konzeption und Implementierung vo...
Herausforderungen & Erfolgsfaktoren bei der Konzeption und Implementierung vo...Herausforderungen & Erfolgsfaktoren bei der Konzeption und Implementierung vo...
Herausforderungen & Erfolgsfaktoren bei der Konzeption und Implementierung vo...
 
Service Design - Gestaltung der Digitalen Transformation
Service Design - Gestaltung der Digitalen TransformationService Design - Gestaltung der Digitalen Transformation
Service Design - Gestaltung der Digitalen Transformation
 
Smart Data Engineering: Erfolgsfaktor für die digitale Transformation
Smart Data Engineering: Erfolgsfaktor für die digitale TransformationSmart Data Engineering: Erfolgsfaktor für die digitale Transformation
Smart Data Engineering: Erfolgsfaktor für die digitale Transformation
 
Von der Wiege bis zur Bahre?
Von der Wiege bis zur Bahre?Von der Wiege bis zur Bahre?
Von der Wiege bis zur Bahre?
 
Digitaler Handel
Digitaler HandelDigitaler Handel
Digitaler Handel
 
Online Marketing Konzept einer B2B Veranstaltungsreihe
Online Marketing Konzept einer B2B VeranstaltungsreiheOnline Marketing Konzept einer B2B Veranstaltungsreihe
Online Marketing Konzept einer B2B Veranstaltungsreihe
 

Mehr von IKS Gesellschaft für Informations- und Kommunikationssysteme mbH

Mehr von IKS Gesellschaft für Informations- und Kommunikationssysteme mbH (20)

Es wird Zeit KI zu nutzen - Wie es mit Azure KI Services und .NET MAUI gelingt
Es wird Zeit KI zu nutzen - Wie es mit Azure KI Services und .NET MAUI gelingtEs wird Zeit KI zu nutzen - Wie es mit Azure KI Services und .NET MAUI gelingt
Es wird Zeit KI zu nutzen - Wie es mit Azure KI Services und .NET MAUI gelingt
 
Thementag 2023 06 Dieses Mal machen wir alles richtig - 9 Hacks für wandelbar...
Thementag 2023 06 Dieses Mal machen wir alles richtig - 9 Hacks für wandelbar...Thementag 2023 06 Dieses Mal machen wir alles richtig - 9 Hacks für wandelbar...
Thementag 2023 06 Dieses Mal machen wir alles richtig - 9 Hacks für wandelbar...
 
Thementag 2023 04 Lindern, heilen oder gar fit machen.pdf
Thementag 2023 04 Lindern, heilen oder gar fit machen.pdfThementag 2023 04 Lindern, heilen oder gar fit machen.pdf
Thementag 2023 04 Lindern, heilen oder gar fit machen.pdf
 
Thementag 2023 05 Wer zu spät kommt, den bestraft das Leben - Modernisierung ...
Thementag 2023 05 Wer zu spät kommt, den bestraft das Leben - Modernisierung ...Thementag 2023 05 Wer zu spät kommt, den bestraft das Leben - Modernisierung ...
Thementag 2023 05 Wer zu spät kommt, den bestraft das Leben - Modernisierung ...
 
Thementag 2023 01 Mut zur Modernisierung - ein Praxisbeispiel.pdf
Thementag 2023 01 Mut zur Modernisierung - ein Praxisbeispiel.pdfThementag 2023 01 Mut zur Modernisierung - ein Praxisbeispiel.pdf
Thementag 2023 01 Mut zur Modernisierung - ein Praxisbeispiel.pdf
 
Thementag 2023 03 Einführung in die Softwaremodernisierung.pdf
Thementag 2023 03 Einführung in die Softwaremodernisierung.pdfThementag 2023 03 Einführung in die Softwaremodernisierung.pdf
Thementag 2023 03 Einführung in die Softwaremodernisierung.pdf
 
Thementag 2022 04 ML auf die Schiene gebracht.pdf
Thementag 2022 04 ML auf die Schiene gebracht.pdfThementag 2022 04 ML auf die Schiene gebracht.pdf
Thementag 2022 04 ML auf die Schiene gebracht.pdf
 
Thementag 2022 03 Ein Modell ist trainiert - und jetzt.pdf
Thementag 2022 03 Ein Modell ist trainiert - und jetzt.pdfThementag 2022 03 Ein Modell ist trainiert - und jetzt.pdf
Thementag 2022 03 Ein Modell ist trainiert - und jetzt.pdf
 
Thementag 2022 02 Der Deutschen Bahn in die Karten geschaut.pdf
Thementag 2022 02 Der Deutschen Bahn in die Karten geschaut.pdfThementag 2022 02 Der Deutschen Bahn in die Karten geschaut.pdf
Thementag 2022 02 Der Deutschen Bahn in die Karten geschaut.pdf
 
Daten / Information / Wissen - Möglichkeiten und Grenzen des Machine Learning
Daten / Information / Wissen - Möglichkeiten und Grenzen des Machine LearningDaten / Information / Wissen - Möglichkeiten und Grenzen des Machine Learning
Daten / Information / Wissen - Möglichkeiten und Grenzen des Machine Learning
 
Erste Schritte in die neue Welt-So gelingt der Einstieg in Big Data und Machi...
Erste Schritte in die neue Welt-So gelingt der Einstieg in Big Data und Machi...Erste Schritte in die neue Welt-So gelingt der Einstieg in Big Data und Machi...
Erste Schritte in die neue Welt-So gelingt der Einstieg in Big Data und Machi...
 
Darf es ein bisschen mehr sein - Konzepte und Strategien zur Bewältigung groß...
Darf es ein bisschen mehr sein - Konzepte und Strategien zur Bewältigung groß...Darf es ein bisschen mehr sein - Konzepte und Strategien zur Bewältigung groß...
Darf es ein bisschen mehr sein - Konzepte und Strategien zur Bewältigung groß...
 
Big Data und Machine Learning - Wer braucht das schon!?
Big Data und Machine Learning - Wer braucht das schon!?Big Data und Machine Learning - Wer braucht das schon!?
Big Data und Machine Learning - Wer braucht das schon!?
 
Erste Schritte in die neue Welt - So gelingt der Einstieg in Big Data und Mac...
Erste Schritte in die neue Welt - So gelingt der Einstieg in Big Data und Mac...Erste Schritte in die neue Welt - So gelingt der Einstieg in Big Data und Mac...
Erste Schritte in die neue Welt - So gelingt der Einstieg in Big Data und Mac...
 
Darf es ein bisschen mehr sein - Konzepte Strategien zur Bewältigung großer u...
Darf es ein bisschen mehr sein - Konzepte Strategien zur Bewältigung großer u...Darf es ein bisschen mehr sein - Konzepte Strategien zur Bewältigung großer u...
Darf es ein bisschen mehr sein - Konzepte Strategien zur Bewältigung großer u...
 
Daten / Information / Wissen - Möglichkeiten und Grenzen des Machine Learning
Daten / Information / Wissen - Möglichkeiten und Grenzen des Machine LearningDaten / Information / Wissen - Möglichkeiten und Grenzen des Machine Learning
Daten / Information / Wissen - Möglichkeiten und Grenzen des Machine Learning
 
Big Data und Machine Learning - Wer braucht das schon!?
Big Data und Machine Learning - Wer braucht das schon!?Big Data und Machine Learning - Wer braucht das schon!?
Big Data und Machine Learning - Wer braucht das schon!?
 
Daten / Information / Wissen - Möglichkeiten und Grenzen des Machine Learning
Daten / Information / Wissen - Möglichkeiten und Grenzen des Machine LearningDaten / Information / Wissen - Möglichkeiten und Grenzen des Machine Learning
Daten / Information / Wissen - Möglichkeiten und Grenzen des Machine Learning
 
Darf es ein bisschen mehr sein - Konzepte und Strategien zur Bewältigung groß...
Darf es ein bisschen mehr sein - Konzepte und Strategien zur Bewältigung groß...Darf es ein bisschen mehr sein - Konzepte und Strategien zur Bewältigung groß...
Darf es ein bisschen mehr sein - Konzepte und Strategien zur Bewältigung groß...
 
Big Data und Machine Learning - Wer braucht das schon!
Big Data und Machine Learning - Wer braucht das schon!Big Data und Machine Learning - Wer braucht das schon!
Big Data und Machine Learning - Wer braucht das schon!
 

Thementag 2022 01 Verpassen Sie nicht den Anschluss.pdf

  • 2. 2 | 162 Agenda Data Science und Machine Learning Ideen aus dem Business Aromatic: Ideen für das Business Der Bahntracker
  • 3. 3 | 162 Agenda Data Science und Machine Learning Ideen aus dem Business Aromatic: Ideen für das Business Der Bahntracker
  • 4. 4 | 162 Am Anfang war das Bit
  • 5. 5 | 162 Datenvolumen Byte = 8 Bit Kibibyte (KiB) = 1024 Byte Mebibyte (MiB) = 1.048.576 Byte Gibibyte (GiB) = 1.073.741.824 Byte Tebibyte (TiB) = 1.099.511.627.776 Byte Pebibyte (PiB) = 1.125.899.906.842.624 Byte Exbibyte (EiB) = 1.152.921.504.606.846.976 Byte Zebibyte (ZiB) = 1.180.591.620.717.411.303.424 Byte Yobibyte (YiB) = 1.208.925.819.614.629.174.706.176 Byte · 2,5 (täglich) · 54 (weltweit) · 2 alle drei Jahre Quelle: [DatenvolumenWeltweit1/2]
  • 6. 6 | 162 Das Internet ist nur ein Hype (Bill Gates 1993) Quelle: [Internetverbrauch]
  • 7. 7 | 162 Der Wert von Daten 17.01.2020: Google-Mutterkonzern Alphabet knackt die Eine-Billion-Dollar- Grenze [BoersenwertAlphabet] 28.6.2021: Facebook ist jetzt über eine Billion Dollar wert. [BoersenwertFacebook] (Internet-)Suche nach den „großen Datenkraken“: u Alphabet u Meta (Facebook) u Amazon u Apple u Microsoft Quelle: [WertvollsteUnternehmen]
  • 10. 10 | 162 Data-Science-Methoden sind Verfahren, die aus (Big) Data unbekannte, neuartige, nützliche und wichtige Informationen „aufspüren“, um Entscheidungen zu treffen oder Vorhersagen zu machen – verstärkt mithilfe von maschinellem Lernen.
  • 11. 11 | 162 Data Science: Implementiere die Berechnung Input Output (Big) Data unbekannte, neuartige, nützliche, wichtige Information ? Hist. Info Fachwissen
  • 12. 12 | 162 Data Science: Wettervorhersage Input Output unbekannte, neuartige, nützliche, wichtige Information ? Hist. Info Datum: 18.8.2022 Uhrzeit: 12:00 Ort: Hilden Temperatur: 22°C Niederschlag: 60% Luftfeuchte: 56% Wind: 11 km/h Wetter-Modell (125 PiB), 130 TB/Tag Fachwissen
  • 13. 13 | 162 Galileos freier Fall Zeit (t) Höhe (h) 0 0 1 5 2 20 3 45 4 80 5 125 6 210 Input Output ?
  • 14. 14 | 162 Ø-Gewicht im Alter von … Input Output ? Alter Gewicht Statistik
  • 15. 15 | 162 Trägt mein Baum Früchte? Input Output ? Alter, Sorte, Boden ja / nein Software
  • 16. 16 | 162 Handschrifterkennung Input Output ? ML-Verfahren 4 4 5 9 6 4 9 7 0 7 3 0 1 3 4
  • 17. 17 | 162 Algorithmische versus ML-Verfahren Input Output Software Analyse Input Output Daten aus (früheren) Berechnungen ML-Verfahren Programmieren Trainieren Anforderungen Beispiele Parameter
  • 20. 20 | 162 Maschinelle Lernverfahren „programmieren“ sich selbstständig anhand großer Datenmengen und sind in der Lage Strukturen z. T. komplexer Natur zu erkennen.
  • 21. 21 | 162 Agenda DataScience und Machine Learning Ideen aus dem Business Aromatic: Ideen für das Business Der Bahntracker
  • 22. 22 | 162 Data Science und ML sind vielfältig einsetzbar Kunde Marketing CRM Prozess Produktion Wartung Logistik Produkt Funktionalität Qualität
  • 23. 23 | 162 Kundensegmente Input Output Datenbank Dateien Services Kundenstammdaten, Kaufverhalten Termindisziplin, Nutzungshäufigkeit, Reklamationen, Zahlungsmoral, demo- & geographische Daten, Scores, Preise, Konkurrenz, Trends Kundensegement ML-Verfahren KN 4711 Peter Maier Geschlecht: M Schoßhund
  • 24. 24 | 162 Gezielte Werbung für einen Mann Beispiel: Schoßhunde wollen nicht von Schoßhunden beworben werden. Quellen: [Segmentierung1], [Segmentierung2], [Segmentierung3]. Populäre Bezeichnungen im Marketing
  • 25. 25 | 162 Krankheiten diagnostizieren Medikamente schneller entwickeln: DeepMind, Exscientia (DSP-1181), … Behandlung personalisieren (z. B. Überwachung chronischer Krankheiten) Sonstige Data Science und KI der Medizin (Produkt) Krebserkennung EKG Hautläsionen Retina Quellen: [Medikamente1], [Medikamente2].
  • 26. 26 | 162 Marketing & Vertrieb u Kundensegmentierung u Digitale Assistenten (ChatBot) Fehleraufdeckung u Falschabrechnungen u Betrugsversuche Spezialthema: Anrechenbare Vorerkrankungen u Frage: Hat eine Erkrankung einen ursächlichen Zusammenhang zu einer vorherigen? u Beispiel: Bandscheibenvorfall und Rückenschmerzen. u Bislang Sachbearbeiter*innen => viele historische Daten vorhanden J Data Science bei einer Krankenversicherung (Prozess)
  • 27. 27 | 162 ICD Schlüssel Vorerkran- kungsgruppe Zeitraum von Zeitraum bis Spondylose ? 12.06.2022 05.07.2022 Rückenschmerzen 5 09.05.2022 15.05.2022 Oberflächliche Verletzungen der Hüfte und des Oberschenkels 8 03.12.2021 03.12.2021 Bronchitis 7 12.09.2021 19.09.2021 Bandscheibenvorfall 5 15.03.2021 07.04.2021 Rückenschmerzen 5 01.02.2021 05.02.2021 Anrechenbare Vorerkrankungen KI-Aufgabe
  • 31. 31 | 162 KI-Ampel-Steuerung beobachtet auch Stau-Infos aus dem Internet
  • 32. 32 | 162 Intelligente, vorausschauende Ampelschaltungen u KI ermittelt das beste Ampel-Schaltverhalten, um den Verkehrsfluss zu optimieren u Hochauflösende Kamera- und Radarsensorik erfassen Verkehrsgeschehen In Zukunft werden 5.200 Lichtsignalanlagen miteinander kommunizieren (straßen.nrw) u Schaltungen für eine solch hohe Dynamik lassen sich kaum noch programmieren, sondern müssen erlernt werden. Autonomes Fahren: Bei „Car 2 X“ kommuniziert das Fahrzeug mit z. B. auch mit Ampeln Vorteile u Verbesserung des Verkehrsfluss um ca. 15 Prozent durch KI u Verringern von Staus, Lärm und CO2-Belastung Smarte Ampeln für den Verkehr Quellen: [SmartCity1], [SmartCity2].
  • 34. 34 | 162 Wasserverluste in öffentlichen Trinkwassernetzen Quelle: [Wasserverluste]
  • 35. 35 | 162 115.000 km Trinkwasserleitungen 100.000 km Abwasserleitungen Erwartete Lebensdauer ca. 50 Jahre 10 % - 15 % der Leitungen sind sanierungsbedürftig Leckagen in Bayerns Trinkwasserleitungen Durchfluss- & Druckmessstelle Quellen: [UniBielefeld], [LebensraumWasser].
  • 36. 36 | 162 Normaler Wasserverbrauch 15.2.2020 16.2.2020 Quelle: [LeckagenmitKI]
  • 37. 37 | 162 Leckage erkennbar als Anomalie im Wasserverbrauch Quelle: [LeckagenmitKI]
  • 39. 39 | 162 Machine Learning Group der Uni Bielefeld u Leckagen-Erkennung anhand von Druckmessungen u Erkennung von Sensor-Fehlern (!) mit KI Fraunhofer-Instituts Projekt KI-MUSIK4.0 u Audio-Überwachung gegen Leckagen in pneumatischen Antrieben RBS Wave GmbH u Früherkennung und Vorortung von Leckagen mit KI-basierter Software NL Accustics u Our advanced machine learning-based algorithms provide you with easy-to-use diagnostics for intelligent maintenance decisions. Neuron Soundware u Ausfälle voraussagen mit KI, IoT und Sound Verwandte Forschung aktuell Quellen: [UniBielefeld], [Fraunhofer], [LeckagenmitKI], [Industr], [Siemens], [FHKiel], [PipePredict].
  • 40. 40 | 162 KI wird kreativ
  • 41. 41 | 162 Natural Language Understanding (NLU) u OpenAI u DeepL u Google BERT, Word2Vec, Glove, ELMO, u Facebook XLM u IBM Watson GitHub Copilot OpenAI MuseNet OpenAI Dall·E, Google Imagen DeepMind Agent Gato Zeitenwende für neuronale Netzwerkmodelle GPT3
  • 42. 42 | 162 OpenAIs Dall·E 2 Googles Imagen KI-generierte Bilder Bilder Toilettenauto Eine verchromte Ente mit goldenem Schnabel streitet sich mit einer wü- tenden Schildkröte in einem Wald Quellen: [DallE2], [Imagen]
  • 43. 43 | 162 MuseNet – OpenAI https://openai.com/blog/musenet/ Kann Musikstücke fortsetzen in unterschiedlichsten Stilen Transformer lernt anhand von Midi-Files u selbstüberwacht Technik u verwendet Sparse Transformer mit u 72 Schichten, 24 Attentionheads u über einen Kontext von 4096 Tokens
  • 44. 44 | 162 Türkischer Marsch im Stile von Chopin
  • 45. 45 | 162 app.neuro-flash.com Kann man Kunden besser verstehen und was treibt sie an? Die Sammlung, Aufbereitung und Analyse von Daten – das ist die Kernaufgabe der Data Science. Durch den Einsatz von Methoden der Statistik, der Wahrscheinlichkeitsrechnung und der maschinellen Lernverfahren können Unternehmen mehr über ihre Kunden erfahren und herausfinden, was diese wirklich wollen. Data Science ist kein Hexenwerk, sondern eine Kombination aus verschiedenen Disziplinen, die bereits seit Jahrzehnten erforscht werden. Dennoch ist sie für viele etablierte Unternehmen neu und ungewohnt. Diese müssen sich erst einmal daran gewöhnen, statt auf Bauchgefühl oder Intuition Daten als Grundlage für ihre Entscheidungen heranzuziehen. Oft fehlt es etablierten Unternehmen an den richtigen Strukturen und Prozessen, um Data Science erfolgreich einsetzen zu können. Zudem mangelt es oft an Experimentierfreude und Risikobereitschaft. Dabei ist es gerade wichtig, neue Wege zu gehen und Fehler zu machen. Nur so können sich Unternehmen weiterentwickeln und langfristig erfolgreich sein. à „Data-Science“, Vortragstitel Data Science – die neue Waffe im Kampf um die Kunden à Einleitung für Vortrag
  • 46. 46 | 162 Agenda Data Science und Machine Learning Ideen aus dem Business Aromatic: Ideen für das Business Der Bahntracker
  • 47. 47 | 162 AROMATIC Aromen, Heilkräuter und Gewürze
  • 48. 48 | 162 DataRobot Aromatic-Control-Center Prod-Überwachung Chat Bot Segmente / Cluster Empfehlungssystem Portfolio Neukundengewinnung Zulieferer-Scan Routenplanung Recruiting Betrugserkennung WebSite-Optimierung Sentiment-Analyse Kostenplanung AROMATIC
  • 49. 49 | 162 Kundensegmente B2C Datenbank: Segmente 2022 Retouren ++ -- - + Alter Ø 35 Ø 63 Ø 46 Ø 32 Ø 25 Umsätze ++ ++ + - Einkäufe pro Jahr 8 6 2,8 7,2 3,5 Bevorz. Produkte Medizin Gewürze Aromen Online-Affinität ++ - + ++ AROMATIC
  • 50. 50 | 162 Kundensegmente B2C Datenbank: Segmente 2022 Online Luxus Business FamiIies Young Retouren ++ -- - + Alter Ø 35 Ø 63 Ø 46 Ø 32 Ø 25 Umsätze ++ ++ + - Einkäufe pro Jahr 8 6 2,8 7,2 3,5 Bevorz. Produkte Medizin Gewürze Aromen Online-Affinität ++ - + ++ AROMATIC
  • 51. 51 | 162 127 € 180 € 60 € 2020 2021 Kundensegmente Online- Shopper Luxus Business Families Young 373 € 346 € Umsatz Merkmal: B2C Datenbank: Segmententwicklung 2022 Jahr AROMATIC
  • 52. 52 | 162 Marketing-Budget-Verteilung Online- Shopper Luxus Business Families Young Budget für 09.22 Machine Learning CLV 2022 11.500 € 2021 2022 18.000 € 2021 AROMATIC
  • 53. 53 | 162 DataRobot Aromatic-Control-Center Prod-Überwachung Chat Bot Segmente / Cluster Empfehlungssystem Portfolio Neukundengewinnung Zulieferer-Scan Routenplanung Recruiting Betrugserkennung WebSite-Optimierung Sentiment-Analyse Kostenplanung AROMATIC Kündigungsprävention
  • 54. 54 | 162 Kündigungsprävention Input Output Preise, Käufe, Reklamationen Kündigungswahrscheinlichkeit Datawarehouse Statistik
  • 55. 55 | 162 Kündigungsprävention Input Output Datenbank Dateien Services Kundenstammdaten, Kaufverhalten Termindisziplin, Nutzungshäufigkeit, Reklamationen, Zahlungsmoral, demo- & geographische Daten, Scores, Preise, Konkurrenz, Trends, ... Kündigungswahrscheinlichkeit Statistik
  • 56. 56 | 162 Amazon Fraud Detector u Schnellere Erkennung von mehr Online-Betrug mit maschinellem Lernen Amazon Textract u Problemloses Extrahieren von Text und Daten aus praktisch jedem Dokument Google Natural Language API u Informationen aus unstrukturiertem Text gewinnen Amazon Lex u Erstellen von Sprach- und Text-Chatbots Amazon Lookout for Equipment u Erkennen eines anormalen Geräteverhaltens durch Analysieren von Sensordate Data Science as a (Cloud-)Service
  • 57. 57 | 162 Amazon Monitron u Zustandsüberwachungssystem für Produktionsmaschinen Amazon Comprehend Medical u Amazon Comprehend Medical verwendet maschinelles Lernen, um Erkenntnisse und Beziehungen aus medizinischem Text zu extrahieren. Amazon HealthLake u Gesundheitsdaten sinnvoll nutzen AWS DeepLens u Videokamera mit Deep Learning-Funktion Google Vision AI u Mit vortrainierten Modellen Emotionen und noch sehr viel mehr erkennen Data Science as a (Cloud-)Service
  • 58. 58 | 162 Neues Projekt: Kündigungsprävention
  • 59. 59 | 162 Der Data-Science-Lebenszyklus Data Engineering Data Analysis Machine Learning Data Science Daten sammeln Daten bereinigen Explorative Analyse Model- lierung Deploy- ment
  • 60. 60 | 162 Der Data-Science-Lebenszyklus Data Engineering Data Analysis Machine Learning Data Science Daten sammeln Daten bereinigen Explorative Analyse Model- lierung Deploy- ment Anforderungs- & Projekt- Management
  • 61. 61 | 162 Der Data-Science-Lebenszyklus Data Engineering Data Analysis Machine Learning Data Science Daten sammeln Daten bereinigen Explorative Analyse Model- lierung Deploy- ment Anforderungs- & Projekt- Management Design Thinking Data Thinking
  • 62. 62 | 162 Der Data-Science-Lebenszyklus Data Engineering Data Analysis Machine Learning Data Science Daten sammeln Daten bereinigen Explorative Analyse Model- lierung Deploy- ment Anforderungs- & Projekt- Management Data Thinking
  • 63. 63 | 162 Der Data-Science-Lebenszyklus Anforderungs- & Projekt- Management Data Thinking
  • 64. 64 | 162 Der Data-Science-Lebenszyklus Daten sammeln Anforderungs- & Projekt- Management Data Thinking Datenbank Dateien Data Mining Statistik Services Big Data Smart Data IoT Proof of Concept Daten bereinigen Explorative Analyse Data Warehouse Data Lake Präparierte Daten Daten visualisieren Feedback
  • 65. 65 | 162 Der Data-Science-Lebenszyklus Data Engineering Data Analysis Machine Learning Data Science Daten sammeln Anforderungs- & Projekt- Management Data Thinking Daten bereinigen Explorative Analyse Model- lierung Deploy- ment Prototyp
  • 66. 66 | 162 Der Data-Science-Lebenszyklus Data Engineering Data Analysis Machine Learning Data Science Daten sammeln Anforderungs- & Projekt- Management Data Thinking Daten bereinigen Explorative Analyse Model- lierung Deploy- ment Qualitäts- sicherung MLOps Produktion
  • 67. 67 | 162 Kündigungsprävention Online- Shopper Luxus Business Families Young Termindisziplin Kaufverhalten Nutzungshäufigkeit Reklamationen Zahlungsmoral Machine Learning 2020 2021 2022 2020 2021 2022 Kundenstammdaten demographische Daten geographische Daten Scores Machine Learning AROMATIC
  • 68. 68 | 162 Kündigungsprävention Kündigungswahrscheinlichkeit: 36% 1 Reklamation mit Kündigungsandrohung letzter Monat 4 Reklamationen aus gleicher Adresse in letzten 3 Monaten Frühere Abo-Kündigung durch Abonnent 15 Jahre bisherige Abo-Laufzeit Kunde bezieht Vollabo Peter Baumgärtner Alter: 54 Wohnort: Essen Knd.Nr. 234554 AROMATIC
  • 69. 69 | 162 Kündigungsprävention 20-fach höher 0,02% 0,2% 2,2% 9,6% 57,4% 19,7% 5,0% 3,3% 2,6% 385 kritische Abonnenten Aktion 1 Aktion 2 Aktion 3 20-fach niedriger 10-fach höher 5-fach höher 2-fach höher Durchschnitt 2-fach niedriger 5-fach niedriger 10-fach niedriger AROMATIC
  • 70. 70 | 162 Warum scheitern so viele Data-Science-Projekte? schlechte, evtl. zu viele (€) Daten Auch die Cloud allein bewirkt keine Wunder rechtlich: Datenschutz! Uni- bzw. Kursstoff Viele neue Erfolge Kostet nicht die meiste Zeit Datenbeschaffung technisch, organisatorisch, Geschäftsidee & -modell sind häufig nicht ausgereift 10% 70% 10% 10% Daten sammeln Anforderungs- & Projekt- Management Data Thinking Daten bereinigen Explorative Analyse Model- lierung Deploy- ment Qualitäts- sicherung Wird gern vergessen
  • 71. 71 | 162 Die Idee! Data-Science-Team aufbauen (mit Draht zum Management) u KI-Expertise hinzunehmen Starten Sie mit einem Pilot-Projekt u Geplante Zeit: ca. 3 – 6 Monate u Ergebnisse messbar machen Nicht jedes Rad neu erfinden: u Es gibt wiederverwendbare Bausteine (Cloud) u AutoML nutzen Mittelfristig bzw. langfristig DS/KI-Strategie etablieren u Es gibt viel zu klären: Technisches, Organisatorisches, Rechtliches u DevOps bzw. MLOps frühzeitig etablieren u Nehmen Sie den Change ERNST; auch hier dauert ALLES länger als gedacht! Erfolgsfaktoren
  • 72. 72 | 162 Agenda Data Science und Machine Learning Ideen aus dem Business Aromatic: Ideen für das Business Der Bahntracker
  • 73. 73 | 162 Worüber haben sich Bahnfahrer*innen am meisten geärgert? 7% 2% 15% 4% 3% 11% 42% 9% 7% Fehlende oder falsche Infos vor und während der Reise Lange Wartezeit beim Umsteigen Laute oder störende Mitreisende Kein oder schlechtes WLAN Teure Fahrkarte Mängel im Zug (z.B. Klimatisierung, WC, Speisewagen) Verspätung / verpasster Anschluss / Zugausfall Schlechte Betreuung bei Problem (z.B. kurzfristig geändertes Abfahrtsgleis) Bahnreise gab keinen Grund zum Ärgern Quelle: [Bahnfahrtaerger]
  • 74. 74 | 162 Meine Bahnfahrt von Düsseldorf nach Frömern
  • 76. 76 | 162 Erste Untersuchungen mit öffentlichen Bahndaten dbf.finalrewind.org Service Daten sammeln Anforderungs- & Projekt- Management Data Thinking „Data Lake“: MongoDB ca. ½ Mio. Datensätze
  • 77. 77 | 162 13 Bahnhöfe, 236 Züge, 1795 Zugnummern (ZN) EC 114 EC 7 EC 9 FLX 30 IC 118 IC 119 IC 1916 IC 1949 IC 1952 IC 1959 IC 2003 IC 2010 IC 2011 IC 2012 IC 2013 IC 2015 IC 2040 IC 2042 IC 2043 IC 2044 IC 2045 IC 2046 IC 2047 IC 2048 IC 2049 IC 2152 IC 2155 IC 2156 IC 2157 IC 2210 IC 2212 IC 2216 IC 2223 IC 2224 IC 2225 IC 2226 IC 2227 IC 2228 IC 2229 IC 2310 IC 2318 IC 2319 IC 2320 IC 2321 IC 2322 IC 2323 IC 2324 IC 2325 IC 2326 IC 2327 IC 2328 IC 2341 IC 2440 IC 2441 IC 2442 IC 2443 IC 2444 IC 2445 IC 2446 ICE 100 ICE 101 ICE 1010 ICE 1011 ICE 1012 ICE 1013 ICE 1015 ICE 1022 ICE 1028 ICE 1050 ICE 1055 ICE 1151 ICE 1152 ICE 1222 ICE 1223 ICE 1224 ICE 1545 ICE 1621 ICE 1626 ICE 1627 ICE 204 ICE 22 ICE 228 ICE 229 ICE 23 ICE 26 ICE 27 ICE 28 ICE 29 ICE 2936 ICE 2941 ICE 2942 ICE 2944 ICE 513 ICE 514 ICE 515 ICE 516 ICE 517 ICE 518 ICE 519 ICE 523 ICE 524 ICE 525 ICE 526 ICE 527 ICE 528 ICE 529 ICE 541 ICE 542 ICE 543 ICE 544 ICE 545 ICE 546 ICE 547 ICE 548 ICE 549 ICE 552 ICE 553 ICE 554 ICE 555 ICE 556 ICE 557 ICE 558 ICE 559 ICE 610 ICE 611 ICE 612 ICE 613 ICE 614 ICE 615 ICE 616 ICE 617 ICE 618 ICE 619 ICE 620 ICE 622 ICE 624 ICE 626 ICE 640 ICE 641 ICE 642 ICE 643 ICE 644 ICE 645 ICE 646 ICE 650 ICE 651 ICE 652 ICE 653 ICE 654 ICE 655 ICE 656 ICE 657 ICE 713 ICE 714 ICE 717 ICE 752 ICE 759 ICE 812 ICE 813 ICE 840 ICE 842 ICE 843 ICE 844 ICE 845 ICE 846 ICE 847 ICE 848 ICE 849 ICE 853 ICE 854 ICE 855 ICE 856 ICE 857 ICE 858 ICE 859 ICE 912 ICE 913 ICE 914 ICE 918 ICE 919 ICE 920 ICE 921 ICE 928 ICE 929 ICE 940 ICE 941 ICE 942 ICE 943 ICE 944 ICE 945 ICE 946 ICE 947 ICE 948 ICE 949 ICE 950 ICE 951 ICE 952 ICE 953 ICE 954 ICE 955 ICE 956 ICE 957 RB 32 RB 40 RB 43 RB 50 RB 51 RB 52 RB 53 RB 54 RB 59 RB 91 RE 1 RE 11 RE 13 RE 16 RE 17 RE 3 RE 34989 RE 4 RE 57 RE 6 RE 7 RE 98079 RE 98505 RE 98531 S 1 S 2 S 4 S 5 S 8 S 9 THA 9412 THA 9424 THA 9459 THA 9471 Düsseldorf Hbf Duisburg Hbf Wuppertal Hbf Essen Hbf Dortmund Hbf Do-Hörde Holzwickede Fröndenberg Hagen Hbf Schwerte/Ruhr Unna Hamm Hbf Frömern
  • 78. 78 | 162 Erste Untersuchungen mit öffentlichen Bahndaten dbf.finalrewind.org Service Daten sammeln Anforderungs- & Projekt- Management Data Thinking Daten bereinigen „Data Lake“: MongoDB Präpariert: MongoDB ca. ½ Mio. Datensätze ca. 200.000 Fahrten
  • 79. 79 | 162 Date: 2022-06-08 Train: 26831, RE 1 Düsseldorf Hbf, Arrival: 18:19 Delay: 19, Delay-Infos: Bauarbeiten, Observation: 18:35 Düsseldorf Flugh. Duisburg Hbf, Arrival: 18:36 Delay: 20, Delay-Infos: Bauarbeiten, Observation: 18:53 Mülheim(Ruhr)Hbf Essen Hbf, Arrival: 18:51 Delay: 18, Delay-Infos: Bauarbeiten, Observation: 18:48 Wattenscheid Bochum Hbf Dortmund Hbf, Arrival: 19:15 Delay: 17, Delay-Infos: Bauarbeiten, Observation: 18:49 Dortmund-Kurl Kamen-Methler Kamen Bönen-Nordbögge Hamm Hbf, Arrival: 19:40 Delay: 17, Delay-Infos: Bauarbeiten, Observation: 18:52 Eine zusammengesetzte Fahrt
  • 80. 80 | 162 Erste Untersuchungen mit öffentlichen Bahndaten dbf.finalrewind.org Service ca. ½ Mio. Datensätze ca. 200.000 Fahrten Daten sammeln Anforderungs- & Projekt- Management Data Thinking Daten bereinigen Explorative Analyse Daten visualisieren Data Mining Statistik Proof of Concept „Data Lake“: MongoDB Präpariert: MongoDB
  • 81. 81 | 162 Summe alle Verspätungen (Rhein/Ruhr) Pfingsten Fron- leichnam 1.6. Tornado
  • 82. 82 | 162 Meine Bahnfahrt von Düsseldorf nach Frömern
  • 83. 83 | 162 Intelligente Verarbeitung der Daten
  • 85. 85 | 162 Es existieren zahlreiche Fahrten Hagen Hörde Unna Fröndenberg Schwerte Düsseldorf Frömern Start Ziel Dortmund
  • 86. 86 | 162 Schnellste Verbindung (V1) 17:12 18:19 18:32 Hörde Schwerte Hagen Düsseldorf Fröndenberg Frömern Gesamtfahrzeit: 1:27 Unna 18:39 Dortmund
  • 87. 87 | 162 Zweitschnellste Verbindung (V2) 18:15 18:41 Hörde Schwerte Fröndenberg Unna Hagen Gesamtfahrzeit: 1:55 (+0:28) 17:22 Frömern Dortmund Düsseldorf 19:17 19:09 19:05
  • 88. 88 | 162 Drittschnellste Verbindung (V3) 17:12 18:07 18:28 Hörde Schwerte Hagen Düsseldorf Fröndenberg Frömern Gesamtfahrzeit: 2:05 (+0:38) Unna 18:37 19:17 19:09 Dortmund
  • 89. 89 | 162 { V1 V2 V1 Auskunft der Bahn { { kein V3!
  • 90. 90 | 162 Wir entscheiden uns zunächst für V1 17:12 18:19 18:32 Hörde Schwerte Hagen Düsseldorf Fröndenberg Frömern Gesamtfahrzeit: 1:27 h Unna 18:39 Dortmund
  • 91. 91 | 162 Anstatt des Zugs 7 17:12 Hamm (Westf.) Wuppertal - Hagen - Unna +++ ca. 10 Min. später +++ RE 13
  • 92. 92 | 162 Ein typisches Szenario 7 17:12 Hamm (Westf.) Wuppertal - Hagen - Unna +++ ca. 15 Min. später +++ RE 13
  • 93. 93 | 162 18:32 (+0:13) 18:19 V1 ist nun problematisch 17:27 (+0:15) 17:12 Hörde Unna Schwerte Hagen Düsseldorf Fröndenberg Frömern 19:32 Der Anschluss wird vsl. nicht erreicht Gesamtfahrzeit: 2:27 (+1:00) 19:39 ! Dortmund
  • 94. 94 | 162 Auskunft der Bahn V2 {
  • 95. 95 | 162 Der naive Bahnfahrer wählt demnach V2 18:15 18:41 19:09 Hörde Schwerte Fröndenberg Unna Hagen Gesamtfahrzeit: 1:55 (+0:28) 17:22 Düsseldorf Frömern 19:17 19:05 Dortmund
  • 96. 96 | 162 Alles scheint ok 17:22 Hamm (Westf.) Duisburg - Mülheim - Essen - Dortmund RE 1 17
  • 97. 97 | 162 Die Fahrt beginnt mit dem RE 1 18:15 18:41 Hörde Schwerte Fröndenberg Unna Hagen 17:22 Frömern Gesamtfahrzeit: 1:55 (+0:28) 19:17 Düsseldorf 19:09 19:05 Dortmund
  • 98. 98 | 162 Angekommen in Dortmund 18:15 18:41 Hörde Schwerte Fröndenberg Unna Hagen 17:22 Düsseldorf Frömern Gesamtfahrzeit: 1:55 (+0:28) 19:17 19:09 19:05 Dortmund
  • 99. 99 | 162 Umstieg in den RE 57 18:15 18:41 Hörde Schwerte Fröndenberg Unna Hagen 17:22 Düsseldorf Frömern Gesamtfahrzeit: 1:55 (+0:28) 19:17 19:09 19:05 Dortmund
  • 100. 100 | 162 Leichte Verspätung bis Hörde 18:15 18:41 Schwerte Fröndenberg Unna Hagen 17:22 Düsseldorf Frömern 18:51 (+0:03) 18:48 Hörde Gesamtfahrzeit: 1:55 (+0:28) 19:17 19:09 19:05 Dortmund
  • 101. 101 | 162 19:05 19:11 (+0:06) Weitere Verspätung bis Fröndenberg 18:15 18:41 19:17 Schwerte Fröndenberg Unna Hagen 17:22 Düsseldorf Frömern 18:51 (+0:03) 18:48 Hörde Gesamtfahrzeit: 1:55 (+0:28) Der Anschluss wird vsl. nicht erreicht ! 19:09 Dortmund
  • 102. 102 | 162 19:05 19:11 (+0:06) Gezwungen, den nächsten RB 54 zu nehmen 18:15 18:41 20:09 Schwerte Fröndenberg Unna Hagen 17:22 Düsseldorf Frömern 18:51 (+0:03) 18:48 Hörde 20:17 Dortmund Gesamtfahrzeit: 2:55 (+1:28)
  • 103. 103 | 162 Ein Verdopplung der Fahrzeit! 18:15 18:41 20:09 Schwerte Fröndenberg Unna Hagen Gesamtfahrzeit: 2:55 (+1:28) 17:22 Düsseldorf Frömern 18:51 (+0:03) 18:48 Hörde 20:17 19:05 19:11 (+0:06) Dortmund
  • 104. 104 | 162 4 7 14 8 12 8 4 4 14 5 7 7 8 10 3 5 9 31 8 4 5 5 18 5 8 20 1 4 5 0 3 3 3 5 3 19 3 4 0 2 3 11 17 4 23 3 3 27 30 2 1 . 0 3 . 2 2 2 3 . 0 3 . 2 2 2 5 . 0 3 . 2 2 2 7 . 0 3 . 2 2 2 9 . 0 3 . 2 2 3 1 . 0 3 . 2 2 0 2 . 0 4 . 2 2 0 4 . 0 4 . 2 2 0 6 . 0 4 . 2 2 0 8 . 0 4 . 2 2 1 0 . 0 4 . 2 2 1 2 . 0 4 . 2 2 1 4 . 0 4 . 2 2 1 6 . 0 4 . 2 2 1 8 . 0 4 . 2 2 2 0 . 0 4 . 2 2 2 2 . 0 4 . 2 2 2 4 . 0 4 . 2 2 2 6 . 0 4 . 2 2 2 8 . 0 4 . 2 2 3 0 . 0 4 . 2 2 0 2 . 0 5 . 2 2 0 4 . 0 5 . 2 2 0 6 . 0 5 . 2 2 0 8 . 0 5 . 2 2 1 0 . 0 5 . 2 2 1 2 . 0 5 . 2 2 1 4 . 0 5 . 2 2 Verspätung > 3 Min: 65 % Ø 7,55 Min / Median 5 Min Verspätungen des RE 57 (10773) in Fröndenberg, Abfahrt in Dortmund Hbf: 17:41 Uhr
  • 105. 105 | 162 Was ist das Problem? Der Anschluss in Fröndenberg ist sehr knapp bemessen: 4 Min. Umsteigezeit! Die Verspätung tritt erst während der 2. Fahrt auf und wird bei Fahrtantritt in Düsseldorf in der Bahn-App somit nicht angekündigt. Nur als erfahrener Bahnfahrer weiß ich, dass diese Fahrt äußerst riskant ist. DS-Frage: Könnte die Bahn-App diese Erfahrungswerte einrechnen? Antwort: JA!
  • 106. 106 | 162 Den Autobahn-Tracker gibt es schon
  • 107. 107 | 162 18:32 (+0:13) 18:19 Hörde Unna Schwerte Hagen Düsseldorf Fröndenberg Frömern 19:32 Gesamtfahrzeit: 2:27 (+1:00) 17:27 (+0:15) 17:12 19:39 Wären wir trotzdem in den RE 13 eingestiegen (V1) ! Dortmund
  • 108. 108 | 162 18:29 (+0:10) 18:19 Bis Hagen bereits fünf Minuten aufgeholt 17:27 (+0:15) 17:12 Hörde Unna Schwerte Hagen Düsseldorf Fröndenberg Frömern 19:32 18:09 (+0:10) 17:58 Gesamtfahrzeit: 2:27 (+1:00) 19:39 ! Dortmund
  • 109. 109 | 162 18:28 (+0:09) 18:19 Der RE 13 macht weitere Minuten gut 17:27 (+0:15) 17:12 Hörde Unna Schwerte Hagen Düsseldorf Fröndenberg Frömern Gesamtfahrzeit: 1:27 h 18:32 18:39 18:17 (+0:09) 18:08 18:09 (+0:10) 17:58 Dortmund
  • 110. 110 | 162 18:27 (+0:08) 18:19 Der Anschluss wird wider Erwarten erreicht Hörde Unna Schwerte Hagen Düsseldorf Fröndenberg Frömern Gesamtfahrzeit: 1:27 h 18:32 17:27 (+0:15) 17:12 18:09 (+0:10) 17:58 18:17 (+0:09) 18:08 18:39 Dortmund Ein Aufholen von 4 Min würde ausreichen.
  • 111. 111 | 162 Umstieg in den RB 54 Hörde Unna Schwerte Hagen Düsseldorf Fröndenberg Frömern Gesamtfahrzeit: 1:27 h 18:32 18:17 (+0:09) 18:08 18:09 (+0:10) 17:58 17:27 (+0:15) 17:12 18:39 18:27 (+0:08) 18:19 Dortmund
  • 112. 112 | 162 18:27 (+0:08) 18:19 Pünktlich trotz anfänglicher Verspätung 17:27 (+0:15) 17:12 Hörde Unna Schwerte Hagen Düsseldorf Fröndenberg Frömern Gesamtfahrzeit: 1:27 h 18:32 18:39 18:17 (+0:09) 18:08 18:09 (+0:10) 17:58 Dortmund
  • 113. 113 | 162 -15 -10 -5 0 5 10 15 20 25 30 Diagrammtitel Aufholvermögen des RE13 um 17:12 ab Düsseldorf Bei den um ≥ 5 Min verspäteten Fahrten machte der RE 13 in 67% der Fälle wieder Minuten gut: Ø 6,7 / Median 3,5 Verspätung in Düsseldorf (≥ 5 Min) Verspätung in Unna Differenz
  • 114. 114 | 162 18:32 (+0:13) 18:19 Hörde Unna Dortmund Schwerte Hagen Düsseldorf Fröndenberg Frömern 19:32 Gesamtfahrzeit: 2:27 (+1:00) 19:39 17:27 (+0:15) 17:12 Würde der Zug die Aufholjagd nicht schaffen… Dortmund
  • 115. 115 | 162 18:34 (+0:15) 18:19 Hörde Unna Schwerte Hagen Düsseldorf Fröndenberg Frömern 19:32 Gesamtfahrzeit: 2:27 (+1:00) 19:39 17:27 (+0:15) 17:12 Würde der Zug die Aufholjagd nicht schaffen… 18:13 (+0:15) 17:58 Dortmund
  • 116. 116 | 162 18:34 (+0:15) 18:19 … gäbe es die drittschnellste Verbindung (V3) 17:12 Hörde Schwerte Hagen Düsseldorf Fröndenberg Frömern Gesamtfahrzeit: 2:05 (+0:38) Unna 19:09 19:17 18:37 18:13 (+0:15) 17:58 18:28 18:24 (+0:17) 18:07 Dortmund
  • 117. 117 | 162 V3 klappt auch bei 17 Min. Verspätung 17:12 Hörde Schwerte Hagen Düsseldorf Fröndenberg Frömern Gesamtfahrzeit: 2:05 (+0:38) Unna 19:09 18:28 19:17 18:37 18:13 (+0:15) 17:58 Dortmund
  • 118. 118 | 162 V3: Genügend Umsteigezeit in Fröndenberg 17:12 Hörde Schwerte Hagen Düsseldorf Fröndenberg Frömern Gesamtfahrzeit: 2:05 (+0:38) Unna 19:09 18:28 19:17 18:37 18:13 (+0:15) 17:58 Dortmund
  • 119. 119 | 162 18:13 (+0:15) 17:58 V3 ist die wesentlich bessere Wahl als V2 17:12 Hörde Schwerte Hagen Düsseldorf Fröndenberg Frömern Gesamtfahrzeit: 2:05 (+0:38) Unna 19:09 18:37 18:28 19:17 Dortmund
  • 121. 121 | 162 Auskunft der Bahn V1 V3 V1 { { {
  • 122. 122 | 162 Erste Untersuchungen mit öffentlichen Bahndaten dbf.finalrewind.org Service ca. ½ Mio. Datensätze ca. 200.000 Fahrten Daten sammeln Anforderungs- & Projekt- Management Data Thinking Daten bereinigen Explorative Analyse Daten visualisieren Data Mining Statistik Proof of Concept „Data Lake“: MongoDB Präpariert: MongoDB Ideation: Wie könnte man die BahnApp verbessern?
  • 123. 123 | 162 Die Bahntracker-App Hey Bahntracker, ich möchte jetzt gern nach Frömern. Bahntracker Lieber Fahrgast, Du kannst mich mit Hey Bahntracker ansprechen. Wie kann ich Dir helfen?
  • 124. 124 | 162 Benutze den RE13 planmäßig um 17:12 Uhr von Gleis 7. Ankunft um 18:40. Achtung: Der Zug hat 12 Minuten Verspätung. Der Anschluss in den RB 54 in Unna wird voraussichtlich erreicht. Alternative: Umstieg in Schwerte in den RE 57 mit einer Ankunft um 19:17 Uhr Du wirst ggf. über den Umstieg in Schwerte rechtzeitig von mir informiert. Die Bahntracker-App Hey Bahntracker, ich möchte jetzt gern nach Frömern. 17:24 Falls Anschluss in Unna gefährdet: Ticket kaufen Ticket kaufen Bahntracker Du: „Ich möchte jetzt gern nach Frömern.“ Meine Empfehlung: Gleis 7 Gleis 7 Schwerte
  • 125. 125 | 162 Anschluss wartet, bitte umsteigen
  • 126. 126 | 162 Von den ersten Untersuchungen… dbf.finalrewind.org Service ca. ½ Mio. Datensätze ca. 200.000 Fahrten Daten sammeln Anforderungs- & Projekt- Management Data Thinking Daten bereinigen Explorative Analyse Daten visualisieren Data Mining Statistik Proof of Concept „Data Lake“: MongoDB Präpariert: MongoDB
  • 127. 127 | 162 … bis hin zu einem produktionsreifen System Data Engineering Data Analysis Machine Learning Data Science Daten sammeln Anforderungs- & Projekt- Management Data Thinking Daten bereinigen Explorative Analyse Model- lierung Deploy- ment Qualitäts- sicherung MLOps Produktion
  • 128. 128 | 162 Die Bahntracker-App Hey Bahntracker, ich möchte jetzt gern nach Frömern. Bahntracker Lieber Fahrgast, Du kannst mich mit Hey Bahntracker ansprechen. Wie kann ich Dir helfen?
  • 129. 129 | 162 Benutze den RE13 planmäßig um 17:12 Uhr von Gleis 7. Ankunft um 18:40. Achtung: Der Zug hat 12 Minuten Verspätung. Der Anschluss in den RB 54 in Unna wird voraussichtlich erreicht. Alternative: Umstieg in Schwerte in den RE 57 mit einer Ankunft um 19:17 Uhr Du wirst ggf. über den Umstieg in Schwerte rechtzeitig von mir informiert. Die Bahntracker-App Hey Bahntracker, ich möchte jetzt gern nach Frömern. 17:24 Falls Anschluss in Unna gefährdet: Ticket kaufen Ticket kaufen Bahntracker Du: „Ich möchte jetzt gern nach Frömern.“ Meine Empfehlung: Gleis 7 Gleis 7 Schwerte
  • 130. 130 | 162 Ziel: Finde die beste Alternative: V1, V2, V3
  • 131. 131 | 162 V1: Bekomme ich voraussichtlich den Anschluss in Unna? 17:12 18:19 18:32 Hörde Schwerte Hagen Düsseldorf Fröndenberg Frömern Unna 18:39 Dortmund ?
  • 132. 132 | 162 V2: Bekomme ich voraussichtlich die Anschlüsse in Dortmund und Fröndenberg? 18:15 18:41 Hörde Schwerte Fröndenberg Unna Hagen 17:22 Frömern Dortmund Düsseldorf 19:17 19:09 19:05 ? ?
  • 133. 133 | 162 V3: Bekomme ich voraussichtlich die Anschlüsse in Schwerte und Fröndenberg? 17:12 18:07 18:28 Hörde Schwerte Hagen Düsseldorf Fröndenberg Frömern Unna 18:37 19:17 19:09 Dortmund ? ?
  • 134. 134 | 162 Anbindung an das Backend Bahn- daten Bahntracker-Backend Bahntracker-App ZN 20087 Unna Min. Vorher- sagen Abfahr- ten ? 17:20:34 Filter ZN 20087 Schwerte ZN 10719 Fröndenberg ZN 10773 Fröndenberg Verspätung ZN 26829 Dortmund
  • 135. 135 | 162 ZN Bahnhof Zeiten 20087 Düsseldorf 17:12 +12 Unna 18:19 +10 14859 Unna 18:32 Frömern 18:39 ZN Bahnhof Zeiten 26829 Düsseldorf 17:22 +3 Dortmund 18:15 +12 10773 Dortmund 18:41 +2 Fröndenberg 19:05 +6 14862 Fröndenberg 19:09 Frömern 19:19 ZN Bahnhof Zeiten 20087 Düsseldorf 17:12 +12 Schwerte 18:07 +10 10719 Schwerte 18:28 +2 Fröndenberg 18:37 +2 Fröndenberg 19:09 Frömern 19:19 V1 V2 V3 Prognosen
  • 136. 136 | 162 Anbindung an das Backend Bahn- daten Bahntracker-Backend Bahntracker-App ZN 20087 Unna Min. Vorher- sagen Abfahr- ten ? 17:20:34 Filter ZN 20087 Schwerte ZN 10719 Fröndenberg Verspätung
  • 137. 137 | 162 V1: Anschluss in Unna 18:19 18:32 Hörde Schwerte Hagen Düsseldorf Fröndenberg Frömern Gesamtfahrzeit: 1:27 Unna 18:39 Dortmund ZN: 20087 ZN: 14859 17:24 (+0:12) 17:12 ? 17:20:34
  • 138. 138 | 162 V1: Anschluss in Unna? 18:19 18:32 Düsseldorf Unna ZN: 20087 17:24 (+0:12) 17:12 ? 17:20:34
  • 139. 139 | 162 V1: Anschluss in Unna? Input Output Information Zugnummer Bahnhof vorauss. Verspätung ZN 20087 Unna Düsseldorf ZN: 20087 aktuelle Daten: • Verspätung bei der Abfahrt • Baustellen • Auslastung historische Daten: Ferienzeit 18:19 18:32 Unna ? 17:24 (+0:12) 17:12 17:20:34 10 Min. (67%)
  • 140. 140 | 162 Schnittstelle „Verspätungsprognose“ Output vorauss. Verspätung 10 Min. (67%) Düsseldorf ZN: 20087 Unna 17:24 (+0:12) 17:12 17:20:34 18:29 (+0:10) 18:19 19:32
  • 141. 141 | 162 Schnittstelle „Verspätungsprognose“ Output vorauss. Verspätung 11 Min. (70%) Unna 17:24:21 18:30 (+0:11) 18:19 19:32
  • 142. 142 | 162 Schnittstelle „Verspätungsprognose“ Output vorauss. Verspätung 10 Min. (73%) Unna 17:28:31 18:29 (+0:10) 18:19 19:32
  • 143. 143 | 162 Schnittstelle „Verspätungsprognose“ Output vorauss. Verspätung 10 Min. (75%) Unna 17:32:28 18:29 (+0:10) 18:19 19:32
  • 144. 144 | 162 Schnittstelle „Verspätungsprognose“ Output vorauss. Verspätung 10 Min. (77%) Unna 17:36:25 18:29 (+0:10) 18:19 19:32
  • 145. 145 | 162 Aktuelle Verspätungen meiner Fahrt verfolgen
  • 146. 146 | 162 Schnittstelle „Verspätungsprognose“ Output vorauss. Verspätung 9 Min. (79%) Wuppertal ZN: 20087 Unna 17:43 (+0:11) 17:32 17:40:35 18:28 (+0:09) 18:19 18:32
  • 147. 147 | 162 Entscheidung: Weiter mit dem RE 13 oder Umstieg?
  • 148. 148 | 162 Entscheidung: Weiter mit dem RE 13 Output vorauss. Verspätung 8 Min. (95%) Schwerte ZN: 20087 Unna 18:16 (+0:08) 18:08 18:14:31 18:27 (+0:08) 18:19 18:32
  • 149. 149 | 162 Schnittstelle „Verspätungsprognose“ Output vorauss. Verspätung 8 Min. (97%) Unna 18:18:27 18:27 (+0:08) 18:19 18:32
  • 150. 150 | 162 Fast am Ziel … Output vorauss. Verspätung 8 Min. (99%) Unna 18:24:33 18:27 (+0:08) 18:19 18:32
  • 151. 151 | 162 Zufrieden am Ziel …
  • 158. 158 | 162 Bildernachweise https://publicdomainvectors.org/de/kostenlose-vektorgrafiken/Handy-in-der-hand/81183.html (S. 123/124, 128/129, 134/136) https://pixabay.com/de/illustrations/tabelle-grau-schwarz-zeilen-reihen-341442/ (S. 14/15) https://imgbin.com/download/d2K4ZMA8 (S. 17) https://en.wikipedia.org/wiki/File:Linear-regression.svg (S. 126) https://neurohive.io/wp-content/uploads/2019/01/dd-e1547642312239.jpg (S. 19) https://imgbin.com/download/YtnaPtD2 (S. 30) https://statistikguru.de/wp-content/uploads/mnist_zahlen.png (S. 18) https://global- uploads.webflow.com/5d3ec351b1eba4332d213004/5d473cc1f0c5a7e8655a827f_AI_In_Diagnosti cs.png (S. 25) https://www.flickr.com/photos/arselectronica/50373725108 (S. 28) https://pixabay.com/de/illustrations/architektur-geb%C3%A4ude-krankenhaus-5749784/ (S. 47) Kapitel 1 | Kapitel 2 | Referenzen | Weiterführende Literatur | Ende
  • 159. 159 | 162 Bildernachweise https://imgbin.com/png/B8ZCtvNe/il-progressonline-voluntary-association-logo-black-png (S. 11-17, 23, 54, 55, 134, 139-144, 146, 148-150) https://cdn.openai.com/research-covers/musenet/2x-no-mark.jpg (S. 43) https://pixabay.com/de/photos/apple-imac-trackpad-homepod-mac-5951013/?download (S. 48- 53, 67-69) https://en.wikipedia.org/wiki/File:TSP_tour_from_an_1832_book.svg (S. 57) https://imgbin.com/download/tw1WUcYZ (S. 22) https://imgbin.com/download/uEUGtb0Z (S. 22) https://imgbin.com/download/UzVuuFA1 (S. 22) Kapitel 1 | Kapitel 2 | Referenzen | Weiterführende Literatur | Ende
  • 160. 160 | 162 Impulsvorträge für Ihr Unternehmen Überblick über das gesamte Angebot an Impulsvorträgen unter: www.iks-gmbh.com/impulsvortraege Ihr Nutzen: u Unabhängiges, aktuelles Expertenwissen. u Individuell auf Ihr Publikum und Ihr Unternehmen zugeschnittene Vorträge. u Referenten mit langjähriger und branchenübergreifender Expertise in der IT-Beratung. u Praxisnahe Vorträge, die aus Projektarbeit entstanden sind, frei von Produktwerbung. u Ideale Ergänzung für Ihre Führungskräftetreffen, Abteilungsmeetings, Hausmessen, Innovation Days, Konferenzen, Open Spaces, Kick-off-Meetings oder Zukunftsworkshops.