SlideShare ist ein Scribd-Unternehmen logo
Verhagelt das Wetter
Ihren
Geschäftserfolg?
Eine KI Analyse
Daniela Nicola
Alexander Meinert
Feb 2019
Agenda
Motivation
Vorzeigeprojekt
Einfluss des Wetters messen
Vorhersagemodelle
Nutzen
2
3
Wetterabhängige Branchen
4
Wetterextreme nehmen durch Klimawandel zu
München, Januar 2019
Rhein bei Düsseldorf, 2018
5
Einfluss des Wetters auf Online Verkaufszahlen
Quelle: www.weatherads.com
ONLINE UMSATZ vs. SONNENSTUNDEN
Umsatz Sonnenstunden/Tag
Umsatz
Sonnenstunden/Tag
6
Aller Anfang ist schwer …
Wie komme ich an
Wetterdaten
heran?
Muss ich etwas
dafür bezahlen?
Wie verbinde ich
Wetterdaten mit
betrieblichen Kennzahlen?
Wie messe ich den
Einfluss des
Wetters?
Wie kann ich das
Wetter in
Vorhersagemodelle
einfließen lassen?
Projekt
Reichen meine
Erfahrungswerte/Bauchgefühl nicht
aus?
Feinstaub
Vorzeigeprojekt: Wetter und Luftqualität
7
Wetter
Ziel 1:
Einflus
s
messe
n
Betriebliche Kennzahlen
Ziel 2:
Vorhersage
n
8
Architektur
9
Wie komme ich an
Wetterdaten
heran?
Muss ich etwas
dafür bezahlen?
Reichen meine
Erfahrungswerte/Bauchgefühl nicht
aus?
Wie verbinde ich
Wetterdaten mit
betrieblichen Kennzahlen?
Wie messe ich den
Einfluss des
Wetters?
Wie kann ich das
Wetter in
Vorhersagemodelle
einfließen lassen?
10
Wie komme ich an
Wetterdaten
heran?
Muss ich etwas
dafür bezahlen?
Reichen meine
Erfahrungswerte/Bauchgefühl nicht
aus?
Wie verbinde ich
Wetterdaten mit
betrieblichen Kennzahlen?
Wie messe ich den
Einfluss des
Wetters?
Wie kann ich das
Wetter in
Vorhersagemodelle
einfließen lassen?
Quellen & Kosten für Wetterdaten
11
 historische Messwerte, aktuelle Vorhersagen
 501 Messstationen in Deutschland
 14 Wetterattribute
 Sonnenscheindauer
 Niederschlagsmenge
 Temperatur (min, max, ⌀),
 Windgeschwindigkeit
 Luftdruck
 Schneehöhe
 …
 Granularität: Jahr, Monat, Tag, Std., Minute
 Zeitraum: je nach Station, meist 30+ Jahre
 Daten verfügbar über Open Data Portal und Python API
Entgeltfrei
auch für wirtschaftliche Zwecke
(Geodatenzugangsgesetz)
Andere Anbieter
• www.openweathermap.org
• www.wetterkontor.de
• www.weather.com (IBM)
12
Wie komme ich an
Wetterdaten
heran?
Muss ich etwas
dafür bezahlen?
Reichen meine
Erfahrungswerte/Bauchgefühl nicht
aus?
Wie messe ich den
Einfluss des
Wetters?
Wie kann ich das
Wetter in
Vorhersagemodelle
einfließen lassen?
Wie verbinde ich
Wetterdaten mit
betrieblichen Kennzahlen?
Für jede Feinstaub Station:
1. Bestimme Geo Koordinaten
 mit Google Maps Rest API
2. Finde nächstgelegene Wetterstation
 mit Python Bibliothek dwdweather
13
Geomatching
Feinstaub-Station
Wetter-Station
from dwdweather import DwdWeather
# Erstelle client
dw = DwdWeather()
# Finde nächste Station zu einer Position
closest = dw.nearest_station(lon=7, lat=51)
Für jeden Standort:
1. Bestimme Geo Koordinaten
 mit Google Maps Rest API
2. Finde nächstgelegene Wetterstation
 mit Python Bibliothek dwdweather
14
Geomatching für Ihre Standorte
Ihre Standorte
Wetter-Station
Gleiche Vorgehensweise
15
Vereinen von Wetter- und Luftqualitätsdaten
Join
Schlüsselattribute für Join:
- Datum & Wetterstations-ID
Variante:
- Datum des Vortages,
also Wetter des Vortages
16
Vereinen von Wetter- und Luftqualitätsdaten (Anfrage SparkSQL)
Variante: Join mit Wetterdaten
des Vortages
%pyspark
df_stations = spark.read.csv(weather.csv, sep=";", header=True, encoding="UTF-8",
schema=weather_schema)
df_stations.createOrReplaceTempView(„weather")
# analog Luftdaten und Stationsliste laden
join = spark.sql("
SELECT *
FROM weather
JOIN stations
ON weather.STATION_ID_WEATHER =
stations.closest_weather_station_id
JOIN air
ON stations.STATION_ID_AIR = air.MESSSTELLE
WHERE weather.MESS_DATUM = air.MESSDATUM
")
join.count()
17
Wie komme ich an
Wetterdaten
heran?
Muss ich etwas
dafür bezahlen?
Reichen meine
Erfahrungswerte/Bauchgefühl nicht
aus?Wie kann ich das
Wetter in
Vorhersagemodelle
einfließen lassen?
Wie verbinde ich
Wetterdaten mit
betrieblichen Kennzahlen?
Wie messe ich den
Einfluss des
Wetters?
 Hat die Sonnenscheindauer Einfluss
auf die Luftverschmutzung?
18
Ziel 1: Einfluss des Wetters messen
 Hat die Windgeschwindigkeit Einfluss
auf die Luftverschmutzung?
FEINSTAUB
Punktwolke (Scatterplot)
Regressionsgerade
FEINSTAUB
WINDGESCHWINDIGKEIT
 Korrelationskoeffizienten (Pearson)
19
Ziel 1: Einfluss des Wetters messen
Korrelation (nach Pearson) erkennt nur lineare
Zusammenhänge.
 Andere Korrelationsverfahren prüfen
 Zusammenhang visuell analysieren
Stärkster Zusammenhang: Wind, Temperatur
Kein Zusammenhang: Luftfeuchtigkeit, Sonnenstunden
FEINSTAUB
Wertebereich: {-1,0 … +1,0}
20
Wie komme ich an
Wetterdaten
heran?
Muss ich etwas
dafür bezahlen?
Reichen meine
Erfahrungswerte/Bauchgefühl nicht
aus?
Wie verbinde ich
Wetterdaten mit
betrieblichen Kennzahlen?
Wie messe ich den
Einfluss des
Wetters?
Wie kann ich das
Wetter in
Vorhersagemodelle
einfließen lassen?
Vorhersageziel:
Wird morgen der EU Grenzwert für Feinstaub von 50 µg/m³ überschritten?
21
Ziel 2: Wetter in Vorhersagemodelle einbeziehen
Tag X
historische Daten
- Feinstaubbelastung
- Wetter
- Datum & Ort
Feinstaub(inµg/m³)
Messdatum
 Schwellenwertüberschreitung
 mehr als 50 µg/m³?
 binäre Klassifikation
 KI Modelle: Random Forest,
Log. Regression, Neuronale Netze
 Kategorien
 0-20 µg/m³ , 21-40 µg/m³ , 41- 60 µg/m³
 multivariate Klassifikation
 KI Modelle wie oben
 Präziser Wert der Zielvariablen
 Beispiel: 26 µg/m³
 KI Modelle: Regression
22
Varianten von Vorhersagemodellen
23
Populärstes Verfahren im Shallow Learning Bereich
Random Forest / Gradient Boosting Maschines
24
Populärstes Verfahren im Deep Learning Bereich
Neuronale Netze
 Vorhersagegüte („Accuracy“): 92%
25
Ergebnis der Vorhersage
91 % 7 %
1 % 1 %
unter
Grenzwert
unter Grenzwert über Grenzwert
tatsächlich
über
Grenzwert
laut
Modell
 Grenzwertüberschreitungen kommen nur selten vor (8%) => ungleichmäßige Verteilung
26
Verbesserung der Vorhersagegüte
91 % 7 %
1 % 1 %
unter
Grenzwert
unter Grenzwert über Grenzwert
tatsächlich
über
Grenzwert
laut
Modell
Erhöhung der Trefferquote der Überschreitungen durch
 Einbeziehen weiterer aussagekräftiger Merkmale ins Modell (z.B. Verkehrsdaten,
Emissionsdaten)
 Änderung der Verteilung der Trainingsdaten („resampling“)
 Ausblenden von Datensätzen mit Grenzwertunterschreitungen
 Replikation der Datensätze mit Grenzwertüberschreitung
27
Nutzen
 Dynamische Verkehrsregulierung bei Bedarf
… anstatt Fahrverbote für Dieselfahrzeuge das ganze Jahr
28
Beispiel eines geschäftlichen Anwendungsfalls
Ein
perfekter
Tag für
Haselnuss
Bei diesem Wetter
muss es Eis am Stiel
sein!
26% Umsatzsteigerung 34% Ausschussreduzierung
29
Weitere Beispiele von geschäftlichen Anwendungsfällen
Energiekonzern sagt
morgigen Strombedarf voraus
Einzelhändler sagt Nachfrage
nach Artikeln voraus
Veranstalter schätzt
erwartete Besucherzahl
Bedarfsgerechte Planung Gewinn
erhöhen
30
Wir messen den Einfluss von Wetter auf Ihre Kennzahlen
Ihre Daten
Erkenntnisse über den
Einfluss des Wetters
auf Ihr Geschäft
Big Data Cluster
statistische & KI Analysen
Input Layer
Hidden Layer
Daniela Nicola
Beraterin, Data Analytics
daniela.nicola@mt-ag.com
31
Zusammenfassung
Alexander Meinert
Berater, Data Analytics
alexander.meinert@mt-ag.com
 Wetter hat Einfluss auf viele Branchen
 Unternehmensdaten mit Wetterdaten verbinden
durch Geomatching & Joins
 Wettereinfluss messen mittels statistischer
Verfahren
 Kennzahlen vorhersagen mit
Klassifikationsmodellen
 Nutzen: Verbessertes Geschäftsverständnis,
präzisere Vorhersagen

Weitere ähnliche Inhalte

Empfohlen

Storytelling For The Web: Integrate Storytelling in your Design Process
Storytelling For The Web: Integrate Storytelling in your Design ProcessStorytelling For The Web: Integrate Storytelling in your Design Process
Storytelling For The Web: Integrate Storytelling in your Design Process
Chiara Aliotta
 
Artificial Intelligence, Data and Competition – SCHREPEL – June 2024 OECD dis...
Artificial Intelligence, Data and Competition – SCHREPEL – June 2024 OECD dis...Artificial Intelligence, Data and Competition – SCHREPEL – June 2024 OECD dis...
Artificial Intelligence, Data and Competition – SCHREPEL – June 2024 OECD dis...
OECD Directorate for Financial and Enterprise Affairs
 
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
SocialHRCamp
 
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
Christy Abraham Joy
 

Empfohlen (20)

Storytelling For The Web: Integrate Storytelling in your Design Process
Storytelling For The Web: Integrate Storytelling in your Design ProcessStorytelling For The Web: Integrate Storytelling in your Design Process
Storytelling For The Web: Integrate Storytelling in your Design Process
 
Artificial Intelligence, Data and Competition – SCHREPEL – June 2024 OECD dis...
Artificial Intelligence, Data and Competition – SCHREPEL – June 2024 OECD dis...Artificial Intelligence, Data and Competition – SCHREPEL – June 2024 OECD dis...
Artificial Intelligence, Data and Competition – SCHREPEL – June 2024 OECD dis...
 
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
 
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 

Verhagelt das Wetter Ihren Geschäftserfolg? Eine KI Analyse

  • 1. Verhagelt das Wetter Ihren Geschäftserfolg? Eine KI Analyse Daniela Nicola Alexander Meinert Feb 2019
  • 2. Agenda Motivation Vorzeigeprojekt Einfluss des Wetters messen Vorhersagemodelle Nutzen 2
  • 4. 4 Wetterextreme nehmen durch Klimawandel zu München, Januar 2019 Rhein bei Düsseldorf, 2018
  • 5. 5 Einfluss des Wetters auf Online Verkaufszahlen Quelle: www.weatherads.com ONLINE UMSATZ vs. SONNENSTUNDEN Umsatz Sonnenstunden/Tag Umsatz Sonnenstunden/Tag
  • 6. 6 Aller Anfang ist schwer … Wie komme ich an Wetterdaten heran? Muss ich etwas dafür bezahlen? Wie verbinde ich Wetterdaten mit betrieblichen Kennzahlen? Wie messe ich den Einfluss des Wetters? Wie kann ich das Wetter in Vorhersagemodelle einfließen lassen? Projekt Reichen meine Erfahrungswerte/Bauchgefühl nicht aus?
  • 7. Feinstaub Vorzeigeprojekt: Wetter und Luftqualität 7 Wetter Ziel 1: Einflus s messe n Betriebliche Kennzahlen Ziel 2: Vorhersage n
  • 9. 9 Wie komme ich an Wetterdaten heran? Muss ich etwas dafür bezahlen? Reichen meine Erfahrungswerte/Bauchgefühl nicht aus? Wie verbinde ich Wetterdaten mit betrieblichen Kennzahlen? Wie messe ich den Einfluss des Wetters? Wie kann ich das Wetter in Vorhersagemodelle einfließen lassen?
  • 10. 10 Wie komme ich an Wetterdaten heran? Muss ich etwas dafür bezahlen? Reichen meine Erfahrungswerte/Bauchgefühl nicht aus? Wie verbinde ich Wetterdaten mit betrieblichen Kennzahlen? Wie messe ich den Einfluss des Wetters? Wie kann ich das Wetter in Vorhersagemodelle einfließen lassen?
  • 11. Quellen & Kosten für Wetterdaten 11  historische Messwerte, aktuelle Vorhersagen  501 Messstationen in Deutschland  14 Wetterattribute  Sonnenscheindauer  Niederschlagsmenge  Temperatur (min, max, ⌀),  Windgeschwindigkeit  Luftdruck  Schneehöhe  …  Granularität: Jahr, Monat, Tag, Std., Minute  Zeitraum: je nach Station, meist 30+ Jahre  Daten verfügbar über Open Data Portal und Python API Entgeltfrei auch für wirtschaftliche Zwecke (Geodatenzugangsgesetz) Andere Anbieter • www.openweathermap.org • www.wetterkontor.de • www.weather.com (IBM)
  • 12. 12 Wie komme ich an Wetterdaten heran? Muss ich etwas dafür bezahlen? Reichen meine Erfahrungswerte/Bauchgefühl nicht aus? Wie messe ich den Einfluss des Wetters? Wie kann ich das Wetter in Vorhersagemodelle einfließen lassen? Wie verbinde ich Wetterdaten mit betrieblichen Kennzahlen?
  • 13. Für jede Feinstaub Station: 1. Bestimme Geo Koordinaten  mit Google Maps Rest API 2. Finde nächstgelegene Wetterstation  mit Python Bibliothek dwdweather 13 Geomatching Feinstaub-Station Wetter-Station from dwdweather import DwdWeather # Erstelle client dw = DwdWeather() # Finde nächste Station zu einer Position closest = dw.nearest_station(lon=7, lat=51)
  • 14. Für jeden Standort: 1. Bestimme Geo Koordinaten  mit Google Maps Rest API 2. Finde nächstgelegene Wetterstation  mit Python Bibliothek dwdweather 14 Geomatching für Ihre Standorte Ihre Standorte Wetter-Station Gleiche Vorgehensweise
  • 15. 15 Vereinen von Wetter- und Luftqualitätsdaten Join Schlüsselattribute für Join: - Datum & Wetterstations-ID Variante: - Datum des Vortages, also Wetter des Vortages
  • 16. 16 Vereinen von Wetter- und Luftqualitätsdaten (Anfrage SparkSQL) Variante: Join mit Wetterdaten des Vortages %pyspark df_stations = spark.read.csv(weather.csv, sep=";", header=True, encoding="UTF-8", schema=weather_schema) df_stations.createOrReplaceTempView(„weather") # analog Luftdaten und Stationsliste laden join = spark.sql(" SELECT * FROM weather JOIN stations ON weather.STATION_ID_WEATHER = stations.closest_weather_station_id JOIN air ON stations.STATION_ID_AIR = air.MESSSTELLE WHERE weather.MESS_DATUM = air.MESSDATUM ") join.count()
  • 17. 17 Wie komme ich an Wetterdaten heran? Muss ich etwas dafür bezahlen? Reichen meine Erfahrungswerte/Bauchgefühl nicht aus?Wie kann ich das Wetter in Vorhersagemodelle einfließen lassen? Wie verbinde ich Wetterdaten mit betrieblichen Kennzahlen? Wie messe ich den Einfluss des Wetters?
  • 18.  Hat die Sonnenscheindauer Einfluss auf die Luftverschmutzung? 18 Ziel 1: Einfluss des Wetters messen  Hat die Windgeschwindigkeit Einfluss auf die Luftverschmutzung? FEINSTAUB Punktwolke (Scatterplot) Regressionsgerade FEINSTAUB WINDGESCHWINDIGKEIT
  • 19.  Korrelationskoeffizienten (Pearson) 19 Ziel 1: Einfluss des Wetters messen Korrelation (nach Pearson) erkennt nur lineare Zusammenhänge.  Andere Korrelationsverfahren prüfen  Zusammenhang visuell analysieren Stärkster Zusammenhang: Wind, Temperatur Kein Zusammenhang: Luftfeuchtigkeit, Sonnenstunden FEINSTAUB Wertebereich: {-1,0 … +1,0}
  • 20. 20 Wie komme ich an Wetterdaten heran? Muss ich etwas dafür bezahlen? Reichen meine Erfahrungswerte/Bauchgefühl nicht aus? Wie verbinde ich Wetterdaten mit betrieblichen Kennzahlen? Wie messe ich den Einfluss des Wetters? Wie kann ich das Wetter in Vorhersagemodelle einfließen lassen?
  • 21. Vorhersageziel: Wird morgen der EU Grenzwert für Feinstaub von 50 µg/m³ überschritten? 21 Ziel 2: Wetter in Vorhersagemodelle einbeziehen Tag X historische Daten - Feinstaubbelastung - Wetter - Datum & Ort Feinstaub(inµg/m³) Messdatum
  • 22.  Schwellenwertüberschreitung  mehr als 50 µg/m³?  binäre Klassifikation  KI Modelle: Random Forest, Log. Regression, Neuronale Netze  Kategorien  0-20 µg/m³ , 21-40 µg/m³ , 41- 60 µg/m³  multivariate Klassifikation  KI Modelle wie oben  Präziser Wert der Zielvariablen  Beispiel: 26 µg/m³  KI Modelle: Regression 22 Varianten von Vorhersagemodellen
  • 23. 23 Populärstes Verfahren im Shallow Learning Bereich Random Forest / Gradient Boosting Maschines
  • 24. 24 Populärstes Verfahren im Deep Learning Bereich Neuronale Netze
  • 25.  Vorhersagegüte („Accuracy“): 92% 25 Ergebnis der Vorhersage 91 % 7 % 1 % 1 % unter Grenzwert unter Grenzwert über Grenzwert tatsächlich über Grenzwert laut Modell
  • 26.  Grenzwertüberschreitungen kommen nur selten vor (8%) => ungleichmäßige Verteilung 26 Verbesserung der Vorhersagegüte 91 % 7 % 1 % 1 % unter Grenzwert unter Grenzwert über Grenzwert tatsächlich über Grenzwert laut Modell Erhöhung der Trefferquote der Überschreitungen durch  Einbeziehen weiterer aussagekräftiger Merkmale ins Modell (z.B. Verkehrsdaten, Emissionsdaten)  Änderung der Verteilung der Trainingsdaten („resampling“)  Ausblenden von Datensätzen mit Grenzwertunterschreitungen  Replikation der Datensätze mit Grenzwertüberschreitung
  • 27. 27 Nutzen  Dynamische Verkehrsregulierung bei Bedarf … anstatt Fahrverbote für Dieselfahrzeuge das ganze Jahr
  • 28. 28 Beispiel eines geschäftlichen Anwendungsfalls Ein perfekter Tag für Haselnuss Bei diesem Wetter muss es Eis am Stiel sein! 26% Umsatzsteigerung 34% Ausschussreduzierung
  • 29. 29 Weitere Beispiele von geschäftlichen Anwendungsfällen Energiekonzern sagt morgigen Strombedarf voraus Einzelhändler sagt Nachfrage nach Artikeln voraus Veranstalter schätzt erwartete Besucherzahl Bedarfsgerechte Planung Gewinn erhöhen
  • 30. 30 Wir messen den Einfluss von Wetter auf Ihre Kennzahlen Ihre Daten Erkenntnisse über den Einfluss des Wetters auf Ihr Geschäft Big Data Cluster statistische & KI Analysen Input Layer Hidden Layer
  • 31. Daniela Nicola Beraterin, Data Analytics daniela.nicola@mt-ag.com 31 Zusammenfassung Alexander Meinert Berater, Data Analytics alexander.meinert@mt-ag.com  Wetter hat Einfluss auf viele Branchen  Unternehmensdaten mit Wetterdaten verbinden durch Geomatching & Joins  Wettereinfluss messen mittels statistischer Verfahren  Kennzahlen vorhersagen mit Klassifikationsmodellen  Nutzen: Verbessertes Geschäftsverständnis, präzisere Vorhersagen

Hinweis der Redaktion

  1. Bildquelle: https://www.ibmbigdatahub.com/blog/weather-data-analytics-helping-retailers-predict-and-meet-customer-demand
  2. Frage: Glauben Sie, dass das Wetter einen Einfluss hat auf Ihre Branche? Wenn viele Hände oben, Folgefrage: Fließt das Wetter aktuell schon in Vorhersagemodelle ein? Land- und Forstwirtschaft: Knapp 80 % der Varianz der Ernteerträge in Deutschland lassen sich mit dem Wetter erklären. (Quelle: https://www.dwd.de/DE/fachnutzer/landwirtschaft/landwirtschaft_node.html) Auswirkungen auf Lebensmittelproduktion und –handel Tourismus: Kindheitserinnerungen an Sommer, in denen es durchgehend so kühl war, dass man nicht an den Strand gehen konnte. Schmerzhafte Einbußen für Hotellerie und Gastronomie Liste der Beispiele ist lang. Das Wetter hat Auswirkungen auf Rohstoffpreise, Lagerhaltung & Lieferkette, Einkaufs- und Verkaufspreise, Personalplanung, Transportzeiten, Ausfälle, Energiekosten
  3. Bilderquellen: http://www.tagesschau.de/multimedia/bilder/schneefaelle-101.html, https://www.cicero.de/kultur/hitze-sahara-sommer-duerre-waldbrand Dürresommer 2018 in ganz Europa Binnenschifffahrt auf dem Rhein kam zum Erliegen, Mineralölnotreserven mussten angezapft werden. 25% Rückgang der Binneschifffahrt in 2018 im Vergleich zum Vorjahr. Das lag nur am Wetter. Problem: Wetterextreme werden durch den Klimawandel in den nächsten Jahren zunehmen (Dürren, Stürme, Dauerregen)
  4. Sie denken vielleicht „meine Firma ist nicht beeinflusst vom Wetter, ich habe ja nur einen Onlineshop.“ Invertierter Zusammenhang von Sonnenstunden und Umsatz eines Internethandels. Kenntnis dieses Zusammenhangs kann sehr nützlich sein für das Schalten von Werbung im Internet. Quelle: http://www.weatherads.io/blog/2014/august/weather-and-ecommerce-how-weather-impacts-retail-website-traffic-and-online-sales Kernaussage: bei schönem Wetter verbringen Menschen mehr Zeit draußen und das Geschäft verlagert sich von Online zu konventionellen Läden (Innenstädte, etc.)
  5. Daten über Luftqualität: offen zugänglich, verlässlich, feingranular -> sehr gut geeignet. Thema von politischer Brisanz durch Dieselkrise Quelle: https://www.lanuv.nrw.de/umwelt/luft/immissionen/messorte-und-werte/
  6. Tonspur: Wetterdaten von ganz Deutschland der letzten 10 Jahre Luftdaten von NRW von 5 Jahren
  7. https://www.researchgate.net/publication/220391454_Toward_a_Theory_of_Behavioral_Operations Harvard Studie, 2007: Menschen sind zu selbstsicher in ihren Entscheidungen und Meinungen wenn sie Vorhersagen basierend auf ihrer Erfahrung treffen. Je größer und komplexer ein Unternehmen, je weniger kann man sich auf diese ungenaue Herangehensweise verlassen. „Toward a Theory of Behavioral Operations“, by Francesca Gino and Gary Pisano
  8. Die Funktion cdist aus der Python Bibliothek scipy kann ebenfalls zur Berechnung der euklidischen Distanz zwischen Standort und Wetterstation genutzt werden
  9. Die Funktion cdist aus der Python Bibliothek scipy kann ebenfalls zur Berechnung der euklidischen Distanz zwischen Standort und Wetterstation genutzt werden
  10. Typischerweise arbeitet man im ML Bereich mit Daten, in denen alle verfügbaren Attribute in einer Zeile konsolidiert sind Im Beispielprojekt waren die Daten in Hadoop / HDFS gespeichert. Daher wird hier Spark zur Zusammenführung der Daten benutzt (PySpark und Spark SQL)
  11. Im Beispielprojekt waren die Daten in Hadoop / HDFS gespeichert. Daher wird hier Spark zur Zusammenführung der Daten benutzt (PySpark und Spark SQL)
  12. Sie könnten Korrelation bestimmen zwischen Wetter & Heizkosten, Wetter & Anzahl Kunden/Besucher, Wetter & Umsatz / Umsatz aufgeteilt nach bestimmten Artikeln, etc. Was tun mit Erkenntnissen der Korrelation? In erster Linie zu Verständniszwecken. Man kann alle Merkmale in KI Modelle nehmen. Ausnahme: solche Merkmale herausnehmen, die untereinander stark korrelieren, z.B. Sonnenstunden und Bedeckungsgrad.
  13. Was steht auf dem Spiel? Bei mehr als 35 Überschreitungen/Jahr drohen Klagen und Sanktionen der EU Deutschland wurde bereits im Mai 2018 vor dem Europäischen Gerichtshof verklagt, u.a. wegen Überschreitung des erlaubten jährlichen Stickstoffdioxidwertes. https://ec.europa.eu/germany/news/20180517-luftverschmutzung-klage_de
  14. automatisch generierte Entscheidungsbäume Populärstes Verfahren im Shallow Learning laut Kaggle, Quelle: Buch „Deep Learning mit Python und Keras“ von Francios Chollet, S. 42 Aufwendiges Feature Engineering / Selektion nicht nötig: Kategoriale Variablen (z.B. Monatsname) können direkt ins Model fließen, ohne vorher umgewandelt zu werden Aussortieren: Attribute, die hohe Korrelation haben (z.B. Sonnenscheindauer und Bedeckungsgrad) Attribute mit vielen Nullwerten
  15. Beide Verfahren haben gleiche Ergebnisse geliefert 91% tatsächliche Grenzunterschreitungen, davon 99% korrekt vorhergesagt (Trefferquote der Unterschreitungen) 8% tatsächliche Grenzüberschreitungen, davon 12,5% korrekt vorhergesagt (Trefferquote der Überschreitungen)
  16. 2. Punkt ist nur sinnvoll, wenn false positives besser sind als true negatives, also wenn Grenzüberschreitungen lieber einmal mehr vorausgesagt werden sollen als einmal weniger reduntante grenzwertüberschreitung
  17. Durch Unwissenheit sind übertriebene Maßnahmen die einzig verbleibende Antwort
  18. 2 Eishersteller untersuchten mit Hilfe von IBM Watson WeatherFx die Beliebtheit / Verkaufszahlen von Eissorten in Abhängigkeit des Wetters, fand Zusammenhänge heraus und konnte damit die Herstellung und den Vertrieb auf die erwartete Nachfrage anpassen. https://www.ibm.com/case-studies/leading-ice-cream-brand-watson-advertising validated that warmer temperatures boost ice cream sales also found correlations with sales in colder weather, aligning with our weather and emotions research that shows that people seek our comfort food during colder weather.
  19. Bestellmengen anpassen anstatt Über- oder Unterbestellungen Preise abstimmen Umsatz erhöhen Extra Personal einplanen bei Bedarf => Einnahmen steigern
  20. Sie wollen herausfinden, wie groß der Einfluss von Wetter, Feiertagen/Ferien oder anderen externen Faktoren auf ihre betrieblichen Kennzahlen ist? Geben Sie uns ihre anonymisierten Daten, und wir verbinden es mit den gespeicherten Wetterdaten, und geben ihnen Metriken über den Wettereinfluss zurück. Wir bauen mit Ihnen Vorhersagemodelle auf. Tun sie was mit ihren Daten? Nutzen Sie die Chance!
  21. Marketing, Ressourcenplanung, Einkaufs- und Lagerhaltung, Preisoptimierung