SlideShare ist ein Scribd-Unternehmen logo
#WISSENTEILEN
Warum der Computer
"Nein" sagt
–
Mehr Nachvollziehbarkeit dank
Explainable AI
@_openKnowledge
Tim Wüllner | open knowledge GmbH
#WISSENTEILEN
Machine Learning Engineer
OPEN KNOWLEDGE
Tim Wüllner
#WISSENTEILEN
Explainable AI?
Warum?
Was ist Explainable AI (XAI)?
BLACK BOX
Input Output
XAI
XAI: Ein vollgepackter Rucksack
Eigenschaften:
• Kompatibilität
• Scope
• Vor- und Nachteile
https://www.reuters.com/article/us-amazon-com-jobs-automation-insight/amazon-scraps-secret-ai-recruiting-tool-
that-showed-bias-against-women-idUSKCN1MK08G/?utm_source=morning_brew
https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing
https://www.labsix.org/physical-objects-that-fool-neural-nets/
„Warum wurde auf dem
Ultraschallbild ein Tumor
klassifiziert?“
„Warum wurde meine
Kreditanfrage
abgelehnt?“
„Warum habe ich ein
höheres Risiko an einer
Krankheit zu erkranken?“
Aber auch abseits dieser Probleme…
Performanz
Explainability
Lineare
Modelle
Decision
Trees
XGBoost
Deep Learning
Performanz
vs.
Explainability
Was hält uns eigentlich davon ab?
#WISSENTEILEN
Der Usecase
Der Usecase
„Ist an der Bike-Sharing Station
ein Fahrrad verfügbar oder
nicht?“
Bike-Sharing Dataset
Saison:
1. Spring
2. Summer
3. Autumn
4. Winter
Wetter:
1. Klar, teilweise bewölkt
2. nebelig, bewölkt
3. Leichter Schnee / Regen / Gewitter
4. Starker Regen + Gewitter + Hagel, Schnee
Gefühlte Temperatur
Target cnt:
Gesamtzahl aller
gemieteten Räder
(casual + registriert)
Luftfeuchtigkeit
Datum (2 Jahre)
Zeitreihe der gemieteten Räder
Weitere
Insights
Data Preparation
One-Hot-
Encoding
Scaling
Berechnung
binärer
Target-
Variable
Preparation-Pipeline
Bike-Sharing
Dataset
Usecase
Dataset
bikes_available = cnt < threshold
Usecase-Dataset: Target-Verteilung
Usecase-Dataset: Target-Tagesverlauf
Kann so sein:
Aber auch so:
#WISSENTEILEN
XAI Hands-On
Ein Blick auf den XAI-Reiseplan…
0
Odds Ratio
?
?
Odds-Ratio am Beispiel
Logistic Regression
Wahrscheinlichkeit
Feature
• Simples Klassifikations-Modell
• Accuracy: 0.81
Analyse der Gewichte
Logistic
Regression
Linear
Regression
𝑦 = 𝑤0 + 𝑤1𝑥1 + … + 𝑤𝑛𝑥𝑛
Modell:
Erklärung:
„Wenn x1 um eine Einheit
vergrößert wird, vergrößert
sich y um w1!“
Analyse der Gewichte
Logistic
Regression
Linear
Regression
𝑦 = 𝑤0 + 𝑤1𝑥1 + … + 𝑤𝑛𝑥𝑛
Modell:
Erklärung:
„Wenn x1 um eine Einheit
vergrößert wird, vergrößert
sich y um w1!“
Modell:
Erklärung:
𝑃 𝑦 = 1 =
1
1 + 𝑒(−(𝑤0+𝑤1𝑥1+ … +𝑤𝑛𝑥𝑛)
Analyse der Gewichte
Ausgangsformel:
Umformen in Linear
Regression Stil:
l𝑜𝑔
𝑃(𝑦 = 1)
𝑃(𝑦 = 0)
= 𝑤0 + 𝑤1𝑥1 + … + 𝑤𝑛𝑥𝑛
𝑃 𝑦 = 1 =
1
1 + 𝑒(−(𝑤0+𝑤1𝑥1+ … +𝑤𝑛𝑥𝑛)
Erklärung:
„Wenn x1 um eine Einheit vergrößert
wird, vergrößert sich log(odds) um w1!“
𝑜𝑑𝑑𝑠 =
𝑃(𝑦 = 1)
𝑃(𝑦 = 0)
Beachte:
Odds Ratio
:
Nach weiteren
Umstellungen:
l𝑜𝑔 𝑜𝑑𝑑𝑠 = 𝑤0 + 𝑤1𝑥1 + … + 𝑤𝑛𝑥𝑛
Erklärung:
„Wenn x1 um eine Einheit vergrößert
wird, vergrößern sich die odds um den
Faktor 𝒆𝒘𝟏!“
𝑜𝑑𝑑𝑠𝑥𝑖+1
𝑜𝑑𝑑𝑠𝑥𝑖
= 𝑒𝑤𝑖  𝑜𝑑𝑑𝑠𝑥𝑖+1 = 𝑒𝑤𝑖𝑜𝑑𝑑𝑠𝑥𝑖
Ein Beispiel:
… mit Feature x1 = Temperatur
& Gewicht w1 = 0.7
„Wenn x1 um eine Einheit vergrößert wird, vergrößern
sich die odds um den Faktor 𝒆𝒘𝟏!“
„Wenn die Temperatur um einen Grad steigt, erhöht sich
die Chance (odds) um den Faktor 𝑒0.𝟕(= 2).
Also verdoppelt sich die Chance, dass Fahrräder
verfügbar sind.“*
*anderen Variablen bleiben gleich. Temperatur wurde nicht skaliert.
Usecase: Odds Ratio
𝑜𝑑𝑑𝑠𝑥𝑖+1
𝑜𝑑𝑑𝑠𝑥𝑖
= 𝑒𝑤𝑖
Odds Ratio
Vorteile
Modell-
Spezifisch
Scope
• Einfache Berechnung
• Stärke und Richtung des Einflusses
• Odds Ratio ist gewöhnungsbedürftig
• Logistic Regression meist zu schlechte
Genauigkeit
Kompatibilität
Nachteile
Global
Ein Blick auf den XAI-Reiseplan…
1
?
?
Odds
Ratio
Ein Blick auf den XAI-Reiseplan…
1
?
Odds-Ratio
Odds
Ratio
Permutation
Importance
Permutation Importance am Beispiel
Decision Tree
• Geeignet für nicht-lineare Klassifikation
• Accuracy: 0.92
XAI: Permutation Importance
Reference Score s
1 Fit &
Validate
XAI: Permutation Importance
Reference Score s
k-mal für
jedes Feature i:
1
Score sk
2
Zufällige
Werte für
Feature i
Fit &
Validate
Validate
K-mal
XAI: Permutation Importance
Reference Score s
k-mal für
jedes Feature i:
1
Score sk
2
Zufällige
Werte für
Feature i
𝑖𝑚𝑝𝑖 = 𝑠 −
1
𝐾
𝑘=1
𝐾
𝑠𝑘𝑖
Fit &
Validate
Validate
K-mal
XAI: Permutation Importance
Fit &
Validate
Reference Score s
k-mal für
jedes Feature i:
Validate
K-mal
Score sk
2
Zufällige
Werte für
Feature i
𝑖𝑚𝑝𝑖 = 𝑠 −
1
𝐾
𝑘=1
𝐾
𝑠𝑘𝑖
BLACK
BOX
BLACK
BOX
1
Usecase: Permutation Importance
Permutation Importance
Vorteile
Modell-
Agnostisch
Scope
• Einfache Berechnung
• Information über Sensitivität
• Direkter Zusammenhang zu Scores
• Nutzung pot. unrealistischer Daten
• Nur Stärke, nicht die Richtung des Einflusses
Kompatibilität
Nachteile
Global
Ein Blick auf den XAI-Reiseplan…
1
?
Odds-Ratio
Odds
Ratio
Permutation
Importance
Ein Blick auf den XAI-Reiseplan…
2 Odds-Ratio
Permutation-
Importance
Odds
Ratio
Permutation
Importance
LIME
Last Stop: XGBoost Accuracy: 0.95
Local Interpretable Model-Agnostic
Explanations (LIME)
Feature 1
Feature
2
Rad nicht verfügbar
Rad Verfügbar
Modell-
Decision Boundary
Erkläre!
Local Interpretable Model-Agnostic
Explanations (LIME)
Feature 1
Feature
2
Erkläre!
Local Interpretable Model-Agnostic
Explanations (LIME)
Künstlich
erzeugte Daten
Rad nicht verfügbar
Rad Verfügbar
Generiere neue
Vorhersagen
in Nachbarschaft
&
Gewichte basierend
auf Kernel
1
Kernel
Local Interpretable Model-Agnostic
Explanations (LIME)
Surrogate-Modell-
Decision Boundary
Original Modell
Vorhersage
Rad nicht verfügbar
Rad Verfügbar
Fitte simples
Surrogate-Modell
auf generierte
Vorhersagen
2
Local Interpretable Model-Agnostic
Explanations (LIME)
Bestimme
Feature-Importance
des Surrogates
3
𝑦 = 𝑤0 + 𝑤1𝑥1 + … + 𝑤𝑛𝑥𝑛
Usecase: LIME
Zu erklärende
Instanz
Das geht auch mit Bildern…
https://christophm.github.io/interpretable-ml-book/lime.html
LIME
Vorteile
Modell-
Agnostisch
Scope
• Einblick in sehr komplexe Modelle
• Tabellarisch, Bilder und Texte
• Richtung und Stärke des Einflusses
• Wahl des Kernels hat großen Einfluss auf
Ergebnis
• Wahl der Nachbarschaft
Kompatibilität
Nachteile
Lokal
Ein Blick auf den XAI-Reiseplan…
2 Odds-Ratio
Permutation-
Importance
Odds
Ratio
Permutation
Importance
LIME
Ein Blick auf die Beute..
3
Odds-Ratio
Permutation-
Importance
LIME
Agnostisch
Spezifisch
Lokal Global
Wir brauchen einen größeren
Rucksack…
Odds
Raito
Permutation
Importance
LIME
SHAP
Partial
Dependency
Plots
Saliency
Maps
Zum Nachschlagen
Frei verfügbar unter:
https://christophm.github.io/
interpretable-ml-book/
A N S P R E C H P A R T N E R
TIM WÜLLNER
Machine Learning Engineer
Kaiserliche Post, Poststraße 1, 26122 Oldenburg
www.openknowledge.de
+49 (0) 441 4082 0
tim.wuellner@openknowledge.de
www.linkedin.com/in/tim-wuellner/
Ich lade dich auf einen
remote Kaffee ein ;-)
Hier direkt
Termin sichern!
#WISSENTEILEN
Zeit für
Fragen?
Immer!

Weitere ähnliche Inhalte

Mehr von OPEN KNOWLEDGE GmbH

Ready for the Future: Jakarta EE in Zeiten von Cloud Native & Co
Ready for the Future: Jakarta EE in Zeiten von Cloud Native & CoReady for the Future: Jakarta EE in Zeiten von Cloud Native & Co
Ready for the Future: Jakarta EE in Zeiten von Cloud Native & Co
OPEN KNOWLEDGE GmbH
 
Shared Data in verteilten Architekturen
Shared Data in verteilten ArchitekturenShared Data in verteilten Architekturen
Shared Data in verteilten Architekturen
OPEN KNOWLEDGE GmbH
 
Machine Learning mit TensorFlow.js
Machine Learning mit TensorFlow.jsMachine Learning mit TensorFlow.js
Machine Learning mit TensorFlow.js
OPEN KNOWLEDGE GmbH
 
KI und Architektur
KI und ArchitekturKI und Architektur
KI und Architektur
OPEN KNOWLEDGE GmbH
 
It's not Rocket Science: Neuronale Netze
It's not Rocket Science: Neuronale NetzeIt's not Rocket Science: Neuronale Netze
It's not Rocket Science: Neuronale Netze
OPEN KNOWLEDGE GmbH
 
Shared Data in verteilten Systemen
Shared Data in verteilten SystemenShared Data in verteilten Systemen
Shared Data in verteilten Systemen
OPEN KNOWLEDGE GmbH
 
Business-Mehrwert durch KI
Business-Mehrwert durch KIBusiness-Mehrwert durch KI
Business-Mehrwert durch KI
OPEN KNOWLEDGE GmbH
 
Mehr Sicherheit durch Automatisierung
Mehr Sicherheit durch AutomatisierungMehr Sicherheit durch Automatisierung
Mehr Sicherheit durch Automatisierung
OPEN KNOWLEDGE GmbH
 
API-Design, Microarchitecture und Testing
API-Design, Microarchitecture und TestingAPI-Design, Microarchitecture und Testing
API-Design, Microarchitecture und Testing
OPEN KNOWLEDGE GmbH
 
Supersonic Java für die Cloud: Quarkus
Supersonic Java für die Cloud: QuarkusSupersonic Java für die Cloud: Quarkus
Supersonic Java für die Cloud: Quarkus
OPEN KNOWLEDGE GmbH
 
Hilfe, ich will meinen Monolithen zurück!
Hilfe, ich will meinen Monolithen zurück!Hilfe, ich will meinen Monolithen zurück!
Hilfe, ich will meinen Monolithen zurück!
OPEN KNOWLEDGE GmbH
 
Das ist doch alles nur Frontend - Wer braucht da schon Architektur?
Das ist doch alles nur Frontend - Wer braucht da schon Architektur?Das ist doch alles nur Frontend - Wer braucht da schon Architektur?
Das ist doch alles nur Frontend - Wer braucht da schon Architektur?
OPEN KNOWLEDGE GmbH
 
Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“
Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“
Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“
OPEN KNOWLEDGE GmbH
 
Das Product Goal oder "Ohne Ziele laufen eben alle in die Richtung, die ihnen...
Das Product Goal oder "Ohne Ziele laufen eben alle in die Richtung, die ihnen...Das Product Goal oder "Ohne Ziele laufen eben alle in die Richtung, die ihnen...
Das Product Goal oder "Ohne Ziele laufen eben alle in die Richtung, die ihnen...
OPEN KNOWLEDGE GmbH
 
Serverless Survival Guide
Serverless Survival GuideServerless Survival Guide
Serverless Survival Guide
OPEN KNOWLEDGE GmbH
 
Die Matrix: Enterprise-Architekturen jenseits von Microservices
Die Matrix: Enterprise-Architekturen jenseits von MicroservicesDie Matrix: Enterprise-Architekturen jenseits von Microservices
Die Matrix: Enterprise-Architekturen jenseits von Microservices
OPEN KNOWLEDGE GmbH
 
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
OPEN KNOWLEDGE GmbH
 
Maschinen ohne Gewissen: wenn KI auf Ethik trifft
Maschinen ohne Gewissen: wenn KI auf Ethik trifftMaschinen ohne Gewissen: wenn KI auf Ethik trifft
Maschinen ohne Gewissen: wenn KI auf Ethik trifft
OPEN KNOWLEDGE GmbH
 
Zukunftssichere Architekturen mit Microservices
Zukunftssichere Architekturen mit MicroservicesZukunftssichere Architekturen mit Microservices
Zukunftssichere Architekturen mit Microservices
OPEN KNOWLEDGE GmbH
 
Modern Web: Trends der Webentwicklung
Modern Web: Trends der WebentwicklungModern Web: Trends der Webentwicklung
Modern Web: Trends der Webentwicklung
OPEN KNOWLEDGE GmbH
 

Mehr von OPEN KNOWLEDGE GmbH (20)

Ready for the Future: Jakarta EE in Zeiten von Cloud Native & Co
Ready for the Future: Jakarta EE in Zeiten von Cloud Native & CoReady for the Future: Jakarta EE in Zeiten von Cloud Native & Co
Ready for the Future: Jakarta EE in Zeiten von Cloud Native & Co
 
Shared Data in verteilten Architekturen
Shared Data in verteilten ArchitekturenShared Data in verteilten Architekturen
Shared Data in verteilten Architekturen
 
Machine Learning mit TensorFlow.js
Machine Learning mit TensorFlow.jsMachine Learning mit TensorFlow.js
Machine Learning mit TensorFlow.js
 
KI und Architektur
KI und ArchitekturKI und Architektur
KI und Architektur
 
It's not Rocket Science: Neuronale Netze
It's not Rocket Science: Neuronale NetzeIt's not Rocket Science: Neuronale Netze
It's not Rocket Science: Neuronale Netze
 
Shared Data in verteilten Systemen
Shared Data in verteilten SystemenShared Data in verteilten Systemen
Shared Data in verteilten Systemen
 
Business-Mehrwert durch KI
Business-Mehrwert durch KIBusiness-Mehrwert durch KI
Business-Mehrwert durch KI
 
Mehr Sicherheit durch Automatisierung
Mehr Sicherheit durch AutomatisierungMehr Sicherheit durch Automatisierung
Mehr Sicherheit durch Automatisierung
 
API-Design, Microarchitecture und Testing
API-Design, Microarchitecture und TestingAPI-Design, Microarchitecture und Testing
API-Design, Microarchitecture und Testing
 
Supersonic Java für die Cloud: Quarkus
Supersonic Java für die Cloud: QuarkusSupersonic Java für die Cloud: Quarkus
Supersonic Java für die Cloud: Quarkus
 
Hilfe, ich will meinen Monolithen zurück!
Hilfe, ich will meinen Monolithen zurück!Hilfe, ich will meinen Monolithen zurück!
Hilfe, ich will meinen Monolithen zurück!
 
Das ist doch alles nur Frontend - Wer braucht da schon Architektur?
Das ist doch alles nur Frontend - Wer braucht da schon Architektur?Das ist doch alles nur Frontend - Wer braucht da schon Architektur?
Das ist doch alles nur Frontend - Wer braucht da schon Architektur?
 
Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“
Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“
Auf geht‘s in die Cloud: „Das kann doch nicht so schwer sein!“
 
Das Product Goal oder "Ohne Ziele laufen eben alle in die Richtung, die ihnen...
Das Product Goal oder "Ohne Ziele laufen eben alle in die Richtung, die ihnen...Das Product Goal oder "Ohne Ziele laufen eben alle in die Richtung, die ihnen...
Das Product Goal oder "Ohne Ziele laufen eben alle in die Richtung, die ihnen...
 
Serverless Survival Guide
Serverless Survival GuideServerless Survival Guide
Serverless Survival Guide
 
Die Matrix: Enterprise-Architekturen jenseits von Microservices
Die Matrix: Enterprise-Architekturen jenseits von MicroservicesDie Matrix: Enterprise-Architekturen jenseits von Microservices
Die Matrix: Enterprise-Architekturen jenseits von Microservices
 
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
Auf gehts in die Cloud: „Das kann doch nicht so schwer sein!“
 
Maschinen ohne Gewissen: wenn KI auf Ethik trifft
Maschinen ohne Gewissen: wenn KI auf Ethik trifftMaschinen ohne Gewissen: wenn KI auf Ethik trifft
Maschinen ohne Gewissen: wenn KI auf Ethik trifft
 
Zukunftssichere Architekturen mit Microservices
Zukunftssichere Architekturen mit MicroservicesZukunftssichere Architekturen mit Microservices
Zukunftssichere Architekturen mit Microservices
 
Modern Web: Trends der Webentwicklung
Modern Web: Trends der WebentwicklungModern Web: Trends der Webentwicklung
Modern Web: Trends der Webentwicklung
 

Warum der Computer "Nein" sagt - Mehr Nachvollziehbarkeit dank Explainable AI

Hinweis der Redaktion

  1. https://us02web.zoom.us/j/82779139937 Meranna Stock-Fotografie-ID:1178528765 Hochgeladen am: 4. Oktober 2019 Kategorien:Fotos | Kreativität
  2. Meranna Stock-Fotografie-ID:1178528765 Hochgeladen am: 4. Oktober 2019 Kategorien:Fotos | Kreativität
  3. Meranna Stock-Fotografie-ID:1178528765 Hochgeladen am: 4. Oktober 2019 Kategorien:Fotos | Kreativität
  4. https://impact.universityofgalway.ie/articles/to-black-box-or-not-to-black-box/
  5. https://www.flaticon.com/de/kostenloses-icon/lupe_2703438?term=lupe&page=1&position=7&origin=search&related_id=2703438 https://www.flaticon.com/de/kostenloses-icon/lupe_2397983?term=lupe&page=1&position=14&origin=search&related_id=2397983
  6. Husky-Wolf Klassifikation 3d-Printed Turtle AMAZON Recruitment Andere
  7. Husky-Wolf Klassifikation 3d-Printed Turtle AMAZON Recruitment Andere
  8. Andere Gründe: Debugging ML Steigerung des Vertrauens Finden von Edge-Cases Wissenschaft: Extraktion von Wissen durch XAI, da das Modell eine Abstraktion der Daten (also der Wahrheit) ist https://www.flaticon.com/free-icon/doctor_921058?term=doctor&page=1&position=25&origin=search&related_id=921058 https://www.flaticon.com/free-icon/sad_7642724?term=sad&page=1&position=11&origin=search&related_id=7642724
  9. Nach https://towardsdatascience.com/explainable-ai-the-data-scientists-new-challenge-f7cac935a5b4
  10. Vielleicht eher sowas: https://www.datacamp.com/tutorial/explainable-ai-understanding-and-trusting-machine-learning-models
  11. Meranna Stock-Fotografie-ID:1178528765 Hochgeladen am: 4. Oktober 2019 Kategorien:Fotos | Kreativität
  12. Möglichkeit von Remote Office aber im Büro gibt es den besseren Kaffee Kein Auto, Fahrrad kaputt, Bus nicht verlässlich Fahrrad leihen, aber App buggy und oft keine Fahrräder mehr da Blöd, weil ich dann meistens schon draußen und hätte viel Zeit sparen können WANN SIND FAHRRÄDER VERFÜGBAR? https://www.flaticon.com/de/kostenloses-icon/mann_4842197?term=person&related_id=4842197
  13. https://archive.ics.uci.edu/dataset/275/bike+sharing+dataset
  14. https://archive.ics.uci.edu/dataset/275/bike+sharing+dataset
  15. Meranna Stock-Fotografie-ID:1178528765 Hochgeladen am: 4. Oktober 2019 Kategorien:Fotos | Kreativität
  16. https://www.flaticon.com/de/kostenloses-icon/schatz_1355958?term=schatz&page=1&position=20&origin=search&related_id=1355958
  17. Lineares Modell für Klassifikation
  18. https://www.flaticon.com/de/kostenloses-icon/blitz_577530?term=blitz&page=1&position=30&origin=search&related_id=577530
  19. https://www.flaticon.com/de/kostenloses-icon/blitz_577530?term=blitz&page=1&position=30&origin=search&related_id=577530
  20. https://www.flaticon.com/de/kostenloses-icon/leichter-regen_1585449?term=regen&page=1&position=58&origin=search&related_id=1585449
  21. Y = w1 * x1 + w0
  22. Y = w1 * x1 + w0
  23. Am meisten Einfluss haben die Features, welche am weitesten von 1 entfernt sind, da bei odds-ratio=1 keine Änderung der Odds bei Feature-Änderung vorliegt.
  24. Zusätzlich: Einfluss der Features scheint nicht linear zu sein Features beeinflussen sich gegenseitig: Season wird einen Einfluss auf Temperatur haben, Hr hat Einfluss auf Temperatur, Gefühlte und echte Temperatur sind korreliert usw. Non-Linear: Decision Tree https://www.flaticon.com/de/kostenloses-icon/stern_5487318?term=bling&page=2&position=96&origin=search&related_id=5487318 https://www.flaticon.com/de/kostenloses-icon/mogen_6645236?term=vorteil&page=1&position=11&origin=search&related_id=6645236
  25. https://www.flaticon.com/de/kostenloses-icon/schatz_1355958?term=schatz&page=1&position=20&origin=search&related_id=1355958 https://www.flaticon.com/de/kostenloses-icon/schatz_1355982?term=schatz&related_id=1355982
  26. https://www.flaticon.com/de/kostenloses-icon/schatz_1355958?term=schatz&page=1&position=20&origin=search&related_id=1355958 https://www.flaticon.com/de/kostenloses-icon/schatz_1355982?term=schatz&related_id=1355982
  27. Dargestellte Baum hat nur eine Accuracy von 0.86
  28. https://scikit-learn.org/stable/modules/permutation_importance.html
  29. https://scikit-learn.org/stable/modules/permutation_importance.html
  30. Wenn negativ: Accuracy ist höher auf zufälligen Daten dieses Features als auf „richtigen“ Daten. Dann hat Feature keinen Einfluss auf Modell-Performance https://scikit-learn.org/stable/modules/permutation_importance.html
  31. https://scikit-learn.org/stable/modules/permutation_importance.html
  32. Zusätzlich: Einfluss der Features scheint nicht linear zu sein Features beeinflussen sich gegenseitig: Season wird einen Einfluss auf Temperatur haben, Hr hat Einfluss auf Temperatur, Gefühlte und echte Temperatur sind korreliert usw. Non-Linear: Decision Tree https://www.flaticon.com/de/kostenloses-icon/stern_5487318?term=bling&page=2&position=96&origin=search&related_id=5487318 https://www.flaticon.com/de/kostenloses-icon/mogen_6645236?term=vorteil&page=1&position=11&origin=search&related_id=6645236
  33. https://www.flaticon.com/de/kostenloses-icon/schatz_1355958?term=schatz&page=1&position=20&origin=search&related_id=1355958 https://www.flaticon.com/de/kostenloses-icon/schatz_1355982?term=schatz&related_id=1355982
  34. https://www.flaticon.com/de/kostenloses-icon/schatz_1355958?term=schatz&page=1&position=20&origin=search&related_id=1355958 https://www.flaticon.com/de/kostenloses-icon/schatz_1355982?term=schatz&related_id=1355982
  35. https://www.flaticon.com/free-icon/checkmark_8832119?term=right&page=1&position=57&origin=search&related_id=8832119 https://www.flaticon.com/free-icon/cancel_12324286?term=wrong&page=1&position=15&origin=search&related_id=12324286
  36. Hier sind auch negative werte möglich. Die grafik muss noch ersetzt werden
  37. Zusätzlich: Einfluss der Features scheint nicht linear zu sein Features beeinflussen sich gegenseitig: Season wird einen Einfluss auf Temperatur haben, Hr hat Einfluss auf Temperatur, Gefühlte und echte Temperatur sind korreliert usw. Non-Linear: Decision Tree https://www.flaticon.com/de/kostenloses-icon/stern_5487318?term=bling&page=2&position=96&origin=search&related_id=5487318 https://www.flaticon.com/de/kostenloses-icon/mogen_6645236?term=vorteil&page=1&position=11&origin=search&related_id=6645236
  38. https://www.flaticon.com/de/kostenloses-icon/schatz_1355958?term=schatz&page=1&position=20&origin=search&related_id=1355958 https://www.flaticon.com/de/kostenloses-icon/schatz_1355982?term=schatz&related_id=1355982
  39. https://www.flaticon.com/de/kostenloses-icon/schatz_1355958?term=schatz&page=1&position=20&origin=search&related_id=1355958 https://www.flaticon.com/de/kostenloses-icon/schatz_1355982?term=schatz&related_id=1355982
  40. https://www.flaticon.com/de/kostenloses-icon/schatz_1355958?term=schatz&page=1&position=20&origin=search&related_id=1355958 https://www.flaticon.com/de/kostenloses-icon/schatz_1355982?term=schatz&related_id=1355982
  41. Meranna Stock-Fotografie-ID:1178528765 Hochgeladen am: 4. Oktober 2019 Kategorien:Fotos | Kreativität
  42. Tree-based models provide an alternative measure of feature importances based on the mean decrease in impurity (MDI). Impurity is quantified by the splitting criterion of the decision trees (Gini, Log Loss or Mean Squared Error). However, this method can give high importance to features that may not be predictive on unseen data when the model is overfitting. Permutation-based feature importance, on the other hand, avoids this issue, since it can be computed on unseen data. Furthermore, impurity-based feature importance for trees are strongly biased and favor high cardinality features (typically numerical features) over low cardinality features such as binary features or categorical variables with a small number of possible categories. Permutation-based feature importances do not exhibit such a bias. Additionally, the permutation feature importance may be computed performance metric on the model predictions and can be used to analyze any model class (not just tree-based models). The following example highlights the limitations of impurity-based feature importance in contrast to permutation-based feature importance: https://scikit-learn.org/stable/auto_examples/inspection/plot_permutation_importance.html#sphx-glr-auto-examples-inspection-plot-permutation-importance-py
  43. Zusätzlich: Einfluss der Features scheint nicht linear zu sein Features beeinflussen sich gegenseitig: Season wird einen Einfluss auf Temperatur haben, Hr hat Einfluss auf Temperatur, Gefühlte und echte Temperatur sind korreliert usw. Non-Linear: Decision Tree https://www.flaticon.com/de/kostenloses-icon/stern_5487318?term=bling&page=2&position=96&origin=search&related_id=5487318 https://www.flaticon.com/de/kostenloses-icon/mogen_6645236?term=vorteil&page=1&position=11&origin=search&related_id=6645236