SlideShare ist ein Scribd-Unternehmen logo
1 von 17
Machine Learning
mit Python
Eine Einführung
Python Paket
• Wir nutzen im diesem Kurs das Scikit Learn Paket
• Es ist das bekannteste Machine Learning Paket für Python und bietet
viele bereits eingebaute Algorithmen
• Zur Installation führe bitte folgenden Code aus:
Machine Learning mit Python
conda install scikit-learn
Oder
pip install scikit-learn
by Datamics, 2018
Machine Learning Prozess
Machine Learning mit Python
Daten
Bereinigung
Daten
Akquisition
Modell
Training
Modell
Tests
Modell
Einsatz
Test
Daten
by Datamics, 2018
Prozess mit Scikit Learn
• Schauen wir uns nun ein Beispiel für einen solchen Prozess mit SciKit
Learn an.
• Macht euch keine großen Sorgen darüber, ob ihr euch alles merken
könnt! Wir werden viele Übungen und Erklärungen zu diesem Beispiel
und darüber hinaus in den folgenden Lektionen behandeln.
Machine Learning mit Python by Datamics, 2018
Prozess mit Scikit Learn
• Jeder Algorithmus in scikit-learn wird durch einen „Estimator“ (dt.
Schätzer) dargestellt
• Zuerst importieren wir das Modell in der allgemeinen Syntax:
from sklearn.family import Modell
• Oder zum Beispiel:
from sklearn.linear_model import LinearRegression
Machine Learning mit Python by Datamics, 2018
Prozess mit Scikit Learn
• Alle Parameter des Estimators können bei seiner Instanziierung
festgelegt werden und alle haben passende Standardwerte
• In Jupyter können wir Shift+Tab verwenden, um alle möglichen
Parameter einzusehen
Machine Learning mit Python by Datamics, 2018
Prozess mit Scikit Learn
Zum Beispiel:
model = LinearRegression(normalize=True)
print (model)
LinearRegression(copy_X=True, fit_intercept=True, normalize=True)
Machine Learning mit Python by Datamics, 2018
Prozess mit Scikit Learn
• Sobald wir unser Modell mit den richtigen Parametern erstellt haben
ist es wichtig es auf Daten anzupassen.
• Denkt aber daran, dass wir die Daten in Trainings- und Testdaten
aufteilen sollten.
Machine Learning mit Python by Datamics, 2018
Beispiel mit Scikit Learn
Machine Learning mit Python by Datamics, 2018
Beispiel mit Scikit Learn
Machine Learning mit Python by Datamics, 2018
Prozess mit Scikit Learn
• Nachdem wir unsere Daten aufgeteilt haben können wir das Modell
trainieren.
• Dazu verwenden wir die model.fit() Methode:
model.fit(X_train,y_train)
Machine Learning mit Python by Datamics, 2018
Prozess mit Scikit Learn
• Jetzt wurde unser Modell basierend auf den Trainingsdaten trainiert.
• Es ist jetzt in der Lage Kennzeichnungen oder Werte der Testdaten
vorherzusagen.
• Hinweis: Wir sprechen hier über Supervised Learning
• Wir können Werte vorhersagen indem wir folgenden Code
verwenden:
predictions = model.predict(X_test)
Machine Learning mit Python by Datamics, 2018
Prozess mit Scikit Learn
• Anschließend können wir unser Modell auf seine Qualität testen
indem wir vorhergesagte Werte mit tatsächlichen Werten vergleichen
• Die Methode der Evaluierung hängt vom verwendeten Machine
Learning Algorithmus ab
Machine Learning mit Python by Datamics, 2018
Zusammenfassung
• Scikit-learn strebt danach für alle Methoden (die wir behandeln
werden) den gleichen Aufbau zu verwenden.
• Ausgehend vom Estimator namens model gilt folgendes:
• Verfügbar für jeden Estimator
• model.fit(): Auf Trainingsdaten anpassen
• Für Supervised Learning: Feature X und Label y -> model.fit(X,y)
• Für Unsupervised Learning: Nur Daten X -> model.fit(X)
Machine Learning mit Python by Datamics, 2018
Zusammenfassung
• Verfügbar für supervised Estimators
• model.predict(): ausgehend von einem trainierten Modell sagt der Estimator
die Labels (Kennzeichnungen) neuer Daten (meist den Testdaten) vorhersagen
(en. predict). Dazu übergeben wir ein Argument: die neuen Daten ->
model.predict(X_neu)
• So erhalten wir ein Array aus dem Label für die neuen Daten
• model.score(): für Klassifizierungsprobleme. Scores liegen zwischen 0 und 1,
wobei 1 eine bessere Einordnung bedeutet
Machine Learning mit Python by Datamics, 2018
Zusammenfassung
• Verfügbar für unsupervised Estimators
• model.predict(): sagt Kennzeichnungen in Cluster-Algorithmen vorher
• model.transform(): ausgehend von einem unsupervised Modell können wir so
neue Daten zur neuen Grundlage machen.
• Wir gehen später genauer auf dieses Konzept ein
• model.fit_transform(): einige Estimators implementieren diese Methode, die
effizienter eine Anpassung und Transformation mit dem selben Input
durchführt
Machine Learning mit Python by Datamics, 2018
Entscheidungshilfe
Machine Learning mit Python by Datamics, 2018

Weitere ähnliche Inhalte

Ähnlich wie Machine Learning mit Python

BAT40 Mobiliar Koller Mösching AI@Mobiliar Wie AI-Services in der Mobiliar ge...
BAT40 Mobiliar Koller Mösching AI@Mobiliar Wie AI-Services in der Mobiliar ge...BAT40 Mobiliar Koller Mösching AI@Mobiliar Wie AI-Services in der Mobiliar ge...
BAT40 Mobiliar Koller Mösching AI@Mobiliar Wie AI-Services in der Mobiliar ge...BATbern
 
Support Vector Machines mit Python
Support Vector Machines mit PythonSupport Vector Machines mit Python
Support Vector Machines mit PythonDatamics
 
Best Practices für TDD in JavaScript
Best Practices für TDD in JavaScriptBest Practices für TDD in JavaScript
Best Practices für TDD in JavaScriptSebastian Springer
 
Next Level Unit Testing
Next Level Unit TestingNext Level Unit Testing
Next Level Unit TestingDaniel Lehner
 
Cognitive Quality Assurance
Cognitive Quality AssuranceCognitive Quality Assurance
Cognitive Quality AssuranceCapgemini
 
Slideshare TensorFlow Grundlagen
Slideshare TensorFlow GrundlagenSlideshare TensorFlow Grundlagen
Slideshare TensorFlow GrundlagenDatamics
 
Ringvorlesung ITmitte.de : Vortrag der FIO SYSTEMS AG über Unit Tests und TDD
Ringvorlesung ITmitte.de : Vortrag der FIO SYSTEMS AG über Unit Tests und TDDRingvorlesung ITmitte.de : Vortrag der FIO SYSTEMS AG über Unit Tests und TDD
Ringvorlesung ITmitte.de : Vortrag der FIO SYSTEMS AG über Unit Tests und TDDCommunity ITmitte.de
 
TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014
TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014
TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014dankl+partner consulting gmbh
 
TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014
TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014
TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014MCP Deutschland GmbH
 
Metrics we can gain from our (Kanban) system and what we can learn from ..
Metrics we can gain from our (Kanban) system and what we can learn from .. Metrics we can gain from our (Kanban) system and what we can learn from ..
Metrics we can gain from our (Kanban) system and what we can learn from .. Martin Putz
 
BizDataX Testdatenmanagement Konzepte
BizDataX Testdatenmanagement KonzepteBizDataX Testdatenmanagement Konzepte
BizDataX Testdatenmanagement KonzepteDragan Kinkela
 
Google Analytics & Seo @seosixt wiesn 2014
Google Analytics & Seo @seosixt wiesn 2014Google Analytics & Seo @seosixt wiesn 2014
Google Analytics & Seo @seosixt wiesn 2014121WATT GmbH
 
Intersys - Integration mit Spirateam (Zurich 2017)
Intersys - Integration mit Spirateam (Zurich 2017)Intersys - Integration mit Spirateam (Zurich 2017)
Intersys - Integration mit Spirateam (Zurich 2017)Adam Sandman
 
ASQF Dresden: Benötigen wir mit SCRUM noch einen Testmanager?
ASQF Dresden: Benötigen wir mit SCRUM noch einen Testmanager?ASQF Dresden: Benötigen wir mit SCRUM noch einen Testmanager?
ASQF Dresden: Benötigen wir mit SCRUM noch einen Testmanager?René Spengler
 
Die nächste Generation des Unit Testing
Die nächste Generation des Unit TestingDie nächste Generation des Unit Testing
Die nächste Generation des Unit TestingDaniel Lehner
 
Puppet - Module entwickeln - Von der Planung bis zur Umsetzung
Puppet - Module entwickeln - Von der Planung bis zur UmsetzungPuppet - Module entwickeln - Von der Planung bis zur Umsetzung
Puppet - Module entwickeln - Von der Planung bis zur Umsetzunginovex GmbH
 
Workshop Artificial Intelligence
Workshop Artificial IntelligenceWorkshop Artificial Intelligence
Workshop Artificial IntelligenceJürg Stuker
 
Softwaremonitoring mit prometheus
Softwaremonitoring mit prometheusSoftwaremonitoring mit prometheus
Softwaremonitoring mit prometheusGeorg Öttl
 
Slideshare reinforcement learning
Slideshare reinforcement learningSlideshare reinforcement learning
Slideshare reinforcement learningDatamics
 

Ähnlich wie Machine Learning mit Python (20)

BAT40 Mobiliar Koller Mösching AI@Mobiliar Wie AI-Services in der Mobiliar ge...
BAT40 Mobiliar Koller Mösching AI@Mobiliar Wie AI-Services in der Mobiliar ge...BAT40 Mobiliar Koller Mösching AI@Mobiliar Wie AI-Services in der Mobiliar ge...
BAT40 Mobiliar Koller Mösching AI@Mobiliar Wie AI-Services in der Mobiliar ge...
 
Support Vector Machines mit Python
Support Vector Machines mit PythonSupport Vector Machines mit Python
Support Vector Machines mit Python
 
Best Practices für TDD in JavaScript
Best Practices für TDD in JavaScriptBest Practices für TDD in JavaScript
Best Practices für TDD in JavaScript
 
Next Level Unit Testing
Next Level Unit TestingNext Level Unit Testing
Next Level Unit Testing
 
Cognitive Quality Assurance
Cognitive Quality AssuranceCognitive Quality Assurance
Cognitive Quality Assurance
 
Slideshare TensorFlow Grundlagen
Slideshare TensorFlow GrundlagenSlideshare TensorFlow Grundlagen
Slideshare TensorFlow Grundlagen
 
Ringvorlesung ITmitte.de : Vortrag der FIO SYSTEMS AG über Unit Tests und TDD
Ringvorlesung ITmitte.de : Vortrag der FIO SYSTEMS AG über Unit Tests und TDDRingvorlesung ITmitte.de : Vortrag der FIO SYSTEMS AG über Unit Tests und TDD
Ringvorlesung ITmitte.de : Vortrag der FIO SYSTEMS AG über Unit Tests und TDD
 
TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014
TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014
TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014
 
TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014
TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014
TPM-Lehrgang 2014 / (Lean) Six Sigma Green Belt Lehrgang 2014
 
Metrics we can gain from our (Kanban) system and what we can learn from ..
Metrics we can gain from our (Kanban) system and what we can learn from .. Metrics we can gain from our (Kanban) system and what we can learn from ..
Metrics we can gain from our (Kanban) system and what we can learn from ..
 
BizDataX Testdatenmanagement Konzepte
BizDataX Testdatenmanagement KonzepteBizDataX Testdatenmanagement Konzepte
BizDataX Testdatenmanagement Konzepte
 
Google Analytics & Seo @seosixt wiesn 2014
Google Analytics & Seo @seosixt wiesn 2014Google Analytics & Seo @seosixt wiesn 2014
Google Analytics & Seo @seosixt wiesn 2014
 
Intersys - Integration mit Spirateam (Zurich 2017)
Intersys - Integration mit Spirateam (Zurich 2017)Intersys - Integration mit Spirateam (Zurich 2017)
Intersys - Integration mit Spirateam (Zurich 2017)
 
3.3 das math-object
3.3   das math-object3.3   das math-object
3.3 das math-object
 
ASQF Dresden: Benötigen wir mit SCRUM noch einen Testmanager?
ASQF Dresden: Benötigen wir mit SCRUM noch einen Testmanager?ASQF Dresden: Benötigen wir mit SCRUM noch einen Testmanager?
ASQF Dresden: Benötigen wir mit SCRUM noch einen Testmanager?
 
Die nächste Generation des Unit Testing
Die nächste Generation des Unit TestingDie nächste Generation des Unit Testing
Die nächste Generation des Unit Testing
 
Puppet - Module entwickeln - Von der Planung bis zur Umsetzung
Puppet - Module entwickeln - Von der Planung bis zur UmsetzungPuppet - Module entwickeln - Von der Planung bis zur Umsetzung
Puppet - Module entwickeln - Von der Planung bis zur Umsetzung
 
Workshop Artificial Intelligence
Workshop Artificial IntelligenceWorkshop Artificial Intelligence
Workshop Artificial Intelligence
 
Softwaremonitoring mit prometheus
Softwaremonitoring mit prometheusSoftwaremonitoring mit prometheus
Softwaremonitoring mit prometheus
 
Slideshare reinforcement learning
Slideshare reinforcement learningSlideshare reinforcement learning
Slideshare reinforcement learning
 

Mehr von Datamics

Die Data Science Toolbox
Die Data Science ToolboxDie Data Science Toolbox
Die Data Science ToolboxDatamics
 
Die Data Science Softskills
Die Data Science SoftskillsDie Data Science Softskills
Die Data Science SoftskillsDatamics
 
Slideshare GAN
Slideshare GANSlideshare GAN
Slideshare GANDatamics
 
Slideshare Recurrent Neural Networks (RNN)
Slideshare Recurrent Neural Networks (RNN)Slideshare Recurrent Neural Networks (RNN)
Slideshare Recurrent Neural Networks (RNN)Datamics
 
Python Bootcamp - Grundlagen
Python Bootcamp - GrundlagenPython Bootcamp - Grundlagen
Python Bootcamp - GrundlagenDatamics
 
Principal Component Analysis mit Python
Principal Component Analysis mit PythonPrincipal Component Analysis mit Python
Principal Component Analysis mit PythonDatamics
 
K Means mit Python
K Means mit PythonK Means mit Python
K Means mit PythonDatamics
 
K Nearest Neighbors mit Python
K Nearest Neighbors mit PythonK Nearest Neighbors mit Python
K Nearest Neighbors mit PythonDatamics
 
Logistische Regression mit Python
Logistische Regression mit PythonLogistische Regression mit Python
Logistische Regression mit PythonDatamics
 
Lineare Regression mit Python
Lineare Regression mit PythonLineare Regression mit Python
Lineare Regression mit PythonDatamics
 

Mehr von Datamics (10)

Die Data Science Toolbox
Die Data Science ToolboxDie Data Science Toolbox
Die Data Science Toolbox
 
Die Data Science Softskills
Die Data Science SoftskillsDie Data Science Softskills
Die Data Science Softskills
 
Slideshare GAN
Slideshare GANSlideshare GAN
Slideshare GAN
 
Slideshare Recurrent Neural Networks (RNN)
Slideshare Recurrent Neural Networks (RNN)Slideshare Recurrent Neural Networks (RNN)
Slideshare Recurrent Neural Networks (RNN)
 
Python Bootcamp - Grundlagen
Python Bootcamp - GrundlagenPython Bootcamp - Grundlagen
Python Bootcamp - Grundlagen
 
Principal Component Analysis mit Python
Principal Component Analysis mit PythonPrincipal Component Analysis mit Python
Principal Component Analysis mit Python
 
K Means mit Python
K Means mit PythonK Means mit Python
K Means mit Python
 
K Nearest Neighbors mit Python
K Nearest Neighbors mit PythonK Nearest Neighbors mit Python
K Nearest Neighbors mit Python
 
Logistische Regression mit Python
Logistische Regression mit PythonLogistische Regression mit Python
Logistische Regression mit Python
 
Lineare Regression mit Python
Lineare Regression mit PythonLineare Regression mit Python
Lineare Regression mit Python
 

Machine Learning mit Python

  • 2. Python Paket • Wir nutzen im diesem Kurs das Scikit Learn Paket • Es ist das bekannteste Machine Learning Paket für Python und bietet viele bereits eingebaute Algorithmen • Zur Installation führe bitte folgenden Code aus: Machine Learning mit Python conda install scikit-learn Oder pip install scikit-learn by Datamics, 2018
  • 3. Machine Learning Prozess Machine Learning mit Python Daten Bereinigung Daten Akquisition Modell Training Modell Tests Modell Einsatz Test Daten by Datamics, 2018
  • 4. Prozess mit Scikit Learn • Schauen wir uns nun ein Beispiel für einen solchen Prozess mit SciKit Learn an. • Macht euch keine großen Sorgen darüber, ob ihr euch alles merken könnt! Wir werden viele Übungen und Erklärungen zu diesem Beispiel und darüber hinaus in den folgenden Lektionen behandeln. Machine Learning mit Python by Datamics, 2018
  • 5. Prozess mit Scikit Learn • Jeder Algorithmus in scikit-learn wird durch einen „Estimator“ (dt. Schätzer) dargestellt • Zuerst importieren wir das Modell in der allgemeinen Syntax: from sklearn.family import Modell • Oder zum Beispiel: from sklearn.linear_model import LinearRegression Machine Learning mit Python by Datamics, 2018
  • 6. Prozess mit Scikit Learn • Alle Parameter des Estimators können bei seiner Instanziierung festgelegt werden und alle haben passende Standardwerte • In Jupyter können wir Shift+Tab verwenden, um alle möglichen Parameter einzusehen Machine Learning mit Python by Datamics, 2018
  • 7. Prozess mit Scikit Learn Zum Beispiel: model = LinearRegression(normalize=True) print (model) LinearRegression(copy_X=True, fit_intercept=True, normalize=True) Machine Learning mit Python by Datamics, 2018
  • 8. Prozess mit Scikit Learn • Sobald wir unser Modell mit den richtigen Parametern erstellt haben ist es wichtig es auf Daten anzupassen. • Denkt aber daran, dass wir die Daten in Trainings- und Testdaten aufteilen sollten. Machine Learning mit Python by Datamics, 2018
  • 9. Beispiel mit Scikit Learn Machine Learning mit Python by Datamics, 2018
  • 10. Beispiel mit Scikit Learn Machine Learning mit Python by Datamics, 2018
  • 11. Prozess mit Scikit Learn • Nachdem wir unsere Daten aufgeteilt haben können wir das Modell trainieren. • Dazu verwenden wir die model.fit() Methode: model.fit(X_train,y_train) Machine Learning mit Python by Datamics, 2018
  • 12. Prozess mit Scikit Learn • Jetzt wurde unser Modell basierend auf den Trainingsdaten trainiert. • Es ist jetzt in der Lage Kennzeichnungen oder Werte der Testdaten vorherzusagen. • Hinweis: Wir sprechen hier über Supervised Learning • Wir können Werte vorhersagen indem wir folgenden Code verwenden: predictions = model.predict(X_test) Machine Learning mit Python by Datamics, 2018
  • 13. Prozess mit Scikit Learn • Anschließend können wir unser Modell auf seine Qualität testen indem wir vorhergesagte Werte mit tatsächlichen Werten vergleichen • Die Methode der Evaluierung hängt vom verwendeten Machine Learning Algorithmus ab Machine Learning mit Python by Datamics, 2018
  • 14. Zusammenfassung • Scikit-learn strebt danach für alle Methoden (die wir behandeln werden) den gleichen Aufbau zu verwenden. • Ausgehend vom Estimator namens model gilt folgendes: • Verfügbar für jeden Estimator • model.fit(): Auf Trainingsdaten anpassen • Für Supervised Learning: Feature X und Label y -> model.fit(X,y) • Für Unsupervised Learning: Nur Daten X -> model.fit(X) Machine Learning mit Python by Datamics, 2018
  • 15. Zusammenfassung • Verfügbar für supervised Estimators • model.predict(): ausgehend von einem trainierten Modell sagt der Estimator die Labels (Kennzeichnungen) neuer Daten (meist den Testdaten) vorhersagen (en. predict). Dazu übergeben wir ein Argument: die neuen Daten -> model.predict(X_neu) • So erhalten wir ein Array aus dem Label für die neuen Daten • model.score(): für Klassifizierungsprobleme. Scores liegen zwischen 0 und 1, wobei 1 eine bessere Einordnung bedeutet Machine Learning mit Python by Datamics, 2018
  • 16. Zusammenfassung • Verfügbar für unsupervised Estimators • model.predict(): sagt Kennzeichnungen in Cluster-Algorithmen vorher • model.transform(): ausgehend von einem unsupervised Modell können wir so neue Daten zur neuen Grundlage machen. • Wir gehen später genauer auf dieses Konzept ein • model.fit_transform(): einige Estimators implementieren diese Methode, die effizienter eine Anpassung und Transformation mit dem selben Input durchführt Machine Learning mit Python by Datamics, 2018
  • 17. Entscheidungshilfe Machine Learning mit Python by Datamics, 2018