SlideShare ist ein Scribd-Unternehmen logo
1 von 16
Installationen für Data
Science mit Python
NumPy Übersicht
• NumPy (oder Numpy) ist eine Library für lineare Algebra für Python
• Sie ist deshalb für Data Science mit Python so wichtig, da fast alle
anderen Libraries im Python Ökosystem auf NumPy aufbauen
• NumPy ist außerdem extrem schnell, da es Verknüpfungen zu C hat
NumPy by Datamics, 2018
Installation
• Die Installation von NumPy (und anderen Libraries) funktioniert am
einfachsten und zuverlässigsten, wenn wir die im Kurs empfohlene
Anaconda Distribution von Python nutzen
• Bei der Nutzung von Anaconda, installiere Numpy im Terminal bzw.
der Kommandozeile durch folgenden Befehl:
conda install numpy
pip install numpy
NumPy by Datamics, 2018
NumPy im unserem Kurs
• NumPy Arrays sind der primäre Weg, wie wir NumPy im Verlauf
dieses Kurses nutzen werden
• NumPy Arrays gibt es hauptsächlich in zwei Varianten: Vektoren und
Matrizen
• Vektoren sind streng eindimensionale Arrays (1-d), wohingegen
Matrizen zweidimensionale Arrays (2-d) sind. Dabei gilt zu beachten,
dass auch Matrizen nur eine Spalte bzw. nur eine Zeile haben können.
NumPy by Datamics, 2018
Pandas Übersicht
• Pandas ist eine Open Source Library, die auf NumPy aufgebaut ist
• Es erlaubt uns schnelle Analysen und Datenbereinigung sowie -
vorbereitung
• Es zeichnet sich besonders durch Performance und Produktivität aus
• Zusätzlich beinhaltet es vorinstallierte Visualisierungsfunktionalität
• Pandas kann mit einer Vielzahl an Datenquellen arbeiten
Pandas by Datamics, 2018
Installation
• Wir müssen Pandas (wie die meisten anderen Libraries im Verlauf des
Kurses) installieren.
• Dazu gehen wir ins Terminal bzw. die Kommandozeile und führen
folgendes aus:
conda install pandas
pip install pandas
Pandas by Datamics, 2018
Datenquellen für Input
• CSV
• Excel
• HTML
• SQL
Daten Ein- und Ausgabe by Datamics, 2018
Module
• Dazu benötigen wir die folgenden Module die wir mit pip oder conda
wie folgt installieren können:
• conda install sqlalchemy
• conda install lxml
• conda install html5lib
• conda install BeauytifulSoup4
Daten Ein- und Ausgabe by Datamics, 2018
MatplotLib
• Wir haben jetzt einen guten Überblick über die Datenanalyse mit
NumPy, Pandas und SciPy
• Das bildet die Grundlage die wir brauchen um fortzuschreiten
• Als nächstes widmen wir uns der Visualisierung von Daten
• MatplotLib
• Seaborn
• Pandas vorinstalliere Visualisierung
• Plotly für interaktive Plots
MatplotLib by Datamics, 2018
MatplotLib Übersicht
• MatplotLib ist die bekannteste und am meisten verbreitete Library
zum Darstellen von Diagrammen und ähnlichen Visualisierungen
• Es erlaubt uns jeden einzelnen Aspekt einer Darstellung einzustellen
• Die Idee bei der Erstellung war es eine ähnliche Nutzererfahrung zu
bieten, wie es MatLab‘s Darstellung tut
MatplotLib by Datamics, 2018
Installation
• Zur Installation von MatplotLib gehen wir ins Terminal bzw. die
Kommandozeile und geben folgenden Befehl ein:
conda install matplotlib
pip install matplotlib
MatplotLib by Datamics, 2018
Seaborn
• Seaborn ist eine statistische Plotting Bibliothek um Diagramme
darzustellen
• Standardmäßig beinhaltet es schon sehr schöne Styles und
Diagramme
• Es harmoniert sehr gut mit den Pandas DataFrame Objekten
Seaborn by Datamics, 2018
Installation
• Zur Installation von Seaborn gehen wir ins Terminal bzw. die
Kommandozeile und geben folgenden Befehl ein:
conda install seaborn
oder
pip install seaborn
Seaborn by Datamics, 2018
Plotly und Cufflinks
• Plotly ist eine interaktive Visualisierungs-Library
• Cufflinks verbindet diese Library mit Pandas
• Bevor wir diese nutzen können müssen wir beide installieren
Plotly und Cufflinks by Datamics, 2018
Installation
• Zur Installation von Plotly und Cufflinks können wir Anaconda leider
nicht direkt verwenden.
• Wir gehen wir ins Terminal bzw. die Kommandozeile und geben
folgenden Befehl ein:
pip install plotly
und
pip install cufflinks
Plotly und Cufflinks by Datamics, 2018
Verwende den Gutschein „SLIDESHARE2018“ auf Udemy oder die
Shortlinks und erhalte unsere Kurse für nur 10,99€ (95% Rabatt).
Python für Data Science und Machine Learning: https://goo.gl/cE7TQ3
Original Python Bootcamp - Von 0 auf 100: https://goo.gl/gjn7pX
R für Data Science und Machine Learning: https://goo.gl/8h5tH7
Exklusive Gutscheine
Udemy-Kurse by Datamics, 2018https://www.udemy.com/user/rene-brunner/

Weitere ähnliche Inhalte

Was ist angesagt?

Overview of python 2019
Overview of python 2019Overview of python 2019
Overview of python 2019Samir Mohanty
 
Python interview questions
Python interview questionsPython interview questions
Python interview questionsPragati Singh
 
Selective repeat protocol
Selective repeat protocolSelective repeat protocol
Selective repeat protocolManusha Dilan
 
Seminar report on python 3 course
Seminar report on python 3 courseSeminar report on python 3 course
Seminar report on python 3 courseHimanshuPanwar38
 
Seminar report On Python
Seminar report On PythonSeminar report On Python
Seminar report On PythonShivam Gupta
 
Introduction to python
Introduction to pythonIntroduction to python
Introduction to pythonMohammed Rafi
 
Python & jupyter notebook installation
Python & jupyter notebook installationPython & jupyter notebook installation
Python & jupyter notebook installationAnamta Sayyed
 
Azure Data Studio Extension Development
Azure Data Studio Extension DevelopmentAzure Data Studio Extension Development
Azure Data Studio Extension DevelopmentDrew Skwiers-Koballa
 
Python presentation by Monu Sharma
Python presentation by Monu SharmaPython presentation by Monu Sharma
Python presentation by Monu SharmaMayank Sharma
 
Top 100 Python Interview Questions And Answers
Top 100 Python Interview Questions And AnswersTop 100 Python Interview Questions And Answers
Top 100 Python Interview Questions And AnswersProBytes
 
Chapter 1 - INTRODUCTION TO PYTHON -MAULIK BORSANIYA
Chapter 1 - INTRODUCTION TO PYTHON -MAULIK BORSANIYAChapter 1 - INTRODUCTION TO PYTHON -MAULIK BORSANIYA
Chapter 1 - INTRODUCTION TO PYTHON -MAULIK BORSANIYAMaulik Borsaniya
 
IoT Development - Opportunities and Challenges
IoT Development - Opportunities and ChallengesIoT Development - Opportunities and Challenges
IoT Development - Opportunities and ChallengesAsim Rais Siddiqui
 
Sensors, MEMS, Internet of Things
Sensors, MEMS, Internet of ThingsSensors, MEMS, Internet of Things
Sensors, MEMS, Internet of ThingsJeffrey Funk
 
Python Anaconda Tutorial | Edureka
Python Anaconda Tutorial | EdurekaPython Anaconda Tutorial | Edureka
Python Anaconda Tutorial | EdurekaEdureka!
 
Top Libraries for Machine Learning with Python
Top Libraries for Machine Learning with Python Top Libraries for Machine Learning with Python
Top Libraries for Machine Learning with Python Chariza Pladin
 

Was ist angesagt? (20)

Overview of python 2019
Overview of python 2019Overview of python 2019
Overview of python 2019
 
Python interview questions
Python interview questionsPython interview questions
Python interview questions
 
Selective repeat protocol
Selective repeat protocolSelective repeat protocol
Selective repeat protocol
 
Python for IoT
Python for IoTPython for IoT
Python for IoT
 
Python Basics
Python BasicsPython Basics
Python Basics
 
Seminar report on python 3 course
Seminar report on python 3 courseSeminar report on python 3 course
Seminar report on python 3 course
 
Seminar report On Python
Seminar report On PythonSeminar report On Python
Seminar report On Python
 
Introduction to python
Introduction to pythonIntroduction to python
Introduction to python
 
Python & jupyter notebook installation
Python & jupyter notebook installationPython & jupyter notebook installation
Python & jupyter notebook installation
 
Python for data science
Python for data sciencePython for data science
Python for data science
 
Azure Data Studio Extension Development
Azure Data Studio Extension DevelopmentAzure Data Studio Extension Development
Azure Data Studio Extension Development
 
Python presentation by Monu Sharma
Python presentation by Monu SharmaPython presentation by Monu Sharma
Python presentation by Monu Sharma
 
Top 100 Python Interview Questions And Answers
Top 100 Python Interview Questions And AnswersTop 100 Python Interview Questions And Answers
Top 100 Python Interview Questions And Answers
 
Chapter 1 - INTRODUCTION TO PYTHON -MAULIK BORSANIYA
Chapter 1 - INTRODUCTION TO PYTHON -MAULIK BORSANIYAChapter 1 - INTRODUCTION TO PYTHON -MAULIK BORSANIYA
Chapter 1 - INTRODUCTION TO PYTHON -MAULIK BORSANIYA
 
IoT Development - Opportunities and Challenges
IoT Development - Opportunities and ChallengesIoT Development - Opportunities and Challenges
IoT Development - Opportunities and Challenges
 
Sensors, MEMS, Internet of Things
Sensors, MEMS, Internet of ThingsSensors, MEMS, Internet of Things
Sensors, MEMS, Internet of Things
 
Introduction to Python Basics Programming
Introduction to Python Basics ProgrammingIntroduction to Python Basics Programming
Introduction to Python Basics Programming
 
Python Anaconda Tutorial | Edureka
Python Anaconda Tutorial | EdurekaPython Anaconda Tutorial | Edureka
Python Anaconda Tutorial | Edureka
 
Top Libraries for Machine Learning with Python
Top Libraries for Machine Learning with Python Top Libraries for Machine Learning with Python
Top Libraries for Machine Learning with Python
 
IoT and Smart Cities
IoT and Smart CitiesIoT and Smart Cities
IoT and Smart Cities
 

Ähnlich wie Python Installationen für Data Science

20160229_ModernApplicationDevelopment_Python_KPatenge
20160229_ModernApplicationDevelopment_Python_KPatenge20160229_ModernApplicationDevelopment_Python_KPatenge
20160229_ModernApplicationDevelopment_Python_KPatengeKarin Patenge
 
.NET Datenzugriff einfach und performant mit Micro O/R Mappern
.NET Datenzugriff einfach und performant mit Micro O/R Mappern .NET Datenzugriff einfach und performant mit Micro O/R Mappern
.NET Datenzugriff einfach und performant mit Micro O/R Mappern André Krämer
 
Python Bootcamp - Grundlagen
Python Bootcamp - GrundlagenPython Bootcamp - Grundlagen
Python Bootcamp - GrundlagenDatamics
 
Grundlagen puppet
Grundlagen puppetGrundlagen puppet
Grundlagen puppetinovex GmbH
 
PHP Deployment mit Ansible
PHP Deployment mit AnsiblePHP Deployment mit Ansible
PHP Deployment mit AnsibleMichael Döhler
 
Warum Python?
Warum Python?Warum Python?
Warum Python?tharwan
 
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel Onkopedia
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel OnkopediaBack to the future - Plone 5.2 und Python 3 Migration am Beispiel Onkopedia
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel OnkopediaAndreas Jung
 
Drupal Basics (7-8) Vortrag (01.2016)
Drupal Basics (7-8) Vortrag (01.2016)Drupal Basics (7-8) Vortrag (01.2016)
Drupal Basics (7-8) Vortrag (01.2016)Peter_Majmesku
 
Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)
Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)
Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)nwilbert
 
Perl Renaissance Reloaded
Perl Renaissance ReloadedPerl Renaissance Reloaded
Perl Renaissance ReloadedGregor Goldbach
 
Schweine latein-vortrag
Schweine latein-vortragSchweine latein-vortrag
Schweine latein-vortragRamon Wartala
 
Slideshare AutoEncoder
Slideshare AutoEncoderSlideshare AutoEncoder
Slideshare AutoEncoderDatamics
 
EntwicklerCamp 2014 - DOTS reloaded
EntwicklerCamp 2014 - DOTS reloadedEntwicklerCamp 2014 - DOTS reloaded
EntwicklerCamp 2014 - DOTS reloadedRené Winkelmeyer
 
Hands-on Workshop: API-Dokumentation mit OpenAPI / Swagger in ASP.NET Core
Hands-on Workshop: API-Dokumentation mit OpenAPI / Swagger in ASP.NET CoreHands-on Workshop: API-Dokumentation mit OpenAPI / Swagger in ASP.NET Core
Hands-on Workshop: API-Dokumentation mit OpenAPI / Swagger in ASP.NET CoreGregor Biswanger
 
Daten natuerlich modellieren und verarbeiten mit Neo4j
Daten natuerlich modellieren und verarbeiten mit Neo4jDaten natuerlich modellieren und verarbeiten mit Neo4j
Daten natuerlich modellieren und verarbeiten mit Neo4jPatrick Baumgartner
 
20181210_ITTage2018_OracleNoSQLDB_KPatenge
20181210_ITTage2018_OracleNoSQLDB_KPatenge20181210_ITTage2018_OracleNoSQLDB_KPatenge
20181210_ITTage2018_OracleNoSQLDB_KPatengeKarin Patenge
 
Java und Python - Das Beste aus beiden Welten nutzen
Java und Python - Das Beste aus beiden Welten nutzenJava und Python - Das Beste aus beiden Welten nutzen
Java und Python - Das Beste aus beiden Welten nutzenAndreas Schreiber
 
Icinga 2009 at Nagios Workshop
Icinga 2009 at Nagios WorkshopIcinga 2009 at Nagios Workshop
Icinga 2009 at Nagios WorkshopIcinga
 

Ähnlich wie Python Installationen für Data Science (20)

20160229_ModernApplicationDevelopment_Python_KPatenge
20160229_ModernApplicationDevelopment_Python_KPatenge20160229_ModernApplicationDevelopment_Python_KPatenge
20160229_ModernApplicationDevelopment_Python_KPatenge
 
.NET Datenzugriff einfach und performant mit Micro O/R Mappern
.NET Datenzugriff einfach und performant mit Micro O/R Mappern .NET Datenzugriff einfach und performant mit Micro O/R Mappern
.NET Datenzugriff einfach und performant mit Micro O/R Mappern
 
Python Bootcamp - Grundlagen
Python Bootcamp - GrundlagenPython Bootcamp - Grundlagen
Python Bootcamp - Grundlagen
 
Grundlagen puppet
Grundlagen puppetGrundlagen puppet
Grundlagen puppet
 
PHP Deployment mit Ansible
PHP Deployment mit AnsiblePHP Deployment mit Ansible
PHP Deployment mit Ansible
 
Warum Python?
Warum Python?Warum Python?
Warum Python?
 
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel Onkopedia
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel OnkopediaBack to the future - Plone 5.2 und Python 3 Migration am Beispiel Onkopedia
Back to the future - Plone 5.2 und Python 3 Migration am Beispiel Onkopedia
 
Drupal Basics (7-8) Vortrag (01.2016)
Drupal Basics (7-8) Vortrag (01.2016)Drupal Basics (7-8) Vortrag (01.2016)
Drupal Basics (7-8) Vortrag (01.2016)
 
Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)
Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)
Python in Computational Neuroscience & Modular toolkit for Data Processing (MDP)
 
Perl Renaissance Reloaded
Perl Renaissance ReloadedPerl Renaissance Reloaded
Perl Renaissance Reloaded
 
Schweine latein-vortrag
Schweine latein-vortragSchweine latein-vortrag
Schweine latein-vortrag
 
Slideshare AutoEncoder
Slideshare AutoEncoderSlideshare AutoEncoder
Slideshare AutoEncoder
 
EntwicklerCamp 2014 - DOTS reloaded
EntwicklerCamp 2014 - DOTS reloadedEntwicklerCamp 2014 - DOTS reloaded
EntwicklerCamp 2014 - DOTS reloaded
 
Hands-on Workshop: API-Dokumentation mit OpenAPI / Swagger in ASP.NET Core
Hands-on Workshop: API-Dokumentation mit OpenAPI / Swagger in ASP.NET CoreHands-on Workshop: API-Dokumentation mit OpenAPI / Swagger in ASP.NET Core
Hands-on Workshop: API-Dokumentation mit OpenAPI / Swagger in ASP.NET Core
 
PLUX.NET – SOFTWAREKOMPOSITION DURCH PLUG & PLAY
PLUX.NET – SOFTWAREKOMPOSITION DURCH PLUG & PLAYPLUX.NET – SOFTWAREKOMPOSITION DURCH PLUG & PLAY
PLUX.NET – SOFTWAREKOMPOSITION DURCH PLUG & PLAY
 
Daten natuerlich modellieren und verarbeiten mit Neo4j
Daten natuerlich modellieren und verarbeiten mit Neo4jDaten natuerlich modellieren und verarbeiten mit Neo4j
Daten natuerlich modellieren und verarbeiten mit Neo4j
 
Ant Maven
Ant MavenAnt Maven
Ant Maven
 
20181210_ITTage2018_OracleNoSQLDB_KPatenge
20181210_ITTage2018_OracleNoSQLDB_KPatenge20181210_ITTage2018_OracleNoSQLDB_KPatenge
20181210_ITTage2018_OracleNoSQLDB_KPatenge
 
Java und Python - Das Beste aus beiden Welten nutzen
Java und Python - Das Beste aus beiden Welten nutzenJava und Python - Das Beste aus beiden Welten nutzen
Java und Python - Das Beste aus beiden Welten nutzen
 
Icinga 2009 at Nagios Workshop
Icinga 2009 at Nagios WorkshopIcinga 2009 at Nagios Workshop
Icinga 2009 at Nagios Workshop
 

Mehr von Datamics

Die Data Science Toolbox
Die Data Science ToolboxDie Data Science Toolbox
Die Data Science ToolboxDatamics
 
Die Data Science Softskills
Die Data Science SoftskillsDie Data Science Softskills
Die Data Science SoftskillsDatamics
 
Slideshare reinforcement learning
Slideshare reinforcement learningSlideshare reinforcement learning
Slideshare reinforcement learningDatamics
 
Slideshare TensorFlow Grundlagen
Slideshare TensorFlow GrundlagenSlideshare TensorFlow Grundlagen
Slideshare TensorFlow GrundlagenDatamics
 
Slideshare GAN
Slideshare GANSlideshare GAN
Slideshare GANDatamics
 
Slideshare Recurrent Neural Networks (RNN)
Slideshare Recurrent Neural Networks (RNN)Slideshare Recurrent Neural Networks (RNN)
Slideshare Recurrent Neural Networks (RNN)Datamics
 
R für Data Science und Machine Learning
R für Data Science und Machine LearningR für Data Science und Machine Learning
R für Data Science und Machine LearningDatamics
 
Principal Component Analysis mit Python
Principal Component Analysis mit PythonPrincipal Component Analysis mit Python
Principal Component Analysis mit PythonDatamics
 
K Means mit Python
K Means mit PythonK Means mit Python
K Means mit PythonDatamics
 
Support Vector Machines mit Python
Support Vector Machines mit PythonSupport Vector Machines mit Python
Support Vector Machines mit PythonDatamics
 
Decision Trees und Random Forest mit Python
Decision Trees und Random Forest mit PythonDecision Trees und Random Forest mit Python
Decision Trees und Random Forest mit PythonDatamics
 
K Nearest Neighbors mit Python
K Nearest Neighbors mit PythonK Nearest Neighbors mit Python
K Nearest Neighbors mit PythonDatamics
 
Logistische Regression mit Python
Logistische Regression mit PythonLogistische Regression mit Python
Logistische Regression mit PythonDatamics
 
Verzerrung Varianz Dilemma
Verzerrung Varianz DilemmaVerzerrung Varianz Dilemma
Verzerrung Varianz DilemmaDatamics
 
Lineare Regression mit Python
Lineare Regression mit PythonLineare Regression mit Python
Lineare Regression mit PythonDatamics
 
Machine Learning mit Python
Machine Learning mit PythonMachine Learning mit Python
Machine Learning mit PythonDatamics
 

Mehr von Datamics (16)

Die Data Science Toolbox
Die Data Science ToolboxDie Data Science Toolbox
Die Data Science Toolbox
 
Die Data Science Softskills
Die Data Science SoftskillsDie Data Science Softskills
Die Data Science Softskills
 
Slideshare reinforcement learning
Slideshare reinforcement learningSlideshare reinforcement learning
Slideshare reinforcement learning
 
Slideshare TensorFlow Grundlagen
Slideshare TensorFlow GrundlagenSlideshare TensorFlow Grundlagen
Slideshare TensorFlow Grundlagen
 
Slideshare GAN
Slideshare GANSlideshare GAN
Slideshare GAN
 
Slideshare Recurrent Neural Networks (RNN)
Slideshare Recurrent Neural Networks (RNN)Slideshare Recurrent Neural Networks (RNN)
Slideshare Recurrent Neural Networks (RNN)
 
R für Data Science und Machine Learning
R für Data Science und Machine LearningR für Data Science und Machine Learning
R für Data Science und Machine Learning
 
Principal Component Analysis mit Python
Principal Component Analysis mit PythonPrincipal Component Analysis mit Python
Principal Component Analysis mit Python
 
K Means mit Python
K Means mit PythonK Means mit Python
K Means mit Python
 
Support Vector Machines mit Python
Support Vector Machines mit PythonSupport Vector Machines mit Python
Support Vector Machines mit Python
 
Decision Trees und Random Forest mit Python
Decision Trees und Random Forest mit PythonDecision Trees und Random Forest mit Python
Decision Trees und Random Forest mit Python
 
K Nearest Neighbors mit Python
K Nearest Neighbors mit PythonK Nearest Neighbors mit Python
K Nearest Neighbors mit Python
 
Logistische Regression mit Python
Logistische Regression mit PythonLogistische Regression mit Python
Logistische Regression mit Python
 
Verzerrung Varianz Dilemma
Verzerrung Varianz DilemmaVerzerrung Varianz Dilemma
Verzerrung Varianz Dilemma
 
Lineare Regression mit Python
Lineare Regression mit PythonLineare Regression mit Python
Lineare Regression mit Python
 
Machine Learning mit Python
Machine Learning mit PythonMachine Learning mit Python
Machine Learning mit Python
 

Python Installationen für Data Science

  • 2. NumPy Übersicht • NumPy (oder Numpy) ist eine Library für lineare Algebra für Python • Sie ist deshalb für Data Science mit Python so wichtig, da fast alle anderen Libraries im Python Ökosystem auf NumPy aufbauen • NumPy ist außerdem extrem schnell, da es Verknüpfungen zu C hat NumPy by Datamics, 2018
  • 3. Installation • Die Installation von NumPy (und anderen Libraries) funktioniert am einfachsten und zuverlässigsten, wenn wir die im Kurs empfohlene Anaconda Distribution von Python nutzen • Bei der Nutzung von Anaconda, installiere Numpy im Terminal bzw. der Kommandozeile durch folgenden Befehl: conda install numpy pip install numpy NumPy by Datamics, 2018
  • 4. NumPy im unserem Kurs • NumPy Arrays sind der primäre Weg, wie wir NumPy im Verlauf dieses Kurses nutzen werden • NumPy Arrays gibt es hauptsächlich in zwei Varianten: Vektoren und Matrizen • Vektoren sind streng eindimensionale Arrays (1-d), wohingegen Matrizen zweidimensionale Arrays (2-d) sind. Dabei gilt zu beachten, dass auch Matrizen nur eine Spalte bzw. nur eine Zeile haben können. NumPy by Datamics, 2018
  • 5. Pandas Übersicht • Pandas ist eine Open Source Library, die auf NumPy aufgebaut ist • Es erlaubt uns schnelle Analysen und Datenbereinigung sowie - vorbereitung • Es zeichnet sich besonders durch Performance und Produktivität aus • Zusätzlich beinhaltet es vorinstallierte Visualisierungsfunktionalität • Pandas kann mit einer Vielzahl an Datenquellen arbeiten Pandas by Datamics, 2018
  • 6. Installation • Wir müssen Pandas (wie die meisten anderen Libraries im Verlauf des Kurses) installieren. • Dazu gehen wir ins Terminal bzw. die Kommandozeile und führen folgendes aus: conda install pandas pip install pandas Pandas by Datamics, 2018
  • 7. Datenquellen für Input • CSV • Excel • HTML • SQL Daten Ein- und Ausgabe by Datamics, 2018
  • 8. Module • Dazu benötigen wir die folgenden Module die wir mit pip oder conda wie folgt installieren können: • conda install sqlalchemy • conda install lxml • conda install html5lib • conda install BeauytifulSoup4 Daten Ein- und Ausgabe by Datamics, 2018
  • 9. MatplotLib • Wir haben jetzt einen guten Überblick über die Datenanalyse mit NumPy, Pandas und SciPy • Das bildet die Grundlage die wir brauchen um fortzuschreiten • Als nächstes widmen wir uns der Visualisierung von Daten • MatplotLib • Seaborn • Pandas vorinstalliere Visualisierung • Plotly für interaktive Plots MatplotLib by Datamics, 2018
  • 10. MatplotLib Übersicht • MatplotLib ist die bekannteste und am meisten verbreitete Library zum Darstellen von Diagrammen und ähnlichen Visualisierungen • Es erlaubt uns jeden einzelnen Aspekt einer Darstellung einzustellen • Die Idee bei der Erstellung war es eine ähnliche Nutzererfahrung zu bieten, wie es MatLab‘s Darstellung tut MatplotLib by Datamics, 2018
  • 11. Installation • Zur Installation von MatplotLib gehen wir ins Terminal bzw. die Kommandozeile und geben folgenden Befehl ein: conda install matplotlib pip install matplotlib MatplotLib by Datamics, 2018
  • 12. Seaborn • Seaborn ist eine statistische Plotting Bibliothek um Diagramme darzustellen • Standardmäßig beinhaltet es schon sehr schöne Styles und Diagramme • Es harmoniert sehr gut mit den Pandas DataFrame Objekten Seaborn by Datamics, 2018
  • 13. Installation • Zur Installation von Seaborn gehen wir ins Terminal bzw. die Kommandozeile und geben folgenden Befehl ein: conda install seaborn oder pip install seaborn Seaborn by Datamics, 2018
  • 14. Plotly und Cufflinks • Plotly ist eine interaktive Visualisierungs-Library • Cufflinks verbindet diese Library mit Pandas • Bevor wir diese nutzen können müssen wir beide installieren Plotly und Cufflinks by Datamics, 2018
  • 15. Installation • Zur Installation von Plotly und Cufflinks können wir Anaconda leider nicht direkt verwenden. • Wir gehen wir ins Terminal bzw. die Kommandozeile und geben folgenden Befehl ein: pip install plotly und pip install cufflinks Plotly und Cufflinks by Datamics, 2018
  • 16. Verwende den Gutschein „SLIDESHARE2018“ auf Udemy oder die Shortlinks und erhalte unsere Kurse für nur 10,99€ (95% Rabatt). Python für Data Science und Machine Learning: https://goo.gl/cE7TQ3 Original Python Bootcamp - Von 0 auf 100: https://goo.gl/gjn7pX R für Data Science und Machine Learning: https://goo.gl/8h5tH7 Exklusive Gutscheine Udemy-Kurse by Datamics, 2018https://www.udemy.com/user/rene-brunner/