SlideShare ist ein Scribd-Unternehmen logo
Nachvollziehbare, datengetriebene,
automatisierte Analysen der
Softwareentwicklung
Markus Harrer
@feststelltaste feststelltaste.de talk@markusharrer.de
software analytics softwaresanierung clean code
Coden
“Without data you're
just another person
with an opinion.“
W. Edwards Deming
Priorisierungsproblem
“Not all parts of a
system will be
well designed.“
Eric Evans
Fragen aus der Praxis
• Weshalb schlagen unsere CI-Builds fehl?
• Woher kommen die vielen DB-Calls?
• Welcher Entwickler kennt sich im Code aus?
• Wo gibt es sich gegenseitig überschreibende
statische Variablen?
• Wo verletzen wir Compliance-Vorgaben?
• Welche „JSF-Getter“ greifen auf das Backend
durch?
• ...
•Oft auch: Wo fange ich an?
Derzeitiger Stand
Derzeitiger Stand
Eure Fragen aus der Praxis
Anspruch
Lösungsoptionen
automatisiert,
datengetrieben und
nachvollziehbar
erarbeiten.
Motivation
Warum?
•Probleme sichtbar machen
+ Klarheit und Verständnis schaffen
•Entscheidungen treiben
+ Budgets sichern
+ Neue Budgets für weitere Analysen sichern
•Kontinuierliches Lernen unterstützen
+ Herausforderungen meistern
+ Selbst stetig besser werden
Software-
daten-
analyse
Metriken
Dash-
boards
Sweet Spot der Analysen
Handlungs-
orientierung
Nachvollziehbarkeit
Rohdaten
Anspruch
Lösungsoptionen
automatisiert,
datengetrieben und
nachvollziehbar
erarbeiten.
Anspruch
Lösungsoptionen
automatisiert,
datengetrieben und
nachvollziehbar
erarbeiten.
Checkliste Automatisierung
Auswertungen als Skripte mit
• Datenbeschaffung
• Analysen
• Visualisierung
DevOps style
Anspruch
Lösungsoptionen
automatisiert,
datengetrieben und
nachvollziehbar
erarbeiten.
Arten von Softwareartefakten und Metadaten
chronologischCommunity
Laufzeitstatisch
Checkliste Daten
Pro Variable eine Spalte (mit richtigem
Datentyp)
Für jede Beobachtung eine Reihe
Eine Tabelle für jede zusammengehörige
Gruppe von Variablen
Für jede Tabelle einer Analyse eine
verlinkende Spalte
Daten sind dreckig
Verwendete Zeit für Datenbereinigung:
bis zu 80%
Anspruch
Lösungsoptionen
automatisiert,
datengetrieben und
nachvollziehbar
erarbeiten.
Checkliste Nachvollziehbarkeit
• Idee / Kontext / Rahmen der Analyse
dokumentiert
• Annahmen und Vereinfachungen
kommuniziert
• Vorverarbeitung (insb. Löschungen)
dokumentiert
• Rechenweg offengelegt
• Zusammenfassungen begründet
Nachvollziehbarkeit + Automatisierung + Daten
Replizierbarkeit
Anspruch
Lösungsoptionen
automatisiert,
datengetrieben und
nachvollziehbar
erarbeiten.
Anspruch
Lösungsoptionen
automatisiert,
datengetrieben und
nachvollziehbar
erarbeiten.
Analyse-Pipeline
Programmiersprache u. a. für
Scientific Computing
Einfach
Effektiv
Schnell
Automatisierungsmeister
Analyse-Pipeline
Pragmatisches Datenanalyse-Framework
Effektive, tabellarische Datenstruktuen
• Schnell
• Flexibel
• Ausdruckstark
Sehr gute Integration
Die Spezialisten (insb. graphartige Daten)
Analyse-Pipeline
Framework zur statischen
Architektur- und Code-
Analyse
Graph-Datenbank
[:SPEICHERT_IN]
Analyse-Pipeline
ZIP
GZ
*.class
JAR, WAR, EAR
MANIFEST.MF
*.properties
XSD
YAML
XML
application.xml
web.xml
beans.xml
JaCoCo
FindBugs
CheckStyle
pom.xml
surefire-reports.xml RDBMS Schema
M2 Repository
DBCSV
Excel
BigQuery
Inputs
HDFStore
Web
JSON
Git
Pandas
jQAssistant
Analyse-Pipeline
Interaktives Notebook
• Analysen dokumentieren und ausführen
Ergebnisse nachvollziehbar
• Alles an einem einzigen Platz
• Lösungsweg sichtbar
• Auswertung wiederholbar
Bei Bedarf
• Data Mining
• NumPy
• scikit-learn
• SciPy
• Visualisierung / Präsentation
• matplotlib
• plot.ly
• Bokeh
• python-pptx
• ...
Analyse-Pipeline
Analyse-Pipeline
Seit grad‘:
Docker
Analyse-Pipeline
XML/Graph
Tabellen
matplotlib
Pandas,
...
Pandas
jQAssistant,
Neo4j
Text
xlsx
E
pptx
P
Python Jupyter
Eingabe
Vorver-
arbeitung
Analyse
Ausgabe
D3
Beispiel
Demo
Git-Log-Analyse
Erfahrungswerte
• Frameworks voll ausspielen
• Schnelle Installation
• Verschiedene Datenquellen kombinieren
• Zusammenfassende Analysen vornehmen
• Keine Angst vor großen Datenmengen
• Analyseumgebung standardisieren
• Gegenseitig unterstützen
Learning by Doing!
Was ist der
Wert der Information
in Relation zum
Aufwand für die Gewinnung
der Information?
Zu guter Letzt
Literatur
Leek, Jeff: The Elements of Data Analytic Style.
LeanPub, 2015.
McKinney, Wes: Python For Data Analysis, O’Reilly,
2012.
Mens, Tom; Serebrenik; Cleve, Anthony:Evolving
Software Systems. Springer, 2014.
Mens, Tom; Demeyer, Serge: Software Evolution.
Springer, 2008.
Shull, Forrest; Singer, Janice; Sjøberg, Dag I.K.: Guide
to Advanced Empirical Software Engineering. Springer,
2008.
Tornhill, Adam:Your Code As a Crime Scene.
Pragmatic Programmers, 2015.
Fragerunde
Eure Fragen
Fragerunde
Fragen, Details, Demos,
Pair Programming?
Bin heute und morgen hier ;-) !

Weitere ähnliche Inhalte

Ähnlich wie Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwicklung [DeveloperCamp2017]

Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
Falk Neubert
 
Dipl.-Ing. Leopold Peneder (HC Solutions)
Dipl.-Ing. Leopold Peneder (HC Solutions)Dipl.-Ing. Leopold Peneder (HC Solutions)
Dipl.-Ing. Leopold Peneder (HC Solutions)
Agenda Europe 2035
 
2005 - NRW Conf: Design, Entwicklung und Tests
2005 - NRW Conf: Design, Entwicklung und Tests2005 - NRW Conf: Design, Entwicklung und Tests
2005 - NRW Conf: Design, Entwicklung und Tests
Daniel Fisher
 
Big Data - Die große Innovation?
Big Data - Die große Innovation?Big Data - Die große Innovation?
Big Data - Die große Innovation?
BARC GmbH
 
Firmenpräsentation clavis it 2011 kurz, deutsch
Firmenpräsentation clavis it 2011 kurz, deutschFirmenpräsentation clavis it 2011 kurz, deutsch
Firmenpräsentation clavis it 2011 kurz, deutsch
Martin Frischknecht
 
Firmenpräsi(kurz) clavis IT 2011
Firmenpräsi(kurz) clavis IT 2011Firmenpräsi(kurz) clavis IT 2011
Firmenpräsi(kurz) clavis IT 2011Martin Frischknecht
 
HTML5 Offline - Fallstricke für mobile Webseiten und WebApps
HTML5 Offline - Fallstricke für mobile Webseiten und WebAppsHTML5 Offline - Fallstricke für mobile Webseiten und WebApps
HTML5 Offline - Fallstricke für mobile Webseiten und WebAppsUlrich Schmidt
 
Qualitymanagement mit Sitecore und Sonarqube
Qualitymanagement mit Sitecore und SonarqubeQualitymanagement mit Sitecore und Sonarqube
Qualitymanagement mit Sitecore und Sonarqube
Daniel Scherrer
 
Verunfallte Softwarearchitektur. Erfolgreiche Lösungen höchstens per Zufall?
Verunfallte Softwarearchitektur. Erfolgreiche Lösungen höchstens per Zufall?Verunfallte Softwarearchitektur. Erfolgreiche Lösungen höchstens per Zufall?
Verunfallte Softwarearchitektur. Erfolgreiche Lösungen höchstens per Zufall?
embarc Software Consulting GmbH
 
Automatisierung von Dokumenten mit SharePoint
Automatisierung von Dokumenten mit SharePointAutomatisierung von Dokumenten mit SharePoint
Automatisierung von Dokumenten mit SharePoint
dox42
 
‘Fehler vorprogrammiert’ Paul Tours, Senior Consultant/Human Inference
‘Fehler vorprogrammiert’ Paul Tours, Senior Consultant/Human Inference‘Fehler vorprogrammiert’ Paul Tours, Senior Consultant/Human Inference
‘Fehler vorprogrammiert’ Paul Tours, Senior Consultant/Human Inference
DataValueTalk
 
Roadshow: What's new in Microsoft SQL Server 2016
Roadshow: What's new in Microsoft SQL Server 2016Roadshow: What's new in Microsoft SQL Server 2016
Roadshow: What's new in Microsoft SQL Server 2016
Digicomp Academy AG
 
Webinar ITPro Kollektion SkillSoft
Webinar ITPro Kollektion SkillSoftWebinar ITPro Kollektion SkillSoft
Webinar ITPro Kollektion SkillSoft
Susanne_fischer
 
SaaS Web 2.0 Prozessmanagement
SaaS Web 2.0 ProzessmanagementSaaS Web 2.0 Prozessmanagement
SaaS Web 2.0 Prozessmanagement
Bjoern Reinhold
 
Präsentation Werdegang tassilo koller
Präsentation Werdegang tassilo kollerPräsentation Werdegang tassilo koller
Präsentation Werdegang tassilo koller
tassilok
 
Ec2009 Templates
Ec2009 TemplatesEc2009 Templates
Ec2009 Templates
Ulrich Krause
 
Infrastructure Solution Day | Hybrid
Infrastructure Solution Day | HybridInfrastructure Solution Day | Hybrid
Infrastructure Solution Day | Hybrid
Microsoft Österreich
 
YUNA - Data Science Plattform für Unternehmen
YUNA - Data Science Plattform für UnternehmenYUNA - Data Science Plattform für Unternehmen
YUNA - Data Science Plattform für Unternehmen
eoda GmbH
 
Bi testing media_factory_0.10
Bi testing media_factory_0.10Bi testing media_factory_0.10
Bi testing media_factory_0.10inovex GmbH
 
AWS Initiate Berlin - Maschinelles Lernen - Chancen, Werkzeuge und Beispiel-A...
AWS Initiate Berlin - Maschinelles Lernen - Chancen, Werkzeuge und Beispiel-A...AWS Initiate Berlin - Maschinelles Lernen - Chancen, Werkzeuge und Beispiel-A...
AWS Initiate Berlin - Maschinelles Lernen - Chancen, Werkzeuge und Beispiel-A...
Amazon Web Services
 

Ähnlich wie Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwicklung [DeveloperCamp2017] (20)

Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
 
Dipl.-Ing. Leopold Peneder (HC Solutions)
Dipl.-Ing. Leopold Peneder (HC Solutions)Dipl.-Ing. Leopold Peneder (HC Solutions)
Dipl.-Ing. Leopold Peneder (HC Solutions)
 
2005 - NRW Conf: Design, Entwicklung und Tests
2005 - NRW Conf: Design, Entwicklung und Tests2005 - NRW Conf: Design, Entwicklung und Tests
2005 - NRW Conf: Design, Entwicklung und Tests
 
Big Data - Die große Innovation?
Big Data - Die große Innovation?Big Data - Die große Innovation?
Big Data - Die große Innovation?
 
Firmenpräsentation clavis it 2011 kurz, deutsch
Firmenpräsentation clavis it 2011 kurz, deutschFirmenpräsentation clavis it 2011 kurz, deutsch
Firmenpräsentation clavis it 2011 kurz, deutsch
 
Firmenpräsi(kurz) clavis IT 2011
Firmenpräsi(kurz) clavis IT 2011Firmenpräsi(kurz) clavis IT 2011
Firmenpräsi(kurz) clavis IT 2011
 
HTML5 Offline - Fallstricke für mobile Webseiten und WebApps
HTML5 Offline - Fallstricke für mobile Webseiten und WebAppsHTML5 Offline - Fallstricke für mobile Webseiten und WebApps
HTML5 Offline - Fallstricke für mobile Webseiten und WebApps
 
Qualitymanagement mit Sitecore und Sonarqube
Qualitymanagement mit Sitecore und SonarqubeQualitymanagement mit Sitecore und Sonarqube
Qualitymanagement mit Sitecore und Sonarqube
 
Verunfallte Softwarearchitektur. Erfolgreiche Lösungen höchstens per Zufall?
Verunfallte Softwarearchitektur. Erfolgreiche Lösungen höchstens per Zufall?Verunfallte Softwarearchitektur. Erfolgreiche Lösungen höchstens per Zufall?
Verunfallte Softwarearchitektur. Erfolgreiche Lösungen höchstens per Zufall?
 
Automatisierung von Dokumenten mit SharePoint
Automatisierung von Dokumenten mit SharePointAutomatisierung von Dokumenten mit SharePoint
Automatisierung von Dokumenten mit SharePoint
 
‘Fehler vorprogrammiert’ Paul Tours, Senior Consultant/Human Inference
‘Fehler vorprogrammiert’ Paul Tours, Senior Consultant/Human Inference‘Fehler vorprogrammiert’ Paul Tours, Senior Consultant/Human Inference
‘Fehler vorprogrammiert’ Paul Tours, Senior Consultant/Human Inference
 
Roadshow: What's new in Microsoft SQL Server 2016
Roadshow: What's new in Microsoft SQL Server 2016Roadshow: What's new in Microsoft SQL Server 2016
Roadshow: What's new in Microsoft SQL Server 2016
 
Webinar ITPro Kollektion SkillSoft
Webinar ITPro Kollektion SkillSoftWebinar ITPro Kollektion SkillSoft
Webinar ITPro Kollektion SkillSoft
 
SaaS Web 2.0 Prozessmanagement
SaaS Web 2.0 ProzessmanagementSaaS Web 2.0 Prozessmanagement
SaaS Web 2.0 Prozessmanagement
 
Präsentation Werdegang tassilo koller
Präsentation Werdegang tassilo kollerPräsentation Werdegang tassilo koller
Präsentation Werdegang tassilo koller
 
Ec2009 Templates
Ec2009 TemplatesEc2009 Templates
Ec2009 Templates
 
Infrastructure Solution Day | Hybrid
Infrastructure Solution Day | HybridInfrastructure Solution Day | Hybrid
Infrastructure Solution Day | Hybrid
 
YUNA - Data Science Plattform für Unternehmen
YUNA - Data Science Plattform für UnternehmenYUNA - Data Science Plattform für Unternehmen
YUNA - Data Science Plattform für Unternehmen
 
Bi testing media_factory_0.10
Bi testing media_factory_0.10Bi testing media_factory_0.10
Bi testing media_factory_0.10
 
AWS Initiate Berlin - Maschinelles Lernen - Chancen, Werkzeuge und Beispiel-A...
AWS Initiate Berlin - Maschinelles Lernen - Chancen, Werkzeuge und Beispiel-A...AWS Initiate Berlin - Maschinelles Lernen - Chancen, Werkzeuge und Beispiel-A...
AWS Initiate Berlin - Maschinelles Lernen - Chancen, Werkzeuge und Beispiel-A...
 

Mehr von Markus Harrer

Datenanalysen in der Softwareentwicklung (IMPROVE Workshop Wien)
Datenanalysen in der Softwareentwicklung (IMPROVE Workshop Wien)Datenanalysen in der Softwareentwicklung (IMPROVE Workshop Wien)
Datenanalysen in der Softwareentwicklung (IMPROVE Workshop Wien)
Markus Harrer
 
Software Analytics - Datenanalysen in der Softwareentwicklung (BigDataMeetup)
Software Analytics - Datenanalysen in der Softwareentwicklung (BigDataMeetup)Software Analytics - Datenanalysen in der Softwareentwicklung (BigDataMeetup)
Software Analytics - Datenanalysen in der Softwareentwicklung (BigDataMeetup)
Markus Harrer
 
Datenanalysen in der Softwareentwicklung mit Software Analytics
Datenanalysen in der Softwareentwicklung mit Software AnalyticsDatenanalysen in der Softwareentwicklung mit Software Analytics
Datenanalysen in der Softwareentwicklung mit Software Analytics
Markus Harrer
 
Software Analytics with Jupyter, Pandas, jQAssistant, and Neo4j [Neo4j Online...
Software Analytics with Jupyter, Pandas, jQAssistant, and Neo4j [Neo4j Online...Software Analytics with Jupyter, Pandas, jQAssistant, and Neo4j [Neo4j Online...
Software Analytics with Jupyter, Pandas, jQAssistant, and Neo4j [Neo4j Online...
Markus Harrer
 
Philosophy screws it all up (Pecha Kucha) [Java Forum Stuttgart 2017]
Philosophy screws it all up (Pecha Kucha) [Java Forum Stuttgart 2017]Philosophy screws it all up (Pecha Kucha) [Java Forum Stuttgart 2017]
Philosophy screws it all up (Pecha Kucha) [Java Forum Stuttgart 2017]
Markus Harrer
 
Architektur und Code im Einklang [JUG Nürnberg]
Architektur und Code im Einklang [JUG Nürnberg]Architektur und Code im Einklang [JUG Nürnberg]
Architektur und Code im Einklang [JUG Nürnberg]
Markus Harrer
 
Architektur und Code im Einklang [DeveloperCamp 2017]
Architektur und Code im Einklang [DeveloperCamp 2017]Architektur und Code im Einklang [DeveloperCamp 2017]
Architektur und Code im Einklang [DeveloperCamp 2017]
Markus Harrer
 
Software Analytics for Pragmatists [DevOps Camp 2017]
Software Analytics for Pragmatists [DevOps Camp 2017]Software Analytics for Pragmatists [DevOps Camp 2017]
Software Analytics for Pragmatists [DevOps Camp 2017]
Markus Harrer
 
Einsatzmöglichkeiten der automatisierten Analyse von Artefakten und Metadaten...
Einsatzmöglichkeiten der automatisierten Analyse von Artefakten und Metadaten...Einsatzmöglichkeiten der automatisierten Analyse von Artefakten und Metadaten...
Einsatzmöglichkeiten der automatisierten Analyse von Artefakten und Metadaten...
Markus Harrer
 
Erkenntnistheoretische Beurteilung von Extreme Programming
Erkenntnistheoretische Beurteilung von Extreme ProgrammingErkenntnistheoretische Beurteilung von Extreme Programming
Erkenntnistheoretische Beurteilung von Extreme Programming
Markus Harrer
 
An interactive form-based mobile software system with a sample application in...
An interactive form-based mobile software system with a sample application in...An interactive form-based mobile software system with a sample application in...
An interactive form-based mobile software system with a sample application in...
Markus Harrer
 
Erkenntnistheoretische Beurteilung von Extreme Programming
Erkenntnistheoretische Beurteilung von Extreme ProgrammingErkenntnistheoretische Beurteilung von Extreme Programming
Erkenntnistheoretische Beurteilung von Extreme Programming
Markus Harrer
 

Mehr von Markus Harrer (12)

Datenanalysen in der Softwareentwicklung (IMPROVE Workshop Wien)
Datenanalysen in der Softwareentwicklung (IMPROVE Workshop Wien)Datenanalysen in der Softwareentwicklung (IMPROVE Workshop Wien)
Datenanalysen in der Softwareentwicklung (IMPROVE Workshop Wien)
 
Software Analytics - Datenanalysen in der Softwareentwicklung (BigDataMeetup)
Software Analytics - Datenanalysen in der Softwareentwicklung (BigDataMeetup)Software Analytics - Datenanalysen in der Softwareentwicklung (BigDataMeetup)
Software Analytics - Datenanalysen in der Softwareentwicklung (BigDataMeetup)
 
Datenanalysen in der Softwareentwicklung mit Software Analytics
Datenanalysen in der Softwareentwicklung mit Software AnalyticsDatenanalysen in der Softwareentwicklung mit Software Analytics
Datenanalysen in der Softwareentwicklung mit Software Analytics
 
Software Analytics with Jupyter, Pandas, jQAssistant, and Neo4j [Neo4j Online...
Software Analytics with Jupyter, Pandas, jQAssistant, and Neo4j [Neo4j Online...Software Analytics with Jupyter, Pandas, jQAssistant, and Neo4j [Neo4j Online...
Software Analytics with Jupyter, Pandas, jQAssistant, and Neo4j [Neo4j Online...
 
Philosophy screws it all up (Pecha Kucha) [Java Forum Stuttgart 2017]
Philosophy screws it all up (Pecha Kucha) [Java Forum Stuttgart 2017]Philosophy screws it all up (Pecha Kucha) [Java Forum Stuttgart 2017]
Philosophy screws it all up (Pecha Kucha) [Java Forum Stuttgart 2017]
 
Architektur und Code im Einklang [JUG Nürnberg]
Architektur und Code im Einklang [JUG Nürnberg]Architektur und Code im Einklang [JUG Nürnberg]
Architektur und Code im Einklang [JUG Nürnberg]
 
Architektur und Code im Einklang [DeveloperCamp 2017]
Architektur und Code im Einklang [DeveloperCamp 2017]Architektur und Code im Einklang [DeveloperCamp 2017]
Architektur und Code im Einklang [DeveloperCamp 2017]
 
Software Analytics for Pragmatists [DevOps Camp 2017]
Software Analytics for Pragmatists [DevOps Camp 2017]Software Analytics for Pragmatists [DevOps Camp 2017]
Software Analytics for Pragmatists [DevOps Camp 2017]
 
Einsatzmöglichkeiten der automatisierten Analyse von Artefakten und Metadaten...
Einsatzmöglichkeiten der automatisierten Analyse von Artefakten und Metadaten...Einsatzmöglichkeiten der automatisierten Analyse von Artefakten und Metadaten...
Einsatzmöglichkeiten der automatisierten Analyse von Artefakten und Metadaten...
 
Erkenntnistheoretische Beurteilung von Extreme Programming
Erkenntnistheoretische Beurteilung von Extreme ProgrammingErkenntnistheoretische Beurteilung von Extreme Programming
Erkenntnistheoretische Beurteilung von Extreme Programming
 
An interactive form-based mobile software system with a sample application in...
An interactive form-based mobile software system with a sample application in...An interactive form-based mobile software system with a sample application in...
An interactive form-based mobile software system with a sample application in...
 
Erkenntnistheoretische Beurteilung von Extreme Programming
Erkenntnistheoretische Beurteilung von Extreme ProgrammingErkenntnistheoretische Beurteilung von Extreme Programming
Erkenntnistheoretische Beurteilung von Extreme Programming
 

Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwicklung [DeveloperCamp2017]

Hinweis der Redaktion

  1. „Keine auf Empirie basierende Untersuchung kann ein allum-fassendes Ergebnis liefern.“ Betrand Meyer Aktives Gegensteuern durch: Einschränkung der kontextabhängigen Messergebnisse Möglichkeit der manuellen Datenbewertung
  2. Weshalb schlagen unsere CI-Builds fehl? Woher kommen die vielen DB-Calls? Welcher Entwickler kennt sich im Code aus? Wo gibt es sich gegenseitig überschreibende statische Variablen? Wo verletzen wir Compliance-Vorgaben? Wie schlimm sind unsere technischen Schulden? ... Oft auch: Wo fange ich an?
  3. 3 Ideen generieren Problem formulieren Hypothese festlegen etc. Durchführung Reproduzierbarkeit Replizierbarkeit Automatisierung
  4. 3
  5. 3 Ideen generieren Problem formulieren Hypothese festlegen etc. Durchführung Reproduzierbarkeit Replizierbarkeit Automatisierung
  6. 3 Ideen generieren Problem formulieren Hypothese festlegen etc. Durchführung Reproduzierbarkeit Replizierbarkeit Automatisierung
  7. 3 Ideen generieren Problem formulieren Hypothese festlegen etc. Durchführung Reproduzierbarkeit Replizierbarkeit Automatisierung
  8. 3
  9. SonarQube & Co: Null Datenberienigung Nichts ohne Kommentar wegwerfen Datenbereinigung durchführen etc. Datentypen (inkl. Einheiten) kontrollieren Codierungen vermeiden Explizite Ausnahmen erläutern Stylings explizit aufbereiten Fehlenden Daten behandeln Datenprobleme offenlegen  Pro Variable eine Spalte  Für jede Beobachtung eine Reihe  Eine Tabelle für jede zusammengehörige Gruppe von Variablen  Für jede Tabelle einer Analyse ein verlinkende Spalte
  10. 3 Ideen generieren Problem formulieren Hypothese festlegen etc. Durchführung Reproduzierbarkeit Replizierbarkeit Automatisierung
  11. Eingabedaten dokumentiert Ideen, Annahmen und Vereinfachungen kommuniziert Vorverarbeitung dokumentiert Rechenweg offengelegt Zusammenfassungen begründet
  12. 3 Ideen generieren Problem formulieren Hypothese festlegen etc. Durchführung Reproduzierbarkeit Replizierbarkeit Automatisierung
  13. 3 Ideen generieren Problem formulieren Hypothese festlegen etc. Durchführung Reproduzierbarkeit Replizierbarkeit Automatisierung
  14. Python is Easy Universally, Python has gained a reputation because of it’s easy to learn. The syntax of Python programming language is designed to be easily readable. Python has significant popularity in  scientific computing. The people working in this field are scientists first, and programmers second. Python is Efficient Nowadays we working on bulk amount of data, popularly known as big data.  The more data you have to process, the more important it becomes to manage the memory you use. Here Python will work very efficiently. Python is Fast We all know Python is an interpreted language, we may think that it is slow, but some amazing work has been done over the past years to improve Python’s performance. My point is that if you want to do high-performance computing, Python is a viable best option today.
  15. Pragmatisches Datenanalyse-Framework Schnelle, flexible und ausdruckstarke Datenstrukturen Tabellenartige Daten Zeitreihen Vektor-/Matrix-Operationen Sehr gute Integration mit Datenquellen Wissenschaftlichen Bibliotheken
  16. KIV Kinder Idioten Vorstandsvorsitzender
  17. 7
  18. ABER: Auswertungen sind harte Arbeit Erste Schritte: innerhalb von 30 Minuten Erste brauchbare Analyse: nach ca. 1 Woche Gut genug: nach ca. 1 Monat Meistern: ein Leben lang
  19. 6
  20. 6
  21. 6