SlideShare ist ein Scribd-Unternehmen logo
Was ist Data
Engineering?
von Cédric Gaudissart
In einem Satz ist Data Engineering das Management von
Systemen, um Daten nutzbar zu machen. Der Lebenszyklus
des Data Engineering umfasst eine Reihe von Phasen, die
darauf abzielen, Rohdaten in nutzbare Daten umzuwandeln.
Von der
Datensammlung zur
Verarbeitung
Datensammlung
Data Engineers sammeln Daten aus
verschiedenen Quellen, einschließlich interner
Datenbanken, IoT-Geräten und externen APIs.
Diese Phase ist wesentlich für die
Ansammlung der Rohmaterialien, die für
Analysen notwendig sind.
Datenaufnahme
Dies beinhaltet die Übertragung von Daten an
Systeme zur Verarbeitung und Speicherung, oft
automatisiert durch Data Engineers. Diese
Phase muss effizient sein, um das Volumen
und die Geschwindigkeit der eingehenden
Daten zu bewältigen.
Datenverarbeitung
Data Engineers validieren, bereinigen und
transformieren Daten, um Qualität und
Nutzbarkeit zu gewährleisten. Dies umfasst
das Entfernen von Duplikaten, das Korrigieren
von Fehlern und das Transformieren der Daten
in ein konsistentes Format.
Integration und Speicherung von Daten
Datenintegration
Data Engineers kombinieren
Daten aus verschiedenen
Quellen, bereichern und
kontextualisieren
Informationen, um eine
ganzheitliche Sicht zu bieten.
Datenspeicherung
Data Engineers organisieren
und speichern Daten auf eine
skalierbare, sichere Weise,
bereit für den Zugriff und die
Analyse. Datenbanken, Daten-
Seen und Datenlager sind
Schlüsselkomponenten.
Datenorchestrierung
Data Engineers optimieren die
Koordination zwischen
verschiedenen Stufen,
automatisieren den Datenfluss
durch Pipelines und stellen
sicher, dass die Daten nahtlos
von der Sammlung zur Analyse
übergehen.
Sicherstellung von Datenqualität und
Zuverlässigkeit
Datenqualitäts
kontrolle
Data Engineers erhalten die
Zuverlässigkeit und
Integrität der Daten durch
kontinuierliches Monitoring,
Validierung und
Korrekturprozesse. Dies
gewährleistet die
allgemeine Qualität der
Daten für fundierte
Entscheidungsfindungen.
Wartung der
Datenpipeline
Data Engineers
aktualisieren, optimieren
und sichern kontinuierlich
die Datenprozesse und -
technologien, um einen
effizienten und konformen
Datenfluss zu
gewährleisten.
Datenarchivierung
Data Engineers bieten ein
sicheres Repository für
historische Daten, das die
Einhaltung von Vorschriften
und zukünftige
Zugänglichkeit erleichtert
und gleichzeitig die
Leistung des aktuellen
Systems optimiert.
Datenmanagement
Im gesamten Lebenszyklus des Data Engineering
werden strenge Datenmanagementpraktiken
aufrechterhalten, um Datenqualität, Datenschutz und
Governance zu gewährleisten. Dies unterstreicht den
Lebenszyklus des Data Engineering als Eckpfeiler für
datengesteuerte Organisationen.

Weitere ähnliche Inhalte

Ähnlich wie Verständnis dafür, was Daten-Engineering ist (in 5 Minuten)

Schritt-für-Schritt-Anleitung zur erfolgreichen SAP Systemstilllegung.docx
Schritt-für-Schritt-Anleitung zur erfolgreichen SAP Systemstilllegung.docxSchritt-für-Schritt-Anleitung zur erfolgreichen SAP Systemstilllegung.docx
Schritt-für-Schritt-Anleitung zur erfolgreichen SAP Systemstilllegung.docx
AVENDATA
 
BATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und KnacknüsseBATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und Knacknüsse
BATbern
 
Saubere Datenmigrations-Konzepte
Saubere Datenmigrations-KonzepteSaubere Datenmigrations-Konzepte
Saubere Datenmigrations-Konzepte
IBsolution GmbH
 
Challenge & Chancen von Migrations-Projekten
Challenge & Chancen von Migrations-ProjektenChallenge & Chancen von Migrations-Projekten
Challenge & Chancen von Migrations-Projekten
Michael Denzler
 
Applikationsmodernisierung: Der Weg von Legacy in die Cloud
Applikationsmodernisierung: Der Weg von Legacy in die CloudApplikationsmodernisierung: Der Weg von Legacy in die Cloud
Applikationsmodernisierung: Der Weg von Legacy in die Cloud
Aarno Aukia
 
Datenqualität verbessern: Initiale Datenbereinigung Sopra Steria Consulting
Datenqualität verbessern: Initiale Datenbereinigung Sopra Steria ConsultingDatenqualität verbessern: Initiale Datenbereinigung Sopra Steria Consulting
Datenqualität verbessern: Initiale Datenbereinigung Sopra Steria Consulting
Sopra Steria Consulting
 
Datenmanagement
DatenmanagementDatenmanagement
Datenmanagement
Uniserv
 
Digitale Transformation der Instandhaltung Whitepaper
Digitale Transformation der Instandhaltung WhitepaperDigitale Transformation der Instandhaltung Whitepaper
Digitale Transformation der Instandhaltung Whitepaper
dankl+partner consulting gmbh
 
Digitale Transformation der Instandhaltung Whitepaper
Digitale Transformation der Instandhaltung WhitepaperDigitale Transformation der Instandhaltung Whitepaper
Digitale Transformation der Instandhaltung Whitepaper
MCP Deutschland GmbH
 
IRF Solutions - Data Focus for Financial Systems
IRF Solutions - Data Focus for Financial SystemsIRF Solutions - Data Focus for Financial Systems
IRF Solutions - Data Focus for Financial Systems
Josef A. Bayer
 
Prozessoptimierung mit ITIL
Prozessoptimierung mit ITILProzessoptimierung mit ITIL
Prozessoptimierung mit ITIL
Christian Reinboth
 
Firmenpräsentation clavis it 2011 kurz, deutsch
Firmenpräsentation clavis it 2011 kurz, deutschFirmenpräsentation clavis it 2011 kurz, deutsch
Firmenpräsentation clavis it 2011 kurz, deutsch
Martin Frischknecht
 
Firmenpräsi(kurz) clavis IT 2011
Firmenpräsi(kurz) clavis IT 2011Firmenpräsi(kurz) clavis IT 2011
Firmenpräsi(kurz) clavis IT 2011Martin Frischknecht
 
Xidra 2016 DevOps
Xidra 2016 DevOpsXidra 2016 DevOps
Xidra 2016 DevOps
Eduard van den Bongard
 
"Erfolgreiche Strategien zur Migration veralteter Software" Präsentation vom ...
"Erfolgreiche Strategien zur Migration veralteter Software" Präsentation vom ..."Erfolgreiche Strategien zur Migration veralteter Software" Präsentation vom ...
"Erfolgreiche Strategien zur Migration veralteter Software" Präsentation vom ...
Bernhard Schimunek
 
Modernes Rechenzentrum
Modernes Rechenzentrum Modernes Rechenzentrum
Modernes Rechenzentrum
Microsoft Österreich
 
Kosten-Nutzen-Analyse der SAP Systemstilllegung Lohnt sich die Investition,.docx
Kosten-Nutzen-Analyse der SAP Systemstilllegung Lohnt sich die Investition,.docxKosten-Nutzen-Analyse der SAP Systemstilllegung Lohnt sich die Investition,.docx
Kosten-Nutzen-Analyse der SAP Systemstilllegung Lohnt sich die Investition,.docx
AVENDATA
 
2016 pcc presse_03_dcc_ontras_dcc_ver05
2016 pcc presse_03_dcc_ontras_dcc_ver052016 pcc presse_03_dcc_ontras_dcc_ver05
2016 pcc presse_03_dcc_ontras_dcc_ver05
Ulrich Schmidt
 
Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...
Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...
Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...
OPITZ CONSULTING Deutschland
 
Warum Ihre Firma ein API braucht
Warum Ihre Firma ein API brauchtWarum Ihre Firma ein API braucht
Warum Ihre Firma ein API braucht
Netcetera
 

Ähnlich wie Verständnis dafür, was Daten-Engineering ist (in 5 Minuten) (20)

Schritt-für-Schritt-Anleitung zur erfolgreichen SAP Systemstilllegung.docx
Schritt-für-Schritt-Anleitung zur erfolgreichen SAP Systemstilllegung.docxSchritt-für-Schritt-Anleitung zur erfolgreichen SAP Systemstilllegung.docx
Schritt-für-Schritt-Anleitung zur erfolgreichen SAP Systemstilllegung.docx
 
BATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und KnacknüsseBATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und Knacknüsse
 
Saubere Datenmigrations-Konzepte
Saubere Datenmigrations-KonzepteSaubere Datenmigrations-Konzepte
Saubere Datenmigrations-Konzepte
 
Challenge & Chancen von Migrations-Projekten
Challenge & Chancen von Migrations-ProjektenChallenge & Chancen von Migrations-Projekten
Challenge & Chancen von Migrations-Projekten
 
Applikationsmodernisierung: Der Weg von Legacy in die Cloud
Applikationsmodernisierung: Der Weg von Legacy in die CloudApplikationsmodernisierung: Der Weg von Legacy in die Cloud
Applikationsmodernisierung: Der Weg von Legacy in die Cloud
 
Datenqualität verbessern: Initiale Datenbereinigung Sopra Steria Consulting
Datenqualität verbessern: Initiale Datenbereinigung Sopra Steria ConsultingDatenqualität verbessern: Initiale Datenbereinigung Sopra Steria Consulting
Datenqualität verbessern: Initiale Datenbereinigung Sopra Steria Consulting
 
Datenmanagement
DatenmanagementDatenmanagement
Datenmanagement
 
Digitale Transformation der Instandhaltung Whitepaper
Digitale Transformation der Instandhaltung WhitepaperDigitale Transformation der Instandhaltung Whitepaper
Digitale Transformation der Instandhaltung Whitepaper
 
Digitale Transformation der Instandhaltung Whitepaper
Digitale Transformation der Instandhaltung WhitepaperDigitale Transformation der Instandhaltung Whitepaper
Digitale Transformation der Instandhaltung Whitepaper
 
IRF Solutions - Data Focus for Financial Systems
IRF Solutions - Data Focus for Financial SystemsIRF Solutions - Data Focus for Financial Systems
IRF Solutions - Data Focus for Financial Systems
 
Prozessoptimierung mit ITIL
Prozessoptimierung mit ITILProzessoptimierung mit ITIL
Prozessoptimierung mit ITIL
 
Firmenpräsentation clavis it 2011 kurz, deutsch
Firmenpräsentation clavis it 2011 kurz, deutschFirmenpräsentation clavis it 2011 kurz, deutsch
Firmenpräsentation clavis it 2011 kurz, deutsch
 
Firmenpräsi(kurz) clavis IT 2011
Firmenpräsi(kurz) clavis IT 2011Firmenpräsi(kurz) clavis IT 2011
Firmenpräsi(kurz) clavis IT 2011
 
Xidra 2016 DevOps
Xidra 2016 DevOpsXidra 2016 DevOps
Xidra 2016 DevOps
 
"Erfolgreiche Strategien zur Migration veralteter Software" Präsentation vom ...
"Erfolgreiche Strategien zur Migration veralteter Software" Präsentation vom ..."Erfolgreiche Strategien zur Migration veralteter Software" Präsentation vom ...
"Erfolgreiche Strategien zur Migration veralteter Software" Präsentation vom ...
 
Modernes Rechenzentrum
Modernes Rechenzentrum Modernes Rechenzentrum
Modernes Rechenzentrum
 
Kosten-Nutzen-Analyse der SAP Systemstilllegung Lohnt sich die Investition,.docx
Kosten-Nutzen-Analyse der SAP Systemstilllegung Lohnt sich die Investition,.docxKosten-Nutzen-Analyse der SAP Systemstilllegung Lohnt sich die Investition,.docx
Kosten-Nutzen-Analyse der SAP Systemstilllegung Lohnt sich die Investition,.docx
 
2016 pcc presse_03_dcc_ontras_dcc_ver05
2016 pcc presse_03_dcc_ontras_dcc_ver052016 pcc presse_03_dcc_ontras_dcc_ver05
2016 pcc presse_03_dcc_ontras_dcc_ver05
 
Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...
Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...
Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...
 
Warum Ihre Firma ein API braucht
Warum Ihre Firma ein API brauchtWarum Ihre Firma ein API braucht
Warum Ihre Firma ein API braucht
 

Verständnis dafür, was Daten-Engineering ist (in 5 Minuten)

  • 1. Was ist Data Engineering? von Cédric Gaudissart In einem Satz ist Data Engineering das Management von Systemen, um Daten nutzbar zu machen. Der Lebenszyklus des Data Engineering umfasst eine Reihe von Phasen, die darauf abzielen, Rohdaten in nutzbare Daten umzuwandeln.
  • 2. Von der Datensammlung zur Verarbeitung Datensammlung Data Engineers sammeln Daten aus verschiedenen Quellen, einschließlich interner Datenbanken, IoT-Geräten und externen APIs. Diese Phase ist wesentlich für die Ansammlung der Rohmaterialien, die für Analysen notwendig sind. Datenaufnahme Dies beinhaltet die Übertragung von Daten an Systeme zur Verarbeitung und Speicherung, oft automatisiert durch Data Engineers. Diese Phase muss effizient sein, um das Volumen und die Geschwindigkeit der eingehenden Daten zu bewältigen. Datenverarbeitung Data Engineers validieren, bereinigen und transformieren Daten, um Qualität und Nutzbarkeit zu gewährleisten. Dies umfasst das Entfernen von Duplikaten, das Korrigieren von Fehlern und das Transformieren der Daten in ein konsistentes Format.
  • 3. Integration und Speicherung von Daten Datenintegration Data Engineers kombinieren Daten aus verschiedenen Quellen, bereichern und kontextualisieren Informationen, um eine ganzheitliche Sicht zu bieten. Datenspeicherung Data Engineers organisieren und speichern Daten auf eine skalierbare, sichere Weise, bereit für den Zugriff und die Analyse. Datenbanken, Daten- Seen und Datenlager sind Schlüsselkomponenten. Datenorchestrierung Data Engineers optimieren die Koordination zwischen verschiedenen Stufen, automatisieren den Datenfluss durch Pipelines und stellen sicher, dass die Daten nahtlos von der Sammlung zur Analyse übergehen.
  • 4. Sicherstellung von Datenqualität und Zuverlässigkeit Datenqualitäts kontrolle Data Engineers erhalten die Zuverlässigkeit und Integrität der Daten durch kontinuierliches Monitoring, Validierung und Korrekturprozesse. Dies gewährleistet die allgemeine Qualität der Daten für fundierte Entscheidungsfindungen. Wartung der Datenpipeline Data Engineers aktualisieren, optimieren und sichern kontinuierlich die Datenprozesse und - technologien, um einen effizienten und konformen Datenfluss zu gewährleisten. Datenarchivierung Data Engineers bieten ein sicheres Repository für historische Daten, das die Einhaltung von Vorschriften und zukünftige Zugänglichkeit erleichtert und gleichzeitig die Leistung des aktuellen Systems optimiert.
  • 5. Datenmanagement Im gesamten Lebenszyklus des Data Engineering werden strenge Datenmanagementpraktiken aufrechterhalten, um Datenqualität, Datenschutz und Governance zu gewährleisten. Dies unterstreicht den Lebenszyklus des Data Engineering als Eckpfeiler für datengesteuerte Organisationen.