SlideShare ist ein Scribd-Unternehmen logo
1 von 30
Downloaden Sie, um offline zu lesen
© OPITZ CONSULTING 2021 / Öffentlich
Daten wirklich nutzen! 1
Was Ihre Daten in der
Digitalisierung können müssen
Online, 1. Juli 2021
Halidun Yüksel, Jürgen Fischer
DATEN WIRKLICH NUTZEN
© OPITZ CONSULTING 2021 / Öffentlich
BITTE BEACHTEN SIE…
Wir werden Ihnen
die Aufzeichnung
dieses Webinars
sowie die
Vortragsfolien in
den nächsten
Tagen zusenden.
Alle Teilnehmer
sind
stummgeschaltet.
Nur so können wir
ein störungsfreies
Webinar bei großer
Personenzahl
gewährleisten.
Bitte melden Sie
sich bei
technischen
Störungen
während des
Webinars über die
Frage-Funktion an
die Organisatoren.
Ihre inhaltlichen
Fragen stellen Sie
bitte auch über die
Frage-Funktion.
Wir beantworten
diese gerne zum
Ende des Webinars.
Daten wirklich nutzen! Seite 2
© OPITZ CONSULTING 2021 / Öffentlich
Daten wirklich nutzen! 3
© OPITZ CONSULTING 2021 / Öffentlich
Daten wirklich nutzen! 4
WOZU NUTZEN WIR EIGENTLICH DATEN?
© OPITZ CONSULTING 2021 / Öffentlich
DATEN FÜHREN ZU ENTSCHEIDUNGEN UND HANDLUNGEN
Daten wirklich nutzen! 5
Lorem
ipsum Aus der Bedeutung leiten sich dann explizite
Entscheidungen und Handlungen ab.
Dem generierten Wissen wird eine Bedeutung
zugewiesen. Welche Konsequenz ziehen
verschiedene Alternativen nach sich?
Informationen werden zu Wissen, sie
werden verstanden und in Beziehung
zueinander gebracht
Aus isolierten Daten werden
Informationen, die beschreibenden
Charakter haben
Entscheidung
und
Handlung
Bedeutung
Wissen
Daten und
Informationen
In Anlehnung an das m³ Manifest Meaning Model von Barry Devlin
© OPITZ CONSULTING 2021 / Öffentlich
Daten wirklich nutzen! 6
© OPITZ CONSULTING 2021 / Öffentlich
COVID-19 – AUF WELCHER BASIS
WERDEN ENTSCHEIDUNGEN
GETROFFEN?
Daten wirklich nutzen! 7
https://www.aerztezeitung.de/Politik/Gesundheitsweiser-Gerlach-kritisiert-schlechte-Daten-und-Entscheidungen-im-Blindflug-408227.html
© OPITZ CONSULTING 2021 / Öffentlich
Daten wirklich nutzen! 8
GUTE DATEN SIND DIE BASIS FÜR ANALYTICS
© OPITZ CONSULTING 2021 / Öffentlich
Daten wirklich nutzen! 9
 "Analytics is an umbrella term that describes the people,
processes, and technologies used to turn data into insights
into action. In this sense, analytics encompasses data
warehousing, business intelligence (BI), performance
management, and data mining"
THE NEW KID IN TOWN: ANALYTICS
„Secrets of Analytical Leaders“, ISBN 978-1935504344
Wayne Eckerson
© OPITZ CONSULTING 2021 / Öffentlich
BEING DATA-DRIVEN?
Data Management
 Was?
 Mehr Daten, neue Quellen,
andere Daten, auf den
Anwendungsfall optimiert
Data Analytics
 Wie?
 Reporting (Standard, Ad-hoc),
Vorhersagen, Machine
Learning, Cognitive,
Autonomous
Data Democratization
 Wer?
 Mehr Nutzer, breitere
Nutzen, besseres
Verständnis von Daten,
Analyse und Nutzen
Daten wirklich nutzen! 10
© OPITZ CONSULTING 2021 / Öffentlich
ANALYTISCHE BANDBREITE
Daten wirklich nutzen! 11
Daten
Aktion
Feedback
Descriptive
What happened?
Entscheidung
Diagnostic
Why did it happen?
Predictive
What will happen?
Prescriptive
What should I do?
Decision support
Decision automation
Analyse Menschlicher Einfluß
Analytics
AI, Machine Learning
- Einfache Berechnungen
- Reporting/Dashboards
- Gängige BI Plattformen
- Data Science
- Neuronale Netze
© OPITZ CONSULTING 2021 / Öffentlich
Daten wirklich nutzen! 12
„IF YOU CANT‘T BUILD A DATA WAREHOUSE,
YOU SHOULDN‘T DO AI."
(Andrew Ng, Stanford University)
© OPITZ CONSULTING 2021 / Öffentlich
MDM/DQM – DER FC BAYERN UNTER DEN ANALYTICS TRENDS
Daten wirklich nutzen! 13
© OPITZ CONSULTING 2021 / Öffentlich
KLEINER FEHLER – GROßE WIRKUNG
DER LOGIKBAUM
Daten wirklich nutzen! 14
Umsatzverlust
Imageverlust
Kosten-
steigerung
Anzahl Kunden
unscharf bzw.
unbekannt
Aufwand pro
Kunde unscharf
Umsatz pro
Kunde unscharf
Tatsächlicher
Kundenzuwachs oder
–abgang schwer zu
ermitteln
Kundenwertanalysen
werden unscharf
Kundenbetreuung
wird falsch
priorisiert
Fehlerhafte Kunden- /
Vertragsbereinigungsmaßnahmen
Verlust wichtiger Kunden
Kunde erhält
dieselben Angebote
mehrfach
Erhöhte
Werbekosten
Kunde kann
Angebot nur einmal
nutzen
Kunde wird
verärgert
Kundenkreditlimits
greifen nicht
(Kunden können
über mehrere
Kundennummern
höhere Limits
ausnutzen)
Erhöhter Aufwand
und Kosten bei
Bonitätsprüfungen
Erhöhtes
Forderungsausfall-
risiko
Auswirkung Dubletten in Kundenstammdaten
© OPITZ CONSULTING 2021 / Öffentlich
NOTWENDIGKEIT EINER HOHEN DATENQUALITÄT
SICHTBARE UND VERMEINTLICH UNSICHTBARE AUSWIRKUNGEN NIEDRIGER DATENQUALITÄT
Daten wirklich nutzen! 15
➢ Geldstrafen
➢ Wiederholte
Dateneingabe
➢ Verlorene
Aufträge
➢ Korrektur
der Daten
➢ Systemkosten-
Erhöhung
➢ Entgangene Neukunden
➢ Zeitverlust
➢ Imageschäden
➢ Kunden-
abwanderung
➢ Zinskosten
➢ Lange Suchdauer
➢ Falsche Entscheidungen
➢ Mitarbeiter-
unzufriedenheit
➢ Rückläufer
© OPITZ CONSULTING 2021 / Öffentlich
SYMPTOME SCHLECHTER DATEN*
SCHLECHTE DATEN VERURSACHEN KOSTEN
Daten wirklich nutzen! 16
78%
veraltete Daten
68%
doppelte/mehrfach
vorhandene Daten
20%
hohe
Rückläuferquote
37%
postalisch falsche
Daten
85%
unvollständige
Daten
*Laut Uniserv Studie:
https://www.uniserv.com/unternehmen/blog/detail/article/ergebnisse-der-trendstudie-kundendatenmanagement-2018
© OPITZ CONSULTING 2021 / Öffentlich
DATENQUALITÄTS-VERBESSERUNGSPROZESS
FACHLICHE UND TECHNISCHE
MAßNAHMEN SIND ERFORDERLICH
Daten wirklich nutzen! 17
Ist-Analyse der
Datenqualität
• Technischer Prozess
1.
Datenqualitätsprozess
im Unternehmen
etablieren
• Fachlicher und
strategischer Prozess
4.
Datenbereinigung
• Technischer Prozess
3.
Regeln und
Überwachung für
Daten festlegen
• Fachlicher Prozess
2.
Nachhaltiges Datenmanagement
Unregelmäßige Überprüfung der
Qualität
© OPITZ CONSULTING 2021 / Öffentlich
IST-ANALYSE DER DATENQUALITÄT
METRIKEN*
Daten wirklich nutzen! 18
Ein Datensatz darf in sich und zu anderen Datensätzen
keine Widersprüche aufweisen
Jeder Datensatz muss eindeutig
interpretierbar sein
Ein Datensatz muss
alle notwendigen Attribute enthalten
Die Daten müssen mit der Realität
übereinstimmen
Alle Datensätze müssen jeweils dem aktuellen
Zustand der abgebildeten Realität entsprechen
Innerhalb der Datensätze dürfen
keine Dubletten vorkommen
Die Informationen eines Datensatzes
müssen einheitlich strukturiert sein
Datenqualität
Konsistenz
Gültigkeit
Vollständigkeit
Korrektheit
Genauigkeit
Redundanz-
freiheit
Einheitlichkeit
*in Anlehnung an DGIQ – IQ Definition 2007
© OPITZ CONSULTING 2021 / Öffentlich
DATENQUALITÄT ALS CHANGE PROZESS
Daten wirklich nutzen! 19
Regeln zum Umgang
mit fehlerhaften Daten
definieren
Mitarbeiter befähigen
Prozesse zur
Datenerfassung festlegen
Data
Regeln
&
Prozesse
Verantwortlichkeiten
klären
© OPITZ CONSULTING 2021 / Öffentlich
DATENBEREINIGUNG
Daten wirklich nutzen! 20
Manuelle Datenbereinigung
• Überprüfung von Aktualität der Daten
• Überprüfung bei ähnlichen Daten die nicht
automatisiert bereinigt sind
• Erstellen neuer Regeln, anhand von Erkenntnissen
während der Datenbereinigung
Technische, automatisierte
Datenbereinigung
• Dubletten erkennen und eliminieren
• Regelbasiertes Cleansing z.B. Schreibweisen von
Ortsnamen, Alter des Datensatzes
• Erstellen von Ähnlichkeitsclustern
• Übernahme der Daten aus einem zentralen
System (Data Warehouse)
• Berichte an die Data Stewards über
automatisierte Datenbereinigungen
© OPITZ CONSULTING 2021 / Öffentlich
MACHEN SIE MIT UNS DEN
DATA QUALITY QUICK CHECK
Daten wirklich nutzen! 21
 Wir überprüfen ausgewählte Entitäten und
zugehörige Tabellen anhand von 7 Kriterien
für eine gute Datenqualität.
 Wir machen die Datenqualität transparent.
Wo sind Sie gut aufgestellt, wo gibt es
Potenziale?
 Was bedeuten die Ergebnisse für Ihre
nächsten Projekte? Sie erhalten eine genaue
Übersicht, eine persönliche Bewertung und
Vorschläge für mögliche Maßnahmen.
 Fact Sheet: Data Quality Quick Check
© OPITZ CONSULTING 2021 / Öffentlich
DATENQUALITÄT – EINHEITLICHKEIT
Daten wirklich nutzen! 22
Die Informationen eines Datensatzes müssen einheitlich strukturiert sein.
Das heißt, eine Menge von Daten wird fortlaufend einheitlich präsentiert.
Beispiel
Kundenadressen sind entsprechend der festgelegten Regeln zu erfassen
Es wird z.B. festgestellt, dass Ortsnamen in verschiedenen Schreibweisen erfasst wurden.(z.B. Köln, Koeln, KÖLN, KOELN)
Berechnung
Von 100.000 Ortsnamen weichen 25.000 Ortsnamen von der vereinbarten Schreibregel ab
75.000 Datensätze sind einheitlich. Ergibt 75% Einheitlichkeit
© OPITZ CONSULTING 2021 / Öffentlich
DATENQUALITÄT – GÜLTIGKEIT
Daten wirklich nutzen! 23
Jeder Datensatz muss eindeutig interpretierbar sein.
Datenelement, das gegen sich selbst/sein Gegenstück in einem anderen Datensatz/einer Datenbank gemessen
wurde
Beispiel
Zwei Datensätze (z.B. Kundenadressdatensatz) mit unterschiedlicher ID (Kundennummer) unterscheiden sich in allen weiteren
Attributen z.B. nur in einem weiteren Merkmal (Geburtsdatum)
ID1 -> Gebdat = 21.05.1991 ; ID2 -> Gebdat = 23.06.1991
Alle weiteren Attribute wie z.B. Name, Vorname, Straße, Hausnummer, PLZ, Ort, sind identisch.
Es besteht berechtigter Zweifel, ob es sich hier tatsächlich um zwei unterschiedliche Kunden handelt. Zusätzlich entsteht der Zweifel,
ob eines oder sogar keines der Geburtsdaten richtig ist. Somit sind beide Datensätze nicht mehr eindeutig interpretierbar.
Berechnung
Von 100.000 Kundendatensätzen sind 10.000 bis auf wenige Merkmale identisch, ähnlich und
nicht eindeutig. 95.000 Datensätze sind eindeutig. Ergibt 90% Eindeutigkeit
© OPITZ CONSULTING 2021 / Öffentlich
DATENQUALITÄT – VOLLSTÄNDIGKEIT
Daten wirklich nutzen! 24
Berechnung
100.000 Kundendatensätze liegen vor. Davon sind 2000 Attributeinträge leer.
98.000 Datensätze sind Vollständig. Das ergibt 98% Vollständigkeit der Kundendatensätze.
Vollständigkeit Datensatz
▪ Ein vollständiger "Kundenadressdatensatz"
besteht aus folgenden Attributen:
➢ Kundennummer
➢ Vorname
➢ Nachname
➢ Straße
Fehlt eines oder mehrere Attribute, ist der
Datensatz nicht vollständig
Attribute müssen alle notwendigen Daten enthalten Ein Datensatz muss alle notwendigen Attribute enthalten
Vollständigkeit Attribut
▪ Das Attribut „Kundennummer identifiziert
einen Kunden und muss immer gefüllt sein
© OPITZ CONSULTING 2021 / Öffentlich
DATENQUALITÄT – KORREKTHEIT
Daten wirklich nutzen! 25
Die Daten müssen mit der Realität übereinstimmen.
Mapping gegen Daten, deren Korrektheit bestätigt ist oder eine definierte, abgestimmte Plausibilitätsregel
Beispiel
Das Geburtsdatum ist mit dem Wert 01.01.1900 belegt. Die Wahrscheinlichkeit das Kunden am 01.01.1900 geboren sind geht gegen
0.
Berechnung
100.000 Kundendatensätze liegen vor.
Davon sind im Attribut Geburtsdatum 5000 Einträge mit 01.01.1900.
95.000 Datensätze sind Korrekt. Ergibt 95% Korrektheit der Kundendatensätze.
© OPITZ CONSULTING 2021 / Öffentlich
DATENQUALITÄT – KONSISTENZ
Daten wirklich nutzen! 26
Ein Datensatz darf in sich und zu anderen Datensätzen keine Widersprüche aufweisen.
Mehrere Attribute (Kundennummer, Vorname, Nachname, Straße, Hausnummer, PLZ, Ort) definieren einen Kundendatensatz. Für
die korrekte Abwicklung von Geschäftsvorfällen müssen die Kundendatensätze 100% konsistent sein. Für die einzelnen Attribute
eines Kundendatensatzes wurden Datenqualitätskriterien (z.B. Vollständigkeit und Eindeutigkeit) definiert und gemessen.
Beispiel
Mehrere Attribute (Kundennummer, Vorname, Nachname, Straße, Hausnummer, PLZ, Ort) definieren einen Kundendatensatz. Für die
korrekte Abwicklung von Geschäftsvorfällen müssen die Kundendatensätze 100% konsistent sein. Für die einzelnen Attribute eines
Kundendatensatzes wurden Datenqualitätskriterien (z.B. Vollständigkeit und Eindeutigkeit) definiert und gemessen.
Berechnung
Bei 100.000 Datensätzen wurden 21.000 Datensätzen identifiziert, bei denen mind. 1 Attribut
von den Attributen, die einen Datensatz definieren, die Datenqualitätskriterien verletzt.
Die Konsistenz liegt bei 79%.
© OPITZ CONSULTING 2021 / Öffentlich
DATENQUALITÄT – GENAUIGKEIT
Daten wirklich nutzen! 27
Die Daten müssen in der geforderten Exaktheit vorliegen.
Beispiel
Ein Datum ist immer in dem Format (tt.mm.jjjj) anzugeben.
Es soll geprüft werden, wie häufig eine Regelverletzung vorliegt.
Berechnung
Bei 100.000 Datensätzen wurden 1.000 Datensätze mit Regelverletzung identifiziert.
Die Genauigkeit liegt bei 1%.
© OPITZ CONSULTING 2021 / Öffentlich
DATENQUALITÄT – REDUNDANZFREIHEIT
Daten wirklich nutzen! 28
Innerhalb der Datensätze dürfen keine Dubletten vorkommen.
Datenelement, das gegen sich selbst/sein Gegenstück in einem anderen Datensatz/einer Datenbank verglichen
wurde.
Beispiel
Aus verschiedenen Datenquellen wurden redundant vorgehaltene Kundendaten zusammengeführt. Bei Auswertungen wurde
festgestellt, dass die Vereinheitlichung nicht vollständig funktioniert hat. Jeder Kunde darf nur einmal vorkommen.
Berechnung
Die Dublettenprüfung ergibt, dass von 100.000 Kundennummern 8.000 doppelt vorliegen.
92.000 Datensätze sind redundanzfrei. Ergibt 92% Redundanzfreiheit.
© OPITZ CONSULTING 2021 / Öffentlich
DATENQUALITÄT – ERGEBNIS
Daten wirklich nutzen! 29
© OPITZ CONSULTING 2021 / Öffentlich
BEI FRAGEN KOMMT GERNE AUF UNS ZU!
Daten wirklich nutzen! 30
Halidun Yüksel
Manager Solutions
Halidun.Yueksel@opitz-consulting.com
Jürgen Fischer
Director Business & IT Innovation
Juergen.Fischer@opitz-consulting.com
Juergen_Fischer70
jürgen-fischer-70b621208
www.opitz-consulting.com

Weitere ähnliche Inhalte

Ähnlich wie OC|Webcast "Daten wirklich nutzen"

Bernd Fuhlert: Vortrag an der FOM Hochschule - Dezember 2011
Bernd Fuhlert: Vortrag an der FOM Hochschule - Dezember 2011Bernd Fuhlert: Vortrag an der FOM Hochschule - Dezember 2011
Bernd Fuhlert: Vortrag an der FOM Hochschule - Dezember 2011Bernd Fuhlert
 
Big Data_und auf was es wirklich ankommt. 1A Relations
Big Data_und auf was es wirklich ankommt. 1A RelationsBig Data_und auf was es wirklich ankommt. 1A Relations
Big Data_und auf was es wirklich ankommt. 1A RelationsGeorg Blum
 
Faire Datenökonomie für Wirtschaft, Wissenschaft und Gesellschaft: Was brauch...
Faire Datenökonomie für Wirtschaft, Wissenschaft und Gesellschaft: Was brauch...Faire Datenökonomie für Wirtschaft, Wissenschaft und Gesellschaft: Was brauch...
Faire Datenökonomie für Wirtschaft, Wissenschaft und Gesellschaft: Was brauch...Christoph Lange
 
Open Data & API Economy
Open Data & API EconomyOpen Data & API Economy
Open Data & API EconomyAndré Nitze
 
Open Government Data & offene Wirtschaftsdaten - Two of a Kind?
Open Government Data & offene Wirtschaftsdaten - Two of a Kind?Open Government Data & offene Wirtschaftsdaten - Two of a Kind?
Open Government Data & offene Wirtschaftsdaten - Two of a Kind?Johann Höchtl
 
Urban Data - Open Data - Data Excellence in der Stadt Wien
Urban Data - Open Data - Data Excellence in der Stadt WienUrban Data - Open Data - Data Excellence in der Stadt Wien
Urban Data - Open Data - Data Excellence in der Stadt WienStadt Wien
 
Grüne ag netzpolitik_20131012
Grüne ag netzpolitik_20131012Grüne ag netzpolitik_20131012
Grüne ag netzpolitik_20131012Andre Golliez
 
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)Martin Kaltenböck
 
GraphTalk Berlin - Deutschlands erstes Entscheidernetzwerk mit Neo4j
GraphTalk Berlin - Deutschlands erstes Entscheidernetzwerk mit Neo4jGraphTalk Berlin - Deutschlands erstes Entscheidernetzwerk mit Neo4j
GraphTalk Berlin - Deutschlands erstes Entscheidernetzwerk mit Neo4jNeo4j
 
Mag. Rainer Weinzettl (Hewlett Packard GmbH)
Mag. Rainer Weinzettl (Hewlett Packard GmbH)Mag. Rainer Weinzettl (Hewlett Packard GmbH)
Mag. Rainer Weinzettl (Hewlett Packard GmbH)Agenda Europe 2035
 
Google Analytics Konferenz 2015_Building a data strategy_Georg Koch_herold.at
Google Analytics Konferenz 2015_Building a data strategy_Georg Koch_herold.atGoogle Analytics Konferenz 2015_Building a data strategy_Georg Koch_herold.at
Google Analytics Konferenz 2015_Building a data strategy_Georg Koch_herold.ate-dialog GmbH
 
Mag. Lorenz Szabo (BDO Austria)
Mag. Lorenz Szabo (BDO Austria)Mag. Lorenz Szabo (BDO Austria)
Mag. Lorenz Szabo (BDO Austria)Agenda Europe 2035
 
Medien & Verlage im Zusammenspiel mit Open (Government) Data
Medien & Verlage im Zusammenspiel mit Open (Government) DataMedien & Verlage im Zusammenspiel mit Open (Government) Data
Medien & Verlage im Zusammenspiel mit Open (Government) DataMartin Kaltenböck
 
10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swc
10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swc10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swc
10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swcOGD-DACHLI Konferenzreihe
 
Open Government Data im Meldewesen
Open Government Data im MeldewesenOpen Government Data im Meldewesen
Open Government Data im MeldewesenBernhard Krabina
 
OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...
OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...
OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...Semantic Web Company
 
Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)
Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)
Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)Praxistage
 
Top 10 der Business Intelligence-Trends für das Jahr 2014
Top 10 der Business Intelligence-Trends für das Jahr 2014Top 10 der Business Intelligence-Trends für das Jahr 2014
Top 10 der Business Intelligence-Trends für das Jahr 2014Tableau Software
 

Ähnlich wie OC|Webcast "Daten wirklich nutzen" (20)

Bernd Fuhlert: Vortrag an der FOM Hochschule - Dezember 2011
Bernd Fuhlert: Vortrag an der FOM Hochschule - Dezember 2011Bernd Fuhlert: Vortrag an der FOM Hochschule - Dezember 2011
Bernd Fuhlert: Vortrag an der FOM Hochschule - Dezember 2011
 
Big Data_und auf was es wirklich ankommt. 1A Relations
Big Data_und auf was es wirklich ankommt. 1A RelationsBig Data_und auf was es wirklich ankommt. 1A Relations
Big Data_und auf was es wirklich ankommt. 1A Relations
 
Faire Datenökonomie für Wirtschaft, Wissenschaft und Gesellschaft: Was brauch...
Faire Datenökonomie für Wirtschaft, Wissenschaft und Gesellschaft: Was brauch...Faire Datenökonomie für Wirtschaft, Wissenschaft und Gesellschaft: Was brauch...
Faire Datenökonomie für Wirtschaft, Wissenschaft und Gesellschaft: Was brauch...
 
Open Data & API Economy
Open Data & API EconomyOpen Data & API Economy
Open Data & API Economy
 
Open Government Data & offene Wirtschaftsdaten - Two of a Kind?
Open Government Data & offene Wirtschaftsdaten - Two of a Kind?Open Government Data & offene Wirtschaftsdaten - Two of a Kind?
Open Government Data & offene Wirtschaftsdaten - Two of a Kind?
 
Urban Data - Open Data - Data Excellence in der Stadt Wien
Urban Data - Open Data - Data Excellence in der Stadt WienUrban Data - Open Data - Data Excellence in der Stadt Wien
Urban Data - Open Data - Data Excellence in der Stadt Wien
 
Grüne ag netzpolitik_20131012
Grüne ag netzpolitik_20131012Grüne ag netzpolitik_20131012
Grüne ag netzpolitik_20131012
 
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
 
GraphTalk Berlin - Deutschlands erstes Entscheidernetzwerk mit Neo4j
GraphTalk Berlin - Deutschlands erstes Entscheidernetzwerk mit Neo4jGraphTalk Berlin - Deutschlands erstes Entscheidernetzwerk mit Neo4j
GraphTalk Berlin - Deutschlands erstes Entscheidernetzwerk mit Neo4j
 
Mag. Rainer Weinzettl (Hewlett Packard GmbH)
Mag. Rainer Weinzettl (Hewlett Packard GmbH)Mag. Rainer Weinzettl (Hewlett Packard GmbH)
Mag. Rainer Weinzettl (Hewlett Packard GmbH)
 
Vienna od meet-up-20oct2016-tuwien
Vienna od meet-up-20oct2016-tuwienVienna od meet-up-20oct2016-tuwien
Vienna od meet-up-20oct2016-tuwien
 
Google Analytics Konferenz 2015_Building a data strategy_Georg Koch_herold.at
Google Analytics Konferenz 2015_Building a data strategy_Georg Koch_herold.atGoogle Analytics Konferenz 2015_Building a data strategy_Georg Koch_herold.at
Google Analytics Konferenz 2015_Building a data strategy_Georg Koch_herold.at
 
Mag. Lorenz Szabo (BDO Austria)
Mag. Lorenz Szabo (BDO Austria)Mag. Lorenz Szabo (BDO Austria)
Mag. Lorenz Szabo (BDO Austria)
 
Medien & Verlage im Zusammenspiel mit Open (Government) Data
Medien & Verlage im Zusammenspiel mit Open (Government) DataMedien & Verlage im Zusammenspiel mit Open (Government) Data
Medien & Verlage im Zusammenspiel mit Open (Government) Data
 
10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swc
10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swc10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swc
10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swc
 
Open Government Data im Meldewesen
Open Government Data im MeldewesenOpen Government Data im Meldewesen
Open Government Data im Meldewesen
 
OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...
OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...
OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...
 
Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)
Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)
Sabine Bühn, Bernd Aschauer (Aschauer IT & Business)
 
Berlin Open Data Day
Berlin Open Data DayBerlin Open Data Day
Berlin Open Data Day
 
Top 10 der Business Intelligence-Trends für das Jahr 2014
Top 10 der Business Intelligence-Trends für das Jahr 2014Top 10 der Business Intelligence-Trends für das Jahr 2014
Top 10 der Business Intelligence-Trends für das Jahr 2014
 

Mehr von OPITZ CONSULTING Deutschland

Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"OPITZ CONSULTING Deutschland
 
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der PraxisOC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der PraxisOPITZ CONSULTING Deutschland
 
OC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
OC|Webcast: Oracle Lizenzierung - Virtualisierung und CloudOC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
OC|Webcast: Oracle Lizenzierung - Virtualisierung und CloudOPITZ CONSULTING Deutschland
 
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!OPITZ CONSULTING Deutschland
 
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...OPITZ CONSULTING Deutschland
 
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...OPITZ CONSULTING Deutschland
 
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?OPITZ CONSULTING Deutschland
 
OC|Weekly Talk - Digitales Coaching & Smart Sparring
OC|Weekly Talk - Digitales Coaching & Smart Sparring OC|Weekly Talk - Digitales Coaching & Smart Sparring
OC|Weekly Talk - Digitales Coaching & Smart Sparring OPITZ CONSULTING Deutschland
 
Effiziente Betriebsoptimierung durch Cloud Nutzung
Effiziente Betriebsoptimierung durch Cloud NutzungEffiziente Betriebsoptimierung durch Cloud Nutzung
Effiziente Betriebsoptimierung durch Cloud NutzungOPITZ CONSULTING Deutschland
 
OC|Weekly Talk - Mitarbeiterführung in Zeiten von Social Distance
OC|Weekly Talk - Mitarbeiterführung in Zeiten von Social DistanceOC|Weekly Talk - Mitarbeiterführung in Zeiten von Social Distance
OC|Weekly Talk - Mitarbeiterführung in Zeiten von Social DistanceOPITZ CONSULTING Deutschland
 

Mehr von OPITZ CONSULTING Deutschland (20)

OC|Webcast: Grundlagen der Oracle Lizenzierung
OC|Webcast: Grundlagen der Oracle LizenzierungOC|Webcast: Grundlagen der Oracle Lizenzierung
OC|Webcast: Grundlagen der Oracle Lizenzierung
 
OC|Webcast "Java heute" vom 28.09.2021
OC|Webcast "Java heute" vom 28.09.2021OC|Webcast "Java heute" vom 28.09.2021
OC|Webcast "Java heute" vom 28.09.2021
 
OC|Webcast "Java heute" vom 24.08.2021
OC|Webcast "Java heute" vom 24.08.2021OC|Webcast "Java heute" vom 24.08.2021
OC|Webcast "Java heute" vom 24.08.2021
 
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
 
OC|Webcast "Willkommen in der Cloud!"
OC|Webcast "Willkommen in der Cloud!"OC|Webcast "Willkommen in der Cloud!"
OC|Webcast "Willkommen in der Cloud!"
 
OC|Webcast "Die neue Welt der Virtualisierung"
OC|Webcast "Die neue Welt der Virtualisierung"OC|Webcast "Die neue Welt der Virtualisierung"
OC|Webcast "Die neue Welt der Virtualisierung"
 
10 Thesen zur professionellen Softwareentwicklung
10 Thesen zur professionellen Softwareentwicklung10 Thesen zur professionellen Softwareentwicklung
10 Thesen zur professionellen Softwareentwicklung
 
OC|Webcast: Oracle Lizenzierung - Lizenznews 2021
OC|Webcast: Oracle Lizenzierung - Lizenznews 2021OC|Webcast: Oracle Lizenzierung - Lizenznews 2021
OC|Webcast: Oracle Lizenzierung - Lizenznews 2021
 
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der PraxisOC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
 
OC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
OC|Webcast: Oracle Lizenzierung - Virtualisierung und CloudOC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
OC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
 
OC|Webcast: Grundlagen der Oracle-Lizenzierung
OC|Webcast: Grundlagen der Oracle-LizenzierungOC|Webcast: Grundlagen der Oracle-Lizenzierung
OC|Webcast: Grundlagen der Oracle-Lizenzierung
 
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
 
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
 
OC|Weekly Talk The Power of DevOps…
OC|Weekly Talk  The Power of DevOps…OC|Weekly Talk  The Power of DevOps…
OC|Weekly Talk The Power of DevOps…
 
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
 
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
 
OC|Weekly Talk - Digitales Coaching & Smart Sparring
OC|Weekly Talk - Digitales Coaching & Smart Sparring OC|Weekly Talk - Digitales Coaching & Smart Sparring
OC|Weekly Talk - Digitales Coaching & Smart Sparring
 
OC|Weekly Talk - Beratung remote
OC|Weekly Talk - Beratung remoteOC|Weekly Talk - Beratung remote
OC|Weekly Talk - Beratung remote
 
Effiziente Betriebsoptimierung durch Cloud Nutzung
Effiziente Betriebsoptimierung durch Cloud NutzungEffiziente Betriebsoptimierung durch Cloud Nutzung
Effiziente Betriebsoptimierung durch Cloud Nutzung
 
OC|Weekly Talk - Mitarbeiterführung in Zeiten von Social Distance
OC|Weekly Talk - Mitarbeiterführung in Zeiten von Social DistanceOC|Weekly Talk - Mitarbeiterführung in Zeiten von Social Distance
OC|Weekly Talk - Mitarbeiterführung in Zeiten von Social Distance
 

OC|Webcast "Daten wirklich nutzen"

  • 1. © OPITZ CONSULTING 2021 / Öffentlich Daten wirklich nutzen! 1 Was Ihre Daten in der Digitalisierung können müssen Online, 1. Juli 2021 Halidun Yüksel, Jürgen Fischer DATEN WIRKLICH NUTZEN
  • 2. © OPITZ CONSULTING 2021 / Öffentlich BITTE BEACHTEN SIE… Wir werden Ihnen die Aufzeichnung dieses Webinars sowie die Vortragsfolien in den nächsten Tagen zusenden. Alle Teilnehmer sind stummgeschaltet. Nur so können wir ein störungsfreies Webinar bei großer Personenzahl gewährleisten. Bitte melden Sie sich bei technischen Störungen während des Webinars über die Frage-Funktion an die Organisatoren. Ihre inhaltlichen Fragen stellen Sie bitte auch über die Frage-Funktion. Wir beantworten diese gerne zum Ende des Webinars. Daten wirklich nutzen! Seite 2
  • 3. © OPITZ CONSULTING 2021 / Öffentlich Daten wirklich nutzen! 3
  • 4. © OPITZ CONSULTING 2021 / Öffentlich Daten wirklich nutzen! 4 WOZU NUTZEN WIR EIGENTLICH DATEN?
  • 5. © OPITZ CONSULTING 2021 / Öffentlich DATEN FÜHREN ZU ENTSCHEIDUNGEN UND HANDLUNGEN Daten wirklich nutzen! 5 Lorem ipsum Aus der Bedeutung leiten sich dann explizite Entscheidungen und Handlungen ab. Dem generierten Wissen wird eine Bedeutung zugewiesen. Welche Konsequenz ziehen verschiedene Alternativen nach sich? Informationen werden zu Wissen, sie werden verstanden und in Beziehung zueinander gebracht Aus isolierten Daten werden Informationen, die beschreibenden Charakter haben Entscheidung und Handlung Bedeutung Wissen Daten und Informationen In Anlehnung an das m³ Manifest Meaning Model von Barry Devlin
  • 6. © OPITZ CONSULTING 2021 / Öffentlich Daten wirklich nutzen! 6
  • 7. © OPITZ CONSULTING 2021 / Öffentlich COVID-19 – AUF WELCHER BASIS WERDEN ENTSCHEIDUNGEN GETROFFEN? Daten wirklich nutzen! 7 https://www.aerztezeitung.de/Politik/Gesundheitsweiser-Gerlach-kritisiert-schlechte-Daten-und-Entscheidungen-im-Blindflug-408227.html
  • 8. © OPITZ CONSULTING 2021 / Öffentlich Daten wirklich nutzen! 8 GUTE DATEN SIND DIE BASIS FÜR ANALYTICS
  • 9. © OPITZ CONSULTING 2021 / Öffentlich Daten wirklich nutzen! 9  "Analytics is an umbrella term that describes the people, processes, and technologies used to turn data into insights into action. In this sense, analytics encompasses data warehousing, business intelligence (BI), performance management, and data mining" THE NEW KID IN TOWN: ANALYTICS „Secrets of Analytical Leaders“, ISBN 978-1935504344 Wayne Eckerson
  • 10. © OPITZ CONSULTING 2021 / Öffentlich BEING DATA-DRIVEN? Data Management  Was?  Mehr Daten, neue Quellen, andere Daten, auf den Anwendungsfall optimiert Data Analytics  Wie?  Reporting (Standard, Ad-hoc), Vorhersagen, Machine Learning, Cognitive, Autonomous Data Democratization  Wer?  Mehr Nutzer, breitere Nutzen, besseres Verständnis von Daten, Analyse und Nutzen Daten wirklich nutzen! 10
  • 11. © OPITZ CONSULTING 2021 / Öffentlich ANALYTISCHE BANDBREITE Daten wirklich nutzen! 11 Daten Aktion Feedback Descriptive What happened? Entscheidung Diagnostic Why did it happen? Predictive What will happen? Prescriptive What should I do? Decision support Decision automation Analyse Menschlicher Einfluß Analytics AI, Machine Learning - Einfache Berechnungen - Reporting/Dashboards - Gängige BI Plattformen - Data Science - Neuronale Netze
  • 12. © OPITZ CONSULTING 2021 / Öffentlich Daten wirklich nutzen! 12 „IF YOU CANT‘T BUILD A DATA WAREHOUSE, YOU SHOULDN‘T DO AI." (Andrew Ng, Stanford University)
  • 13. © OPITZ CONSULTING 2021 / Öffentlich MDM/DQM – DER FC BAYERN UNTER DEN ANALYTICS TRENDS Daten wirklich nutzen! 13
  • 14. © OPITZ CONSULTING 2021 / Öffentlich KLEINER FEHLER – GROßE WIRKUNG DER LOGIKBAUM Daten wirklich nutzen! 14 Umsatzverlust Imageverlust Kosten- steigerung Anzahl Kunden unscharf bzw. unbekannt Aufwand pro Kunde unscharf Umsatz pro Kunde unscharf Tatsächlicher Kundenzuwachs oder –abgang schwer zu ermitteln Kundenwertanalysen werden unscharf Kundenbetreuung wird falsch priorisiert Fehlerhafte Kunden- / Vertragsbereinigungsmaßnahmen Verlust wichtiger Kunden Kunde erhält dieselben Angebote mehrfach Erhöhte Werbekosten Kunde kann Angebot nur einmal nutzen Kunde wird verärgert Kundenkreditlimits greifen nicht (Kunden können über mehrere Kundennummern höhere Limits ausnutzen) Erhöhter Aufwand und Kosten bei Bonitätsprüfungen Erhöhtes Forderungsausfall- risiko Auswirkung Dubletten in Kundenstammdaten
  • 15. © OPITZ CONSULTING 2021 / Öffentlich NOTWENDIGKEIT EINER HOHEN DATENQUALITÄT SICHTBARE UND VERMEINTLICH UNSICHTBARE AUSWIRKUNGEN NIEDRIGER DATENQUALITÄT Daten wirklich nutzen! 15 ➢ Geldstrafen ➢ Wiederholte Dateneingabe ➢ Verlorene Aufträge ➢ Korrektur der Daten ➢ Systemkosten- Erhöhung ➢ Entgangene Neukunden ➢ Zeitverlust ➢ Imageschäden ➢ Kunden- abwanderung ➢ Zinskosten ➢ Lange Suchdauer ➢ Falsche Entscheidungen ➢ Mitarbeiter- unzufriedenheit ➢ Rückläufer
  • 16. © OPITZ CONSULTING 2021 / Öffentlich SYMPTOME SCHLECHTER DATEN* SCHLECHTE DATEN VERURSACHEN KOSTEN Daten wirklich nutzen! 16 78% veraltete Daten 68% doppelte/mehrfach vorhandene Daten 20% hohe Rückläuferquote 37% postalisch falsche Daten 85% unvollständige Daten *Laut Uniserv Studie: https://www.uniserv.com/unternehmen/blog/detail/article/ergebnisse-der-trendstudie-kundendatenmanagement-2018
  • 17. © OPITZ CONSULTING 2021 / Öffentlich DATENQUALITÄTS-VERBESSERUNGSPROZESS FACHLICHE UND TECHNISCHE MAßNAHMEN SIND ERFORDERLICH Daten wirklich nutzen! 17 Ist-Analyse der Datenqualität • Technischer Prozess 1. Datenqualitätsprozess im Unternehmen etablieren • Fachlicher und strategischer Prozess 4. Datenbereinigung • Technischer Prozess 3. Regeln und Überwachung für Daten festlegen • Fachlicher Prozess 2. Nachhaltiges Datenmanagement Unregelmäßige Überprüfung der Qualität
  • 18. © OPITZ CONSULTING 2021 / Öffentlich IST-ANALYSE DER DATENQUALITÄT METRIKEN* Daten wirklich nutzen! 18 Ein Datensatz darf in sich und zu anderen Datensätzen keine Widersprüche aufweisen Jeder Datensatz muss eindeutig interpretierbar sein Ein Datensatz muss alle notwendigen Attribute enthalten Die Daten müssen mit der Realität übereinstimmen Alle Datensätze müssen jeweils dem aktuellen Zustand der abgebildeten Realität entsprechen Innerhalb der Datensätze dürfen keine Dubletten vorkommen Die Informationen eines Datensatzes müssen einheitlich strukturiert sein Datenqualität Konsistenz Gültigkeit Vollständigkeit Korrektheit Genauigkeit Redundanz- freiheit Einheitlichkeit *in Anlehnung an DGIQ – IQ Definition 2007
  • 19. © OPITZ CONSULTING 2021 / Öffentlich DATENQUALITÄT ALS CHANGE PROZESS Daten wirklich nutzen! 19 Regeln zum Umgang mit fehlerhaften Daten definieren Mitarbeiter befähigen Prozesse zur Datenerfassung festlegen Data Regeln & Prozesse Verantwortlichkeiten klären
  • 20. © OPITZ CONSULTING 2021 / Öffentlich DATENBEREINIGUNG Daten wirklich nutzen! 20 Manuelle Datenbereinigung • Überprüfung von Aktualität der Daten • Überprüfung bei ähnlichen Daten die nicht automatisiert bereinigt sind • Erstellen neuer Regeln, anhand von Erkenntnissen während der Datenbereinigung Technische, automatisierte Datenbereinigung • Dubletten erkennen und eliminieren • Regelbasiertes Cleansing z.B. Schreibweisen von Ortsnamen, Alter des Datensatzes • Erstellen von Ähnlichkeitsclustern • Übernahme der Daten aus einem zentralen System (Data Warehouse) • Berichte an die Data Stewards über automatisierte Datenbereinigungen
  • 21. © OPITZ CONSULTING 2021 / Öffentlich MACHEN SIE MIT UNS DEN DATA QUALITY QUICK CHECK Daten wirklich nutzen! 21  Wir überprüfen ausgewählte Entitäten und zugehörige Tabellen anhand von 7 Kriterien für eine gute Datenqualität.  Wir machen die Datenqualität transparent. Wo sind Sie gut aufgestellt, wo gibt es Potenziale?  Was bedeuten die Ergebnisse für Ihre nächsten Projekte? Sie erhalten eine genaue Übersicht, eine persönliche Bewertung und Vorschläge für mögliche Maßnahmen.  Fact Sheet: Data Quality Quick Check
  • 22. © OPITZ CONSULTING 2021 / Öffentlich DATENQUALITÄT – EINHEITLICHKEIT Daten wirklich nutzen! 22 Die Informationen eines Datensatzes müssen einheitlich strukturiert sein. Das heißt, eine Menge von Daten wird fortlaufend einheitlich präsentiert. Beispiel Kundenadressen sind entsprechend der festgelegten Regeln zu erfassen Es wird z.B. festgestellt, dass Ortsnamen in verschiedenen Schreibweisen erfasst wurden.(z.B. Köln, Koeln, KÖLN, KOELN) Berechnung Von 100.000 Ortsnamen weichen 25.000 Ortsnamen von der vereinbarten Schreibregel ab 75.000 Datensätze sind einheitlich. Ergibt 75% Einheitlichkeit
  • 23. © OPITZ CONSULTING 2021 / Öffentlich DATENQUALITÄT – GÜLTIGKEIT Daten wirklich nutzen! 23 Jeder Datensatz muss eindeutig interpretierbar sein. Datenelement, das gegen sich selbst/sein Gegenstück in einem anderen Datensatz/einer Datenbank gemessen wurde Beispiel Zwei Datensätze (z.B. Kundenadressdatensatz) mit unterschiedlicher ID (Kundennummer) unterscheiden sich in allen weiteren Attributen z.B. nur in einem weiteren Merkmal (Geburtsdatum) ID1 -> Gebdat = 21.05.1991 ; ID2 -> Gebdat = 23.06.1991 Alle weiteren Attribute wie z.B. Name, Vorname, Straße, Hausnummer, PLZ, Ort, sind identisch. Es besteht berechtigter Zweifel, ob es sich hier tatsächlich um zwei unterschiedliche Kunden handelt. Zusätzlich entsteht der Zweifel, ob eines oder sogar keines der Geburtsdaten richtig ist. Somit sind beide Datensätze nicht mehr eindeutig interpretierbar. Berechnung Von 100.000 Kundendatensätzen sind 10.000 bis auf wenige Merkmale identisch, ähnlich und nicht eindeutig. 95.000 Datensätze sind eindeutig. Ergibt 90% Eindeutigkeit
  • 24. © OPITZ CONSULTING 2021 / Öffentlich DATENQUALITÄT – VOLLSTÄNDIGKEIT Daten wirklich nutzen! 24 Berechnung 100.000 Kundendatensätze liegen vor. Davon sind 2000 Attributeinträge leer. 98.000 Datensätze sind Vollständig. Das ergibt 98% Vollständigkeit der Kundendatensätze. Vollständigkeit Datensatz ▪ Ein vollständiger "Kundenadressdatensatz" besteht aus folgenden Attributen: ➢ Kundennummer ➢ Vorname ➢ Nachname ➢ Straße Fehlt eines oder mehrere Attribute, ist der Datensatz nicht vollständig Attribute müssen alle notwendigen Daten enthalten Ein Datensatz muss alle notwendigen Attribute enthalten Vollständigkeit Attribut ▪ Das Attribut „Kundennummer identifiziert einen Kunden und muss immer gefüllt sein
  • 25. © OPITZ CONSULTING 2021 / Öffentlich DATENQUALITÄT – KORREKTHEIT Daten wirklich nutzen! 25 Die Daten müssen mit der Realität übereinstimmen. Mapping gegen Daten, deren Korrektheit bestätigt ist oder eine definierte, abgestimmte Plausibilitätsregel Beispiel Das Geburtsdatum ist mit dem Wert 01.01.1900 belegt. Die Wahrscheinlichkeit das Kunden am 01.01.1900 geboren sind geht gegen 0. Berechnung 100.000 Kundendatensätze liegen vor. Davon sind im Attribut Geburtsdatum 5000 Einträge mit 01.01.1900. 95.000 Datensätze sind Korrekt. Ergibt 95% Korrektheit der Kundendatensätze.
  • 26. © OPITZ CONSULTING 2021 / Öffentlich DATENQUALITÄT – KONSISTENZ Daten wirklich nutzen! 26 Ein Datensatz darf in sich und zu anderen Datensätzen keine Widersprüche aufweisen. Mehrere Attribute (Kundennummer, Vorname, Nachname, Straße, Hausnummer, PLZ, Ort) definieren einen Kundendatensatz. Für die korrekte Abwicklung von Geschäftsvorfällen müssen die Kundendatensätze 100% konsistent sein. Für die einzelnen Attribute eines Kundendatensatzes wurden Datenqualitätskriterien (z.B. Vollständigkeit und Eindeutigkeit) definiert und gemessen. Beispiel Mehrere Attribute (Kundennummer, Vorname, Nachname, Straße, Hausnummer, PLZ, Ort) definieren einen Kundendatensatz. Für die korrekte Abwicklung von Geschäftsvorfällen müssen die Kundendatensätze 100% konsistent sein. Für die einzelnen Attribute eines Kundendatensatzes wurden Datenqualitätskriterien (z.B. Vollständigkeit und Eindeutigkeit) definiert und gemessen. Berechnung Bei 100.000 Datensätzen wurden 21.000 Datensätzen identifiziert, bei denen mind. 1 Attribut von den Attributen, die einen Datensatz definieren, die Datenqualitätskriterien verletzt. Die Konsistenz liegt bei 79%.
  • 27. © OPITZ CONSULTING 2021 / Öffentlich DATENQUALITÄT – GENAUIGKEIT Daten wirklich nutzen! 27 Die Daten müssen in der geforderten Exaktheit vorliegen. Beispiel Ein Datum ist immer in dem Format (tt.mm.jjjj) anzugeben. Es soll geprüft werden, wie häufig eine Regelverletzung vorliegt. Berechnung Bei 100.000 Datensätzen wurden 1.000 Datensätze mit Regelverletzung identifiziert. Die Genauigkeit liegt bei 1%.
  • 28. © OPITZ CONSULTING 2021 / Öffentlich DATENQUALITÄT – REDUNDANZFREIHEIT Daten wirklich nutzen! 28 Innerhalb der Datensätze dürfen keine Dubletten vorkommen. Datenelement, das gegen sich selbst/sein Gegenstück in einem anderen Datensatz/einer Datenbank verglichen wurde. Beispiel Aus verschiedenen Datenquellen wurden redundant vorgehaltene Kundendaten zusammengeführt. Bei Auswertungen wurde festgestellt, dass die Vereinheitlichung nicht vollständig funktioniert hat. Jeder Kunde darf nur einmal vorkommen. Berechnung Die Dublettenprüfung ergibt, dass von 100.000 Kundennummern 8.000 doppelt vorliegen. 92.000 Datensätze sind redundanzfrei. Ergibt 92% Redundanzfreiheit.
  • 29. © OPITZ CONSULTING 2021 / Öffentlich DATENQUALITÄT – ERGEBNIS Daten wirklich nutzen! 29
  • 30. © OPITZ CONSULTING 2021 / Öffentlich BEI FRAGEN KOMMT GERNE AUF UNS ZU! Daten wirklich nutzen! 30 Halidun Yüksel Manager Solutions Halidun.Yueksel@opitz-consulting.com Jürgen Fischer Director Business & IT Innovation Juergen.Fischer@opitz-consulting.com Juergen_Fischer70 jürgen-fischer-70b621208 www.opitz-consulting.com