SlideShare ist ein Scribd-Unternehmen logo
Datenqualität in DWH-Projekten bei Versicherungen
20. September 2007



                                                               Matthias Nadler-Schulz
                                                           Dr. Leonhardt Wohlschlager




                     Business Consulting Düsseldorf 2007            © LogicaCMG 2007 All rights reserved
Agenda


  • Zielsetzung


  • Data Profiling


  • Data-Quality-Tools


  • Masterdatenmanagement


  • Konsolidiertes Unternehmensdatenmodell



                         Business Consulting Düsseldorf 2007   2
Vorstellung



• Matthias Nadler-Schulz


   – 33 Jahre
   – seit 1997 berufstätig (IT/FM)
   – seit 2002 BI/DWH-Consultant
   – 2002-2005: DATA MART Consulting
   – seit 2006: LogicaCMG
   – Team Manager BI Financial Services
   – Schwerpunkt im Bereich der Datenbewirtschaftung und COGNOS
   – Account Manager für die BARMER
   – Weitere Kunden sind die Gothaer, AMB, Apobank, CoBa, DreBa




                                Business Consulting Düsseldorf 2007   3
Vorstellung



• Dr. Leonhardt Wohlschlager, Dipl.Kfm., PMP
   – Studium in Köln, Paris und Rotterdam
   – 1994 – 1995 IBM, Köln, Datenmodellierung
   – 1996 – 1997 Société Maria Galland, Information
                 Management, Paris
                 DigiVision, Köln, Electronic Business
   – 1998 – 2000 IBM, Hamburg, Electronic Business
   – 2001 – 2005 Universität zu Köln, Informationsmanagement,
                 Freiberufliche Tätigkeit
   – seit 2006    LogicaCMG, Düsseldorf
   – Schwerpunkt in den Bereichen des Information Management, IT Management und
     CRM mit international Ausrichtung (CEMS MIM)
   – Project Management Professional (PMP)
   – Veröffentlichungen zum Thema Informationsmanagement in der
     Versicherungswirtschaft
   – Kunden sind die Barmer, IDG, Gothaer, Vodafone und Unternehmensberatungen.


                              Business Consulting Düsseldorf 2007                 4
Zielsetzung



• Begriffsbestimmung der Datenqualität


• Datenqualität als Notwendigkeit im DWH-Projekt


• Relevanz der Masterdaten und der fachlichen Erhebung


• Einsatzpotential von Data Profiling und Quality




                             Business Consulting Düsseldorf 2007   5
Problemstellung

Schwerwiegende Datenfehler in einem Vertriebsinformationssystem
führen zu Akzeptanzverlusten bei den Endanwendern

• Das VIS ist das zentrale Steuerungsinstrument im Vertrieb und ist Quelle für die
  Provisionssysteme.

• Nutzer sind sowohl der konzerneigene Vertrieb als auch externe
  Vermittlungspartner (Finanzdienstleister, Banken, freie Vermittler).

• Die Verarbeitung scheint fehlerfrei zu arbeiten, Testläufe zeigen keine
  Abweichungen. Das System arbeitete einen längeren Zeitraum
  erwartungsgemäß.

• Quellsysteme sind zum Teil nicht einsehbar. Abgleiche gegen die Bestands-
  systeme zeigen bei einigen Vermittlern erhebliche Abweichungen.

         Nutzungsmöglichkeiten durch unklare Datenqualität
         eingeschränkt
                               Business Consulting Düsseldorf 2007                   6
Wie können wir diese Probleme verhindern? Unsere Thesen…


• These 1:
  Data Profiling erleichtert eine frühzeitige Identifizierung von möglichen
  Datenproblemen.

• These 2:
  Data Quality im ETL-Prozess gibt den Fachbereichen die Möglichkeit, Business
  Rules einzusetzen.

• These 3:
  Stamm- und Strukturdaten müssen zeitlich abgegrenzt und fortlaufend gepflegt
  werden.

• These 4:
  Grundlage des physischen Modells muss ein abgestimmtes konzeptionelles
  Datenmodell sein.



                                Business Consulting Düsseldorf 2007              7
Definition der Datenqualität

Datenqualität                                                       Relevant,
                                                                     korrekt,
                                                                    konform,
• bezeichnet die Relevanz und Korrektheit                          zuverlässig
  von Informationen                                                     ?

• beschreibt, wie gut eine Information bzw. ein Datensatz ist, um die Realität zu
  beschreiben, d.h. inwieweit sie ein Modell tatsächlicher Situationen bildet.


• besagt, wie verläßlich eine Information ist und inwieweit man sie als
  Grundlage für eine Planung des eigenen Handelns verwenden kann.


• ist nicht gleichbedeutend mit der Relevanz (der Semantik) oder mit dem
  formalen Informationsgehalt (der statistischen Signifikanz).



                             Business Consulting Düsseldorf 2007                    8
Typische Kriterien für Datenqualität



• Richtigkeit


• Konsistenz


• Vollständigkeit


• Aktualität


• Aufgabenbezogenheit


• Zusammenhangbezogenheit

                    Quelle: Vgl. zu den Zielen des Datenmanagements: Jörg Biethahn; Norbert Rohrig /Datenmanagement 1990/ 740 f.


                                      Business Consulting Düsseldorf 2007                                                     9
Die Messbarkeit von Datenqualität Beschreibung

• Wie lässt sich die Datenqualität im Data Warehousing messen?



   – Wie erreichen wir eine Akzeptanz der Messung?


   – Wie sollen wir die Messkriterien gewichten?


   – Wie wollen wir den Messvorgang operationalisieren?


   – Wie sollen wir die Interpretationsspielräume reduzieren?




                            Business Consulting Düsseldorf 2007   10
Messen der Datenqualität im Data Warehousing (Beispiel)

  Qualitätsattribute
   1. Realtime verfügbar
   2. aktuell
   3. genau                         Bewertungsbogen
                                     Bewertungsbogen
   4. exakt
   5. objektiv
                           Wie wichtig ist für Sie, 1     2    3   4    5
   6. interpretierbar      daß Daten folgende
   7. relevant             Eigenschaften haben                                     Attributgruppen
                                                                                    Attributgruppen
   8. Einfache Pflege      (1 = unwichtig / 5 = sehr
   9. transparent          wichtig)?                                             Attribut Definition     Gruppe
   …
                           verfügbar                      x
                                                                                                         Genauigkeit
                           aktuell                             x
                           differenziert                                x        1. Glaubwürdigkeit
                           genau                     x                           2. Objektivität
                           …                                                                             Verfügbarkeit
1. Definition einer                                                              1. für alle NLs
                                                                                 2. DRM
   Attributliste zur                                                                                     Konsistenz
                                                                                 1. Spartenneutralität
   Beschreibung der        2. Gewichtung und Gruppierung                         …
   Datenqualität              der Listeneinträge durch
                              Nutzer pro Fachbereich
                                                       3. Bildung von Attributgruppen
                                                          durch IT-Experten
                                                          und Key User
                                           Business Consulting Düsseldorf 2007                                         11
Ein zusätzliches Kriterium: Transparenz über die Daten



                                                                                    Tarif-, Vertrags-, Leistungs-
                Transparenz                                                         und Partner-Informationen
                                                                                                                               Aktivität
                                                                                                                                                                                    Geschäfts-   Aktivität
                                                                                                                                                                                                                                                      Geschäfts-
                                                                                                                                                                                                                                                        regel
                                                                                                                                                                                      regel
                                                                                                                                                                                                                 Partner
                                                                                                                                                                                                                                    Spezifikation




                   durch
                                                                                                                                               Partner
                                                                                                                                                                  Spezifikation                  Kontakt-
                                                                                                                                                                                                  punkt                          Vertrag
                                                                                                                                                                                                   und       Objekt
                                                                                                                                                                                                   Ort

                                                                                                                                                                                                                                                      Finanz-
                                                                                                                                                                                                                                                      anlagen
                                                                                                                                                                                                                           Leistungs-
                                                                                                                                                                                                                           erstellung


                                                                                                                                                                                                               Ereignis
                                                                                                                                                                                                                                                      Finanz-
                                                                                                                                                                                                                                                    Transaktion

                                                                                                                               Kontakt-
                                                           Aktivität
                                                                                                                Geschäfts-      punkt                          Vertrag
                                                                                                                  regel
                                                                                                                                 und       Objekt
                                                                           Partner
                                                                                              Spezifikation
                                                                                                                                 Ort

                                                                                                                                                                                    Finanz-
                                                           Kontakt-
                                                            punkt                          Vertrag                                                                                  anlagen
                                                             und
                                                             Ort
                                                                       Objekt
                                                                                                                                                         Leistungs-




    Reporting und Überwachung
                                                                                                                Finanz-
                                                                                                                                                         erstellung
                                                                                                                anlagen
                                                                                     Leistungs-
                                                                                     erstellung


                                                                         Ereignis
                                                                                                                Finanz-
                                                                                                                                             Ereignis
                                                                                                              Transaktion
                                                                                                                                                                                    Finanz-
                                                                                                                                                                                  Transaktion




                                                                                                                             Pro Datenquelle und -typ:
                                                                                                                             Key Attributes
    Automation                                                                                                               -vollständig?
                                                                                                                             -redundant?
                                                                                                                             -zeitgerecht?
                                                                                                                             -…
Datenabgleich
                           Datenbereinigung
                            Business Consulting Düsseldorf 2007                                                                                                                                                                                                    12
Begriffsdefinition Data Profiling


Unter Data Profiling
                                                                     Data Profiling
wird ein Prozess verstanden,


bei dem Daten in einer Datenquelle


mit statistischen Werkzeugen und Methoden
                                                                        Source

analysiert werden,
                                                                      Data Quality

um die Datenqualität zu ermitteln.



                               Business Consulting Düsseldorf 2007                    13
Data Profiling


• liefert Angaben über die Aufgabenbezogenheit der Daten



• liefert Maße für Datenqualität



• verfolgt die Datenqualität



• prüft, ob die Datenwerte die Metadaten definieren und vice versa



• liefert eine unternehmensweite Sicht, z.B. für Masterdatenmanagement
                               Business Consulting Düsseldorf 2007       14
Problem Profiling Beschreibung

              Quellsysteme sind zum Teil nicht
              einsehbar.

These 1:

Data Profiling erleichtert eine frühzeitige Identifizierung von möglichen
Datenproblemen.


Beispiel:

Die Schnittstelle eines Kooperationspartners soll die Antragsbestandssätze
und alle nachfolgenden Antragsbewegungssätze liefern.

Tatsächlich werden jedoch nur Antragsbestandssätze geliefert.




                              Business Consulting Düsseldorf 2007            15
Lösung Profiling
                                                         Be
                                                           i sp
                                                               iel




                   Business Consulting Düsseldorf 2007           16
Problem Profiling Beschreibung

             Die Verarbeitung scheint fehlerfrei zu arbeiten,
             Testläufe zeigen keine Abweichungen.

These 2:

Data Quality im ETL-Prozess gibt den Fachbereichen die Möglichkeit,
Business Rules einzusetzen.


Beispiel:

Regeln in den Köpfen der Mitarbeitern sind nicht in den Systemen hinterlegt
und nicht dokumentiert.




                            Business Consulting Düsseldorf 2007               17
Lösung Data Quality
                                                            Be
                                                              i sp
                                                                  iel




                      Business Consulting Düsseldorf 2007           18
Tool-unterstützte Metriken und Datenqualitätsverbesserungen
                                                             Be
                                                               i sp
                                                                   iel




                       Business Consulting Düsseldorf 2007           19
Begriffsdefinition des Masterdatenmanagements



• Verwaltung und Organisation derjenigen Referenz- oder Masterdaten,
  die von IT-Anwendungssystemen und Abteilungen geteilt werden.


• Konsistente Informationsverarbeitung in heterogenen
  Systemarchitekturen hierdurch erreichbar


• besonders geeignet für große Unternehmen mit vielen
  Geschäftsfunktionen




         Quelle: Vgl. wikipedia (Hrsg.) /Master Data Management 2007/ http://en.wikipedia.org/wiki/Master_Data_Management


                                      Business Consulting Düsseldorf 2007                                             20
Problem Profiling Beschreibung

            Abgleiche gegen die Bestandssysteme zeigen
            bei einigen Vermittlern erhebliche Abweichungen.

These 3:

Stamm- und Strukturdaten müssen zeitlich abgegrenzt und fortlaufend gepflegt
werden.


Beispiel:

Die Versicherung als Organisation wandelt sich ständig. Daher müssen die
Stamm- und Strukturdaten im ETL-Prozess an die organisatorischen
Veränderungen angepasst werden kann.




                            Business Consulting Düsseldorf 2007                21
Lösung MasterDaten
                                                           Be
                                                             i sp
                                                                 iel




                     Business Consulting Düsseldorf 2007           22
Lösung MasterDaten
                                                           Be
                                                             i sp
                                                                 iel




                     Business Consulting Düsseldorf 2007           23
Probleme ohne konzeptionelles Datenmodell

            Unterschiedliche Begriffsdefinitionen führen zu
            inkonsistenten Berichten.

These 4:

Grundlage des physischen Modells muss ein abgestimmtes konzeptionelles
Datenmodell sein.


Beispiel:

In der Lebensversicherung gibt es eine Produktsicht, in der Schaden- und
Unfallversicherung eine Tarifsicht.




                            Business Consulting Düsseldorf 2007            24
Einzelprobleme bei der Herstellung einer konzeptionellen Sicht

• Die Fachabteilungen investieren nicht genügend Zeit in der Vermittlung ihrer
  Sicht, ihrer Anforderungen oder in die Klarstellung der Sachverhalte.


• Bestimmte Informationsobjekte werden zu stark in den Vordergrund gestellt.


• Die Fachabteilungen sind nicht bereit, ihre Sichten gegenseitig abzustimmen
  bzw. andere Sicht anzunehmen.


• Die Beziehungen zwischen den hauptsächlichen Informationsobjekten werden
  nicht erhoben.


• Einzelne Fachabteilungen erkennen ihre Berichte bzw. (bei der Erstellung) die
  Inhalte des physischen Datenmodells nicht wieder.



                             Business Consulting Düsseldorf 2007                  25
Konsolidierung: Unternehmensweit einheitliche Partnersicht
                                                                       Be
                                                                         i sp
                                                                             iel



                    Verträge         Kunden-                 Schäden
                                   stammdaten

    Einheitliche
Kundengesamtsicht        Storno-                    Kunden-
  im Vertrieb und         risiko                     wert
      Service


                    Kontakte Kundendaten Inkasso




                       Business Consulting Düsseldorf 2007                     26
Berichtsorientiertes Vorgehen



1. Begriff eines Berichts erheben


2. Begriff mit den schon erhobenen Begriffen abgleichen


3. Abstimmung in Workshops mit den Fachabteilungen


4. Konzeptionelle Modellierung


5. Transformation in ein physisches Datenmodell


6. (Top down / Bottom up – Herangehensweise)


                            Business Consulting Düsseldorf 2007   27
Vorgehen bei Analyse und Design des Core DWH (Übersicht)


                                                                                                                                      Merkmale
                                                                                                                                      Attribute
                                                                                                                       Templates      Kennzahlen
                                                                                                                                      Definitionen




                                                                                                               Workshop-              Berichts-
    Glossar
                                                                                                                Listen             anforderungen



              Aktivität
                                                                    Geschäfts-
                                                                      regel




    Daten-                                                                                                 Verwendungs-               Begriffs
                              Partner
                                                  Spezifikation




                                                                                                              matrix               verwendungen
              Kontakt-
               punkt                           Vertrag




    modell
                und       Objekt
                Ort

                                                                    Finanz-
                                                                    anlagen
                                         Leistungs-
                                         erstellung


                            Ereignis
                                                                    Finanz-
                                                                  Transaktion




                                        Schnittstelle zur physischen Modellierung

                                                                                 Business Consulting Düsseldorf 2007                                 28
Template – Merkmale und Definitionen

                    Eingabefelder                                                                                       Vertrags-
                                                                                                                        definition
Merkmal             Definition                                                                                       Anmerkung

                    Vertrag zwischen einem Versicherungsunternehmen und Versicherungsnehmer über die
Vertrag             Gewährung von Versicherungsschutz gegen Beitragszahlung.

                    Ein gemeldetes Ereignis, durch das sich die Vermögenslage des Geschädigten mit und nach
                    dem schädigendem Ereignis gegenüber der vorherigen Lage verschlechtert hat. Daraus kann
Schaden             ein Anspruch auf Entschädigung aus einem Versicherungsvertrag entstehen.
Kunde               Kunde ist ein Partner mit der Rolle VN zum Vertrag                                               Es werden derzeit in anderen
                    Vertriebsweg sind die Vertriebskanäle. Z.B. Ausschließlichkeitsorganisation, Makler,
Vertriebsweg        Kooperationspartner, Direkt(Impuls), Banken und Sonstige
Sparte              Zusammenfassung gleichartiger Risiken/Wagnisse mit zugrundeliegendem Bedingungswerk
                                                                                                                     Stellt die unterste Stufe des
                                                                                                                     Vertriebs dar. Die Rechtsform
                                                                                                                     kann hierbei sowohl Makler
                                                                                                                     HGB §93 als auch HGB §84
Agentur             dezentrale Vertriebseinheit                                                                      sein.
Außendienstbezirk   Unterteilung der Vertriebsstätte zur Zuordnung des Betreuers (z.B. Verkaufsleiter, Orgaleiter,
                    Die Organisationsdirektion (OD) stellt eine regionale Zusammenfassung von Vertriebsstätten       bitte mit Vertrieb klären, aktuell
                    ohne dem Vertriebsweg Makler dar.                                                                gibt es die Nummern 1 - 4 und
                                                                                                                     9
OD
Produkt             Bezeichnung eines eigenständigen Deckungsumfangs des Konzerns. Stellt eine innerhalb der
                    Gothaer standardisierte Kombination eines oder mehrerer Risiken dar.
Wagnis              Risiko in Haftpflicht z.B. Privathaftpflicht für Angestellte




                                                          Business Consulting Düsseldorf 2007                                                       29
Template – Attribute und Definitionen

                                                              Attribut-
                                                             definitionen




                       Business Consulting Düsseldorf 2007                  30
Template - Fakten und Kennzahlen

                                                            Kennzahlen-
                                                            definitionen




                      Business Consulting Düsseldorf 2007                  31
Template - Berichte

                                                               Bericht:
                                                             Kennzahlen-
                                                                Anzahl
                                                             definitionen
                                                            Versiche-rungen
                                                                  pro
                                                            Spartennummer
                                                              und Monat




                      Business Consulting Düsseldorf 2007                     32
Workshop-Liste




                 Business Consulting Düsseldorf 2007   33
Glossar




                                                Kennzahl




                                                  Attribut




          Business Consulting Düsseldorf 2007                34
Transformation in das DWH-Datenmodell




                     Business Consulting Düsseldorf 2007   35
Konsolidierung

1. Wiederverwendung bereits definierter Begriffe


2. Qualitätssicherung der Templates mit Rücklauf


3. Erzeugen einer Begriffsliste und Auswertung


4. Zuordnungen


5. Modellierung


6. Qualitätssicherung



                            Business Consulting Düsseldorf 2007   36
Partnermodell




                Konsolidierte
                 Orgadaten




                           Business Consulting Düsseldorf 2007   37
Vertragsmodell




                 Generelle
                  Attribute

                                                        Spezielle
                                                        Attribute




                  Business Consulting Düsseldorf 2007               38
Zielfoto

    Hubs       Externe Daten                                                                                                                                                                    Interne Daten
                                                               Agentur-
                                                               system                                                                                                            Kunden-
                                                                                                                                                                  Kontakt-    service Center    Produkt-
                                                                                                                                                                 datenbank                     datenbank




                                                                                                                                   MDM
                            Internet         Manuelle         Agentur-
                                             Eingaben                                                                                                            Schaden-      Manuelle
                                                             datenbank                                                                                                         Eingaben         Kunden-
                                                                                                                                                                 datenbank                     datenbank
                            • Tarifrechner



         Data Quality                                                                                 Stage Bereich                                                               Data Profiling

    Physische                                                                   Data Warehouse                                                                                        Ausnahme-
    Speicherung                     Manuelle                                                                                                                                           berichte
                                    Eingaben                                                                                                  Regel




                                                                                  Partner                                 Spezifikation


                                                                                                                                                                             • Risikomanagement
                                                                                                                                                                                                               Data Profiling
                                                                  Adresse und
                                                                     Gebiet                 Objekt                                  Vertrag
                                                                                                                                                                             • Controlling
                                                                                                                                                      Kapital-
                                                                                                                      Leistungs-                      anlagen
                                                                                                                      erbringung



                                                                                                     Ereignis


                                                                                                                                                 Finanz-
                                                                                                                                              transaktionen




             Data Quality                                                       Selektion, Transformation
    Data
    Marts
                    Ausnahme-                     Scoring-                                                                                                                                         Marketing     Data Profiling
                                                                                                           Risikodaten                                                Kontaktdaten
                      daten                        daten                                                                                                                                           datenbank

Risk Mgmt.         Stornofrüh-                    Scoring-                                                                                                              Kontakt-                   Database
  System           warnsystem                     System                                                                                                               applikation                 Marketing
                   • Stornofrüherkennung        • Profitabilitätsanalyse                                • Gute, schlechte                                             • Kundenanliegen            • Profile/Segmente
                   • Stornoprophylaxe           • Kundenwert                                                    Risiken                                               • Servicestandards          • Kampagnenmgmt.


                                                                         Business Consulting Düsseldorf 2007                                                                                                              39
Unsere Empfehlung

Zuerst eine konsolidierte fachliche Erhebung ...

... dann die Bereitstellung von MasterDaten ...

 ... auf deren Basis dann Business Rules hinterlegt werden...
 ... welche als Grundlage für das Profiling dienen!




                      Business Consulting Düsseldorf 2007   40
Richtlinie für Planung eines DWH mit garantierter Datenqualität

• Unternehmensweite Datendefinition
   – Informationen müssen in ihrer Bedeutung unter den Fachbereichen abgestimmt
     sein
       • Datendefinitionen auf Schemaebene
       • erlaubte Wertbereiche auf Instanzebene
• Übernahme der nur tatsächlich benötigten Daten
   – keine Datenfriedhöfe
• Übernahme der Detaildaten und Ablage der Metadaten
   – Detaildaten in DWH integrieren und historisieren
       • spätere Analyseanforderungen abdecken
       • Aufbewahrung zur Nachvollziehbarkeit der abgeleiteten Daten für jurist.
         Fragestellungen




                                       Quelle: Lehner /Datenbanktechnologie für DWH-Systeme 2003/ 123 ff.

                               Business Consulting Düsseldorf 2007                                     41
BACKUP




         Business Consulting Düsseldorf 2007   42
Zielfoto


                                                     Data Profiling



Data Quality




                                                     Data Profiling



Data Quality

                                                     Data Profiling




               Business Consulting Düsseldorf 2007                    43
Lösung

• Top-down und Bottom-up-Vorgehensweise müssen sich ergänzen


• Erhebung der Beziehungen zwischen den Objekten erforderlich


• Fallabschliessende Erledigung eines Begriffs vor Implementierung in das
  Physische Datenmodell




                            Business Consulting Düsseldorf 2007             44
Abgrenzung der Stammdaten von den Bewegungsdaten



• Stammdaten ist ein Begriff aus der Informatik („Datenmanagement“) und der
  Betriebswirtschaft („betriebliche Anwendungsprogramme“).


• Daten einer Anwendung können entsprechend ihrer Änderungshäufigkeit in
  Stammdaten und Bewegungsdaten eingeteilt werden.


• Im Kontext betrieblicher Mengen- und Wertebetrachtungen gibt es darüber
  hinaus noch den Begriff Bestandsdaten.




                               Quelle: http://de.wikipedia.org/wiki/Stammdaten, gefunden am 20.08.2007

                           Business Consulting Düsseldorf 2007                                      45
Konditionelle Abhängigkeiten: Vater-Sohn-Beziehungen
                                                                                              B
                                   Organi-                                                  Ba eispi
       Person        Partner                                                                   c     e
                                                                                            No hma l
                                   sation                                   Spezifikation
                                                                                              tat n-
                                                                                                 ion

       Partner-         Partner-                          Partnerrolle in
                                                                              Vertrag
      beziehung          name                              Spezifikat.



                                                          Partnerrolle in
                  Registrierung                                                 Ort
                                                             Vertrag



                      Registrierter                        Partner/Ort-
       Konto                                                                  Statistik
                        Partner                             Beziehung



               Partner/Konto-                                Partner in
                 Beziehung                                    Statistik



                                      Business Consulting Düsseldorf 2007                           46
Existentielle Abhängigkeiten: Vater-Sohn-Beziehungen
                                                            Stammdaten
                                                                               Erw Beis
                                                                                  in- pie
                                                                                     No l
                                                                                        tat
                                                                                           ion
                                                            stämmiger




                                                            beweglicher




                                                            Bewegungsdaten

                                                                             Quelle: Eigene Projekte

                      Business Consulting Düsseldorf 2007                                         47
Änderungsdienst

                                                        Stammdaten =
                                                        Daten, die über einen
                                                        längeren Zeitraum
                                                        unverändert bleiben.

                                            statisch
                                                        Definiert über den
                                                        Änderungsdienst, d.h.
                                                        die Anzahl der Einfüge-,
                                            dynamisch   Änderungs- und
                                                        Löschungsoperationen
                                                        von Datensätzen




                  Business Consulting Düsseldorf 2007                              48
Beispiele für Data Profiling

• Datentypen
   – Alphabetische Werte in numerischem Datentyp
• Muster
   – BLZ: 999 999 999
• Domain
   – Geschlecht: 0 anstelle von (m, w)
• Häufigkeit
   – Die meisten Versicherungsnehmer sind männlich.
• Statistiken
   – Maximum, Minimum, Median, Modus, Durchschnitt, Erwartungswert,
     Standardabweichung
• Interdependenz
   – Zip-Code hängt ab vom Country Code.



                               Business Consulting Düsseldorf 2007    49

Weitere ähnliche Inhalte

Was ist angesagt?

Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...
Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...
Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...
Christian Schieder
 
2012 04-17 Die automatische Post- und Rechnungseingangsbearbeitung
2012 04-17 Die automatische Post- und Rechnungseingangsbearbeitung2012 04-17 Die automatische Post- und Rechnungseingangsbearbeitung
2012 04-17 Die automatische Post- und Rechnungseingangsbearbeitung
BARC GmbH
 
BARC Was Datenmanagement Messbar Dazu Beitragen Kann
BARC Was Datenmanagement Messbar Dazu Beitragen KannBARC Was Datenmanagement Messbar Dazu Beitragen Kann
BARC Was Datenmanagement Messbar Dazu Beitragen Kann
DataValueTalk
 
Mobile BI - Mobilisieren von Unternehmensprozessen
Mobile BI - Mobilisieren von UnternehmensprozessenMobile BI - Mobilisieren von Unternehmensprozessen
Mobile BI - Mobilisieren von Unternehmensprozessen
BARC GmbH
 
Next generation sap bi 2012
Next generation sap bi 2012 Next generation sap bi 2012
Next generation sap bi 2012
Maria Willamowius
 
Datenqualitätsmanagement heute und morgen
Datenqualitätsmanagement heute und morgenDatenqualitätsmanagement heute und morgen
Datenqualitätsmanagement heute und morgen
Vizlib Ltd.
 
Business intelligence überblicksvortrag
Business intelligence überblicksvortragBusiness intelligence überblicksvortrag
Business intelligence überblicksvortrag
Falk Neubert
 
Systematika Business Intelligence Specialists
Systematika Business Intelligence SpecialistsSystematika Business Intelligence Specialists
Systematika Business Intelligence Specialists
Systematika Information Systems
 
Innocate Imagebroschuere 2013 - http://www.innocate.de/
Innocate Imagebroschuere 2013 - http://www.innocate.de/Innocate Imagebroschuere 2013 - http://www.innocate.de/
Innocate Imagebroschuere 2013 - http://www.innocate.de/
Sunny2014
 
Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...
Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...
Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...
OPITZ CONSULTING Deutschland
 
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
Falk Neubert
 
OpenDMA - Daten Management Solution
OpenDMA  - Daten Management SolutionOpenDMA  - Daten Management Solution
OpenDMA - Daten Management Solution
Torsten Glunde
 
DE- Module 2 - Improving your business model using your own data
DE- Module 2 - Improving your business model using your own dataDE- Module 2 - Improving your business model using your own data
DE- Module 2 - Improving your business model using your own data
caniceconsulting
 
Unternehmensweites DQ-Controlling auf Basis von BI-Werkzeugen
Unternehmensweites DQ-Controlling auf Basis von BI-WerkzeugenUnternehmensweites DQ-Controlling auf Basis von BI-Werkzeugen
Unternehmensweites DQ-Controlling auf Basis von BI-Werkzeugen
Vizlib Ltd.
 
Reporting- und Business-Intelligence-Werkzeuge für den Controller: Grundlagen...
Reporting- und Business-Intelligence-Werkzeuge für den Controller: Grundlagen...Reporting- und Business-Intelligence-Werkzeuge für den Controller: Grundlagen...
Reporting- und Business-Intelligence-Werkzeuge für den Controller: Grundlagen...
Daniel Eiduzzis
 
Data Governance: Problemfelder in der Umsetzung von BI-Initiativen und Lesson...
Data Governance: Problemfelder in der Umsetzung von BI-Initiativen und Lesson...Data Governance: Problemfelder in der Umsetzung von BI-Initiativen und Lesson...
Data Governance: Problemfelder in der Umsetzung von BI-Initiativen und Lesson...
Daniel Eiduzzis
 

Was ist angesagt? (20)

Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...
Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...
Operational Intelligence im Kontext des Enterprise Decision Managements - MKW...
 
2012 04-17 Die automatische Post- und Rechnungseingangsbearbeitung
2012 04-17 Die automatische Post- und Rechnungseingangsbearbeitung2012 04-17 Die automatische Post- und Rechnungseingangsbearbeitung
2012 04-17 Die automatische Post- und Rechnungseingangsbearbeitung
 
BARC Was Datenmanagement Messbar Dazu Beitragen Kann
BARC Was Datenmanagement Messbar Dazu Beitragen KannBARC Was Datenmanagement Messbar Dazu Beitragen Kann
BARC Was Datenmanagement Messbar Dazu Beitragen Kann
 
Mobile BI - Mobilisieren von Unternehmensprozessen
Mobile BI - Mobilisieren von UnternehmensprozessenMobile BI - Mobilisieren von Unternehmensprozessen
Mobile BI - Mobilisieren von Unternehmensprozessen
 
Next generation sap bi 2012
Next generation sap bi 2012 Next generation sap bi 2012
Next generation sap bi 2012
 
Datenqualitätsmanagement heute und morgen
Datenqualitätsmanagement heute und morgenDatenqualitätsmanagement heute und morgen
Datenqualitätsmanagement heute und morgen
 
Business intelligence überblicksvortrag
Business intelligence überblicksvortragBusiness intelligence überblicksvortrag
Business intelligence überblicksvortrag
 
IT Trends 2011 - und welchen Einfluss Business Analytics darauf hat
IT Trends 2011 - und welchen Einfluss Business Analytics darauf hatIT Trends 2011 - und welchen Einfluss Business Analytics darauf hat
IT Trends 2011 - und welchen Einfluss Business Analytics darauf hat
 
Systematika Business Intelligence Specialists
Systematika Business Intelligence SpecialistsSystematika Business Intelligence Specialists
Systematika Business Intelligence Specialists
 
Innocate Imagebroschuere 2013 - http://www.innocate.de/
Innocate Imagebroschuere 2013 - http://www.innocate.de/Innocate Imagebroschuere 2013 - http://www.innocate.de/
Innocate Imagebroschuere 2013 - http://www.innocate.de/
 
Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...
Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...
Historisierung und Analyse von Daten aus Oracle Enterprise Manager Cloud Cont...
 
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
Open-Source ERP und BI - Kriterien für ein effizientes Zusammenspiel -
 
OpenDMA - Daten Management Solution
OpenDMA  - Daten Management SolutionOpenDMA  - Daten Management Solution
OpenDMA - Daten Management Solution
 
DE- Module 2 - Improving your business model using your own data
DE- Module 2 - Improving your business model using your own dataDE- Module 2 - Improving your business model using your own data
DE- Module 2 - Improving your business model using your own data
 
2010 09 30 11-30 thomas marx
2010 09 30 11-30 thomas marx2010 09 30 11-30 thomas marx
2010 09 30 11-30 thomas marx
 
Unternehmensweites DQ-Controlling auf Basis von BI-Werkzeugen
Unternehmensweites DQ-Controlling auf Basis von BI-WerkzeugenUnternehmensweites DQ-Controlling auf Basis von BI-Werkzeugen
Unternehmensweites DQ-Controlling auf Basis von BI-Werkzeugen
 
SAP Einführung_1
SAP Einführung_1SAP Einführung_1
SAP Einführung_1
 
Reporting- und Business-Intelligence-Werkzeuge für den Controller: Grundlagen...
Reporting- und Business-Intelligence-Werkzeuge für den Controller: Grundlagen...Reporting- und Business-Intelligence-Werkzeuge für den Controller: Grundlagen...
Reporting- und Business-Intelligence-Werkzeuge für den Controller: Grundlagen...
 
Data Governance: Problemfelder in der Umsetzung von BI-Initiativen und Lesson...
Data Governance: Problemfelder in der Umsetzung von BI-Initiativen und Lesson...Data Governance: Problemfelder in der Umsetzung von BI-Initiativen und Lesson...
Data Governance: Problemfelder in der Umsetzung von BI-Initiativen und Lesson...
 
Effimag präsentation05
Effimag präsentation05Effimag präsentation05
Effimag präsentation05
 

Ähnlich wie Datenqualität in DWH-Projekten bei Versicherungen (für Informatica Fachtreffen)

Patterns in der Produktkonfiguration
Patterns in der ProduktkonfigurationPatterns in der Produktkonfiguration
Patterns in der Produktkonfiguration
Wirtschaftsinformatik an der TU Chemnitz
 
BI und ECM - Verbindung von strukturierten und unstrukturierten Daten
BI und ECM - Verbindung von strukturierten und unstrukturierten DatenBI und ECM - Verbindung von strukturierten und unstrukturierten Daten
BI und ECM - Verbindung von strukturierten und unstrukturierten Daten
BARC GmbH
 
Effizienz im Fokus: Clients, Server Systeme überwachen, analysieren und optim...
Effizienz im Fokus: Clients, Server Systeme überwachen, analysieren und optim...Effizienz im Fokus: Clients, Server Systeme überwachen, analysieren und optim...
Effizienz im Fokus: Clients, Server Systeme überwachen, analysieren und optim...
We4IT Group
 
Daten- und Informationsqualitätsmanagement als integraler Baustein von Manage...
Daten- und Informationsqualitätsmanagement als integraler Baustein von Manage...Daten- und Informationsqualitätsmanagement als integraler Baustein von Manage...
Daten- und Informationsqualitätsmanagement als integraler Baustein von Manage...
Marco Geuer
 
Data Mining und OLAP
Data Mining und OLAPData Mining und OLAP
Data Mining und OLAP
murat9393
 
10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swc
10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swc10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swc
10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swc
OGD-DACHLI Konferenzreihe
 
Open Government Vorgehensmodell 2.0
Open Government Vorgehensmodell 2.0Open Government Vorgehensmodell 2.0
Open Government Vorgehensmodell 2.0
Brigitte Lutz
 
KDZ & Stadt Wien, Open Government Vorgehensmodell
KDZ & Stadt Wien, Open Government VorgehensmodellKDZ & Stadt Wien, Open Government Vorgehensmodell
KDZ & Stadt Wien, Open Government Vorgehensmodell
OGD-DACHLI Konferenzreihe
 
Cen xchange crm trends 2013
Cen xchange crm trends 2013Cen xchange crm trends 2013
Cen xchange crm trends 2013
Nils Hafner
 
SQLTXPLAIN - Oder: Warum performt mein SQL nicht?
SQLTXPLAIN - Oder: Warum performt mein SQL nicht?SQLTXPLAIN - Oder: Warum performt mein SQL nicht?
SQLTXPLAIN - Oder: Warum performt mein SQL nicht?
OPITZ CONSULTING Deutschland
 
Twowayys Agile Sourcing
Twowayys Agile SourcingTwowayys Agile Sourcing
Twowayys Agile Sourcing
Jörg Petters
 
Datenqualität (DQ) - Voraussetzung für ein funktionierendes Qualitäts Managem...
Datenqualität (DQ) - Voraussetzung für ein funktionierendes Qualitäts Managem...Datenqualität (DQ) - Voraussetzung für ein funktionierendes Qualitäts Managem...
Datenqualität (DQ) - Voraussetzung für ein funktionierendes Qualitäts Managem...
Marco Geuer
 
BATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und KnacknüsseBATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und Knacknüsse
BATbern
 
Social Workspace als Herausforderung für die IT-Organisation
Social Workspace als Herausforderung für die IT-OrganisationSocial Workspace als Herausforderung für die IT-Organisation
Social Workspace als Herausforderung für die IT-Organisation
acentrix GmbH
 
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTiggesDas modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
OPITZ CONSULTING Deutschland
 
Verbesserung und Kontrolle der Servicequalität für Endbenutzer
Verbesserung und Kontrolle der Servicequalität für EndbenutzerVerbesserung und Kontrolle der Servicequalität für Endbenutzer
Verbesserung und Kontrolle der Servicequalität für Endbenutzer
Digicomp Academy AG
 
130213 itn webcast_sap
130213 itn webcast_sap130213 itn webcast_sap
130213 itn webcast_sap
it-novum
 
Data Governance Journey from UM to VF
Data Governance Journey from UM to VFData Governance Journey from UM to VF
Data Governance Journey from UM to VF
Marco Geuer
 
MUM Produktpräsentation 2010
MUM Produktpräsentation 2010MUM Produktpräsentation 2010
MUM Produktpräsentation 2010
Philip Axmann
 

Ähnlich wie Datenqualität in DWH-Projekten bei Versicherungen (für Informatica Fachtreffen) (20)

Patterns in der Produktkonfiguration
Patterns in der ProduktkonfigurationPatterns in der Produktkonfiguration
Patterns in der Produktkonfiguration
 
BI und ECM - Verbindung von strukturierten und unstrukturierten Daten
BI und ECM - Verbindung von strukturierten und unstrukturierten DatenBI und ECM - Verbindung von strukturierten und unstrukturierten Daten
BI und ECM - Verbindung von strukturierten und unstrukturierten Daten
 
Effizienz im Fokus: Clients, Server Systeme überwachen, analysieren und optim...
Effizienz im Fokus: Clients, Server Systeme überwachen, analysieren und optim...Effizienz im Fokus: Clients, Server Systeme überwachen, analysieren und optim...
Effizienz im Fokus: Clients, Server Systeme überwachen, analysieren und optim...
 
Daten- und Informationsqualitätsmanagement als integraler Baustein von Manage...
Daten- und Informationsqualitätsmanagement als integraler Baustein von Manage...Daten- und Informationsqualitätsmanagement als integraler Baustein von Manage...
Daten- und Informationsqualitätsmanagement als integraler Baustein von Manage...
 
Data Mining und OLAP
Data Mining und OLAPData Mining und OLAP
Data Mining und OLAP
 
10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swc
10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swc10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swc
10 dirschl kaltenböck_ogd_d-a-ch-li 20121004_wkd-swc
 
Open Government Vorgehensmodell 2.0
Open Government Vorgehensmodell 2.0Open Government Vorgehensmodell 2.0
Open Government Vorgehensmodell 2.0
 
KDZ & Stadt Wien, Open Government Vorgehensmodell
KDZ & Stadt Wien, Open Government VorgehensmodellKDZ & Stadt Wien, Open Government Vorgehensmodell
KDZ & Stadt Wien, Open Government Vorgehensmodell
 
Cen xchange crm trends 2013
Cen xchange crm trends 2013Cen xchange crm trends 2013
Cen xchange crm trends 2013
 
SQLTXPLAIN - Oder: Warum performt mein SQL nicht?
SQLTXPLAIN - Oder: Warum performt mein SQL nicht?SQLTXPLAIN - Oder: Warum performt mein SQL nicht?
SQLTXPLAIN - Oder: Warum performt mein SQL nicht?
 
Mbuf
MbufMbuf
Mbuf
 
Twowayys Agile Sourcing
Twowayys Agile SourcingTwowayys Agile Sourcing
Twowayys Agile Sourcing
 
Datenqualität (DQ) - Voraussetzung für ein funktionierendes Qualitäts Managem...
Datenqualität (DQ) - Voraussetzung für ein funktionierendes Qualitäts Managem...Datenqualität (DQ) - Voraussetzung für ein funktionierendes Qualitäts Managem...
Datenqualität (DQ) - Voraussetzung für ein funktionierendes Qualitäts Managem...
 
BATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und KnacknüsseBATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und Knacknüsse
 
Social Workspace als Herausforderung für die IT-Organisation
Social Workspace als Herausforderung für die IT-OrganisationSocial Workspace als Herausforderung für die IT-Organisation
Social Workspace als Herausforderung für die IT-Organisation
 
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTiggesDas modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
 
Verbesserung und Kontrolle der Servicequalität für Endbenutzer
Verbesserung und Kontrolle der Servicequalität für EndbenutzerVerbesserung und Kontrolle der Servicequalität für Endbenutzer
Verbesserung und Kontrolle der Servicequalität für Endbenutzer
 
130213 itn webcast_sap
130213 itn webcast_sap130213 itn webcast_sap
130213 itn webcast_sap
 
Data Governance Journey from UM to VF
Data Governance Journey from UM to VFData Governance Journey from UM to VF
Data Governance Journey from UM to VF
 
MUM Produktpräsentation 2010
MUM Produktpräsentation 2010MUM Produktpräsentation 2010
MUM Produktpräsentation 2010
 

Datenqualität in DWH-Projekten bei Versicherungen (für Informatica Fachtreffen)

  • 1. Datenqualität in DWH-Projekten bei Versicherungen 20. September 2007 Matthias Nadler-Schulz Dr. Leonhardt Wohlschlager Business Consulting Düsseldorf 2007 © LogicaCMG 2007 All rights reserved
  • 2. Agenda • Zielsetzung • Data Profiling • Data-Quality-Tools • Masterdatenmanagement • Konsolidiertes Unternehmensdatenmodell Business Consulting Düsseldorf 2007 2
  • 3. Vorstellung • Matthias Nadler-Schulz – 33 Jahre – seit 1997 berufstätig (IT/FM) – seit 2002 BI/DWH-Consultant – 2002-2005: DATA MART Consulting – seit 2006: LogicaCMG – Team Manager BI Financial Services – Schwerpunkt im Bereich der Datenbewirtschaftung und COGNOS – Account Manager für die BARMER – Weitere Kunden sind die Gothaer, AMB, Apobank, CoBa, DreBa Business Consulting Düsseldorf 2007 3
  • 4. Vorstellung • Dr. Leonhardt Wohlschlager, Dipl.Kfm., PMP – Studium in Köln, Paris und Rotterdam – 1994 – 1995 IBM, Köln, Datenmodellierung – 1996 – 1997 Société Maria Galland, Information Management, Paris DigiVision, Köln, Electronic Business – 1998 – 2000 IBM, Hamburg, Electronic Business – 2001 – 2005 Universität zu Köln, Informationsmanagement, Freiberufliche Tätigkeit – seit 2006 LogicaCMG, Düsseldorf – Schwerpunkt in den Bereichen des Information Management, IT Management und CRM mit international Ausrichtung (CEMS MIM) – Project Management Professional (PMP) – Veröffentlichungen zum Thema Informationsmanagement in der Versicherungswirtschaft – Kunden sind die Barmer, IDG, Gothaer, Vodafone und Unternehmensberatungen. Business Consulting Düsseldorf 2007 4
  • 5. Zielsetzung • Begriffsbestimmung der Datenqualität • Datenqualität als Notwendigkeit im DWH-Projekt • Relevanz der Masterdaten und der fachlichen Erhebung • Einsatzpotential von Data Profiling und Quality Business Consulting Düsseldorf 2007 5
  • 6. Problemstellung Schwerwiegende Datenfehler in einem Vertriebsinformationssystem führen zu Akzeptanzverlusten bei den Endanwendern • Das VIS ist das zentrale Steuerungsinstrument im Vertrieb und ist Quelle für die Provisionssysteme. • Nutzer sind sowohl der konzerneigene Vertrieb als auch externe Vermittlungspartner (Finanzdienstleister, Banken, freie Vermittler). • Die Verarbeitung scheint fehlerfrei zu arbeiten, Testläufe zeigen keine Abweichungen. Das System arbeitete einen längeren Zeitraum erwartungsgemäß. • Quellsysteme sind zum Teil nicht einsehbar. Abgleiche gegen die Bestands- systeme zeigen bei einigen Vermittlern erhebliche Abweichungen. Nutzungsmöglichkeiten durch unklare Datenqualität eingeschränkt Business Consulting Düsseldorf 2007 6
  • 7. Wie können wir diese Probleme verhindern? Unsere Thesen… • These 1: Data Profiling erleichtert eine frühzeitige Identifizierung von möglichen Datenproblemen. • These 2: Data Quality im ETL-Prozess gibt den Fachbereichen die Möglichkeit, Business Rules einzusetzen. • These 3: Stamm- und Strukturdaten müssen zeitlich abgegrenzt und fortlaufend gepflegt werden. • These 4: Grundlage des physischen Modells muss ein abgestimmtes konzeptionelles Datenmodell sein. Business Consulting Düsseldorf 2007 7
  • 8. Definition der Datenqualität Datenqualität Relevant, korrekt, konform, • bezeichnet die Relevanz und Korrektheit zuverlässig von Informationen ? • beschreibt, wie gut eine Information bzw. ein Datensatz ist, um die Realität zu beschreiben, d.h. inwieweit sie ein Modell tatsächlicher Situationen bildet. • besagt, wie verläßlich eine Information ist und inwieweit man sie als Grundlage für eine Planung des eigenen Handelns verwenden kann. • ist nicht gleichbedeutend mit der Relevanz (der Semantik) oder mit dem formalen Informationsgehalt (der statistischen Signifikanz). Business Consulting Düsseldorf 2007 8
  • 9. Typische Kriterien für Datenqualität • Richtigkeit • Konsistenz • Vollständigkeit • Aktualität • Aufgabenbezogenheit • Zusammenhangbezogenheit Quelle: Vgl. zu den Zielen des Datenmanagements: Jörg Biethahn; Norbert Rohrig /Datenmanagement 1990/ 740 f. Business Consulting Düsseldorf 2007 9
  • 10. Die Messbarkeit von Datenqualität Beschreibung • Wie lässt sich die Datenqualität im Data Warehousing messen? – Wie erreichen wir eine Akzeptanz der Messung? – Wie sollen wir die Messkriterien gewichten? – Wie wollen wir den Messvorgang operationalisieren? – Wie sollen wir die Interpretationsspielräume reduzieren? Business Consulting Düsseldorf 2007 10
  • 11. Messen der Datenqualität im Data Warehousing (Beispiel) Qualitätsattribute 1. Realtime verfügbar 2. aktuell 3. genau Bewertungsbogen Bewertungsbogen 4. exakt 5. objektiv Wie wichtig ist für Sie, 1 2 3 4 5 6. interpretierbar daß Daten folgende 7. relevant Eigenschaften haben Attributgruppen Attributgruppen 8. Einfache Pflege (1 = unwichtig / 5 = sehr 9. transparent wichtig)? Attribut Definition Gruppe … verfügbar x Genauigkeit aktuell x differenziert x 1. Glaubwürdigkeit genau x 2. Objektivität … Verfügbarkeit 1. Definition einer 1. für alle NLs 2. DRM Attributliste zur Konsistenz 1. Spartenneutralität Beschreibung der 2. Gewichtung und Gruppierung … Datenqualität der Listeneinträge durch Nutzer pro Fachbereich 3. Bildung von Attributgruppen durch IT-Experten und Key User Business Consulting Düsseldorf 2007 11
  • 12. Ein zusätzliches Kriterium: Transparenz über die Daten Tarif-, Vertrags-, Leistungs- Transparenz und Partner-Informationen Aktivität Geschäfts- Aktivität Geschäfts- regel regel Partner Spezifikation durch Partner Spezifikation Kontakt- punkt Vertrag und Objekt Ort Finanz- anlagen Leistungs- erstellung Ereignis Finanz- Transaktion Kontakt- Aktivität Geschäfts- punkt Vertrag regel und Objekt Partner Spezifikation Ort Finanz- Kontakt- punkt Vertrag anlagen und Ort Objekt Leistungs- Reporting und Überwachung Finanz- erstellung anlagen Leistungs- erstellung Ereignis Finanz- Ereignis Transaktion Finanz- Transaktion Pro Datenquelle und -typ: Key Attributes Automation -vollständig? -redundant? -zeitgerecht? -… Datenabgleich Datenbereinigung Business Consulting Düsseldorf 2007 12
  • 13. Begriffsdefinition Data Profiling Unter Data Profiling Data Profiling wird ein Prozess verstanden, bei dem Daten in einer Datenquelle mit statistischen Werkzeugen und Methoden Source analysiert werden, Data Quality um die Datenqualität zu ermitteln. Business Consulting Düsseldorf 2007 13
  • 14. Data Profiling • liefert Angaben über die Aufgabenbezogenheit der Daten • liefert Maße für Datenqualität • verfolgt die Datenqualität • prüft, ob die Datenwerte die Metadaten definieren und vice versa • liefert eine unternehmensweite Sicht, z.B. für Masterdatenmanagement Business Consulting Düsseldorf 2007 14
  • 15. Problem Profiling Beschreibung Quellsysteme sind zum Teil nicht einsehbar. These 1: Data Profiling erleichtert eine frühzeitige Identifizierung von möglichen Datenproblemen. Beispiel: Die Schnittstelle eines Kooperationspartners soll die Antragsbestandssätze und alle nachfolgenden Antragsbewegungssätze liefern. Tatsächlich werden jedoch nur Antragsbestandssätze geliefert. Business Consulting Düsseldorf 2007 15
  • 16. Lösung Profiling Be i sp iel Business Consulting Düsseldorf 2007 16
  • 17. Problem Profiling Beschreibung Die Verarbeitung scheint fehlerfrei zu arbeiten, Testläufe zeigen keine Abweichungen. These 2: Data Quality im ETL-Prozess gibt den Fachbereichen die Möglichkeit, Business Rules einzusetzen. Beispiel: Regeln in den Köpfen der Mitarbeitern sind nicht in den Systemen hinterlegt und nicht dokumentiert. Business Consulting Düsseldorf 2007 17
  • 18. Lösung Data Quality Be i sp iel Business Consulting Düsseldorf 2007 18
  • 19. Tool-unterstützte Metriken und Datenqualitätsverbesserungen Be i sp iel Business Consulting Düsseldorf 2007 19
  • 20. Begriffsdefinition des Masterdatenmanagements • Verwaltung und Organisation derjenigen Referenz- oder Masterdaten, die von IT-Anwendungssystemen und Abteilungen geteilt werden. • Konsistente Informationsverarbeitung in heterogenen Systemarchitekturen hierdurch erreichbar • besonders geeignet für große Unternehmen mit vielen Geschäftsfunktionen Quelle: Vgl. wikipedia (Hrsg.) /Master Data Management 2007/ http://en.wikipedia.org/wiki/Master_Data_Management Business Consulting Düsseldorf 2007 20
  • 21. Problem Profiling Beschreibung Abgleiche gegen die Bestandssysteme zeigen bei einigen Vermittlern erhebliche Abweichungen. These 3: Stamm- und Strukturdaten müssen zeitlich abgegrenzt und fortlaufend gepflegt werden. Beispiel: Die Versicherung als Organisation wandelt sich ständig. Daher müssen die Stamm- und Strukturdaten im ETL-Prozess an die organisatorischen Veränderungen angepasst werden kann. Business Consulting Düsseldorf 2007 21
  • 22. Lösung MasterDaten Be i sp iel Business Consulting Düsseldorf 2007 22
  • 23. Lösung MasterDaten Be i sp iel Business Consulting Düsseldorf 2007 23
  • 24. Probleme ohne konzeptionelles Datenmodell Unterschiedliche Begriffsdefinitionen führen zu inkonsistenten Berichten. These 4: Grundlage des physischen Modells muss ein abgestimmtes konzeptionelles Datenmodell sein. Beispiel: In der Lebensversicherung gibt es eine Produktsicht, in der Schaden- und Unfallversicherung eine Tarifsicht. Business Consulting Düsseldorf 2007 24
  • 25. Einzelprobleme bei der Herstellung einer konzeptionellen Sicht • Die Fachabteilungen investieren nicht genügend Zeit in der Vermittlung ihrer Sicht, ihrer Anforderungen oder in die Klarstellung der Sachverhalte. • Bestimmte Informationsobjekte werden zu stark in den Vordergrund gestellt. • Die Fachabteilungen sind nicht bereit, ihre Sichten gegenseitig abzustimmen bzw. andere Sicht anzunehmen. • Die Beziehungen zwischen den hauptsächlichen Informationsobjekten werden nicht erhoben. • Einzelne Fachabteilungen erkennen ihre Berichte bzw. (bei der Erstellung) die Inhalte des physischen Datenmodells nicht wieder. Business Consulting Düsseldorf 2007 25
  • 26. Konsolidierung: Unternehmensweit einheitliche Partnersicht Be i sp iel Verträge Kunden- Schäden stammdaten Einheitliche Kundengesamtsicht Storno- Kunden- im Vertrieb und risiko wert Service Kontakte Kundendaten Inkasso Business Consulting Düsseldorf 2007 26
  • 27. Berichtsorientiertes Vorgehen 1. Begriff eines Berichts erheben 2. Begriff mit den schon erhobenen Begriffen abgleichen 3. Abstimmung in Workshops mit den Fachabteilungen 4. Konzeptionelle Modellierung 5. Transformation in ein physisches Datenmodell 6. (Top down / Bottom up – Herangehensweise) Business Consulting Düsseldorf 2007 27
  • 28. Vorgehen bei Analyse und Design des Core DWH (Übersicht) Merkmale Attribute Templates Kennzahlen Definitionen Workshop- Berichts- Glossar Listen anforderungen Aktivität Geschäfts- regel Daten- Verwendungs- Begriffs Partner Spezifikation matrix verwendungen Kontakt- punkt Vertrag modell und Objekt Ort Finanz- anlagen Leistungs- erstellung Ereignis Finanz- Transaktion Schnittstelle zur physischen Modellierung Business Consulting Düsseldorf 2007 28
  • 29. Template – Merkmale und Definitionen Eingabefelder Vertrags- definition Merkmal Definition Anmerkung Vertrag zwischen einem Versicherungsunternehmen und Versicherungsnehmer über die Vertrag Gewährung von Versicherungsschutz gegen Beitragszahlung. Ein gemeldetes Ereignis, durch das sich die Vermögenslage des Geschädigten mit und nach dem schädigendem Ereignis gegenüber der vorherigen Lage verschlechtert hat. Daraus kann Schaden ein Anspruch auf Entschädigung aus einem Versicherungsvertrag entstehen. Kunde Kunde ist ein Partner mit der Rolle VN zum Vertrag Es werden derzeit in anderen Vertriebsweg sind die Vertriebskanäle. Z.B. Ausschließlichkeitsorganisation, Makler, Vertriebsweg Kooperationspartner, Direkt(Impuls), Banken und Sonstige Sparte Zusammenfassung gleichartiger Risiken/Wagnisse mit zugrundeliegendem Bedingungswerk Stellt die unterste Stufe des Vertriebs dar. Die Rechtsform kann hierbei sowohl Makler HGB §93 als auch HGB §84 Agentur dezentrale Vertriebseinheit sein. Außendienstbezirk Unterteilung der Vertriebsstätte zur Zuordnung des Betreuers (z.B. Verkaufsleiter, Orgaleiter, Die Organisationsdirektion (OD) stellt eine regionale Zusammenfassung von Vertriebsstätten bitte mit Vertrieb klären, aktuell ohne dem Vertriebsweg Makler dar. gibt es die Nummern 1 - 4 und 9 OD Produkt Bezeichnung eines eigenständigen Deckungsumfangs des Konzerns. Stellt eine innerhalb der Gothaer standardisierte Kombination eines oder mehrerer Risiken dar. Wagnis Risiko in Haftpflicht z.B. Privathaftpflicht für Angestellte Business Consulting Düsseldorf 2007 29
  • 30. Template – Attribute und Definitionen Attribut- definitionen Business Consulting Düsseldorf 2007 30
  • 31. Template - Fakten und Kennzahlen Kennzahlen- definitionen Business Consulting Düsseldorf 2007 31
  • 32. Template - Berichte Bericht: Kennzahlen- Anzahl definitionen Versiche-rungen pro Spartennummer und Monat Business Consulting Düsseldorf 2007 32
  • 33. Workshop-Liste Business Consulting Düsseldorf 2007 33
  • 34. Glossar Kennzahl Attribut Business Consulting Düsseldorf 2007 34
  • 35. Transformation in das DWH-Datenmodell Business Consulting Düsseldorf 2007 35
  • 36. Konsolidierung 1. Wiederverwendung bereits definierter Begriffe 2. Qualitätssicherung der Templates mit Rücklauf 3. Erzeugen einer Begriffsliste und Auswertung 4. Zuordnungen 5. Modellierung 6. Qualitätssicherung Business Consulting Düsseldorf 2007 36
  • 37. Partnermodell Konsolidierte Orgadaten Business Consulting Düsseldorf 2007 37
  • 38. Vertragsmodell Generelle Attribute Spezielle Attribute Business Consulting Düsseldorf 2007 38
  • 39. Zielfoto Hubs Externe Daten Interne Daten Agentur- system Kunden- Kontakt- service Center Produkt- datenbank datenbank MDM Internet Manuelle Agentur- Eingaben Schaden- Manuelle datenbank Eingaben Kunden- datenbank datenbank • Tarifrechner Data Quality Stage Bereich Data Profiling Physische Data Warehouse Ausnahme- Speicherung Manuelle berichte Eingaben Regel Partner Spezifikation • Risikomanagement Data Profiling Adresse und Gebiet Objekt Vertrag • Controlling Kapital- Leistungs- anlagen erbringung Ereignis Finanz- transaktionen Data Quality Selektion, Transformation Data Marts Ausnahme- Scoring- Marketing Data Profiling Risikodaten Kontaktdaten daten daten datenbank Risk Mgmt. Stornofrüh- Scoring- Kontakt- Database System warnsystem System applikation Marketing • Stornofrüherkennung • Profitabilitätsanalyse • Gute, schlechte • Kundenanliegen • Profile/Segmente • Stornoprophylaxe • Kundenwert Risiken • Servicestandards • Kampagnenmgmt. Business Consulting Düsseldorf 2007 39
  • 40. Unsere Empfehlung Zuerst eine konsolidierte fachliche Erhebung ... ... dann die Bereitstellung von MasterDaten ... ... auf deren Basis dann Business Rules hinterlegt werden... ... welche als Grundlage für das Profiling dienen! Business Consulting Düsseldorf 2007 40
  • 41. Richtlinie für Planung eines DWH mit garantierter Datenqualität • Unternehmensweite Datendefinition – Informationen müssen in ihrer Bedeutung unter den Fachbereichen abgestimmt sein • Datendefinitionen auf Schemaebene • erlaubte Wertbereiche auf Instanzebene • Übernahme der nur tatsächlich benötigten Daten – keine Datenfriedhöfe • Übernahme der Detaildaten und Ablage der Metadaten – Detaildaten in DWH integrieren und historisieren • spätere Analyseanforderungen abdecken • Aufbewahrung zur Nachvollziehbarkeit der abgeleiteten Daten für jurist. Fragestellungen Quelle: Lehner /Datenbanktechnologie für DWH-Systeme 2003/ 123 ff. Business Consulting Düsseldorf 2007 41
  • 42. BACKUP Business Consulting Düsseldorf 2007 42
  • 43. Zielfoto Data Profiling Data Quality Data Profiling Data Quality Data Profiling Business Consulting Düsseldorf 2007 43
  • 44. Lösung • Top-down und Bottom-up-Vorgehensweise müssen sich ergänzen • Erhebung der Beziehungen zwischen den Objekten erforderlich • Fallabschliessende Erledigung eines Begriffs vor Implementierung in das Physische Datenmodell Business Consulting Düsseldorf 2007 44
  • 45. Abgrenzung der Stammdaten von den Bewegungsdaten • Stammdaten ist ein Begriff aus der Informatik („Datenmanagement“) und der Betriebswirtschaft („betriebliche Anwendungsprogramme“). • Daten einer Anwendung können entsprechend ihrer Änderungshäufigkeit in Stammdaten und Bewegungsdaten eingeteilt werden. • Im Kontext betrieblicher Mengen- und Wertebetrachtungen gibt es darüber hinaus noch den Begriff Bestandsdaten. Quelle: http://de.wikipedia.org/wiki/Stammdaten, gefunden am 20.08.2007 Business Consulting Düsseldorf 2007 45
  • 46. Konditionelle Abhängigkeiten: Vater-Sohn-Beziehungen B Organi- Ba eispi Person Partner c e No hma l sation Spezifikation tat n- ion Partner- Partner- Partnerrolle in Vertrag beziehung name Spezifikat. Partnerrolle in Registrierung Ort Vertrag Registrierter Partner/Ort- Konto Statistik Partner Beziehung Partner/Konto- Partner in Beziehung Statistik Business Consulting Düsseldorf 2007 46
  • 47. Existentielle Abhängigkeiten: Vater-Sohn-Beziehungen Stammdaten Erw Beis in- pie No l tat ion stämmiger beweglicher Bewegungsdaten Quelle: Eigene Projekte Business Consulting Düsseldorf 2007 47
  • 48. Änderungsdienst Stammdaten = Daten, die über einen längeren Zeitraum unverändert bleiben. statisch Definiert über den Änderungsdienst, d.h. die Anzahl der Einfüge-, dynamisch Änderungs- und Löschungsoperationen von Datensätzen Business Consulting Düsseldorf 2007 48
  • 49. Beispiele für Data Profiling • Datentypen – Alphabetische Werte in numerischem Datentyp • Muster – BLZ: 999 999 999 • Domain – Geschlecht: 0 anstelle von (m, w) • Häufigkeit – Die meisten Versicherungsnehmer sind männlich. • Statistiken – Maximum, Minimum, Median, Modus, Durchschnitt, Erwartungswert, Standardabweichung • Interdependenz – Zip-Code hängt ab vom Country Code. Business Consulting Düsseldorf 2007 49

Hinweis der Redaktion

  1. Richtigkeit nach höchsten versicherungswirtschaftlich vertretbaren Genauigkeitsanforderungen Konsistenz z.B. Prüfung der Korrektheit durch Bereichsangaben / Abprüfung alternativer Werte Vollständigkeit Reicht die Menge der verfügbaren Daten für die versicherungswirschaftlichen Entscheidungen, z.B. die Stornoidentifikation, aus? Aktualität z.B. möglichst automatische Datenerfassung der Kontakte oder Anträge Aufgabenbezogenheit z.B. Daten in richtiger Dimension, richtigem Planungszeitraum für den richtigen Tarif? Zusammenhangbezogenheit z.B. Daten und Kennzahlen für das interne und externe Rechnungswesen Zusammenhangbezogenheit: Es muß festgehalten werden, welche Daten mit welchem Zeitbezug wo in welcher Form und welchem Bezug stehen und wie die Daten für welchen Zweck erstellt wurden, wer auf diese Daten zugreifen darf und wer für die Richtigkeit der Daten verantwortlich ist.
  2. liefert Angaben über die Aufgabenbezogenheit der Daten z.B. Tauglichkeit der Daten für Kundenklassifikationen liefert Maße für Datenqualität z.B. Rufnummernqualität für Telefonaktionen verfolgt die Datenqualität z.B. Verbesserung der Kundendatenqualität bei Bereinigungsaktionen prüft, ob die Datenwerte die Metadaten definieren und vice versa z.B. Anzahl 0171-Nummern im Attribut „tel_buero“ liefert eine unternehmensweite Sicht, z.B. für Masterdatenmanagement
  3. Datentypen Alphabetische Werte in numerischem Datentyp Muster BLZ: 999 999 999 Domain Geschlecht: 0 anstelle von (m, w) Häufigkeit Die meisten Versicherungsnehmer sind männlich. Statistiken Maximum, Minimum, Median, Modus, Durchschnitt, Erwartungswert, Standardabweichung Interdependenz Zip-Code hängt ab vom Country Code.