DDVUG
HANNOVER
STAMMTISCH
Networking – Raus aus dem Vault -
Virtualisierung
Willkommen
 Einleitung – DDVUG – Vorstellung
 Business Vault Patterns
 Raus aus dem Vault – Virtualisierung
 Networking - Diskussion
DDVUG e.V.
 Deutschsprachige Data Vault User
Group
 Verbreitung von Wissen
 Veranstaltungen (Stammtische)
 Arbeitsergebnisse bereitstellen
 ddvug.de
 http://datavaultusergroup.de/wp-content/uploads/Mitgliedsantrag.pdf
Alligator Company
 “Crossing Borders” – DWH, Data
Vault und Automation
 Torsten Glunde, CEO und Gründer
 torsten.glunde@alligator-
company.de
 @tglunde
 alligator-company.de
Data Vault
16.12.
2016
Verfasser eintragen über Einfügen, Kopf- und Fußzeile 5
OLTP
Quellen
Anwende
r
Raw Vault
DM
DM
BU
Business
Vault
Data
Wahrnehmun
g
Realität
Anforderung Anforderung
Diskrepanz
Regel
 Wahrnehmungen unterscheiden
sich
 Diskrepanz zwischen verfügbaren
Daten und angeforderten
Informationen
 Trennung von RAW und Business
Vault
 Warum Data Vault?
 Erweiterbarkeit
 Nachvollziehbarkeit
Data Vault
 RAW
 Core Business Concept,
Geschäftsschlüssel
 Automation und Generation
 Langzeitspeicher
 Keine Agilität
 Regeln
 Anforderungsgetrieben
 Speicherung, Nachvollziehbarkeit
 Hohe Agilität?
 Raus
 Höchste Agilität
 Probleme mit Data Vault
Rohdaten
Regel
n
RAW Business
Raus
Agilität
Business Vault – Muster
 Abgeleitete Attribute
 Satelliten
 Gleiche Granularität
 Abgeleitete Relationen
 Same-As-Link
 Identity Resolution, DQ
 Aggregation (Portfolio, Deckungsbeiträge, …)
 Abgeleitete Events (Bewegungssätze aus Bestandssystemen,
Zufallssätze / Stichproben)
 Abgeleitete Hubs
 Identity Resolution
 DQ
 Bestehende Data Vault Muster!
Business Vault – Muster
 Dimensionale Abbildung
 Hierarchie
 Link + SAL für Vorgänger und
Nachfolger
 Denormalisierung?
 Denormalisierte Strukturen
aufbauen?
 Unbalancierte Hierarchien
 NA-Dummies
 Normalisierung zur balancierten
Hierarchie?
 PIT?
 Bridge?
 Zeitlinien?
Source: Michael Müller, MID
Raus aus dem Vault
 Data Virtualisierung + SuperNova Modeling
 Data Virtualisierung ersetzt physische
Datenhaushalte nach dem Vault
 SuperNova ist eine Modellierungstechnik speziell
für Data Vault gedacht
 Modellgetriebener Ansatz
 Virtualisierte Daten basierend auf VIEWs
Data Virtualization
Rohdaten
Regel
n
RAW Business
Data Virtualization Server
Rohdaten
Regel
n
RAW Business
DM Cube File
Data Virtualization
 Modellgetrieben
 Keine Datenbewirtschaftung
 Modell-Definition anhand von
SQL
 SQL-Engine
 View Definitionen
 Bekannte Optimierung
 Caching
 Materialized Views
 Ergebnis Caching
 Hersteller
 Denodo, Cisco, SAS, JBOSS
Data Virtualization Server
Relationales
Modell
Quelltabellen
Views
Cach
e
Parser
Engine
Optimiz
e
DV
Super Nova Überblick
 Supernova
 Alle Versionen von
Hub und Link
(Eliminierung von
Satelliten)
 Extended Supernova
 Views mit Regeln
 Delivery
 Star Schema View
 Denormalisierung
 Anforderungsgetriebe
n
Source: Rick van der Lans sponsored by Cisco Centennium: http://www.cisco.com/c/dam/en_us/services/enterprise-it-services/data-virtualization/documents/whitepaper-cisco-datavaul.pdf
Supernova –Views
Source: Rick van der Lans sponsored by Cisco Centennium: http://www.cisco.com/c/dam/en_us/services/enterprise-it-services/data-virtualization/documents/whitepaper-cisco-datavaul.pdf
Supernova – Views
Source: Rick van der Lans sponsored by Cisco Centennium: http://www.cisco.com/c/dam/en_us/services/enterprise-it-services/data-virtualization/documents/whitepaper-cisco-datavaul.pdf
Supernova – Views
Source: Rick van der Lans sponsored by Cisco Centennium: http://www.cisco.com/c/dam/en_us/services/enterprise-it-services/data-virtualization/documents/whitepaper-cisco-datavaul.pdf
Supernova – Views
Source: Rick van der Lans sponsored by Cisco Centennium: http://www.cisco.com/c/dam/en_us/services/enterprise-it-services/data-virtualization/documents/whitepaper-cisco-datavaul.pdf
Supernova – Views
Source: Rick van der Lans sponsored by Cisco Centennium: http://www.cisco.com/c/dam/en_us/services/enterprise-it-services/data-virtualization/documents/whitepaper-cisco-datavaul.pdf
Data Vault vs. Supernova
Source: Rick van der Lans sponsored by Cisco Centennium: http://www.cisco.com/c/dam/en_us/services/enterprise-it-services/data-virtualization/documents/whitepaper-cisco-datavaul.pdf
Supernova + Datenvirtualisierung
 Modellierung mittels SQL-Views
 Bestehendes Know-How
 Transiente Datenhaltung
 Versionierung / Transparenz über Metadaten
 Lineage
 Autorisierung
 Abhängig vom Hersteller der Virtualisierungssoftware
 Supernova Generierbar
 Höhere Agilität als bei der Verwendung von
herkömmlichen Bewirtschaftungsprozessen
 Virtualisierung ermöglicht auch Zugriff auf Legacy-
Systeme
 ?
Vorteile Nachteile
Linksammlung
 Automation
 Roelant Vos http://roelantvos.com
 Quipu http://www.datawarehousemanagement.org/
 Wherescape http://wherescape.com
 BI-Ready  http://attunity.com
 Data Virtualization & Logical Data Warehouse
 Mark Beyer http://blogs.gartner.com/merv-adrian/2011/11/03/mark-beyer-father-of-the-logical-data-
warehouse-guest-post/
 Rick van der Lans http://www.r20.nl/whitepapers.htm
 Data Virtuality http://datavirtuality.com/products/logical-data-warehouse/
 Cisco http://www.cisco.com/c/en/us/services/enterprise-it-services/data-virtualization.html
 Denodo http://www.denodo.com/en
 SAS Federation http://www.sas.com/en_us/software/data-management/data-federation.html
 Red Hat https://www.redhat.com/en/technologies/jboss-middleware/data-virtualization
Danke
16x9
4x3

Data Virtualization - Supernova

  • 1.
    DDVUG HANNOVER STAMMTISCH Networking – Rausaus dem Vault - Virtualisierung
  • 2.
    Willkommen  Einleitung –DDVUG – Vorstellung  Business Vault Patterns  Raus aus dem Vault – Virtualisierung  Networking - Diskussion
  • 3.
    DDVUG e.V.  DeutschsprachigeData Vault User Group  Verbreitung von Wissen  Veranstaltungen (Stammtische)  Arbeitsergebnisse bereitstellen  ddvug.de  http://datavaultusergroup.de/wp-content/uploads/Mitgliedsantrag.pdf
  • 4.
    Alligator Company  “CrossingBorders” – DWH, Data Vault und Automation  Torsten Glunde, CEO und Gründer  torsten.glunde@alligator- company.de  @tglunde  alligator-company.de
  • 5.
    Data Vault 16.12. 2016 Verfasser eintragenüber Einfügen, Kopf- und Fußzeile 5 OLTP Quellen Anwende r Raw Vault DM DM BU Business Vault Data Wahrnehmun g Realität Anforderung Anforderung Diskrepanz Regel  Wahrnehmungen unterscheiden sich  Diskrepanz zwischen verfügbaren Daten und angeforderten Informationen  Trennung von RAW und Business Vault  Warum Data Vault?  Erweiterbarkeit  Nachvollziehbarkeit
  • 6.
    Data Vault  RAW Core Business Concept, Geschäftsschlüssel  Automation und Generation  Langzeitspeicher  Keine Agilität  Regeln  Anforderungsgetrieben  Speicherung, Nachvollziehbarkeit  Hohe Agilität?  Raus  Höchste Agilität  Probleme mit Data Vault Rohdaten Regel n RAW Business Raus Agilität
  • 7.
    Business Vault –Muster  Abgeleitete Attribute  Satelliten  Gleiche Granularität  Abgeleitete Relationen  Same-As-Link  Identity Resolution, DQ  Aggregation (Portfolio, Deckungsbeiträge, …)  Abgeleitete Events (Bewegungssätze aus Bestandssystemen, Zufallssätze / Stichproben)  Abgeleitete Hubs  Identity Resolution  DQ  Bestehende Data Vault Muster!
  • 8.
    Business Vault –Muster  Dimensionale Abbildung  Hierarchie  Link + SAL für Vorgänger und Nachfolger  Denormalisierung?  Denormalisierte Strukturen aufbauen?  Unbalancierte Hierarchien  NA-Dummies  Normalisierung zur balancierten Hierarchie?  PIT?  Bridge?  Zeitlinien? Source: Michael Müller, MID
  • 9.
    Raus aus demVault  Data Virtualisierung + SuperNova Modeling  Data Virtualisierung ersetzt physische Datenhaushalte nach dem Vault  SuperNova ist eine Modellierungstechnik speziell für Data Vault gedacht  Modellgetriebener Ansatz  Virtualisierte Daten basierend auf VIEWs
  • 10.
    Data Virtualization Rohdaten Regel n RAW Business DataVirtualization Server Rohdaten Regel n RAW Business DM Cube File
  • 11.
    Data Virtualization  Modellgetrieben Keine Datenbewirtschaftung  Modell-Definition anhand von SQL  SQL-Engine  View Definitionen  Bekannte Optimierung  Caching  Materialized Views  Ergebnis Caching  Hersteller  Denodo, Cisco, SAS, JBOSS Data Virtualization Server Relationales Modell Quelltabellen Views Cach e Parser Engine Optimiz e DV
  • 12.
    Super Nova Überblick Supernova  Alle Versionen von Hub und Link (Eliminierung von Satelliten)  Extended Supernova  Views mit Regeln  Delivery  Star Schema View  Denormalisierung  Anforderungsgetriebe n Source: Rick van der Lans sponsored by Cisco Centennium: http://www.cisco.com/c/dam/en_us/services/enterprise-it-services/data-virtualization/documents/whitepaper-cisco-datavaul.pdf
  • 13.
    Supernova –Views Source: Rickvan der Lans sponsored by Cisco Centennium: http://www.cisco.com/c/dam/en_us/services/enterprise-it-services/data-virtualization/documents/whitepaper-cisco-datavaul.pdf
  • 14.
    Supernova – Views Source:Rick van der Lans sponsored by Cisco Centennium: http://www.cisco.com/c/dam/en_us/services/enterprise-it-services/data-virtualization/documents/whitepaper-cisco-datavaul.pdf
  • 15.
    Supernova – Views Source:Rick van der Lans sponsored by Cisco Centennium: http://www.cisco.com/c/dam/en_us/services/enterprise-it-services/data-virtualization/documents/whitepaper-cisco-datavaul.pdf
  • 16.
    Supernova – Views Source:Rick van der Lans sponsored by Cisco Centennium: http://www.cisco.com/c/dam/en_us/services/enterprise-it-services/data-virtualization/documents/whitepaper-cisco-datavaul.pdf
  • 17.
    Supernova – Views Source:Rick van der Lans sponsored by Cisco Centennium: http://www.cisco.com/c/dam/en_us/services/enterprise-it-services/data-virtualization/documents/whitepaper-cisco-datavaul.pdf
  • 18.
    Data Vault vs.Supernova Source: Rick van der Lans sponsored by Cisco Centennium: http://www.cisco.com/c/dam/en_us/services/enterprise-it-services/data-virtualization/documents/whitepaper-cisco-datavaul.pdf
  • 19.
    Supernova + Datenvirtualisierung Modellierung mittels SQL-Views  Bestehendes Know-How  Transiente Datenhaltung  Versionierung / Transparenz über Metadaten  Lineage  Autorisierung  Abhängig vom Hersteller der Virtualisierungssoftware  Supernova Generierbar  Höhere Agilität als bei der Verwendung von herkömmlichen Bewirtschaftungsprozessen  Virtualisierung ermöglicht auch Zugriff auf Legacy- Systeme  ? Vorteile Nachteile
  • 20.
    Linksammlung  Automation  RoelantVos http://roelantvos.com  Quipu http://www.datawarehousemanagement.org/  Wherescape http://wherescape.com  BI-Ready  http://attunity.com  Data Virtualization & Logical Data Warehouse  Mark Beyer http://blogs.gartner.com/merv-adrian/2011/11/03/mark-beyer-father-of-the-logical-data- warehouse-guest-post/  Rick van der Lans http://www.r20.nl/whitepapers.htm  Data Virtuality http://datavirtuality.com/products/logical-data-warehouse/  Cisco http://www.cisco.com/c/en/us/services/enterprise-it-services/data-virtualization.html  Denodo http://www.denodo.com/en  SAS Federation http://www.sas.com/en_us/software/data-management/data-federation.html  Red Hat https://www.redhat.com/en/technologies/jboss-middleware/data-virtualization
  • 21.

Hinweis der Redaktion

  • #6 Analyse von Quelldaten (Profiling) ergibt die Realität der Daten Die Analyse der Anforderungen (Zielmodell) ergibt die Informationen. Im Business Vault muss die Diskrepanz zwischen Informationsbedarf und Datenrealität durch Geschäftsregeln in Informationen transformiert werden. Ein Weiterer Vorteil dieser Transparenz ist die Möglichkeit darauf MDM auf zu setzen um Datenqualität in der Quelle zu lösen