SlideShare ist ein Scribd-Unternehmen logo
1 von 43
www.ise-informatik.de
Logical Data Warehouse
SQL mit Oracle DB und Hadoop
Matthias Fuchs
DWH Architekt
ISE Information Systems Engineering GmbH
Ingo Reisky
Senior Consultant
Opitz Consulting Deutschland GmbH
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 2
Enable
eXtreme
Performance.
ISE Information Systems Engineering
 Gegründet 1991
 Mitarbeiteranzahl: 60
 Hauptsitz in Gräfenberg, Niederlassungen in München und Nürnberg
 Schwerpunkte:
 Oracle Engineered Systems (Exadata / Exalogic / Exalytics)
 Data Warehousing & Business Intelligence
 Oracle DB – Migrationen, Optimierungen, Hochverfügbarkeit
 Managed Service für Datenbanken, BI und Middlewareapplikationen
 Oracle Partner Engineered Systems Award 2013
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 3
Enable
eXtreme
Performance.
Erstes und einziges Exastack Technology Center in
Deutschland in Nürnberg
ISE Oracle Technology Center
Coming soon ODA X5
© OPITZ CONSULTING Deutschland GmbH 2015 Seite 4
Mission
Wir entwickeln gemeinsam mit allen
Branchen Lösungen, die dazu führen,
dass sich diese Organisationen besser
entwickeln als ihr Wettbewerb.
Unsere Dienstleistung erfolgt
partnerschaftlich und ist auf eine
langjährige Zusammenarbeit angelegt.
Leistungsangebot
Business IT Alignment
Business Information Management
Business Process Management
Anwendungsentwicklung
SOA und System-Integration
IT-Infrastruktur-Management
Märkte
Branchenübergreifend
Über 600 Kunden
29%
Industrie / Versorger /
Telekommunikation
29%
Handel / Logistik /
Dienstleistungen
42%
Öffentliche Auftraggeber / Banken und
Versicherungen / Vereine und Verbände
Eckdaten
Gründung 1990
400 Mitarbeiter
9 Standorte
Vorstellung OPITZ CONSULTING
© OPITZ CONSULTING Deutschland GmbH 2015 Seite 5
Wie OPITZ CONSULTING Big Data versteht
 Wir helfen Kunden,
 die Möglichkeiten von Big Data zu verstehen
 Business Cases in ihrem Unternehmen zu erkennen und ganzheitlich unter
Berücksichtigung bestehender Architekturen zu bewerten
 Projekte zielorientiert aufzusetzen und erfolgreich durchzuführen
 Business Cases anhand von Proof of Concepts zu verifizieren.
 Big Data ist bei OPITZ CONSULTING eines der TOP 3
Zukunftsthemen!
Big Data = Alter Hut
• IT-Durchdringung der
Geschäftswelt steigt seit
Beginn
• Mooresche Gesetz gilt
immer noch
OPITZ CONSULTING1990
• Database-focused
Company
• große Datenmengen &
komplexe
Anforderungen
OPITZ CONSULTINGt+25
• Individuallösungen,
wenn Standard nicht
ausreicht
• Kontinuierliche Adaption
neuer IT-Trends
Big Data = Chance
• Prozess- und
Interessenstransparenz
dank Maschine Data
• Wettbewerbsvorteile
dank Kombination
(Mobile+ Big Data +
Cloud + Analytics)
25
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 6
Enable
eXtreme
Performance.
 Matthias Fuchs
- Senior Consultant
Infrastructure&Database
- 10 Jahre Oracle-Erfahrung
- OCP, Exadata Certified
- Focus on DWH, Audit,
Security in Oracle DB and
Oracle Exa Systems
Bio
 Ingo Reisky
- Senior Consultant im
Infrastructure Consulting
bei OPITZ CONSULTING
- Mitglied OC-CC Big Data
- Dipl.-Wirtschaftsingenieur
Univ. Karlsruhe (TH)
- OCP, LPIC-2, RHCT, …
- Fusion MW Spezialist:
Oracle Weblogic Server,
SOA Suite, Enterprise
Manager Cloud Control
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 7
Enable
eXtreme
Performance.
Agenda
 LDW - Logical Data Warehouse
 Big Data SQL Infrastructure
 Sqoop - der Anfang
 Fallbeispiel aus Kundenprojekt
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 8
Enable
eXtreme
Performance.
LDW – Logical Data Warehouse
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 9
Enable
eXtreme
Performance.
Logical Data Warehouse
Gartner Hype Cycle for Information Infrastructure, 2012,
“the Logical Data Warehouse (LDW) is a new data
management architecture for analytics which combines the
strengths of traditional repository warehouses with
alternative data management and access strategy. The
LDW will form a new best practices by the end of 2015.”
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 10
Enable
eXtreme
Performance.
 Repository Management
 Verschiedene Typen u.a. Metadaten
 Konsolidierung
 Data Virtualization
 Virtuelle Daten Schicht
 Distributed Processes
 Aufruf externer Prozesse
 z.B. Bilder oder Content Analyse, aber auch MapReduce
 Cloud
 Auditing statistics and performance Evaluation
 Statistik über Performance
 End User, Applikationen oder Verbindungen
 SLA Management
 Metadataset über erwartete Ausführungenzeiten etc.
 Überwachung und ggf. Änderung der Ausführung
 Taxonomy - Ontology resolution
 a taxonomy “tree” in an ontological “forest”
 Metadata Management
Gartner: Logical Data Warehouse
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 11
Enable
eXtreme
Performance.
 Repository Management
 Verschiedene Typen u.a. Metadaten
 Konsolidierung
 Data Virtualization
 Virtuelle Daten Schicht
 Distributed Processes
 Aufruf externer Prozesse
 z.B. Bilder oder Content Analyse, aber auch MapReduce
 Cloud
 Auditing statistics and performance Evaluation
 Statistik über Performance
 End User, Applikationen oder Verbindungen
 SLA Management
 Metadataset über erwartete Ausführungenzeiten etc.
 Überwachung und ggf. Änderung der Ausführung
 Taxonomy - Ontology resolution
 a taxonomy “tree” in an ontological “forest”
 Metadata Management
Gartner: Logical Data Warehouse
‚Data-to-insight cycle ' schneller
günstiges Framework um neue
Inhalte einzubeziehen
Höhere Flexibilität
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 12
Enable
eXtreme
Performance.
Gartner: Übersicht
Aus Gartner Newsletter Logical Data Warehousing for Big Data
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 13
Enable
eXtreme
Performance.
Big Data SQL Infrastructure
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 14
Enable
eXtreme
Performance.
Logische Implementation
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 15
Enable
eXtreme
Performance.
First LDW Implementationen
SLA Management Audit Management
Virtual.
.
Hadoop
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 16
Enable
eXtreme
Performance.
 Innovation: Oracle Big Data SQL
 Erweitert Oracle SQL für Oracle DB, NoSQL und Hadoop!
Daten aus heterogenen Quellen
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 17
Enable
eXtreme
Performance.
Big Data Sql - Übersicht
Oracle Big Data SQL
Cloudera
Hadoop
NOSQL
R Advanced
Analytics
Exadata
Advanced
Analytics
Advanced
Security
Connectors
ODI
Or BigData Lite VM
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 18
Enable
eXtreme
Performance.
Big Data Systemübersicht
Storage Layer
Filesystem (HDFS)
Resource Management YARN + MapReduce
Processing Layer
Big Data SQL
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 19
Enable
eXtreme
Performance.
Big Data und DB im LDW
ODI, BPM, SOA
Enterprise Metadata
Management
Oracle Big Data
Appliance
Repository Management
Data Virtualization
Distributed Processes
Auditing statistics and performance
SLA Management
Taxonomy - Ontology resolution
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 21
Enable
eXtreme
Performance.
Daten in Hadoop laden
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 22
Enable
eXtreme
Performance.
 Sqoop = SQL- to - Hadoop
 Paralleles kopieren von JDBC <-> HDFS
 MapReduce jobs zum Daten laden/schreiben
Sqoop
DB
HDFS
Map
Reduce
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 23
Enable
eXtreme
Performance.
 OraOOP Guy Harrison team Quest (Dell)
 Ab version 1.4.5 (CDH 5.1)
 Oracle direct path (non-buffered) IO for all reads
 Auf mappers werden Anzahl Blöcke verteilt
 Bei partitionierten Tabellen, kann der Mapper pro Partition arbeiten
Sqoop mit Oracle
ORACLE
TABLE
HDFS HADOOP
MAPPER
ORACLE
SESSION
HADOOP
MAPPER
ORACLE
SESSION
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 24
Enable
eXtreme
Performance.
Sqoop 1 vs. Sqoop 2
Sqoop 1 Sqoop 2
Kerberos Security, RDBMS
connectors, transfer to hive
Jdbc Connection
Client startet Map jobs Service based, DB Treiber
auf dem Server
MAP only MAPReduce
Client mit connection
Details
Vorkonfigurierte
datasources
Durch quest Oracle direct
Treiber implementiert
Oracle direct connector
geplant 1.99.7
(aktuell1.99.5)
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 25
Enable
eXtreme
Performance.
 Auszug aus Roadmap Sqoop 2, Version 1.99.7:
https://cwiki.apache.org/confluence/display/SQOOP/Sqoop+2+Roadmap
 “In this release, let’s focus on developing new connectors and
execution engines.
 HBase connector
 Hive connector
 HCatalog connector (Or is this the same as Hive connector?)
 MySQL fast connector
 PostgreSQL fast connector
 Oracle fast connector
 Netezza connector
 Teradata connector (?)
 Spark execution engine”
Ausblick: Sqoop 2 Roadmap
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 26
Enable
eXtreme
Performance.
 Oracle Data Integrator
 Sqoop loads beide Richtungen
 Integration Knowledge Modules
 Oracle SQL Connector
 External Table
 Hive oder HDFS to Oracle
 Oracle Loader for Hadoop
 Load data to Oracle
 Prepare data and load to Oracle
https://docs.oracle.com/cd/E57371_01/doc.41/e57352/start.htm#BDCUG261
Big Data Connector
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 27
Enable
eXtreme
Performance.
Oracle SQLConnector
http://www.oracle.com/us/products/database/big-data-connectors/certifications/index.html
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 28
Enable
eXtreme
Performance.
 Oracle Change Data Capture
 Supported in 11.2 – but not recommended by Oracle
 Desupported in 12.1
 Oracle Golden Gate
 1. RDBMS to HIVE
 2. RDBMS to Flume
 3. RDBMS to HDFS
 Andere Hersteller:
 (Dell) Quest SharePlex – Auslesen redologs
 (VMWare) Continuent Tungsten – benutzt CDC im Hintergrund
 Libelle
Real Time
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 29
Enable
eXtreme
Performance.
Noch mehr SQL auf Hadoop
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 30
Enable
eXtreme
Performance.
 Zahlreiche Möglichkeiten, mit „R“ strukturierte Daten abzufragen
 Verbindung mit R gegen Oracle DB
 Package ROracle (mit Oracle Client/Instant Client)
 http://www.oracle.com/technetwork/database/database-
technologies/r/roracle/overview/index.html
 Verbindung mit R gegen Apache Hadoop oder Hive
 Packages in RHadoop (R gegen HDFS, HBase, …):
https://github.com/RevolutionAnalytics/RHadoop/wiki
 RHIPE: Integrierte R- und Hadoop-Umgebung
 Package RHive: HiveQL (HQL, ähnlich SQL) gegen Hive
 R in der Oracle DB oder In Hive:
 Advanced Analytics Option (AAO)
 http://www.oracle.com/technetwork/database/options/advanced-
analytics/overview/index.html
R und SQL
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 31
Enable
eXtreme
Performance.
 Apache Spark ist eine alternative Execution Engine für Hadoop
(neben MapReduce und Tez) oder Stand-alone: schnell!
 Spark SQL: Modul für den Zugriff auf strukturierte Daten
 Abfrage aus Spark als “Resilient Distributed Datasets” (RDD):
SchemaRDDs als einheitliches Interface, mit integrierten APIs für
Python, Scala und Java
 Auch für die Abfrage aus Hive-Tabellen, Parquet- und JSON-Dateien
 Enthält Server-Modus für JDBC- und ODBC-Verbindungen
 Unterstützt Ausfalltoleranz während laufender Abfragen nach dem
RDD-Modell und skalliert auch für große Jobs: Eignung für interaktive
und langlaufende Abfragen (historische Daten)
 Mehr unter: https://spark.apache.org/sql/
Spark SQL
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 32
Enable
eXtreme
Performance.
Fallbeispiel aus Kundenprojekt
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 33
Enable
eXtreme
Performance.
 Ziel
 Daten von Servicecalls (OSB) auswerten
 Daten Historisieren
 Feststellen von Anomalien
 Mappen von Strukturierten und Unstrukturierten Daten
 Tabellen/View und Datei Import
 Auswertung mit ausgewählten Werkzeugen
Analyse von Infrastrukturdaten
HDFS
Analytic
output
Weblogs
CC
RDBMS
Flume SQOOP
YARN/MR
• R
• Elasticsearch
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 34
Enable
eXtreme
Performance.
 Wahl der Hadoop Distribution
 Cloudera – Oracle supported
 Ohne -> sehr aufwendig
 Filedaten
 Flume
 Weblogic und Apache Logs
 Gut dokumentiert im Netz
 Ggf. Realtime Auswertung mit Elasticsearch or Solr
 Hive
 CDH 5.1
 OCRFile Format
Vorbereitung
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 35
Enable
eXtreme
Performance.
 Optimized Row Columnar File Format
 light-weight indexes bereits im Fileformat
 block-mode compression auf basis des Datentyps
Hive ORCFile
TPC-DS Scale 500 Dataset GB, Hortonworks
585
• Encoded Text
• CSV File
505
• RCFile
• Record Columnar File
221
• Parquet
• Columnar Storage Format, impala
131
• ORCFile
• Hive
Größenvergleich
über
verschiedene
Typen
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 36
Enable
eXtreme
Performance.
 Teil 1 Datenladen
 Teil 2
Create Big Data SQL Layer
Ablauf Datenintegration
DB
HDFS
HIVE
Oracle Big Data SQL
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 37
Enable
eXtreme
Performance.
Prozess Teil 1
DB
HDFS
HIVE
• Start sqoop job to HDFS
• Create external table on
HDFS Files
• insert as select in hive ocr
data table
• Import parallel 1, da view daten
• Kein primary key, keine parallelen MapReduce Prozesse
• Direct read notwendig, da sonst tmp Tablespace zu klein
• Start mit sqoop2, ende mit sqoop1 inklusiv Optimierung
• ODI statt oozie
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 38
Enable
eXtreme
Performance.
 Suche Tabelle in Hive aus DB
 select table_name, input_format, Location from ALL_HIVE_tables
where table_name like '%oem%';
Prozess Teil 2
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 39
Enable
eXtreme
Performance.
 Create Table in DB (nur in Test VM)
 DDL mit CREATE_EXTDDL_FOR_HIVE erzeugen
 DDL ausführen
Prozess Teil 2
dbms_hadoop.create_extddl_for_hive(
CLUSTER_ID=>'bigdatalite',
DB_NAME=>'default',
HIVE_TABLE_NAME=>'oem_data',
HIVE_PARTITION=>FALSE,
TABLE_NAME=>'oem_data',
PERFORM_DDL=>FALSE,
TEXT_OF_DDL=>DDLout
);
CREATE TABLE OEM_DATA ( target_name
VARCHAR2(4000), target_guid …..
key_value6 VARCHAR2(4000),
collection_timestamp VARCHAR2(4000))
ORGANIZATION EXTERNAL
(TYPE ORACLE_HIVE
DEFAULT DIRECTORY DEFAULT_DIR
ACCESS PARAMETERS (
com.oracle.bigdata.cluster=bigdatalite
com.oracle.bigdata.tablename=default.oem_
data)
) ;
DDL Erzeugen
DDL Ausführen
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 40
Enable
eXtreme
Performance.
Ausführungsplan
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 41
Enable
eXtreme
Performance.
 Daten für einen Tag
 ~ 239.634.928 Zeilen/12 Spalten
 TXT Files
~100 G unkomprimiert
Ladezeit ca. 1h aus CC DB
 OCR Files in hive
~ 27 M komprimiert
~ Ladezeit ca. 30 Minuten
Ergebnisse: Laden der Daten
Type Größe Select
count
Where
Oem_data BigDataSQL 2,8 MB
2,1 Mio
11s 8s
Oem_data local
kopiert
Oracle 558 MB
2,1 Mio
0,5s 0,5s
Oem_data Hive 57s 50s
Teil 1
Teil 2
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 42
Enable
eXtreme
Performance.
 Only data retrieval (TABLE ACCESS FULL und Filter ) werden
offloaded!
 Datenbearbeitung im DB Layer
 GROUP BY, ORDER BY, JOIN, PL/SQL etc
 BigDataSQL 2.0 (Aggregation in Hadoop?)
 Alternativ Connect über ODBC
Lastverteilung Big Data SQL
Tool Beschreibung Decompress
CPU
Filtering CPU Datatype
Conversion
Sqoop Hadoop Oracle Oracle
Oracle SQL
Connector
für HDFS
Text Dateien HDFS
oder DataPump
HDFS
Oracle Oracle
Big Data
SQL
12c
Exadata&BDA
Hadoop Hadoop Hadoop
ODBC Hadoop Hadoop Oracle
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 43
Enable
eXtreme
Performance.
Zusammenfassung
Exadata €€€
DB/EMC €€€
Integration Layer
Exadata €
DB/EMC €
Hadoop
€
Vorher:
Nacher:
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 44
Enable
eXtreme
Performance.
Q & A

Weitere ähnliche Inhalte

Was ist angesagt?

MT AG Präsentation Rapid Application Development mit APEX 5
MT AG Präsentation Rapid Application Development mit APEX 5MT AG Präsentation Rapid Application Development mit APEX 5
MT AG Präsentation Rapid Application Development mit APEX 5MT AG
 
Endress + Hauser: Echtzeit Performance Monitoring erfolgreich umgesetzt
Endress + Hauser: Echtzeit Performance Monitoring erfolgreich umgesetzt Endress + Hauser: Echtzeit Performance Monitoring erfolgreich umgesetzt
Endress + Hauser: Echtzeit Performance Monitoring erfolgreich umgesetzt Dynatrace
 
MT AG Data Vault Generator
MT AG Data Vault GeneratorMT AG Data Vault Generator
MT AG Data Vault GeneratorMT AG
 
Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...
Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...
Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...Praxistage
 
SAP SuccessFactors Architektur und Administration
SAP SuccessFactors Architektur und AdministrationSAP SuccessFactors Architektur und Administration
SAP SuccessFactors Architektur und AdministrationMichael Mueller
 
Experten webinar auf dem steilen weg zur digitalen versicherung
Experten webinar    auf dem steilen weg zur digitalen versicherungExperten webinar    auf dem steilen weg zur digitalen versicherung
Experten webinar auf dem steilen weg zur digitalen versicherungcamunda services GmbH
 
Integration of BI Publisher in ADF applications
Integration of BI Publisher in ADF applicationsIntegration of BI Publisher in ADF applications
Integration of BI Publisher in ADF applicationsAndreas Koop
 
Implementierung von SAP SuccessFactors Lösungen
Implementierung von SAP SuccessFactors Lösungen Implementierung von SAP SuccessFactors Lösungen
Implementierung von SAP SuccessFactors Lösungen Michael Mueller
 
Hinter die Marketing-Kulissen geschaut - Was bedeutet der Cloud-Trend für die...
Hinter die Marketing-Kulissen geschaut - Was bedeutet der Cloud-Trend für die...Hinter die Marketing-Kulissen geschaut - Was bedeutet der Cloud-Trend für die...
Hinter die Marketing-Kulissen geschaut - Was bedeutet der Cloud-Trend für die...OPITZ CONSULTING Deutschland
 
Visualisierung von fachlichen Informationen mit Oracle ADF
Visualisierung von fachlichen Informationen mit Oracle ADFVisualisierung von fachlichen Informationen mit Oracle ADF
Visualisierung von fachlichen Informationen mit Oracle ADFUlrich Gerkmann-Bartels
 
Helmut Rainer (BWT), Michael Schober (ECOSOL)
Helmut Rainer (BWT), Michael Schober (ECOSOL)Helmut Rainer (BWT), Michael Schober (ECOSOL)
Helmut Rainer (BWT), Michael Schober (ECOSOL)Praxistage
 
Agile Business Intelligence in der Praxis - Scrum im DWH-Umfeld
Agile Business Intelligence in der Praxis - Scrum im DWH-UmfeldAgile Business Intelligence in der Praxis - Scrum im DWH-Umfeld
Agile Business Intelligence in der Praxis - Scrum im DWH-UmfeldOPITZ CONSULTING Deutschland
 
Ing. Peter Klein (ÖBB), Carlo Wunrau (Schiffl Austria)
Ing. Peter Klein (ÖBB), Carlo Wunrau (Schiffl Austria)Ing. Peter Klein (ÖBB), Carlo Wunrau (Schiffl Austria)
Ing. Peter Klein (ÖBB), Carlo Wunrau (Schiffl Austria)Praxistage
 
Choice-o-mat: Entscheidungshilfe für Oracle Entwicklungswerkzeuge
Choice-o-mat: Entscheidungshilfe für Oracle Entwicklungswerkzeuge Choice-o-mat: Entscheidungshilfe für Oracle Entwicklungswerkzeuge
Choice-o-mat: Entscheidungshilfe für Oracle Entwicklungswerkzeuge Ulrich Gerkmann-Bartels
 
MT AG 8 Gute Gründe warum Forms zu APEX
MT AG 8 Gute Gründe warum Forms zu APEXMT AG 8 Gute Gründe warum Forms zu APEX
MT AG 8 Gute Gründe warum Forms zu APEXNiels de Bruijn
 
Produktorganisation-Abgrenzung, Idealbild, Realität -
Produktorganisation-Abgrenzung, Idealbild, Realität -Produktorganisation-Abgrenzung, Idealbild, Realität -
Produktorganisation-Abgrenzung, Idealbild, Realität -Ayelt Komus
 
MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...
MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...
MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...Niels de Bruijn
 

Was ist angesagt? (20)

DevOps und ITIL: Waffenbrüder oder Feinde?
DevOps und ITIL: Waffenbrüder oder Feinde?DevOps und ITIL: Waffenbrüder oder Feinde?
DevOps und ITIL: Waffenbrüder oder Feinde?
 
DevOps Meetup Freiburg - DevOps in Practice
DevOps Meetup Freiburg - DevOps in PracticeDevOps Meetup Freiburg - DevOps in Practice
DevOps Meetup Freiburg - DevOps in Practice
 
MT AG Präsentation Rapid Application Development mit APEX 5
MT AG Präsentation Rapid Application Development mit APEX 5MT AG Präsentation Rapid Application Development mit APEX 5
MT AG Präsentation Rapid Application Development mit APEX 5
 
Endress + Hauser: Echtzeit Performance Monitoring erfolgreich umgesetzt
Endress + Hauser: Echtzeit Performance Monitoring erfolgreich umgesetzt Endress + Hauser: Echtzeit Performance Monitoring erfolgreich umgesetzt
Endress + Hauser: Echtzeit Performance Monitoring erfolgreich umgesetzt
 
MT AG Data Vault Generator
MT AG Data Vault GeneratorMT AG Data Vault Generator
MT AG Data Vault Generator
 
Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...
Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...
Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...
 
SAP SuccessFactors Architektur und Administration
SAP SuccessFactors Architektur und AdministrationSAP SuccessFactors Architektur und Administration
SAP SuccessFactors Architektur und Administration
 
Experten webinar auf dem steilen weg zur digitalen versicherung
Experten webinar    auf dem steilen weg zur digitalen versicherungExperten webinar    auf dem steilen weg zur digitalen versicherung
Experten webinar auf dem steilen weg zur digitalen versicherung
 
[DE] Staffware Process Suite – Delivering the Process of Business | Dr. Ulric...
[DE] Staffware Process Suite – Delivering the Process of Business | Dr. Ulric...[DE] Staffware Process Suite – Delivering the Process of Business | Dr. Ulric...
[DE] Staffware Process Suite – Delivering the Process of Business | Dr. Ulric...
 
Integration of BI Publisher in ADF applications
Integration of BI Publisher in ADF applicationsIntegration of BI Publisher in ADF applications
Integration of BI Publisher in ADF applications
 
Implementierung von SAP SuccessFactors Lösungen
Implementierung von SAP SuccessFactors Lösungen Implementierung von SAP SuccessFactors Lösungen
Implementierung von SAP SuccessFactors Lösungen
 
Hinter die Marketing-Kulissen geschaut - Was bedeutet der Cloud-Trend für die...
Hinter die Marketing-Kulissen geschaut - Was bedeutet der Cloud-Trend für die...Hinter die Marketing-Kulissen geschaut - Was bedeutet der Cloud-Trend für die...
Hinter die Marketing-Kulissen geschaut - Was bedeutet der Cloud-Trend für die...
 
Visualisierung von fachlichen Informationen mit Oracle ADF
Visualisierung von fachlichen Informationen mit Oracle ADFVisualisierung von fachlichen Informationen mit Oracle ADF
Visualisierung von fachlichen Informationen mit Oracle ADF
 
Helmut Rainer (BWT), Michael Schober (ECOSOL)
Helmut Rainer (BWT), Michael Schober (ECOSOL)Helmut Rainer (BWT), Michael Schober (ECOSOL)
Helmut Rainer (BWT), Michael Schober (ECOSOL)
 
Agile Business Intelligence in der Praxis - Scrum im DWH-Umfeld
Agile Business Intelligence in der Praxis - Scrum im DWH-UmfeldAgile Business Intelligence in der Praxis - Scrum im DWH-Umfeld
Agile Business Intelligence in der Praxis - Scrum im DWH-Umfeld
 
Ing. Peter Klein (ÖBB), Carlo Wunrau (Schiffl Austria)
Ing. Peter Klein (ÖBB), Carlo Wunrau (Schiffl Austria)Ing. Peter Klein (ÖBB), Carlo Wunrau (Schiffl Austria)
Ing. Peter Klein (ÖBB), Carlo Wunrau (Schiffl Austria)
 
Choice-o-mat: Entscheidungshilfe für Oracle Entwicklungswerkzeuge
Choice-o-mat: Entscheidungshilfe für Oracle Entwicklungswerkzeuge Choice-o-mat: Entscheidungshilfe für Oracle Entwicklungswerkzeuge
Choice-o-mat: Entscheidungshilfe für Oracle Entwicklungswerkzeuge
 
MT AG 8 Gute Gründe warum Forms zu APEX
MT AG 8 Gute Gründe warum Forms zu APEXMT AG 8 Gute Gründe warum Forms zu APEX
MT AG 8 Gute Gründe warum Forms zu APEX
 
Produktorganisation-Abgrenzung, Idealbild, Realität -
Produktorganisation-Abgrenzung, Idealbild, Realität -Produktorganisation-Abgrenzung, Idealbild, Realität -
Produktorganisation-Abgrenzung, Idealbild, Realität -
 
MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...
MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...
MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...
 

Ähnlich wie Logical Data Warehouse - SQL mit Oracle DB und Hadoop

Oracle Open World 2009 Review V1.6
Oracle Open World 2009 Review V1.6Oracle Open World 2009 Review V1.6
Oracle Open World 2009 Review V1.6Torsten Winterberg
 
Oracle Database 12c Release 2
Oracle Database 12c Release 2 Oracle Database 12c Release 2
Oracle Database 12c Release 2 oraclebudb
 
Überblick zu Oracle Database 12c Release 2
Überblick zu Oracle Database 12c Release 2Überblick zu Oracle Database 12c Release 2
Überblick zu Oracle Database 12c Release 2Ulrike Schwinn
 
Big Data Konnektivität
Big Data KonnektivitätBig Data Konnektivität
Big Data KonnektivitätTrivadis
 
Oracle Technology Monthly Oktober 2017
Oracle Technology Monthly Oktober 2017Oracle Technology Monthly Oktober 2017
Oracle Technology Monthly Oktober 2017oraclebudb
 
Webinar - Sehr empfehlenswert: wie man aus Daten durch maschinelles Lernen We...
Webinar - Sehr empfehlenswert: wie man aus Daten durch maschinelles Lernen We...Webinar - Sehr empfehlenswert: wie man aus Daten durch maschinelles Lernen We...
Webinar - Sehr empfehlenswert: wie man aus Daten durch maschinelles Lernen We...Cloudera, Inc.
 
Data Lake Architektur: Von den Anforderungen zur Technologie
Data Lake Architektur: Von den Anforderungen zur TechnologieData Lake Architektur: Von den Anforderungen zur Technologie
Data Lake Architektur: Von den Anforderungen zur TechnologieJens Albrecht
 
Überblick Oracle Datenbank 12c
Überblick Oracle Datenbank 12cÜberblick Oracle Datenbank 12c
Überblick Oracle Datenbank 12cIleana Somesan
 
20181120_DOAG_OracleNoSQLDB_KPatenge
20181120_DOAG_OracleNoSQLDB_KPatenge20181120_DOAG_OracleNoSQLDB_KPatenge
20181120_DOAG_OracleNoSQLDB_KPatengeKarin Patenge
 
Microprofile-Anwendungen mit Quarkus
Microprofile-Anwendungen mit Quarkus Microprofile-Anwendungen mit Quarkus
Microprofile-Anwendungen mit Quarkus gedoplan
 
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...BOSTON Server & Storage Solutions GmbH
 
Überblick: 18c und Autonomous Data Warehouse Cloud (ADWC)
Überblick: 18c und Autonomous Data Warehouse Cloud (ADWC)Überblick: 18c und Autonomous Data Warehouse Cloud (ADWC)
Überblick: 18c und Autonomous Data Warehouse Cloud (ADWC)Ulrike Schwinn
 
20181210_ITTage2018_OracleNoSQLDB_KPatenge
20181210_ITTage2018_OracleNoSQLDB_KPatenge20181210_ITTage2018_OracleNoSQLDB_KPatenge
20181210_ITTage2018_OracleNoSQLDB_KPatengeKarin Patenge
 
Gewinnung von OPEN SOURCE Techniken für junge Unternehmen
Gewinnung von OPEN SOURCE Techniken für junge UnternehmenGewinnung von OPEN SOURCE Techniken für junge Unternehmen
Gewinnung von OPEN SOURCE Techniken für junge UnternehmenBjoern Reinhold
 
Dataservices - Data Processing mit Microservices
Dataservices - Data Processing mit MicroservicesDataservices - Data Processing mit Microservices
Dataservices - Data Processing mit MicroservicesQAware GmbH
 
20190604_DOAGDatabase2019_OracleNoSQLDB_for_DBAs
20190604_DOAGDatabase2019_OracleNoSQLDB_for_DBAs20190604_DOAGDatabase2019_OracleNoSQLDB_for_DBAs
20190604_DOAGDatabase2019_OracleNoSQLDB_for_DBAsKarin Patenge
 
WS: Uhl, Lisog - Deutsche Wolke
WS: Uhl, Lisog - Deutsche WolkeWS: Uhl, Lisog - Deutsche Wolke
WS: Uhl, Lisog - Deutsche WolkeCloudOps Summit
 

Ähnlich wie Logical Data Warehouse - SQL mit Oracle DB und Hadoop (20)

Oracle Open World 2009 Review V1.6
Oracle Open World 2009 Review V1.6Oracle Open World 2009 Review V1.6
Oracle Open World 2009 Review V1.6
 
Oracle Database 12c Release 2
Oracle Database 12c Release 2 Oracle Database 12c Release 2
Oracle Database 12c Release 2
 
Überblick zu Oracle Database 12c Release 2
Überblick zu Oracle Database 12c Release 2Überblick zu Oracle Database 12c Release 2
Überblick zu Oracle Database 12c Release 2
 
Big Data Konnektivität
Big Data KonnektivitätBig Data Konnektivität
Big Data Konnektivität
 
Oracle Technology Monthly Oktober 2017
Oracle Technology Monthly Oktober 2017Oracle Technology Monthly Oktober 2017
Oracle Technology Monthly Oktober 2017
 
Webinar - Sehr empfehlenswert: wie man aus Daten durch maschinelles Lernen We...
Webinar - Sehr empfehlenswert: wie man aus Daten durch maschinelles Lernen We...Webinar - Sehr empfehlenswert: wie man aus Daten durch maschinelles Lernen We...
Webinar - Sehr empfehlenswert: wie man aus Daten durch maschinelles Lernen We...
 
Data Lake Architektur: Von den Anforderungen zur Technologie
Data Lake Architektur: Von den Anforderungen zur TechnologieData Lake Architektur: Von den Anforderungen zur Technologie
Data Lake Architektur: Von den Anforderungen zur Technologie
 
Überblick Oracle Datenbank 12c
Überblick Oracle Datenbank 12cÜberblick Oracle Datenbank 12c
Überblick Oracle Datenbank 12c
 
20181120_DOAG_OracleNoSQLDB_KPatenge
20181120_DOAG_OracleNoSQLDB_KPatenge20181120_DOAG_OracleNoSQLDB_KPatenge
20181120_DOAG_OracleNoSQLDB_KPatenge
 
Microprofile-Anwendungen mit Quarkus
Microprofile-Anwendungen mit Quarkus Microprofile-Anwendungen mit Quarkus
Microprofile-Anwendungen mit Quarkus
 
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
 
Kevin Hofer
Kevin HoferKevin Hofer
Kevin Hofer
 
Überblick: 18c und Autonomous Data Warehouse Cloud (ADWC)
Überblick: 18c und Autonomous Data Warehouse Cloud (ADWC)Überblick: 18c und Autonomous Data Warehouse Cloud (ADWC)
Überblick: 18c und Autonomous Data Warehouse Cloud (ADWC)
 
20181210_ITTage2018_OracleNoSQLDB_KPatenge
20181210_ITTage2018_OracleNoSQLDB_KPatenge20181210_ITTage2018_OracleNoSQLDB_KPatenge
20181210_ITTage2018_OracleNoSQLDB_KPatenge
 
Frameworks und Prozessoren
Frameworks und ProzessorenFrameworks und Prozessoren
Frameworks und Prozessoren
 
Gewinnung von OPEN SOURCE Techniken für junge Unternehmen
Gewinnung von OPEN SOURCE Techniken für junge UnternehmenGewinnung von OPEN SOURCE Techniken für junge Unternehmen
Gewinnung von OPEN SOURCE Techniken für junge Unternehmen
 
Dataservices - Data Processing mit Microservices
Dataservices - Data Processing mit MicroservicesDataservices - Data Processing mit Microservices
Dataservices - Data Processing mit Microservices
 
20190604_DOAGDatabase2019_OracleNoSQLDB_for_DBAs
20190604_DOAGDatabase2019_OracleNoSQLDB_for_DBAs20190604_DOAGDatabase2019_OracleNoSQLDB_for_DBAs
20190604_DOAGDatabase2019_OracleNoSQLDB_for_DBAs
 
WS: Uhl, Lisog - Deutsche Wolke
WS: Uhl, Lisog - Deutsche WolkeWS: Uhl, Lisog - Deutsche Wolke
WS: Uhl, Lisog - Deutsche Wolke
 
Enterprise APEX
Enterprise APEXEnterprise APEX
Enterprise APEX
 

Mehr von OPITZ CONSULTING Deutschland

Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"OPITZ CONSULTING Deutschland
 
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der PraxisOC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der PraxisOPITZ CONSULTING Deutschland
 
OC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
OC|Webcast: Oracle Lizenzierung - Virtualisierung und CloudOC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
OC|Webcast: Oracle Lizenzierung - Virtualisierung und CloudOPITZ CONSULTING Deutschland
 
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!OPITZ CONSULTING Deutschland
 
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...OPITZ CONSULTING Deutschland
 
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...OPITZ CONSULTING Deutschland
 
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?OPITZ CONSULTING Deutschland
 
OC|Weekly Talk - Digitales Coaching & Smart Sparring
OC|Weekly Talk - Digitales Coaching & Smart Sparring OC|Weekly Talk - Digitales Coaching & Smart Sparring
OC|Weekly Talk - Digitales Coaching & Smart Sparring OPITZ CONSULTING Deutschland
 
Effiziente Betriebsoptimierung durch Cloud Nutzung
Effiziente Betriebsoptimierung durch Cloud NutzungEffiziente Betriebsoptimierung durch Cloud Nutzung
Effiziente Betriebsoptimierung durch Cloud NutzungOPITZ CONSULTING Deutschland
 

Mehr von OPITZ CONSULTING Deutschland (20)

OC|Webcast: Grundlagen der Oracle Lizenzierung
OC|Webcast: Grundlagen der Oracle LizenzierungOC|Webcast: Grundlagen der Oracle Lizenzierung
OC|Webcast: Grundlagen der Oracle Lizenzierung
 
OC|Webcast "Java heute" vom 28.09.2021
OC|Webcast "Java heute" vom 28.09.2021OC|Webcast "Java heute" vom 28.09.2021
OC|Webcast "Java heute" vom 28.09.2021
 
OC|Webcast "Java heute" vom 24.08.2021
OC|Webcast "Java heute" vom 24.08.2021OC|Webcast "Java heute" vom 24.08.2021
OC|Webcast "Java heute" vom 24.08.2021
 
OC|Webcast "Daten wirklich nutzen"
OC|Webcast "Daten wirklich nutzen"OC|Webcast "Daten wirklich nutzen"
OC|Webcast "Daten wirklich nutzen"
 
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
 
OC|Webcast "Willkommen in der Cloud!"
OC|Webcast "Willkommen in der Cloud!"OC|Webcast "Willkommen in der Cloud!"
OC|Webcast "Willkommen in der Cloud!"
 
OC|Webcast "Die neue Welt der Virtualisierung"
OC|Webcast "Die neue Welt der Virtualisierung"OC|Webcast "Die neue Welt der Virtualisierung"
OC|Webcast "Die neue Welt der Virtualisierung"
 
10 Thesen zur professionellen Softwareentwicklung
10 Thesen zur professionellen Softwareentwicklung10 Thesen zur professionellen Softwareentwicklung
10 Thesen zur professionellen Softwareentwicklung
 
OC|Webcast: Oracle Lizenzierung - Lizenznews 2021
OC|Webcast: Oracle Lizenzierung - Lizenznews 2021OC|Webcast: Oracle Lizenzierung - Lizenznews 2021
OC|Webcast: Oracle Lizenzierung - Lizenznews 2021
 
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der PraxisOC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
 
OC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
OC|Webcast: Oracle Lizenzierung - Virtualisierung und CloudOC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
OC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
 
OC|Webcast: Grundlagen der Oracle-Lizenzierung
OC|Webcast: Grundlagen der Oracle-LizenzierungOC|Webcast: Grundlagen der Oracle-Lizenzierung
OC|Webcast: Grundlagen der Oracle-Lizenzierung
 
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
 
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
 
OC|Weekly Talk The Power of DevOps…
OC|Weekly Talk  The Power of DevOps…OC|Weekly Talk  The Power of DevOps…
OC|Weekly Talk The Power of DevOps…
 
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
 
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
 
OC|Weekly Talk - Digitales Coaching & Smart Sparring
OC|Weekly Talk - Digitales Coaching & Smart Sparring OC|Weekly Talk - Digitales Coaching & Smart Sparring
OC|Weekly Talk - Digitales Coaching & Smart Sparring
 
OC|Weekly Talk - Beratung remote
OC|Weekly Talk - Beratung remoteOC|Weekly Talk - Beratung remote
OC|Weekly Talk - Beratung remote
 
Effiziente Betriebsoptimierung durch Cloud Nutzung
Effiziente Betriebsoptimierung durch Cloud NutzungEffiziente Betriebsoptimierung durch Cloud Nutzung
Effiziente Betriebsoptimierung durch Cloud Nutzung
 

Logical Data Warehouse - SQL mit Oracle DB und Hadoop

  • 1. www.ise-informatik.de Logical Data Warehouse SQL mit Oracle DB und Hadoop Matthias Fuchs DWH Architekt ISE Information Systems Engineering GmbH Ingo Reisky Senior Consultant Opitz Consulting Deutschland GmbH
  • 2. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 2 Enable eXtreme Performance. ISE Information Systems Engineering  Gegründet 1991  Mitarbeiteranzahl: 60  Hauptsitz in Gräfenberg, Niederlassungen in München und Nürnberg  Schwerpunkte:  Oracle Engineered Systems (Exadata / Exalogic / Exalytics)  Data Warehousing & Business Intelligence  Oracle DB – Migrationen, Optimierungen, Hochverfügbarkeit  Managed Service für Datenbanken, BI und Middlewareapplikationen  Oracle Partner Engineered Systems Award 2013
  • 3. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 3 Enable eXtreme Performance. Erstes und einziges Exastack Technology Center in Deutschland in Nürnberg ISE Oracle Technology Center Coming soon ODA X5
  • 4. © OPITZ CONSULTING Deutschland GmbH 2015 Seite 4 Mission Wir entwickeln gemeinsam mit allen Branchen Lösungen, die dazu führen, dass sich diese Organisationen besser entwickeln als ihr Wettbewerb. Unsere Dienstleistung erfolgt partnerschaftlich und ist auf eine langjährige Zusammenarbeit angelegt. Leistungsangebot Business IT Alignment Business Information Management Business Process Management Anwendungsentwicklung SOA und System-Integration IT-Infrastruktur-Management Märkte Branchenübergreifend Über 600 Kunden 29% Industrie / Versorger / Telekommunikation 29% Handel / Logistik / Dienstleistungen 42% Öffentliche Auftraggeber / Banken und Versicherungen / Vereine und Verbände Eckdaten Gründung 1990 400 Mitarbeiter 9 Standorte Vorstellung OPITZ CONSULTING
  • 5. © OPITZ CONSULTING Deutschland GmbH 2015 Seite 5 Wie OPITZ CONSULTING Big Data versteht  Wir helfen Kunden,  die Möglichkeiten von Big Data zu verstehen  Business Cases in ihrem Unternehmen zu erkennen und ganzheitlich unter Berücksichtigung bestehender Architekturen zu bewerten  Projekte zielorientiert aufzusetzen und erfolgreich durchzuführen  Business Cases anhand von Proof of Concepts zu verifizieren.  Big Data ist bei OPITZ CONSULTING eines der TOP 3 Zukunftsthemen! Big Data = Alter Hut • IT-Durchdringung der Geschäftswelt steigt seit Beginn • Mooresche Gesetz gilt immer noch OPITZ CONSULTING1990 • Database-focused Company • große Datenmengen & komplexe Anforderungen OPITZ CONSULTINGt+25 • Individuallösungen, wenn Standard nicht ausreicht • Kontinuierliche Adaption neuer IT-Trends Big Data = Chance • Prozess- und Interessenstransparenz dank Maschine Data • Wettbewerbsvorteile dank Kombination (Mobile+ Big Data + Cloud + Analytics) 25
  • 6. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 6 Enable eXtreme Performance.  Matthias Fuchs - Senior Consultant Infrastructure&Database - 10 Jahre Oracle-Erfahrung - OCP, Exadata Certified - Focus on DWH, Audit, Security in Oracle DB and Oracle Exa Systems Bio  Ingo Reisky - Senior Consultant im Infrastructure Consulting bei OPITZ CONSULTING - Mitglied OC-CC Big Data - Dipl.-Wirtschaftsingenieur Univ. Karlsruhe (TH) - OCP, LPIC-2, RHCT, … - Fusion MW Spezialist: Oracle Weblogic Server, SOA Suite, Enterprise Manager Cloud Control
  • 7. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 7 Enable eXtreme Performance. Agenda  LDW - Logical Data Warehouse  Big Data SQL Infrastructure  Sqoop - der Anfang  Fallbeispiel aus Kundenprojekt
  • 8. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 8 Enable eXtreme Performance. LDW – Logical Data Warehouse
  • 9. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 9 Enable eXtreme Performance. Logical Data Warehouse Gartner Hype Cycle for Information Infrastructure, 2012, “the Logical Data Warehouse (LDW) is a new data management architecture for analytics which combines the strengths of traditional repository warehouses with alternative data management and access strategy. The LDW will form a new best practices by the end of 2015.”
  • 10. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 10 Enable eXtreme Performance.  Repository Management  Verschiedene Typen u.a. Metadaten  Konsolidierung  Data Virtualization  Virtuelle Daten Schicht  Distributed Processes  Aufruf externer Prozesse  z.B. Bilder oder Content Analyse, aber auch MapReduce  Cloud  Auditing statistics and performance Evaluation  Statistik über Performance  End User, Applikationen oder Verbindungen  SLA Management  Metadataset über erwartete Ausführungenzeiten etc.  Überwachung und ggf. Änderung der Ausführung  Taxonomy - Ontology resolution  a taxonomy “tree” in an ontological “forest”  Metadata Management Gartner: Logical Data Warehouse
  • 11. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 11 Enable eXtreme Performance.  Repository Management  Verschiedene Typen u.a. Metadaten  Konsolidierung  Data Virtualization  Virtuelle Daten Schicht  Distributed Processes  Aufruf externer Prozesse  z.B. Bilder oder Content Analyse, aber auch MapReduce  Cloud  Auditing statistics and performance Evaluation  Statistik über Performance  End User, Applikationen oder Verbindungen  SLA Management  Metadataset über erwartete Ausführungenzeiten etc.  Überwachung und ggf. Änderung der Ausführung  Taxonomy - Ontology resolution  a taxonomy “tree” in an ontological “forest”  Metadata Management Gartner: Logical Data Warehouse ‚Data-to-insight cycle ' schneller günstiges Framework um neue Inhalte einzubeziehen Höhere Flexibilität
  • 12. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 12 Enable eXtreme Performance. Gartner: Übersicht Aus Gartner Newsletter Logical Data Warehousing for Big Data
  • 13. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 13 Enable eXtreme Performance. Big Data SQL Infrastructure
  • 14. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 14 Enable eXtreme Performance. Logische Implementation
  • 15. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 15 Enable eXtreme Performance. First LDW Implementationen SLA Management Audit Management Virtual. . Hadoop
  • 16. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 16 Enable eXtreme Performance.  Innovation: Oracle Big Data SQL  Erweitert Oracle SQL für Oracle DB, NoSQL und Hadoop! Daten aus heterogenen Quellen
  • 17. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 17 Enable eXtreme Performance. Big Data Sql - Übersicht Oracle Big Data SQL Cloudera Hadoop NOSQL R Advanced Analytics Exadata Advanced Analytics Advanced Security Connectors ODI Or BigData Lite VM
  • 18. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 18 Enable eXtreme Performance. Big Data Systemübersicht Storage Layer Filesystem (HDFS) Resource Management YARN + MapReduce Processing Layer Big Data SQL
  • 19. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 19 Enable eXtreme Performance. Big Data und DB im LDW ODI, BPM, SOA Enterprise Metadata Management Oracle Big Data Appliance Repository Management Data Virtualization Distributed Processes Auditing statistics and performance SLA Management Taxonomy - Ontology resolution
  • 20. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 21 Enable eXtreme Performance. Daten in Hadoop laden
  • 21. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 22 Enable eXtreme Performance.  Sqoop = SQL- to - Hadoop  Paralleles kopieren von JDBC <-> HDFS  MapReduce jobs zum Daten laden/schreiben Sqoop DB HDFS Map Reduce
  • 22. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 23 Enable eXtreme Performance.  OraOOP Guy Harrison team Quest (Dell)  Ab version 1.4.5 (CDH 5.1)  Oracle direct path (non-buffered) IO for all reads  Auf mappers werden Anzahl Blöcke verteilt  Bei partitionierten Tabellen, kann der Mapper pro Partition arbeiten Sqoop mit Oracle ORACLE TABLE HDFS HADOOP MAPPER ORACLE SESSION HADOOP MAPPER ORACLE SESSION
  • 23. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 24 Enable eXtreme Performance. Sqoop 1 vs. Sqoop 2 Sqoop 1 Sqoop 2 Kerberos Security, RDBMS connectors, transfer to hive Jdbc Connection Client startet Map jobs Service based, DB Treiber auf dem Server MAP only MAPReduce Client mit connection Details Vorkonfigurierte datasources Durch quest Oracle direct Treiber implementiert Oracle direct connector geplant 1.99.7 (aktuell1.99.5)
  • 24. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 25 Enable eXtreme Performance.  Auszug aus Roadmap Sqoop 2, Version 1.99.7: https://cwiki.apache.org/confluence/display/SQOOP/Sqoop+2+Roadmap  “In this release, let’s focus on developing new connectors and execution engines.  HBase connector  Hive connector  HCatalog connector (Or is this the same as Hive connector?)  MySQL fast connector  PostgreSQL fast connector  Oracle fast connector  Netezza connector  Teradata connector (?)  Spark execution engine” Ausblick: Sqoop 2 Roadmap
  • 25. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 26 Enable eXtreme Performance.  Oracle Data Integrator  Sqoop loads beide Richtungen  Integration Knowledge Modules  Oracle SQL Connector  External Table  Hive oder HDFS to Oracle  Oracle Loader for Hadoop  Load data to Oracle  Prepare data and load to Oracle https://docs.oracle.com/cd/E57371_01/doc.41/e57352/start.htm#BDCUG261 Big Data Connector
  • 26. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 27 Enable eXtreme Performance. Oracle SQLConnector http://www.oracle.com/us/products/database/big-data-connectors/certifications/index.html
  • 27. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 28 Enable eXtreme Performance.  Oracle Change Data Capture  Supported in 11.2 – but not recommended by Oracle  Desupported in 12.1  Oracle Golden Gate  1. RDBMS to HIVE  2. RDBMS to Flume  3. RDBMS to HDFS  Andere Hersteller:  (Dell) Quest SharePlex – Auslesen redologs  (VMWare) Continuent Tungsten – benutzt CDC im Hintergrund  Libelle Real Time
  • 28. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 29 Enable eXtreme Performance. Noch mehr SQL auf Hadoop
  • 29. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 30 Enable eXtreme Performance.  Zahlreiche Möglichkeiten, mit „R“ strukturierte Daten abzufragen  Verbindung mit R gegen Oracle DB  Package ROracle (mit Oracle Client/Instant Client)  http://www.oracle.com/technetwork/database/database- technologies/r/roracle/overview/index.html  Verbindung mit R gegen Apache Hadoop oder Hive  Packages in RHadoop (R gegen HDFS, HBase, …): https://github.com/RevolutionAnalytics/RHadoop/wiki  RHIPE: Integrierte R- und Hadoop-Umgebung  Package RHive: HiveQL (HQL, ähnlich SQL) gegen Hive  R in der Oracle DB oder In Hive:  Advanced Analytics Option (AAO)  http://www.oracle.com/technetwork/database/options/advanced- analytics/overview/index.html R und SQL
  • 30. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 31 Enable eXtreme Performance.  Apache Spark ist eine alternative Execution Engine für Hadoop (neben MapReduce und Tez) oder Stand-alone: schnell!  Spark SQL: Modul für den Zugriff auf strukturierte Daten  Abfrage aus Spark als “Resilient Distributed Datasets” (RDD): SchemaRDDs als einheitliches Interface, mit integrierten APIs für Python, Scala und Java  Auch für die Abfrage aus Hive-Tabellen, Parquet- und JSON-Dateien  Enthält Server-Modus für JDBC- und ODBC-Verbindungen  Unterstützt Ausfalltoleranz während laufender Abfragen nach dem RDD-Modell und skalliert auch für große Jobs: Eignung für interaktive und langlaufende Abfragen (historische Daten)  Mehr unter: https://spark.apache.org/sql/ Spark SQL
  • 31. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 32 Enable eXtreme Performance. Fallbeispiel aus Kundenprojekt
  • 32. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 33 Enable eXtreme Performance.  Ziel  Daten von Servicecalls (OSB) auswerten  Daten Historisieren  Feststellen von Anomalien  Mappen von Strukturierten und Unstrukturierten Daten  Tabellen/View und Datei Import  Auswertung mit ausgewählten Werkzeugen Analyse von Infrastrukturdaten HDFS Analytic output Weblogs CC RDBMS Flume SQOOP YARN/MR • R • Elasticsearch
  • 33. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 34 Enable eXtreme Performance.  Wahl der Hadoop Distribution  Cloudera – Oracle supported  Ohne -> sehr aufwendig  Filedaten  Flume  Weblogic und Apache Logs  Gut dokumentiert im Netz  Ggf. Realtime Auswertung mit Elasticsearch or Solr  Hive  CDH 5.1  OCRFile Format Vorbereitung
  • 34. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 35 Enable eXtreme Performance.  Optimized Row Columnar File Format  light-weight indexes bereits im Fileformat  block-mode compression auf basis des Datentyps Hive ORCFile TPC-DS Scale 500 Dataset GB, Hortonworks 585 • Encoded Text • CSV File 505 • RCFile • Record Columnar File 221 • Parquet • Columnar Storage Format, impala 131 • ORCFile • Hive Größenvergleich über verschiedene Typen
  • 35. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 36 Enable eXtreme Performance.  Teil 1 Datenladen  Teil 2 Create Big Data SQL Layer Ablauf Datenintegration DB HDFS HIVE Oracle Big Data SQL
  • 36. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 37 Enable eXtreme Performance. Prozess Teil 1 DB HDFS HIVE • Start sqoop job to HDFS • Create external table on HDFS Files • insert as select in hive ocr data table • Import parallel 1, da view daten • Kein primary key, keine parallelen MapReduce Prozesse • Direct read notwendig, da sonst tmp Tablespace zu klein • Start mit sqoop2, ende mit sqoop1 inklusiv Optimierung • ODI statt oozie
  • 37. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 38 Enable eXtreme Performance.  Suche Tabelle in Hive aus DB  select table_name, input_format, Location from ALL_HIVE_tables where table_name like '%oem%'; Prozess Teil 2
  • 38. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 39 Enable eXtreme Performance.  Create Table in DB (nur in Test VM)  DDL mit CREATE_EXTDDL_FOR_HIVE erzeugen  DDL ausführen Prozess Teil 2 dbms_hadoop.create_extddl_for_hive( CLUSTER_ID=>'bigdatalite', DB_NAME=>'default', HIVE_TABLE_NAME=>'oem_data', HIVE_PARTITION=>FALSE, TABLE_NAME=>'oem_data', PERFORM_DDL=>FALSE, TEXT_OF_DDL=>DDLout ); CREATE TABLE OEM_DATA ( target_name VARCHAR2(4000), target_guid ….. key_value6 VARCHAR2(4000), collection_timestamp VARCHAR2(4000)) ORGANIZATION EXTERNAL (TYPE ORACLE_HIVE DEFAULT DIRECTORY DEFAULT_DIR ACCESS PARAMETERS ( com.oracle.bigdata.cluster=bigdatalite com.oracle.bigdata.tablename=default.oem_ data) ) ; DDL Erzeugen DDL Ausführen
  • 39. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 40 Enable eXtreme Performance. Ausführungsplan
  • 40. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 41 Enable eXtreme Performance.  Daten für einen Tag  ~ 239.634.928 Zeilen/12 Spalten  TXT Files ~100 G unkomprimiert Ladezeit ca. 1h aus CC DB  OCR Files in hive ~ 27 M komprimiert ~ Ladezeit ca. 30 Minuten Ergebnisse: Laden der Daten Type Größe Select count Where Oem_data BigDataSQL 2,8 MB 2,1 Mio 11s 8s Oem_data local kopiert Oracle 558 MB 2,1 Mio 0,5s 0,5s Oem_data Hive 57s 50s Teil 1 Teil 2
  • 41. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 42 Enable eXtreme Performance.  Only data retrieval (TABLE ACCESS FULL und Filter ) werden offloaded!  Datenbearbeitung im DB Layer  GROUP BY, ORDER BY, JOIN, PL/SQL etc  BigDataSQL 2.0 (Aggregation in Hadoop?)  Alternativ Connect über ODBC Lastverteilung Big Data SQL Tool Beschreibung Decompress CPU Filtering CPU Datatype Conversion Sqoop Hadoop Oracle Oracle Oracle SQL Connector für HDFS Text Dateien HDFS oder DataPump HDFS Oracle Oracle Big Data SQL 12c Exadata&BDA Hadoop Hadoop Hadoop ODBC Hadoop Hadoop Oracle
  • 42. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 43 Enable eXtreme Performance. Zusammenfassung Exadata €€€ DB/EMC €€€ Integration Layer Exadata € DB/EMC € Hadoop € Vorher: Nacher:
  • 43. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 44 Enable eXtreme Performance. Q & A