SlideShare ist ein Scribd-Unternehmen logo
1 von 35
Downloaden Sie, um offline zu lesen
株式会社インサイトテクノロジー
宮地 敬史
基幹系データをより早く分析基盤に!
ハイブリッド・データ分析基盤へのスマートな
データ統合
Insight Technologyとは?
コンサルティングサービス ソフトウェア ハードウェア
システム設計~運用まで
データベース総合ソリューション
システム設計~運用まで
データベース総合ソリューション
データベースの様々な課題を
解決する各種ソフトウェア
データベースの様々な課題を
解決する各種ソフトウェア
高性能・低コスト・高信頼性
データベース専用マシン
高性能・低コスト・高信頼性
データベース専用マシン
データベースに関連するナレッジと技術力を追求し、ソフトウェア、ハードウェア、
サービスを最適に組み合わせてお客様に提供する会社です。
高速・低コスト・セキュア なデータベース環境を実現
データベースのアクセス監査ツール(自社開発)
マルチデータベースのリアルタイムレプリケーションツール
次世代型データウェアハウス向け 超高速データベース
Oracle Standard Edition向け DR構築ツール
データベースのパフォーマンス監視・分析ツール(自社開発)
世界最速のデータベース専用高速マシン(自社開発)
2
Agenda
1. ハイブリッドデータ分析基盤の構築 / 課題
2. Attunity社製品のご紹介
3. DEMO
4. 導入事例
1.ハイブリッドデータ分析基盤の構築 / 課題
5
CLOUDSTREAMINGDATA LAKES
ON PREMDATA WAREHOUSE BATCH
最新のデータ分析基盤
6
 デジタルトランスフォーメーション
 データのマネタイズ
 センサーデータ、位置情報、行動ログ等、これまで使用していたデータ
に加えて、基幹系システムで持っている顧客データ、販売データも使用
して更に高度な分析、施策を打ちたい!
 連携するデータはより鮮度の高いものが欲しい!
 分析対象のデータは適宜追加していきたい!
最新のデータ分析基盤
 目的
7
最新のデータ分析基盤
業務システム Enterprise Data
Warehouse(EDW)
データマート Business
Analytics
Visualization
& Dashboards
データベースシステム
分析系
COLD
データ
ETL
Web Logs,
Click Streams
Social
Networks
Machine
Generated
Sensor
Data
Geolocation
Data
Data
Science
バッチ処理
OLTP,ERP,
CRM,etc
HOTデータ
COLD
データ
バッチ処理
8
課題①:分析対象データの鮮度
業務システム Enterprise Data
Warehouse(EDW)
データマート Business
Analytics
Visualization
& Dashboards
データベースシステム
分析系
COLD
データ
ETL
Web Logs,
Click Streams
Social
Networks
Machine
Generated
Sensor
Data
Geolocation
Data
Data
Science
バッチ処理
OLTP,ERP,
CRM,etc
HOTデータ
COLD
データ
バッチ処理
時間が掛かる 時間が掛かる
9
課題②:分析対象データの増加時の対応
業務システム Enterprise Data
Warehouse(EDW)
データマート Business
Analytics
Visualization
& Dashboards
データベースシステム
分析系
COLD
データ
ETL
ドキュメント,
Eメール
Web Logs,
Click Streams
Social
Networks
Machine
Generated
Sensor
Data
Geolocation
Data
Data
Science
バッチ処理
OLTP,ERP,
CRM,etc
HOTデータ
COLD
データ
バッチ処理
時間が掛かる 時間が掛かる
連携対象が増えた
場合の対応
1
 デジタルトランスフォーメーション
 データのマネタイズ
 センサーデータ、位置情報、行動ログ等、これまで使用していたデータ
に加えて、基幹系システムで持っている顧客データ、販売データも使用
して更に高度な分析、施策を打ちたい!
 連携するデータはより鮮度の高いものが欲しい!
 分析対象のデータは適宜追加していきたい!
最新のデータ分析基盤
 目的
 課題
 基幹系データのデータ分析基盤へのニアリアルタイム連携
 連携対象データの追加等、構成変更へのフレキシブルな対応
2. Attunity社製品のご紹介
Attunity とは?
1
 1988年創業、データ統合において、30年にわたる研究開発と経験
 CDC(更新データ捕捉)技術における独立系リーディング企業
 米国、英国、イスラエル、日本、香港、台湾、韓国など、全世界的事業規模
FINANCIAL
SERVICES
MANUFACTURING/
INDUSTRIAL
HEALTH
CARE
GOVERNMENT TECHNOLOGY /
TELECOM
RETAIL OTHER
INDUSTRIES
世界65ヶ国で2,000社以上の顧客。Fortune100のうち半数が使用。
Trusted by Microsoft
with 3 OEMs,
bundled inside
SQL Server
Trusted by Amazon
(AWS) with strategic
partnership for cloud
database migration
Trusted by IBM and
Oracle with respective
OEMs of Attunity
technology
Trusted by Teradata
and HP as resellers for
data warehouse and
analytics
Trusted by
global system
integrators
Trusted by over
2000 customers for
commitment, flexibility
and speed
2000+
Trusted by SAP as
certified solution in
use with over 200 SAP
customers
Trusted by big data
leaders for data lake
solutions
Trusted by IBM and
Oracle with respective
OEMs of Attunity
technology
Trusted by Teradata
and HP as resellers for
data warehouse and
analytics
パートナーシップ - 多くの企業に認められ、選ばれている技術
企業のデータ管理に最適なATTUNITYのプラットフォーム
15© 2017 Attunity
#1 provider of change
data capture (CDC)
 多数のソースデータベースの
サポート
 ハイパフォーマンス
 ソースシステムへの低負荷
#1 cloud database
migration technology
 AWS等のクラウド環境へ
40,000以上のデータベースの
移行実績
#1 in ease of use
 現場のデータアーキテクト、
DBAがデプロイしやすい
デザイン
ストリーミング/クラウドを含むデータレイクへの効率的なリアルタイムデータ連携の
再有力プラットフォーム
Attunityが提供するソフトウェアの特徴
16© 2017 Attunity
自動化、いろいろな環境で使える
リアルタイムデータ転送
分析用データ構造の生成
※Hadoop環境へのニアリアルタイム
データ連携
ATTUNITY REPLICATE ATTUNITY COMPOSE
ATTUNITY ENTERPRISE MANAGER
Attunityソフトウェアの統合管理ツール
Attunity社が提供するデータ連携プラットフォーム
 エージェントレス (LUW)
 異種データベース間のデータ高速転送・同期
 FULL LOAD(初期コピー)~CDC(変更データ反映)までシームレスに連携
 GUIベースの簡易設定、監視
【Target】【Source】
SQL Server 2005/2008/2012/2014
MySQL 5.5/5.6
Sybase ASE 12.5/15/15.5/16
IMSIMS
PostgresSQL 9.4.2↑(Win) 9.4(Linux)
 主要対応環境
 ロジカルレプリケーション(データベース同期)
Oracle10g/11g/12c
Attunity Replicate - 概要
18© 2017 Attunity
TRANSFER
IN-MEMORY
FILTER
HADOOP
RDBMS
DATA
WAREHOUSE
FILES
MAINFRAME
TRANSFORM
FILE CHANNEL
PERSISTENT
STORE
CDC
BATCH
INCREMENTAL
BATCH
HADOOP
RDBMS
DATA
WAREHOUSE
STREAMING
FILES
ATTUNITY POWERPOINT ASSET LIBRARY
RDBMS
Oracle
SQL Server
DB2 LUW
DB2 iSeries
DB2 z/OS
MySQL
PostgreSQL
Sybase ASE
Informix
Data Warehouse
Exadata
Teradata
Netezza
Vertica
Actian Vector
Actian Matrix
SAP / HANA
Hortonworks
Cloudera
MapR
Hadoop
IMS/DB
SQL M/P
Enscribe
RMS
Legacy
AWS RDS
Amazon Aurora
Salesforce
Cloud
RDBMS
Oracle
SQL Server
DB2 LUW
MySQL
PostgreSQL
Sybase ASE
Informix
Data Warehouse
Microsoft PDW
Exadata
Teradata
Netezza
Vertica
Sybase IQ
Amazon
Redshift
Actian Vector
SAP HANA
Hortonworks
Cloudera
MapR
Amazon EMR
Azure
HDInsight *
Hadoop
Azure Event
Hubs *
MapR-ES *
Kafka
Streaming
Amazon RDS
Amazon Redshift
Amazon EMR
Amazon S3
Amazon Aurora
Google Cloud SQL
Azure SQL DW
Azure SQL DB
Snowflake
Cloud
Delimited
FLAT FILES
targets
sources
ECC on
Oracle
ECC on SQL
ECC on DB2
ECC on
HANA
S4 HANA
SAP
サポートデータベース
Delimited
(CSV,TSV)
FLAT FILES
Attunity Replicate アーキテクチャ
Attunity Replicate アーキテクチャ
Kafkaへのデータストリーミング → HDF → HDP
Attunity とHortonworks
METADATA
HIVE
OPTIMIZED
STREAM
OPTIMIZED
CHANGE DATA CAPTURECHANGE DATA CAPTURE
CLOUD ON PREM
WAREHOUSE MAINFRAME RDBMS SAP
TRANSFORM & UPDATETRANSFORM & UPDATE
Hive最適化のHDPとスト
リーミング最適化のHDF
エージェントレス、コー
ディングレスデータ連携
分析用のHiveデータセッ
トの自動生成
ソースDBデータ/メタデ
ータのUPDATEの連携
変換プロセスのHiveへの
連携
用途に応じた、ODS、
HDS形式での連携が可能
Attunity Replicate + Attunity Composeによる、データ分析基盤への
データ連携の仕組み
業務DB
ランディング
ゾーン
(Oracle/SQLServer
/DB2,etc)
トランザクションログ
CDC INCREMENTAL
ターゲット
データ
Hive ACID MERGE
 Attunity Replicate:ランディングゾーンに差分データをInsert
 Attunity Compose:ランディングゾーンの差分データ( INSERT/UPDATE/DELETE )を
Hive ACID Mergeにより、ターゲットデータに効率よく適用
2
データ分析基盤の構築 / 課題
業務システム Enterprise Data
Warehouse(EDW)
データマート Business
Analytics
Visualization
& Dashboards
データベースシステム
分析系
COLD
データ
ETL
ドキュメント,
Eメール
Web Logs,
Click Streams
Social
Networks
Machine
Generated
Sensor
Data
Geolocation
Data
Data
Science
バッチ処理
OLTP,ERP,
CRM,etc
HOTデータ
COLD
データ
バッチ処理
時間が掛かる 時間が掛かる
連携対象が増えた
場合の対応
2
Attunityプラットフォームを導入すると・・・
業務システム Enterprise Data
Warehouse(EDW)
データマート Business
Analytics
Visualization
& Dashboards
データベースシステム
分析系
COLD
データ
ETL
ドキュメント,
Eメール
Web Logs,
Click Streams
Social
Networks
Machine
Generated
Sensor
Data
Geolocation
Data
Data
Science
バッチ処理
OLTP,ERP,
CRM,etc
HOTデータ
COLD
データ
バッチ処理
時間が掛かる 時間が掛かる
処理に必要な更新データのリアルタイム反映
連携対象が増えた
場合も簡単に追加可能!!
2
 デジタルトランスフォーメーション
 データのマネタイズ
 センサーデータ、位置情報、行動ログ等、これまで使用していたデータ
に加えて、基幹系システムで持っている顧客データ、販売データも使用
して更に高度な分析、施策を打ちたい!
 連携するデータはより鮮度の高いものが欲しい!
 分析対象のデータは適宜追加していきたい!
まとめ
 目的
 課題
 基幹系データのデータ分析基盤へのニアリアルタイム連携
 連携対象データの追加等、構成変更へのフレキシブルな対応
Attunity Replicate+Attunity Composeを使うことで、ニアリ
アルタイム且つ、簡単にデータの連携が可能!!
3. DEMO
Oracle 12cR2
デモ環境
Land_gonta
gonta
4. 事例のご紹介
導入事例: アメリカ 某自動車製造メーカー
•グローバルな分析を中央集中化すること
•迅速な洞察と競合他社に対する強みを見出すこと
4,500 applications
DB2 MF SQL Oracle
全世界に社員数20万人、
50工場
• 多様なアプリケーション、地理情報に関する大量のデータ
• 分析の遅延 => 機会損失
Challenges
•KafkaデータブローカーでHadoopデータレイク上に一元管理
•Attunity Replicateで全ソース/ターゲットを最小時間で統合
•約1,000,000ドル(1億円)削減
Goals
Goals
ELT
導入事例: アメリカ 某自動車製造メーカー
Single Analytic Environment
Oracle, SQLServer,DB2,
Teradata, etc
※200以上のデータソース
Challenge
 AS/400上の顧客データのHadoopプラットフォームでのリアルタイムデータ分析
 HadoopにODS (Operational Data Store)を配置し、データハブとして使用
Goals
 プルデンシャルのコアデータ(将来的には非構造化データも)を配置する、
ニアリアルタイムデータハブの構築
 デジタルトランスフォーメーション推進と、データのマネタイズ
 課題
- サイロ化による不完全なデータ
- データの可用性
- レガシーシステム内の、不完全・アクセスできないデータ
Technical Solution
 Attunity Replicate (AS/400へはエージェントレスで使用可能)
→ サービスメンテナンス対応工数の低減
 Attunity Compose for Hortonworks HIVE ACID Merge and Kafka.
→ 新しいアプリケーションの運用/インテリジェンス/意思決定の改善
Situation Overview
導入事例: Prudential Singapore
プルデンシャルの最大の事業部門は
プルデンシャル・コーポレーション・アジアで、
12のアジア市場で1300万人以上の顧客を抱え、
香港、インド、インドネシア、マレーシア、
シンガポール、フィリピン、ベトナムで
3位の生命保険会社です。
プルデンシャルUKは700万人の顧客を抱えており、
英国の生命保険および年金の大手プロバイダーです。
AS/400 iSeries
Automating A Prudential data Hub
REAL-TIME HISTORIC
TRANSFORM & UPDATE DATA
ACID Merge
7
REAL-TIME DATA INGESTION
Life Asia
Insurance Policy System
HIVE (ACID MERGE)
記載されている会社名、サービス名、製品名は、株式会社インサイトテクノロジーおよび各社の商標または登録商標です。
Copyright 2018 Insight Technology, Inc. All Rights Reserved.
ご清聴、ありがとうございました!

Weitere ähnliche Inhalte

Was ist angesagt?

Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Hortonworks Japan
 
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Insight Technology, Inc.
 
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...Insight Technology, Inc.
 
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]Insight Technology, Inc.
 
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 Insight Technology, Inc.
 
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...Insight Technology, Inc.
 
From data catalog to preparation. The latest data platform to accelerate the ...
From data catalog to preparation. The latest data platform to accelerate the ...From data catalog to preparation. The latest data platform to accelerate the ...
From data catalog to preparation. The latest data platform to accelerate the ...DataWorks Summit
 
難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...
[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...
[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...Insight Technology, Inc.
 
BigData-JAWS#16 Lake House Architecture
BigData-JAWS#16 Lake House ArchitectureBigData-JAWS#16 Lake House Architecture
BigData-JAWS#16 Lake House ArchitectureSatoru Ishikawa
 
Red Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM sessionRed Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM sessionShinichiro Arai
 
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...Insight Technology, Inc.
 
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組みData Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組みcyberagent
 
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのかTechon Organization
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionTetsutaro Watanabe
 
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...Insight Technology, Inc.
 
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)NTT DATA Technology & Innovation
 

Was ist angesagt? (20)

Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤Apache Hadoopを利用したビッグデータ分析基盤
Apache Hadoopを利用したビッグデータ分析基盤
 
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
 
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
 
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
 
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
 
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
エンタープライズでのAI活用を支援する新世代データウェアハウスのあり方[ATTUNITY & インサイトテクノロジー IoT / Big Data フォー...
 
The real world use of Big Data to change business
The real world use of Big Data to change businessThe real world use of Big Data to change business
The real world use of Big Data to change business
 
From data catalog to preparation. The latest data platform to accelerate the ...
From data catalog to preparation. The latest data platform to accelerate the ...From data catalog to preparation. The latest data platform to accelerate the ...
From data catalog to preparation. The latest data platform to accelerate the ...
 
Case Study: OLAP usability on Spark and Hadoop
Case Study: OLAP usability on Spark and HadoopCase Study: OLAP usability on Spark and Hadoop
Case Study: OLAP usability on Spark and Hadoop
 
難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?
 
[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...
[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...
[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...
 
BigData-JAWS#16 Lake House Architecture
BigData-JAWS#16 Lake House ArchitectureBigData-JAWS#16 Lake House Architecture
BigData-JAWS#16 Lake House Architecture
 
Red Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM sessionRed Hat Forum 2014 IBM session
Red Hat Forum 2014 IBM session
 
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
 
Case study of DevOps for Hadoop in Recruit.
Case study of DevOps for Hadoop in Recruit.Case study of DevOps for Hadoop in Recruit.
Case study of DevOps for Hadoop in Recruit.
 
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組みData Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
 
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年version
 
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
 
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
AI/ML開発・運用ワークフロー検討案(日本ソフトウェア科学会 機械学習工学研究会 本番適用のためのインフラと運用WG主催 討論会)
 

Ähnlich wie Smart data integration to hybrid data analysis infrastructure

[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...Insight Technology, Inc.
 
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...Insight Technology, Inc.
 
Azure上の データベース 機能の選び方。KVSからDWHまで
Azure上の データベース 機能の選び方。KVSからDWHまでAzure上の データベース 機能の選び方。KVSからDWHまで
Azure上の データベース 機能の選び方。KVSからDWHまでDaisuke Masubuchi
 
20170413_データレプリケーション技術を適用したデータベース移行と分析基盤の構築 by 株式会社インサイトテクノロジー 森田俊哉
20170413_データレプリケーション技術を適用したデータベース移行と分析基盤の構築 by 株式会社インサイトテクノロジー 森田俊哉20170413_データレプリケーション技術を適用したデータベース移行と分析基盤の構築 by 株式会社インサイトテクノロジー 森田俊哉
20170413_データレプリケーション技術を適用したデータベース移行と分析基盤の構築 by 株式会社インサイトテクノロジー 森田俊哉Insight Technology, Inc.
 
やりたいことから考えるMicrosoft Azure 上の データストアの選び方とデータサイエンティスト向け活用法。KVSからDWHまで
やりたいことから考えるMicrosoft Azure 上の データストアの選び方とデータサイエンティスト向け活用法。KVSからDWHまでやりたいことから考えるMicrosoft Azure 上の データストアの選び方とデータサイエンティスト向け活用法。KVSからDWHまで
やりたいことから考えるMicrosoft Azure 上の データストアの選び方とデータサイエンティスト向け活用法。KVSからDWHまでDaisuke Masubuchi
 
クラウドの破壊力
クラウドの破壊力クラウドの破壊力
クラウドの破壊力Osaka University
 
【CEDEC2018】Azure最新情報+「オトギフロンティア」運用大公開+サーバーレスアーキテクチャー
【CEDEC2018】Azure最新情報+「オトギフロンティア」運用大公開+サーバーレスアーキテクチャー【CEDEC2018】Azure最新情報+「オトギフロンティア」運用大公開+サーバーレスアーキテクチャー
【CEDEC2018】Azure最新情報+「オトギフロンティア」運用大公開+サーバーレスアーキテクチャーDaisuke Masubuchi
 
Vertica 10 カタログ 2020年版
Vertica 10 カタログ 2020年版Vertica 10 カタログ 2020年版
Vertica 10 カタログ 2020年版Kaito Tonooka
 
20160202_Live Demo!! ビッグデータ/クラウドにレプリケーション技術でマルチロケーションデータ連携 by 株式会社インサイトテクノロジー...
20160202_Live Demo!! ビッグデータ/クラウドにレプリケーション技術でマルチロケーションデータ連携 by 株式会社インサイトテクノロジー...20160202_Live Demo!! ビッグデータ/クラウドにレプリケーション技術でマルチロケーションデータ連携 by 株式会社インサイトテクノロジー...
20160202_Live Demo!! ビッグデータ/クラウドにレプリケーション技術でマルチロケーションデータ連携 by 株式会社インサイトテクノロジー...Insight Technology, Inc.
 
クラウドにおけるビッグデータ分析環境
クラウドにおけるビッグデータ分析環境クラウドにおけるビッグデータ分析環境
クラウドにおけるビッグデータ分析環境Kimihiko Kitase
 
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情Hideo Takagi
 
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京Koichiro Sasaki
 
20170719 wintechq azure_stack
20170719 wintechq azure_stack20170719 wintechq azure_stack
20170719 wintechq azure_stackOsamu Takazoe
 
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoPrestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoTreasure Data, Inc.
 
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...Amazon Web Services Japan
 
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎Insight Technology, Inc.
 
JAZUG Nagoya Windows Azure Update 20140301
JAZUG Nagoya Windows Azure Update 20140301JAZUG Nagoya Windows Azure Update 20140301
JAZUG Nagoya Windows Azure Update 20140301Ayako Omori
 

Ähnlich wie Smart data integration to hybrid data analysis infrastructure (20)

[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
 
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
 
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
 
Azure上の データベース 機能の選び方。KVSからDWHまで
Azure上の データベース 機能の選び方。KVSからDWHまでAzure上の データベース 機能の選び方。KVSからDWHまで
Azure上の データベース 機能の選び方。KVSからDWHまで
 
Azure Data Platform
Azure Data PlatformAzure Data Platform
Azure Data Platform
 
20170413_データレプリケーション技術を適用したデータベース移行と分析基盤の構築 by 株式会社インサイトテクノロジー 森田俊哉
20170413_データレプリケーション技術を適用したデータベース移行と分析基盤の構築 by 株式会社インサイトテクノロジー 森田俊哉20170413_データレプリケーション技術を適用したデータベース移行と分析基盤の構築 by 株式会社インサイトテクノロジー 森田俊哉
20170413_データレプリケーション技術を適用したデータベース移行と分析基盤の構築 by 株式会社インサイトテクノロジー 森田俊哉
 
やりたいことから考えるMicrosoft Azure 上の データストアの選び方とデータサイエンティスト向け活用法。KVSからDWHまで
やりたいことから考えるMicrosoft Azure 上の データストアの選び方とデータサイエンティスト向け活用法。KVSからDWHまでやりたいことから考えるMicrosoft Azure 上の データストアの選び方とデータサイエンティスト向け活用法。KVSからDWHまで
やりたいことから考えるMicrosoft Azure 上の データストアの選び方とデータサイエンティスト向け活用法。KVSからDWHまで
 
Data Architecture
Data ArchitectureData Architecture
Data Architecture
 
クラウドの破壊力
クラウドの破壊力クラウドの破壊力
クラウドの破壊力
 
【CEDEC2018】Azure最新情報+「オトギフロンティア」運用大公開+サーバーレスアーキテクチャー
【CEDEC2018】Azure最新情報+「オトギフロンティア」運用大公開+サーバーレスアーキテクチャー【CEDEC2018】Azure最新情報+「オトギフロンティア」運用大公開+サーバーレスアーキテクチャー
【CEDEC2018】Azure最新情報+「オトギフロンティア」運用大公開+サーバーレスアーキテクチャー
 
Vertica 10 カタログ 2020年版
Vertica 10 カタログ 2020年版Vertica 10 カタログ 2020年版
Vertica 10 カタログ 2020年版
 
20160202_Live Demo!! ビッグデータ/クラウドにレプリケーション技術でマルチロケーションデータ連携 by 株式会社インサイトテクノロジー...
20160202_Live Demo!! ビッグデータ/クラウドにレプリケーション技術でマルチロケーションデータ連携 by 株式会社インサイトテクノロジー...20160202_Live Demo!! ビッグデータ/クラウドにレプリケーション技術でマルチロケーションデータ連携 by 株式会社インサイトテクノロジー...
20160202_Live Demo!! ビッグデータ/クラウドにレプリケーション技術でマルチロケーションデータ連携 by 株式会社インサイトテクノロジー...
 
クラウドにおけるビッグデータ分析環境
クラウドにおけるビッグデータ分析環境クラウドにおけるビッグデータ分析環境
クラウドにおけるビッグデータ分析環境
 
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情
 
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
 
20170719 wintechq azure_stack
20170719 wintechq azure_stack20170719 wintechq azure_stack
20170719 wintechq azure_stack
 
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 TokyoPrestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
 
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
20180425 AWS Black Belt Online Seminar Amazon Relational Database Service (Am...
 
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ  by トレジャーデータ株式会社 斉藤太郎
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
 
JAZUG Nagoya Windows Azure Update 20140301
JAZUG Nagoya Windows Azure Update 20140301JAZUG Nagoya Windows Azure Update 20140301
JAZUG Nagoya Windows Azure Update 20140301
 

Mehr von DataWorks Summit

Floating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache RatisFloating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache RatisDataWorks Summit
 
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFiTracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFiDataWorks Summit
 
HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...DataWorks Summit
 
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...DataWorks Summit
 
Managing the Dewey Decimal System
Managing the Dewey Decimal SystemManaging the Dewey Decimal System
Managing the Dewey Decimal SystemDataWorks Summit
 
Practical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist ExamplePractical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist ExampleDataWorks Summit
 
HBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at UberHBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at UberDataWorks Summit
 
Scaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and PhoenixScaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and PhoenixDataWorks Summit
 
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFiBuilding the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFiDataWorks Summit
 
Supporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability ImprovementsSupporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability ImprovementsDataWorks Summit
 
Security Framework for Multitenant Architecture
Security Framework for Multitenant ArchitectureSecurity Framework for Multitenant Architecture
Security Framework for Multitenant ArchitectureDataWorks Summit
 
Presto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything EnginePresto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything EngineDataWorks Summit
 
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...DataWorks Summit
 
Extending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google CloudExtending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google CloudDataWorks Summit
 
Event-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFiEvent-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFiDataWorks Summit
 
Securing Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache RangerSecuring Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache RangerDataWorks Summit
 
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...DataWorks Summit
 
Computer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near YouComputer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near YouDataWorks Summit
 
Big Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache SparkBig Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache SparkDataWorks Summit
 

Mehr von DataWorks Summit (20)

Data Science Crash Course
Data Science Crash CourseData Science Crash Course
Data Science Crash Course
 
Floating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache RatisFloating on a RAFT: HBase Durability with Apache Ratis
Floating on a RAFT: HBase Durability with Apache Ratis
 
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFiTracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
Tracking Crime as It Occurs with Apache Phoenix, Apache HBase and Apache NiFi
 
HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...HBase Tales From the Trenches - Short stories about most common HBase operati...
HBase Tales From the Trenches - Short stories about most common HBase operati...
 
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
Optimizing Geospatial Operations with Server-side Programming in HBase and Ac...
 
Managing the Dewey Decimal System
Managing the Dewey Decimal SystemManaging the Dewey Decimal System
Managing the Dewey Decimal System
 
Practical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist ExamplePractical NoSQL: Accumulo's dirlist Example
Practical NoSQL: Accumulo's dirlist Example
 
HBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at UberHBase Global Indexing to support large-scale data ingestion at Uber
HBase Global Indexing to support large-scale data ingestion at Uber
 
Scaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and PhoenixScaling Cloud-Scale Translytics Workloads with Omid and Phoenix
Scaling Cloud-Scale Translytics Workloads with Omid and Phoenix
 
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFiBuilding the High Speed Cybersecurity Data Pipeline Using Apache NiFi
Building the High Speed Cybersecurity Data Pipeline Using Apache NiFi
 
Supporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability ImprovementsSupporting Apache HBase : Troubleshooting and Supportability Improvements
Supporting Apache HBase : Troubleshooting and Supportability Improvements
 
Security Framework for Multitenant Architecture
Security Framework for Multitenant ArchitectureSecurity Framework for Multitenant Architecture
Security Framework for Multitenant Architecture
 
Presto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything EnginePresto: Optimizing Performance of SQL-on-Anything Engine
Presto: Optimizing Performance of SQL-on-Anything Engine
 
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
Introducing MlFlow: An Open Source Platform for the Machine Learning Lifecycl...
 
Extending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google CloudExtending Twitter's Data Platform to Google Cloud
Extending Twitter's Data Platform to Google Cloud
 
Event-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFiEvent-Driven Messaging and Actions using Apache Flink and Apache NiFi
Event-Driven Messaging and Actions using Apache Flink and Apache NiFi
 
Securing Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache RangerSecuring Data in Hybrid on-premise and Cloud Environments using Apache Ranger
Securing Data in Hybrid on-premise and Cloud Environments using Apache Ranger
 
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
Big Data Meets NVM: Accelerating Big Data Processing with Non-Volatile Memory...
 
Computer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near YouComputer Vision: Coming to a Store Near You
Computer Vision: Coming to a Store Near You
 
Big Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache SparkBig Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
Big Data Genomics: Clustering Billions of DNA Sequences with Apache Spark
 

Kürzlich hochgeladen

論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsWSO2
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptxsn679259
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 

Kürzlich hochgeladen (10)

論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 

Smart data integration to hybrid data analysis infrastructure

  • 2. Insight Technologyとは? コンサルティングサービス ソフトウェア ハードウェア システム設計~運用まで データベース総合ソリューション システム設計~運用まで データベース総合ソリューション データベースの様々な課題を 解決する各種ソフトウェア データベースの様々な課題を 解決する各種ソフトウェア 高性能・低コスト・高信頼性 データベース専用マシン 高性能・低コスト・高信頼性 データベース専用マシン データベースに関連するナレッジと技術力を追求し、ソフトウェア、ハードウェア、 サービスを最適に組み合わせてお客様に提供する会社です。 高速・低コスト・セキュア なデータベース環境を実現 データベースのアクセス監査ツール(自社開発) マルチデータベースのリアルタイムレプリケーションツール 次世代型データウェアハウス向け 超高速データベース Oracle Standard Edition向け DR構築ツール データベースのパフォーマンス監視・分析ツール(自社開発) 世界最速のデータベース専用高速マシン(自社開発) 2
  • 3. Agenda 1. ハイブリッドデータ分析基盤の構築 / 課題 2. Attunity社製品のご紹介 3. DEMO 4. 導入事例
  • 5. 5 CLOUDSTREAMINGDATA LAKES ON PREMDATA WAREHOUSE BATCH 最新のデータ分析基盤
  • 6. 6  デジタルトランスフォーメーション  データのマネタイズ  センサーデータ、位置情報、行動ログ等、これまで使用していたデータ に加えて、基幹系システムで持っている顧客データ、販売データも使用 して更に高度な分析、施策を打ちたい!  連携するデータはより鮮度の高いものが欲しい!  分析対象のデータは適宜追加していきたい! 最新のデータ分析基盤  目的
  • 7. 7 最新のデータ分析基盤 業務システム Enterprise Data Warehouse(EDW) データマート Business Analytics Visualization & Dashboards データベースシステム 分析系 COLD データ ETL Web Logs, Click Streams Social Networks Machine Generated Sensor Data Geolocation Data Data Science バッチ処理 OLTP,ERP, CRM,etc HOTデータ COLD データ バッチ処理
  • 8. 8 課題①:分析対象データの鮮度 業務システム Enterprise Data Warehouse(EDW) データマート Business Analytics Visualization & Dashboards データベースシステム 分析系 COLD データ ETL Web Logs, Click Streams Social Networks Machine Generated Sensor Data Geolocation Data Data Science バッチ処理 OLTP,ERP, CRM,etc HOTデータ COLD データ バッチ処理 時間が掛かる 時間が掛かる
  • 9. 9 課題②:分析対象データの増加時の対応 業務システム Enterprise Data Warehouse(EDW) データマート Business Analytics Visualization & Dashboards データベースシステム 分析系 COLD データ ETL ドキュメント, Eメール Web Logs, Click Streams Social Networks Machine Generated Sensor Data Geolocation Data Data Science バッチ処理 OLTP,ERP, CRM,etc HOTデータ COLD データ バッチ処理 時間が掛かる 時間が掛かる 連携対象が増えた 場合の対応
  • 10. 1  デジタルトランスフォーメーション  データのマネタイズ  センサーデータ、位置情報、行動ログ等、これまで使用していたデータ に加えて、基幹系システムで持っている顧客データ、販売データも使用 して更に高度な分析、施策を打ちたい!  連携するデータはより鮮度の高いものが欲しい!  分析対象のデータは適宜追加していきたい! 最新のデータ分析基盤  目的  課題  基幹系データのデータ分析基盤へのニアリアルタイム連携  連携対象データの追加等、構成変更へのフレキシブルな対応
  • 12. Attunity とは? 1  1988年創業、データ統合において、30年にわたる研究開発と経験  CDC(更新データ捕捉)技術における独立系リーディング企業  米国、英国、イスラエル、日本、香港、台湾、韓国など、全世界的事業規模 FINANCIAL SERVICES MANUFACTURING/ INDUSTRIAL HEALTH CARE GOVERNMENT TECHNOLOGY / TELECOM RETAIL OTHER INDUSTRIES 世界65ヶ国で2,000社以上の顧客。Fortune100のうち半数が使用。
  • 13. Trusted by Microsoft with 3 OEMs, bundled inside SQL Server Trusted by Amazon (AWS) with strategic partnership for cloud database migration Trusted by IBM and Oracle with respective OEMs of Attunity technology Trusted by Teradata and HP as resellers for data warehouse and analytics Trusted by global system integrators Trusted by over 2000 customers for commitment, flexibility and speed 2000+ Trusted by SAP as certified solution in use with over 200 SAP customers Trusted by big data leaders for data lake solutions Trusted by IBM and Oracle with respective OEMs of Attunity technology Trusted by Teradata and HP as resellers for data warehouse and analytics パートナーシップ - 多くの企業に認められ、選ばれている技術
  • 15. 15© 2017 Attunity #1 provider of change data capture (CDC)  多数のソースデータベースの サポート  ハイパフォーマンス  ソースシステムへの低負荷 #1 cloud database migration technology  AWS等のクラウド環境へ 40,000以上のデータベースの 移行実績 #1 in ease of use  現場のデータアーキテクト、 DBAがデプロイしやすい デザイン ストリーミング/クラウドを含むデータレイクへの効率的なリアルタイムデータ連携の 再有力プラットフォーム Attunityが提供するソフトウェアの特徴
  • 16. 16© 2017 Attunity 自動化、いろいろな環境で使える リアルタイムデータ転送 分析用データ構造の生成 ※Hadoop環境へのニアリアルタイム データ連携 ATTUNITY REPLICATE ATTUNITY COMPOSE ATTUNITY ENTERPRISE MANAGER Attunityソフトウェアの統合管理ツール Attunity社が提供するデータ連携プラットフォーム
  • 17.  エージェントレス (LUW)  異種データベース間のデータ高速転送・同期  FULL LOAD(初期コピー)~CDC(変更データ反映)までシームレスに連携  GUIベースの簡易設定、監視 【Target】【Source】 SQL Server 2005/2008/2012/2014 MySQL 5.5/5.6 Sybase ASE 12.5/15/15.5/16 IMSIMS PostgresSQL 9.4.2↑(Win) 9.4(Linux)  主要対応環境  ロジカルレプリケーション(データベース同期) Oracle10g/11g/12c Attunity Replicate - 概要
  • 18. 18© 2017 Attunity TRANSFER IN-MEMORY FILTER HADOOP RDBMS DATA WAREHOUSE FILES MAINFRAME TRANSFORM FILE CHANNEL PERSISTENT STORE CDC BATCH INCREMENTAL BATCH HADOOP RDBMS DATA WAREHOUSE STREAMING FILES ATTUNITY POWERPOINT ASSET LIBRARY
  • 19. RDBMS Oracle SQL Server DB2 LUW DB2 iSeries DB2 z/OS MySQL PostgreSQL Sybase ASE Informix Data Warehouse Exadata Teradata Netezza Vertica Actian Vector Actian Matrix SAP / HANA Hortonworks Cloudera MapR Hadoop IMS/DB SQL M/P Enscribe RMS Legacy AWS RDS Amazon Aurora Salesforce Cloud RDBMS Oracle SQL Server DB2 LUW MySQL PostgreSQL Sybase ASE Informix Data Warehouse Microsoft PDW Exadata Teradata Netezza Vertica Sybase IQ Amazon Redshift Actian Vector SAP HANA Hortonworks Cloudera MapR Amazon EMR Azure HDInsight * Hadoop Azure Event Hubs * MapR-ES * Kafka Streaming Amazon RDS Amazon Redshift Amazon EMR Amazon S3 Amazon Aurora Google Cloud SQL Azure SQL DW Azure SQL DB Snowflake Cloud Delimited FLAT FILES targets sources ECC on Oracle ECC on SQL ECC on DB2 ECC on HANA S4 HANA SAP サポートデータベース Delimited (CSV,TSV) FLAT FILES
  • 23. Attunity とHortonworks METADATA HIVE OPTIMIZED STREAM OPTIMIZED CHANGE DATA CAPTURECHANGE DATA CAPTURE CLOUD ON PREM WAREHOUSE MAINFRAME RDBMS SAP TRANSFORM & UPDATETRANSFORM & UPDATE Hive最適化のHDPとスト リーミング最適化のHDF エージェントレス、コー ディングレスデータ連携 分析用のHiveデータセッ トの自動生成 ソースDBデータ/メタデ ータのUPDATEの連携 変換プロセスのHiveへの 連携 用途に応じた、ODS、 HDS形式での連携が可能
  • 24. Attunity Replicate + Attunity Composeによる、データ分析基盤への データ連携の仕組み 業務DB ランディング ゾーン (Oracle/SQLServer /DB2,etc) トランザクションログ CDC INCREMENTAL ターゲット データ Hive ACID MERGE  Attunity Replicate:ランディングゾーンに差分データをInsert  Attunity Compose:ランディングゾーンの差分データ( INSERT/UPDATE/DELETE )を Hive ACID Mergeにより、ターゲットデータに効率よく適用
  • 25. 2 データ分析基盤の構築 / 課題 業務システム Enterprise Data Warehouse(EDW) データマート Business Analytics Visualization & Dashboards データベースシステム 分析系 COLD データ ETL ドキュメント, Eメール Web Logs, Click Streams Social Networks Machine Generated Sensor Data Geolocation Data Data Science バッチ処理 OLTP,ERP, CRM,etc HOTデータ COLD データ バッチ処理 時間が掛かる 時間が掛かる 連携対象が増えた 場合の対応
  • 26. 2 Attunityプラットフォームを導入すると・・・ 業務システム Enterprise Data Warehouse(EDW) データマート Business Analytics Visualization & Dashboards データベースシステム 分析系 COLD データ ETL ドキュメント, Eメール Web Logs, Click Streams Social Networks Machine Generated Sensor Data Geolocation Data Data Science バッチ処理 OLTP,ERP, CRM,etc HOTデータ COLD データ バッチ処理 時間が掛かる 時間が掛かる 処理に必要な更新データのリアルタイム反映 連携対象が増えた 場合も簡単に追加可能!!
  • 27. 2  デジタルトランスフォーメーション  データのマネタイズ  センサーデータ、位置情報、行動ログ等、これまで使用していたデータ に加えて、基幹系システムで持っている顧客データ、販売データも使用 して更に高度な分析、施策を打ちたい!  連携するデータはより鮮度の高いものが欲しい!  分析対象のデータは適宜追加していきたい! まとめ  目的  課題  基幹系データのデータ分析基盤へのニアリアルタイム連携  連携対象データの追加等、構成変更へのフレキシブルな対応 Attunity Replicate+Attunity Composeを使うことで、ニアリ アルタイム且つ、簡単にデータの連携が可能!!
  • 31. 導入事例: アメリカ 某自動車製造メーカー •グローバルな分析を中央集中化すること •迅速な洞察と競合他社に対する強みを見出すこと 4,500 applications DB2 MF SQL Oracle 全世界に社員数20万人、 50工場 • 多様なアプリケーション、地理情報に関する大量のデータ • 分析の遅延 => 機会損失 Challenges •KafkaデータブローカーでHadoopデータレイク上に一元管理 •Attunity Replicateで全ソース/ターゲットを最小時間で統合 •約1,000,000ドル(1億円)削減 Goals Goals
  • 32. ELT 導入事例: アメリカ 某自動車製造メーカー Single Analytic Environment Oracle, SQLServer,DB2, Teradata, etc ※200以上のデータソース
  • 33. Challenge  AS/400上の顧客データのHadoopプラットフォームでのリアルタイムデータ分析  HadoopにODS (Operational Data Store)を配置し、データハブとして使用 Goals  プルデンシャルのコアデータ(将来的には非構造化データも)を配置する、 ニアリアルタイムデータハブの構築  デジタルトランスフォーメーション推進と、データのマネタイズ  課題 - サイロ化による不完全なデータ - データの可用性 - レガシーシステム内の、不完全・アクセスできないデータ Technical Solution  Attunity Replicate (AS/400へはエージェントレスで使用可能) → サービスメンテナンス対応工数の低減  Attunity Compose for Hortonworks HIVE ACID Merge and Kafka. → 新しいアプリケーションの運用/インテリジェンス/意思決定の改善 Situation Overview 導入事例: Prudential Singapore プルデンシャルの最大の事業部門は プルデンシャル・コーポレーション・アジアで、 12のアジア市場で1300万人以上の顧客を抱え、 香港、インド、インドネシア、マレーシア、 シンガポール、フィリピン、ベトナムで 3位の生命保険会社です。 プルデンシャルUKは700万人の顧客を抱えており、 英国の生命保険および年金の大手プロバイダーです。
  • 34. AS/400 iSeries Automating A Prudential data Hub REAL-TIME HISTORIC TRANSFORM & UPDATE DATA ACID Merge 7 REAL-TIME DATA INGESTION Life Asia Insurance Policy System HIVE (ACID MERGE)