SlideShare ist ein Scribd-Unternehmen logo
1 von 57
Downloaden Sie, um offline zu lesen
データ分析を⽀える技術 DWH再⼊⾨
データアナリティクス事業本部
2020/06/19
⽯川 覚
2⾃⼰紹介
• ⽒名
- ⽯川 覚 (いしかわ さとる)
• 所属
- データアナリティクス事業本部 (DA事業本部)
- インテグレーション部
- 札幌オフィス勤務
• 略歴
- メーカー系SIer、ITベンチャー企業、現在に⾄る
• 担当業務
- データ分析基盤の設計・開発、コンサルティング
• 好きなサービス
- Amazon Redshift/Athena、Snowflake 、Google BigQuery
2020 APN AWS Top Engineers 選出
3アジェンダ
• DWH再⼊⾨
• DWHの特性
• ディメンジョナルデータモデル
• 分析データの利⽤
• ⼀般的なDBとDWHの相違点
• DWHのアーキテクチャ
4
DWH再⼊⾨
5DWHとは
DWHはデータウェアハウスの略(データの倉庫)
分析しやすく検索できるように蓄積したデータベース
6DWHとは
DWHはデータウェアハウスの略(データの倉庫)
分析しやすく検索できるように蓄積したデータベース
• 部⾨のデータをDWHに集め
• そのデータを分析しやすく変換
• 分析の⽬的ごとにデータを作成・蓄積
7DWH導⼊の背景
⼀つの企業の中でさまざまな部⾨のDBに、データが分散して
いることをサイロ化と呼びます。
eコマース 店舗
8DWH導⼊の背景
⼀つの企業の中でさまざまな部⾨のDBに、データが分散して
いることをサイロ化と呼びます。
eコマース 店舗
もう〜サイロ化した貴重なデータを
企業の意思決定⽀援に活かすには、
データを集めて、分析しやすく検索
できるように蓄積したDBが必要〜
9DWH導⼊の背景
部⾨のDBは、トランザクションの実⾏に最適化されており、
分析クエリの実⾏には不向きです。
DWH(データの倉庫)
そこで登場したのが、データ分析に
最適化されたDBであるDWHです
10
DWHの特性
11DWHの特性
ビル・インモンさんが提唱するDWHの4つ特性
1. 統合化(integrated)
2. サブジェクト指向(subject oriented)
3. 時系列(time variant)
4. 恒常性(nonvolatile)
12DWHの特性
ビル・インモンさんが提唱するDWHの6つ特性
1. 統合化(integrated)
2. サブジェクト指向(subject oriented)
• 詳細データ(detail data)
• 要約データ(summary data)
3. 時系列(time variant)
4. 恒常性(nonvolatile)
13DWHの特性
まずは部⾨のデータをDWHに集める
部⾨のデータを⼀箇所に集めるには、部⾨のDBからエクス
ポートしたファイルをDWHにインポートするのが⼀般的で
す。
• 部⾨のDBからエクスポートしたファイルはオブジェクトス
トレージにアップロードする
• 補⾜︓Amazon Redshiftの場合、S3(オブジェクトスト
レージ)に集めたデータファイルは、データファイルに対し
て直接クエリを実⾏できる「データレイク」のストレージと
しても活⽤できる
14DWHの特性
1. 統合化(integrated)
各部⾨のデータの表記揺れや意味を統⼀します。データを利⽤
するアナリストが個々のデータの違いを意識せずに利⽤できる
ように整理する。
例.
• ⽇付︓和暦から⻄暦変換、JSTからUTC変換
• ⽂字列︓⼤⽂字⼩⽂字、整数・少数、表記揺れ
• 値︓Nullや空⽂字、コード体系の取り扱い
15DWHの特性
1. 統合化(integrated)
補⾜︓データの変換⽅法
• ETL(Extract Transform Load)
• ETLツールでデータを変換してロードする⽅式
• ELT(Extract Load Transform)
• ステージングエリアにデータをロードした後、SQLでデータを変
換する⽅式
16DWHの特性
2. サブジェクト指向(subject oriented)
• 「商品」や「顧客」のように分析の軸(次元)ごとに集計し
て蓄積したデータである「データマート」を作成する
• 複数ディメンジョンのデータマート︓データ探索⽤途
• 単⼀ディメンジョンのデータマート︓パフォーマンス重
視のためダッシュボード⽤途
※グラニュラリティ(要約の粒度)は要件やデータの規模に
よって調整する
17DWHの特性
2. サブジェクト指向(subject oriented)
• 詳細データ(detail data)︓分析しやすく変換したデータ
をそのまま保存
• 要約データ(summary data)︓複数の詳細データを結合
したり、集計した結果を保存
18DWHの特性
3. 時系列(time variant)
⽇々⽣成されるデータ、その時点のデータ状態を保存します。
過去に遡ってデータ分析ができることが⽬的です。
19DWHの特性
4. 恒常性(nonvolatile)
蓄積されたデータは、変更せずに参照可能な状態で保存します。
いつでもデータ発⽣時の値を参照出来ることが⽬的です。
クラウドのオブジェクトストレージは堅牢かつイミュータブル
でありDWHのデータの保存に適しています。
20DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
21DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
部⾨のDBからデータをエクスポートする
22DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
エクスポートしたファイルをS3にアップロード
23DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
S3のデータをDWHのステージング層にロードする
24DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
ステージング層のデータを統合化(integrated)してDWH層インポートする
25DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
DWH層のデータを⽤いてデータマートを作成する
26DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
データマートを⽤いて分析する
27DWHの特性
データの流れ
BIシステム利⽤者
アナリスト
POSデータ
基幹システム
ステージング層 DWH層 データマート層
eコマース売上
RedshiftS3
データ分析基盤
データレイク層
28
ディメンジョナルデータモデル
29ディメンジョナルデータモデル
ディメンジョナルデータモデルとは
• ラルフ・キンボールさんが提唱するディメンジョナルモデル
とは、スタースキーマでDWHを構築すること
• 分析したい値を持つファクトテーブルと、分析の軸(次元)
となる値を持つディメンジョンテーブルから構成される
• ERモデル(第3正規形)は分析データのモデリングに最適
ではない
30ディメンジョナルデータモデル
スタースキーマとは
テーブル同⼠の関係性を可視化
すると、ファクトテーブルを中
⼼にその周りをディメンション
テーブルが取り囲む形になる。
売上
時間ID
店舗ID
商品ID
顧客ID
担当者ID
売上⾦額
時間
時間ID
年⽉⽇
時間
休⽇
店舗
店舗ID
店舗名
地域
顧客
顧客ID
顧客名
顧客分類
商品
商品ID
商品名
カテゴリ
担当者
担当者ID
担当者名
部⾨
31ディメンジョナルデータモデル
売上
時間ID
店舗ID
商品ID
顧客ID
担当者ID
売上⾦額
時間
時間ID
年⽉⽇
時間
休⽇
店舗
店舗ID
店舗名
地域
顧客
顧客ID
顧客名
顧客分類
商品
商品ID
商品名
カテゴリ
担当者
担当者ID
担当者名
部⾨名
スタースキーマとは
テーブル同⼠の関係性を可視化
すると、ファクトテーブルを中
⼼にその周りをディメンション
テーブルが取り囲む形になる。
32ディメンジョナルデータモデル
売上
時間ID
店舗ID
商品ID
顧客ID
担当者ID
売上⾦額
時間
時間ID
年⽉⽇
時間
休⽇
店舗
店舗ID
店舗名
地域
顧客
顧客ID
顧客名
顧客分類
商品
商品ID
商品名
カテゴリ
担当者
担当者ID
担当者名
部⾨
ファクト
ファクトテーブル
ファクトテーブルは、分析した
い値の列と、その周りのテーブ
ル(ディメンジョンテーブル)
を参照する外部キーの列がある
33ディメンジョナルデータモデル
売上
時間ID
店舗ID
商品ID
顧客ID
担当者ID
売上⾦額
時間
時間ID
年⽉⽇
時間
休⽇
店舗
店舗ID
店舗名
地域
顧客
顧客ID
顧客名
顧客分類
商品
商品ID
商品名
カテゴリ
担当者
担当者ID
担当者名
部⾨
ディメンジョン
ディメンジョンテーブル
ディメンジョンテーブルは分析
の軸(次元)を持つテーブル
34ディメンジョナルデータモデル
ファクトとディメンジョンの関係
• ディメンジョンテーブルに対し
てファクトテーブルは圧倒的に
レコード数が多い傾向がある
• あえて第3正規形まで正規化せ
ず、第2正規形で留めておくこ
とでテーブルの結合するコスト
を抑える
売上
時間ID
店舗ID
商品ID
顧客ID
担当者ID
売上⾦額
時間
時間ID
年⽉⽇
時間
休⽇
店舗
店舗ID
店舗名
地域
顧客
顧客ID
顧客名
顧客分類
商品
商品ID
商品名
カテゴリ
担当者
担当者ID
担当者名
部⾨
35
分析データの利⽤
36分析データの利⽤
代表的なデータ分析の⼿法
• ダイス
• スライス
• ドリルアップ・ドリルダウン
BIツールを使い始める前に
理解することをおすすめします。
37分析データの利⽤
ダイス(ダイシング)
データ分析の軸(次元)を変更して、分析の視点を変える。
• 例.商品ごとに分析していたものを、店舗ごとに切り替えて
別の視点で分析する
• ダイスするには、統合化したそのままのデータか、複数ディ
メンジョンのデータマートを事前に作成する
38分析データの利⽤
スライス(スライシング)
多次元の表を2次元の表に切り取る操作。
• 例.商品別年⽉⽇別売上表などを切り出し、季節による商品
の売り上げ推移を分析する
• 統合化(integrated)後のデータからデータマートを作成す
る過程でも実施する
39分析データの利⽤
ドリルアップ・ドリルダウン
分析の深さを詳細にしたり、まとめたりして変更する操作。
• 例1.年⽉ごとに⾏っていた分析を、粒度をあげて年単位に
することをドリルアップという
• 例2.逆に粒度を下げて⽇単位にすることをドリルダウンと
いう
• 年⽉⽇のドリルアップ・ドリルダウンはBIツールを⽤いる
と簡単にできる
40分析データの利⽤
BIツールによる可視化
• ダイス、スライス、ドリルダウン・アップの操作が容易
• データを2次元的なクロス集計表だけでなく、様々な表⽰形
式(グラフなど)でデータを表現できる
• 定型分析
• ダッシューボードなど、常に表⽰する情報は、パフォー
マンス重視の単⼀ディメンジョンデータマートを⽤いる
• データ探索(データディスカバリ)
• 統合化(integrated)後のデータや既存の複合ディメン
ジョンデータマートを⽤いて、新たな洞察を得る
41
⼀般的なDBとDWHの相違点
42相違点は…
トランザクション処理と分析処理では、
データに対するアクセスパターンが異なる
43相違点
アクセスパターン
• オンライントランザクション処理(OLTP)︓⼀般的なDB
• インデックスのキーから少数のレコードを取得・更新
• インタラクティブであり、素早く応答が必要
• オンライン分析処理(OLAP)︓DWH
• ⼤量のレコード中の少数の列だけを読み出しが多い
• 要約統計 (レコード数、合計、平均など)を計算した結果
をユーザーに返したり、テーブルに保存する
44相違点
データアクセスの⽐較
特性 オンライントランザクション処理
(OLTP: OnLine Transaction Processing)
オンライン分析処理
(OLAP: OnLine Analytic Processing)
データの規模 数GBから数TB 数百GBから数PB
読み込みの
パターン
インデックスのキーを⽤いた少数
のレコードの低レイテンシ読み込
み
⼤量のレコード中の少数の列だ
けを読み込み
書き込みの
パターン
ランダムアクセスと低レイテンシ
書き込み
レコード中の更新した列の追加
書き込み、もしくは⼤量データ
の⼀括インポート
45
DWHのアーキテクチャ
46列指向ストレージ
分析クエリを効率よく実⾏できる「列指向ストレージ」
分析クエリが⼀度にアクセスするのは、そのうちの4ないし5
列程度という特徴があります。
DWHではテーブルのデータを⾏ごとではなく、列ごとに保存
します。
• ⾏指向︓データを⾏ごとに保存する⽅式
• 列指向︓列ごとにデータを保存する⽅式
47列指向ストレージ
データスキャンの削減
分析対象となる列のデー
タだけにしかアクセスし
ないため、データスキャ
ンが最⼩化できる
引⽤︓https://www.slideshare.net/AmazonWebServicesJapan/20181205-aws-black-belt-online-seminar-amazon-athena-20190510update/26
48列指向ストレージ
I/O効率や圧縮率の向上
• 列ごとにデータを格納
して連続的にデータを
読み出すことでI/O効
率が向上する
• 同じ列に含まれるデー
タは類似性が⾼く、圧
縮率が⾼くなる
引⽤︓https://www.slideshare.net/AmazonWebServicesJapan/20181205-aws-black-belt-online-seminar-amazon-athena-20190510update/26
49DWHのシステム構成
複数のノードを⽤いた並列分散処理
⼤量のデータの分析を想定した並列分散アーキテクチャを採⽤
している。
• シェアードナッシング
• ストレージをノードごとに割り当て、複数ノードで並列
分散処理する
• シェアードストレージ
• データを共有ストレージに保存し、複数ノードで並列分
散処理する
• ストレージとコンピューティングを分離
50DWHのシステム構成
DWHの例
• シェアードナッシングを採⽤しているDWH
• Amazon Redshift(RA3はハイブリッド)
• Teradata
• Vertica
• シェアードストレージを採⽤しているDWH
• Google BigQuery
• Snowflake
51DWHのアーキテクチャ
例. Amazon Redshift(RA3)
ホットデータはシェアー
ドナッシング、コールド
データは、シェアードス
トレージ
双⽅の⻑所を活かし、ス
トレージとコンピュー
ティングを分離したアー
キテクチャを採⽤してい
る
52
まとめ
53まとめ
DWHのデータ設計
• アナリストが個々のデータの違いを意識せずに利⽤できるよ
うにデータを統合化(integrated)する
• 分析⽤途応じて、結合・集計されたデータマートが時系列か
つ永続的に保存する
• 分析⽤途のテーブルはディメンジョナルデータモデル(ス
タースキーマ)を採⽤し、第2正規化までとする
54まとめ
DWHのデータ活⽤
• データの可視化にはデータマートとBIツールが有効
• 複数ディメンジョンのデータマート︓データ探索⽤途
• 単⼀ディメンジョンのデータマート︓パフォーマンス重
視のダッシュボードなど
55まとめ
DWHのアーキテクチャ
• ⼤量レコード中の少数の列の読み込みを想定して列指向スト
レージを採⽤している
• ⼤量のデータを処理できるように伸縮⾃在で並列分散処理が
可能なシステム構成を採⽤する
• 特に「ビッグデータの分析」であれば上記は必須です
56
わかるようでわからないDWH
違いをご理解いただけたら幸いです。
データ分析を支える技術 DWH再入門

Weitere ähnliche Inhalte

Was ist angesagt?

データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現Ryoma Nagata
 
アサヒのデータ活用基盤を支えるデータ仮想化技術
アサヒのデータ活用基盤を支えるデータ仮想化技術アサヒのデータ活用基盤を支えるデータ仮想化技術
アサヒのデータ活用基盤を支えるデータ仮想化技術Denodo
 
Data platformdesign
Data platformdesignData platformdesign
Data platformdesignRyoma Nagata
 
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)Noritaka Sekiyama
 
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonightAmazon Web Services Japan
 
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)NTT DATA Technology & Innovation
 
BigData Architecture for Azure
BigData Architecture for AzureBigData Architecture for Azure
BigData Architecture for AzureRyoma Nagata
 
アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門Yoichi Kawasaki
 
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのかTechon Organization
 
Snowflake Architecture and Performance
Snowflake Architecture and PerformanceSnowflake Architecture and Performance
Snowflake Architecture and PerformanceMineaki Motohashi
 
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)Yosuke Katsuki
 
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)NTT DATA OSS Professional Services
 
Databricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptxDatabricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptxotato
 
20190806 AWS Black Belt Online Seminar AWS Glue
20190806 AWS Black Belt Online Seminar AWS Glue20190806 AWS Black Belt Online Seminar AWS Glue
20190806 AWS Black Belt Online Seminar AWS GlueAmazon Web Services Japan
 
エンジニアの個人ブランディングと技術組織
エンジニアの個人ブランディングと技術組織エンジニアの個人ブランディングと技術組織
エンジニアの個人ブランディングと技術組織Takafumi ONAKA
 
Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理Cloudera Japan
 
20200218 AWS Black Belt Online Seminar Next Generation Redshift
20200218 AWS Black Belt Online Seminar Next Generation Redshift20200218 AWS Black Belt Online Seminar Next Generation Redshift
20200218 AWS Black Belt Online Seminar Next Generation RedshiftAmazon Web Services Japan
 
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)NTT DATA Technology & Innovation
 
Amazon Redshiftによるリアルタイム分析サービスの構築
Amazon Redshiftによるリアルタイム分析サービスの構築Amazon Redshiftによるリアルタイム分析サービスの構築
Amazon Redshiftによるリアルタイム分析サービスの構築Minero Aoki
 
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
クラウドDWHにおける観点とAzure Synapse Analyticsの対応クラウドDWHにおける観点とAzure Synapse Analyticsの対応
クラウドDWHにおける観点とAzure Synapse Analyticsの対応Ryoma Nagata
 

Was ist angesagt? (20)

データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
 
アサヒのデータ活用基盤を支えるデータ仮想化技術
アサヒのデータ活用基盤を支えるデータ仮想化技術アサヒのデータ活用基盤を支えるデータ仮想化技術
アサヒのデータ活用基盤を支えるデータ仮想化技術
 
Data platformdesign
Data platformdesignData platformdesign
Data platformdesign
 
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
 
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
 
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
 
BigData Architecture for Azure
BigData Architecture for AzureBigData Architecture for Azure
BigData Architecture for Azure
 
アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門
 
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
 
Snowflake Architecture and Performance
Snowflake Architecture and PerformanceSnowflake Architecture and Performance
Snowflake Architecture and Performance
 
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
 
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
 
Databricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptxDatabricksを初めて使う人に向けて.pptx
Databricksを初めて使う人に向けて.pptx
 
20190806 AWS Black Belt Online Seminar AWS Glue
20190806 AWS Black Belt Online Seminar AWS Glue20190806 AWS Black Belt Online Seminar AWS Glue
20190806 AWS Black Belt Online Seminar AWS Glue
 
エンジニアの個人ブランディングと技術組織
エンジニアの個人ブランディングと技術組織エンジニアの個人ブランディングと技術組織
エンジニアの個人ブランディングと技術組織
 
Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理
 
20200218 AWS Black Belt Online Seminar Next Generation Redshift
20200218 AWS Black Belt Online Seminar Next Generation Redshift20200218 AWS Black Belt Online Seminar Next Generation Redshift
20200218 AWS Black Belt Online Seminar Next Generation Redshift
 
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
 
Amazon Redshiftによるリアルタイム分析サービスの構築
Amazon Redshiftによるリアルタイム分析サービスの構築Amazon Redshiftによるリアルタイム分析サービスの構築
Amazon Redshiftによるリアルタイム分析サービスの構築
 
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
クラウドDWHにおける観点とAzure Synapse Analyticsの対応クラウドDWHにおける観点とAzure Synapse Analyticsの対応
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
 

Ähnlich wie データ分析を支える技術 DWH再入門

BigData-JAWS#16 Lake House Architecture
BigData-JAWS#16 Lake House ArchitectureBigData-JAWS#16 Lake House Architecture
BigData-JAWS#16 Lake House ArchitectureSatoru Ishikawa
 
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - Tetsutaro Watanabe
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data PlatformNaoki (Neo) SATO
 
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Mineaki Motohashi
 
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...Insight Technology, Inc.
 
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューションDell TechCenter Japan
 
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)Kensuke SAEKI
 
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみたAWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみたtatsuya 264
 
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Atsushi Tsuchiya
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)日本マイクロソフト株式会社
 
Azure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data LakeAzure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data LakeHideo Takagi
 
トレジャーデータ新サービス発表 2013/12/9
トレジャーデータ新サービス発表 2013/12/9トレジャーデータ新サービス発表 2013/12/9
トレジャーデータ新サービス発表 2013/12/9Treasure Data, Inc.
 
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装de:code 2017
 
Cm re growth-devio-mtup11-sapporo-004
Cm re growth-devio-mtup11-sapporo-004Cm re growth-devio-mtup11-sapporo-004
Cm re growth-devio-mtup11-sapporo-004Satoru Ishikawa
 
20181206 Jazug DataScience TeamBuilding and DevOps
20181206 Jazug DataScience TeamBuilding and DevOps20181206 Jazug DataScience TeamBuilding and DevOps
20181206 Jazug DataScience TeamBuilding and DevOpsYukako Shimizu
 
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例オラクルエンジニア通信
 
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」オラクルエンジニア通信
 

Ähnlich wie データ分析を支える技術 DWH再入門 (20)

S01 t3 data_engineer
S01 t3 data_engineerS01 t3 data_engineer
S01 t3 data_engineer
 
BigData-JAWS#16 Lake House Architecture
BigData-JAWS#16 Lake House ArchitectureBigData-JAWS#16 Lake House Architecture
BigData-JAWS#16 Lake House Architecture
 
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
 
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
 
Strata conference 2012
Strata conference 2012Strata conference 2012
Strata conference 2012
 
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
 
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
 
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
ビジネスインテリジェンス入門~OSSでBIを始めよう~version2(公開版)
 
「Data Infrastructure at Scale 」#yjdsw4
「Data Infrastructure at Scale 」#yjdsw4「Data Infrastructure at Scale 」#yjdsw4
「Data Infrastructure at Scale 」#yjdsw4
 
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみたAWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた
 
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
Open Cloud Innovation2016 day1(これからのデータ分析者とエンジニアに必要なdatascienceexperienceツールと...
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
 
Azure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data LakeAzure Antenna はじめての Azure Data Lake
Azure Antenna はじめての Azure Data Lake
 
トレジャーデータ新サービス発表 2013/12/9
トレジャーデータ新サービス発表 2013/12/9トレジャーデータ新サービス発表 2013/12/9
トレジャーデータ新サービス発表 2013/12/9
 
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
[DI12] あらゆるデータをビジネスに活用! Azure Data Lake を中心としたビックデータ処理基盤のアーキテクチャと実装
 
Cm re growth-devio-mtup11-sapporo-004
Cm re growth-devio-mtup11-sapporo-004Cm re growth-devio-mtup11-sapporo-004
Cm re growth-devio-mtup11-sapporo-004
 
20181206 Jazug DataScience TeamBuilding and DevOps
20181206 Jazug DataScience TeamBuilding and DevOps20181206 Jazug DataScience TeamBuilding and DevOps
20181206 Jazug DataScience TeamBuilding and DevOps
 
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
Oracle Data Minerハンズオンセミナー170927:③Business Analytics概要と事例
 
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
 

Mehr von Satoru Ishikawa

re:Growth2019 Analytics Updates
re:Growth2019 Analytics Updatesre:Growth2019 Analytics Updates
re:Growth2019 Analytics UpdatesSatoru Ishikawa
 
Developers.IO 2019 Effective Datalake
Developers.IO 2019 Effective DatalakeDevelopers.IO 2019 Effective Datalake
Developers.IO 2019 Effective DatalakeSatoru Ishikawa
 
re:invent 2018 analytics関連アップデート
re:invent 2018 analytics関連アップデートre:invent 2018 analytics関連アップデート
re:invent 2018 analytics関連アップデートSatoru Ishikawa
 
Re invent 2017 データベースサービス総復習!
Re invent 2017 データベースサービス総復習!Re invent 2017 データベースサービス総復習!
Re invent 2017 データベースサービス総復習!Satoru Ishikawa
 
20161214 re growth-sapporo
20161214 re growth-sapporo20161214 re growth-sapporo
20161214 re growth-sapporoSatoru Ishikawa
 
Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114Satoru Ishikawa
 
re:Growth ビッグデータ観点で見た AWS re:Invent 2015
re:Growth ビッグデータ観点で見た AWS re:Invent 2015re:Growth ビッグデータ観点で見た AWS re:Invent 2015
re:Growth ビッグデータ観点で見た AWS re:Invent 2015Satoru Ishikawa
 
db-tech-showcase-sapporo-b24-20150911p
db-tech-showcase-sapporo-b24-20150911pdb-tech-showcase-sapporo-b24-20150911p
db-tech-showcase-sapporo-b24-20150911pSatoru Ishikawa
 
Running Amazon S3 Encryption
Running Amazon S3 EncryptionRunning Amazon S3 Encryption
Running Amazon S3 EncryptionSatoru Ishikawa
 
Cloud Programing for beginner
Cloud Programing for beginnerCloud Programing for beginner
Cloud Programing for beginnerSatoru Ishikawa
 

Mehr von Satoru Ishikawa (11)

re:Growth2019 Analytics Updates
re:Growth2019 Analytics Updatesre:Growth2019 Analytics Updates
re:Growth2019 Analytics Updates
 
Developers.IO 2019 Effective Datalake
Developers.IO 2019 Effective DatalakeDevelopers.IO 2019 Effective Datalake
Developers.IO 2019 Effective Datalake
 
re:invent 2018 analytics関連アップデート
re:invent 2018 analytics関連アップデートre:invent 2018 analytics関連アップデート
re:invent 2018 analytics関連アップデート
 
Re invent 2017 データベースサービス総復習!
Re invent 2017 データベースサービス総復習!Re invent 2017 データベースサービス総復習!
Re invent 2017 データベースサービス総復習!
 
20161214 re growth-sapporo
20161214 re growth-sapporo20161214 re growth-sapporo
20161214 re growth-sapporo
 
Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114
 
re:Growth ビッグデータ観点で見た AWS re:Invent 2015
re:Growth ビッグデータ観点で見た AWS re:Invent 2015re:Growth ビッグデータ観点で見た AWS re:Invent 2015
re:Growth ビッグデータ観点で見た AWS re:Invent 2015
 
db-tech-showcase-sapporo-b24-20150911p
db-tech-showcase-sapporo-b24-20150911pdb-tech-showcase-sapporo-b24-20150911p
db-tech-showcase-sapporo-b24-20150911p
 
Cmdevio2015 devday-g-3
Cmdevio2015 devday-g-3Cmdevio2015 devday-g-3
Cmdevio2015 devday-g-3
 
Running Amazon S3 Encryption
Running Amazon S3 EncryptionRunning Amazon S3 Encryption
Running Amazon S3 Encryption
 
Cloud Programing for beginner
Cloud Programing for beginnerCloud Programing for beginner
Cloud Programing for beginner
 

データ分析を支える技術 DWH再入門