3. 3 Cloud & App Business div. Copyright 2017 Sony Network Communications Inc.
SNC クラウド&アプリ事業とデータ活用
ソニーグループ製品・サービスへの
クラウドサービス開発運用、
分析・グロース支援
アプリ&データを活用した
メディア事業、デジタル配信事業
4. 4 Cloud & App Business div. Copyright 2017 Sony Network Communications Inc.
なんでBigQuery使うの?
5. 5 Cloud & App Business div. Copyright 2017 Sony Network Communications Inc.
答え: データ分析・ビジネス活用の生産性をあげたかったから
2014 2015 2016 2017 year
#records
/month
(billion)
1.8
7
12
PDCA
Volume & Variety
データが容量も種類も増
えているのに、予算や人
が増えない。。
Background
Agility
PDCAを速く回すには
分析官がストレスの少
ないデータ環境がいる
To-Be
No-system ops
インフラ・システムを運用
するんじゃなくて
データを運用する
Democratization
データドリブンビジネスを
するために
分析官が満足するだけで
なく、企画やエンジニアに
も敷居をさげる
Biz operator
Data
scientist Engineer
一番の理由は、分析官もエンジニアもやりたかったから!
6. 6 Cloud & App Business div. Copyright 2017 Sony Network Communications Inc.
クラウドシステムアーキテクチャ (2016年初め)
Device &
application
Frontend,
Service provision
Backend
for big data
ほとんどの要素はAWSで構成、Hadoop使い始めたのが2013年。
BigQueryをアドホック分析で使い始めていた
7. 7 Cloud & App Business div. Copyright 2017 Sony Network Communications Inc.
アドホック分析環境から、商用データ分析基盤にするには
アドホック環境要件
クエリ速く!
安く!
Data
scientist
クエリエラーしてもねー
ちょちょいとなんとかしちゃうよー
ID管理
アクセスコントロール
セキュリティ
利用者拡大しつつ、
性能・ガバナンス担保
分析結果をBI・外部
連携にすぐ自動化
理解しやすい、分析し
やすいデータ構造
商用データ分析基盤要件
Biz operator
Data
scientist Engineer
連続稼動性、セキュリティ、使いやすさ、性能、
コスト管理、運用性、ユーザ多い。。。
GAP
9. 9 Cloud & App Business div. Copyright 2017 Sony Network Communications Inc.
ETL Analysis Data Mart
Private DMPアーキテクチャ: フルマネージドにできる
Data Loader
Data warehouse, Intermediate
& Data mart
Querying Framework
Data
studio
Architecture: Private DMP
SFTP
API
Source
Stream & Bulk
10. 10 Cloud & App Business div. Copyright 2017 Sony Network Communications Inc.
工夫1: クエリ開発&実行フレームワーク
Pull Req
分析結果をすぐに商用サービス・PDCAに適用する
簡単なチューニングは、SQLを少し書ける人でもできる!
Querying Framework
• SQL (+ UDF)
• Schedule
• Target output
Review,
Merge
定期実行
Biz operator
主任級?の
分析官・エンジニア
Data
scientist
11. 11 Cloud & App Business div. Copyright 2017 Sony Network Communications Inc.
工夫2: 階層的データ構成
Metadata
SQL, csv, etc
ETL
Clean
sing
Raw Layer
Intermediate
layer
Raw A Raw B Raw C
Int A’ Int C’
Standard
format
Join
metadata
Int BC’
Int A“B” Int ABC”
App / Mart
layerApp 1
JOIN、補間、統計計算、K-匿名化
App 2 App 3
Sources
ID matching
and tokenize
1次抽出・変換・時系列管理
中間層のデータ設計で、系の性能・ROIを決める
(ユーザ・用途に応じたテーブル、理解しやすいデータ、クエリの性能・コスト、アクセスコントロール)
12. 12 Cloud & App Business div. Copyright 2017 Sony Network Communications Inc.
クラウドシステムアーキテクチャ (2017年初め)
Device &
application
Frontend,
Service provision
Backend
for big data
データ要件に応じて、AWSとGCPを併用、となりました
Data with strong security Private DMP Anonymized data
秘密の
データ
13. 13 Cloud & App Business div. Copyright 2017 Sony Network Communications Inc.
その後どうでしょう?
14. 14 Cloud & App Business div. Copyright 2017 Sony Network Communications Inc.
しっかり使ってます!
セグメントを作るためのクエリは約60本
(Bizの人がほぼチューンできちゃう)
他の分析PJで約100本
システム運用メンバ x >> X
データ運用メンバ y < Y
データ分析メンバ z << Z
クエリするBizの人 0 < A
No-opsは無理
だが
システム運用から
データ運用へ
データ
民主化!
まだ改善点が多いですが
データ分析・運用にフォーカスしたチーム構成に
人が増えても
XX万円溶けたってことはなくなったかな。。。
以前 今
15. 15 Cloud & App Business div. Copyright 2017 Sony Network Communications Inc.
その他技術的なノウハウ
Schema-lessなJSONの安定投入 コスト、アクセス権対策のため
テーブルパーティション分割は細かめに
id b c Error Column
1 “D" true
2 NULL false
3 Value of key b is
invalid
json_payload
"{ "id": 1, "b": “D”, "c": true}"
"{ "id": 2, "c": false}"
“{ ”id“: 3, ”b“: 10, ”c“: false}” 不正
UDF(Null補間、データエラーチェック)
JSON
Raw table
遺産があり注意(全部変えるのは大変)
ルールを作る
・古いもの
レガシーSQL + 過去のテーブルモデル
・新しいもの
スタンダードSQL + 日付や種類でパーティション
&レイヤ構造
過ちが少ない、アクセスコントロールできる
17. 17 Cloud & App Business div. Copyright 2017 Sony Network Communications Inc.
現場の声(素直でごめんなさい)
Legacy SQLと
Standard SQLを
よく間違う
(BigQuery Mate愛用)
Legacy SQLが技術負債
に、、、いきなりアナウンス無し
に動かなくなることが
日本のサポート
が、、、
UDFすごく便利!
並列計算爆速!
DataStudioはシンプ
ルで無料でうれしい
あまりも気軽すぎて分
析設計がおざなりにw
社内セキュリティ要件
の対応はこれから
UDFの同時実行数
など上限には注意
18. 18 Cloud & App Business div. Copyright 2017 Sony Network Communications Inc.
BigQueryを商用で使うのは、(特に2016年では)チャレンジでした。
データを扱いやすくするため、柔軟性、コスト、変換、などトレードオフ要素を考えて行っ
た一つのデータレイク設計事例として参考にしていただければ幸いです
グループ会社内でBigQueryを使う人が増えています
• 実際はAWS/Azureを含めて増えているとは思います
• 社内外で分け隔てなく仲間を作っていきたいです
• Googleさんの支援を引き続きお願いします!
データはおいしく調理しつづけて行きたいです。社員(分析官)が喜びます。
まとめ
19. 19 Cloud & App Business div. Copyright 2017 Sony Network Communications Inc.
Happy
Holidays!!
Special thanks to
木村さん、鈴木さん
黒澤さん、楠本さん、
パートナーの皆様
(特に照井さん!)
高倉さん、増田さん
G社にいっちゃったYさん