SlideShare ist ein Scribd-Unternehmen logo
1 von 57
Downloaden Sie, um offline zu lesen
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
2017年9月15日
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
ヤフー株式会社 東浩稔
Yahoo!プロモーション広告の
ビックデータ基盤を
支える技術と今後の展望
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
自己紹介
東 浩稔(あずま ひろとし)
所属:マーケティングソリューションズカンパニー 開発本部
パフォーマンスデータPF開発部
プロモーション広告のデータPF全般について、アーキテクチャの刷新や
パフォーマンスの改善を担当
経歴:
2012年中途入社。現在3社目
1社目:製造業(ITエンジニアではない)
2社目:証券系SIer
3社目:Yahoo!ディスプレイアドネットワーク(以下、YDN)のレポート開発や集計シス
テムのリードエンジニアを担当し、今年度より現在の業務を担当。
2
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
アジェンダ
1. Yahoo!プロモーション広告と現在の
システム
2. 現在の課題
3. 今後の展望と事例
3
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
1. Yahoo!プロモーション広告と現在の
システム
2. 現在の課題
3. 今後の展望と事例
4
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
データプラットフォームのミッション
Yahoo!プロモーション広告のPFを
利用している人たちのストレスを無くす
5
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
データプラットフォームのミッション
Yahoo!プロモーション広告のPFを
利用している人たちのストレスを無くす
6
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
Yahoo!プロモーション広告
7
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
プロモーション広告システムとその利用者
8
広告主様 ヤフーを訪れた
ユーザー様
メディア担当様
広告配信
システム
広告管理
システム
パートナー
管理システム
集計システム分析システム広告業務
担当
広告 広告 配信結果
レポート
配信面のチューニング
レポート
ログ
集計データ
集計データ
分析結果
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
プロモーション広告システムとその利用者
9
広告主様 ヤフーを訪れた
ユーザー様
メディア担当様
広告配信
システム
広告管理
システム
パートナー
管理システム
集計システム分析システム広告業務
担当
広告 広告 配信結果
レポート
配信面のチューニング
レポート
ログ
集計データ
集計データ
分析結果
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
プロモーション広告システムとその利用者
10
広告主様 ヤフーを訪れた
ユーザー様
メディア担当様
広告配信
システム
広告管理
システム
パートナー
管理システム
集計システム分析システム広告業務
担当
広告 広告 配信結果
レポート
配信面のチューニング
レポート
ログ
集計データ
集計データ
分析結果
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
プロモーション広告システムとその利用者
11
広告主様 ヤフーを訪れた
ユーザー様
メディア担当様
広告配信
システム
広告管理
システム
パートナー
管理システム
集計システム分析システム広告業務
担当
広告 広告 配信結果
レポート
配信面のチューニング
レポート
ログ
集計データ
集計データ
分析結果
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
プロモーション広告システムとその利用者
12
広告主様 ヤフーを訪れた
ユーザー様
メディア担当様
広告配信
システム
広告管理
システム
パートナー
管理システム
集計システム分析システム広告業務
担当
広告 広告 配信結果
レポート
配信面のチューニング
レポート
ログ
集計データ
集計データ
分析結果
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
プロモーション広告システムとその利用者
13
広告主様 ヤフーを訪れた
ユーザー様
メディア担当様
広告配信
システム
広告管理
システム
パートナー
管理システム
集計システム分析システム広告業務
担当
広告 広告 配信結果
レポート
配信面のチューニング
レポート
ログ
集計データ
集計データ
分析結果
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
数字で見るプロモーション広告システム
14
広告主様 ヤフーを訪れた
ユーザー様
メディア担当様
広告配信
システム
広告管理
システム
パートナー
管理システム
集計システム分析システム広告業務
担当
広告 広告 配信結果
レポート
配信面のチューニング
レポート
ログ
集計データ
集計データ
分析結果
※1 出典:ヤフー株式会社 2017年度 第1四半期 事業指標推移表
※2 YDB+スポンサードサーチのレポート作成数
月間 約4400万
レポート作成
(※2)
月間 約725億PV
(※1)
月間 約150TB
(※3)
※3YDNのデータ量/gz圧縮済み
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
本日お話する対象システム
15
広告主様 ヤフーを訪れた
ユーザー様
メディア担当様
広告配信
システム
広告管理
システム
パートナー
管理システム
集計システム分析システム広告業務
担当
広告 広告 配信結果
レポート
配信面のチューニング
レポート
ログ
集計データ
集計データ
分析結果
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
現在のシステム構成(YDN)
16
Oracle
(OLTP)
Oracle
(Batch)
統計
広告入稿
レポート Hadoop
集計
Teradata
(DWH) パートナー
配信Data Pipeline
広告運用
分析/業務
メディア担当様
Isilon
(Storage)
配信面運用
広告主様
ヤフーを訪れた
ユーザー様
広告業務
担当
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
現在のシステム構成(YDN)
17
Oracle
(OLTP)
Oracle
(Batch)
統計
広告入稿
レポート Hadoop
集計
Teradata
(DWH) パートナー
配信Data Pipeline
広告業務
担当
広告運用
分析/業務
メディア担当様
Isilon
(Storage)
配信面運用
広告主様
ヤフーを訪れた
ユーザー様
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
現在のシステム構成(YDN)
18
Oracle
(OLTP)
Oracle
(Batch)
統計
広告入稿
レポート Hadoop
集計
Teradata
(DWH) パートナー
配信Data Pipeline
広告運用
分析/業務
メディア担当様
Isilon
(Storage)
配信面運用
広告主様
ヤフーを訪れた
ユーザー様
広告業務
担当
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
現在のシステム構成(YDN)
19
Oracle
(OLTP)
Oracle
(Batch)
統計
広告入稿
レポート Hadoop
集計
Teradata
(DWH) パートナー
配信Data Pipeline
広告運用
分析/業務
メディア担当様
Isilon
(Storage)
配信面運用
広告主様
ヤフーを訪れた
ユーザー様
広告業務
担当
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
現在のシステム構成(YDN)
20
Oracle
(OLTP)
Oracle
(Batch)
統計
広告入稿
レポート Hadoop
集計
Teradata
(DWH) パートナー
配信Data Pipeline
広告運用
分析/業務
メディア担当様
Isilon
(Storage)
配信面運用
広告主様
ヤフーを訪れた
ユーザー様
広告業務
担当
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
現在のシステム構成(YDN)
21
Oracle
(OLTP)
Oracle
(Batch)
統計
広告入稿
レポート Hadoop
集計
Teradata
(DWH) パートナー
配信Data Pipeline
広告運用
分析/業務
メディア担当様
Isilon
(Storage)
配信面運用
広告主様
ヤフーを訪れた
ユーザー様
広告業務
担当
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
補足:統計とレポートの違い
22
• 両方とも配信の実績を確認するツール
• 統計で概要を確認し、レポートで詳細を分析する
機能 I/F 種別 速度 自由度
統計 画面
リアル
タイム型
数秒 低い
レポート
ファイル
DL
バッチ型 数十秒〜数分 高い
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
1. Yahoo!プロモーション広告と現在の
システム
2. 現在の課題
3. 今後の展望と事例
23
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
ヤフーの広告事業は堅調
24出典:2017年度第1四半期決算発表 プレゼンテーション資料
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
その裏側では
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
スポンサードサーチ 広告入稿量
26
2年間で約3倍
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
YDN 配信ログ量
27
2年間で約3.6倍
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
YDN レポート作成数
28
2年間で約3倍
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
利用が増えることでシステムの負荷も増える
29
Oracle
(OLTP)
Oracle
(Batch)
広告入稿
統計
レポート Hadoop
集計
Teradata
(DWH) パートナー
配信Data Pipeline
広告運用
分析/業務
メディア担当様
Isilon
(Storage)
配信面運用
広告主様
ヤフーを訪れた
ユーザー様
配信ログ量 増レポート作成数 増
広告入稿量 増
広告業務
担当
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
影響:レポートのスループット低下
30
Oracle
(OLTP)
Oracle
(Batch)
広告入稿
統計
レポート Hadoop
集計
Teradata
(DWH) パートナー
配信Data Pipeline
広告運用
分析/業務
メディア担当様
Isilon
(Storage)
配信面運用
広告主様
ヤフーを訪れた
ユーザー様
YDNレポートの
作成要求に対して
処理が追いつかなくなってきた
広告業務
担当
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
影響: RDBのレイテンシ低下
31
Oracle
(OLTP)
Oracle
(Batch)
広告入稿
統計
レポート Hadoop
集計
Teradata
(DWH) パートナー
配信Data Pipeline
広告運用
分析/業務
メディア担当様
Isilon
(Storage)
配信面運用
広告主様
ヤフーを訪れた
ユーザー様
統計情報を参照する際の
レイテンシが低下しはじめた
広告業務
担当
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
データプラットフォームのミッション
Yahoo!プロモーション広告のPFを
利用している人たちのストレスを無くすこと
32
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
データプラットフォームのストレスとは?
33
• 遅い
- レイテンシの低下
- データの反映遅延(リアルタイム性)
• 使えない
- 稼働率の低下
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
データプラットフォームのストレスとは?
34
• 遅い
- レイテンシの低下
- データの反映遅延(リアルタイム性)
• 使えない
- 稼働率の低下
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
広告主様が感じるストレス
35
• 遅い
- レイテンシの低下
→ 統計画面の表示
→ YDNレポート作成
- データの反映遅延(リアルタイム性)
• 使えない
- 稼働率の低下
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
ストレスにどう対処していくか?
36
1. 処理リソースを増やす
2. 定期的に技術を見直す
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
ストレスにどう対処していくか?
37
1. 処理リソースを増やす
2. 定期的に技術を見直す
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
どういうアプローチか?
38
必要なリソース
時間
キャパシティ
トラフィック、必要な計算リソース
オーバーキャパシティ
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
1.処理リソースを増やす
39
必要なリソース
時間
トラフィック、必要な計算リソース
キャパシティ
サーバ追加でキャパシティの上限値をあげる
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
では、それ以上増えたら?
40
必要なリソース
時間
トラフィック、必要な計算リソース
キャパシティ
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
リソースを追加しつづけることはできない
41
• 費用対効果が合わない
• どこかにボトルネックが生まれるので
永遠にスケールアウトし続けることは
できない
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
ストレスにどう対処していくか?
42
1. 処理リソースを増やす
2. 定期的に技術を見直す
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
2.定期的に技術を見直す
43
必要なリソース
時間
トラフィック、必要な計算リソース
アーキテクチャ
を見直して効率
を良くする
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
現在の課題は?
44
1. 処理リソースを増やす
→ RDBがそもそもスケールアウト
しにくい構成
2. 定期的に技術を見直す
→ YDNレポートのトラフィックの伸びに
対してリソースが不足してきた
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
1. Yahoo!プロモーション広告と現在の
システム
2. 現在の課題
3. 今後の展望と事例
45
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
どこを見直すのか
46
Oracle
(OLTP)
Oracle
(Batch)
広告入稿
統計
レポート Hadoop
集計
Teradata
(DWH) パートナー
配信Data Pipeline
広告運用
分析/業務
メディア担当様
Isilon
(Storage)
配信面運用
広告主様
ヤフーを訪れた
ユーザー様
2.利用している技術を
見直し、リソースの
利用効率をあげる
1.RDB一辺倒からユース
ケース毎にデータPFを
使い分け、増え続ける
データ量に対応する
広告業務
担当
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
データプラットフォーム見直しの方針
47
• 大方針としては、全てOracleを利用するのではなく、
ユースケースを見極めて、プラットフォームを
分散させる
• 分散させたデータを繋ぐためにマルチデータソース
にアクセスできるPrestoを採用する
• トランザクション管理が必要なものは従来通り
Oracleを使用する
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
今後の展望
※まだ導入してません
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
今後の展望(全体像)
49
Oracle
(OLTP)
広告入稿
統計
レポート Hadoop
(HDFS)
集計
広告運用
Presto
(クエリエンジン)
HBase/Phoenix
(KVS)
TBD
(Cache)
SQLレイヤ Cacheレイヤ 永続化レイヤ ストレージレイヤ
広告主様
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
1.スケールアウト構成+Cache
50
Oracle
(OLTP)
広告入稿
統計
レポート Hadoop
(HDFS)
集計
広告運用
Presto
(クエリエンジン)
HBase/Phoenix
(KVS)
TBD
(Cache)
分離した入稿データと統計
データをジョインするため
クエリエンジンとして
Prestoを利用
統計
データ
入稿
データ
(Cache)
入稿
データ
広告主様
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
2.技術の見直し(Hive → Presto)
51
Oracle
(OLTP)
広告入稿
統計
レポート Hadoop
(HDFS)
集計
広告運用
広告主様
Presto
(クエリエンジン)
HBase/Phoenix
(KVS)
TBD
(Cache)
レポート
データ
YDNレポートで利用しているHive を
Presto + HDFSへ切り替える
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
検証した結果
※まだ導入してません
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
1.HBase/Phoenix
53
• サーバ30台
• 1,6,12,24,48並列で実行
• テーブルレコードは22億行
• 大中小150アカウントを選び
3回実行(450Query )
• 22億件から1件〜300件程度
抽出するパターン
- 0.04秒〜1.06秒(48並列)に
収まる
Response Time
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
2.Presto
54
• HiveとPrestoの比較
• サーバ13台
• 1,2,4,8,16,32並列で実行
- スループットがHiveの8倍以
上(32並列)
- レスポンスタイムもHiveの8
倍速い(32並列)
- 並列度を増やしても劣化が少
ない
Request per Hour
Total Response Time
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
まとめ
• Yahoo!プロモーション広告はYahoo!サービスの
膨大なトラフィックが集まる
また、その伸びも速い
• トラフィックの伸びに追従するにはリソースの
追加と技術を定期的に見直すことが必要
• 新しい技術に触れ、成果が目に見えやすい
55
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
最後に
詳細はこの後の懇親会でお話しましょう!
56
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
ありがとうございました!

Weitere ähnliche Inhalte

Was ist angesagt?

イベント・ソーシングを知る
イベント・ソーシングを知るイベント・ソーシングを知る
イベント・ソーシングを知る
Shuhei Fujita
 
Apache Arrow - データ処理ツールの次世代プラットフォーム
Apache Arrow - データ処理ツールの次世代プラットフォームApache Arrow - データ処理ツールの次世代プラットフォーム
Apache Arrow - データ処理ツールの次世代プラットフォーム
Kouhei Sutou
 

Was ist angesagt? (20)

シリコンバレーの「何が」凄いのか
シリコンバレーの「何が」凄いのかシリコンバレーの「何が」凄いのか
シリコンバレーの「何が」凄いのか
 
Apache Spark on Kubernetes入門(Open Source Conference 2021 Online Hiroshima 発表資料)
Apache Spark on Kubernetes入門(Open Source Conference 2021 Online Hiroshima 発表資料)Apache Spark on Kubernetes入門(Open Source Conference 2021 Online Hiroshima 発表資料)
Apache Spark on Kubernetes入門(Open Source Conference 2021 Online Hiroshima 発表資料)
 
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
 
Planet-scale Data Ingestion Pipeline: Bigdam
Planet-scale Data Ingestion Pipeline: BigdamPlanet-scale Data Ingestion Pipeline: Bigdam
Planet-scale Data Ingestion Pipeline: Bigdam
 
楽天における大規模データベースの運用
楽天における大規模データベースの運用楽天における大規模データベースの運用
楽天における大規模データベースの運用
 
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
Apache Spark の紹介(前半:Sparkのキホン)
Apache Spark の紹介(前半:Sparkのキホン)Apache Spark の紹介(前半:Sparkのキホン)
Apache Spark の紹介(前半:Sparkのキホン)
 
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
 
はじめてのElasticsearchクラスタ
はじめてのElasticsearchクラスタはじめてのElasticsearchクラスタ
はじめてのElasticsearchクラスタ
 
ゼロから始めるSparkSQL徹底活用!
ゼロから始めるSparkSQL徹底活用!ゼロから始めるSparkSQL徹底活用!
ゼロから始めるSparkSQL徹底活用!
 
忙しい人の5分で分かるMesos入門 - Mesos って何だ?
忙しい人の5分で分かるMesos入門 - Mesos って何だ?忙しい人の5分で分かるMesos入門 - Mesos って何だ?
忙しい人の5分で分かるMesos入門 - Mesos って何だ?
 
Power BI を提案してみた件
Power BI を提案してみた件Power BI を提案してみた件
Power BI を提案してみた件
 
イベント・ソーシングを知る
イベント・ソーシングを知るイベント・ソーシングを知る
イベント・ソーシングを知る
 
Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理
 
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
 
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版) データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
データウェアハウスモデリング入門(ダイジェスト版)(事前公開版)
 
Apache Arrow - データ処理ツールの次世代プラットフォーム
Apache Arrow - データ処理ツールの次世代プラットフォームApache Arrow - データ処理ツールの次世代プラットフォーム
Apache Arrow - データ処理ツールの次世代プラットフォーム
 
リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例
 
並行処理初心者のためのAkka入門
並行処理初心者のためのAkka入門並行処理初心者のためのAkka入門
並行処理初心者のためのAkka入門
 

Andere mochten auch

Yahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnight
Yahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnightYahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnight
Yahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnight
Yahoo!デベロッパーネットワーク
 

Andere mochten auch (20)

Yahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnight
Yahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnightYahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnight
Yahoo! JAPANが持つデータ分析ソリューションの紹介 #yjdsnight
 
マルチビッグデータの活用を支える DWHの作り方
マルチビッグデータの活用を支える DWHの作り方マルチビッグデータの活用を支える DWHの作り方
マルチビッグデータの活用を支える DWHの作り方
 
Presto in Yahoo! JAPAN #yjdsnight
Presto in Yahoo! JAPAN #yjdsnightPresto in Yahoo! JAPAN #yjdsnight
Presto in Yahoo! JAPAN #yjdsnight
 
ICML2017 参加報告会 山本康生
ICML2017 参加報告会 山本康生ICML2017 参加報告会 山本康生
ICML2017 参加報告会 山本康生
 
Hive on Tezのベストプラクティス
Hive on TezのベストプラクティスHive on Tezのベストプラクティス
Hive on Tezのベストプラクティス
 
AMPと広告とOpenRTBと #yjmu
AMPと広告とOpenRTBと #yjmuAMPと広告とOpenRTBと #yjmu
AMPと広告とOpenRTBと #yjmu
 
僕とヤフーと時々Teradata #prestodb
僕とヤフーと時々Teradata #prestodb僕とヤフーと時々Teradata #prestodb
僕とヤフーと時々Teradata #prestodb
 
ヤフーオープンローカルプラットフォームの設計思想
ヤフーオープンローカルプラットフォームの設計思想ヤフーオープンローカルプラットフォームの設計思想
ヤフーオープンローカルプラットフォームの設計思想
 
Kafka・Storm・ZooKeeperの認証と認可について #kafkajp
Kafka・Storm・ZooKeeperの認証と認可について #kafkajpKafka・Storm・ZooKeeperの認証と認可について #kafkajp
Kafka・Storm・ZooKeeperの認証と認可について #kafkajp
 
Yahoo! JAPANのCloud Foundry導入状況
Yahoo! JAPANのCloud Foundry導入状況Yahoo! JAPANのCloud Foundry導入状況
Yahoo! JAPANのCloud Foundry導入状況
 
ビックデータ処理技術の全体像とリクルートでの使い分け
ビックデータ処理技術の全体像とリクルートでの使い分けビックデータ処理技術の全体像とリクルートでの使い分け
ビックデータ処理技術の全体像とリクルートでの使い分け
 
IT業界のリーディングカンパニーとして描く「少し先の未来」〜Yahoo! JAPANの事例を通して〜#a11yfuture
IT業界のリーディングカンパニーとして描く「少し先の未来」〜Yahoo! JAPANの事例を通して〜#a11yfutureIT業界のリーディングカンパニーとして描く「少し先の未来」〜Yahoo! JAPANの事例を通して〜#a11yfuture
IT業界のリーディングカンパニーとして描く「少し先の未来」〜Yahoo! JAPANの事例を通して〜#a11yfuture
 
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
 
Rakutenとsreと私 yanagimoto koichi
Rakutenとsreと私 yanagimoto koichiRakutenとsreと私 yanagimoto koichi
Rakutenとsreと私 yanagimoto koichi
 
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
 
Yahoo! JAPANを支えるビッグデータプラットフォーム技術
Yahoo! JAPANを支えるビッグデータプラットフォーム技術Yahoo! JAPANを支えるビッグデータプラットフォーム技術
Yahoo! JAPANを支えるビッグデータプラットフォーム技術
 
What i learned from translation of the sre ryuji tamagawa
What i learned from translation of the sre ryuji tamagawaWhat i learned from translation of the sre ryuji tamagawa
What i learned from translation of the sre ryuji tamagawa
 
銀行ロビーアシスタント
銀行ロビーアシスタント銀行ロビーアシスタント
銀行ロビーアシスタント
 
Kafka Connect(Japanese)
Kafka Connect(Japanese)Kafka Connect(Japanese)
Kafka Connect(Japanese)
 
Life of an enginner in rakuten osaka diarmaid lindsay
Life of an enginner in rakuten osaka diarmaid lindsayLife of an enginner in rakuten osaka diarmaid lindsay
Life of an enginner in rakuten osaka diarmaid lindsay
 

Ähnlich wie Yahoo!プロモーション広告のビックデータ基盤を支える技術と今後の展望

データの見える化で進めるデータドリブンカンパニー #devsumiC
データの見える化で進めるデータドリブンカンパニー #devsumiCデータの見える化で進めるデータドリブンカンパニー #devsumiC
データの見える化で進めるデータドリブンカンパニー #devsumiC
Yahoo!デベロッパーネットワーク
 
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試みデータテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
Yahoo!デベロッパーネットワーク
 
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)
Ryusuke Ashiya
 
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
Yahoo!デベロッパーネットワーク
 
プランニングツールにおけるインタラクティブな可視化を支えるバックエンド
プランニングツールにおけるインタラクティブな可視化を支えるバックエンドプランニングツールにおけるインタラクティブな可視化を支えるバックエンド
プランニングツールにおけるインタラクティブな可視化を支えるバックエンド
Yahoo!デベロッパーネットワーク
 
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
Amazon Web Services Japan
 

Ähnlich wie Yahoo!プロモーション広告のビックデータ基盤を支える技術と今後の展望 (20)

データの見える化で進めるデータドリブンカンパニー #devsumiC
データの見える化で進めるデータドリブンカンパニー #devsumiCデータの見える化で進めるデータドリブンカンパニー #devsumiC
データの見える化で進めるデータドリブンカンパニー #devsumiC
 
SHANON Marketing Conference 2017_シャノンも選んだTableauがあなたの会社のデータを語らせます
SHANON Marketing Conference 2017_シャノンも選んだTableauがあなたの会社のデータを語らせますSHANON Marketing Conference 2017_シャノンも選んだTableauがあなたの会社のデータを語らせます
SHANON Marketing Conference 2017_シャノンも選んだTableauがあなたの会社のデータを語らせます
 
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試みデータテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
 
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)
分析のモダナイズへのヒント:データ価値を最大化するビジュアル分析とエンタープライズ組織への展開 - 経営課題解決シンポジウム (2018/09/28)
 
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
 
リクルート式Hadoopの使い方
リクルート式Hadoopの使い方リクルート式Hadoopの使い方
リクルート式Hadoopの使い方
 
絶対にタダでは転ばない広告エンジニア #yjmu
絶対にタダでは転ばない広告エンジニア #yjmu絶対にタダでは転ばない広告エンジニア #yjmu
絶対にタダでは転ばない広告エンジニア #yjmu
 
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
Yahoo! JAPAN MeetUp #8 (インフラ技術カンファレンス)セッション①
 
大規模インフラで考える インフラチームの未来
大規模インフラで考える インフラチームの未来大規模インフラで考える インフラチームの未来
大規模インフラで考える インフラチームの未来
 
Beginner must-see! A future that can be opened by learning Hadoop
Beginner must-see! A future that can be opened by learning HadoopBeginner must-see! A future that can be opened by learning Hadoop
Beginner must-see! A future that can be opened by learning Hadoop
 
キャップジェミニ、あなたの『RISE WITH SAP』のパートナーです
キャップジェミニ、あなたの『RISE WITH SAP』のパートナーですキャップジェミニ、あなたの『RISE WITH SAP』のパートナーです
キャップジェミニ、あなたの『RISE WITH SAP』のパートナーです
 
私たち企業がアクセシビリティに取り組む理由(2018年) #accfes
私たち企業がアクセシビリティに取り組む理由(2018年) #accfes私たち企業がアクセシビリティに取り組む理由(2018年) #accfes
私たち企業がアクセシビリティに取り組む理由(2018年) #accfes
 
プログラムせずに実現する!Amazon Redshift分析・活用環境
プログラムせずに実現する!Amazon Redshift分析・活用環境プログラムせずに実現する!Amazon Redshift分析・活用環境
プログラムせずに実現する!Amazon Redshift分析・活用環境
 
Base 20141011 1_for_slideshre
Base 20141011 1_for_slideshreBase 20141011 1_for_slideshre
Base 20141011 1_for_slideshre
 
プランニングツールにおけるインタラクティブな可視化を支えるバックエンド
プランニングツールにおけるインタラクティブな可視化を支えるバックエンドプランニングツールにおけるインタラクティブな可視化を支えるバックエンド
プランニングツールにおけるインタラクティブな可視化を支えるバックエンド
 
[data analytics showcase] A12: データに隠された課題、ちゃんと見えていますか? by Tableau Japan 株式会社 ...
[data analytics showcase] A12: データに隠された課題、ちゃんと見えていますか? by Tableau Japan 株式会社 ...[data analytics showcase] A12: データに隠された課題、ちゃんと見えていますか? by Tableau Japan 株式会社 ...
[data analytics showcase] A12: データに隠された課題、ちゃんと見えていますか? by Tableau Japan 株式会社 ...
 
超高速開発の基礎概念 20141119 0
超高速開発の基礎概念 20141119 0超高速開発の基礎概念 20141119 0
超高速開発の基礎概念 20141119 0
 
株式会社リブセンス会社説明資料(転職エージェント企業様向け)
株式会社リブセンス会社説明資料(転職エージェント企業様向け)株式会社リブセンス会社説明資料(転職エージェント企業様向け)
株式会社リブセンス会社説明資料(転職エージェント企業様向け)
 
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
 
最若手メンバーこそチャンス!チーム改善に取り組んでわかったこと
最若手メンバーこそチャンス!チーム改善に取り組んでわかったこと最若手メンバーこそチャンス!チーム改善に取り組んでわかったこと
最若手メンバーこそチャンス!チーム改善に取り組んでわかったこと
 

Mehr von Yahoo!デベロッパーネットワーク

Mehr von Yahoo!デベロッパーネットワーク (20)

ゼロから始める転移学習
ゼロから始める転移学習ゼロから始める転移学習
ゼロから始める転移学習
 
継続的なモデルモニタリングを実現するKubernetes Operator
継続的なモデルモニタリングを実現するKubernetes Operator継続的なモデルモニタリングを実現するKubernetes Operator
継続的なモデルモニタリングを実現するKubernetes Operator
 
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるかヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
 
オンプレML基盤on Kubernetes パネルディスカッション
オンプレML基盤on Kubernetes パネルディスカッションオンプレML基盤on Kubernetes パネルディスカッション
オンプレML基盤on Kubernetes パネルディスカッション
 
LakeTahoe
LakeTahoeLakeTahoe
LakeTahoe
 
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
 
Persistent-memory-native Database High-availability Feature
Persistent-memory-native Database High-availability FeaturePersistent-memory-native Database High-availability Feature
Persistent-memory-native Database High-availability Feature
 
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
 
eコマースと実店舗の相互利益を目指したデザイン #yjtc
eコマースと実店舗の相互利益を目指したデザイン #yjtceコマースと実店舗の相互利益を目指したデザイン #yjtc
eコマースと実店舗の相互利益を目指したデザイン #yjtc
 
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtcヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
 
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtcYahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
 
ビッグデータから人々のムードを捉える #yjtc
ビッグデータから人々のムードを捉える #yjtcビッグデータから人々のムードを捉える #yjtc
ビッグデータから人々のムードを捉える #yjtc
 
サイエンス領域におけるMLOpsの取り組み #yjtc
サイエンス領域におけるMLOpsの取り組み #yjtcサイエンス領域におけるMLOpsの取り組み #yjtc
サイエンス領域におけるMLOpsの取り組み #yjtc
 
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtcヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
 
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtcYahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
 
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
 
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtcPC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
 
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtcモブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
 
「新しいおうち探し」のためのAIアシスト検索 #yjtc
「新しいおうち探し」のためのAIアシスト検索 #yjtc「新しいおうち探し」のためのAIアシスト検索 #yjtc
「新しいおうち探し」のためのAIアシスト検索 #yjtc
 
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtcユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
 

Kürzlich hochgeladen

Kürzlich hochgeladen (11)

Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 

Yahoo!プロモーション広告のビックデータ基盤を支える技術と今後の展望

  • 1. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 2017年9月15日 Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. ヤフー株式会社 東浩稔 Yahoo!プロモーション広告の ビックデータ基盤を 支える技術と今後の展望
  • 2. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 自己紹介 東 浩稔(あずま ひろとし) 所属:マーケティングソリューションズカンパニー 開発本部 パフォーマンスデータPF開発部 プロモーション広告のデータPF全般について、アーキテクチャの刷新や パフォーマンスの改善を担当 経歴: 2012年中途入社。現在3社目 1社目:製造業(ITエンジニアではない) 2社目:証券系SIer 3社目:Yahoo!ディスプレイアドネットワーク(以下、YDN)のレポート開発や集計シス テムのリードエンジニアを担当し、今年度より現在の業務を担当。 2
  • 3. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. アジェンダ 1. Yahoo!プロモーション広告と現在の システム 2. 現在の課題 3. 今後の展望と事例 3
  • 4. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 1. Yahoo!プロモーション広告と現在の システム 2. 現在の課題 3. 今後の展望と事例 4
  • 5. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. データプラットフォームのミッション Yahoo!プロモーション広告のPFを 利用している人たちのストレスを無くす 5
  • 6. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. データプラットフォームのミッション Yahoo!プロモーション広告のPFを 利用している人たちのストレスを無くす 6
  • 7. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. Yahoo!プロモーション広告 7
  • 8. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. プロモーション広告システムとその利用者 8 広告主様 ヤフーを訪れた ユーザー様 メディア担当様 広告配信 システム 広告管理 システム パートナー 管理システム 集計システム分析システム広告業務 担当 広告 広告 配信結果 レポート 配信面のチューニング レポート ログ 集計データ 集計データ 分析結果
  • 9. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. プロモーション広告システムとその利用者 9 広告主様 ヤフーを訪れた ユーザー様 メディア担当様 広告配信 システム 広告管理 システム パートナー 管理システム 集計システム分析システム広告業務 担当 広告 広告 配信結果 レポート 配信面のチューニング レポート ログ 集計データ 集計データ 分析結果
  • 10. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. プロモーション広告システムとその利用者 10 広告主様 ヤフーを訪れた ユーザー様 メディア担当様 広告配信 システム 広告管理 システム パートナー 管理システム 集計システム分析システム広告業務 担当 広告 広告 配信結果 レポート 配信面のチューニング レポート ログ 集計データ 集計データ 分析結果
  • 11. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. プロモーション広告システムとその利用者 11 広告主様 ヤフーを訪れた ユーザー様 メディア担当様 広告配信 システム 広告管理 システム パートナー 管理システム 集計システム分析システム広告業務 担当 広告 広告 配信結果 レポート 配信面のチューニング レポート ログ 集計データ 集計データ 分析結果
  • 12. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. プロモーション広告システムとその利用者 12 広告主様 ヤフーを訪れた ユーザー様 メディア担当様 広告配信 システム 広告管理 システム パートナー 管理システム 集計システム分析システム広告業務 担当 広告 広告 配信結果 レポート 配信面のチューニング レポート ログ 集計データ 集計データ 分析結果
  • 13. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. プロモーション広告システムとその利用者 13 広告主様 ヤフーを訪れた ユーザー様 メディア担当様 広告配信 システム 広告管理 システム パートナー 管理システム 集計システム分析システム広告業務 担当 広告 広告 配信結果 レポート 配信面のチューニング レポート ログ 集計データ 集計データ 分析結果
  • 14. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 数字で見るプロモーション広告システム 14 広告主様 ヤフーを訪れた ユーザー様 メディア担当様 広告配信 システム 広告管理 システム パートナー 管理システム 集計システム分析システム広告業務 担当 広告 広告 配信結果 レポート 配信面のチューニング レポート ログ 集計データ 集計データ 分析結果 ※1 出典:ヤフー株式会社 2017年度 第1四半期 事業指標推移表 ※2 YDB+スポンサードサーチのレポート作成数 月間 約4400万 レポート作成 (※2) 月間 約725億PV (※1) 月間 約150TB (※3) ※3YDNのデータ量/gz圧縮済み
  • 15. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 本日お話する対象システム 15 広告主様 ヤフーを訪れた ユーザー様 メディア担当様 広告配信 システム 広告管理 システム パートナー 管理システム 集計システム分析システム広告業務 担当 広告 広告 配信結果 レポート 配信面のチューニング レポート ログ 集計データ 集計データ 分析結果
  • 16. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 現在のシステム構成(YDN) 16 Oracle (OLTP) Oracle (Batch) 統計 広告入稿 レポート Hadoop 集計 Teradata (DWH) パートナー 配信Data Pipeline 広告運用 分析/業務 メディア担当様 Isilon (Storage) 配信面運用 広告主様 ヤフーを訪れた ユーザー様 広告業務 担当
  • 17. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 現在のシステム構成(YDN) 17 Oracle (OLTP) Oracle (Batch) 統計 広告入稿 レポート Hadoop 集計 Teradata (DWH) パートナー 配信Data Pipeline 広告業務 担当 広告運用 分析/業務 メディア担当様 Isilon (Storage) 配信面運用 広告主様 ヤフーを訪れた ユーザー様
  • 18. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 現在のシステム構成(YDN) 18 Oracle (OLTP) Oracle (Batch) 統計 広告入稿 レポート Hadoop 集計 Teradata (DWH) パートナー 配信Data Pipeline 広告運用 分析/業務 メディア担当様 Isilon (Storage) 配信面運用 広告主様 ヤフーを訪れた ユーザー様 広告業務 担当
  • 19. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 現在のシステム構成(YDN) 19 Oracle (OLTP) Oracle (Batch) 統計 広告入稿 レポート Hadoop 集計 Teradata (DWH) パートナー 配信Data Pipeline 広告運用 分析/業務 メディア担当様 Isilon (Storage) 配信面運用 広告主様 ヤフーを訪れた ユーザー様 広告業務 担当
  • 20. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 現在のシステム構成(YDN) 20 Oracle (OLTP) Oracle (Batch) 統計 広告入稿 レポート Hadoop 集計 Teradata (DWH) パートナー 配信Data Pipeline 広告運用 分析/業務 メディア担当様 Isilon (Storage) 配信面運用 広告主様 ヤフーを訪れた ユーザー様 広告業務 担当
  • 21. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 現在のシステム構成(YDN) 21 Oracle (OLTP) Oracle (Batch) 統計 広告入稿 レポート Hadoop 集計 Teradata (DWH) パートナー 配信Data Pipeline 広告運用 分析/業務 メディア担当様 Isilon (Storage) 配信面運用 広告主様 ヤフーを訪れた ユーザー様 広告業務 担当
  • 22. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 補足:統計とレポートの違い 22 • 両方とも配信の実績を確認するツール • 統計で概要を確認し、レポートで詳細を分析する 機能 I/F 種別 速度 自由度 統計 画面 リアル タイム型 数秒 低い レポート ファイル DL バッチ型 数十秒〜数分 高い
  • 23. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 1. Yahoo!プロモーション広告と現在の システム 2. 現在の課題 3. 今後の展望と事例 23
  • 24. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. ヤフーの広告事業は堅調 24出典:2017年度第1四半期決算発表 プレゼンテーション資料
  • 25. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. その裏側では
  • 26. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. スポンサードサーチ 広告入稿量 26 2年間で約3倍
  • 27. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. YDN 配信ログ量 27 2年間で約3.6倍
  • 28. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. YDN レポート作成数 28 2年間で約3倍
  • 29. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 利用が増えることでシステムの負荷も増える 29 Oracle (OLTP) Oracle (Batch) 広告入稿 統計 レポート Hadoop 集計 Teradata (DWH) パートナー 配信Data Pipeline 広告運用 分析/業務 メディア担当様 Isilon (Storage) 配信面運用 広告主様 ヤフーを訪れた ユーザー様 配信ログ量 増レポート作成数 増 広告入稿量 増 広告業務 担当
  • 30. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 影響:レポートのスループット低下 30 Oracle (OLTP) Oracle (Batch) 広告入稿 統計 レポート Hadoop 集計 Teradata (DWH) パートナー 配信Data Pipeline 広告運用 分析/業務 メディア担当様 Isilon (Storage) 配信面運用 広告主様 ヤフーを訪れた ユーザー様 YDNレポートの 作成要求に対して 処理が追いつかなくなってきた 広告業務 担当
  • 31. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 影響: RDBのレイテンシ低下 31 Oracle (OLTP) Oracle (Batch) 広告入稿 統計 レポート Hadoop 集計 Teradata (DWH) パートナー 配信Data Pipeline 広告運用 分析/業務 メディア担当様 Isilon (Storage) 配信面運用 広告主様 ヤフーを訪れた ユーザー様 統計情報を参照する際の レイテンシが低下しはじめた 広告業務 担当
  • 32. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. データプラットフォームのミッション Yahoo!プロモーション広告のPFを 利用している人たちのストレスを無くすこと 32
  • 33. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. データプラットフォームのストレスとは? 33 • 遅い - レイテンシの低下 - データの反映遅延(リアルタイム性) • 使えない - 稼働率の低下
  • 34. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. データプラットフォームのストレスとは? 34 • 遅い - レイテンシの低下 - データの反映遅延(リアルタイム性) • 使えない - 稼働率の低下
  • 35. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 広告主様が感じるストレス 35 • 遅い - レイテンシの低下 → 統計画面の表示 → YDNレポート作成 - データの反映遅延(リアルタイム性) • 使えない - 稼働率の低下
  • 36. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. ストレスにどう対処していくか? 36 1. 処理リソースを増やす 2. 定期的に技術を見直す
  • 37. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. ストレスにどう対処していくか? 37 1. 処理リソースを増やす 2. 定期的に技術を見直す
  • 38. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. どういうアプローチか? 38 必要なリソース 時間 キャパシティ トラフィック、必要な計算リソース オーバーキャパシティ
  • 39. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 1.処理リソースを増やす 39 必要なリソース 時間 トラフィック、必要な計算リソース キャパシティ サーバ追加でキャパシティの上限値をあげる
  • 40. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. では、それ以上増えたら? 40 必要なリソース 時間 トラフィック、必要な計算リソース キャパシティ
  • 41. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. リソースを追加しつづけることはできない 41 • 費用対効果が合わない • どこかにボトルネックが生まれるので 永遠にスケールアウトし続けることは できない
  • 42. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. ストレスにどう対処していくか? 42 1. 処理リソースを増やす 2. 定期的に技術を見直す
  • 43. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 2.定期的に技術を見直す 43 必要なリソース 時間 トラフィック、必要な計算リソース アーキテクチャ を見直して効率 を良くする
  • 44. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 現在の課題は? 44 1. 処理リソースを増やす → RDBがそもそもスケールアウト しにくい構成 2. 定期的に技術を見直す → YDNレポートのトラフィックの伸びに 対してリソースが不足してきた
  • 45. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 1. Yahoo!プロモーション広告と現在の システム 2. 現在の課題 3. 今後の展望と事例 45
  • 46. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. どこを見直すのか 46 Oracle (OLTP) Oracle (Batch) 広告入稿 統計 レポート Hadoop 集計 Teradata (DWH) パートナー 配信Data Pipeline 広告運用 分析/業務 メディア担当様 Isilon (Storage) 配信面運用 広告主様 ヤフーを訪れた ユーザー様 2.利用している技術を 見直し、リソースの 利用効率をあげる 1.RDB一辺倒からユース ケース毎にデータPFを 使い分け、増え続ける データ量に対応する 広告業務 担当
  • 47. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. データプラットフォーム見直しの方針 47 • 大方針としては、全てOracleを利用するのではなく、 ユースケースを見極めて、プラットフォームを 分散させる • 分散させたデータを繋ぐためにマルチデータソース にアクセスできるPrestoを採用する • トランザクション管理が必要なものは従来通り Oracleを使用する
  • 48. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 今後の展望 ※まだ導入してません
  • 49. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 今後の展望(全体像) 49 Oracle (OLTP) 広告入稿 統計 レポート Hadoop (HDFS) 集計 広告運用 Presto (クエリエンジン) HBase/Phoenix (KVS) TBD (Cache) SQLレイヤ Cacheレイヤ 永続化レイヤ ストレージレイヤ 広告主様
  • 50. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 1.スケールアウト構成+Cache 50 Oracle (OLTP) 広告入稿 統計 レポート Hadoop (HDFS) 集計 広告運用 Presto (クエリエンジン) HBase/Phoenix (KVS) TBD (Cache) 分離した入稿データと統計 データをジョインするため クエリエンジンとして Prestoを利用 統計 データ 入稿 データ (Cache) 入稿 データ 広告主様
  • 51. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 2.技術の見直し(Hive → Presto) 51 Oracle (OLTP) 広告入稿 統計 レポート Hadoop (HDFS) 集計 広告運用 広告主様 Presto (クエリエンジン) HBase/Phoenix (KVS) TBD (Cache) レポート データ YDNレポートで利用しているHive を Presto + HDFSへ切り替える
  • 52. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 検証した結果 ※まだ導入してません
  • 53. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 1.HBase/Phoenix 53 • サーバ30台 • 1,6,12,24,48並列で実行 • テーブルレコードは22億行 • 大中小150アカウントを選び 3回実行(450Query ) • 22億件から1件〜300件程度 抽出するパターン - 0.04秒〜1.06秒(48並列)に 収まる Response Time
  • 54. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 2.Presto 54 • HiveとPrestoの比較 • サーバ13台 • 1,2,4,8,16,32並列で実行 - スループットがHiveの8倍以 上(32並列) - レスポンスタイムもHiveの8 倍速い(32並列) - 並列度を増やしても劣化が少 ない Request per Hour Total Response Time
  • 55. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. まとめ • Yahoo!プロモーション広告はYahoo!サービスの 膨大なトラフィックが集まる また、その伸びも速い • トラフィックの伸びに追従するにはリソースの 追加と技術を定期的に見直すことが必要 • 新しい技術に触れ、成果が目に見えやすい 55
  • 56. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 最後に 詳細はこの後の懇親会でお話しましょう! 56
  • 57. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. ありがとうございました!