SlideShare ist ein Scribd-Unternehmen logo
1 von 22
Downloaden Sie, um offline zu lesen
Modeling delayed feedback in display advertising @KDD 2014勉強会 
坪坂 正志 
m.tsubosaka@gmail.com 
2014/9/23 
KDD 2014勉強会 
1
今日紹介する論文 
•Modeling delayed feedback in display advertising 
–Olivier Chapelle (Criteo) 
•ディスプレイ広告において広告を表示した時のコ ンバージョン率を予測する 
•ログから学習を行おうとするときにコンバージョ ンの発生には遅れが生じるため実際は正例な のに負例として扱ってしまうという問題が発生す る 
•このため時間遅れをモデル化したコンバージョン 予測モデルを提案する 
KDD 2014勉強会 
2
CPA payment modelと コンバージョン率の予測 
•広告配信業者は広告主からは1回のコンバージョンにつきいくらという契 約で行う 
•一方媒体の方に広告を出す際には1インプレッションいくらかという契約 で行う 
•このため1インプレッションをいくらで買うかを決めるためには1インプレッ ションあたりの広告主からもらえる金額の期待値を計算する必要がある 
•その期待値は次の式で計算できる 
–eCPM = CPA × P(click) × P(conversion | click) 
–P(conversion | click)をモデル化するのが今回の論文のメインテーマ 
KDD 2014勉強会 
3 
広告主 
媒体 
インプレッションい くらで買い取り 
クリック/コンバージョン 一回につき課金
コンバージョン予測における課題 
•クリック予測においては通常ユーザはインプレッション の後すぐに広告をクリックするかクリックしないかのど ちらかである 
–このためクリック予測の問題においては通常の回帰問題 として扱える 
–難しさとしてはインプレッションは一日数十億と膨大でス ケールする機械学習のロジックをいかに作るかが重要と なってくる 
•コンバージョン予測についてはユーザは広告をクリッ クしてもすぐにコンバージョンするわけではないので通 常の回帰問題として定式化することができない 
–一方データ数はユーザのクリック数はそこまで多くないの でデータの数はそこまでもない 
KDD 2014勉強会 
4
遅れが発生する場合の問題点 
•通常のデータを扱うようにクリック後コンバージョンしてい るデータを正例として、していないデータを負例とすると学 習期間中にコンバージョンしていないデータが本当は正例 なのに負例として扱われる 
KDD 2014勉強会 
5 
学習期間 
click 
click 
click 
conv 
conv 
学習期間中にコンバージョ ンしなかったので負例とし て扱われる 
コンバージョンしてるので 正例として扱う 
コンバージョンしてないの で負例として扱う
遅れが発生する場合の問題点 
•先行研究としてはランダムにラベルが欠損す るという問題設定はいくつか存在する 
•しかし時間遅れが発生する場合学習期間中 の最近のデータほど誤って正例なのに負例と して扱われるというバイアスが発生してくる 
•このため時間遅れを扱うようなモデルを作る 必要がある 
KDD 2014勉強会 
6
コンバージョン遅れについての分析 
•実際のデータを見たところクリック後1日以内 にコンバージョンするデータは全体の半分 
•13%のデータは2週間後にコンバージョンが発 生している 
KDD 2014勉強会 
7
新規キャンペーン 
•ディスプレイ広告においては常に新しいキャンペーンが 入ってくる 
•新規キャンペーンのためにも常にモデルを更新する必要 がある 
–コンバージョンの遅れを考慮してデータが30日貯まるまで待つ という運用ではパフォーマンスに与える影響が大きい 
KDD 2014勉強会 
8
コンバージョン遅れのモデル 
•クリック後ユーザがコンバージョンしなかった 場合に二つの場合を考える 
•1. ユーザはその後コンバージョンしない 
•2. ユーザはその後コンバージョンするが十分 な時間がたっていない 
KDD 2014勉強会 
9
コンバージョン遅れのモデル 
•上の話を定式化すると 
•X : 特徴量ベクトル 
•Y : コンバージョンが発生したかどうか 
•C : クリックしたユーザがコンバージョンするかどうか 
•D : クリックからコンバージョンにかかる時間 
•E : クリック後にかかった時間 
•Y=0  C = 0 or E < D 
•Y=1 => C=1 
•ログ上で観測されるのは(풙푖,푦푖,푒푖)の3つ組, 푦푖=1の ときは푑푖,푐푖も観測されている 
KDD 2014勉強会 
10
コンバージョン遅れのモデル 
•ユーザがコンバージョンする確率はロジスティック回 帰モデルを使って 
•푃퐶=1푋=풙=푝풙푖= 11+exp⁡(−풘푐⋅풙) 
•とする 
•時間遅れについては平均휆푥の指数分布に従うとす る 
•푃퐷=푑푋=풙,퐶=1=휆풙exp⁡(−휆풙푑) 
•ただし휆풙=exp(풘푑⋅풙)>0とする 
•このモデルでのパラメータは二つの重みベクトル풘푐, 풘푑となる 
KDD 2014勉強会 
11
モデルからの確率 
•観測されているコンバージョンイベントについ ての確率は 
•푃푌=1,퐷=푑푖푋=푥푖,퐸=푒푖 
•=푃퐷=푑푖푋=푥푖,퐶=1푃(퐶=1|푋=푥푖) 
•=휆푥푖exp−휆푥푖푑푖푝(푥푖) 
•となる 
KDD 2014勉強会 
12
モデルからの確率 
•コンバージョンが観測されてないイベントについての確率は 
•푃푌=0푋=푥푖,퐸=푒푖 
–=푃푌=0퐶=0,푋=푥푖,퐸=푒푖푃퐶=0푋=푥푖 
–+⁡푃푌=0퐶=1,푋=푥푖,퐸=푒푖푃(퐶=1|푋=푥푖) 
–1−푝푥푖+푝푥푖⁡푃푌=0퐶=1,푋=푥푖,퐸=푒푖 
•最後のユーザはコンバージョンするがまだコンバージョンに 至ってないという確率は 
–푃푌=0퐶=1,푋=푥푖,퐸=푒푖 
–=푃퐷>퐸퐶=1,푋=푥푖,퐸=푒푖= 휆푥exp(−휆푥푡)푑푡 ∞ 푒푖 
–exp(−휆푥푒푖)⁡ 
KDD 2014勉強会 
13
最適化について 
•提案モデルについてはパラメータベクトルの 推定とユーザがコンバージョンするかどうか の観測されない隠れ変数であるCの推定の二 つが必要となっている 
•こういったときに最適な方法としてEMアルゴリ ズムを用いる 
–詳細については論文4章を参照 
–Eステップで푃(퐶=1|푋=푥푖,푌=푦푖)を計算し 
–Mステップでパラメータベクトルの最適化を行う 
KDD 2014勉強会 
14
関連研究 
•Learning classifiers from only positive and unlabeled data, KDD 2008 
–正例とラベルがないデータのみあるときの学習について 
–本研究と違ってラベルなしのデータについてラベルがラン ダムに欠落しているという仮定をおいている 
–ラベルなしデータについては正例と負例が一定率で混在 しているという定式化 
–本研究では時間が経っているデータはネガティブサンプ ルに近い形で扱えるような定式化を行っている 
•生存時間解析 
–生存時間解析においては患者はいずれ死ぬので、本研 究において常にC=1という仮定をおいたのと同じになって いる 
KDD 2014勉強会 
15
実験 (Toy example) 
•データをコンバージョン率を10%, コンバージョンまでにかかる時間 を平均4日の指数分布に従って発生させる 
•このときコンバージョン率を単純にコンバージョン数をデータの数 で割って推定したものと比較した 
•本論文での提案手法であるDFM(Delayed feedback model)がより 短期間で真の値に収束している 
KDD 2014勉強会 
16
コンバージョンの遅れについて 
•実際のデータを使ってDelayが指数分布に従うかどうかを検証した 
•正確にはモデルは特徴量ベクトルxの条件つき分布であるがこれを検証 するにはデータ量が少なすぎるのでキャンペーンのみで条件付けを行っ た 
•また現実のデータは指数分布と違うところもある 
–24時間での周期性(ユーザがブラウザを使う時間に周期があるため) 
–短い時間でコンバージョンする率を過少評価して、長い時間でコンバージョン する率を過大評価している 
KDD 2014勉強会 
17
比較手法 
•NAIVE 
–学習期間においてコンバージョンしたデータを正例として、そう でないデータを負例としてコンバージョン率を学習する 
•ORACLE 
–データの学習期間より先の時間のデータをみてコンバージョン したかどうかを確認して、それも正例として扱う 
•SHIFTED 
–訓練データには30日前のものを使ってクリック後コンバージョン したかどうかが正しく分かるようにする 
•RESCALE 
–NAIVEと同じであるが推定したコンバージョン率を正例の欠損 率で割ってやる 
KDD 2014勉強会 
18
比較手法 
•STC (Short term conversion model) 
–本論文で比較のために作ったヒューリスティックな手法 
–1 一日以内にコンバージョンする確率をモデル化 
•푃(퐶=1,퐷≤1|푋=푥) 
–2 一日以内にコンバージョンするデータとすべてのコンバージョ ンについての比率を計算する 
• 푃(퐶=1,퐷≤1|푋=푥) 푃(퐶=1|푋=푥) =푃(퐷≤1|퐶=1,푋=푥) 
•1については直近のデータから学習できる 
•2についてはコンバージョンデータの中から一日以内にコ ンバージョンするかどうかの二値分類モデルとなっている 
•2については過去ログが必要となるがこの値はある程度ロ バストである 
KDD 2014勉強会 
19
実験 
•実験においてテストデータは7日間のデータを用いた、この とき学習は過去3週間のデータから毎日行った 
–データ数は約6M件、詳細については以下のURLで公開されて いる 
–http://labs.criteo.com/tag/dataset/ 
•データは二種類用意して、全てのキャンペーンに関するも のとRecentという過去データよりテストデータの方が出現 数が多いキャンペーンに関するもののみのデータを使った 
•実験の評価にはNLL(Average Negative log-likelihood)を 使った 
–ROCを使わないのは確率を推定することも重要となっているた め 
KDD 2014勉強会 
20
実験結果 
•Oracleとの比較を行ったさいに提案手法である DFMが最もOracleとの差分が小さかった 
•またNAIVEは特にRecentなデータに対して予測 精度が悪い 
–多くの正例を負例として扱うため 
KDD 2014勉強会 
21
結論 
•本論文ではコンバージョン率の推定の際にコ ンバージョンの遅れをモデル化した手法を提 案した 
•推定は単純な勾配法で行え、しかもいくつか のベースラインより高い精度となっている 
•本手法は広告領域だけではなく他の領域で も使うことのできる汎用的な方法となっている 
KDD 2014勉強会 
22

Weitere ähnliche Inhalte

Was ist angesagt?

グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
Kawamoto_Kazuhiko
 
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門
shima o
 

Was ist angesagt? (20)

グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
 
統計的因果推論勉強会 第1回
統計的因果推論勉強会 第1回統計的因果推論勉強会 第1回
統計的因果推論勉強会 第1回
 
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門
 
Deep State Space Models for Time Series Forecasting の紹介
Deep State Space Models for Time Series Forecasting の紹介Deep State Space Models for Time Series Forecasting の紹介
Deep State Space Models for Time Series Forecasting の紹介
 
Transformerを多層にする際の勾配消失問題と解決法について
Transformerを多層にする際の勾配消失問題と解決法についてTransformerを多層にする際の勾配消失問題と解決法について
Transformerを多層にする際の勾配消失問題と解決法について
 
Stanでガウス過程
Stanでガウス過程Stanでガウス過程
Stanでガウス過程
 
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明
 
20170618論文読み会 伊藤
20170618論文読み会 伊藤20170618論文読み会 伊藤
20170618論文読み会 伊藤
 
PRML輪読#1
PRML輪読#1PRML輪読#1
PRML輪読#1
 
[DL輪読会]Clebsch–Gordan Nets: a Fully Fourier Space Spherical Convolutional Neu...
[DL輪読会]Clebsch–Gordan Nets: a Fully Fourier Space Spherical Convolutional Neu...[DL輪読会]Clebsch–Gordan Nets: a Fully Fourier Space Spherical Convolutional Neu...
[DL輪読会]Clebsch–Gordan Nets: a Fully Fourier Space Spherical Convolutional Neu...
 
ベルヌーイ分布における超パラメータ推定のための経験ベイズ法
ベルヌーイ分布における超パラメータ推定のための経験ベイズ法ベルヌーイ分布における超パラメータ推定のための経験ベイズ法
ベルヌーイ分布における超パラメータ推定のための経験ベイズ法
 
深層学習の数理
深層学習の数理深層学習の数理
深層学習の数理
 
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
 
Bayesian Neural Networks : Survey
Bayesian Neural Networks : SurveyBayesian Neural Networks : Survey
Bayesian Neural Networks : Survey
 
カステラ本勉強会 第三回
カステラ本勉強会 第三回カステラ本勉強会 第三回
カステラ本勉強会 第三回
 
階層ベイズと自由エネルギー
階層ベイズと自由エネルギー階層ベイズと自由エネルギー
階層ベイズと自由エネルギー
 
PRML輪読#11
PRML輪読#11PRML輪読#11
PRML輪読#11
 
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
 
2 4.devianceと尤度比検定
2 4.devianceと尤度比検定2 4.devianceと尤度比検定
2 4.devianceと尤度比検定
 
【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models【DL輪読会】Scaling Laws for Neural Language Models
【DL輪読会】Scaling Laws for Neural Language Models
 

Andere mochten auch

Sano web広告最適化20131018v3
Sano web広告最適化20131018v3Sano web広告最適化20131018v3
Sano web広告最適化20131018v3
Masakazu Sano
 

Andere mochten auch (7)

Tokyowebmining ctr-predict
Tokyowebmining ctr-predictTokyowebmining ctr-predict
Tokyowebmining ctr-predict
 
【Zansa】物理学はWebデータ分析に使えるか
【Zansa】物理学はWebデータ分析に使えるか【Zansa】物理学はWebデータ分析に使えるか
【Zansa】物理学はWebデータ分析に使えるか
 
Sano web広告最適化20131018v3
Sano web広告最適化20131018v3Sano web広告最適化20131018v3
Sano web広告最適化20131018v3
 
20140213 web×マス広告の統合分析第3部_公開用
20140213 web×マス広告の統合分析第3部_公開用20140213 web×マス広告の統合分析第3部_公開用
20140213 web×マス広告の統合分析第3部_公開用
 
機械学習モデルの列挙
機械学習モデルの列挙機械学習モデルの列挙
機械学習モデルの列挙
 
#ibis2017 Description: IBIS2017の企画セッションでの発表資料
#ibis2017 Description: IBIS2017の企画セッションでの発表資料#ibis2017 Description: IBIS2017の企画セッションでの発表資料
#ibis2017 Description: IBIS2017の企画セッションでの発表資料
 
機械学習を用いた異常検知入門
機械学習を用いた異常検知入門機械学習を用いた異常検知入門
機械学習を用いた異常検知入門
 

Ähnlich wie KDD2014_study

Ähnlich wie KDD2014_study (7)

Real time bidding algorithms for performance-based display ad allocation
Real time bidding algorithms for performance-based display ad allocationReal time bidding algorithms for performance-based display ad allocation
Real time bidding algorithms for performance-based display ad allocation
 
Sano tokyowebmining 201625_v04
Sano tokyowebmining 201625_v04Sano tokyowebmining 201625_v04
Sano tokyowebmining 201625_v04
 
Real time bid optimization with smooth budget delivery in online advertising
Real time bid optimization with smooth budget delivery in online advertisingReal time bid optimization with smooth budget delivery in online advertising
Real time bid optimization with smooth budget delivery in online advertising
 
Joint optimization of bid and budget allocation in sponsored search
Joint optimization of bid and budget allocation in sponsored searchJoint optimization of bid and budget allocation in sponsored search
Joint optimization of bid and budget allocation in sponsored search
 
Estimating conversionrateindisplayadvertisingfrompastperformancedata
Estimating conversionrateindisplayadvertisingfrompastperformancedataEstimating conversionrateindisplayadvertisingfrompastperformancedata
Estimating conversionrateindisplayadvertisingfrompastperformancedata
 
Kaggle – Airbnb New User Bookingsのアプローチについて(Kaggle Tokyo Meetup #1 20160305)
Kaggle – Airbnb New User Bookingsのアプローチについて(Kaggle Tokyo Meetup #1 20160305)Kaggle – Airbnb New User Bookingsのアプローチについて(Kaggle Tokyo Meetup #1 20160305)
Kaggle – Airbnb New User Bookingsのアプローチについて(Kaggle Tokyo Meetup #1 20160305)
 
Estimating conversion rate in display advertising from past performance data
Estimating conversion rate in display advertising from past performance dataEstimating conversion rate in display advertising from past performance data
Estimating conversion rate in display advertising from past performance data
 

Mehr von 正志 坪坂

Riak Search 2.0を使ったデータ集計
Riak Search 2.0を使ったデータ集計Riak Search 2.0を使ったデータ集計
Riak Search 2.0を使ったデータ集計
正志 坪坂
 
Contexual bandit @TokyoWebMining
Contexual bandit @TokyoWebMiningContexual bandit @TokyoWebMining
Contexual bandit @TokyoWebMining
正志 坪坂
 
Introduction to contexual bandit
Introduction to contexual banditIntroduction to contexual bandit
Introduction to contexual bandit
正志 坪坂
 
確率モデルを使ったグラフクラスタリング
確率モデルを使ったグラフクラスタリング確率モデルを使ったグラフクラスタリング
確率モデルを使ったグラフクラスタリング
正志 坪坂
 
Big Data Bootstrap (ICML読み会)
Big Data Bootstrap (ICML読み会)Big Data Bootstrap (ICML読み会)
Big Data Bootstrap (ICML読み会)
正志 坪坂
 
static index pruningについて
static index pruningについてstatic index pruningについて
static index pruningについて
正志 坪坂
 

Mehr von 正志 坪坂 (20)

Recsys2018 unbiased
Recsys2018 unbiasedRecsys2018 unbiased
Recsys2018 unbiased
 
WSDM2018Study
WSDM2018StudyWSDM2018Study
WSDM2018Study
 
Recsys2016勉強会
Recsys2016勉強会Recsys2016勉強会
Recsys2016勉強会
 
KDD 2016勉強会 Deep crossing
KDD 2016勉強会 Deep crossingKDD 2016勉強会 Deep crossing
KDD 2016勉強会 Deep crossing
 
Deeplearning輪読会
Deeplearning輪読会Deeplearning輪読会
Deeplearning輪読会
 
WSDM 2016勉強会 Geographic Segmentation via latent factor model
WSDM 2016勉強会 Geographic Segmentation via latent factor modelWSDM 2016勉強会 Geographic Segmentation via latent factor model
WSDM 2016勉強会 Geographic Segmentation via latent factor model
 
Deeplearning勉強会20160220
Deeplearning勉強会20160220Deeplearning勉強会20160220
Deeplearning勉強会20160220
 
OnlineMatching勉強会第一回
OnlineMatching勉強会第一回OnlineMatching勉強会第一回
OnlineMatching勉強会第一回
 
Recsys2015
Recsys2015Recsys2015
Recsys2015
 
KDD 2015読み会
KDD 2015読み会KDD 2015読み会
KDD 2015読み会
 
Recsys2014 recruit
Recsys2014 recruitRecsys2014 recruit
Recsys2014 recruit
 
EMNLP2014_reading
EMNLP2014_readingEMNLP2014_reading
EMNLP2014_reading
 
Riak Search 2.0を使ったデータ集計
Riak Search 2.0を使ったデータ集計Riak Search 2.0を使ったデータ集計
Riak Search 2.0を使ったデータ集計
 
Contexual bandit @TokyoWebMining
Contexual bandit @TokyoWebMiningContexual bandit @TokyoWebMining
Contexual bandit @TokyoWebMining
 
Introduction to contexual bandit
Introduction to contexual banditIntroduction to contexual bandit
Introduction to contexual bandit
 
確率モデルを使ったグラフクラスタリング
確率モデルを使ったグラフクラスタリング確率モデルを使ったグラフクラスタリング
確率モデルを使ったグラフクラスタリング
 
Big Data Bootstrap (ICML読み会)
Big Data Bootstrap (ICML読み会)Big Data Bootstrap (ICML読み会)
Big Data Bootstrap (ICML読み会)
 
Tokyowebmining2012
Tokyowebmining2012Tokyowebmining2012
Tokyowebmining2012
 
static index pruningについて
static index pruningについてstatic index pruningについて
static index pruningについて
 
NIPS 2012 読む会
NIPS 2012 読む会NIPS 2012 読む会
NIPS 2012 読む会
 

KDD2014_study