アドテクにおける機械学習技術 @Tokyo Data Night #tokyodn

アドテクにおける機械学習技術
2015.7.23
ソネット・メディア・ネットワークス株式会社
舘野啓

2015/7/23
• 舘野啓 (たてのけい)
– ソネット・メディア・ネットワークス所属
– @f_g_hollyhock (連絡用)
• 経歴
– 2003.6～2012.3
某メーカー研究所にて機械学習やパーソナライゼーション/リコメンデーション技術
の日々
– 2012.4～2014.7
新規事業立ち上げでもがく(含むSan Franciscoでの活動)
– 2014.10～
ソネット・メディア・ネットワークスにてアドテク業界に足を踏み入れる
• 好き
自己紹介

2015/7/23 3
• Demand Side Platform(DSP) “Logicad” の
パワーアップ＆新機能・新サービス開発
業務紹介
http://www.so-netmedia.jp/company/news/2015/pr_release_20150707.html
“潜在顧客ターゲティング”

アドテクにおける機械学習技術
2015/7/23 4

2015/7/23 5
• お話の内容
– Web広告、特にRTBの仕組みのどんなところに機械学習が使わ
れているのか？
• お話のターゲット
– “アドテク” “機械学習”の言葉ぐらいは知ってるソフトウェア
エンジニア
• 今日は気にしないこと
– 「そもそもネットの広告って・・・」
– 未来の広告の形、マーケティングソリューションのあり方
– アルゴリズムの詳細
– RTB/ビッグデータ分析のためのシステム [12]
• 個人の見解です
はじめに

2015/7/23 6
• 機械学習
– ≒ 未知のものを予測するためにデータから学習する
ための技術
• "学習"と"予測"って？
機械学習とは
サンプル
特徴量
知りたいこと
？
学習アルゴリズム
予測
モデル
予測結果未知サンプル
教師データ

DSP
demand
side
platform
DSP
demand
side
platform
2015/7/23 7
Real Time Bidding(RTB)とは
SSP
supply
side
platform
DSP
demand
side
platform
広告主
A
広告主
B
───
───
───
───
───
───
枠
ad a1
ad a2
ad b1
ad b2
auction
ad
───
───
───
───
───
───
¥a
¥ｂ
広告を表示する
サイト
こちらもご参考に：[1][2]

DSP
demand
side
platform
DSP
demand
side
platform
2015/7/23 8
機械学習とRTB
SSP
supply
side
platform
DSP
demand
side
platform
広告主
A
広告主
B
───
───
───
───
───
───
枠
ad a1
ad a2
ad b1
ad b2
auction
ad
───
───
───
───
───
───
¥a
¥ｂ
広告を表示する
サイト
どんな広告を
(what)
誰に (who)
いつ (when)
幾らで
(how much)
どこ{で,に} (where)
なぜ (why)メディア・ユーザ・広告主がハッピーになる
ためには決めなきゃいけないことたくさん

• RTBにおいて学習したいもの：
行動を引き起こす5W1Hのモデル
2015/7/23 9
機械学習とRTB
𝑷 act user, ad, context )
誰に (who)
どんな広告を
(what)
いつ (when)
行動
(クリック, CV etc.)
幾らで (how much)
決定
なぜ(why)
どこ{で,に} (where)

2015/7/23 10
機械学習とRTB
サンプル
特徴量
act
学習アルゴリズム
予測モデル
user ad context
𝑷 act user, ad, context )未知サンプル
user ad context
予測結果
act
───
───
───
───
───
───
枠
ad a1
───
───
───
───
───
───
枠
ad a2
ad b1
ad c3
───
───
───
───
───
───
枠
───
───
───
───
───
───
枠
───
───
───
───
───
───
枠
ad a1
教師データ
入札額
(how much)
who, what,
when, where

2015/7/23 11
• 事実ベース
– 事前に定義可能な”セグメント”に対して配信
– e.g. リターゲティング※
• 広告主サイトに訪れたユーザに配信(刈り取り)
– e.g. オーディエンスターゲティング
• 性別・年齢・興味カテゴリなどの属性で指定して配信
• 属性は予測したものも含む
• 行動予測ベース
– 広告をクリックしそうな人、コンバージョン(CV;
商品購入など)しそうな人を機械学習などで予測[3]
して配信
– e.g. ロジスティック回帰モデルによるクリック予測
Who：誰に広告を出すか？
※“リターゲティング”はマイクロアド社の登録商標です

2015/7/23 12
• 広告のコストパフォーマンスを最大化するに
は？
– →広告の影響を受ける人を見つけるモデル[4][5]
Who：誰に広告を出すか？
行動する放っておいてもOK 広告の影響を受ける
行動しないあまのじゃく何しても無駄
行動する行動しない
広告を
見た場合
広告を見なかった場合
ユーザのタイプの分類

2015/7/23 13
• インサイトの抽出：
広告主が自身の顧客がどんな人たちかを知り
たい
– ⇒効いている特徴量で説明
• だいたいわけがわからない
– ⇒クラスタリングして名前を付ける
• だいたいわけがわからない or 難しい
Who：広告に反応したのはどんな人か？
要は何？
統計と
意味の
谷

2015/7/23 14
• どんな広告＝
{広告主, 商材, クリエイティブ}
– 広告主や商材(の種類)などは特徴量として学習される
– RTBでは広告主の意図(入札金額の大小)が入るので、
常にユーザにとって最適な広告が出るわけでは無い
– ⇒ここではクリエイティブにfocus
• クリックしやすい広告・記憶しやすい広告
– 位置, サイズ, アニメーション, 色, わかりやすさ etc.
[6]
– まだまだノウハウと感性の領域 ⇔ 解明する余地大
• Deep Learning, 認知科学, 感性工学,・・・？
What：どんな広告を出すか？

2015/7/23 15
• ダイナミッククリエイティブ
– 複数商品の写真などを組み合わせて一
つのバナーを動的に生成
– どう組み合わせるか？
e.g. 閲覧した商品＋
ユーザにおすすめの商品
• “ユーザにおすすめの商品”？
– そのユーザが買いそう・気に入りそう
な商品を予測
• Jaccard係数などによる商品相関
(“この商品を買った人はこんな商品も
買っています”)
• 行列の穴埋め問題として行列分解(Matrix
factorization) [7]

2015/7/23 16
• どんなクリエイティブが効果的かを知る
– A/Bテスト
• どちら(どれ)がbetterな選択肢なのかを統計的な妥当
性を担保して決定する
• 選択肢すべてを平等に試して比較
⇒選択肢が膨大な場合無駄打ち大＝コスト大
– Multi Armed Bandit
• なるべく少ないコストで有望な選択肢を決める手法
• e.g. (ダイナミッククリエイティブのように)多様な組
み合わせからベストなものを選ぶ [8]
– 色, 配置, 形, パターンなど

2015/7/23 17
• どこに
＝どの枠(ドメイン, サイト, ページ内の位置)に
– 効果の高い枠は？
• 特徴量として学習
– そもそもそこは出すべき面か？：ad verification
• 見えない場所に表示しても意味が無い(viewability) [9]
• 不正(ad fraud; botによるクリックetc.)が無いか
• ブランドにとって不適切なコンテンツでないか
• 広告の意図にマッチした内容かどうか
– e.g. 飛行機事故の記事に航空会社の広告は・・・
• ⇒自動 vs. 手動
• どこで＝ユーザの位置情報
– モバイル＋Online-to-Offline(O2O)などでの活用
• e.g. Shufoo! http://www.shufoo.net/
Where：どこ{に,で}広告を出すか？

2015/7/23 18
• どんなタイミングで提示すれば受け入れやすい
か？
– 適切な間隔 (frequency, recency, 時刻 etc.)
• あまり大量に/頻繁に同じ広告を出されるとウザい etc.
– ユーザの状態(センシング情報などから推定)に応じて
変化する [10]
• CRM的な観点での広告利用
– e.g. 以前買った洗剤がちょうどなくなるころにおす
すめ(imp)する
– e.g. サービスのリマインド
When：いつ広告を出すか？

2015/7/23 19
• ユーザの受け入れやすさに関わる(と思われる)
– Golden circle的な意味でも
• が・・・
– しつこいRT広告→わかっててもウザくなってくる
• 「この商品確かに見たけどさ！」
– 大量の手がかり(特徴量)をベースにする機械学習は
”なぜ”をひねり出すのは苦手
• ⇒“なぜ”が問われない広告
– 「あなたの友達の○○さんがいいね！しています」
– ネイティブ広告
• メインコンテンツに違和感なく溶け込む
– 動画広告
• コンテンツとして面白い
Why：なぜその広告が出たのか？

2015/7/23 20
• 理想の入札金額：アクション期待価値
– e.g. 目標CPC 100円 × クリック確率 0.1%
→ 0.1円で入札
– sealed bid & second-price auctionにおいて理論上最適
な戦略
• 実は入札金額で“誰に”出すかは決まる
– e.g. 0円でbid＝セグメント外
– ただし計算リソースの節約、予算消化の予測、広告主側の
理解etc.によりセグメントを事前に作ることに意味はある
How much：いくらで広告を出すか？
広告主にとっての
ユーザのアクション価値(金額)
広告提示に対して
アクションする確率

2015/7/23 21
• 発展形 [11]
– RTBのすべての事象を確率的にシミュレーションし、
予算内でアクション(クリックやCV)数を最大化する
ような入札戦略 b() を学習
How much：いくらで広告を出すか？
どんなユーザが
どんな頻度で枠
を見るか
impしたときに
アクションする確率
入札金額
入札の
勝率
ad c3
───
───
───
───
───
───
枠
𝒙 =

2015/7/23 22
• 機械学習タスクとして
– 大量データ
• 1011～トランザクション/月
– 大規模特徴量
• e.g. 広告枠のドメイン数 105～
– 少数の正例
• キャンペーンごとのCV数数十～数百だったり
• 時間方向の最適化 ⇒ 個人に寄り添った情報提供
– e.g. Life Time Value最大化, 順番を考慮した情報提示
• “統計と意味の谷”の解消
– エンドユーザ側 / 広告主側
これからの課題

2015/7/23 23
• 𝑷 act user, ad, context ) を頑張ってます
• 課題は山積み、やりがい特大
– エンドユーザも広告主も人間、技術だけ突き
詰めても(今は)限界が・・・
• 技術とビジネスが直結するexcitingな
領域です！
まとめ

2015/7/23 24
• [1] アドテク勉強会 http://goo.gl/vFqPRs
• [2] 「今さら聞けない ! 」マーケティング担当者のためのアドテクノロジー (1) アドテクノロジーの歴
史 - アドネットワークの誕生まで | マイナビニュース http://goo.gl/PYQqxJ
• [3] Chapelle, O., et al., Simple and scalable response prediction for display advertising, ACM
TIST, 2015.
• [4] Radcliffe, N. J., et al., Real-World Uplift Modelling with Significance-Based Uplift Trees,
StocasticSolutions.com, 2011. http://goo.gl/GjSWN4
• [5] 里, Uplift Modelling 入門（1）, 2012. http://goo.gl/h2F572
• [6] Nihel, Z., The Effectiveness of Internet Advertising through Memorization and Click on a
Banner, Int. J. of Marketing Studies, 2013.
• [7] Koren, Y., et al., Matrix factorization techniques for recommender systems, Computer, 2009.
• [8] Auer, P., Using confidence bounds for exploitation-exploration trade-offs, JMLR, 2002.
• [9] The Importance of Being Seen, 2014. https://goo.gl/f6kWyQ
• [10] Pejovic, V., et al., InterruptMe : Designing Intelligent Prompting Mechanisms for Pervasive
Applications, UbiComp, 2014.
• [11] Zhang, W., et al., Optimal Real-Time Bidding for Display Advertising, KDD, 2014.
• [12]クラウド技術を活用したリアルタイム広告 Logicad の入札・配信・ログ解析 #awssummit
http://goo.gl/uGVct
参考文献

アドテクにおける機械学習技術 @Tokyo Data Night #tokyodn

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (7)

Similar to アドテクにおける機械学習技術 @Tokyo Data Night #tokyodn

Similar to アドテクにおける機械学習技術 @Tokyo Data Night #tokyodn (20)

Recently uploaded

Recently uploaded (10)

アドテクにおける機械学習技術 @Tokyo Data Night #tokyodn