Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.

ヤフートップページでの機械学習#yjdsw1

2.252 Aufrufe

Veröffentlicht am

http://yahoo-ds-event.connpass.com/event/21903/

Veröffentlicht in: Technologie
  • Als Erste(r) kommentieren

ヤフートップページでの機械学習#yjdsw1

  1. 1. 公開 ヤフートップページでの 機械学習 ヤフー株式会社 D&S統括本部サイエンス本部サイエンス1部コマースサイエンス2 深澤 良介
  2. 2. 公開 自己紹介 深澤良介 • 2009年新卒入社 • 自然言語処理と機械学習のバックグラウンド • 情報検索とレコメンデーションのプロジェクト を渡り歩いてきました Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 2
  3. 3. 公開 スマホのトップページは 今年生まれ変わりました! Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 3
  4. 4. 公開 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 4
  5. 5. 公開 サービスの規模 • デイリーユニークブラウザ数: 5000万 UB※1 (下記含めスマホブラウザ+アプリ合算の値) • ピーク時リクエスト数: 数千 req/s • 推薦対象の記事数: 数万 documents ※1:決算説明会 - 決算説明会資料 - IRアーカイブス - IR情報 - ヤフー株式会社 http://ir.yahoo.co.jp/jp/archives/present/2015q2/index.html Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 5
  6. 6. 公開 機械学習はどこに活かされている? Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 6
  7. 7. 公開 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 7
  8. 8. 公開 “あなたへのおすすめ” として 影響力の大きい記事 パーソナライズされた記事 を推薦 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 8
  9. 9. 公開 機械学習の応用先 • 推薦する記事のパーソナライズ • 影響力の大きい記事の推定 • 記事のPV予測 • 重複記事判定 • 画像クロッピング Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 9
  10. 10. 公開 推薦する記事のパーソナライズ • ユーザの行動ログを利用 • ヤフーニュース閲覧履歴 • 検索キーワード • etc. • ユーザの興味に合致する記事を選び、 CTR を最適化するよう学習 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 10 ゲーム情報で一杯に!
  11. 11. 公開 影響力の大きい記事の推定 • 過去ヤフートピックスで選ばれた記事データを 元に、今入稿された記事が選ばれるかどうかを 推定 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 11
  12. 12. 公開 記事のPV予測 • 記事情報を元にPVの推定を行い、 PVの入稿後実績を利用して修正が入るように RNN を構築 • 推定が難しい外部要因などにも上手く追従 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 12 ※ 縦軸: pvの自然対数値 横軸: 入稿後経過時間(hour)
  13. 13. 公開 重複記事判定 • 当初は記事タイトルのコサイン類似度での判定 • 言い換え表現なども多く、表層表現では限界 • AutoEncoder を使った NN を構築、 予め付与されている記事カテゴリを判別できる よう学習し、文書ベクトルを獲得 Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 13
  14. 14. 公開 画像クロッピング • トップページのUIに合わせた サムネイル切り出し • 顔検出、顕著性の検出を行っている Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 14 (C) Aflo
  15. 15. 公開 まとめ • 大きなUI変更に伴い、トップページは サイエンス部の技術力を活用したサービスに! • 国際学会で取り上げられているような先端技術 も追いつつ、実サービスへの応用も進んでます (進行中、国際学会発表を目指すものも) Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 15
  16. 16. 公開 詳細はこのあとの懇親会で! Copyright (C) 2015 Yahoo Japan Corporation. All Rights Reserved. 無断引用・転載禁止 16

×