Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.

Yahoo!ショッピングと分散表現#yjdsw1

995 Aufrufe

Veröffentlicht am

http://yahoo-ds-event.connpass.com/event/21903/

Veröffentlicht in: Technologie
  • Als Erste(r) kommentieren

Yahoo!ショッピングと分散表現#yjdsw1

  1. 1. Yahoo!ショッピングと分散表現 ヤフー株式会社 D&Sサイエンス本部サイエンス4部ベーシック1 齋藤 祐樹
  2. 2. P2自己紹介 齋藤 祐樹 • ランキングやレコメンドアルゴリズムの開発 • 学生時代は形式手法やモデル検査についての研究 略歴 • 2013/3 大学院卒業 • 2013/4 ヤフー株式会社入社 • 2013/9-2014/9 YDNの予測アルゴリズム開発 • 2014/10- now ショッピングのランキングモデル開発
  3. 3. P3ショッピング検索とランキング Yahoo!ショッピングは2段階の ランキングフェーズで構成 Search Engine Cluster … second phase - 絞り込まれたレコードをランク付けする - 予測モデルによるランキング処理 first phase - 全レコードから候補となりうるものを絞り込む - 計算コストの小さい評価方法によるランキング
  4. 4. P4問題設定 クエリが与えられたときに検索エンジンから返却された商品に対して クリック/購入確率が最大になるような順番になる商品のスコアを予 測したい • ラベルは5段階(Perfect, Excellent, Good, Fair, Bad) 特徴量 • クエリ • 商品情報 • 価格,レビュー数,レビュー値,ページビュー など • クエリと商品情報の単語の一致度 • 検索エンジンの返すサマリ NDCD,MRR,MAP,AUCなどのランク指標を最大にしたい
  5. 5. P5問題設定 クエリが与えられたときに検索エンジンから返却された商品に対して クリック/購入確率が最大になるような順番になる商品のスコアを予 測したい • ラベルは5段階(Perfect, Excellent, Good, Fair, Bad) 特徴量 • クエリ • 商品情報 • 価格,レビュー数,レビュー値,ページビューなど • クエリと商品情報の単語の一致度 • 検索エンジンの返すサマリ NDCD,MRR,MAP,AUCなどのランク指標を最大にしたい 構造的に近いものを高く評価しやすい
  6. 6. P6クエリとタイトル 検索エンジンの返却するのスコアだとタイトルは似ているがクエリの意図す る商品と異なる商品にも高いスコアをつけてしまう クエリ:テレビ テレビ用壁掛け金具/20〜37インチ用 液晶テレビ プラズマテレビ テレビ金具 ミツマルテック 40V型フルハイビジョン液晶テレビ ブラック LC4095 [LC4095] これ以外にも言い換え表現などの問題もある
  7. 7. P7最近の研究動向 分散表現にskipgram[Milkolov+,’13] ,学習器にCNNとしたものが QAタスクにおいて精度がよいとの報告[Aliaksei+,SIGIR’15]がある 図は[Aliaksei+,SIGIR’15]から引用 ここがskipgramから得られる分散表現
  8. 8. P8ちょっとした疑問 ショッピング検索においてクリックされるドキュメントはクエリとセ マンティック的に近いと仮定したとき,もし分散表現のベクトルのコサ イン類似度でセマンティック上の近さを表現できているのならばCNN などで学習する必要はないのではないか? クリックされなかった ドキュメント クリックされた ドキュメント クエリ もし上図のようになっていればコサイン類似度の降順に商品を並べればよい
  9. 9. P9調査結果 • コーパス:Yahoo!ショッピングの検索ログ • |vocab| : ~ 1million • Skipgramモデルのパラメータの設定は論文通り クエリに近ければクリックさ れるというわけではなさそう PCAの上位2軸でプロット

×