Suche senden
Hochladen
Learning-to-Rank meetup Vol. 1
•
0 gefällt mir
•
2,722 views
Koji Sekiguchi
Folgen
Learning-to-Rank for Apache Lucene
Weniger lesen
Mehr lesen
Technologie
Melden
Teilen
Melden
Teilen
1 von 24
Jetzt herunterladen
Downloaden Sie, um offline zu lesen
Empfohlen
DSIRNLP#1 ランキング学習ことはじめ
DSIRNLP#1 ランキング学習ことはじめ
sleepy_yoshi
マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話
cyberagent
Prophet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツール
hoxo_m
ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方
BrainPad Inc.
Rustに触れて私のPythonはどう変わったか
Rustに触れて私のPythonはどう変わったか
ShunsukeNakamura17
Solr から使う OpenNLP の日本語固有表現抽出
Solr から使う OpenNLP の日本語固有表現抽出
Koji Sekiguchi
学習時に使ってはいないデータの混入「リーケージを避ける」
学習時に使ってはいないデータの混入「リーケージを避ける」
西岡 賢一郎
継続的なモデルモニタリングを実現するKubernetes Operator
継続的なモデルモニタリングを実現するKubernetes Operator
Yahoo!デベロッパーネットワーク
Empfohlen
DSIRNLP#1 ランキング学習ことはじめ
DSIRNLP#1 ランキング学習ことはじめ
sleepy_yoshi
マッチングサービスにおけるKPIの話
マッチングサービスにおけるKPIの話
cyberagent
Prophet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツール
hoxo_m
ブレインパッドにおける機械学習プロジェクトの進め方
ブレインパッドにおける機械学習プロジェクトの進め方
BrainPad Inc.
Rustに触れて私のPythonはどう変わったか
Rustに触れて私のPythonはどう変わったか
ShunsukeNakamura17
Solr から使う OpenNLP の日本語固有表現抽出
Solr から使う OpenNLP の日本語固有表現抽出
Koji Sekiguchi
学習時に使ってはいないデータの混入「リーケージを避ける」
学習時に使ってはいないデータの混入「リーケージを避ける」
西岡 賢一郎
継続的なモデルモニタリングを実現するKubernetes Operator
継続的なモデルモニタリングを実現するKubernetes Operator
Yahoo!デベロッパーネットワーク
ChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AI
Shota Imai
協調フィルタリング入門
協調フィルタリング入門
hoxo_m
研究分野をサーベイする
研究分野をサーベイする
Takayuki Itoh
DockerコンテナでGitを使う
DockerコンテナでGitを使う
Kazuhiro Suga
IT系エンジニアのためのプレゼンテーション入門
IT系エンジニアのためのプレゼンテーション入門
Masahito Zembutsu
リーン開発の本質 公開用
リーン開発の本質 公開用
ESM SEC
デキるプログラマだけが知っているコードレビュー7つの秘訣
デキるプログラマだけが知っているコードレビュー7つの秘訣
Masahiro Nishimi
逆説のスタートアップ思考
逆説のスタートアップ思考
Takaaki Umada
40歳過ぎてもエンジニアでいるためにやっていること
40歳過ぎてもエンジニアでいるためにやっていること
onozaty
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
Tokoroten Nakayama
Elasticsearch の検索精度のチューニング 〜テストを作って高速かつ安全に〜
Elasticsearch の検索精度のチューニング 〜テストを作って高速かつ安全に〜
Takahiko Ito
DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜
Jun Okumura
Jupyter だけで機械学習を実サービス展開できる基盤
Jupyter だけで機械学習を実サービス展開できる基盤
Recruit Lifestyle Co., Ltd.
リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例
Tetsutaro Watanabe
卒業研究発表のスライド
卒業研究発表のスライド
Takebuchi Eiichi
LINEの新卒採用試験 ズバリ問題解説
LINEの新卒採用試験 ズバリ問題解説
LINE Corporation
レコメンドアルゴリズムの基本と周辺知識と実装方法
レコメンドアルゴリズムの基本と周辺知識と実装方法
Takeshi Mikami
組織にテストを書く文化を根付かせる戦略と戦術
組織にテストを書く文化を根付かせる戦略と戦術
Takuto Wada
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
joisino
Surveyから始まる研究者への道 - Stand on the shoulders of giants -
Surveyから始まる研究者への道 - Stand on the shoulders of giants -
諒介 荒木
20180725 Learning To Rank meetup
20180725 Learning To Rank meetup
Yasufumi Mizoguchi
NLP4L - 情報検索における性能改善のためのコーパスの活用とランキング学習
NLP4L - 情報検索における性能改善のためのコーパスの活用とランキング学習
Koji Sekiguchi
Weitere ähnliche Inhalte
Was ist angesagt?
ChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AI
Shota Imai
協調フィルタリング入門
協調フィルタリング入門
hoxo_m
研究分野をサーベイする
研究分野をサーベイする
Takayuki Itoh
DockerコンテナでGitを使う
DockerコンテナでGitを使う
Kazuhiro Suga
IT系エンジニアのためのプレゼンテーション入門
IT系エンジニアのためのプレゼンテーション入門
Masahito Zembutsu
リーン開発の本質 公開用
リーン開発の本質 公開用
ESM SEC
デキるプログラマだけが知っているコードレビュー7つの秘訣
デキるプログラマだけが知っているコードレビュー7つの秘訣
Masahiro Nishimi
逆説のスタートアップ思考
逆説のスタートアップ思考
Takaaki Umada
40歳過ぎてもエンジニアでいるためにやっていること
40歳過ぎてもエンジニアでいるためにやっていること
onozaty
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
Tokoroten Nakayama
Elasticsearch の検索精度のチューニング 〜テストを作って高速かつ安全に〜
Elasticsearch の検索精度のチューニング 〜テストを作って高速かつ安全に〜
Takahiko Ito
DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜
Jun Okumura
Jupyter だけで機械学習を実サービス展開できる基盤
Jupyter だけで機械学習を実サービス展開できる基盤
Recruit Lifestyle Co., Ltd.
リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例
Tetsutaro Watanabe
卒業研究発表のスライド
卒業研究発表のスライド
Takebuchi Eiichi
LINEの新卒採用試験 ズバリ問題解説
LINEの新卒採用試験 ズバリ問題解説
LINE Corporation
レコメンドアルゴリズムの基本と周辺知識と実装方法
レコメンドアルゴリズムの基本と周辺知識と実装方法
Takeshi Mikami
組織にテストを書く文化を根付かせる戦略と戦術
組織にテストを書く文化を根付かせる戦略と戦術
Takuto Wada
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
joisino
Surveyから始まる研究者への道 - Stand on the shoulders of giants -
Surveyから始まる研究者への道 - Stand on the shoulders of giants -
諒介 荒木
Was ist angesagt?
(20)
ChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AI
協調フィルタリング入門
協調フィルタリング入門
研究分野をサーベイする
研究分野をサーベイする
DockerコンテナでGitを使う
DockerコンテナでGitを使う
IT系エンジニアのためのプレゼンテーション入門
IT系エンジニアのためのプレゼンテーション入門
リーン開発の本質 公開用
リーン開発の本質 公開用
デキるプログラマだけが知っているコードレビュー7つの秘訣
デキるプログラマだけが知っているコードレビュー7つの秘訣
逆説のスタートアップ思考
逆説のスタートアップ思考
40歳過ぎてもエンジニアでいるためにやっていること
40歳過ぎてもエンジニアでいるためにやっていること
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
Elasticsearch の検索精度のチューニング 〜テストを作って高速かつ安全に〜
Elasticsearch の検索精度のチューニング 〜テストを作って高速かつ安全に〜
DQNからRainbowまで 〜深層強化学習の最新動向〜
DQNからRainbowまで 〜深層強化学習の最新動向〜
Jupyter だけで機械学習を実サービス展開できる基盤
Jupyter だけで機械学習を実サービス展開できる基盤
リクルートを支える横断データ基盤と機械学習の適用事例
リクルートを支える横断データ基盤と機械学習の適用事例
卒業研究発表のスライド
卒業研究発表のスライド
LINEの新卒採用試験 ズバリ問題解説
LINEの新卒採用試験 ズバリ問題解説
レコメンドアルゴリズムの基本と周辺知識と実装方法
レコメンドアルゴリズムの基本と周辺知識と実装方法
組織にテストを書く文化を根付かせる戦略と戦術
組織にテストを書く文化を根付かせる戦略と戦術
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Surveyから始まる研究者への道 - Stand on the shoulders of giants -
Surveyから始まる研究者への道 - Stand on the shoulders of giants -
Ähnlich wie Learning-to-Rank meetup Vol. 1
20180725 Learning To Rank meetup
20180725 Learning To Rank meetup
Yasufumi Mizoguchi
NLP4L - 情報検索における性能改善のためのコーパスの活用とランキング学習
NLP4L - 情報検索における性能改善のためのコーパスの活用とランキング学習
Koji Sekiguchi
Code4Lib 2013参加報告
Code4Lib 2013参加報告
Masao Takaku
solr勉強会資料
solr勉強会資料
Atsushi Takayasu
情報検索の基礎からデータの徹底活用まで
情報検索の基礎からデータの徹底活用まで
Koji Sekiguchi
OpenStack環境構築支援について
OpenStack環境構築支援について
Satoshi Konno
Serverless meetup02 openwhisk
Serverless meetup02 openwhisk
Hideaki Tokida
Reading 1st dRuby
Reading 1st dRuby
Koichi ITO
オープンソース入門
オープンソース入門
VirtualTech Japan Inc./Begi.net Inc.
Plone features and trends
Plone features and trends
Takanori Suzuki
Elasticsearch 20150107
Elasticsearch 20150107
ShingoOKAWA
Open robotarm.orgのめざすもの
Open robotarm.orgのめざすもの
遼太 城野
ビッグデータ関連Oss動向調査とニーズ分析
ビッグデータ関連Oss動向調査とニーズ分析
Yukio Yoshida
OpenStack Now!
OpenStack Now!
Hideki Saito
Twitter API
Twitter API
Hiroshi Tsujimura
OSC 2011 Tokyo/Spring OpenStackプレゼン
OSC 2011 Tokyo/Spring OpenStackプレゼン
Masanori Itoh
オープンソースの来し方行末@OSC 2017 Osaka
オープンソースの来し方行末@OSC 2017 Osaka
Open Source Software Association of Japan
Railsから学ぶRESTfulなuri設計
Railsから学ぶRESTfulなuri設計
Kanako Kobayashi
恐るべきApache, Web勉強会@福岡
恐るべきApache, Web勉強会@福岡
Aya Komuro
JJUG CCC 2014 ATL
JJUG CCC 2014 ATL
Recruit Technologies
Ähnlich wie Learning-to-Rank meetup Vol. 1
(20)
20180725 Learning To Rank meetup
20180725 Learning To Rank meetup
NLP4L - 情報検索における性能改善のためのコーパスの活用とランキング学習
NLP4L - 情報検索における性能改善のためのコーパスの活用とランキング学習
Code4Lib 2013参加報告
Code4Lib 2013参加報告
solr勉強会資料
solr勉強会資料
情報検索の基礎からデータの徹底活用まで
情報検索の基礎からデータの徹底活用まで
OpenStack環境構築支援について
OpenStack環境構築支援について
Serverless meetup02 openwhisk
Serverless meetup02 openwhisk
Reading 1st dRuby
Reading 1st dRuby
オープンソース入門
オープンソース入門
Plone features and trends
Plone features and trends
Elasticsearch 20150107
Elasticsearch 20150107
Open robotarm.orgのめざすもの
Open robotarm.orgのめざすもの
ビッグデータ関連Oss動向調査とニーズ分析
ビッグデータ関連Oss動向調査とニーズ分析
OpenStack Now!
OpenStack Now!
Twitter API
Twitter API
OSC 2011 Tokyo/Spring OpenStackプレゼン
OSC 2011 Tokyo/Spring OpenStackプレゼン
オープンソースの来し方行末@OSC 2017 Osaka
オープンソースの来し方行末@OSC 2017 Osaka
Railsから学ぶRESTfulなuri設計
Railsから学ぶRESTfulなuri設計
恐るべきApache, Web勉強会@福岡
恐るべきApache, Web勉強会@福岡
JJUG CCC 2014 ATL
JJUG CCC 2014 ATL
Mehr von Koji Sekiguchi
20221209-ApacheSolrによるはじめてのセマンティックサーチ.pdf
20221209-ApacheSolrによるはじめてのセマンティックサーチ.pdf
Koji Sekiguchi
Lucene 6819-good-bye-index-time-boost
Lucene 6819-good-bye-index-time-boost
Koji Sekiguchi
An Introduction to NLP4L (Scala by the Bay / Big Data Scala 2015)
An Introduction to NLP4L (Scala by the Bay / Big Data Scala 2015)
Koji Sekiguchi
An Introduction to NLP4L
An Introduction to NLP4L
Koji Sekiguchi
Nlp4 l intro-20150513
Nlp4 l intro-20150513
Koji Sekiguchi
コーパス学習による Apache Solr の徹底活用
コーパス学習による Apache Solr の徹底活用
Koji Sekiguchi
LUCENE-5252 NGramSynonymTokenizer
LUCENE-5252 NGramSynonymTokenizer
Koji Sekiguchi
情報検索におけるランキング計算の紹介
情報検索におけるランキング計算の紹介
Koji Sekiguchi
系列パターンマイニングを用いた単語パターン学習とWikipediaからの組織名抽出
系列パターンマイニングを用いた単語パターン学習とWikipediaからの組織名抽出
Koji Sekiguchi
Luceneインデックスの共起単語分析とSolrによる共起単語サジェスチョン
Luceneインデックスの共起単語分析とSolrによる共起単語サジェスチョン
Koji Sekiguchi
Html noise reduction
Html noise reduction
Koji Sekiguchi
Lucene terms extraction
Lucene terms extraction
Koji Sekiguchi
Visualize terms network in Lucene index
Visualize terms network in Lucene index
Koji Sekiguchi
WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成
Koji Sekiguchi
HMM viterbi
HMM viterbi
Koji Sekiguchi
NLP x Lucene/Solr
NLP x Lucene/Solr
Koji Sekiguchi
OpenNLP - MEM and Perceptron
OpenNLP - MEM and Perceptron
Koji Sekiguchi
自然言語処理における機械学習による曖昧性解消入門
自然言語処理における機械学習による曖昧性解消入門
Koji Sekiguchi
Similarity functions in Lucene 4.0
Similarity functions in Lucene 4.0
Koji Sekiguchi
Pre rondhuit-naming-story
Pre rondhuit-naming-story
Koji Sekiguchi
Mehr von Koji Sekiguchi
(20)
20221209-ApacheSolrによるはじめてのセマンティックサーチ.pdf
20221209-ApacheSolrによるはじめてのセマンティックサーチ.pdf
Lucene 6819-good-bye-index-time-boost
Lucene 6819-good-bye-index-time-boost
An Introduction to NLP4L (Scala by the Bay / Big Data Scala 2015)
An Introduction to NLP4L (Scala by the Bay / Big Data Scala 2015)
An Introduction to NLP4L
An Introduction to NLP4L
Nlp4 l intro-20150513
Nlp4 l intro-20150513
コーパス学習による Apache Solr の徹底活用
コーパス学習による Apache Solr の徹底活用
LUCENE-5252 NGramSynonymTokenizer
LUCENE-5252 NGramSynonymTokenizer
情報検索におけるランキング計算の紹介
情報検索におけるランキング計算の紹介
系列パターンマイニングを用いた単語パターン学習とWikipediaからの組織名抽出
系列パターンマイニングを用いた単語パターン学習とWikipediaからの組織名抽出
Luceneインデックスの共起単語分析とSolrによる共起単語サジェスチョン
Luceneインデックスの共起単語分析とSolrによる共起単語サジェスチョン
Html noise reduction
Html noise reduction
Lucene terms extraction
Lucene terms extraction
Visualize terms network in Lucene index
Visualize terms network in Lucene index
WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成
HMM viterbi
HMM viterbi
NLP x Lucene/Solr
NLP x Lucene/Solr
OpenNLP - MEM and Perceptron
OpenNLP - MEM and Perceptron
自然言語処理における機械学習による曖昧性解消入門
自然言語処理における機械学習による曖昧性解消入門
Similarity functions in Lucene 4.0
Similarity functions in Lucene 4.0
Pre rondhuit-naming-story
Pre rondhuit-naming-story
Kürzlich hochgeladen
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
sn679259
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
WSO2
Kürzlich hochgeladen
(10)
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
Learning-to-Rank meetup Vol. 1
1.
ランキング学習 勉強会(第1回) 4/18/2018 関口宏司
2.
自己紹介 • ロンウイット 創業者兼社長 •
Apache Lucene/Solr/OpenNLP コミッター兼PMCメンバー、ASFメンバー ASFメンバーって・・・? https://www.rondhuit.com/miracle-org-asf.html • 書籍執筆&監修 • Apache Lucene/Solr, Apache Ant, etc. • ツイッター:@kojisays 2
3.
ロンウイットについて • 2006年設立当初より情報検索の専門企業 • Apache
Lucene/Solr/OpenNLP, Elasticsearch • コンサルティング、製品開発、サポート、教育 • Apacheコミッターを複数名輩出 • 「Apache Lucene/Solr勉強会」主催 3
4.
ランキング学習勉強会の目的 • ランキング学習(LTR=Learning-to-Rank)の理 論から実践まで • LTRアルゴリズムを勉強 •
LTRプログラムを作成 • LTRプログラムを利用 4
5.
ランキングの重要性 • ランキング=検索結果リストの表示順=文書のスコア • ランキングはユーザの検索エンジンの性能評価に大きな 影響を与える •
検索エンジンの性能評価 • 精度(Precision) • 再現率(Recall) ※ 株式会社ロンウイットの研修コース「Apache Mahout & Sparkではじめる機械学習」より抜粋。 5
6.
精度と再現率(理論) ※ 株式会社ロンウイットの研修コース「Apache Mahout
& Sparkではじめる機械学習」より抜粋。 文書の全体集合 ユーザの期待システム出力 6
7.
精度と再現率(理論) ※ 株式会社ロンウイットの研修コース「Apache Mahout
& Sparkではじめる機械学習」より抜粋。 文書の全体集合 A CB ユーザの期待システム出力 P=B/(A+B) R=B/(C+B) P:Precision R:Recall 7
8.
精度と再現率(実際) ※ 株式会社ロンウイットの研修コース「Apache Mahout
& Sparkではじめる機械学習」より抜粋。 文書の全体集合 ユーザの期待 システム出力 P=0.01% R=99.9% 8
9.
適切なランキングで低精度をカバー ※ 株式会社ロンウイットの研修コース「Apache Mahout
& Sparkではじめる機械学習」より抜粋。 文書の全体集合 ユーザの期待 システム出力 1位 2位 3位 100位 : 10,000位 : 500位 : 9
10.
パーソナライズ検索とは 文書の全体集合 ユーザの期待 システム出力 q=apple 1位 2位 3位 fruit… A 10
11.
パーソナライズ検索とは 文書の全体集合 システム出力 q=apple computer ユーザの期待 1位 2位 3位 B 11
12.
スコア計算の種類 ※ 株式会社ロンウイットの研修コース「Apache Mahout
& Sparkではじめる機械学習」より抜粋。 クエリ従属 クエリ独立 スコア = S(q, di) スコア = S(di) ベクトル空間モデル 確率モデル PageRank HITS Apache Lucene/Solr Apache Nutch DEC AltaVista Google PageRank 12
13.
ランキング学習のスコア • ランキング学習のスコアは「クエリ従属」の一種 → スコア
= S(q, di) • ただし、ベクトルdiはクエリによって変わる → di = f(q) di di=f(q1) di=f(q2) ベクトル空間モデル 確率モデル ランキング学習 13
14.
パーソナライズ検索とLTR • パーソナライズ検索はユーザによって正解セットが移動 • ユーザによってクエリを変えさえすれば、LTRの枠組みで パーソナライズ検索の学習と実行が可能! →
q’ = f(q, u) 14
15.
LTRのフレームワーク クエリ1 文書a1 文書b1 : ランキング1 クエリ2 文書a2 文書b2 : ランキング2 クエリn 文書an 文書bn : ランキングn ・・・ モデル クエリx 文書ax 文書bx : ランキング? クエリx 文書ax 文書bx : ランキング 推定値 学習データ モデルの 学習 ランキング システム 15
16.
3つのアプローチ Pointwise 単一の文書に「あるクエリとの関連度」情 報が付与されているデータを学習する。 (例)PRank, NNRank あるクエリについて 文書1:★★★★☆ 文書2:★☆☆☆☆ 文書3:★★★☆☆ Pairwise あるクエリについて文書ペアのどちらがよ り関連度が高いかという情報が付与されて いるデータを学習する。(例) RankingSVM, SortNet あるクエリについて 文書1
> 文書2 文書2 < 文書3 文書4 > 文書5 Listwise あるクエリについて文書集合の中での順位 情報が付与されているデータを学習する。 (例)ListNet, LambdaRank あるクエリについて 1位:文書5 2位:文書3 3位:文書11 ※ 株式会社ロンウイットの研修コース「Apache Mahout & Sparkではじめる機械学習」より抜粋。 16
17.
マイクロソフトのデータセット • LETOR(LEarning TO
Rank) 4.0 released 2009 • MQ2007:TREC 2007のMillion Query Trackのクエリ セットを使用 • MQ2008:TREC 2008のMillion Query Trackのクエリ セットを使用 17 2 qid:10032 1:0.056537 2:0.000000 3:0.666667 4:1.000000 5:0.067138 … 45:0.000000 46:0.076923 #docid = GX029-35-5894638 inc = 0.0119881192468859 prob = 0.139842 0 qid:10032 1:0.279152 2:0.000000 3:0.000000 4:0.000000 5:0.279152 … 45:0.250000 46:1.000000 #docid = GX030-77-6315042 inc = 1 prob = 0.341364 0 qid:10032 1:0.130742 2:0.000000 3:0.333333 4:0.000000 5:0.134276 … 45:0.750000 46:1.000000 #docid = GX140-98-13566007 inc = 1 prob = 0.0701303 1 qid:10032 1:0.593640 2:1.000000 3:0.000000 4:0.000000 5:0.600707 … 45:0.500000 46:0.000000 #docid = GX256-43-0740276 inc = 0.0136292023050293 prob = 0.400738
18.
マイクロソフトのデータセット 18 出典:https://www.microsoft.com/en-us/research/project/ letor-learning-rank-information-retrieval/
19.
使用するOSS • LTR4L Learning-to-Rank
for Apache Lucene https://github.com/LTR4L/ltr4l • Apache Lucene • Apache Solr • Elasticsearch 19
20.
LTRフレームワークとの対応 クエリ1 文書a1 文書b1 : ランキング1 クエリ2 文書a2 文書b2 : ランキング2 クエリn 文書an 文書bn : ランキングn ・・・ モデル クエリx 文書ax 文書bx : ランキング? クエリx 文書ax 文書bx : ランキング 推定値 学習データ モデルの 学習 ランキング システム 20
21.
LTRフレームワークとの対応 Lucene/Solr/ES クエリ1 文書a1 文書b1 : ランキング1 クエリ2 文書a2 文書b2 : ランキング2 クエリn 文書an 文書bn : ランキングn ・・・ ランキング学習 モデル クエリx 文書ax 文書bx : ランキング? クエリx 文書ax 文書bx : ランキング 推定値 教師データ作成 リランキング特徴抽出 特徴抽出 :LTR4Lが提供 21
22.
Web アプリ インプレッ ションログ クリック モデル Lucene Solr/ES 特徴抽出 学習 データ ランキング 学習 モデル リランキング 活性化関数 最適化関数 正則化関数 評価関数 正規化 Fold分割 report.csv 評価 NDCG Loss config.json M1 M2 MAP NDCG@3 NDCG@10 レポート 可視化 22
23.
LTR勉強会の目的(再) • LTRの理論から実践まで • LTRアルゴリズムを勉強 •
LTRプログラムを作成 • LTRプログラムを利用 23
24.
ランキング学習 勉強会 LTR勉強会の目的(再) • LTRの理論から実践まで 理論の勉強 LTRの利用 (LT発表) LTR実装 フィードバック 24
Jetzt herunterladen