NIPS2010読み会: A New Probabilistic Model for Rank Aggregation

NIPS2010読み会
2010-12-26
Yoshihiko Suhara
@sleepy_yoshi

1

挨拶
• 名前
– 数原良彦 (すはらよしひこ)
– @sleepy_yoshi

• ランキング萌え

• 本当は他の論文を紹介する予定だったが，論文が
むずかしく理解できやはりランキングを愛している
ため，本論文を選択
– rank aggregationは未知の領域

2

0354

A New Probabilistic Model for
Rank Aggregation

T. Qin†, X. Geng‡, T.-Y. Liu†
† Microsoft Research Asia
‡ Chinese Academy of Sciences

3

一言要約
• Rank aggregationのための新しい確率モ
デルを提案。

4

Rank aggregation?

5

Rank Aggregationとは
• 課題
– 複数のランキングリストを入力として受け取り，評価値の
高いリストを出力することを目指す

• アプリケーション
– メタサーチエンジン
– 複数のリストを統合するようなアプリケーション
– Etc..

6

メタサーチエンジン
Meta search engine
hoge search

Search engine A Search engine B Search engine C
hoge search hoge search hoge search Final ranking:

Ranking: Ranking: Ranking:

Rank aggregation

7

メタサーチエンジン
Meta search engine
hoge search
Rank
aggregation
hoge search hoge search hoge search Final ranking:

Ranking: Ranking: Ranking:

Rank aggregation

8

Rank aggregation
is NOT
learning to rank

9

Learning to rankとの違い
• Learning to rank (≒ Learning to rank “documents”)
– 入力: 文書集合
– 出力: 各文書のスコア or ランキングリスト

• Rank aggregation
– 入力: 複数のランキングリスト
– 出力: ひとつのランキングリスト

※ 公開データセットや学会のセッション分けではRank aggregationはlearning to rank
とされていることもあるが，ここでは区別のため，Learning to rankではないとした 10

表記法 (1/3)
• �� : 文書i の順位
• �� −1 (��): i位に位置する文書
��(��)

1

2
3
4

�� −1 (��) 12

表記法 (2/3)
• 順列�� = �� −1 1 , �� −1 2 , … , �� −1 (��)

• n次の対称群��
– 「n個のものを並び替える」操作を元とする群
– 集合 {1, 2, ..., n} の上の置換（全単射）全体

• ��−�� : 上位k件が固定された群
– ��−�� = �� ∈ �� |�� = ��, ∀�� = 1, … , ��

13

表記法 (3/3)
• ��−�� : 上位k件が��と同様に順序づけられた群
– ��−�� = ��|�� ∈ �� , �� −1 �� = �� −1 �� , ∀�� = 1, … , ��
上位k件が��と等しい

14

既存手法の俯瞰

15

Rank aggregationの分類と
本論文が扱う課題

Supervised Unsupervised

Weighted BordaCount BordaCount
Order-based
Mallows model Mallows model
Luce model

Score-based Linear CombMNZ
Combination

[Aslam+ 02]を参考 16

BordaCount (Borda-fuse) [Aslam+ 02]
• 選挙のための得点方式
• 候補者数N人に対し，投票者は順位を付けて投票
– 1位にN点，2位にN-1点，…
Final results
hoge search hoge search hoge search
score
A +4 B +4 B 11
B +4

B +3 +3 A +3 A 9
C

C +2 A +2 D +2 C 6

D +1 D +1 C +1 D 4

訓練データが不要 (unsupervised) 17

Weighted BordaCount (Borda-fuse)
• 検索エンジンの性能に基づいて得点に重みづけを行う
– 訓練データにおける各エンジンの検索評価指標の値を利用

x0.5 X3.0 X0.1 Final results
hoge search hoge search hoge search
score
A +4 B +4 B 13.9
B +4

B +3 +3 A +3 C 10.1
C

C +2 A +2 D +2 A 8.3

D +1 D +1 C +1 D 3.7

BordaCountよりも性能が良い [Aslam+ 02] 18

MallowsモデルとLuceモデル

19

既存の順位モデル
• Mallowsモデル [Mallows 57]
– 距離ベース手法

• Luceモデル [Luce 59][Plackett 63]
– 多段階手法

20

順序の距離を用いたRank aggregationの例

• 入力: M個のリスト�� (�� = 1, … ��)
• 出力: 各リストに対する距離の和が最小のリスト
��

�� = argmin�� (��, �� )
��=1

どのようにリスト間の距離を測るか?
21

順序リスト間の距離
• 代表的な距離

��
2
Spearman距離 �� , �� = �� − ��
��=1
��

Spearman footrule �� , �� = �� − ��(��)
��=1

��

Kendall距離 �� , �� = 1 �� −1 �� >�� −1 ��
��=1 ��>��
1 �� = 1 if x is true, 0 otherwise

22

補足: xx距離とxx相関係数の関係
• Spearmanの順位相関係数��は，Spearman距離を
−1,1 に正規化したもの

• Kendallの順位相関係数��は，Kendall距離を −1,1
に正規化したもの

／￣￣￣＼
／ ─ ─ ＼これ豆知識な。
／（●）（●）＼.
| （__人__） |
＼｀ ⌒´ ／
／＼

23

Mallowsモデル
• 距離ベースの確率モデル
1 分散
�� , �� = exp(−�� , �� )
��(��, ��) パラメータ

�� ∈ �� , �� ∈ ��

�� , �� = exp(−�� , �� )
��∈��

Rank aggregationへの利用法 [Lebanon+ 02]
��
1
�� = max exp(− �� (��, �� )
��(��, ��)
��=1

計算に膨大なコスト (��(��!)) がかかる 24

Luce (Plackett-Luce) モデル
• 各順位ごとに確率を計算する多段階の確率モデル
• 個々の文書iに対するスコア�� を用いて以下の通り計算
exp(��−1 1 )
�� −1 (1)が1位にランクされる確率 ��
��=1 exp(��−1 �� )

exp(��−1 2 )
�� −1 (2)が2位にランクされる確率 ��
��=2 exp(��−1 �� )

順列��の確率は， ��
exp(��−1 �� )
�� = ��
��=1 ��=�� exp(��−1 �� )

文書のスコアの関数として定義しているため，
多目的の順列間距離を用いることができない 25

提案手法のアプローチ
• Mallowsモデルのように距離ベースの確率モデルで
あり，Luceモデルのように段階ごとに効率よく確率を
計算できるモデル

• 右剰余類 (right coset) を用いた距離のモデル化

27

右剰余類��−��
�� −4 ��
C ��と同じ
A A A C C

B B
B B B B

C C C D
D D
・・・
E
D D E E E

E F A
D A F
F E F F
F A

全順列 (=6!) 上位4件が��と等しい
全順列の部分集合
28

提案手法: CPSモデル (1/2)
• Coset-permutation distance based stagewise (CPS)
右剰余類に含まれる全
1 リスト��とリスト��の距離
�� −�� , �� = ��(��, ��) の平均
��−��
��∈��−��

Luceモデルよろしく，k位のランクの確率は，

exp(−�� −�� , �� )
��
��=�� exp(−�� −�� , ��, �� , �� )

��−�� , ��, ��

29

提案手法: CPSモデル (2/2)
• リスト��の確率は
��
exp(−�� −�� , �� )
�� , �� = ��
��=1 ��=�� exp(−�� −�� , ��, �� , �� )

• 入力リスト��が複数与えられた場合には，
m番目の入力リスト
��
exp(− ��=1 �� −�� , �� )
�� , �� = ��
��=1 ��=�� exp(− ��=1 �� −�� , ��, �� , �� )

�� = *��1 , … , �� +
�� = *��1 , … , �� +
30

CPSモデルを用いたRank aggregation
• 確率が最大となるランキングリストを選択

�� = argmax�� (��|��, ��)

��
exp(− ��=1 �� −�� , �� )
�� , �� = ��
��=1 ��=�� exp(− ��=1 �� −�� , ��, �� , �� )

�� = *��1 , … , �� +
�� = *��1 , … , �� +

31

効率的な計算
• �� − �� ! の計算量が必要に見えるが，実際には
��(��2 )の計算量で済む．
– 詳細は論文を参考

32

既存モデルとの関係
• Mallowsモデル
– 距離ベースであること
– Mallowsモデルとの大きな違いは計算効率

• Luceモデル
– 段階ごとに確率を計算すること

33

4. Algorithms for Rank Aggregation

34

学習
• 訓練データ �� = �� , ��(��)
– �� : ground truthランキング
– ��(��) : M個の入力ランキング

��の最尤推定を行うため，以下の対数尤度を��について最大化

eは凸関数かつ対数凸関数であるため

��(��)は上に凸であるため，
勾配法などで大域的最適な��を求めることができる
35

出力ランキングの推定
• 入力: M個のランキング，学習したパラメータ��
• 出力: 最終ランキング

M個のランキング��とパラメータ��を用いて
最適なランキング��を推定する

• 推定手法1: global inference
• 推定手法2: sequential inference
– 高速化した手法

36

推定手法1: global inference
• Mallowsモデルと同様に全順列 (�� ∈ �� 全て) について確率
を計算する
• 計算量はんぱない

��
exp(− ��=1 �� −�� , �� )
�� , �� = ��
��=1 ��=�� exp(− ��=1 �� −�� , ��, �� , �� )

37

推定手法2: Sequential inference
• 最終ランキングの最上位から文書をひとつずつ決定していく

38

実験条件 (1/2)
• データセット
– LETORデータセット (MQ2007-agg, MQ2008-agg)
– MQ2008-smallを作成
• 8文書以下のクエリに限定
– 3段階の適合性評価: (Highly relevant, relevant, irrelevant)

• 評価方法
– 評価指標: NDCG
– 5-fold Cross validationの結果を平均

40

補足: NDCG
• Normalized Discounted Cumulative Gain
– [0, 1]
• 適合性評価が多段階のタスクを評価する指標
��
2�� − 1
��@�� = e.g., �� = *4,3,2,1+
log 2 (1 + ��)
��=1

��@��
��@�� =
��@��

��@��: 理想的なランキングにおけるDCG@kの値

41

実験条件 (2/2)
• 比較手法
– CPS-G: CPSモデル (global inference)
– CPS-S: CPSモデル (sequential inference)
– Mallows: Mallowsモデル (最尤推定)
– MallApp: Mallowsモデル (MCMCサンプリングによる推定)
– BordaCount

• MQ2008-smallのみの利用
– CPS-G, Mallows, MallAppは計算量の問題で大規模データ
に適用不可能なため，MQ2008-smallのみを用いて評価

42

結果

WeightedBordaCountじゃないみたい

44

まとめ
• Rank aggregationのための新しい確率モデルである
CPSモデルを提案した
• Coset-permutation distanceを利用する
• Luceモデル (高速に計算可能) と Mallowsモデル (高
い表現力) の利点を引き継いでいる

• Future work
– (1) 3つの距離以外にも効率よく計算可能なモデルを
– (2) unsupervisedなrank aggregationにも適用したい
– (3) 提案モデルの他の利用方法を模索したい

45

参考文献
• 引用文献
– [Aslam+ 01] J. A. Aslam, M. Montague. Models for
Metasearch. SIGIR2001.
– [Lebanon+ 02] G. Lebanon, J. Lefferty. Cranking: Combining
Rankings Using Conditional Probability Models on
Permutation. ICML2002.

• 距離の確率モデルについては下記のサーベイ文献
を参考にした
– [神嶌 09] 神嶌敏弘. 順序の距離と確率モデル. SIG-
DMSM-A902-07. 2009.

46

NIPS2010読み会: A New Probabilistic Model for Rank Aggregation

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (20)

Ähnlich wie NIPS2010読み会: A New Probabilistic Model for Rank Aggregation

Ähnlich wie NIPS2010読み会: A New Probabilistic Model for Rank Aggregation (20)

Mehr von sleepy_yoshi

Mehr von sleepy_yoshi (20)

NIPS2010読み会: A New Probabilistic Model for Rank Aggregation