SlideShare ist ein Scribd-Unternehmen logo
1 von 44
DEIM 2014 B8-4

2014.3.5 (Wed)

話題を考慮した多様性のある
情報推薦手法の提案
†明治大学 理工学部 情報科学科
2

Outline
1.
2.
3.
4.
5.

はじめに
提案手法
評価実験
結果
まとめ
3

1. はじめに
4

1.1 背景

-1

• 従来の推薦システムは

ユーザ or アイテム の類似度合いから推薦

推
薦

似ている
5

1.1 背景

-1

• 従来の推薦システムは

ユーザ or アイテム の類似度合いから推薦

推
薦
似ている
味噌ラーメン
が好き
6

1.1 背景

-2

【問題点】
「似ている」だけでは
アイテムを推薦する理由にならない
⇒明確な理由付けがない
推
薦
これは
味噌味?
醤油味?
7

1.2 目的
• 提案手法は,明確な理由付けができる手法

理由付け
* アイテムの特徴
* どのユーザからのお薦めか
推
薦
* 味噌
* 川越シェフ
8

2. 提案手法
9

2.1 着想

-1

• 類似度合いを用いない

→話題(トピック)を用いる ⇒理由付け可能
トピック

ラーメン

トピック

ターゲットユーザ

お肉
10

2.1 着想

-1

• 類似度合いを用いない

→話題(トピック)を用いる ⇒理由付け可能
トピック

“ラーメン”
推薦
ラーメン

トピック

ターゲットユーザ

“お肉”
推薦
お肉
11

2.1 着想

-2

期間限定
ラーメン

• 類似度合いを用いると,

推薦するアイテムがいつも同じ
→アイテム紹介式で推薦
トピック

ラーメン

ターゲットユーザ

紹
介

川越シェフ

⇒どのユーザからの
お薦めか理由付け
⇒リアルタイムで推薦
12

2.2 構成
1

2

3

4

•ユーザ&アイテム プロファイル構築

•評価付け,特徴抽出

•ターゲットユーザ選出,アイテム推薦

•プロファイル更新
13

1

2

3

4

•ユーザ&アイテム プロファイル構築

•評価付け,特徴抽出

•ターゲットユーザ選出,アイテム推薦

•プロファイル更新
14

2.3

処理

1

•ユーザ&アイテム プロファイル構築

• ユーザプロファイル

…嗜好情報
ユーザの興味のある
タグ群を構築

• アイテムプロファイル

…被嗜好情報
アイテムを説明するのに
相応しいタグ群を構築
15

2.3

処理

1

•ユーザ&アイテム プロファイル構築

• ユーザプロファイル

…嗜好情報

ラーメン
お肉
味噌
パスタ

• アイテムプロファイル

…被嗜好情報

ラーメン
味噌
ランチ
太麺
16

1

2

3

4

•ユーザ&アイテム プロファイル構築

•評価付け,特徴抽出

•ターゲットユーザ選出,アイテム推薦

•プロファイル更新
17

2.3

処理

2

•評価付け,特徴抽出

• 紹介(推薦)=評価付け

→紹介タイミング
…お薦めのアイテムのみ推薦すべき

• 特徴抽出

→共起タグ

評価付け
ユーザA

ラーメン
味噌
ランチ
太麺

ラーメン
お肉
味噌
パスタ

ラーメン
味噌
関連特徴
18

1

2

3

4

•ユーザ&アイテム プロファイル構築

•評価付け,特徴抽出

•ターゲットユーザ選出,アイテム推薦

•プロファイル更新
19

2.3

処理

3

•ターゲットユーザ選出,アイテム推薦

• ターゲットユーザ選出

→関連特徴を持つユーザを探す

ダーツ
味噌
ドリア
ラーメン

ラーメン
豚骨
お肉
醤油

ラーメン
ドリア
ピラフ
からあげ

関連特徴
ラーメン
味噌
20

2.3

処理

3

•ターゲットユーザ選出,アイテム推薦

• アイテム推薦

「すぐに推薦」
「あとで推薦」
どちらも可能
ダーツ
味噌
ドリア
ラーメン

ラーメン
お肉
味噌
パスタ

ラーメン
味噌
ランチ
太麺

評価付け
ユーザA

紹
介

ラーメン
味噌
評価付け
ユーザA から

を理由
として推薦
21

1

2

3

4

•ユーザ&アイテム プロファイル構築

•評価付け,特徴抽出

•ターゲットユーザ選出,アイテム推薦

•プロファイル更新
22

2.3

処理

4

•プロファイル更新

• ユーザプロファイル・アイテムプロファイル の更新

評価付け
ユーザA

ラーメン
お肉
味噌
パスタ

ラーメン
味噌
ランチ
太麺

→ユーザの直近の興味を表現できる
→最近どのような項目でアイテムが注目
されているか表現できる
23

2.3

処理

4

•プロファイル更新

• ユーザプロファイル・アイテムプロファイル の更新

評価付け
ユーザA

新しい
プロファイル

ラーメン
お肉
味噌
パスタ

ラーメン
味噌
ランチ
太麺

ラーメン
お肉
味噌
太麺

ラーメン
味噌
お肉
太麺
24

1

2

3

4

•ユーザ&アイテム プロファイル構築

•評価付け,特徴抽出

•ターゲットユーザ選出,アイテム推薦

•プロファイル更新
25

3. 評価実験
26

3.1 使用データ
• ソーシャルブックマーク

データセット
delicious http://grouplens.org/datasets/hetrec-2011/

User
Item (Page)
Bookmark
Tag

1867
69223
104799
40897

→いつユーザがどのページをブックマークしたか
→ブックマークしたときにどのようなタグを付けたか
27

3.2 実験方法
• 1個 のセグメントを

学習部
4個
〃
正解部
を1ケース
• セグメントをスライドさせ,15ケース用意

Case 1
Case 2
Case 3

Case 15
28

3.3 評価指標
• 推薦精度 (再現率)

Precision , Recall , F-Measure
→定義した正解部とのズレ
• 推薦可能なユーザの割合

E-Rate
→アイテムが1つ以上推薦できたユーザの割合
• 多様性 (嗜好網羅的)

Profile Covering Diversity (PCD)
29

3.4 多様性 (嗜好網羅的)
• なぜ,多様性を計る?

⇒提案手法は,様々な話題を考慮し,
ユーザが好む話題を網羅できる
トピック

“ラーメン”
推薦
ラーメン

トピック

ターゲットユーザ

“お肉”
推薦
お肉

-1
30

3.4 多様性 (嗜好網羅的)

-2

• 多様性を どのように 計る?

⇒ユーザプロファイルのタグを均等に網羅する
ように推薦アイテム群が構築できているか
例) 4つの好みがある中で
2つのアイテムを推薦
ラーメン
お肉
味噌
パスタ

推薦されたアイテム

⇒ 0.5 (50%)
31

4. 結果
32

4.1 結果
• 各手法の推薦有用性比較

F-Measure
Proposal 0.00062
Item-CF
0.00215
User-CF
0.00020
Random
0.00006

E-Rate
0.588
0.088
0.081
1.000

PCD
0.271
0.051
0.048
0.010

• 提案手法は,推薦できるユーザの割合 また

多様性(嗜好網羅的)で最も優れる手法
33

4.2 考察
• 推薦精度では,協調フィルタリングに比べ

あまり変わらない もしくは 大きく下げていない

• 推薦可能なユーザ

→ 多い

• ユーザの好みに対して網羅的に情報を推薦できる

(多様性がある)

⇒提案手法が最も有用であると考えられる
34

5. まとめ
35

5.1 まとめ
• 話題を考慮した情報推薦手法を提案
• ソーシャルブックマークを用いることで

膨大な情報から有益な情報推薦が可能であった

• 提案手法は,

▽どのユーザによる推薦 →評価付けしたユーザ
▽なぜこの情報を推薦
→話題(トピック),タグ

これらを示せる ⇒ 理由付け ができた
36

ご静聴ありがとうございました
37

6. 参考
38

6.1 関連研究

-1

多様性 (情報推薦手法)
• 類似アイテム除去 (フィルタリング)

計算結果

推薦
39

6.1 関連研究

-2

多様性 (評価指標)
• 推薦リスト内類似度

ILS : Intra-List Similarity
→推薦リスト内のアイテム類似度を用いる

• 相対的多様性

RD : Relative Diversity
→注目アイテムに対して
各アイテムとの類似度を用いる

→いずれも 類似度
40

6.1 関連研究

-3

ソーシャルブックマーク での情報推薦
• フォークソノミー

Folksonomy
→ユーザによって情報にタグ付け

• 推薦方法

→ユーザ同士の嗜好類似度を算出しやすくする
・ユーザと各タグの表記ゆれ
・嗜好の表現を抽象化
→クラスタリング
41

6.2 実験方法
• ブックマーク順にログを整列

• 20個 のセグメントに分割

104799

0
bookmark
20 Segments
42

6.3 比較手法
提案手法(Proposal)と比較する手法を用意
• 協調フィルタリング

アイテムベース
ユーザベース
• 無作為抽出手法

(CF , Collaborative Filtering)
Item-CF
User-CF
Random

…全ページからユーザが未だブックマークして
いないページを無作為に3ページ抽出し推薦
43

6.4 結果
• 各手法の推薦精度比較

Item-CF
Proposal
User-CF
Random
• 提案手法は,

Precision
0.00568
0.00125
0.00072
0.00029

Recall
0.00132
0.00041
0.00012
0.00003

F-Measure
0.00215
0.00062
0.00020
0.00006

アイテムベースの協調フィルタリングより劣る
44

6.5 展望
• 推薦精度と多様性は,

ドメインによって変動してしまう可能性大

→目的依存である
⇒情報の内容を意味理解させる
ことで改善できるのではないか

Weitere ähnliche Inhalte

Andere mochten auch

Fundacion san mateo
Fundacion san mateoFundacion san mateo
Fundacion san mateoGDRODRIGUEZ
 
leidy yuliana mora hernandez 11-2
leidy yuliana mora hernandez 11-2leidy yuliana mora hernandez 11-2
leidy yuliana mora hernandez 11-2yulianamora20
 
Online Journalism in Bangladesh
Online Journalism in BangladeshOnline Journalism in Bangladesh
Online Journalism in BangladeshSaiful Samin
 
Cuento motor "Érase una de indios"
Cuento motor  "Érase una de indios"Cuento motor  "Érase una de indios"
Cuento motor "Érase una de indios"jose coci coci
 
Noordersluis
NoordersluisNoordersluis
NoordersluisiZovator
 
Visioning the Next Decade: NIPTE-FDA Collaboration
Visioning the Next Decade: NIPTE-FDA CollaborationVisioning the Next Decade: NIPTE-FDA Collaboration
Visioning the Next Decade: NIPTE-FDA CollaborationAjaz Hussain
 
she'll just grab any device that's closer
she'll just grab any device that's closershe'll just grab any device that's closer
she'll just grab any device that's closerJoan Choi
 
Behavioral Economics and Managment of Pharmaceutical QbD 25 August 2016
Behavioral Economics and Managment of Pharmaceutical QbD 25 August 2016Behavioral Economics and Managment of Pharmaceutical QbD 25 August 2016
Behavioral Economics and Managment of Pharmaceutical QbD 25 August 2016Ajaz Hussain
 
Geografia do Paraná
Geografia do Paraná Geografia do Paraná
Geografia do Paraná aroudus
 
Conjunction and its type
Conjunction and its typeConjunction and its type
Conjunction and its typeAnaya Zafar
 
[MABLE] 2016년 상반기 미디어 결산 및 트랜드 보고서
[MABLE] 2016년 상반기 미디어 결산 및 트랜드 보고서[MABLE] 2016년 상반기 미디어 결산 및 트랜드 보고서
[MABLE] 2016년 상반기 미디어 결산 및 트랜드 보고서MABLE N search marketing
 

Andere mochten auch (11)

Fundacion san mateo
Fundacion san mateoFundacion san mateo
Fundacion san mateo
 
leidy yuliana mora hernandez 11-2
leidy yuliana mora hernandez 11-2leidy yuliana mora hernandez 11-2
leidy yuliana mora hernandez 11-2
 
Online Journalism in Bangladesh
Online Journalism in BangladeshOnline Journalism in Bangladesh
Online Journalism in Bangladesh
 
Cuento motor "Érase una de indios"
Cuento motor  "Érase una de indios"Cuento motor  "Érase una de indios"
Cuento motor "Érase una de indios"
 
Noordersluis
NoordersluisNoordersluis
Noordersluis
 
Visioning the Next Decade: NIPTE-FDA Collaboration
Visioning the Next Decade: NIPTE-FDA CollaborationVisioning the Next Decade: NIPTE-FDA Collaboration
Visioning the Next Decade: NIPTE-FDA Collaboration
 
she'll just grab any device that's closer
she'll just grab any device that's closershe'll just grab any device that's closer
she'll just grab any device that's closer
 
Behavioral Economics and Managment of Pharmaceutical QbD 25 August 2016
Behavioral Economics and Managment of Pharmaceutical QbD 25 August 2016Behavioral Economics and Managment of Pharmaceutical QbD 25 August 2016
Behavioral Economics and Managment of Pharmaceutical QbD 25 August 2016
 
Geografia do Paraná
Geografia do Paraná Geografia do Paraná
Geografia do Paraná
 
Conjunction and its type
Conjunction and its typeConjunction and its type
Conjunction and its type
 
[MABLE] 2016년 상반기 미디어 결산 및 트랜드 보고서
[MABLE] 2016년 상반기 미디어 결산 및 트랜드 보고서[MABLE] 2016년 상반기 미디어 결산 및 트랜드 보고서
[MABLE] 2016년 상반기 미디어 결산 및 트랜드 보고서
 

Mehr von Tatsuya Coike

rm shredder @ ABPro2016
rm shredder @ ABPro2016rm shredder @ ABPro2016
rm shredder @ ABPro2016Tatsuya Coike
 
Password Timing @ ABPro2015
Password Timing @ ABPro2015Password Timing @ ABPro2015
Password Timing @ ABPro2015Tatsuya Coike
 
主観表現と客観表現を用いたTwitterにおける有益なツイートの推定
主観表現と客観表現を用いたTwitterにおける有益なツイートの推定主観表現と客観表現を用いたTwitterにおける有益なツイートの推定
主観表現と客観表現を用いたTwitterにおける有益なツイートの推定Tatsuya Coike
 
RGB Color Strike Game @ ABPro2014
RGB Color Strike Game @ ABPro2014RGB Color Strike Game @ ABPro2014
RGB Color Strike Game @ ABPro2014Tatsuya Coike
 
Foursquare Introduction
Foursquare IntroductionFoursquare Introduction
Foursquare IntroductionTatsuya Coike
 
Way of Experiment & Evaluation
Way of Experiment & EvaluationWay of Experiment & Evaluation
Way of Experiment & EvaluationTatsuya Coike
 

Mehr von Tatsuya Coike (6)

rm shredder @ ABPro2016
rm shredder @ ABPro2016rm shredder @ ABPro2016
rm shredder @ ABPro2016
 
Password Timing @ ABPro2015
Password Timing @ ABPro2015Password Timing @ ABPro2015
Password Timing @ ABPro2015
 
主観表現と客観表現を用いたTwitterにおける有益なツイートの推定
主観表現と客観表現を用いたTwitterにおける有益なツイートの推定主観表現と客観表現を用いたTwitterにおける有益なツイートの推定
主観表現と客観表現を用いたTwitterにおける有益なツイートの推定
 
RGB Color Strike Game @ ABPro2014
RGB Color Strike Game @ ABPro2014RGB Color Strike Game @ ABPro2014
RGB Color Strike Game @ ABPro2014
 
Foursquare Introduction
Foursquare IntroductionFoursquare Introduction
Foursquare Introduction
 
Way of Experiment & Evaluation
Way of Experiment & EvaluationWay of Experiment & Evaluation
Way of Experiment & Evaluation
 

Kürzlich hochgeladen

新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 

Kürzlich hochgeladen (7)

新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 

話題を考慮した多様性のある情報推薦手法の提案