SlideShare ist ein Scribd-Unternehmen logo
1 von 16
CIKM2013 論文読み会

FIRE: Interactive Visual Support for
Parameter Space-Driven
Rule Mining
Abhishek Mukherji, Xika Lin, Jason Whitehouse,
Christopher R. Botaish,
Elke A. Rundensteiner and Matthew O. Ward

2013.12.07(土)
大木基至
01. 自己紹介
・名前:大木基至(25歳)
・所属:通信会社のデータプラットホームチーム
・マイブーム:人狼、ボドゲ、ジム
・スキル:マイニングが好き
・2年前くらいからマーケティングへのマイニング
の応用を勝手にやってます
• 2012年度VMStudio & TMStudio学生研究“優秀賞”:アン
ケート調査とTwitterの解析に基づく就職活動支援策の提
案
• 2012年度S-PLUS学生研究“佳作賞”:数量化理論第Ⅱ類と
アソシエーションルール解析による自動車バナーデザイン
の分析(詳細)
• 2011年度VMStudio & TMStudio学生研究“佳作賞”:多変
量解析を用いた大学生のためのニュースサイトの構築

・今年も1件出して、現在1件取り組み中
・予測モデル系コンペもやってみたいけど、やるこ
と多すぎてフリーズ中
2013.12.07 発表資料

シリコンバレー
Google 本社にて

1 / 15
02. モチベーション
・大学時代にルールマイニング系の研究をしていた
- 1.ルールの可視化システムの開発
- 3次元ネットワーク図で表現するみたいなやつ
- 2.ルールの評価指標の研究
- ルールの頑健性を定義し、有用性を検証
・というわけで、ルールマイニング系を発表します
・でも、今日は時間なかったので、応用系に逃げました
・10時から読んで作ったので、詳細は
知りません(ごめんなさい)

2013.12.07 発表資料

2 / 15
03. 概要
• 効率的にルールを発見すること重要!
• 一方、マイニングシステムのユーザビリティが遅れてる
• ルール間の関係を対話的に探索したい
• その際、ルールマイニングのパラメータも多くて大変
• FIRE(Framework for Interactive Rule Exploration)
を提案し、ユーザビリティを向上させる
• ルールの分布を表示するビジュアルにこだわる
• パラメータ選択やユーザの理解を助ける
• 22人でユーザビリティ実験
• 対話的マイニング、知識発見、ビジュアル分析に重要な
貢献を果たせた

2013.12.07 発表資料

3 / 15
04. Introduction
• ルールマイニングと言えば、バスケット分析的な(?)
• 有名なアルゴリズムと言えば、Agrawalのアプリオリアル
ゴリズム
• いわゆる支持度に基づく抽出
• 単純だけど、よく使われる

• 抽出までのパフォーマンス(質と速さ)は割とやってる
• マイニングシステムのためのユーザビリティにもそろそ
ろ力いれよう
• けど、いろいろユーザビリティ向上には課題が…

2013.12.07 発表資料

4 / 15
04. Introduction
課題
• パラメータチューニング
• データに応じて、パラメータ(閾値とか)調整必要
• 閾値の高すぎるパラメータだとルールを絞りすぎて

• ルール間の関係可視化
• お互いをカバーしてるルールとかあったりで関係ってのはある
• 大量のルールの中でもう少しグルーピングとかしたい

• パレート最適
• 一般に1つの評価指標でルールは評価しない
• 2つ以上の評価指標を使って最適なルールを見つけましょう

…などなど

2013.12.07 発表資料

5 / 15
04. Introduction
とりあえずやってること
• FIRE
• PSpace View:全体的なパラメータスペースビュー
• RSpace View:詳細なルールスペースビュー

• Supportとconfidenceの値で2次元にマッピングする
• A→Bのルールで、
Support = |A ⋂ B|、Confidence = |A ⋂ B |/| A|

• ルールを抽出して、各ルールをマッピング
• これらのビューで課題を解決する
• 最後にユーザ使ってシステム評価もする
• うーむ、怪しい

2013.12.07 発表資料

6 / 15
05. Interactive Rule Mining Model
• これがFIRE!(うーん、なんだコレ)

PSpace
View
2013.12.07 発表資料

RSpace
View
7 / 15
06. FIRE Interactive Visualization
• X軸がsupport値
• Y軸がconfidence値
• 色の濃さでルールの頻度
を表現
• 領域は各閾値を満たす
ルールセット

2013.12.07 発表資料

8 / 15
06. FIRE Interactive Visualization

各領域でユ
ニークな
ルールの
みを描画

2013.12.07 発表資料

冗長なルー
ルを取り除
いて描画

9 / 15
06. FIRE Interactive Visualization
• トップ100のルールが
欲しいってなったときに
境界を描画
• 例はConfidenceで

2013.12.07 発表資料

10 / 15
06. FIRE Interactive Visualization
領域をクリックしたら、詳細でるよ

2013.12.07 発表資料

11 / 15
06. FIRE Interactive Visualization
二つの領域の比較もお手軽に!(そうか?)

2013.12.07 発表資料

12 / 15
07. Evaluation
• ユーザに使ってもらって評価実験をした
• 以下の手順
• 1.ルールマイニングを説明
• 2.FIREの使い方説明
• 3.30分~50分で分析

• 比較はWEKAのようなCRMっていう既存のソフトで
• 探索の時間で効率性を、良いルールをどれだけ選べるか
で精度を評価する
• データセットはおなじみUCI
• 5種類のタスクをしてる
• 時間がないため、詳細は口頭で

2013.12.07 発表資料

13 / 15
07. Evaluation

ほぼ圧勝!!
2013.12.07 発表資料

14 / 15
08. おまけ
• これが良いかどうかはともかく、ビジュアライジングの
一例として使っていただければ…
• 濃淡と領域表現は参考になった
• ちなみに、CIKM2013には他に、定量的な属性しかない
テーブルから定量ルールを抽出する方法がありました
• ルールマイニングのトレンド
• Interestingness Measureの研究
• ルールセットの評価
• ルール抽出してた人らが、ルール抽出しないでクラス分類をする
方法を提案し出した(Lazy Classification)
• 速度が速くて、精度が高い

• 仕事だとルールマイニングは結構好かれると個人的に思
う(某コンサル会社は決定木を一番使うらしい)

2013.12.07 発表資料

15 / 15

Weitere ähnliche Inhalte

Andere mochten auch

12.10.22_論文紹介_Measuring expected effects of interventions based on decision r...
12.10.22_論文紹介_Measuring expected effects of interventions based on decision r...12.10.22_論文紹介_Measuring expected effects of interventions based on decision r...
12.10.22_論文紹介_Measuring expected effects of interventions based on decision r...LINE Corp.
 
11.05.10_論文紹介_Can Bayesian Confirmation Measures be Useful for Rough Set Deci...
11.05.10_論文紹介_Can Bayesian Confirmation Measures be Useful for Rough Set Deci...11.05.10_論文紹介_Can Bayesian Confirmation Measures be Useful for Rough Set Deci...
11.05.10_論文紹介_Can Bayesian Confirmation Measures be Useful for Rough Set Deci...LINE Corp.
 
11.11.27_2011年度数理システム学生研究奨励賞「佳作賞」_ニュースサイトにおける大学生の嗜好要因の特定とサイト制作への応用_
11.11.27_2011年度数理システム学生研究奨励賞「佳作賞」_ニュースサイトにおける大学生の嗜好要因の特定とサイト制作への応用_11.11.27_2011年度数理システム学生研究奨励賞「佳作賞」_ニュースサイトにおける大学生の嗜好要因の特定とサイト制作への応用_
11.11.27_2011年度数理システム学生研究奨励賞「佳作賞」_ニュースサイトにおける大学生の嗜好要因の特定とサイト制作への応用_LINE Corp.
 
12.10.15_論文紹介_Property of rule interestingness measures and alternative appro...
12.10.15_論文紹介_Property of rule interestingness measures and alternative appro...12.10.15_論文紹介_Property of rule interestingness measures and alternative appro...
12.10.15_論文紹介_Property of rule interestingness measures and alternative appro...LINE Corp.
 
13.12.21_大ヒットの方程式数理モデル解説
13.12.21_大ヒットの方程式数理モデル解説13.12.21_大ヒットの方程式数理モデル解説
13.12.21_大ヒットの方程式数理モデル解説LINE Corp.
 
13.11.15_野村総研マーケティング分析コンテスト2013(佳作賞)_Facebookとtwitterの利用者に対する消費行動分析とそれに基づく広告...
13.11.15_野村総研マーケティング分析コンテスト2013(佳作賞)_Facebookとtwitterの利用者に対する消費行動分析とそれに基づく広告...13.11.15_野村総研マーケティング分析コンテスト2013(佳作賞)_Facebookとtwitterの利用者に対する消費行動分析とそれに基づく広告...
13.11.15_野村総研マーケティング分析コンテスト2013(佳作賞)_Facebookとtwitterの利用者に対する消費行動分析とそれに基づく広告...LINE Corp.
 
Rによる決定木解析の一例
Rによる決定木解析の一例Rによる決定木解析の一例
Rによる決定木解析の一例LINE Corp.
 
12.09.12_FSS2012
12.09.12_FSS201212.09.12_FSS2012
12.09.12_FSS2012LINE Corp.
 
15.05.21_ビッグデータ分析基盤Sparkの最新動向とその活用-Spark SUMMIT EAST 2015-
15.05.21_ビッグデータ分析基盤Sparkの最新動向とその活用-Spark SUMMIT EAST 2015-15.05.21_ビッグデータ分析基盤Sparkの最新動向とその活用-Spark SUMMIT EAST 2015-
15.05.21_ビッグデータ分析基盤Sparkの最新動向とその活用-Spark SUMMIT EAST 2015-LINE Corp.
 
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...LINE Corp.
 

Andere mochten auch (10)

12.10.22_論文紹介_Measuring expected effects of interventions based on decision r...
12.10.22_論文紹介_Measuring expected effects of interventions based on decision r...12.10.22_論文紹介_Measuring expected effects of interventions based on decision r...
12.10.22_論文紹介_Measuring expected effects of interventions based on decision r...
 
11.05.10_論文紹介_Can Bayesian Confirmation Measures be Useful for Rough Set Deci...
11.05.10_論文紹介_Can Bayesian Confirmation Measures be Useful for Rough Set Deci...11.05.10_論文紹介_Can Bayesian Confirmation Measures be Useful for Rough Set Deci...
11.05.10_論文紹介_Can Bayesian Confirmation Measures be Useful for Rough Set Deci...
 
11.11.27_2011年度数理システム学生研究奨励賞「佳作賞」_ニュースサイトにおける大学生の嗜好要因の特定とサイト制作への応用_
11.11.27_2011年度数理システム学生研究奨励賞「佳作賞」_ニュースサイトにおける大学生の嗜好要因の特定とサイト制作への応用_11.11.27_2011年度数理システム学生研究奨励賞「佳作賞」_ニュースサイトにおける大学生の嗜好要因の特定とサイト制作への応用_
11.11.27_2011年度数理システム学生研究奨励賞「佳作賞」_ニュースサイトにおける大学生の嗜好要因の特定とサイト制作への応用_
 
12.10.15_論文紹介_Property of rule interestingness measures and alternative appro...
12.10.15_論文紹介_Property of rule interestingness measures and alternative appro...12.10.15_論文紹介_Property of rule interestingness measures and alternative appro...
12.10.15_論文紹介_Property of rule interestingness measures and alternative appro...
 
13.12.21_大ヒットの方程式数理モデル解説
13.12.21_大ヒットの方程式数理モデル解説13.12.21_大ヒットの方程式数理モデル解説
13.12.21_大ヒットの方程式数理モデル解説
 
13.11.15_野村総研マーケティング分析コンテスト2013(佳作賞)_Facebookとtwitterの利用者に対する消費行動分析とそれに基づく広告...
13.11.15_野村総研マーケティング分析コンテスト2013(佳作賞)_Facebookとtwitterの利用者に対する消費行動分析とそれに基づく広告...13.11.15_野村総研マーケティング分析コンテスト2013(佳作賞)_Facebookとtwitterの利用者に対する消費行動分析とそれに基づく広告...
13.11.15_野村総研マーケティング分析コンテスト2013(佳作賞)_Facebookとtwitterの利用者に対する消費行動分析とそれに基づく広告...
 
Rによる決定木解析の一例
Rによる決定木解析の一例Rによる決定木解析の一例
Rによる決定木解析の一例
 
12.09.12_FSS2012
12.09.12_FSS201212.09.12_FSS2012
12.09.12_FSS2012
 
15.05.21_ビッグデータ分析基盤Sparkの最新動向とその活用-Spark SUMMIT EAST 2015-
15.05.21_ビッグデータ分析基盤Sparkの最新動向とその活用-Spark SUMMIT EAST 2015-15.05.21_ビッグデータ分析基盤Sparkの最新動向とその活用-Spark SUMMIT EAST 2015-
15.05.21_ビッグデータ分析基盤Sparkの最新動向とその活用-Spark SUMMIT EAST 2015-
 
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...
16.02.08_Hadoop Conferece Japan 2016_データサイエンスにおける一次可視化からのSpark on Elasticsear...
 

Ähnlich wie 13.12.07 CIKM2013読み会

企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキルRakuten Group, Inc.
 
定性調査のポイント
定性調査のポイント定性調査のポイント
定性調査のポイントFumito Sato
 
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)Sho Nakamura
 
Study on Visual Analytics Framework for Formulating Evaluation Metrics of Mul...
Study on Visual Analytics Framework for Formulating Evaluation Metrics of Mul...Study on Visual Analytics Framework for Formulating Evaluation Metrics of Mul...
Study on Visual Analytics Framework for Formulating Evaluation Metrics of Mul...Rei Takami
 
The Web Conference 2020 国際会議報告(ACM SIGMOD 日本支部第73回支部大会・依頼講演)
The Web Conference 2020 国際会議報告(ACM SIGMOD 日本支部第73回支部大会・依頼講演)The Web Conference 2020 国際会議報告(ACM SIGMOD 日本支部第73回支部大会・依頼講演)
The Web Conference 2020 国際会議報告(ACM SIGMOD 日本支部第73回支部大会・依頼講演)Kosetsu Tsukuda
 
学習分析学会ミートアップ:マイクロクレデンシャルとラーイングアナリティクス
学習分析学会ミートアップ:マイクロクレデンシャルとラーイングアナリティクス学習分析学会ミートアップ:マイクロクレデンシャルとラーイングアナリティクス
学習分析学会ミートアップ:マイクロクレデンシャルとラーイングアナリティクスKeiko Tanaka
 
「ビジネスモデルYOU」ワークショップ(BMGとBMYで何かやる #6 )公開用
「ビジネスモデルYOU」ワークショップ(BMGとBMYで何かやる #6 )公開用「ビジネスモデルYOU」ワークショップ(BMGとBMYで何かやる #6 )公開用
「ビジネスモデルYOU」ワークショップ(BMGとBMYで何かやる #6 )公開用masashi takehara
 
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史Leading Edge Co.,Ltd.
 
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用Yusuke Uchida
 
UX研究のテーマとアプローチ~ 混合研究法によるUX研究の事例
UX研究のテーマとアプローチ~ 混合研究法によるUX研究の事例UX研究のテーマとアプローチ~ 混合研究法によるUX研究の事例
UX研究のテーマとアプローチ~ 混合研究法によるUX研究の事例 Masaya Ando
 
今年のKDDベストペーパーを実装・公開しました
今年のKDDベストペーパーを実装・公開しました今年のKDDベストペーパーを実装・公開しました
今年のKDDベストペーパーを実装・公開しましたShohei Hido
 
自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵
自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵
自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵Sapporo Sparkle k.k.
 
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点- 『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点- Koichi Hamada
 
京都大学鹿島研究室勉強会資料-配布用-
京都大学鹿島研究室勉強会資料-配布用-京都大学鹿島研究室勉強会資料-配布用-
京都大学鹿島研究室勉強会資料-配布用-Koichiro Kondo
 
HCDの教育をHCDで考えた話
HCDの教育をHCDで考えた話HCDの教育をHCDで考えた話
HCDの教育をHCDで考えた話Jun Iio
 
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Yamato OKAMOTO
 
20150924 Human Interface Symposium 2015 ,How to measure service quality.
20150924 Human Interface Symposium 2015 ,How to measure service quality.20150924 Human Interface Symposium 2015 ,How to measure service quality.
20150924 Human Interface Symposium 2015 ,How to measure service quality.ITOJUN
 
【de:code 2020】 学生諸君! Azure であそぼう! ~Microsoft の AI を自作アプリに取り入れるまで~
【de:code 2020】 学生諸君! Azure であそぼう! ~Microsoft の AI を自作アプリに取り入れるまで~【de:code 2020】 学生諸君! Azure であそぼう! ~Microsoft の AI を自作アプリに取り入れるまで~
【de:code 2020】 学生諸君! Azure であそぼう! ~Microsoft の AI を自作アプリに取り入れるまで~日本マイクロソフト株式会社
 

Ähnlich wie 13.12.07 CIKM2013読み会 (20)

企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル
 
定性調査のポイント
定性調査のポイント定性調査のポイント
定性調査のポイント
 
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
DEIM2019 楽天技術研究所の研究とケーススタディ(推薦システム)
 
Study on Visual Analytics Framework for Formulating Evaluation Metrics of Mul...
Study on Visual Analytics Framework for Formulating Evaluation Metrics of Mul...Study on Visual Analytics Framework for Formulating Evaluation Metrics of Mul...
Study on Visual Analytics Framework for Formulating Evaluation Metrics of Mul...
 
How to use IMDJ
How to use IMDJHow to use IMDJ
How to use IMDJ
 
The Web Conference 2020 国際会議報告(ACM SIGMOD 日本支部第73回支部大会・依頼講演)
The Web Conference 2020 国際会議報告(ACM SIGMOD 日本支部第73回支部大会・依頼講演)The Web Conference 2020 国際会議報告(ACM SIGMOD 日本支部第73回支部大会・依頼講演)
The Web Conference 2020 国際会議報告(ACM SIGMOD 日本支部第73回支部大会・依頼講演)
 
学習分析学会ミートアップ:マイクロクレデンシャルとラーイングアナリティクス
学習分析学会ミートアップ:マイクロクレデンシャルとラーイングアナリティクス学習分析学会ミートアップ:マイクロクレデンシャルとラーイングアナリティクス
学習分析学会ミートアップ:マイクロクレデンシャルとラーイングアナリティクス
 
「ビジネスモデルYOU」ワークショップ(BMGとBMYで何かやる #6 )公開用
「ビジネスモデルYOU」ワークショップ(BMGとBMYで何かやる #6 )公開用「ビジネスモデルYOU」ワークショップ(BMGとBMYで何かやる #6 )公開用
「ビジネスモデルYOU」ワークショップ(BMGとBMYで何かやる #6 )公開用
 
Sexi勉強会0630
Sexi勉強会0630Sexi勉強会0630
Sexi勉強会0630
 
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
 
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
 
UX研究のテーマとアプローチ~ 混合研究法によるUX研究の事例
UX研究のテーマとアプローチ~ 混合研究法によるUX研究の事例UX研究のテーマとアプローチ~ 混合研究法によるUX研究の事例
UX研究のテーマとアプローチ~ 混合研究法によるUX研究の事例
 
今年のKDDベストペーパーを実装・公開しました
今年のKDDベストペーパーを実装・公開しました今年のKDDベストペーパーを実装・公開しました
今年のKDDベストペーパーを実装・公開しました
 
自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵
自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵
自己紹介にかえて-変化する企業ITと“ワクワク感” 桑原里恵
 
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点- 『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
 
京都大学鹿島研究室勉強会資料-配布用-
京都大学鹿島研究室勉強会資料-配布用-京都大学鹿島研究室勉強会資料-配布用-
京都大学鹿島研究室勉強会資料-配布用-
 
HCDの教育をHCDで考えた話
HCDの教育をHCDで考えた話HCDの教育をHCDで考えた話
HCDの教育をHCDで考えた話
 
Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)
 
20150924 Human Interface Symposium 2015 ,How to measure service quality.
20150924 Human Interface Symposium 2015 ,How to measure service quality.20150924 Human Interface Symposium 2015 ,How to measure service quality.
20150924 Human Interface Symposium 2015 ,How to measure service quality.
 
【de:code 2020】 学生諸君! Azure であそぼう! ~Microsoft の AI を自作アプリに取り入れるまで~
【de:code 2020】 学生諸君! Azure であそぼう! ~Microsoft の AI を自作アプリに取り入れるまで~【de:code 2020】 学生諸君! Azure であそぼう! ~Microsoft の AI を自作アプリに取り入れるまで~
【de:code 2020】 学生諸君! Azure であそぼう! ~Microsoft の AI を自作アプリに取り入れるまで~
 

Mehr von LINE Corp.

18.07.11_useR2018 Poster_Time Series Digger : Automatic time series analysis ...
18.07.11_useR2018 Poster_Time Series Digger : Automatic time series analysis ...18.07.11_useR2018 Poster_Time Series Digger : Automatic time series analysis ...
18.07.11_useR2018 Poster_Time Series Digger : Automatic time series analysis ...LINE Corp.
 
18.02.05_IAAI2018_Mobille Network Failure Event Detection and Forecasting wit...
18.02.05_IAAI2018_Mobille Network Failure Event Detection and Forecasting wit...18.02.05_IAAI2018_Mobille Network Failure Event Detection and Forecasting wit...
18.02.05_IAAI2018_Mobille Network Failure Event Detection and Forecasting wit...LINE Corp.
 
17.04.27_JSAI Cup 2017_5th winner's solution
17.04.27_JSAI Cup 2017_5th winner's solution17.04.27_JSAI Cup 2017_5th winner's solution
17.04.27_JSAI Cup 2017_5th winner's solutionLINE Corp.
 
17.11.29_論文紹介_BRACID a comprehensive approach to learning rules from imbalanc...
17.11.29_論文紹介_BRACID a comprehensive approach to learning rules from imbalanc...17.11.29_論文紹介_BRACID a comprehensive approach to learning rules from imbalanc...
17.11.29_論文紹介_BRACID a comprehensive approach to learning rules from imbalanc...LINE Corp.
 
17.04.21_論文紹介_Decision bireducts and decision reducts - a comparison
17.04.21_論文紹介_Decision bireducts and decision reducts - a comparison17.04.21_論文紹介_Decision bireducts and decision reducts - a comparison
17.04.21_論文紹介_Decision bireducts and decision reducts - a comparisonLINE Corp.
 
17.01.18_論文紹介_Discrimination- and privacy-aware patterns
17.01.18_論文紹介_Discrimination- and privacy-aware patterns17.01.18_論文紹介_Discrimination- and privacy-aware patterns
17.01.18_論文紹介_Discrimination- and privacy-aware patternsLINE Corp.
 
13.03.09_決定ルール解析のための頑健性指標
13.03.09_決定ルール解析のための頑健性指標13.03.09_決定ルール解析のための頑健性指標
13.03.09_決定ルール解析のための頑健性指標LINE Corp.
 
Rによるテキストマイニングの一例
Rによるテキストマイニングの一例Rによるテキストマイニングの一例
Rによるテキストマイニングの一例LINE Corp.
 
11.12.06_論文紹介_Classification systems based on rough sets under the belief fun...
11.12.06_論文紹介_Classification systems based on rough sets under the belief fun...11.12.06_論文紹介_Classification systems based on rough sets under the belief fun...
11.12.06_論文紹介_Classification systems based on rough sets under the belief fun...LINE Corp.
 
11.06.10_論文紹介_Rough Set and Bayes Factor
11.06.10_論文紹介_Rough Set and Bayes Factor11.06.10_論文紹介_Rough Set and Bayes Factor
11.06.10_論文紹介_Rough Set and Bayes FactorLINE Corp.
 

Mehr von LINE Corp. (10)

18.07.11_useR2018 Poster_Time Series Digger : Automatic time series analysis ...
18.07.11_useR2018 Poster_Time Series Digger : Automatic time series analysis ...18.07.11_useR2018 Poster_Time Series Digger : Automatic time series analysis ...
18.07.11_useR2018 Poster_Time Series Digger : Automatic time series analysis ...
 
18.02.05_IAAI2018_Mobille Network Failure Event Detection and Forecasting wit...
18.02.05_IAAI2018_Mobille Network Failure Event Detection and Forecasting wit...18.02.05_IAAI2018_Mobille Network Failure Event Detection and Forecasting wit...
18.02.05_IAAI2018_Mobille Network Failure Event Detection and Forecasting wit...
 
17.04.27_JSAI Cup 2017_5th winner's solution
17.04.27_JSAI Cup 2017_5th winner's solution17.04.27_JSAI Cup 2017_5th winner's solution
17.04.27_JSAI Cup 2017_5th winner's solution
 
17.11.29_論文紹介_BRACID a comprehensive approach to learning rules from imbalanc...
17.11.29_論文紹介_BRACID a comprehensive approach to learning rules from imbalanc...17.11.29_論文紹介_BRACID a comprehensive approach to learning rules from imbalanc...
17.11.29_論文紹介_BRACID a comprehensive approach to learning rules from imbalanc...
 
17.04.21_論文紹介_Decision bireducts and decision reducts - a comparison
17.04.21_論文紹介_Decision bireducts and decision reducts - a comparison17.04.21_論文紹介_Decision bireducts and decision reducts - a comparison
17.04.21_論文紹介_Decision bireducts and decision reducts - a comparison
 
17.01.18_論文紹介_Discrimination- and privacy-aware patterns
17.01.18_論文紹介_Discrimination- and privacy-aware patterns17.01.18_論文紹介_Discrimination- and privacy-aware patterns
17.01.18_論文紹介_Discrimination- and privacy-aware patterns
 
13.03.09_決定ルール解析のための頑健性指標
13.03.09_決定ルール解析のための頑健性指標13.03.09_決定ルール解析のための頑健性指標
13.03.09_決定ルール解析のための頑健性指標
 
Rによるテキストマイニングの一例
Rによるテキストマイニングの一例Rによるテキストマイニングの一例
Rによるテキストマイニングの一例
 
11.12.06_論文紹介_Classification systems based on rough sets under the belief fun...
11.12.06_論文紹介_Classification systems based on rough sets under the belief fun...11.12.06_論文紹介_Classification systems based on rough sets under the belief fun...
11.12.06_論文紹介_Classification systems based on rough sets under the belief fun...
 
11.06.10_論文紹介_Rough Set and Bayes Factor
11.06.10_論文紹介_Rough Set and Bayes Factor11.06.10_論文紹介_Rough Set and Bayes Factor
11.06.10_論文紹介_Rough Set and Bayes Factor
 

13.12.07 CIKM2013読み会

  • 1. CIKM2013 論文読み会 FIRE: Interactive Visual Support for Parameter Space-Driven Rule Mining Abhishek Mukherji, Xika Lin, Jason Whitehouse, Christopher R. Botaish, Elke A. Rundensteiner and Matthew O. Ward 2013.12.07(土) 大木基至
  • 2. 01. 自己紹介 ・名前:大木基至(25歳) ・所属:通信会社のデータプラットホームチーム ・マイブーム:人狼、ボドゲ、ジム ・スキル:マイニングが好き ・2年前くらいからマーケティングへのマイニング の応用を勝手にやってます • 2012年度VMStudio & TMStudio学生研究“優秀賞”:アン ケート調査とTwitterの解析に基づく就職活動支援策の提 案 • 2012年度S-PLUS学生研究“佳作賞”:数量化理論第Ⅱ類と アソシエーションルール解析による自動車バナーデザイン の分析(詳細) • 2011年度VMStudio & TMStudio学生研究“佳作賞”:多変 量解析を用いた大学生のためのニュースサイトの構築 ・今年も1件出して、現在1件取り組み中 ・予測モデル系コンペもやってみたいけど、やるこ と多すぎてフリーズ中 2013.12.07 発表資料 シリコンバレー Google 本社にて 1 / 15
  • 3. 02. モチベーション ・大学時代にルールマイニング系の研究をしていた - 1.ルールの可視化システムの開発 - 3次元ネットワーク図で表現するみたいなやつ - 2.ルールの評価指標の研究 - ルールの頑健性を定義し、有用性を検証 ・というわけで、ルールマイニング系を発表します ・でも、今日は時間なかったので、応用系に逃げました ・10時から読んで作ったので、詳細は 知りません(ごめんなさい) 2013.12.07 発表資料 2 / 15
  • 4. 03. 概要 • 効率的にルールを発見すること重要! • 一方、マイニングシステムのユーザビリティが遅れてる • ルール間の関係を対話的に探索したい • その際、ルールマイニングのパラメータも多くて大変 • FIRE(Framework for Interactive Rule Exploration) を提案し、ユーザビリティを向上させる • ルールの分布を表示するビジュアルにこだわる • パラメータ選択やユーザの理解を助ける • 22人でユーザビリティ実験 • 対話的マイニング、知識発見、ビジュアル分析に重要な 貢献を果たせた 2013.12.07 発表資料 3 / 15
  • 5. 04. Introduction • ルールマイニングと言えば、バスケット分析的な(?) • 有名なアルゴリズムと言えば、Agrawalのアプリオリアル ゴリズム • いわゆる支持度に基づく抽出 • 単純だけど、よく使われる • 抽出までのパフォーマンス(質と速さ)は割とやってる • マイニングシステムのためのユーザビリティにもそろそ ろ力いれよう • けど、いろいろユーザビリティ向上には課題が… 2013.12.07 発表資料 4 / 15
  • 6. 04. Introduction 課題 • パラメータチューニング • データに応じて、パラメータ(閾値とか)調整必要 • 閾値の高すぎるパラメータだとルールを絞りすぎて • ルール間の関係可視化 • お互いをカバーしてるルールとかあったりで関係ってのはある • 大量のルールの中でもう少しグルーピングとかしたい • パレート最適 • 一般に1つの評価指標でルールは評価しない • 2つ以上の評価指標を使って最適なルールを見つけましょう …などなど 2013.12.07 発表資料 5 / 15
  • 7. 04. Introduction とりあえずやってること • FIRE • PSpace View:全体的なパラメータスペースビュー • RSpace View:詳細なルールスペースビュー • Supportとconfidenceの値で2次元にマッピングする • A→Bのルールで、 Support = |A ⋂ B|、Confidence = |A ⋂ B |/| A| • ルールを抽出して、各ルールをマッピング • これらのビューで課題を解決する • 最後にユーザ使ってシステム評価もする • うーむ、怪しい 2013.12.07 発表資料 6 / 15
  • 8. 05. Interactive Rule Mining Model • これがFIRE!(うーん、なんだコレ) PSpace View 2013.12.07 発表資料 RSpace View 7 / 15
  • 9. 06. FIRE Interactive Visualization • X軸がsupport値 • Y軸がconfidence値 • 色の濃さでルールの頻度 を表現 • 領域は各閾値を満たす ルールセット 2013.12.07 発表資料 8 / 15
  • 10. 06. FIRE Interactive Visualization 各領域でユ ニークな ルールの みを描画 2013.12.07 発表資料 冗長なルー ルを取り除 いて描画 9 / 15
  • 11. 06. FIRE Interactive Visualization • トップ100のルールが 欲しいってなったときに 境界を描画 • 例はConfidenceで 2013.12.07 発表資料 10 / 15
  • 12. 06. FIRE Interactive Visualization 領域をクリックしたら、詳細でるよ 2013.12.07 発表資料 11 / 15
  • 13. 06. FIRE Interactive Visualization 二つの領域の比較もお手軽に!(そうか?) 2013.12.07 発表資料 12 / 15
  • 14. 07. Evaluation • ユーザに使ってもらって評価実験をした • 以下の手順 • 1.ルールマイニングを説明 • 2.FIREの使い方説明 • 3.30分~50分で分析 • 比較はWEKAのようなCRMっていう既存のソフトで • 探索の時間で効率性を、良いルールをどれだけ選べるか で精度を評価する • データセットはおなじみUCI • 5種類のタスクをしてる • 時間がないため、詳細は口頭で 2013.12.07 発表資料 13 / 15
  • 16. 08. おまけ • これが良いかどうかはともかく、ビジュアライジングの 一例として使っていただければ… • 濃淡と領域表現は参考になった • ちなみに、CIKM2013には他に、定量的な属性しかない テーブルから定量ルールを抽出する方法がありました • ルールマイニングのトレンド • Interestingness Measureの研究 • ルールセットの評価 • ルール抽出してた人らが、ルール抽出しないでクラス分類をする 方法を提案し出した(Lazy Classification) • 速度が速くて、精度が高い • 仕事だとルールマイニングは結構好かれると個人的に思 う(某コンサル会社は決定木を一番使うらしい) 2013.12.07 発表資料 15 / 15