SlideShare ist ein Scribd-Unternehmen logo
1 von 12
Downloaden Sie, um offline zu lesen
By jot.punkt under CC-BY http://www.flickr.com/photos/janramroth/1287533046/



個人に最適化したフィードリーダの構築
 大阪府立大学工業高等専門学校 5年電子情報コース
 花川研究室 / 清原弘貴
日付:2011/ 10/ 21
目次

 1.はじめに
 2.システムの概要
 3.動作原理
 4.これまでの成果
 5.今後の課題

             Speaker:清原 弘貴
1. 1 はじめに : 背景
フィードリーダとは
ニュースフィードを登録するだけで
自動でWebサイトの新着記事を取得できる

(Google Readerなど)
  


欠点
 取得した記事をすべて表示するので
 登録数が多いと読み切れない
  
                       未読記事の多いニュースリーダ

                               Speaker:清原 弘貴
1. 2 はじめに : 目的

目的:利用者が興味をもつであろう記事のみを表示する
   フィードリーダを構築


       ニュースフィードの登録

                         開発したい
                        フィードリーダ

 利用者   最適化されたニュースフィード


                         Speaker:清原 弘貴
2. システムの概要

 分類のために利用者の興味を調べる必要がある
  -> ソーシャルブックマークをもとに学習する


ソーシャ   好まれる記事         好まれる特徴
ルブック
マーク
                                学習

                 特徴
       好まれる記事
                 抽出   好まれる特徴         好まれる記事

新着
                                分類
記事
       好まれない記事        好まれない特徴

                                              Speaker:清原 弘貴
3.1 動作原理 : 特徴抽出
✤   文中の単語を特徴とする
      (名詞,動詞,形容詞,形容動詞,副詞,連体詞)


✤   Yahoo!形態素解析を用いた
       1つの記事あたり5つの特徴語を抽出した

               特徴抽出したい文

      クライアント     必要な品詞       Yahoo!形態素
                                 解析
                  特徴となる単語

                                    Speaker:清原 弘貴
3.1 動作原理 : 分類
✤   新着記事の分類

 -> 推奨すべき記事 or 推奨すべきでない記事



✤   スパムフィルタの原理を参考に,実際にメーラなどに
    使われているモジュールを使用
✤   フィッシャー法というアルゴリズムで実装されている
✤   http://examples.oreilly.com/9780596529321/



                                                 Speaker:清原 弘貴
4. これまでの成果

実装できたもの
 ✤   動作の主要部分
      新着記事取得 → 記事の分類


 ✤   開発者用の画面

 ✤   ユーザ登録

                       開発者用の画面から見た新着記事


                                  Speaker:清原 弘貴
4. これまでの成果

実装できたもの
 ✤   動作の主要部分
      新着記事取得 → 記事の分類


 ✤   開発者用の画面

 ✤   ユーザ登録


推奨される記事かどうかを
表す値の変動が確認できた
                       Speaker:清原 弘貴
4. これまでの成果(2)



利用者の興味が抽出
できているのが確認できた




                Speaker:清原 弘貴
今後の課題
 ✤   ユーザ向け画面の作成
 ✤   分類の精度向上
     ・特徴語の品詞によって重み付けする
     ・他のアルゴリズムを使う
      (分類機の候補にPA法,ベイジアンフィルタなど)



 ✤   動作原理の理解
      ・フィッシャー法や形態素解析の理解



                                 Speaker:清原 弘貴
おわりに




 ご清聴ありがとうございました



              Speaker:清原 弘貴

Weitere ähnliche Inhalte

Ähnlich wie 卒研中間発表資料:個人に最適化したフィードリーダの構築

Hadoop conference Japan 2011
Hadoop conference Japan 2011Hadoop conference Japan 2011
Hadoop conference Japan 2011Takahiko Ito
 
Out systemsaichiusermeeting#5 lt2
Out systemsaichiusermeeting#5 lt2Out systemsaichiusermeeting#5 lt2
Out systemsaichiusermeeting#5 lt2潤司 渡部
 
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #SeleniumjpSeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #SeleniumjpYahoo!デベロッパーネットワーク
 
Generating word clouds in python
Generating word clouds in pythonGenerating word clouds in python
Generating word clouds in pythonAyakaHonda1
 
学会講演要旨検索システムにおける タグクラウドによる 重要キーワードの可視化
学会講演要旨検索システムにおけるタグクラウドによる重要キーワードの可視化学会講演要旨検索システムにおけるタグクラウドによる重要キーワードの可視化
学会講演要旨検索システムにおける タグクラウドによる 重要キーワードの可視化Katsutoshi Seki
 
自動テスト知識体系TABOKのご紹介
自動テスト知識体系TABOKのご紹介自動テスト知識体系TABOKのご紹介
自動テスト知識体系TABOKのご紹介Shinsuke Matsuki
 
俺も受託開発〜準委任契約によるふつうのソフトウェア開発〜
俺も受託開発〜準委任契約によるふつうのソフトウェア開発〜俺も受託開発〜準委任契約によるふつうのソフトウェア開発〜
俺も受託開発〜準委任契約によるふつうのソフトウェア開発〜Koichi ITO
 
ThemeStudy ― CHI2017-2018分析 + CHI2018速報
ThemeStudy ― CHI2017-2018分析 + CHI2018速報ThemeStudy ― CHI2017-2018分析 + CHI2018速報
ThemeStudy ― CHI2017-2018分析 + CHI2018速報cvpaper. challenge
 
ユーザーストーリーワークショップ
ユーザーストーリーワークショップユーザーストーリーワークショップ
ユーザーストーリーワークショップYou&I
 
遅いクエリと向き合う仕組み #CybozuMeetup
遅いクエリと向き合う仕組み #CybozuMeetup遅いクエリと向き合う仕組み #CybozuMeetup
遅いクエリと向き合う仕組み #CybozuMeetupS Akai
 
20140523 jQuery基礎 (HTML5ビギナーズ)
20140523 jQuery基礎 (HTML5ビギナーズ)20140523 jQuery基礎 (HTML5ビギナーズ)
20140523 jQuery基礎 (HTML5ビギナーズ)Daisuke Yamazaki
 
プログラマが欲しい仕様書とは
プログラマが欲しい仕様書とはプログラマが欲しい仕様書とは
プログラマが欲しい仕様書とはKatsutoshi Makino
 
提案に役に立つ情報 (teianlab 勉強会)
提案に役に立つ情報 (teianlab 勉強会)提案に役に立つ情報 (teianlab 勉強会)
提案に役に立つ情報 (teianlab 勉強会)MKT International Inc.
 
Ocs2012 tokyo/spring plone
Ocs2012 tokyo/spring plone Ocs2012 tokyo/spring plone
Ocs2012 tokyo/spring plone Manabu Terada
 
self made Fulltext search first_step
self made Fulltext search first_stepself made Fulltext search first_step
self made Fulltext search first_stepRyou Katou
 
翻訳支援ツールの紹介
翻訳支援ツールの紹介翻訳支援ツールの紹介
翻訳支援ツールの紹介Self Employed
 
Mizuno buddypress-plugin
Mizuno buddypress-pluginMizuno buddypress-plugin
Mizuno buddypress-pluginIkuko Kanada
 
Mizuno buddypress-plugin
Mizuno buddypress-pluginMizuno buddypress-plugin
Mizuno buddypress-pluginFumito Mizuno
 
eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」
eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」
eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」ericsagnes
 

Ähnlich wie 卒研中間発表資料:個人に最適化したフィードリーダの構築 (20)

Hadoop conference Japan 2011
Hadoop conference Japan 2011Hadoop conference Japan 2011
Hadoop conference Japan 2011
 
Out systemsaichiusermeeting#5 lt2
Out systemsaichiusermeeting#5 lt2Out systemsaichiusermeeting#5 lt2
Out systemsaichiusermeeting#5 lt2
 
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #SeleniumjpSeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
SeleniumE2Eテストフレームワークを使用したテスト自動化事例 #Seleniumjp
 
Generating word clouds in python
Generating word clouds in pythonGenerating word clouds in python
Generating word clouds in python
 
学会講演要旨検索システムにおける タグクラウドによる 重要キーワードの可視化
学会講演要旨検索システムにおけるタグクラウドによる重要キーワードの可視化学会講演要旨検索システムにおけるタグクラウドによる重要キーワードの可視化
学会講演要旨検索システムにおける タグクラウドによる 重要キーワードの可視化
 
自動テスト知識体系TABOKのご紹介
自動テスト知識体系TABOKのご紹介自動テスト知識体系TABOKのご紹介
自動テスト知識体系TABOKのご紹介
 
俺も受託開発〜準委任契約によるふつうのソフトウェア開発〜
俺も受託開発〜準委任契約によるふつうのソフトウェア開発〜俺も受託開発〜準委任契約によるふつうのソフトウェア開発〜
俺も受託開発〜準委任契約によるふつうのソフトウェア開発〜
 
Twitter4Jとテスト
Twitter4JとテストTwitter4Jとテスト
Twitter4Jとテスト
 
ThemeStudy ― CHI2017-2018分析 + CHI2018速報
ThemeStudy ― CHI2017-2018分析 + CHI2018速報ThemeStudy ― CHI2017-2018分析 + CHI2018速報
ThemeStudy ― CHI2017-2018分析 + CHI2018速報
 
ユーザーストーリーワークショップ
ユーザーストーリーワークショップユーザーストーリーワークショップ
ユーザーストーリーワークショップ
 
遅いクエリと向き合う仕組み #CybozuMeetup
遅いクエリと向き合う仕組み #CybozuMeetup遅いクエリと向き合う仕組み #CybozuMeetup
遅いクエリと向き合う仕組み #CybozuMeetup
 
20140523 jQuery基礎 (HTML5ビギナーズ)
20140523 jQuery基礎 (HTML5ビギナーズ)20140523 jQuery基礎 (HTML5ビギナーズ)
20140523 jQuery基礎 (HTML5ビギナーズ)
 
プログラマが欲しい仕様書とは
プログラマが欲しい仕様書とはプログラマが欲しい仕様書とは
プログラマが欲しい仕様書とは
 
提案に役に立つ情報 (teianlab 勉強会)
提案に役に立つ情報 (teianlab 勉強会)提案に役に立つ情報 (teianlab 勉強会)
提案に役に立つ情報 (teianlab 勉強会)
 
Ocs2012 tokyo/spring plone
Ocs2012 tokyo/spring plone Ocs2012 tokyo/spring plone
Ocs2012 tokyo/spring plone
 
self made Fulltext search first_step
self made Fulltext search first_stepself made Fulltext search first_step
self made Fulltext search first_step
 
翻訳支援ツールの紹介
翻訳支援ツールの紹介翻訳支援ツールの紹介
翻訳支援ツールの紹介
 
Mizuno buddypress-plugin
Mizuno buddypress-pluginMizuno buddypress-plugin
Mizuno buddypress-plugin
 
Mizuno buddypress-plugin
Mizuno buddypress-pluginMizuno buddypress-plugin
Mizuno buddypress-plugin
 
eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」
eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」
eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」
 

Mehr von hirokiky

簡単な算数でできる文章校正
簡単な算数でできる文章校正簡単な算数でできる文章校正
簡単な算数でできる文章校正hirokiky
 
エンジニアが起業のアイディアを見つける方法
エンジニアが起業のアイディアを見つける方法エンジニアが起業のアイディアを見つける方法
エンジニアが起業のアイディアを見つける方法hirokiky
 
それ、公開しちゃおうよ - みんなのPython勉強会63登壇
それ、公開しちゃおうよ - みんなのPython勉強会63登壇それ、公開しちゃおうよ - みんなのPython勉強会63登壇
それ、公開しちゃおうよ - みんなのPython勉強会63登壇hirokiky
 
プロダクト開発してわかったDjangoの深〜いパーミッション管理の話 @ PyconJP2017
プロダクト開発してわかったDjangoの深〜いパーミッション管理の話 @ PyconJP2017プロダクト開発してわかったDjangoの深〜いパーミッション管理の話 @ PyconJP2017
プロダクト開発してわかったDjangoの深〜いパーミッション管理の話 @ PyconJP2017hirokiky
 
営業も広報もいない僕たちが11年間やってきたこと
営業も広報もいない僕たちが11年間やってきたこと営業も広報もいない僕たちが11年間やってきたこと
営業も広報もいない僕たちが11年間やってきたことhirokiky
 
LLoT ランゲージアップデート Python
LLoT ランゲージアップデート PythonLLoT ランゲージアップデート Python
LLoT ランゲージアップデート Pythonhirokiky
 
How we realized SOA by Python at PyCon JP 2015
How we realized SOA by Python at PyCon JP 2015How we realized SOA by Python at PyCon JP 2015
How we realized SOA by Python at PyCon JP 2015hirokiky
 
価値を届ける技術 #bpstudy 96
価値を届ける技術 #bpstudy 96価値を届ける技術 #bpstudy 96
価値を届ける技術 #bpstudy 96hirokiky
 
Pycon2014 django performance
Pycon2014 django performancePycon2014 django performance
Pycon2014 django performancehirokiky
 
gargant.dispatch, a flexible dispatcher for WSGI
gargant.dispatch, a flexible dispatcher for WSGIgargant.dispatch, a flexible dispatcher for WSGI
gargant.dispatch, a flexible dispatcher for WSGIhirokiky
 
Django最速デバッグ指南 PyConAPAC 2013
Django最速デバッグ指南 PyConAPAC 2013Django最速デバッグ指南 PyConAPAC 2013
Django最速デバッグ指南 PyConAPAC 2013hirokiky
 
軽量のススメ
軽量のススメ軽量のススメ
軽量のススメhirokiky
 
django-websettingsの紹介
django-websettingsの紹介django-websettingsの紹介
django-websettingsの紹介hirokiky
 
pyramid_layoutと僕と、ときどきzope.interface
pyramid_layoutと僕と、ときどきzope.interfacepyramid_layoutと僕と、ときどきzope.interface
pyramid_layoutと僕と、ときどきzope.interfacehirokiky
 
My pyhack 1301
My pyhack 1301My pyhack 1301
My pyhack 1301hirokiky
 
Useful Django 1.4
Useful Django 1.4Useful Django 1.4
Useful Django 1.4hirokiky
 
使えるDjango1.4
使えるDjango1.4使えるDjango1.4
使えるDjango1.4hirokiky
 

Mehr von hirokiky (17)

簡単な算数でできる文章校正
簡単な算数でできる文章校正簡単な算数でできる文章校正
簡単な算数でできる文章校正
 
エンジニアが起業のアイディアを見つける方法
エンジニアが起業のアイディアを見つける方法エンジニアが起業のアイディアを見つける方法
エンジニアが起業のアイディアを見つける方法
 
それ、公開しちゃおうよ - みんなのPython勉強会63登壇
それ、公開しちゃおうよ - みんなのPython勉強会63登壇それ、公開しちゃおうよ - みんなのPython勉強会63登壇
それ、公開しちゃおうよ - みんなのPython勉強会63登壇
 
プロダクト開発してわかったDjangoの深〜いパーミッション管理の話 @ PyconJP2017
プロダクト開発してわかったDjangoの深〜いパーミッション管理の話 @ PyconJP2017プロダクト開発してわかったDjangoの深〜いパーミッション管理の話 @ PyconJP2017
プロダクト開発してわかったDjangoの深〜いパーミッション管理の話 @ PyconJP2017
 
営業も広報もいない僕たちが11年間やってきたこと
営業も広報もいない僕たちが11年間やってきたこと営業も広報もいない僕たちが11年間やってきたこと
営業も広報もいない僕たちが11年間やってきたこと
 
LLoT ランゲージアップデート Python
LLoT ランゲージアップデート PythonLLoT ランゲージアップデート Python
LLoT ランゲージアップデート Python
 
How we realized SOA by Python at PyCon JP 2015
How we realized SOA by Python at PyCon JP 2015How we realized SOA by Python at PyCon JP 2015
How we realized SOA by Python at PyCon JP 2015
 
価値を届ける技術 #bpstudy 96
価値を届ける技術 #bpstudy 96価値を届ける技術 #bpstudy 96
価値を届ける技術 #bpstudy 96
 
Pycon2014 django performance
Pycon2014 django performancePycon2014 django performance
Pycon2014 django performance
 
gargant.dispatch, a flexible dispatcher for WSGI
gargant.dispatch, a flexible dispatcher for WSGIgargant.dispatch, a flexible dispatcher for WSGI
gargant.dispatch, a flexible dispatcher for WSGI
 
Django最速デバッグ指南 PyConAPAC 2013
Django最速デバッグ指南 PyConAPAC 2013Django最速デバッグ指南 PyConAPAC 2013
Django最速デバッグ指南 PyConAPAC 2013
 
軽量のススメ
軽量のススメ軽量のススメ
軽量のススメ
 
django-websettingsの紹介
django-websettingsの紹介django-websettingsの紹介
django-websettingsの紹介
 
pyramid_layoutと僕と、ときどきzope.interface
pyramid_layoutと僕と、ときどきzope.interfacepyramid_layoutと僕と、ときどきzope.interface
pyramid_layoutと僕と、ときどきzope.interface
 
My pyhack 1301
My pyhack 1301My pyhack 1301
My pyhack 1301
 
Useful Django 1.4
Useful Django 1.4Useful Django 1.4
Useful Django 1.4
 
使えるDjango1.4
使えるDjango1.4使えるDjango1.4
使えるDjango1.4
 

卒研中間発表資料:個人に最適化したフィードリーダの構築

  • 1. By jot.punkt under CC-BY http://www.flickr.com/photos/janramroth/1287533046/ 個人に最適化したフィードリーダの構築 大阪府立大学工業高等専門学校 5年電子情報コース 花川研究室 / 清原弘貴 日付:2011/ 10/ 21
  • 2. 目次 1.はじめに 2.システムの概要 3.動作原理 4.これまでの成果 5.今後の課題 Speaker:清原 弘貴
  • 3. 1. 1 はじめに : 背景 フィードリーダとは ニュースフィードを登録するだけで 自動でWebサイトの新着記事を取得できる (Google Readerなど)    欠点  取得した記事をすべて表示するので 登録数が多いと読み切れない    未読記事の多いニュースリーダ Speaker:清原 弘貴
  • 4. 1. 2 はじめに : 目的 目的:利用者が興味をもつであろう記事のみを表示する    フィードリーダを構築 ニュースフィードの登録 開発したい フィードリーダ 利用者 最適化されたニュースフィード Speaker:清原 弘貴
  • 5. 2. システムの概要 分類のために利用者の興味を調べる必要がある  -> ソーシャルブックマークをもとに学習する ソーシャ 好まれる記事 好まれる特徴 ルブック マーク 学習 特徴 好まれる記事 抽出 好まれる特徴 好まれる記事 新着 分類 記事 好まれない記事 好まれない特徴 Speaker:清原 弘貴
  • 6. 3.1 動作原理 : 特徴抽出 ✤ 文中の単語を特徴とする (名詞,動詞,形容詞,形容動詞,副詞,連体詞) ✤ Yahoo!形態素解析を用いた 1つの記事あたり5つの特徴語を抽出した 特徴抽出したい文 クライアント 必要な品詞 Yahoo!形態素 解析 特徴となる単語 Speaker:清原 弘貴
  • 7. 3.1 動作原理 : 分類 ✤ 新着記事の分類  -> 推奨すべき記事 or 推奨すべきでない記事 ✤ スパムフィルタの原理を参考に,実際にメーラなどに 使われているモジュールを使用 ✤ フィッシャー法というアルゴリズムで実装されている ✤ http://examples.oreilly.com/9780596529321/ Speaker:清原 弘貴
  • 8. 4. これまでの成果 実装できたもの ✤ 動作の主要部分 新着記事取得 → 記事の分類 ✤ 開発者用の画面 ✤ ユーザ登録 開発者用の画面から見た新着記事 Speaker:清原 弘貴
  • 9. 4. これまでの成果 実装できたもの ✤ 動作の主要部分 新着記事取得 → 記事の分類 ✤ 開発者用の画面 ✤ ユーザ登録 推奨される記事かどうかを 表す値の変動が確認できた Speaker:清原 弘貴
  • 11. 今後の課題 ✤ ユーザ向け画面の作成 ✤ 分類の精度向上 ・特徴語の品詞によって重み付けする ・他のアルゴリズムを使う  (分類機の候補にPA法,ベイジアンフィルタなど) ✤ 動作原理の理解 ・フィッシャー法や形態素解析の理解 Speaker:清原 弘貴