Weitere ähnliche Inhalte
Ähnlich wie Twitterにおける即時話題推定技術「どたばたかいぎ」の開発 (20)
Mehr von Eric Sartre (11)
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
- 2. 0.説明手順
1. 研究背景 6. 実装
2. 研究目的 7. ここまでの結果
3. 研究概要 8. ここまでの考察
4. 研究計画 9. 今後の展望
5. 理論
- 8. 4.研究計画
大きく分けて7つの研究項目がある
・各企業にデータ提供の交渉
・表記ゆれ/関連概念データベースの用意
・特徴語抽出 ・精度向上
・データベース ・システム補助
・アルゴリズム ・future work
・出力方法
- 23. 6.実装
現時点でできていること
1. MeCabコーパスの強化
2. 表記ゆれの吸収
カテゴリ情報を利用したらどれだけの
正確さになるかの実証をまだ
行なっていない。
- 30. 8.ここまでの考察
S memcachedを用いることで高速に単語の変換
が可能になった。
S インターネットスラングにも柔軟に対応。
S なぜか「人」から「GReeeeN」にリダイレクト
されたりする。データ処理のミス?
S 一部解析に失敗することがある。形態素解析辞
書に学習させる内容をもう少し選ぶ必要がある
S 新出単語を特徴語として検出できない。
- 31. 9.今後の展望
S 表記ゆれ・関連概念データベースの用意
S データベースの速度改善
S 関連概念の比較による同一話題推定アルゴリズムの研究
S レート計算による話題推定アルゴリズムの改良
S 発言内ハイパーリンクを考慮した推定アルゴリズムの研究
S ソーシャルグラフを考慮した推定アルゴリズムの研究