SlideShare ist ein Scribd-Unternehmen logo
1 von 23
Downloaden Sie, um offline zu lesen
代わりにググる 
まっすぃーん作った 
作りたかった 
@haru2036 
#ssmjp 2014/10
おわび
やってみたけど 
あんまうまくいかなかった
残念な感じ
そもそも内容が 
ささみっぽくない 
(参加2回め)
ごめんなさい
@haru2036    
• 自然言語処理とか機械学習興味あるけどできない 
• 数学できません 
• Haskell好き 
• サイボウズ・ラボユース2期コアメンバーひよっこ担当 
• ドール沼 
• 武装神姫沼
嫁
嫁 is (実体化して)ほしい 
• 作りたい 
• ガワは今ある技術でも何とかできそう 
• 人間にできてコンピュータにできないこと is 必要 
• コンピュータにそれできたら嫁できる 
• 神姫はよ
たとえば 
• 質問文からググるためのワードをかんがえるとか 
• かわいいとか 
• しゃべれるとか
てはじめに 
• ぐぐってもらうとかできそう
どうやって 
• 素人なりに考えました 
• なんか文の構造に依存しそう
少し具体的に 
• 教師あり機械学習のようなもの 
• 品詞に変換したあとのtrigramを素性にする 
• [(“名詞”, “助詞”, “動詞”), (“助詞”, “動詞”, “助 
詞”)…] 
• ラベルを文の中での単語の順番にする 
• 分類器に入れてみる
実装 
• 分類器: ナイーブベイズ(手前味噌のNagato) 
• モデル: Bag-of-Trigrams(品詞)(?) 
• 形態素解析器: MeCab 
• Nagato&今回のコレ: Haskell製
コーパス 
• あんまり質問文にフォーカスしたコーパスがあるか 
わからない 
• ぐぐったけど見つからなかった 
• 諦めて適当に手ででっち上げた質問文を使う 
• はてなの質問からも引っ張ってきて手でラベルふる
結果以前の問題 
• どんなものが出力されればいいのかわからない 
• 正解がない? 
• 人によって違いそう
結果 
• ダメでした 
• 単純な質問文でも精度が低い 
• 上:質問文, 下:検索用クエリ
原因? 
• 学習する元の量が少ない 
• そもそも手法がダメ 
• 文中での単語の位置のズレが補正できてない
位置ずれ補正 
• 文の構造が微妙に違うと文中の単語位置では違いが 
• 一番近い同じ品詞の部分を抜き出すように修正 
• あんまり意味なかった
選択肢 
• ダメっぽい手法を投げ捨てて別の手法を考える 
• 学習させる量を増やす
結論 
• むずかしい 
• 他の先行研究的なの調べる必要 is ある 
• これtrigramにしないで全文でやったほうが…… 
• 素人考えはやっぱりあてにならない 
• つぎはもっと調べます 
• そもそもGoogleなら質問文から検索できるやん
ご清聴 
ありがとうございました
リポジトリ 
• githubにあります 
• nagato: haru2036/nagato 
• 今回のアレ: haru2036/nl-query

Weitere ähnliche Inhalte

Was ist angesagt?

レッツゴー難読化シェル芸
レッツゴー難読化シェル芸レッツゴー難読化シェル芸
レッツゴー難読化シェル芸xztaityozx
 
放送大学テキスト「自然言語処理」 6章 意味の解析(1)
放送大学テキスト「自然言語処理」 6章 意味の解析(1)放送大学テキスト「自然言語処理」 6章 意味の解析(1)
放送大学テキスト「自然言語処理」 6章 意味の解析(1)Retrieva inc.
 
夢のある話をしようと思ったけど、やっぱり現実の話をする
夢のある話をしようと思ったけど、やっぱり現実の話をする夢のある話をしようと思ったけど、やっぱり現実の話をする
夢のある話をしようと思ったけど、やっぱり現実の話をするHidetsugu Takahashi
 
20190527 #techpub #7_beajouneyman
20190527 #techpub #7_beajouneyman20190527 #techpub #7_beajouneyman
20190527 #techpub #7_beajouneymanJourneyman
 
国立国会図書館出向報告―カレントアウェアネス-Eの編集経験を中心に
国立国会図書館出向報告―カレントアウェアネス-Eの編集経験を中心に国立国会図書館出向報告―カレントアウェアネス-Eの編集経験を中心に
国立国会図書館出向報告―カレントアウェアネス-Eの編集経験を中心にYutaka HAYASHI
 
コミケに行こう!
コミケに行こう!コミケに行こう!
コミケに行こう!masaki yamada
 
プログラミング同好会とすごい合同勉強会
プログラミング同好会とすごい合同勉強会プログラミング同好会とすごい合同勉強会
プログラミング同好会とすごい合同勉強会nemumu
 
20170527開発合宿感想
20170527開発合宿感想20170527開発合宿感想
20170527開発合宿感想Tomohide Murata
 
SNS 「github」で遊ぼう
SNS 「github」で遊ぼうSNS 「github」で遊ぼう
SNS 「github」で遊ぼうTomohiko Himura
 
May python prevail everyone
May python prevail everyoneMay python prevail everyone
May python prevail everyoneDaiki Kojima
 
Tbmu 20141112 oregadget
Tbmu 20141112 oregadgetTbmu 20141112 oregadget
Tbmu 20141112 oregadgetTerumasa Okabe
 
We are カジュアルPerler by yusukebe
We are  カジュアルPerler by yusukebeWe are  カジュアルPerler by yusukebe
We are カジュアルPerler by yusukebeYusuke Wada
 
自宅環境:無償アプライアンスの活用 2017610a
自宅環境:無償アプライアンスの活用 2017610a自宅環境:無償アプライアンスの活用 2017610a
自宅環境:無償アプライアンスの活用 2017610aYuichi Tominaga
 

Was ist angesagt? (14)

レッツゴー難読化シェル芸
レッツゴー難読化シェル芸レッツゴー難読化シェル芸
レッツゴー難読化シェル芸
 
放送大学テキスト「自然言語処理」 6章 意味の解析(1)
放送大学テキスト「自然言語処理」 6章 意味の解析(1)放送大学テキスト「自然言語処理」 6章 意味の解析(1)
放送大学テキスト「自然言語処理」 6章 意味の解析(1)
 
夢のある話をしようと思ったけど、やっぱり現実の話をする
夢のある話をしようと思ったけど、やっぱり現実の話をする夢のある話をしようと思ったけど、やっぱり現実の話をする
夢のある話をしようと思ったけど、やっぱり現実の話をする
 
20190527 #techpub #7_beajouneyman
20190527 #techpub #7_beajouneyman20190527 #techpub #7_beajouneyman
20190527 #techpub #7_beajouneyman
 
国立国会図書館出向報告―カレントアウェアネス-Eの編集経験を中心に
国立国会図書館出向報告―カレントアウェアネス-Eの編集経験を中心に国立国会図書館出向報告―カレントアウェアネス-Eの編集経験を中心に
国立国会図書館出向報告―カレントアウェアネス-Eの編集経験を中心に
 
コミケに行こう!
コミケに行こう!コミケに行こう!
コミケに行こう!
 
プログラミング同好会とすごい合同勉強会
プログラミング同好会とすごい合同勉強会プログラミング同好会とすごい合同勉強会
プログラミング同好会とすごい合同勉強会
 
20170527開発合宿感想
20170527開発合宿感想20170527開発合宿感想
20170527開発合宿感想
 
SNS 「github」で遊ぼう
SNS 「github」で遊ぼうSNS 「github」で遊ぼう
SNS 「github」で遊ぼう
 
Tobetobe lt
Tobetobe ltTobetobe lt
Tobetobe lt
 
May python prevail everyone
May python prevail everyoneMay python prevail everyone
May python prevail everyone
 
Tbmu 20141112 oregadget
Tbmu 20141112 oregadgetTbmu 20141112 oregadget
Tbmu 20141112 oregadget
 
We are カジュアルPerler by yusukebe
We are  カジュアルPerler by yusukebeWe are  カジュアルPerler by yusukebe
We are カジュアルPerler by yusukebe
 
自宅環境:無償アプライアンスの活用 2017610a
自宅環境:無償アプライアンスの活用 2017610a自宅環境:無償アプライアンスの活用 2017610a
自宅環境:無償アプライアンスの活用 2017610a
 

Andere mochten auch (17)

ChuDe3_Nhom16
ChuDe3_Nhom16ChuDe3_Nhom16
ChuDe3_Nhom16
 
Curse Voice with Voice Changer for Funny Curse Gaming
Curse Voice with Voice Changer for Funny Curse GamingCurse Voice with Voice Changer for Funny Curse Gaming
Curse Voice with Voice Changer for Funny Curse Gaming
 
General docs 1
General docs 1General docs 1
General docs 1
 
Ijetr021244
Ijetr021244Ijetr021244
Ijetr021244
 
Ijetr021220
Ijetr021220Ijetr021220
Ijetr021220
 
Rational drug design
Rational drug designRational drug design
Rational drug design
 
RSA
RSARSA
RSA
 
Orientasi Pendidikan Kepramukaan dalam Pembinaan Kepribadian (Bab IV : Penyaj...
Orientasi Pendidikan Kepramukaan dalam Pembinaan Kepribadian (Bab IV : Penyaj...Orientasi Pendidikan Kepramukaan dalam Pembinaan Kepribadian (Bab IV : Penyaj...
Orientasi Pendidikan Kepramukaan dalam Pembinaan Kepribadian (Bab IV : Penyaj...
 
звіт директора
звіт директоразвіт директора
звіт директора
 
060313
060313060313
060313
 
Talk Like Medusa in Dota 2
Talk Like Medusa in Dota 2Talk Like Medusa in Dota 2
Talk Like Medusa in Dota 2
 
SPSS
SPSSSPSS
SPSS
 
Majbritt Lock in The Fantastiks
Majbritt Lock in The FantastiksMajbritt Lock in The Fantastiks
Majbritt Lock in The Fantastiks
 
Avaliação monitor de informática
Avaliação   monitor de informáticaAvaliação   monitor de informática
Avaliação monitor de informática
 
Sílabo de la asignatura de evaluación
Sílabo de la asignatura de evaluaciónSílabo de la asignatura de evaluación
Sílabo de la asignatura de evaluación
 
Ijetr021139
Ijetr021139Ijetr021139
Ijetr021139
 
Digiwomen - the art of in mails
Digiwomen - the art of in mailsDigiwomen - the art of in mails
Digiwomen - the art of in mails
 

ggrmcne