OtaQ
- 1. OtaQ
OtaQ
早押し4択クイズの自動生成
jewel_x12 @ Niigata.pm tech talk #1
- 10. ウィキペディア記事から
自動生成する
• 「Qろいど」(学びing)
「けんてーごっこ」のデータをもとに、
穴埋め問題を自動生成
http://manabing.jp/service/qroid.html
今回は、書かれている内容をヒント文から
推測する形式の問題
- 15. OtaQ では
1. 名詞のスコア付け
• TF-IDF
2. 文の特徴度を(1)のスコアを用いて計算
• 合計するだけ
3. 文の特徴度が高い順に選択する
• 単語数の制限等はない
• 1番目は必ず含める
- 16. OtaQ では
1. 名詞のスコア付け
• TF-IDF
2. 文の特徴度を(1)のスコアを用いて計算
• 合計するだけ
3. 文の特徴度が高い順に選択する
• 単語数の制限等はない
• 1番目は必ず含める
らくちん♪
- 17. 4択の生成
手法の候補
1. 似た記事タイトルを集める
2. 文書クラスタリング
3. カテゴリ情報を利用
• 所属しているカテゴリのうち、1番小さい
ものからランダムにタイトルを抽出
• 一番それっぽい結果になる
• 人手最高!!!!!!!!!
- 21. Perl の感想
• bless を使ったオブジェクト指向プログラ
ミングは面白かった
• リファレンスの存在を知らないで進めてた
ら、よくわからないことになった
• Test::More でのテストもわかり易かった
• 中途半端な知識で進めると辛いときがある
- 22. ゲーム部
• Sinatra
• MongoDB
• nginx + unicorn
• 使ったことなかったので使った
・ クライアント側
• ランダム10問を JSON で受け取る
• 答えも受け取るのでチート可能
- 23. 生成されたクイズ
• 24,000 問くらいある
• カテゴリ名に「アニメ・ゲーム・同人・声優」等を含む
ものに絞っている
• お母さんの前では遊べない内容もある
• 無関係やアレゲなカテゴリは除去している
• 特徴のある文をそのまま出力しても問題と
して成立しにくい
• 「A は B の一種」のような関係を抽出すると良いか
も?