Suche senden
Hochladen
ATL オープンラボ NLP 2015
•
6 gefällt mir
•
8,842 views
Recruit Technologies
Folgen
Slides used in ATL Open Lab 2015 April
Weniger lesen
Mehr lesen
Software
Melden
Teilen
Melden
Teilen
1 von 63
Empfohlen
RedPen Status 2014/07
RedPen Status 2014/07
Recruit Technologies
RedPen texconf15
RedPen texconf15
Recruit Technologies
JJUG 2015 Summer
JJUG 2015 Summer
Recruit Technologies
Alteryx UG3 LT #alteryx_ug
Alteryx UG3 LT #alteryx_ug
__john_smith__
FluentdやNorikraを使った データ集約基盤への取り組み紹介
FluentdやNorikraを使った データ集約基盤への取り組み紹介
Recruit Technologies
Watson活用事例~Watsonハッカソンの例を通じて~
Watson活用事例~Watsonハッカソンの例を通じて~
Hiroki Nakayama
ディープラーニングでおそ松さんの6つ子は見分けられるのか? FIT2016
ディープラーニングでおそ松さんの6つ子は見分けられるのか? FIT2016
Yota Ishida
リクルートにおける画像解析事例紹介
リクルートにおける画像解析事例紹介
Recruit Technologies
Empfohlen
RedPen Status 2014/07
RedPen Status 2014/07
Recruit Technologies
RedPen texconf15
RedPen texconf15
Recruit Technologies
JJUG 2015 Summer
JJUG 2015 Summer
Recruit Technologies
Alteryx UG3 LT #alteryx_ug
Alteryx UG3 LT #alteryx_ug
__john_smith__
FluentdやNorikraを使った データ集約基盤への取り組み紹介
FluentdやNorikraを使った データ集約基盤への取り組み紹介
Recruit Technologies
Watson活用事例~Watsonハッカソンの例を通じて~
Watson活用事例~Watsonハッカソンの例を通じて~
Hiroki Nakayama
ディープラーニングでおそ松さんの6つ子は見分けられるのか? FIT2016
ディープラーニングでおそ松さんの6つ子は見分けられるのか? FIT2016
Yota Ishida
リクルートにおける画像解析事例紹介
リクルートにおける画像解析事例紹介
Recruit Technologies
研究を基にしたオープンソース開発チェックポイント
研究を基にしたオープンソース開発チェックポイント
Recruit Technologies
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理
Preferred Networks
Semantic analysis and helpfulness prediction of text for online product reviews
Semantic analysis and helpfulness prediction of text for online product reviews
浩気 西山
RTミドルウェアサマーキャンプ2018「開発プロセスと RT コンポーネントのデバッグ・テスト手法」
RTミドルウェアサマーキャンプ2018「開発プロセスと RT コンポーネントのデバッグ・テスト手法」
openrtm
Classification of Visualize Tool
Classification of Visualize Tool
show you
[db analytics showcase Sapporo 2017] MicrosoftのAIテクノロジーを活用しよう ~インテリジェントAPIからデ...
[db analytics showcase Sapporo 2017] MicrosoftのAIテクノロジーを活用しよう ~インテリジェントAPIからデ...
Naoki (Neo) SATO
OSS ソースコードサーチツールの効能、有効活用方法
OSS ソースコードサーチツールの効能、有効活用方法
Open Source Software Association of Japan
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
Toshiyuki Shimono
Rsj2013 sekiyama 3
Rsj2013 sekiyama 3
openrtm
Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門
Tatsuya Tojima
ドキュメントを加速する作画ツール Blockdiag 2011/07 #infotalk
ドキュメントを加速する作画ツール Blockdiag 2011/07 #infotalk
Takeshi Komiya
TypeScript で型を上手く使う試み.pdf
TypeScript で型を上手く使う試み.pdf
Ryo Higashigawa
bigdata2012nlp okanohara
bigdata2012nlp okanohara
Preferred Networks
Why python
Why python
Mikio Kubo
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
Yuya Unno
NLPソリューション開発の最前線_DLLAB_自然言語処理ナイト_200702
NLPソリューション開発の最前線_DLLAB_自然言語処理ナイト_200702
小川 雄太郎
NLPソリューション開発の最前線
NLPソリューション開発の最前線
Deep Learning Lab(ディープラーニング・ラボ)
Trat_sprint1
Trat_sprint1
tratwakate
フリーソフトウェア「KH Coder」を使った計量テキスト分析 ―手軽なマウス操作による分析からプラグイン作成まで― #TokyoWebmining 41st
フリーソフトウェア「KH Coder」を使った計量テキスト分析 ―手軽なマウス操作による分析からプラグイン作成まで― #TokyoWebmining 41st
khcoder
Hadoopカンファレンス2013
Hadoopカンファレンス2013
Recruit Technologies
新卒2年目が鍛えられたコードレビュー道場
新卒2年目が鍛えられたコードレビュー道場
Recruit Technologies
カーセンサーで深層学習を使ってUX改善を行った事例とそこからの学び
カーセンサーで深層学習を使ってUX改善を行った事例とそこからの学び
Recruit Technologies
Weitere ähnliche Inhalte
Ähnlich wie ATL オープンラボ NLP 2015
研究を基にしたオープンソース開発チェックポイント
研究を基にしたオープンソース開発チェックポイント
Recruit Technologies
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理
Preferred Networks
Semantic analysis and helpfulness prediction of text for online product reviews
Semantic analysis and helpfulness prediction of text for online product reviews
浩気 西山
RTミドルウェアサマーキャンプ2018「開発プロセスと RT コンポーネントのデバッグ・テスト手法」
RTミドルウェアサマーキャンプ2018「開発プロセスと RT コンポーネントのデバッグ・テスト手法」
openrtm
Classification of Visualize Tool
Classification of Visualize Tool
show you
[db analytics showcase Sapporo 2017] MicrosoftのAIテクノロジーを活用しよう ~インテリジェントAPIからデ...
[db analytics showcase Sapporo 2017] MicrosoftのAIテクノロジーを活用しよう ~インテリジェントAPIからデ...
Naoki (Neo) SATO
OSS ソースコードサーチツールの効能、有効活用方法
OSS ソースコードサーチツールの効能、有効活用方法
Open Source Software Association of Japan
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
Toshiyuki Shimono
Rsj2013 sekiyama 3
Rsj2013 sekiyama 3
openrtm
Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門
Tatsuya Tojima
ドキュメントを加速する作画ツール Blockdiag 2011/07 #infotalk
ドキュメントを加速する作画ツール Blockdiag 2011/07 #infotalk
Takeshi Komiya
TypeScript で型を上手く使う試み.pdf
TypeScript で型を上手く使う試み.pdf
Ryo Higashigawa
bigdata2012nlp okanohara
bigdata2012nlp okanohara
Preferred Networks
Why python
Why python
Mikio Kubo
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
Yuya Unno
NLPソリューション開発の最前線_DLLAB_自然言語処理ナイト_200702
NLPソリューション開発の最前線_DLLAB_自然言語処理ナイト_200702
小川 雄太郎
NLPソリューション開発の最前線
NLPソリューション開発の最前線
Deep Learning Lab(ディープラーニング・ラボ)
Trat_sprint1
Trat_sprint1
tratwakate
フリーソフトウェア「KH Coder」を使った計量テキスト分析 ―手軽なマウス操作による分析からプラグイン作成まで― #TokyoWebmining 41st
フリーソフトウェア「KH Coder」を使った計量テキスト分析 ―手軽なマウス操作による分析からプラグイン作成まで― #TokyoWebmining 41st
khcoder
Hadoopカンファレンス2013
Hadoopカンファレンス2013
Recruit Technologies
Ähnlich wie ATL オープンラボ NLP 2015
(20)
研究を基にしたオープンソース開発チェックポイント
研究を基にしたオープンソース開発チェックポイント
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理
Semantic analysis and helpfulness prediction of text for online product reviews
Semantic analysis and helpfulness prediction of text for online product reviews
RTミドルウェアサマーキャンプ2018「開発プロセスと RT コンポーネントのデバッグ・テスト手法」
RTミドルウェアサマーキャンプ2018「開発プロセスと RT コンポーネントのデバッグ・テスト手法」
Classification of Visualize Tool
Classification of Visualize Tool
[db analytics showcase Sapporo 2017] MicrosoftのAIテクノロジーを活用しよう ~インテリジェントAPIからデ...
[db analytics showcase Sapporo 2017] MicrosoftのAIテクノロジーを活用しよう ~インテリジェントAPIからデ...
OSS ソースコードサーチツールの効能、有効活用方法
OSS ソースコードサーチツールの効能、有効活用方法
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
Rsj2013 sekiyama 3
Rsj2013 sekiyama 3
Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門
ドキュメントを加速する作画ツール Blockdiag 2011/07 #infotalk
ドキュメントを加速する作画ツール Blockdiag 2011/07 #infotalk
TypeScript で型を上手く使う試み.pdf
TypeScript で型を上手く使う試み.pdf
bigdata2012nlp okanohara
bigdata2012nlp okanohara
Why python
Why python
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
NLPソリューション開発の最前線_DLLAB_自然言語処理ナイト_200702
NLPソリューション開発の最前線_DLLAB_自然言語処理ナイト_200702
NLPソリューション開発の最前線
NLPソリューション開発の最前線
Trat_sprint1
Trat_sprint1
フリーソフトウェア「KH Coder」を使った計量テキスト分析 ―手軽なマウス操作による分析からプラグイン作成まで― #TokyoWebmining 41st
フリーソフトウェア「KH Coder」を使った計量テキスト分析 ―手軽なマウス操作による分析からプラグイン作成まで― #TokyoWebmining 41st
Hadoopカンファレンス2013
Hadoopカンファレンス2013
Mehr von Recruit Technologies
新卒2年目が鍛えられたコードレビュー道場
新卒2年目が鍛えられたコードレビュー道場
Recruit Technologies
カーセンサーで深層学習を使ってUX改善を行った事例とそこからの学び
カーセンサーで深層学習を使ってUX改善を行った事例とそこからの学び
Recruit Technologies
Rancherを活用した開発事例の紹介 ~Rancherのメリットと辛いところ~
Rancherを活用した開発事例の紹介 ~Rancherのメリットと辛いところ~
Recruit Technologies
Tableau活用4年の軌跡
Tableau活用4年の軌跡
Recruit Technologies
HadoopをBQにマイグレしようとしてる話
HadoopをBQにマイグレしようとしてる話
Recruit Technologies
LT(自由)
LT(自由)
Recruit Technologies
リクルートグループの現場事例から見る AI/ディープラーニング ビジネス活用の勘所
リクルートグループの現場事例から見る AI/ディープラーニング ビジネス活用の勘所
Recruit Technologies
Company Recommendation for New Graduates via Implicit Feedback Multiple Matri...
Company Recommendation for New Graduates via Implicit Feedback Multiple Matri...
Recruit Technologies
リクルート式AIの活用法
リクルート式AIの活用法
Recruit Technologies
銀行ロビーアシスタント
銀行ロビーアシスタント
Recruit Technologies
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
Recruit Technologies
ユーザー企業内製CSIRTにおける対応のポイント
ユーザー企業内製CSIRTにおける対応のポイント
Recruit Technologies
ユーザーからみたre:Inventのこれまでと今後
ユーザーからみたre:Inventのこれまでと今後
Recruit Technologies
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Recruit Technologies
EMRでスポットインスタンスの自動入札ツールを作成する
EMRでスポットインスタンスの自動入札ツールを作成する
Recruit Technologies
RANCHERを使ったDev(Ops)
RANCHERを使ったDev(Ops)
Recruit Technologies
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
Recruit Technologies
ユーザー企業内製CSIRTにおける対応のポイント
ユーザー企業内製CSIRTにおける対応のポイント
Recruit Technologies
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
Recruit Technologies
「リクルートデータセット」 ~公開までの道のりとこれから~
「リクルートデータセット」 ~公開までの道のりとこれから~
Recruit Technologies
Mehr von Recruit Technologies
(20)
新卒2年目が鍛えられたコードレビュー道場
新卒2年目が鍛えられたコードレビュー道場
カーセンサーで深層学習を使ってUX改善を行った事例とそこからの学び
カーセンサーで深層学習を使ってUX改善を行った事例とそこからの学び
Rancherを活用した開発事例の紹介 ~Rancherのメリットと辛いところ~
Rancherを活用した開発事例の紹介 ~Rancherのメリットと辛いところ~
Tableau活用4年の軌跡
Tableau活用4年の軌跡
HadoopをBQにマイグレしようとしてる話
HadoopをBQにマイグレしようとしてる話
LT(自由)
LT(自由)
リクルートグループの現場事例から見る AI/ディープラーニング ビジネス活用の勘所
リクルートグループの現場事例から見る AI/ディープラーニング ビジネス活用の勘所
Company Recommendation for New Graduates via Implicit Feedback Multiple Matri...
Company Recommendation for New Graduates via Implicit Feedback Multiple Matri...
リクルート式AIの活用法
リクルート式AIの活用法
銀行ロビーアシスタント
銀行ロビーアシスタント
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
ユーザー企業内製CSIRTにおける対応のポイント
ユーザー企業内製CSIRTにおける対応のポイント
ユーザーからみたre:Inventのこれまでと今後
ユーザーからみたre:Inventのこれまでと今後
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
EMRでスポットインスタンスの自動入札ツールを作成する
EMRでスポットインスタンスの自動入札ツールを作成する
RANCHERを使ったDev(Ops)
RANCHERを使ったDev(Ops)
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
ユーザー企業内製CSIRTにおける対応のポイント
ユーザー企業内製CSIRTにおける対応のポイント
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
「リクルートデータセット」 ~公開までの道のりとこれから~
「リクルートデータセット」 ~公開までの道のりとこれから~
ATL オープンラボ NLP 2015
1.
ATLにおける 自然言語処理 関連技術の 事例紹介 株式会社リクルートテクノロジーズ 伊藤 敬彦 1
2.
自己紹介 名前:伊藤敬彦 Twitter アカウント: takahi_i 所属:株式会社リクルートテ クノロジーズ
ATL 工学博士(専門分野:データ マイニング、グラフ、検索) 2
3.
本日のトピック RedPen 自動文書検査ツール 3 パン田一郎 LINE アカウント 対話ボット
4.
自動文書 検査ツール RedPen 4
5.
背景: ソフトウェアの開発 環境 ソフトウェア開発では品質検査ツールを利用する ツール:CheckStyle [Burn]、FindBugs
[Rutar ら] 等… コードが規約に従っているか自動で検査する: 行長、変数名、ファイル長、潜在的なバグ … ➔ 品質検査ツールは開発効率のアップ、品質向上に 寄与 5
6.
背景: 文書の執筆環境 文書:マニュアル、論文、仕様書 文書にも品質検査ツールは存在する JustRight! [JustSystem]、Tomarigi
[又平 ら]、 ChantKun[笠原] しかし問題がある 6
7.
背景: 既存の品質検査ツー ルの問題点 有料 規約にあわせた設定ができない,設定を共有できない 日本語以外の言語(英語)で使えない ソースが公開されていない マークアップ言語に対応してない ➔ 問題を解決するため
RedPen を開発した 7
8.
RedPenとは 自然言語で記述された文書の品質検査ツール 機能:入力文書内の問題箇所で警告を出力する オープンソースプロジェクト URL: http://redpen.cc 8
9.
例: 問題箇所を含む文書 9 最近利用されているソフトウェアの中には複数の計算機上で動作(分 散)するものが多く存在し、このような分散ソフトウェアは複数の計 算機で動作することで大量のデータを扱えたり、高負荷な状況に対処 できたりします。本稿では,複数の計算機(クラスタ)で動作する各サー バーを「インスタンス」と呼びます。たとえば検索エンジンやデータ ベースではインデックスを複数のインスタンスで分割して保持します。 このような場合、各インデクスの結果をマージしてクライアントプロ グラムに渡す機構が必要となります。 文が長い コンマのフォーマット 単語の不一致単語の不一致 コンマのフォーマット
10.
RedPen の特徴 柔軟な設定 言語非依存 複数のフォーマットに対応:Markdown、Textile 拡張性 ソースを公開している(簡単に機能を追加できる) 研究成果を取り込むのが容易 10
11.
RedPen の使い方 ユーザは検査する項目を設定ファイルに追加する 検査する項目は提供される機能集合の中から選 択する 設定ファイルを引数にして実行する 11
12.
例:RedPen の設定 12 <validators> <validator name=
SentenceLength" /> <validator name="InvalidCharacter" /> <validator name="KatakanaSpellCheck" /> <validator name= SectionLength /> </validators> 文長 不正な文字 スペルチェック
13.
コマンド redpen コマンドを利用して実行する 入力フォーマット: Markdown、Textile、 PlainText 13 $
redpen -c 設定ファイル 入力文書
14.
機能追加 抽象クラス Validator を継承するクラスを定義する 記述言語は
Java やること:一つのメソッドを実装するだけ validate(Sentence input, ValidationError errors) 雑多なことは RedPen がやってくれる マークアップデータ (Markdown) のパース、文の切り出 し 14
15.
例:文長検査 public validate(Sentence sentence, List<ValidationError>
errors) { if (sentence.content.length() > 100) { errors.add(createValidationError(sentence)); } } 15 実装された関数は文書内すべ ての文に自動で適応される
16.
例:文長検査(実装詳細) public validate(Sentence sentence, List<ValidationError>
errors) { if (sentence.content.length() > 100) { errors.add(createValidationError(sentence)); } } 16 文長が長い(100 文字以上) エラーを追加
17.
最近の進 :サーバ機能の 強化 REST API
の強化:ドキュメントと設定ペアを 受け取る API を整備 今までは言語ごとに固定の設定だった 新しい API は設定をユーザごとに異なる設定 で文書を検査 17
18.
サーバ URL:http://redpen.herokuapp.com/ 編集も可能 注:RedPen サーバは Heroku
ボタンで立ち上がる 18
19.
Herokuボタン? クリック数回で自分用サーバがクラウド上 (Heroku上)に立ち上がる リンク: https://github.com/recruit-tech/redpen/ 19
20.
Herokuサーバのメリット 重要:ローカル環境にJavaをインストールしな くても RedPenの機能が利用できる。 注:Java をインストーするのが億劫というコ メントが多数。 好きな言語でクライアントスクリプト(立ち上げ たHerokuサーバに文書と設定を投げる)を記述 するだけでOK! 20
21.
RedPen Python クライ アント Heroku
上の RedPen サーバに設定と、文書を投げる URL:https://github.com/takahi-i/redpen-ci- sample ポイント: 100行未満のスクリプト Java & RedPen インストールしなくても大丈夫! 21
22.
さらに 継続的インテグレーションサービス (Travisなど) の設定を加えると。。。 GitHub で保持されている文書に対する変更 (Pull
Request)を RedPenクライアントで自 動チェックできる https://github.com/takahi-i/redpen-ci- sample/pulls 22
23.
最近進 :そのほか 設定ファイルの自動ロード パラメタで指定しなくてもカレントディレクト リにある redpen-conf.xml
を自動でロードす る。 機能追加:ですます、である調の混在 23
24.
開発:今までとこれから 今までの開発は、簡単に使える、拡張できる環境を整えることに フォーカスしてきた。 今後はもう少し機能を拡充してゆきたい。 高度な言語解析の機能 Asciidoc、LaTeX への対応 さらに簡単に機能追加 Java以外の言語(Scala、Groovy) パターン、ルール 24
25.
NLP 研究者の皆様へ 文書の検査関係の研究成果のアウトプット先とし てご利用いただければと考えております。 公開しても良いものであれば、Pull Request
随 時受け付けております。 25
26.
まとめ RedPen の背景を解説 RedPen の紹介 自然言語を入力とする品質検査ツール 機能の追加方法について解説 今後の予定について解説 26
27.
本日のトピック RedPen 自動文書検査ツール 27 パン田一郎 LINE アカウント 対話ボット
28.
LINEアカウント パン田一郎 の中身 28
29.
背景:パン田一郎 リクルートジョブズが運 営する『fromA navi』 のキャラクタ 最近 LINE
の公式アカウ ントとなる 友人数:約1350万人 ATL が対話部分を担当 29
30.
背景:LINE アカウント パン田一郎 対話を通じて三つの機能を提供する 機能① 雑談 機能②
バイト探し 機能③ バイト生活サポート シフト通知、天気 30
31.
デモ 天気 雑談 31
32.
対話システム? 実はパン田一郎はまともに対話してない。。。 できるのは限定された受け答えだけ 古典的な対話システム 以下パン田一郎の対話システム外観について解説 する 32
33.
パン田システム外観 メッセージ処理コンポーネント 対話文生成コンポーネント 今日の東京の天気は? 晴れ,最高気温は23度だよ パン田システム 33
34.
パン田一郎対話システ ム パン田一郎システムは大きく分けて二つのコンポー ネントからなる 1. メッセージ処理コンポーネント 2. 応答文生成コンポーネント 34
35.
パン田システム外観 35 メッセージ処理コンポーネント 応答文生成コンポーネント 今日の東京の天気は? 晴れ,最高気温は23度だよ 今日の東京の天気は? 入力文からの情報抽出 晴 れ , 最 高 気 温 は 23度 だ よ
36.
メッセージ処理 コンポーネント 36 メッセージ処理コンポーネント 今日の東京の天気は? 今日の東京の天気は? 入力文からの情報抽出
37.
メッセージ処理 コンポーネント 入力:ユーザからの入力メッセージを受け取る 出力:メッセージ内に含まれる情報を抽出する 注:情報の抽出にはApache UIMAを利用した 37
38.
抽出する内容 入力メッセージ (文) の意図 その他の情報 時間抽出 場所判定 数値表現 38
39.
例:情報抽出(天気情 報) 入力メッセージ:今日の天気は? 意図:天気 39
40.
例:情報抽出(バイト 探し) 入力:新宿のバイトおしえて 抽出された情報: 意図:バイト検索 場所:新宿 40
41.
パン田システム外観 41 メッセージ処理コンポーネント 応答文生成コンポーネント 今日の東京の天気は? 晴れ,最高気温は23度だよ 今日の東京の天気は? 入力文からの情報抽出 晴 れ , 最 高 気 温 は 23度 だ よ
42.
応答文生成コンポーネ ント 42 応答文生成コンポーネント晴れ,最高気温は23度だよ 入力文からの情報抽出 晴 れ , 最 高 気 温 は 23度 だ よ
43.
応答文生成コンポーネ ント 入力:入力メッセージ+(メッセージ処理コン ポーネントで抽出された)情報 出力:抽出された意図に応じた応答文 43
44.
応答文生成コンポーネ ントが行う処理 抽出された意図に基づいてサブコンポーネント に処理を移譲する 44
45.
サブコンポーネント 図:応答文生成コンポー ネント 処理:抽出された意図によってサブコンポーネントに処理 を振り分ける サブコンポーネントで応答文を生成する 45 応答文生成コンポーネント バイト検索 天気 雑談
46.
例:天気 意図が天気情報の場合, 天気情報を返すサブコンポーネントが返事を 生成する. 46
47.
ユーザからのメッセージから意図が取れない 場合は? 47
48.
サブコンポーネント 意図が取得できない場 合 雑談コンポーネント(サブコンポーネントの一 つ)に処理が移譲される 48 対話文生成コンポーネント バイト検索 天気 雑談
49.
例:雑談 デモ(意図が抽出されない文): 眠いね∼∼ 疲れた∼∼ 49
50.
雑談コンポーネント ユーザからの入力メッセー ジと応答文のペアを予め 用意 入力メッセージにマッチ した応答文を返す 50 メッセージ 応答文 寒いね∼∼ ホントに寒く なってきた すごいね∼ ほめられるとて れます∼ w まじですw
51.
開発の指針と感想 主な指針:対話システムの中をブラックボックスにしない(シス テムを簡素に保つ) 例:意図推定や情報抽出には正規表現を利用 メリット: 自然言語処理の経験のないエンジニア、シナリオライターがシー ムレスに開発に参加できた だれでも必要なリソース(ルール、対話セット)を随時追加、 検証できる 51
52.
とはいえパン田一郎ができ ないことがたくさんある とくに、文脈の理解 文脈=前の会話の内容 52
53.
たとえば ユーザ:何が趣味? パンダ:登山かな ユーザ:どこがいいの? パンダ:動物園なんてどうでしょう? 53 趣味は登山 登山 とは関係ないことを返して いる
54.
それでも 文脈なくても結構うまくいく! 参考:http://girlsvip-matome.com/acv/ 1008969564.html 54
55.
将来 パン田一郎は人間のような対話ができるように なるか? 55
56.
正直難しい 理由:人間の発するメッセージは多様すぎる 更に過去の文脈を保持するとなるとさらに難 易度があがる。。。 とはいえログデータを活用することで今より 少々自然な対話を目指すことはできる。。? 56
57.
ログデータから分かっ たこと ユーザは同じような入力 しかしない 57
58.
つまり 「元気?」とか短いメッセージが中心であまり バラエティがない。 58
59.
59 戦略:頻度上位のメッセージに対する返信だけ 工夫する 応答文のバリエーションを増やす 上位頻度の入力メッセージだけは文脈を取り 入れた応答をする 検証できてません。。。orz 対話システム改善案
60.
( ́ノД`)コッソリ 実はちょっと別の方向で進化して いるのです ATL 対話システム最近 の進 60
61.
Pepper にATL対話シ ステムを導入 パン田一郎で利用した対話エンジンを拡張 拡張 ユーザのプロファイルに合わせて対話を変化させる 対話対象のプロファイリングは Papper
のAPIを 使用 年齢、性別(対応予定) 61
62.
まとめ LINEアカウントパン田一郎の対話ロジック部分 の解説 シンプルな構成 対話ログの傾向を紹介 ATL 対話システムの現状の拡張について紹介 62
63.
ご静聴ありがとうござ いました 63