Suche senden
Hochladen
RedPen Status 2014/07
•
3 gefällt mir
•
23,004 views
Recruit Technologies
Folgen
This presentation covers the introduction of RedPen and the development status.
Weniger lesen
Mehr lesen
Software
Melden
Teilen
Melden
Teilen
1 von 23
Jetzt herunterladen
Downloaden Sie, um offline zu lesen
Empfohlen
ATL オープンラボ NLP 2015
ATL オープンラボ NLP 2015
Recruit Technologies
RedPen texconf15
RedPen texconf15
Recruit Technologies
JJUG 2015 Summer
JJUG 2015 Summer
Recruit Technologies
Hadoopカンファレンス20140707
Hadoopカンファレンス20140707
Recruit Technologies
FluentdやNorikraを使った データ集約基盤への取り組み紹介
FluentdやNorikraを使った データ集約基盤への取り組み紹介
Recruit Technologies
DocumentValidator
DocumentValidator
Takahiko Ito
International php conference 2016 参加レポート
International php conference 2016 参加レポート
Ryosuke Miyahara
言語処理学会へ遊びに行ったよ
言語処理学会へ遊びに行ったよ
antibayesian 俺がS式だ
Empfohlen
ATL オープンラボ NLP 2015
ATL オープンラボ NLP 2015
Recruit Technologies
RedPen texconf15
RedPen texconf15
Recruit Technologies
JJUG 2015 Summer
JJUG 2015 Summer
Recruit Technologies
Hadoopカンファレンス20140707
Hadoopカンファレンス20140707
Recruit Technologies
FluentdやNorikraを使った データ集約基盤への取り組み紹介
FluentdやNorikraを使った データ集約基盤への取り組み紹介
Recruit Technologies
DocumentValidator
DocumentValidator
Takahiko Ito
International php conference 2016 参加レポート
International php conference 2016 参加レポート
Ryosuke Miyahara
言語処理学会へ遊びに行ったよ
言語処理学会へ遊びに行ったよ
antibayesian 俺がS式だ
第3回 開発ツールチラ見せ♡ナイト オープニングプレゼン
第3回 開発ツールチラ見せ♡ナイト オープニングプレゼン
Tomoyuki Sugita
Alteryx UG3 LT #alteryx_ug
Alteryx UG3 LT #alteryx_ug
__john_smith__
仕事効率化ツール
仕事効率化ツール
Boris Friedrich Milkowski
言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyo
Shuyo Nakatani
研究を基にしたオープンソース開発チェックポイント
研究を基にしたオープンソース開発チェックポイント
Recruit Technologies
20140903 じどうかの窓口特別編 君にもなれる!?テスト自動化エンジニア
20140903 じどうかの窓口特別編 君にもなれる!?テスト自動化エンジニア
SHIFT Inc.
Ldd13 present
Ldd13 present
Masashi Kayahara
Web開発用ツール導入のすすめ
Web開発用ツール導入のすすめ
Kiyoshi SATOH
社内勉強会(Git)
社内勉強会(Git)
Kazuyuki Ikeda
アジャイルマネジメントとは?
アジャイルマネジメントとは?
Kiro Harada
オープンデータのためのスクレイピング
オープンデータのためのスクレイピング
直之 伊藤
ドキュメント生成ツールのお話
ドキュメント生成ツールのお話
Shota Homma
人工知能のコードをハックする会 #2
人工知能のコードをハックする会 #2
Ryohei Kamiya
C++CLIで、ネイティブCの保守開発に.NETを使って楽をしよう
C++CLIで、ネイティブCの保守開発に.NETを使って楽をしよう
Study Group by SciencePark Corp.
BPstudy#64 ドキュメントを作りたくなってしまう魔法のツール Sphinx 2012年版
BPstudy#64 ドキュメントを作りたくなってしまう魔法のツール Sphinx 2012年版
Go Yamada
【XDev】A-2 アジリティ向上のためのツール活用
【XDev】A-2 アジリティ向上のためのツール活用
智治 長沢
windows向けツール紹介
windows向けツール紹介
ryutakatori
GCSアジャイル開発を使ったゲームの作り方
GCSアジャイル開発を使ったゲームの作り方
Hiroyuki Tanaka
Visual開発ツールNode-REDの導入によるプロセスの変化と考慮点
Visual開発ツールNode-REDの導入によるプロセスの変化と考慮点
Makoto SAKAI
匠Methodをサポートする事業開発に役立つ書籍たちを紹介します
匠Methodをサポートする事業開発に役立つ書籍たちを紹介します
Haruo Sato
新卒2年目が鍛えられたコードレビュー道場
新卒2年目が鍛えられたコードレビュー道場
Recruit Technologies
カーセンサーで深層学習を使ってUX改善を行った事例とそこからの学び
カーセンサーで深層学習を使ってUX改善を行った事例とそこからの学び
Recruit Technologies
Weitere ähnliche Inhalte
Ähnlich wie RedPen Status 2014/07
第3回 開発ツールチラ見せ♡ナイト オープニングプレゼン
第3回 開発ツールチラ見せ♡ナイト オープニングプレゼン
Tomoyuki Sugita
Alteryx UG3 LT #alteryx_ug
Alteryx UG3 LT #alteryx_ug
__john_smith__
仕事効率化ツール
仕事効率化ツール
Boris Friedrich Milkowski
言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyo
Shuyo Nakatani
研究を基にしたオープンソース開発チェックポイント
研究を基にしたオープンソース開発チェックポイント
Recruit Technologies
20140903 じどうかの窓口特別編 君にもなれる!?テスト自動化エンジニア
20140903 じどうかの窓口特別編 君にもなれる!?テスト自動化エンジニア
SHIFT Inc.
Ldd13 present
Ldd13 present
Masashi Kayahara
Web開発用ツール導入のすすめ
Web開発用ツール導入のすすめ
Kiyoshi SATOH
社内勉強会(Git)
社内勉強会(Git)
Kazuyuki Ikeda
アジャイルマネジメントとは?
アジャイルマネジメントとは?
Kiro Harada
オープンデータのためのスクレイピング
オープンデータのためのスクレイピング
直之 伊藤
ドキュメント生成ツールのお話
ドキュメント生成ツールのお話
Shota Homma
人工知能のコードをハックする会 #2
人工知能のコードをハックする会 #2
Ryohei Kamiya
C++CLIで、ネイティブCの保守開発に.NETを使って楽をしよう
C++CLIで、ネイティブCの保守開発に.NETを使って楽をしよう
Study Group by SciencePark Corp.
BPstudy#64 ドキュメントを作りたくなってしまう魔法のツール Sphinx 2012年版
BPstudy#64 ドキュメントを作りたくなってしまう魔法のツール Sphinx 2012年版
Go Yamada
【XDev】A-2 アジリティ向上のためのツール活用
【XDev】A-2 アジリティ向上のためのツール活用
智治 長沢
windows向けツール紹介
windows向けツール紹介
ryutakatori
GCSアジャイル開発を使ったゲームの作り方
GCSアジャイル開発を使ったゲームの作り方
Hiroyuki Tanaka
Visual開発ツールNode-REDの導入によるプロセスの変化と考慮点
Visual開発ツールNode-REDの導入によるプロセスの変化と考慮点
Makoto SAKAI
匠Methodをサポートする事業開発に役立つ書籍たちを紹介します
匠Methodをサポートする事業開発に役立つ書籍たちを紹介します
Haruo Sato
Ähnlich wie RedPen Status 2014/07
(20)
第3回 開発ツールチラ見せ♡ナイト オープニングプレゼン
第3回 開発ツールチラ見せ♡ナイト オープニングプレゼン
Alteryx UG3 LT #alteryx_ug
Alteryx UG3 LT #alteryx_ug
仕事効率化ツール
仕事効率化ツール
言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyo
研究を基にしたオープンソース開発チェックポイント
研究を基にしたオープンソース開発チェックポイント
20140903 じどうかの窓口特別編 君にもなれる!?テスト自動化エンジニア
20140903 じどうかの窓口特別編 君にもなれる!?テスト自動化エンジニア
Ldd13 present
Ldd13 present
Web開発用ツール導入のすすめ
Web開発用ツール導入のすすめ
社内勉強会(Git)
社内勉強会(Git)
アジャイルマネジメントとは?
アジャイルマネジメントとは?
オープンデータのためのスクレイピング
オープンデータのためのスクレイピング
ドキュメント生成ツールのお話
ドキュメント生成ツールのお話
人工知能のコードをハックする会 #2
人工知能のコードをハックする会 #2
C++CLIで、ネイティブCの保守開発に.NETを使って楽をしよう
C++CLIで、ネイティブCの保守開発に.NETを使って楽をしよう
BPstudy#64 ドキュメントを作りたくなってしまう魔法のツール Sphinx 2012年版
BPstudy#64 ドキュメントを作りたくなってしまう魔法のツール Sphinx 2012年版
【XDev】A-2 アジリティ向上のためのツール活用
【XDev】A-2 アジリティ向上のためのツール活用
windows向けツール紹介
windows向けツール紹介
GCSアジャイル開発を使ったゲームの作り方
GCSアジャイル開発を使ったゲームの作り方
Visual開発ツールNode-REDの導入によるプロセスの変化と考慮点
Visual開発ツールNode-REDの導入によるプロセスの変化と考慮点
匠Methodをサポートする事業開発に役立つ書籍たちを紹介します
匠Methodをサポートする事業開発に役立つ書籍たちを紹介します
Mehr von Recruit Technologies
新卒2年目が鍛えられたコードレビュー道場
新卒2年目が鍛えられたコードレビュー道場
Recruit Technologies
カーセンサーで深層学習を使ってUX改善を行った事例とそこからの学び
カーセンサーで深層学習を使ってUX改善を行った事例とそこからの学び
Recruit Technologies
Rancherを活用した開発事例の紹介 ~Rancherのメリットと辛いところ~
Rancherを活用した開発事例の紹介 ~Rancherのメリットと辛いところ~
Recruit Technologies
Tableau活用4年の軌跡
Tableau活用4年の軌跡
Recruit Technologies
HadoopをBQにマイグレしようとしてる話
HadoopをBQにマイグレしようとしてる話
Recruit Technologies
LT(自由)
LT(自由)
Recruit Technologies
リクルートグループの現場事例から見る AI/ディープラーニング ビジネス活用の勘所
リクルートグループの現場事例から見る AI/ディープラーニング ビジネス活用の勘所
Recruit Technologies
Company Recommendation for New Graduates via Implicit Feedback Multiple Matri...
Company Recommendation for New Graduates via Implicit Feedback Multiple Matri...
Recruit Technologies
リクルート式AIの活用法
リクルート式AIの活用法
Recruit Technologies
銀行ロビーアシスタント
銀行ロビーアシスタント
Recruit Technologies
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
Recruit Technologies
ユーザー企業内製CSIRTにおける対応のポイント
ユーザー企業内製CSIRTにおける対応のポイント
Recruit Technologies
ユーザーからみたre:Inventのこれまでと今後
ユーザーからみたre:Inventのこれまでと今後
Recruit Technologies
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Recruit Technologies
EMRでスポットインスタンスの自動入札ツールを作成する
EMRでスポットインスタンスの自動入札ツールを作成する
Recruit Technologies
RANCHERを使ったDev(Ops)
RANCHERを使ったDev(Ops)
Recruit Technologies
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
Recruit Technologies
ユーザー企業内製CSIRTにおける対応のポイント
ユーザー企業内製CSIRTにおける対応のポイント
Recruit Technologies
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
Recruit Technologies
「リクルートデータセット」 ~公開までの道のりとこれから~
「リクルートデータセット」 ~公開までの道のりとこれから~
Recruit Technologies
Mehr von Recruit Technologies
(20)
新卒2年目が鍛えられたコードレビュー道場
新卒2年目が鍛えられたコードレビュー道場
カーセンサーで深層学習を使ってUX改善を行った事例とそこからの学び
カーセンサーで深層学習を使ってUX改善を行った事例とそこからの学び
Rancherを活用した開発事例の紹介 ~Rancherのメリットと辛いところ~
Rancherを活用した開発事例の紹介 ~Rancherのメリットと辛いところ~
Tableau活用4年の軌跡
Tableau活用4年の軌跡
HadoopをBQにマイグレしようとしてる話
HadoopをBQにマイグレしようとしてる話
LT(自由)
LT(自由)
リクルートグループの現場事例から見る AI/ディープラーニング ビジネス活用の勘所
リクルートグループの現場事例から見る AI/ディープラーニング ビジネス活用の勘所
Company Recommendation for New Graduates via Implicit Feedback Multiple Matri...
Company Recommendation for New Graduates via Implicit Feedback Multiple Matri...
リクルート式AIの活用法
リクルート式AIの活用法
銀行ロビーアシスタント
銀行ロビーアシスタント
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
ユーザー企業内製CSIRTにおける対応のポイント
ユーザー企業内製CSIRTにおける対応のポイント
ユーザーからみたre:Inventのこれまでと今後
ユーザーからみたre:Inventのこれまでと今後
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
EMRでスポットインスタンスの自動入札ツールを作成する
EMRでスポットインスタンスの自動入札ツールを作成する
RANCHERを使ったDev(Ops)
RANCHERを使ったDev(Ops)
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
リクルートにおけるセキュリティ施策方針とCSIRT組織運営のポイント
ユーザー企業内製CSIRTにおける対応のポイント
ユーザー企業内製CSIRTにおける対応のポイント
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
「リクルートデータセット」 ~公開までの道のりとこれから~
「リクルートデータセット」 ~公開までの道のりとこれから~
RedPen Status 2014/07
1.
RedPen の概要 伊藤 敬彦 1
2.
自己紹介 所属:株式会社リクルートテ クノロジーズ ATL Twitter アカウント:
takahi_i 2
3.
開発の背景 私(プログラマ)はコードのチェックを色々なツー ルを使って行っている ツール:CheckStyle, FindBugs, lint, Valgrind,
CI etc… ➔ ツールを使うことで開発効率、品質向上 3
4.
開発の背景 私(プログラマ)は文書を書く マニュアル、論文、仕様書 残念ながら、品質をチェックするツールがない ➔ 結果、生産性、品質が向上しない 4
5.
開発の背景 自然言語文書をチェックするツールあれば、幸せ に? 機械的に処理できるフォーマット異常を検知して くれるだけで相当嬉しい。 ➔ 著者は内容の校正に集中できる。 5
6.
RedPenとは 自然言語文書の自動チェックツール 自然言語文書: 論文、マニュアル、仕様書、レジュ メ、広告 etc… 6
7.
RedPenとは RedPen は入力文書にある悪い点に対して警告 を出力する。 ! ! URL: http://redpen.bigram.org/ 7 注:現状、研究分野の「自然言語処理」で行って いる高度な解析は対象としていない。
8.
悪い部分? 基本的なパーツが わない ターミノロジー 句読点 文が長すぎる スペルミス 短縮形に対する正規形が文書に書かれていない 8
9.
例: 悪い文書 9 最近利用されているソフトウェアの中には複数の計算機上で動作(分 散)するものが多く存在し、このような分散ソフトウェアは複数の計 算機で動作することで大量のデータを扱えたり、高負荷な状況に対処 できたりします。本稿では,複数の計算機(クラスタ)で動作する各サー バーを「インスタンス」と呼びます。たとえば検索エンジンやデータ ベースではインデックスを複数のインスタンスで分割して保持します。 このような場合、各インデクスの結果をマージしてクライアントプロ グラムに渡す機構が必要となります。
10.
例: 悪い文書 10 最近利用されているソフトウェアの中には複数の計算機上で動作(分 散)するものが多く存在し、このような分散ソフトウェアは複数の計 算機で動作することで大量のデータを扱えたり、高負荷な状況に対処 できたりします。本稿では,複数の計算機(クラスタ)で動作する各サー バーを「インスタンス」と呼びます。たとえば検索エンジンやデータ ベースではインデックスを複数のインスタンスで分割して保持します。 このような場合、各インデクスの結果をマージしてクライアントプロ グラムに渡す機構が必要となります。 文が長い コンマのフォーマット 単語の不一致単語の不一致 コンマのフォーマット
11.
RedPen の特徴 設定だけで利用できる 言語非依存(英語でも日本語でも設定を変えると 動作する) 11
12.
RedPen の使い方 ユーザは設定ファイルにチェックする項目をリス トアップ チェックする項目目は提供される Validator
集 合の中か ら選択する 12
13.
例:RedPen の設定 13 <validator-list> <validator name=
SentenceLength" /> <validator name="InvalidCharacter" /> <validator name="KatakanaSpellCheck" /> <validator name= SectionLength /> </validator-list> 文長 不正な文字 スペルチェック
14.
利用できる Validator SentenceLength InvalidExpression SpaceAfterPeriod CommaNumber WordNumber SuggestExpression InvalidCharacter SpaceWithSymbol KatakanaEndHyphen KatakanaSpellCheck SectionLength ParagraphNumber ParagraphStartWith 14
15.
コマンド redpen コマンドを利用して実行する ! 入力フォーマット: Markdown、Textile、 PlainText 15 $
redpen -c 設定ファイル 入力文書
16.
サーバ redpen に同梱されているサンプルサーバを起動 する 16 $ java
-jar redpen.war
17.
デモ 17
18.
所感:設定が面倒くさい 不正なシンボルや単語はデフォルトセットが必要 か? 正式文書に使うべきでない表現は最初から入れて おいてほしい。 18
19.
これから Validator の追加 英語のスペルチェック、敬語、口語 コードのリファクタリング ユーザ獲得 アプリ作成 19
20.
これから 現状、RedPen は機械処理できるような単純機 能に限定している。 近い将来、高度な解析を簡単に試せるように、 Plugin をサポート。 研究者の人に試してもらいたい。 20
21.
これから サーバサイドの強化。 ゆくゆくはマルチテナント化 CI ツールから利用できるようにする。 Jenkins, Travis
CI, Circle CI etc… 9月に本リリース予定。 21
22.
まとめ RedPen の背景を解説 RedPen の紹介 自然言語を入力とするチェックツール 今後の予定について解説 22
Jetzt herunterladen