SlideShare ist ein Scribd-Unternehmen logo
1 von 60
Perl で自然言語処理 佐藤 敏紀(さとうとしのり) @overlast 1
私(佐藤敏紀)の自己紹介 名前:佐藤敏紀(さとうとしのり) ID       : overlast(Twitter : @overlast) key     : 自然言語処理/機械学習/検索/圧縮/順序学習 blog   : Overlasting::Life(http://diary.overlasting.net/)  略歴 2005年4月〜2008年3月:東工大の奥村研究室 自然言語処理(比較関係抽出)の研究 2008年5月〜:某大手ポータルサイト 自然言語処理・機械学習技術をWeb文書に応用 類似文字列検索ライブラリの研究・開発 スペル訂正システムの研究・開発 2
アジェンダ 自然言語処理って何? 何をやったら自然言語処理なの? 自然言語処理の勉強のはじめ方 Webサービスと自然言語処理 上手な自然言語処理との付き合い方 改善ポイント発見のためのキーワード 3
自然言語処理って何? 4
自然言語処理(NLP : Natural Language Processing)とは= 「自然言語」をコンピュータで「処理」すること 自然言語(Natural Language) 人間が意思疎通のために使っている言葉 言葉による意思疎通の手法例:読み・書き・話し コンピュータ用の人工言語と区別される 自然言語処理 分野 : 人工知能 + 言語学 内容 = 解析をする際にどのように高い性能を達成するか 計算言語学(Computational Linguistics)と関連 NLPと聞いて神経的なモノを浮かべては駄目 5
自然言語処理技術の応用例Google 日本語入力 - CGI API 6
自然言語処理技術者に必須な要素 扱うデータに含まれる言語に関する知識 言語に関する文法、用語 テキストデータ中の単語の分布、文の構造など 必要な処理を実現できるプログラミングスキル 実現したいことによって、必要なスキルが異なる できれば確率・統計に関連する知識 何をやる場合でも、ほぼ必ず必要になる 7
自然言語処理に関連する知識・技術 自然言語処理を実現するための知識 データ構造とアルゴリズム、機械学習、代数学、離散数学、グラフ理論、確率統計、情報理論、データ圧縮、組み合わせ最適化など 自然言語処理の基盤技術 形態素解析、構文解析、意味解析、文脈解析など 自然言語処理技術を応用して実現できる技術 情報検索、固有表現抽出、テキストマイニング、情報抽出、かな漢字変換、機械翻訳、文書分類、OCR、スペルチェック、音声認識、自動要約など 8 このあたりが自然言語処理と呼ばれる
自然言語処理の勉強のはじめ方- これから勉強する人向け - 9
日本語の教科書などを読む 自然言語処理の基礎(奥村学著) 薄いので読みやすい 自然言語処理(長尾真 著) 多少(かなり?)古いが網羅的 基礎日本語文法(増岡・田窪著) 日本語の自然言語処理に必要な用語を知る 言語処理のための機械学習入門 自然言語処理を学びつつ機械学習にも入門できる 生駒日記:NAISTの小町守さんのブログ NLP関連の良質な記事をピックアップして下さる 毎日読んでいれば理解が深まる(半年ROM) 海外インターンに行きたくなる(副作用) 10
英語の教科書などを読む 最初の参考書 Foundations of Statistical Natural Language Processing 多少古いが、未読なら通読する価値がある 様々な自然言語処理の研究室で読まれている 略称 : FSNLP 学会・研究会 自然言語処理の学会 PFIの岡野原さんによる学会の解説 Link of NLP/CL Conference 東京大学喜連川研特認助教の吉永直樹さんのリスト。便利。 ACL Anthology 情報処理学会電子図書館(有料) ACM Digital Library(有料) 11
勉強会・研究会・学会に参加する 勉強会・コミュニティ 自然言語処理勉強会@東京 @nokunoさんが主催。参加時の心理的ハードルが低い。 NLP若手の会 研究会や勉強会を頻繁に開催している。 研究会 情報処理学会の自然言語処理研究会 定期開催しているので割と気軽に参加できる。 学会の全国大会 言語処理学会の年次大会 => お祭。参加すべき。 12
その他のおすすめ資料 集合知プログラミング 自然言語処理の応用を体験できる Pythonのコードを見ながらPerlで書く 大規模サービス技術入門(伊藤・田中著) 通読すると何かをやった気分になれる 入門自然言語処理 Natural Language Processing with Pythonの邦訳 オライリーさん。12章が日本語で書き下ろし 情報検索と言語処理-言語と計算-徳永(徳永著) おすすめ。Amazonで本書の関連書籍を見ると良い。 「たつをのChangeLog」のサンプルコード Perl でWebAPIから得た結果を加工するサンプル 13
自然言語処理に必要な3つの心構え 最初は簡単に実装し、徐々に洗練する 簡単で効果が高いところから解決しよう 機械はミスをする 多少の間違えは諦めよう。70%正解してれば十分 データは自前で集めて、自前で管理する 他社のAPIや外注に依存しきるのは危険 14
簡単な方法からやって、洗練する 最初に 『かなり効果が高い & 割と簡単に導入できる』  技術に絞って開発し、サービスに導入する。 導入後にユーザの動きが変わるので、ログを分析し、次に効果が高い技術を考える 15
機械はミスをする 人間は優秀。機械では真似しきれない。 例:以下の文から、日本語の誤り箇所を探せ ちょっと、そのケーブルで貸して下さい 一度は紙と鉛筆を用意して問題を解こう どの位の精度が期待できるかを試そう。 例:リンゴを分類して、分類精度を得てみよう リンゴとみかんを分類 簡単すぎ 甘い赤リンゴと甘くない赤リンゴを分類 難しすぎる(世の中には、この分類をする仕事がある) 16
日本語の口語文テキストは難しい 難しい自然言語処理には間違えがつきもの。 多くの自然言語処理技術がもっている仮定 形態素解析器などによる分かち書き処理は100%うまくいく    実際には、100%うまくいくわけではない 多くの形態素解析器は新聞のような文書向けに調整済み ブログやTwitterの文書は新聞テキストより解析が難しい そのため、形態素解析以降の処理にエラーが出てくる 多少の間違えは許容しよう。気にしないこと 17
データは自前で集め、自前で持つ データを自分で収集しなかった場合 他人がデータに何か処理を行なっていた場合に困ることがある デーやを自前で持っていなかった場合 ある日、他社が提供するAPIが止まるとサービスが続行できなくなる データをネットワーク越しに利用している場合 頻繁なデータ転送に時間を食ってしまう データが超巨大な場合は解決できないので諦めて良い 理想:言語処理用データは計算機のローカルディスクに置く 自然言語処理をすると必ず意外に長い処理時間がかかる。 自然言語処理はアプリケーションのメイン処理ではない ソートとか正規化とか、事前にできることは全て事前にやっておく 18
Webサービスと自然言語処理 いざ実践!! 19
自然言語処理は最初は意外と簡単 自然言語処理は Webサービスを盛り上げるスパイス、と考えてみよう 塩やコショウのようなもの。 何かを始められるかどうかの目安 自分の計算機上で形態素解析器を動かして、何かの文書における単語の出現頻度をカウントできる 技術を使いこなすことや、オリジナル手法を考えようとすると、難易度が飛躍的に上がる 最初は Web API やライブラリを利用すればOK 試作は Perl でサクッと作ればOK 20
課題を見つけてチャレンジする データの獲得手法 自社・他社が提供するAPIを使用 他社からデータを購入・提供 自社で独自にデータ収集 データ処理の手法 自社・他社が提供するAPIを使用 コンピュータを用意。ライブラリをインストール・使用 自分でライブラリを開発 21
Webサービスにありがちな悩み サイト内のユーザ回遊性を高めたい データはある。だけど、検索できない 単語Aと単語Bって一緒にならないの? ユーザが全アイテムを見てくれない ソートの順序が気にいらない データにカテゴリ的なものを付けたい -> これらの問題は導入が簡単で効果も高い 22
0/7 23
Web API を使って問題解決 もう皆さん飽きてますよね。 他の方が沢山プレゼンをしてるはずなのでググってください。 個人的には、他者が提供しているAPIへの依存を減らした方が良いと思います。 24
1/7 25
サイト内のユーザ回遊性を高めたい-> 『レコメンド』 あるユーザの興味をひきそうな「アイテム」や「ユーザ」を推薦 アイテムの例:商品、Webページ、芸能人など 2つの手法がある コンテンツベース 「アイテム」が持つ情報から類似する「アイテム」を探す 協調フィルタリング 「情報」と「ユーザの行動」の関係から類似度を計算 ユーザを推薦 アイテム空間に基づき高類似度のユーザを抽出 アイテムを推薦 ユーザ空間に基づき高類似度のアイテムを抽出 26
例:Twitterのお気に入りレコメンド(1/2)- 協調フィルタリングでアイテム空間に基づきユーザを推薦 - ユーザ 1 : 発言 A、発言 B、発言 C … ユーザ 2 : 発言A、発言 D、発言 G …    ユーザ 3 : 発言 E、発言 F、発言G …  ユーザ 4 : 発言 B、発言 G、発言I …  ユーザ 5 : 発言 C、発言 G、発言I …  ユーザ 5 : 発言 O、発言 R、発言 Z …  27
例:Twitterのお気に入りレコメンド(2/2)- 協調フィルタリングでアイテム空間に基づきユーザを推薦 - あなた : 発言 B、発言 C、発言 G … ユーザ 1 : 発言A、発言 B、発言 C …     ユーザ 4 : 発言 B、発言 G、発言 I … ユーザ 4 : 発言 C、発言 G、発言 I … 28 ,[object Object]
ユーザ 2 : 発言 A、発言 D、発言 G …
ユーザ 3 : 発言 E、発言 F、発言 G …
ユーザ 4 : 発言 B、発言 G、発言 I …
ユーザ 5 : 発言 C、発言 G、発言 I …
ユーザ 6 : 発言 O、発言 R、発言 Z …お気に入りが  共通している ユーザを抽出
例:はてなブックマークの関連エントリー 29
CPANモジュールの例Algorithm::NaiveBayes 30 実行結果 --- 'ユーザ1 : 0.935928608918598' --- 'ユーザ3 : 0.263229921258356' --- 'ユーザ2 : 0.233982152229649'
2/7 31
データはある。だけど検索できない。=>  まよわず「検索機能をつける」 迷わず「検索」機能をつけよう もし「全文検索を実現する技術者がいない」なら SitemapをGoogleに登録しよう。 それ以外 自前で検索ライブラリを導入する。 or 外注する。 もし「検索機能の設置で損なわれる価値がない」なら 即リリースしよう。 個人が特定されて困る種類の情報もある クレームが来そうなら、検索できない方が良いかも 例:Twitterの発言に性別を推定したタグを付けたデータ 32
3/7 33
単語Aと単語Bって一緒にならないの?=> 「正規化・データクレンジング・名寄せ」では 「正規化・データクレンジング・名寄せ」が必要な例 全角半角とかグチャグチャ 送り仮名の振り方がバラバラ 一部の記号が邪魔 複数のフォーマットが混在している 旧漢字と新漢字が混ざってる 文字コードがサービスごとにちがう ユーザが商品名に余計な文字や記号を付ける。 活用がちょっと違う動詞をまとめたい 要するに、どういう場合に困るの?  (発音がほぼ同じ && 意味がほぼ同じ)だが、文字の表層が違う 34
例:電話番号っぽい数字 例:電話番号 「0120345678」と「0120(34)5678」は 同じ番号? そもそも、電話番号として使える? CPANモジュール「Number::Phone::JP」を使う 事前に記号をヒントに番号を切り分けたり、番号を桁数をヒントに切り分けたりする 判定の結果vaildなだったら0120-34-5678に束ねる => 戦略:『信用して大丈夫かをチェックして、代表表記を決めて、代表表記に紐づける』ことを自動化する 人手は最強だが、均質な作業を高速には行なえない 35
表記を揃える手順の例 データを調査する 処理するデータに特有な傾向をつかむ 特有のフォーマット、や、同じ意味の異なる表記 英数字や記号や全角半角文字を揃える 半角または全角にそろえる 不要な文字を消す 代表となる表記を決める データに特有な同じ意味を表す表現を代表表記に揃える 例:住所 => 「1-2-3」と「1丁目2番地3号」 代表表記との文字列類似度が自分で決めた閾値以上ならまとめる 再び人間がデータを調査。処理全体を洗練する。 36
4/7 37
サイト内のユーザ回遊性を高めたい-> 『アンカーテキスト化』 手法 あらかじめ辞書にキーワードを登録 テキストに辞書中のキーワードが含まれていたらアンカーテキスト化する 例:はてなのキーワードリンク 38
CPANモジュールの例Text::Darts 39 --- 今日は<a href="http://www.google.co.jp/search?ie=UTF-8&q=YAPC">YAPC</a> に<a href="http://www.google.co.jp/search?ie=UTF-8&q=NLP">NLP</a> のことを話に来たが、<a href="http://www.google.co.jp/search?ie=UTF-8&q=大丈夫">大丈夫</a> か。
5/7 40
ユーザが全アイテムを見てくれない=> 『ランダム表示』してログを観察 たとえば? ソート結果のランク外の候補をランダムで混ぜる しばらく運用してクリックスルーログをためる より多くクリックされる候補をソート結果に混ぜる どういうとこで使われてるの? 「検索エンジンの検索結果」や「広告」の精度向上 具体的な手法の例 「N本腕バンディット問題」というキーワードから 41
6/7 42
出力結果の順番が気に入らない-> 『ソート方法』を変えてはどうか ユーザに示すアイテムをソートする順序 利便性に直結する どうやるのか 日付や値段など、「とある属性の昇順降順」 頻度 人気度、回数 確率 例:お気に入り数 / ページビュー数 機械学習技術で並び順を学習 43
例:ショッピングサイトの検索 楽天市場 Amazon 44
例:クックパッドのプレミアムサービス(月294円) 45
例:食べログのiPhone版 46 ,[object Object]
PC版:今のところ無料
有料化時に話題になった
食べログがユーザの評価に関係なくログを集計して算出した注目順の方を有料化すべきだった?,[object Object]
Algorithm::SVMLightのRanking SVMsのサンプルデータ 学習データ 順位 事例セットのID 素性1:スコア 素性2:スコア …. テストデータ 未知の事例セットのID 48
7/7 49
データにカテゴリ的なものを付けたい=>「分類」か「クラスタリング」 分類 事前に各データにカテゴリ付けしたデータ集合を用意 用意したデータを教師データとして分類器を学習 => 分類器で、未知のデータを分類しカテゴリ名をつける   クラスタリング データを近いものから結合してデータの塊をつくっていく 事前に指定した数、ルールから導かれる結合を達成した時点で計算終了 => 出来上がった塊に、なんとかしてカテゴリをつける。   辞書マッチ カテゴリ辞書を作っておいて、マッチしたらカテゴリをつける。 50
文書分類の概要の例 欲しいカテゴリごとに分類された文書集合を用意 機械学習器に学習させる 新しい文書を学習させた機械学習器で判定する 51 中華 和食 洋食 カレー モデルファイル 和食 洋食 素性(そせい)抽出 して学習させる 学習した 中華 カレー 疲れた:1 中華:1 暑い:1 食欲:1 昨日の 自分の Twitter カレー? 素性抽出 判定させる
文書クラスタリング概要の例 事前に文書集合を何個に分けるか考えておく 抽出した素性(そせい)が近い文書をまとめる まとめる時に一番寄与した特徴でラベル付け 52 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 文書 Perl                                Ruby                              PHP                               C++            Python
どんなときに嬉しい?例1:キーワード検索で見つからないデータ Amazonで「アルゴリズム」に関する新刊が欲しい カテゴリ選択で候補数を減らす。 上位のものから探す 53

Weitere ähnliche Inhalte

Was ist angesagt?

企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)Yuya Unno
 
ゼロから始める自然言語処理 【FIT2016チュートリアル】
ゼロから始める自然言語処理 【FIT2016チュートリアル】ゼロから始める自然言語処理 【FIT2016チュートリアル】
ゼロから始める自然言語処理 【FIT2016チュートリアル】Yuki Arase
 
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」 [最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」 Yuki Arase
 
子供の言語獲得と機械の言語獲得
子供の言語獲得と機械の言語獲得子供の言語獲得と機械の言語獲得
子供の言語獲得と機械の言語獲得Yuya Unno
 
言語資源と付き合う
言語資源と付き合う言語資源と付き合う
言語資源と付き合うYuya Unno
 
ピーFIの研究開発現場
ピーFIの研究開発現場ピーFIの研究開発現場
ピーFIの研究開発現場Yuya Unno
 
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会Yuya Unno
 
研究・企業・生き方について 情報科学若手の会2011
研究・企業・生き方について 情報科学若手の会2011研究・企業・生き方について 情報科学若手の会2011
研究・企業・生き方について 情報科学若手の会2011Preferred Networks
 
Tensor flow勉強会 (ayashiminagaranotensorflow)
Tensor flow勉強会 (ayashiminagaranotensorflow)Tensor flow勉強会 (ayashiminagaranotensorflow)
Tensor flow勉強会 (ayashiminagaranotensorflow)tak9029
 
[旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」 [旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」 Yuki Arase
 
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning AlgorithmICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning AlgorithmYuya Unno
 
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理Preferred Networks
 
深層学習フレームワークChainerの特徴
深層学習フレームワークChainerの特徴深層学習フレームワークChainerの特徴
深層学習フレームワークChainerの特徴Yuya Unno
 
Lt python腕試しネタ
Lt python腕試しネタLt python腕試しネタ
Lt python腕試しネタkiwofusi
 
Jenkins によるレポートスクリプト管理
Jenkins によるレポートスクリプト管理Jenkins によるレポートスクリプト管理
Jenkins によるレポートスクリプト管理Tatsuya Tojima
 
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生Toshihiko Yamasaki
 

Was ist angesagt? (18)

企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
 
ゼロから始める自然言語処理 【FIT2016チュートリアル】
ゼロから始める自然言語処理 【FIT2016チュートリアル】ゼロから始める自然言語処理 【FIT2016チュートリアル】
ゼロから始める自然言語処理 【FIT2016チュートリアル】
 
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」 [最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[最新版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
 
子供の言語獲得と機械の言語獲得
子供の言語獲得と機械の言語獲得子供の言語獲得と機械の言語獲得
子供の言語獲得と機械の言語獲得
 
言語資源と付き合う
言語資源と付き合う言語資源と付き合う
言語資源と付き合う
 
ピーFIの研究開発現場
ピーFIの研究開発現場ピーFIの研究開発現場
ピーFIの研究開発現場
 
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
 
研究・企業・生き方について 情報科学若手の会2011
研究・企業・生き方について 情報科学若手の会2011研究・企業・生き方について 情報科学若手の会2011
研究・企業・生き方について 情報科学若手の会2011
 
Tensor flow勉強会 (ayashiminagaranotensorflow)
Tensor flow勉強会 (ayashiminagaranotensorflow)Tensor flow勉強会 (ayashiminagaranotensorflow)
Tensor flow勉強会 (ayashiminagaranotensorflow)
 
[旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」 [旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
[旧版] JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
 
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning AlgorithmICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
 
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理
 
深層学習フレームワークChainerの特徴
深層学習フレームワークChainerの特徴深層学習フレームワークChainerの特徴
深層学習フレームワークChainerの特徴
 
Lt python腕試しネタ
Lt python腕試しネタLt python腕試しネタ
Lt python腕試しネタ
 
Rでダイエット
RでダイエットRでダイエット
Rでダイエット
 
Jenkins によるレポートスクリプト管理
Jenkins によるレポートスクリプト管理Jenkins によるレポートスクリプト管理
Jenkins によるレポートスクリプト管理
 
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
【FIT2016チュートリアル】ここから始める情報処理 ~音声編~ by 東工大・篠崎先生
 
内省するTensorFlow
内省するTensorFlow内省するTensorFlow
内省するTensorFlow
 

Andere mochten auch

Keeping TABS Q2. 2011 (trends+anthropology+behaviour+strategy)
Keeping TABS Q2. 2011 (trends+anthropology+behaviour+strategy)Keeping TABS Q2. 2011 (trends+anthropology+behaviour+strategy)
Keeping TABS Q2. 2011 (trends+anthropology+behaviour+strategy)Canvas8
 
『伝達したい情報を構造化し表現する技術』教育の実践
『伝達したい情報を構造化し表現する技術』教育の実践『伝達したい情報を構造化し表現する技術』教育の実践
『伝達したい情報を構造化し表現する技術』教育の実践Kazuo Kashima
 
Topical keyphrase extraction from twitter
Topical keyphrase extraction from twitterTopical keyphrase extraction from twitter
Topical keyphrase extraction from twitterShunsuke Kozawa
 
Joint inference of named entity recognition and normalization for tweets
Joint inference of named entity recognition and normalization for tweetsJoint inference of named entity recognition and normalization for tweets
Joint inference of named entity recognition and normalization for tweetsShunsuke Kozawa
 
はてなブックマークのシステムについて
はてなブックマークのシステムについてはてなブックマークのシステムについて
はてなブックマークのシステムについてNaoya Ito
 
業務効率化のためのエクセルのアイデア 20151112
業務効率化のためのエクセルのアイデア 20151112業務効率化のためのエクセルのアイデア 20151112
業務効率化のためのエクセルのアイデア 20151112shin tanaka
 
2015年10月度スパイス・パークのアップデート計画
2015年10月度スパイス・パークのアップデート計画2015年10月度スパイス・パークのアップデート計画
2015年10月度スパイス・パークのアップデート計画Tsuyoshi Horigome
 
貯金エクササイズ
貯金エクササイズ貯金エクササイズ
貯金エクササイズTakuya Komatsu
 
貯金エクササイズその後
貯金エクササイズその後貯金エクササイズその後
貯金エクササイズその後Takuya Komatsu
 
仕様記述言語の中の関数
仕様記述言語の中の関数仕様記述言語の中の関数
仕様記述言語の中の関数ardbeg1958
 
お金持ちはなぜタワーマンションに住むの?そのリスクは?
お金持ちはなぜタワーマンションに住むの?そのリスクは?お金持ちはなぜタワーマンションに住むの?そのリスクは?
お金持ちはなぜタワーマンションに住むの?そのリスクは?節約 社長
 
[20120410] @marqsの転職を祝うLT
[20120410] @marqsの転職を祝うLT[20120410] @marqsの転職を祝うLT
[20120410] @marqsの転職を祝うLTYoshifumi Yamaguchi
 
20140607 限界はどこにある?
20140607 限界はどこにある?20140607 限界はどこにある?
20140607 限界はどこにある?Runabout GIA
 
シンプル資産運用法
シンプル資産運用法シンプル資産運用法
シンプル資産運用法renny_29
 
日本を捨てた富裕層たち
日本を捨てた富裕層たち日本を捨てた富裕層たち
日本を捨てた富裕層たちyorihiko katou
 
家計簿習慣化支援サービス ~エロい家計簿~
家計簿習慣化支援サービス ~エロい家計簿~家計簿習慣化支援サービス ~エロい家計簿~
家計簿習慣化支援サービス ~エロい家計簿~Takuya Komatsu
 
0423mitsubishi
0423mitsubishi0423mitsubishi
0423mitsubishiloftwork
 
物欲家計簿プレゼン
物欲家計簿プレゼン物欲家計簿プレゼン
物欲家計簿プレゼンTakuya Komatsu
 
だいたいデジタルのライフログ
だいたいデジタルのライフログだいたいデジタルのライフログ
だいたいデジタルのライフログRyusuke Goto
 

Andere mochten auch (20)

Keeping TABS Q2. 2011 (trends+anthropology+behaviour+strategy)
Keeping TABS Q2. 2011 (trends+anthropology+behaviour+strategy)Keeping TABS Q2. 2011 (trends+anthropology+behaviour+strategy)
Keeping TABS Q2. 2011 (trends+anthropology+behaviour+strategy)
 
『伝達したい情報を構造化し表現する技術』教育の実践
『伝達したい情報を構造化し表現する技術』教育の実践『伝達したい情報を構造化し表現する技術』教育の実践
『伝達したい情報を構造化し表現する技術』教育の実践
 
Topical keyphrase extraction from twitter
Topical keyphrase extraction from twitterTopical keyphrase extraction from twitter
Topical keyphrase extraction from twitter
 
Joint inference of named entity recognition and normalization for tweets
Joint inference of named entity recognition and normalization for tweetsJoint inference of named entity recognition and normalization for tweets
Joint inference of named entity recognition and normalization for tweets
 
はてなブックマークのシステムについて
はてなブックマークのシステムについてはてなブックマークのシステムについて
はてなブックマークのシステムについて
 
業務効率化のためのエクセルのアイデア 20151112
業務効率化のためのエクセルのアイデア 20151112業務効率化のためのエクセルのアイデア 20151112
業務効率化のためのエクセルのアイデア 20151112
 
婚活メソッド
婚活メソッド婚活メソッド
婚活メソッド
 
2015年10月度スパイス・パークのアップデート計画
2015年10月度スパイス・パークのアップデート計画2015年10月度スパイス・パークのアップデート計画
2015年10月度スパイス・パークのアップデート計画
 
貯金エクササイズ
貯金エクササイズ貯金エクササイズ
貯金エクササイズ
 
貯金エクササイズその後
貯金エクササイズその後貯金エクササイズその後
貯金エクササイズその後
 
仕様記述言語の中の関数
仕様記述言語の中の関数仕様記述言語の中の関数
仕様記述言語の中の関数
 
お金持ちはなぜタワーマンションに住むの?そのリスクは?
お金持ちはなぜタワーマンションに住むの?そのリスクは?お金持ちはなぜタワーマンションに住むの?そのリスクは?
お金持ちはなぜタワーマンションに住むの?そのリスクは?
 
[20120410] @marqsの転職を祝うLT
[20120410] @marqsの転職を祝うLT[20120410] @marqsの転職を祝うLT
[20120410] @marqsの転職を祝うLT
 
20140607 限界はどこにある?
20140607 限界はどこにある?20140607 限界はどこにある?
20140607 限界はどこにある?
 
シンプル資産運用法
シンプル資産運用法シンプル資産運用法
シンプル資産運用法
 
日本を捨てた富裕層たち
日本を捨てた富裕層たち日本を捨てた富裕層たち
日本を捨てた富裕層たち
 
家計簿習慣化支援サービス ~エロい家計簿~
家計簿習慣化支援サービス ~エロい家計簿~家計簿習慣化支援サービス ~エロい家計簿~
家計簿習慣化支援サービス ~エロい家計簿~
 
0423mitsubishi
0423mitsubishi0423mitsubishi
0423mitsubishi
 
物欲家計簿プレゼン
物欲家計簿プレゼン物欲家計簿プレゼン
物欲家計簿プレゼン
 
だいたいデジタルのライフログ
だいたいデジタルのライフログだいたいデジタルのライフログ
だいたいデジタルのライフログ
 

Ähnlich wie Perl で自然言語処理

言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyo言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyoShuyo Nakatani
 
おとなのテキストマイニング
おとなのテキストマイニングおとなのテキストマイニング
おとなのテキストマイニングMunenori Sugimura
 
音声認識超比較、各社コグニティブサービス全部入り
音声認識超比較、各社コグニティブサービス全部入り音声認識超比較、各社コグニティブサービス全部入り
音声認識超比較、各社コグニティブサービス全部入りtakuino
 
MAごころを、君に - #7 ChatGPT勉強会(2023-03-28)
MAごころを、君に - #7 ChatGPT勉強会(2023-03-28)MAごころを、君に - #7 ChatGPT勉強会(2023-03-28)
MAごころを、君に - #7 ChatGPT勉強会(2023-03-28)Webpla LLC.
 
SQLアンチパターン - 開発者を待ち受ける25の落とし穴
SQLアンチパターン - 開発者を待ち受ける25の落とし穴SQLアンチパターン - 開発者を待ち受ける25の落とし穴
SQLアンチパターン - 開発者を待ち受ける25の落とし穴Takuto Wada
 
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発Eric Sartre
 
Wacode5thでのpython講義資料
Wacode5thでのpython講義資料Wacode5thでのpython講義資料
Wacode5thでのpython講義資料丈 宮本
 
Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」tokyorgirls
 
はじめてのテスト技法
はじめてのテスト技法はじめてのテスト技法
はじめてのテスト技法Tatsuya Saito
 
Pythonで自然言語処理
Pythonで自然言語処理Pythonで自然言語処理
Pythonで自然言語処理moai kids
 
R勉強会20140421.upload
R勉強会20140421.uploadR勉強会20140421.upload
R勉強会20140421.uploadHiromi Matsumae
 
Jubatusにおける機械学習のテスト@MLCT
Jubatusにおける機械学習のテスト@MLCTJubatusにおける機械学習のテスト@MLCT
Jubatusにおける機械学習のテスト@MLCTYuya Unno
 
気の合う人達と社外で社内勉強会
気の合う人達と社外で社内勉強会気の合う人達と社外で社内勉強会
気の合う人達と社外で社内勉強会Yu Shibatsuji
 
mypy - 待望のPython3.9型ヒント対応
mypy - 待望のPython3.9型ヒント対応mypy - 待望のPython3.9型ヒント対応
mypy - 待望のPython3.9型ヒント対応KyutatsuNishiura
 
超絶技巧プログラミングと Ruby 3.0 (大江戸 Ruby 会議 05 コミッタ LT)
超絶技巧プログラミングと Ruby 3.0 (大江戸 Ruby 会議 05 コミッタ LT)超絶技巧プログラミングと Ruby 3.0 (大江戸 Ruby 会議 05 コミッタ LT)
超絶技巧プログラミングと Ruby 3.0 (大江戸 Ruby 会議 05 コミッタ LT)mametter
 
Alteryx UG3 LT #alteryx_ug
Alteryx UG3 LT #alteryx_ugAlteryx UG3 LT #alteryx_ug
Alteryx UG3 LT #alteryx_ug__john_smith__
 
さくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッションさくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッションantibayesian 俺がS式だ
 

Ähnlich wie Perl で自然言語処理 (20)

言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyo言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyo
 
おとなのテキストマイニング
おとなのテキストマイニングおとなのテキストマイニング
おとなのテキストマイニング
 
音声認識超比較、各社コグニティブサービス全部入り
音声認識超比較、各社コグニティブサービス全部入り音声認識超比較、各社コグニティブサービス全部入り
音声認識超比較、各社コグニティブサービス全部入り
 
MAごころを、君に - #7 ChatGPT勉強会(2023-03-28)
MAごころを、君に - #7 ChatGPT勉強会(2023-03-28)MAごころを、君に - #7 ChatGPT勉強会(2023-03-28)
MAごころを、君に - #7 ChatGPT勉強会(2023-03-28)
 
YAPC::Asia2015
YAPC::Asia2015YAPC::Asia2015
YAPC::Asia2015
 
SQLアンチパターン - 開発者を待ち受ける25の落とし穴
SQLアンチパターン - 開発者を待ち受ける25の落とし穴SQLアンチパターン - 開発者を待ち受ける25の落とし穴
SQLアンチパターン - 開発者を待ち受ける25の落とし穴
 
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
 
Wacode5thでのpython講義資料
Wacode5thでのpython講義資料Wacode5thでのpython講義資料
Wacode5thでのpython講義資料
 
Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
 
はじめてのテスト技法
はじめてのテスト技法はじめてのテスト技法
はじめてのテスト技法
 
Pythonで自然言語処理
Pythonで自然言語処理Pythonで自然言語処理
Pythonで自然言語処理
 
R勉強会20140421.upload
R勉強会20140421.uploadR勉強会20140421.upload
R勉強会20140421.upload
 
Goをえらんだ理由
Goをえらんだ理由Goをえらんだ理由
Goをえらんだ理由
 
Jubatusにおける機械学習のテスト@MLCT
Jubatusにおける機械学習のテスト@MLCTJubatusにおける機械学習のテスト@MLCT
Jubatusにおける機械学習のテスト@MLCT
 
気の合う人達と社外で社内勉強会
気の合う人達と社外で社内勉強会気の合う人達と社外で社内勉強会
気の合う人達と社外で社内勉強会
 
mypy - 待望のPython3.9型ヒント対応
mypy - 待望のPython3.9型ヒント対応mypy - 待望のPython3.9型ヒント対応
mypy - 待望のPython3.9型ヒント対応
 
超絶技巧プログラミングと Ruby 3.0 (大江戸 Ruby 会議 05 コミッタ LT)
超絶技巧プログラミングと Ruby 3.0 (大江戸 Ruby 会議 05 コミッタ LT)超絶技巧プログラミングと Ruby 3.0 (大江戸 Ruby 会議 05 コミッタ LT)
超絶技巧プログラミングと Ruby 3.0 (大江戸 Ruby 会議 05 コミッタ LT)
 
Alteryx UG3 LT #alteryx_ug
Alteryx UG3 LT #alteryx_ugAlteryx UG3 LT #alteryx_ug
Alteryx UG3 LT #alteryx_ug
 
さくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッションさくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッション
 
Tokyo r30 beginner
Tokyo r30 beginnerTokyo r30 beginner
Tokyo r30 beginner
 

Perl で自然言語処理