Suche senden
Hochladen
概観テキストマイニング
•
10 gefällt mir
•
4,629 views
tod esking
Folgen
さくさくテキストマイニング#2にて発表
Weniger lesen
Mehr lesen
Technologie
Melden
Teilen
Melden
Teilen
1 von 51
Empfohlen
精神論によるいきいきとした組織づくりのご提案
精神論によるいきいきとした組織づくりのご提案
tod esking
自動テストとJenkinsの活用 公開版
自動テストとJenkinsの活用 公開版
baroqueworksdev
小規模開発のためのタスク管理 「Trello」を上手に使うための 3つのくふう
小規模開発のためのタスク管理 「Trello」を上手に使うための 3つのくふう
Tomokatsu Iguchi
勉強会を始めるまで #java_ja
勉強会を始めるまで #java_ja
Go Sueyoshi (a.k.a sue445)
チラ見せ♡ナイト@20150410 LT公開用
チラ見せ♡ナイト@20150410 LT公開用
Keisuke Utsumi
第11回モヤLT 男女ペアプログラミング合コンに行ってきた
第11回モヤLT 男女ペアプログラミング合コンに行ってきた
take4_k
ペアプログラミング ホントのところ
ペアプログラミング ホントのところ
Takuto Wada
【初心者向け】Go言語勉強会資料
【初心者向け】Go言語勉強会資料
Yuji Otani
Empfohlen
精神論によるいきいきとした組織づくりのご提案
精神論によるいきいきとした組織づくりのご提案
tod esking
自動テストとJenkinsの活用 公開版
自動テストとJenkinsの活用 公開版
baroqueworksdev
小規模開発のためのタスク管理 「Trello」を上手に使うための 3つのくふう
小規模開発のためのタスク管理 「Trello」を上手に使うための 3つのくふう
Tomokatsu Iguchi
勉強会を始めるまで #java_ja
勉強会を始めるまで #java_ja
Go Sueyoshi (a.k.a sue445)
チラ見せ♡ナイト@20150410 LT公開用
チラ見せ♡ナイト@20150410 LT公開用
Keisuke Utsumi
第11回モヤLT 男女ペアプログラミング合コンに行ってきた
第11回モヤLT 男女ペアプログラミング合コンに行ってきた
take4_k
ペアプログラミング ホントのところ
ペアプログラミング ホントのところ
Takuto Wada
【初心者向け】Go言語勉強会資料
【初心者向け】Go言語勉強会資料
Yuji Otani
Hokkaido.pm #11
Hokkaido.pm #11
moznion
kintone Cafe Tokyo vol.5/ultra fast recovery
kintone Cafe Tokyo vol.5/ultra fast recovery
Takahiro Kubo
(未発表) JavaScriptテスト勉強会@福岡#0の前に考えていたこと
(未発表) JavaScriptテスト勉強会@福岡#0の前に考えていたこと
Kohki Nakashima
Enshu1
Enshu1
sudahiroshi
TDD のこころ @ OSH2014
TDD のこころ @ OSH2014
Takuto Wada
発見から納品へ
発見から納品へ
You&I
Bottle使ってPython学習一緒にはじめませんか?
Bottle使ってPython学習一緒にはじめませんか?
Tatsuya Shinozuka
並列プログラミング入門!&おさらい!
並列プログラミング入門!&おさらい!
道化師 堂華
おばかアプリ勉強会資料 マイクロソフト
おばかアプリ勉強会資料 マイクロソフト
atmarkit
非同期プログラミング養成ギブスとしてのNode.js
非同期プログラミング養成ギブスとしてのNode.js
Tajima Itsuro
ど素人向け エンジニア勉強会
ど素人向け エンジニア勉強会
YukiIwasaki2764
PFIセミナー 2013/02/28 「プログラミング言語の今」
PFIセミナー 2013/02/28 「プログラミング言語の今」
Preferred Networks
アラフォーでプログラミングをはじめて思ったこと
アラフォーでプログラミングをはじめて思ったこと
hide ogawa
俺とInstant team building
俺とInstant team building
Masayuki KaToH
私なりのGo言語のご紹介
私なりのGo言語のご紹介
Ryuji Iwata
デ部会 プロトタイプ
デ部会 プロトタイプ
Nobuhiko Futagami
20200803 プログラミングの基礎
20200803 プログラミングの基礎
Hikaru Tanaka
ペアプロのオイシイ料理法、おしえます。
ペアプロのオイシイ料理法、おしえます。
takepu
プログラミング手法について調べてみた
プログラミング手法について調べてみた
OgataAyaka
Windowsアプリテスト自動化 [Friendly+delphi]
Windowsアプリテスト自動化 [Friendly+delphi]
Tatsuya Ishikawa
「レガシーコード」とはいったい?
「レガシーコード」とはいったい?
Hiroyuki Ohnaka
仕様変更で死なないためのユニットテスト
仕様変更で死なないためのユニットテスト
tod esking
Weitere ähnliche Inhalte
Was ist angesagt?
Hokkaido.pm #11
Hokkaido.pm #11
moznion
kintone Cafe Tokyo vol.5/ultra fast recovery
kintone Cafe Tokyo vol.5/ultra fast recovery
Takahiro Kubo
(未発表) JavaScriptテスト勉強会@福岡#0の前に考えていたこと
(未発表) JavaScriptテスト勉強会@福岡#0の前に考えていたこと
Kohki Nakashima
Enshu1
Enshu1
sudahiroshi
TDD のこころ @ OSH2014
TDD のこころ @ OSH2014
Takuto Wada
発見から納品へ
発見から納品へ
You&I
Bottle使ってPython学習一緒にはじめませんか?
Bottle使ってPython学習一緒にはじめませんか?
Tatsuya Shinozuka
並列プログラミング入門!&おさらい!
並列プログラミング入門!&おさらい!
道化師 堂華
おばかアプリ勉強会資料 マイクロソフト
おばかアプリ勉強会資料 マイクロソフト
atmarkit
非同期プログラミング養成ギブスとしてのNode.js
非同期プログラミング養成ギブスとしてのNode.js
Tajima Itsuro
ど素人向け エンジニア勉強会
ど素人向け エンジニア勉強会
YukiIwasaki2764
PFIセミナー 2013/02/28 「プログラミング言語の今」
PFIセミナー 2013/02/28 「プログラミング言語の今」
Preferred Networks
アラフォーでプログラミングをはじめて思ったこと
アラフォーでプログラミングをはじめて思ったこと
hide ogawa
俺とInstant team building
俺とInstant team building
Masayuki KaToH
私なりのGo言語のご紹介
私なりのGo言語のご紹介
Ryuji Iwata
デ部会 プロトタイプ
デ部会 プロトタイプ
Nobuhiko Futagami
20200803 プログラミングの基礎
20200803 プログラミングの基礎
Hikaru Tanaka
ペアプロのオイシイ料理法、おしえます。
ペアプロのオイシイ料理法、おしえます。
takepu
プログラミング手法について調べてみた
プログラミング手法について調べてみた
OgataAyaka
Windowsアプリテスト自動化 [Friendly+delphi]
Windowsアプリテスト自動化 [Friendly+delphi]
Tatsuya Ishikawa
Was ist angesagt?
(20)
Hokkaido.pm #11
Hokkaido.pm #11
kintone Cafe Tokyo vol.5/ultra fast recovery
kintone Cafe Tokyo vol.5/ultra fast recovery
(未発表) JavaScriptテスト勉強会@福岡#0の前に考えていたこと
(未発表) JavaScriptテスト勉強会@福岡#0の前に考えていたこと
Enshu1
Enshu1
TDD のこころ @ OSH2014
TDD のこころ @ OSH2014
発見から納品へ
発見から納品へ
Bottle使ってPython学習一緒にはじめませんか?
Bottle使ってPython学習一緒にはじめませんか?
並列プログラミング入門!&おさらい!
並列プログラミング入門!&おさらい!
おばかアプリ勉強会資料 マイクロソフト
おばかアプリ勉強会資料 マイクロソフト
非同期プログラミング養成ギブスとしてのNode.js
非同期プログラミング養成ギブスとしてのNode.js
ど素人向け エンジニア勉強会
ど素人向け エンジニア勉強会
PFIセミナー 2013/02/28 「プログラミング言語の今」
PFIセミナー 2013/02/28 「プログラミング言語の今」
アラフォーでプログラミングをはじめて思ったこと
アラフォーでプログラミングをはじめて思ったこと
俺とInstant team building
俺とInstant team building
私なりのGo言語のご紹介
私なりのGo言語のご紹介
デ部会 プロトタイプ
デ部会 プロトタイプ
20200803 プログラミングの基礎
20200803 プログラミングの基礎
ペアプロのオイシイ料理法、おしえます。
ペアプロのオイシイ料理法、おしえます。
プログラミング手法について調べてみた
プログラミング手法について調べてみた
Windowsアプリテスト自動化 [Friendly+delphi]
Windowsアプリテスト自動化 [Friendly+delphi]
Andere mochten auch
「レガシーコード」とはいったい?
「レガシーコード」とはいったい?
Hiroyuki Ohnaka
仕様変更で死なないためのユニットテスト
仕様変更で死なないためのユニットテスト
tod esking
貧者のための入力デバイス
貧者のための入力デバイス
tod esking
Nyandoc: Scaladoc/Javadoc to markdown converter
Nyandoc: Scaladoc/Javadoc to markdown converter
tod esking
レガシーコード改善のススメ
レガシーコード改善のススメ
Akira Hirasawa
レガシーコードとの付き合い方とテストでの話
レガシーコードとの付き合い方とテストでの話
H Iseri
Andere mochten auch
(6)
「レガシーコード」とはいったい?
「レガシーコード」とはいったい?
仕様変更で死なないためのユニットテスト
仕様変更で死なないためのユニットテスト
貧者のための入力デバイス
貧者のための入力デバイス
Nyandoc: Scaladoc/Javadoc to markdown converter
Nyandoc: Scaladoc/Javadoc to markdown converter
レガシーコード改善のススメ
レガシーコード改善のススメ
レガシーコードとの付き合い方とテストでの話
レガシーコードとの付き合い方とテストでの話
Ähnlich wie 概観テキストマイニング
サポーターズ勉強会スライド 2018/2/27
サポーターズ勉強会スライド 2018/2/27
Kensuke Mitsuzawa
職場で使用しているOSSの開発に参加してみた!
職場で使用しているOSSの開発に参加してみた!
infinite_loop
イケてない開発チームがイケてる開発を始めようとする軌跡
イケてない開発チームがイケてる開発を始めようとする軌跡
NTT Communications Technology Development
LIGでのDocker活用
LIGでのDocker活用
Hayashi Yuichi
Soramame.Block 100行のJavaScriptで ビジュアルプログラミング言語(のフロントエンド)を作ってみた:
Soramame.Block 100行のJavaScriptで ビジュアルプログラミング言語(のフロントエンド)を作ってみた:
Yutaka Kachi
ownCloudについて
ownCloudについて
Shinya Saita
20120927 findjob4 dev_ops
20120927 findjob4 dev_ops
ume3_
Generating word clouds in python
Generating word clouds in python
AyakaHonda1
オブジェクト指向プログラマが今関数型言語を学ばないといけない理由
オブジェクト指向プログラマが今関数型言語を学ばないといけない理由
Kohei Taniguchi
Prejob wordpress v2_1121
Prejob wordpress v2_1121
Shohei Aoyama
Prejob wordpress v2_1121
Prejob wordpress v2_1121
Shohei Aoyama
とりあえず30分でひととおり分かった気にはなれるアジャイル入門
とりあえず30分でひととおり分かった気にはなれるアジャイル入門
陽一 滝川
これからのOpenShiftの話をしよう
これからのOpenShiftの話をしよう
Kazuto Kusama
アジャイルソフトウェア開発の道具箱
アジャイルソフトウェア開発の道具箱
Koichi ITO
2006-04-22 CLR/H #14 .NET and open source
2006-04-22 CLR/H #14 .NET and open source
Yoshiyuki Nakamura
Caketest
Caketest
ryota ichie
俺がモデルだ!問題に立ち向かう
俺がモデルだ!問題に立ち向かう
Akira Suenami
ソフトウェア開発の現場風景
ソフトウェア開発の現場風景
Koichi ITO
どうしてプレゼン研究会を始めたのか
どうしてプレゼン研究会を始めたのか
Masahito Zembutsu
DevOpsが引き金となるインフラエンジニアの進撃
DevOpsが引き金となるインフラエンジニアの進撃
Teruo Adachi
Ähnlich wie 概観テキストマイニング
(20)
サポーターズ勉強会スライド 2018/2/27
サポーターズ勉強会スライド 2018/2/27
職場で使用しているOSSの開発に参加してみた!
職場で使用しているOSSの開発に参加してみた!
イケてない開発チームがイケてる開発を始めようとする軌跡
イケてない開発チームがイケてる開発を始めようとする軌跡
LIGでのDocker活用
LIGでのDocker活用
Soramame.Block 100行のJavaScriptで ビジュアルプログラミング言語(のフロントエンド)を作ってみた:
Soramame.Block 100行のJavaScriptで ビジュアルプログラミング言語(のフロントエンド)を作ってみた:
ownCloudについて
ownCloudについて
20120927 findjob4 dev_ops
20120927 findjob4 dev_ops
Generating word clouds in python
Generating word clouds in python
オブジェクト指向プログラマが今関数型言語を学ばないといけない理由
オブジェクト指向プログラマが今関数型言語を学ばないといけない理由
Prejob wordpress v2_1121
Prejob wordpress v2_1121
Prejob wordpress v2_1121
Prejob wordpress v2_1121
とりあえず30分でひととおり分かった気にはなれるアジャイル入門
とりあえず30分でひととおり分かった気にはなれるアジャイル入門
これからのOpenShiftの話をしよう
これからのOpenShiftの話をしよう
アジャイルソフトウェア開発の道具箱
アジャイルソフトウェア開発の道具箱
2006-04-22 CLR/H #14 .NET and open source
2006-04-22 CLR/H #14 .NET and open source
Caketest
Caketest
俺がモデルだ!問題に立ち向かう
俺がモデルだ!問題に立ち向かう
ソフトウェア開発の現場風景
ソフトウェア開発の現場風景
どうしてプレゼン研究会を始めたのか
どうしてプレゼン研究会を始めたのか
DevOpsが引き金となるインフラエンジニアの進撃
DevOpsが引き金となるインフラエンジニアの進撃
Kürzlich hochgeladen
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
Toru Tamaki
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Hiroki Ichikura
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
taisei2219
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
danielhu54
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
Toru Tamaki
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Yuma Ohgami
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
Ryo Sasaki
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
Toru Tamaki
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
sugiuralab
Kürzlich hochgeladen
(10)
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
概観テキストマイニング
1.
todesking
2.
おはようございます!!!
3.
この発表は何か 「テキストマイニング」なるプ ロセスを定義することにより、 その概観を皆さんに提示するこ とを試みます。
4.
第一部 自己紹介
5.
@todesking
6.
はてな:gnarl
7.
自己紹介 ●
@todesking ● Web系の受託やってる。 ● プライマリな興味の対象はソ フトウェア設計やソフトウェ ア開発プロセスなんだけど、 たぶん誰もそうは思ってない
8.
勤務先
9.
10.
発表者は何をしているか ウルトラテクノロジスト集団を 自称する怪しい企業でWeb系 の受託プロジェクトをやる Javaエンジニアです(主にバッ チ担当)。
11.
発表者は何をしているか 推薦エンジンをやってるチーム に属しており、テキストマイニ ング技術を応用したようなプロ ジェクトもたまにやる。使用言 語はJavaやRuby、ごくたまに Rなどを使用しております。
12.
よろしく おねがいします。
13.
第二部 本編
14.
テキストマイニング
15.
ホワット
16.
テキストマイニング
とは何か
17.
テキストマイニングと は、大量の、フリーテ キストを含むデータか ら、価値ある情報を取 り出すプロセスである
18.
テキストマイニングと は、大量の、フリーテ キストを含むデータか ら、価値ある情報を取 り出すプロセスである
19.
大量の http://www.flickr.com/photos/callumscott2/280532292/
20.
大量のデータ ●
人間ではハンドリングできない程 度に多いデータを相手にする ● 統計的手法はデータが多いほうが 有効 ● 計算機の出番 ● データマイニング!
21.
テキストマイニングと は、大量の、フリーテ キストを含むデータか ら、価値ある情報を取 り出すプロセスである
22.
http://www.flickr.com/photos/wrote/3551555637/
フリーテキスト
23.
フリーテキスト ●
自然言語による記述 ● 構造化されていないデータ ● さまざまなノイズ –表記ゆれ –未知の表現
24.
フリーテキスト ●
計算機で処理するには工夫 が必要 ● 前処理必須 ● 解析ミスがつきもの
25.
ならば、なぜ
26.
なぜフリーテキストなのか? ● データ量はパワーである ●
ノイズ混じりだが大量の データを入手可能 ● 事前に構造を規定しなくて いい
27.
http://www.flickr.com/photos/benstephenson/27533356/in/photostream
28.
http://www.flickr.com/photos/benstephenson/27533356/in/photostream 構造化されていない データを扱う技術が 必要である
29.
フリーテキストの構造を分析する ためにはさまざまな技術が存在す る。分かち書き分析、形態素解析 といった手段で最小構成単位を識 別し、それらの関係を複合語抽出 や係り受け解析で求め、あるいは データに特化したルールを使用す ることもできる。
30.
フリーテキストの
構造を分析する これはノイズとの戦いでもある。 ● 未知の用語 ● 誤記 ● 文法のバリエーション ● テーマの非統一
31.
問題は、いかにフリーテキ ストの構造を解釈すること である。うまい解釈ができ れば、あとはデータマイニ ングの道具を適用できる。
32.
テキストマイニングと は、大量の、フリーテ キストを含むデータか ら、価値ある情報を取 り出すプロセスである
33.
データ http://www.flickr.com/photos/teclasorg/2543197908/
34.
データ フリーテキストがデータのすべ てではない。日付、作者、タ グ、数量などの構造化された フィールドが組み合わさってい ることがあり、これらは分析の 際大きなヒントとなる。
35.
テキストマイニングと は、大量の、フリーテ キストを含むデータか ら、価値ある情報を取 り出すプロセスである
36.
情報 http://www.flickr.com/photos/thefangmonster/352461415/
37.
情報 属性間の相関や似たアイテムの 集合、あるいは全体の傾向な ど、大量のデータを適切に分析 して初めて見えてくるものがあ る。
38.
道具 クラスタリング、相関分析、頻 出パターン分析、トピック抽 出、分類、などなど。統計や データマイニングの分野にさま ざまな道具が蓄積されている。
39.
問題は道具をどのように使い、 結果をどう解釈するかにある。 元になったデータは不完全であ り、さまざまなノイズとバイア スがある。データと道具の性質 をよく理解し、なぜその結果に 至ったのか考えねばならない。
40.
テキストマイニングと は、大量の、フリーテ キストを含むデータか ら、価値ある情報を取 り出すプロセスである
41.
価値
http://www.flickr.com/photos/59937401@N07/5475014890/
42.
テキストマイニングのゴール は、他のいとなみと同じく、 価値を生むことである。
43.
価値ある情報は
行動の指針となる ● 仮説の検証ができる ● 意外性のある結論:「ビールとお むつ」 ● その情報は具体的なアクションに 結びつくか?
44.
テキストマイニングで
いかに価値を産むか ● その分析結果は、何を意味するの か? ● 次にすべき行動は? ● その行動は誰に、どのような価値 をもたらすのか?
45.
テキストマイニングと は、大量の、フリーテ キストを含むデータか ら、価値ある情報を取 り出すプロセスである
46.
プロセス
http://commons.wikimedia.org/wiki/File:Feedback_Loop.svg
47.
プロセス テキストマイニングは、それ自 体で完結するいとなみではな い。データをどこかから得る必 要があり、分析の結果は別の場 所で使われるだろう。
48.
テキストマイニングとは、より 大きなプロセスの一部である
49.
テキストマイニングの結果がただ ちに何らかの価値をもたらすこと は稀である。しかし、ビジネスプ ロセスへ分析結果をフィードバッ クすることでプロセス全体の価値 を向上することができる。
50.
フィードバックによる 価値の向上
51.
テキストマイニングとは、大量 の、フリーテキストを含むデータ から、価値ある情報を取り出すプ ロセスである。願わくば、あなた のテキストマイニングが誰かに価 値をもたらすことを。ご清聴あり がとうございました。