Suche senden
Hochladen
Wikipediaで位置情報のテキストマインニングっぽいことをやってみた 20121208
•
2 gefällt mir
•
7,287 views
真吾 森
Folgen
Melden
Teilen
Melden
Teilen
1 von 32
Jetzt herunterladen
Downloaden Sie, um offline zu lesen
Empfohlen
S09 t0 orientation
S09 t0 orientation
Takeshi Akutsu
S10 t1 spc_by_nowfromnow
S10 t1 spc_by_nowfromnow
Takeshi Akutsu
DBエンジニアに必要だったPythonのスキル
DBエンジニアに必要だったPythonのスキル
Satoshi Yamada
Py datameetup1
Py datameetup1
shiroyagi
Rとデータベース 第61回 Tokyo.R
Rとデータベース 第61回 Tokyo.R
Takashi Minoda
Electron + Mithril Async File Search
Electron + Mithril Async File Search
和晃 西澤
10分でわかるPythonの開発環境
10分でわかるPythonの開発環境
Hisao Soyama
『アジャイルデータサイエンス』1章 理論
『アジャイルデータサイエンス』1章 理論
Hisao Soyama
Empfohlen
S09 t0 orientation
S09 t0 orientation
Takeshi Akutsu
S10 t1 spc_by_nowfromnow
S10 t1 spc_by_nowfromnow
Takeshi Akutsu
DBエンジニアに必要だったPythonのスキル
DBエンジニアに必要だったPythonのスキル
Satoshi Yamada
Py datameetup1
Py datameetup1
shiroyagi
Rとデータベース 第61回 Tokyo.R
Rとデータベース 第61回 Tokyo.R
Takashi Minoda
Electron + Mithril Async File Search
Electron + Mithril Async File Search
和晃 西澤
10分でわかるPythonの開発環境
10分でわかるPythonの開発環境
Hisao Soyama
『アジャイルデータサイエンス』1章 理論
『アジャイルデータサイエンス』1章 理論
Hisao Soyama
Money forwardとりそなVISAデビットの関係を良くしたい
Money forwardとりそなVISAデビットの関係を良くしたい
真吾 森
Html5 canvasとgoogle maps apiで遊んでみた
Html5 canvasとgoogle maps apiで遊んでみた
真吾 森
最底辺から送る目指せ最底辺の振り返り #-0.5
最底辺から送る目指せ最底辺の振り返り #-0.5
真吾 森
[2011.09.17 Nagoya.pm #01]●●●でPerl
[2011.09.17 Nagoya.pm #01]●●●でPerl
真吾 森
[LT]UMLとCloudのススメ SP1
[LT]UMLとCloudのススメ SP1
真吾 森
いろんなCRuby on windows
いろんなCRuby on windows
真吾 森
[第38回FLOSS桜山勉強会]貧乏人のための仮想化Tips
[第38回FLOSS桜山勉強会]貧乏人のための仮想化Tips
真吾 森
Weitere ähnliche Inhalte
Mehr von 真吾 森
Money forwardとりそなVISAデビットの関係を良くしたい
Money forwardとりそなVISAデビットの関係を良くしたい
真吾 森
Html5 canvasとgoogle maps apiで遊んでみた
Html5 canvasとgoogle maps apiで遊んでみた
真吾 森
最底辺から送る目指せ最底辺の振り返り #-0.5
最底辺から送る目指せ最底辺の振り返り #-0.5
真吾 森
[2011.09.17 Nagoya.pm #01]●●●でPerl
[2011.09.17 Nagoya.pm #01]●●●でPerl
真吾 森
[LT]UMLとCloudのススメ SP1
[LT]UMLとCloudのススメ SP1
真吾 森
いろんなCRuby on windows
いろんなCRuby on windows
真吾 森
[第38回FLOSS桜山勉強会]貧乏人のための仮想化Tips
[第38回FLOSS桜山勉強会]貧乏人のための仮想化Tips
真吾 森
Mehr von 真吾 森
(7)
Money forwardとりそなVISAデビットの関係を良くしたい
Money forwardとりそなVISAデビットの関係を良くしたい
Html5 canvasとgoogle maps apiで遊んでみた
Html5 canvasとgoogle maps apiで遊んでみた
最底辺から送る目指せ最底辺の振り返り #-0.5
最底辺から送る目指せ最底辺の振り返り #-0.5
[2011.09.17 Nagoya.pm #01]●●●でPerl
[2011.09.17 Nagoya.pm #01]●●●でPerl
[LT]UMLとCloudのススメ SP1
[LT]UMLとCloudのススメ SP1
いろんなCRuby on windows
いろんなCRuby on windows
[第38回FLOSS桜山勉強会]貧乏人のための仮想化Tips
[第38回FLOSS桜山勉強会]貧乏人のための仮想化Tips
Wikipediaで位置情報のテキストマインニングっぽいことをやってみた 20121208
1.
Wikipediaで位置情報の
テキストマインニング っぽいことをやってみた Prototyping for Experimental Rapid implemented version of Location information application はてな id:babydaemons Twitter @babydaemons
2.
Self Introduction: ・ブラック系ITベンダの切り込み隊長 ・つい最近までプロジェクトが4スレッド並行稼働 ・Nagoya.pmしか活動してない。orz ・妻一人、息子一人 ・はてな
id:babydaemons ・Twitter @babydaemons ・その他 http://www.google.com/?q=babydaemons
3.
今日のお題: https://github.com/babydaemons/ p5-MediaWiki-DumpFile-Parse/
4.
Agenda: ・WikipediaのDBの提供って? ・そのデータってどう使うの? ・テキストマインニングって? ・その位置情報は何に使うの? ・まとめ
5.
Agenda: ・WikipediaのDBの提供って? ・そのデータってどう使うの? ・テキストマインニングって? ・その位置情報は何に使うの? ・まとめ
6.
jawiki-latest- pages-articles
.xml.bz2
7.
8.
*.xml.bz2 1.6GB *.xml
8.0GB
9.
EmacsやVimで 開くのは
10.
神業! Memory 16GB MacBook
Pro 所有の大先生
11.
Agenda: ・WikipediaのDBの提供って? ・そのデータってどう使うの? ・テキストマインニングって? ・その位置情報は何に使うの? ・まとめ
12.
Perl では
13.
MediaWiki::DumpFile::Pages
On CPAN
14.
Ruby では
15.
Faculty of Global
Communications, Doshisha University https://github.com/ yohasebe/wp2txt/
16.
貧民業
では? Memory 4GB MacBook Air 所有の大貧民
17.
https://github.com/babydaemons/
wikipedia-scipts/
18.
Agenda: ・WikipediaのDBの提供って? ・そのデータってどう使うの? ・テキストマインニングって? ・その位置情報は何に使うの? ・まとめ
19.
その対象: 緯度・経度 住所(日本語のみ)
20.
Agenda: ・WikipediaのDBの提供って? ・そのデータってどう使うの? ・テキストマインニングって? ・その位置情報は何に使うの? ・まとめ
21.
概要は テレビCMで!!
22.
23.
24.
25.
某社の 位置情報DBと Wikipedia記事 の紐付け
26.
Released on ガラケー!!
27.
PC/スマホ? お察し下さい
orz
28.
ちなみに プロダクトコードは
Java
29.
Perlは prototyping
30.
Javaで
プロト タイプ 出来ないん ですか? 関数型言語クラスタと テストクラスタの大家
31.
Agenda: ・WikipediaのDBの提供って? ・そのデータってどう使うの? ・テキストマインニングって? ・その位置情報は何に使うの? ・まとめ
32.
まとめ: ・Wikipediaのダンプ超デカっ! ・MySQL取り込み鬼門! ・生データなら楽チン! ・正規表現最強! ・詳細は夜の部で聞いてね! ・だれかMakefile.PMの書き方 教えてください。m(_ _)m
Jetzt herunterladen