SlideShare ist ein Scribd-Unternehmen logo
1 von 30
Downloaden Sie, um offline zu lesen
徐 聖博
第3回メドレー読書会
1
自己紹介
2
経歴
• 2014/04 - 2015/06
• グリー株式会社
• 2015/07 -
• 株式会社メドレー
• 2014/04 -
• ターゲットスポーツ(※ダーツメーカー)
3
http://2013.rl-competition.org/results
保有資格
ダーツプロライセンス
ジグソーパズル検定1級
大学院時代の研究
人工知能(進化計算)
ICML RL Competition 1位
第2部
特集1:機械学習ソフトウェアの概観
• R, Python, Julia, Spark MLlib...
➡ 第1章 開発が進む機械学習ソフトウェア
➡ 第2章 機械学習のソフトウェアを用いた実行例
➡ 第3章 機械学習ソフトウェア選択の指針
本日のメニュー(徐担当分)
4
読書会スタート!
5
6
特集1
機械学習ソフトウェアの概観
R, Python, Julia, Spark MLlib...
7
第1章
開発が進む機械学習ソフトウェア
機械学習ソフトウェアをめぐる動向
8
機械学習のソフトウェアをめぐる動向
9
機械学習アルゴリズム向けに、多くのソフトウェアがある
R, Python, Julia, Weka, RapidMiner, KNIME,
Orange, ELKI, Shogun, Apache Mahout,
Spark MLlib, Hivemall, Jubatus, Vowpal
Wabbit, Accord.NET Machine Learning,
SAS, MATLAB, SPSS...
データ分析者が使用するツールのアンケート結果
10 © 2015 技術評論社 データサイエンティスト養成読本 機械学習入門
本書で取り上げる機械学習ソフトウェアの概要
11
R
• データ解析の代表的なソフトウェア。基本的にオンメモリ処理なので、大
規模なデータを扱うのは難しい
Python
• 汎用的なスクリプト言語。Numpy, Scipy, scikit-learn, Pandasなどパッ
ケージ開発が進み、データ解析分野でも注目が集まっている
Julia
• 2012年に公開された科学計算のための新しい言語。期待が集まる
Apache Mahout
• Apache HadoopやApache Spark上で動作する機械学習ライブラリ。大
規模並列分散処理の草分け的存在
Spark MLlib
• Apache Spark上で動く機械学習ライブラリ。Sparkと共に、今後に注目
代表的なソフトウェアの概要
12
R
13
• 統計解析言語
• 統計解析、可視化、データ加工・変換など多岐に
わたる手法が即座に利用できる
⃝ 資料が最も潤沢にあるソフトウェア
☓ オンメモリで扱うため、大規模データに向かない
Python
14
• 汎用的なスクリプト言語
• package使用で機械学習アルゴリズムを実行可能
⃝ Webアプリケーションに機械学習を組込み易い
☓ Rほどパッケージが充実していない
Julia
15
• MITで開発されている計算機科学のソフトウェア
• 洗練された型システムと多重ディスパッチ
⃝ LLVMのjust-in-timeコンパイルによる高処理速度
⃝ 発展が期待される有望なプログラミング言語
☓ 発展途上のため、参考文献が少ない
Apache Mahout
16
• Apache HadoopやApache Spark上で動作する
機械学習ライブラリ
⃝ 大規模並列分散処理により機械学習を行える
☓ 反復処理に多大なコストが
Spark MLlib
17
• 分散処理エンジン(Apache Spark Core)を中心
に置き、ライブラリの充実させる方針
⃝ Sparkで利用できるライブラリも使える
☓ Scalaが辛い人は辛いかも(私見)
その他
18
Weka/RapidMiner/KNIME
• GUIによりデータ分析のフローを記述できる
Shogun
• 様々なカーネルのSVMを実装している
Hivemall
• Apache Hiveの関数で実装したライブラリ
クラウドサービス
• MicrosoftやAmazonのサービスが代表例
各ソフトウェアで実行可能なタスク
19
ソフトウェアがカバーする主要なタスク
20
© 2015 技術評論社 データサイエンティスト養成読本 機械学習入門
21
第2章
機械学習のソフトウェアを
用いた実行例
予測モデルの構築・評価
22
© 2015 技術評論社 データサイエンティスト養成読本 機械学習入門
予測モデルの構築・評価
23
混合行列:予測と実績のクラスレベルの組み合わせを集計した分割表
© 2015 技術評論社 データサイエンティスト養成読本 機械学習入門
予測モデルの構築・評価
24
正例
• 対象とするクラスに属するもの
負例
• 対象とするクラスに属さないもの
適合率 (Precision) = tp / (tp + fp)
• 正例と予測したもののうち、実際に正例の割合
予測モデルの構築・評価
25
再現率 (Recall) = tp / (tp + fn)
• 実際正例のうち、正例と予測したものの割合
F-値 (F value) = 2 / (1/適合率 + 1/再現率)
• 適合率と再現率の調和平均
正解率 (Accuracy) = (tp + tn) / (tp + fp + fn + tn)
• 正例と負例の両方で予測と実績が一致した割合
実際に動かして見よう!

https://github.com/shengbo-medley/
MiscForStudy/tree/master/20151201
26
27
第3章
機械学習ソフトウェア選択の指針
プログラミング経験が少ない場合はGUIツール
28
プログラミングの学習コストを低くしたい
• 機械学習やソフトウェアの学習と合わせると大変
GUIツールの積極的活用
• KNIMEやWekaなどはGUIがあり、便利(らしい)
プログラミングに抵抗がなければPythonかR
29
RやPythonはパッケージ/ライブラリ/マニュアルが豊富
• 高速化が必要な場合、Rは弱い
• Pythonの方が応用が広いイメージ
速度が求められるが、開発に時間が避けない場合はJulia
• 情報が少ないが、科学技術計算の高速化に向く
1台の計算機のメモリには収まらない規模の場合は
Spark MLlibやApache Mahout
• 最近はSparkが流行っているという印象がある
第2部特集1はここまで
30

Weitere ähnliche Inhalte

Ähnlich wie 第3回メドレー読書会前半

機械学習のマイクロサービスでの運用の実験について #mlops
機械学習のマイクロサービスでの運用の実験について #mlops機械学習のマイクロサービスでの運用の実験について #mlops
機械学習のマイクロサービスでの運用の実験について #mlopsHiroaki Kudo
 
Jag神戸3(共有用)
Jag神戸3(共有用)Jag神戸3(共有用)
Jag神戸3(共有用)takagig
 
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning AlgorithmICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning AlgorithmYuya Unno
 
今年のKDDベストペーパーを実装・公開しました
今年のKDDベストペーパーを実装・公開しました今年のKDDベストペーパーを実装・公開しました
今年のKDDベストペーパーを実装・公開しましたShohei Hido
 
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいことMLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいことRakuten Group, Inc.
 
高専キャリア ~アプリコンテストに独りで挑んだ「OnlyOne」の皆さん~
高専キャリア ~アプリコンテストに独りで挑んだ「OnlyOne」の皆さん~高専キャリア ~アプリコンテストに独りで挑んだ「OnlyOne」の皆さん~
高専キャリア ~アプリコンテストに独りで挑んだ「OnlyOne」の皆さん~KubotaHideya
 
[db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ
 [db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ [db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ
[db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれInsight Technology, Inc.
 
機械学習システムを受託開発 する時に気をつけておきたい事
機械学習システムを受託開発 する時に気をつけておきたい事機械学習システムを受託開発 する時に気をつけておきたい事
機械学習システムを受託開発 する時に気をつけておきたい事BrainPad Inc.
 
Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Shohei Hido
 
プロダクトマネージャのお仕事
プロダクトマネージャのお仕事プロダクトマネージャのお仕事
プロダクトマネージャのお仕事Shohei Hido
 
ROS JAPAN Users Group Meetup 04
ROS JAPAN Users Group Meetup 04ROS JAPAN Users Group Meetup 04
ROS JAPAN Users Group Meetup 04Daiki Maekawa
 
データビジュアライゼーションもくもく会
データビジュアライゼーションもくもく会データビジュアライゼーションもくもく会
データビジュアライゼーションもくもく会dsuke Takaoka
 
資格取得に向けての活動記録
資格取得に向けての活動記録資格取得に向けての活動記録
資格取得に向けての活動記録Kyohei Hamada
 
「ソフトウェア品質データ分析を通じた組織的改善の促進」ソフトウエアジャパン2014「ITフォーラムセッション」IPA/SEC データの分析に基づくシステム...
「ソフトウェア品質データ分析を通じた組織的改善の促進」ソフトウエアジャパン2014「ITフォーラムセッション」IPA/SEC データの分析に基づくシステム...「ソフトウェア品質データ分析を通じた組織的改善の促進」ソフトウエアジャパン2014「ITフォーラムセッション」IPA/SEC データの分析に基づくシステム...
「ソフトウェア品質データ分析を通じた組織的改善の促進」ソフトウエアジャパン2014「ITフォーラムセッション」IPA/SEC データの分析に基づくシステム...Makoto Nonaka
 
ディープラーニングでラーメン二郎(全店舗)を識別してみた
ディープラーニングでラーメン二郎(全店舗)を識別してみたディープラーニングでラーメン二郎(全店舗)を識別してみた
ディープラーニングでラーメン二郎(全店舗)を識別してみたknjcode
 
Supervised Machine Learning of Elastic Stack
Supervised Machine Learning of Elastic StackSupervised Machine Learning of Elastic Stack
Supervised Machine Learning of Elastic StackHiroshi Yoshioka
 
Kaggle の Titanic チュートリアルに挑戦した話
Kaggle の Titanic チュートリアルに挑戦した話Kaggle の Titanic チュートリアルに挑戦した話
Kaggle の Titanic チュートリアルに挑戦した話y-uti
 
Scikit learnで学ぶ機械学習入門
Scikit learnで学ぶ機械学習入門Scikit learnで学ぶ機械学習入門
Scikit learnで学ぶ機械学習入門Takami Sato
 
1時間で分かるSTA (Software Test Automation) #stac2014
1時間で分かるSTA (Software Test Automation) #stac20141時間で分かるSTA (Software Test Automation) #stac2014
1時間で分かるSTA (Software Test Automation) #stac2014Kazuhiro Suzuki
 

Ähnlich wie 第3回メドレー読書会前半 (20)

機械学習のマイクロサービスでの運用の実験について #mlops
機械学習のマイクロサービスでの運用の実験について #mlops機械学習のマイクロサービスでの運用の実験について #mlops
機械学習のマイクロサービスでの運用の実験について #mlops
 
Jag神戸3(共有用)
Jag神戸3(共有用)Jag神戸3(共有用)
Jag神戸3(共有用)
 
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning AlgorithmICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
ICML2013読み会 ELLA: An Efficient Lifelong Learning Algorithm
 
今年のKDDベストペーパーを実装・公開しました
今年のKDDベストペーパーを実装・公開しました今年のKDDベストペーパーを実装・公開しました
今年のKDDベストペーパーを実装・公開しました
 
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいことMLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
MLOps Yearning ~ 実運用システムを構築する前にデータサイエンティストが考えておきたいこと
 
高専キャリア ~アプリコンテストに独りで挑んだ「OnlyOne」の皆さん~
高専キャリア ~アプリコンテストに独りで挑んだ「OnlyOne」の皆さん~高専キャリア ~アプリコンテストに独りで挑んだ「OnlyOne」の皆さん~
高専キャリア ~アプリコンテストに独りで挑んだ「OnlyOne」の皆さん~
 
CDLEおすすめ書籍
CDLEおすすめ書籍CDLEおすすめ書籍
CDLEおすすめ書籍
 
[db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ
 [db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ [db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ
[db analytics showcase Sapporo 2018] B32 無いなら作ろう!教師データ作成のあれこれ
 
機械学習システムを受託開発 する時に気をつけておきたい事
機械学習システムを受託開発 する時に気をつけておきたい事機械学習システムを受託開発 する時に気をつけておきたい事
機械学習システムを受託開発 する時に気をつけておきたい事
 
Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門
 
プロダクトマネージャのお仕事
プロダクトマネージャのお仕事プロダクトマネージャのお仕事
プロダクトマネージャのお仕事
 
ROS JAPAN Users Group Meetup 04
ROS JAPAN Users Group Meetup 04ROS JAPAN Users Group Meetup 04
ROS JAPAN Users Group Meetup 04
 
データビジュアライゼーションもくもく会
データビジュアライゼーションもくもく会データビジュアライゼーションもくもく会
データビジュアライゼーションもくもく会
 
資格取得に向けての活動記録
資格取得に向けての活動記録資格取得に向けての活動記録
資格取得に向けての活動記録
 
「ソフトウェア品質データ分析を通じた組織的改善の促進」ソフトウエアジャパン2014「ITフォーラムセッション」IPA/SEC データの分析に基づくシステム...
「ソフトウェア品質データ分析を通じた組織的改善の促進」ソフトウエアジャパン2014「ITフォーラムセッション」IPA/SEC データの分析に基づくシステム...「ソフトウェア品質データ分析を通じた組織的改善の促進」ソフトウエアジャパン2014「ITフォーラムセッション」IPA/SEC データの分析に基づくシステム...
「ソフトウェア品質データ分析を通じた組織的改善の促進」ソフトウエアジャパン2014「ITフォーラムセッション」IPA/SEC データの分析に基づくシステム...
 
ディープラーニングでラーメン二郎(全店舗)を識別してみた
ディープラーニングでラーメン二郎(全店舗)を識別してみたディープラーニングでラーメン二郎(全店舗)を識別してみた
ディープラーニングでラーメン二郎(全店舗)を識別してみた
 
Supervised Machine Learning of Elastic Stack
Supervised Machine Learning of Elastic StackSupervised Machine Learning of Elastic Stack
Supervised Machine Learning of Elastic Stack
 
Kaggle の Titanic チュートリアルに挑戦した話
Kaggle の Titanic チュートリアルに挑戦した話Kaggle の Titanic チュートリアルに挑戦した話
Kaggle の Titanic チュートリアルに挑戦した話
 
Scikit learnで学ぶ機械学習入門
Scikit learnで学ぶ機械学習入門Scikit learnで学ぶ機械学習入門
Scikit learnで学ぶ機械学習入門
 
1時間で分かるSTA (Software Test Automation) #stac2014
1時間で分かるSTA (Software Test Automation) #stac20141時間で分かるSTA (Software Test Automation) #stac2014
1時間で分かるSTA (Software Test Automation) #stac2014
 

Kürzlich hochgeladen

SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 

Kürzlich hochgeladen (10)

SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 

第3回メドレー読書会前半