Talk given by Akira Shibata at Developer's Summit 2016, one of the largest conference for software developer's in Japan. Akira, Data Scientist at DataRobot, Inc, talked about the evolution of machine learning techniques, most notably the recent developments in DataRobot and TensorFlow.
3. copyright @2016 by DataRobot, Inc. All Rights Reserved 3
2012 2H 2013 1H 2013 2H 2014 1H 2014 2H 2015 1H 2015 2H 2016 1H
June ‘12
Founded
June ‘13
Seed Funding
$3.3M
July ‘14
Series A $21M
Nov ‘15
Series B $33M
データロボット会社紹介
4. copyright @2016 by DataRobot, Inc. All Rights Reserved 4
世界で30万人以上が登録する、データサイエンティストのコンペプラットフォーム。
数多くの企業がデータを公開し、予測精度で上位成績者には賞金が渡される。
Jeremy Achin
CEO & Co-Founder
Highest† 20th
Xavier Conort
Chief Data Scientist
Highest† 1st
Tom DeGody
CTO & Co-Founder
Highest† 20th
Peter Prettenhofer
Data Scientist
Highest† 14th
Core Contributor
Owen Zhang
Chief Product Officer
Highest† 1st
Sergey Yurgenson
Data Scientist
Highest† 1st
Viktor Gal
Data Scientist
Core Contributor
トップKagglerが多数在籍
5. copyright @2016 by DataRobot, Inc. All Rights Reserved
データサイエン
ティストのたま
り場
Python じゃな
い方もどうぞ
6. copyright @2016 by DataRobot, Inc. All Rights Reserved
PyData.Tokyoでは、開始当初から深層学習を追ってきた
9. copyright @2016 by DataRobot, Inc. All Rights Reserved
今日お伝えしたいこと
あなたも人工知能使えます
つかってっください
10. copyright @2016 by DataRobot, Inc. All Rights Reserved
深層学習(ディープラーニング)アルゴリズムの画像処理における性能がすごすぎ
機械って人間超えちゃったりするんじゃね?人間置き換えちゃうんじゃね?
とりあえずその辺の技術全般を指すハイプ用語として成立
メディアもネタになって嬉しいし、そっち系のスタートアップなんかもとりあえず波にのることに
した。
そもそも...人工知能ってなに?
11. copyright @2016 by DataRobot, Inc. All Rights Reserved
人工知能作ろうとしてる人、増えてます
12. copyright @2016 by DataRobot, Inc. All Rights Reserved
人工知能 機械学習 深層学習(ディープラーニング)
もう少しだけ正確に
13. copyright @2016 by DataRobot, Inc. All Rights Reserved
機械学習ってなに?
コンピューターアルゴリズムにデータを分析させ、
パターンを学習させることで、
予測や識別などの問題を解かせること。
種類
● 教師あり
● 教師なし
手法
● 回帰
● 決定木
● ベイジアンモデル
● クラスタリング
● ニューラルネットワーク
● 深層学習
14. copyright @2016 by DataRobot, Inc. All Rights Reserved
機械学習への入力データと解ける問題
分類
● 2値分類:True/False
● 多値分類:カテゴリー・タグ
回帰
● 連続値:数値
時系列
● 数値 x 時間
レコメンデーション
● 数値 x アイテム
クラスタリング
● ブーリアン
● 数値
● カテゴリ
● テキスト
15. copyright @2016 by DataRobot, Inc. All Rights Reserved
既に広くビジネスに応用されている
● 金融
○ この人お金貸したら返ってくる?
○
● 保険
○ この人が来年事故に遭う確率は?
● マーケティング
○ この広告はどれくらいクリックされる?
○ どのマーケティングキャンペーンが一番効果的?
● 人事・採用
○ この候補者は自社で活躍できるか?
○ どの従業員が辞めそう?
● スポーツ
○ この選手はいくつの試合でヒットを打てる??
● ヘルスケア
○ 退院した患者がまた悪くなって再入院する確率は?
16. copyright @2016 by DataRobot, Inc. All Rights Reserved
どんどん進化してる
研究者が自分でアルゴリズ
ムを考案して論文を発表
オープンソースライブラリで
コーディングができる人はつ
かえる
● Pythonならscikit-learn
ボタンをポチッと押すだけで、
誰でも使える
● DataRobot
深層学習前の機械学習技術は
イマココ
17. copyright @2016 by DataRobot, Inc. All Rights Reserved
深層学習ってなに?
神経回路にインスパイアされたニューラルネットワーク型アルゴリズムの「隠れ層」
を多段にすることで、学習能力を高めたもの。特に画像識別分野で高い精度を発
揮している。
学習手法
● オートエンコーダー
● Restricted Boltzmann Machine などなど
ネットワークタイプ
● Convolutional
● Recurrent などなど
HWの進歩
● GPUを使った効率化
そもそも...
24. copyright @2016 by DataRobot, Inc. All Rights Reserved
TensorFlowとは
深層学習の構築に必要な線形代数を
表現し、GPUなどの分散処理技術を
使って高速に計算するためのライブラ
リ。
エンジニアならPython/C++からわりと簡
単に使える。
25. copyright @2016 by DataRobot, Inc. All Rights Reserved
● 手書き文字の認識
● テキストのベクトル化(Word2Vec)
● 機械翻訳
● 自然言語のモデリング
● イメージ内にある物体の識別
● などなど
TensorFlowで既にできる深層学習の応用例
Googleの物体識別アルゴリズム、
Inception3は96%以上のtop5正答
率で、世界最高精度かつ、人間より
も精度が高い。
既にTensorFlowで使える。
26. copyright @2016 by DataRobot, Inc. All Rights Reserved
pip install --upgrade https://storage.googleapis.
com/tensorflow/mac/tensorflow-0.7.0-py2-none-any.
whl
プラス幾つかのコマンドで
デモ:
わりと簡単につかえる... エンジニアなら
27. copyright @2016 by DataRobot, Inc. All Rights Reserved
http://kivantium.hateblo.jp/entry/2015/11/18/233834
じぶんで応用すると...
28. copyright @2016 by DataRobot, Inc. All Rights Reserved
Deep Dreamも、もうすぐ
TensorFlowから使える