SlideShare ist ein Scribd-Unternehmen logo
1 von 22
Downloaden Sie, um offline zu lesen
1
機械学習の全般知識
2017/01/31
mabonki0725
2
機械学習との関わり
• データ分析と統計モデル構築15年
• 吟味したデータで構築したモデルは実運用でも精度を維持する
• 現在は自前で構築したモデルよりフリーのモデルの方が高精度
• 統計数理研究所の機械学習ゼミに4年間在籍
• PRMLを読み殆どの統計モデルをスクラッチで構築
  判別木 SVM ベイジアンネット DeepLearning(CNN LSTM)
本資料のモデルや図は全てこの当時作成したもの
• 所属ゼミでは最近まではDeepLearningが禁止だった  
• AI論文は月に2000本発表される。しかし日本人の
投稿は殆どない
• 日米の投資額の差(1000倍)
• 単一民族の日本人は多様性を捉える統計が馴染まない
3
機械学習の進展
1)2000年頃までは古典的な頻度統計が主流だった
• データが貴重で計算機のパワーも低い時代の統計
• 仮説検定やP値など結果の解釈が難解であった
2)2000年以降ベイズ統計が発展する
• 豊富なデータと計算機パワーで繰返し計算でモデルを精緻化する
• 隠れた変数(見えない因子)をモデルに入れることに成功
3)DeepLearningの特徴量抽出能力が認識される
• Hintonの教師なしモデル(RBM)が飛躍的に性能を向上させる
4)強化学習+DeepLearningのAlpha碁が出現
• DeepMind社が状況認識と適応行動を合体する(DQNモデル)
• 計算機どうし対戦で能力を向上(敵対的モデルが注目される) 
5) オープン・イノベーションによってツールが殆どFreeになる
• 機械学習やAIがロジックからツール主導になる。
• Pythonは全ての言語の長所が反映され、ツールの充足が高い
4
機械学習モデル構築の工程
• 機械学習ツールを使う前処理が大部分を占る
• 機械学習のツールを使うのは全体の5%のみ
• 実用上は運用データでの精度が大事
課題 工数 課題例(企業審査モデル) 区分 負荷
分析方針 5 審査モデル可能性の調査 計画 5.0%
データ所在調査 5 与信先のデータの調査
データ取得 10 与信先のデータの集積
データの解釈 10 データの整合性の検討
データの統合 10 有意なデータの選択と統合
データ分割 10 与信先のタイプで区分
データ加工 20 信用を説明する有意なデータの加工
モデル化 5 モデルを適用 モデル適用 5.0%
モデル精度検証 10 過学習、劣学習を検証 モデル検証 10.0%
モデル実装 5 審査モデルを実装
モニタリング 10 運用データでの精度をモニタリング
データ加工
後処理
65.0%
15.0%
5
学習モデルの大分類
K-means  LDA EM 隠れた判別変数を見出し、収束状態で判断非教師モデル
大分類 説明
頻度統計モデル モデルを決めるパラメータを一度で最適化する 教師データ有
モデル
ベイズ統計モデル
教師付モデル 教師データが判断別基準
データの背後に隠れた変数を逐次最適化する 教師データ無 
判別ツリー SVA 
教師
半教師モデル 一部の教師データで全データを推定する
識別
生成
VAE
統計
グラフィカルモデル データをグラフ化して分析する ベイジアンネット SEM
自然言語処理 文章データを分類、意味解析する 機械翻訳 word2vec  
非統計モデル データは独立していると仮定 ニューロ  計画法 
時系列モデル 時系列のデータから将来予測 ARMA カルマンフィルター
非
数値
1
2
3
4
5
6
7
8
9
10 DeepLearning 画像 音声 言語の識別 CNN LSTM
11 強化学習 報酬(得点 勝敗)の最大化を目指し意思決定 ロボテックス アルファ碁
6
1-a 教師付モデル(判別ツリー)
正解ラベルがあるデータで学習するモデル
相関(AIC)分析の結果
見に来た人と属性の相関ランク
上位ランク:家の形態 地域
判別木の結果
借家・北部地域・月収22万超の
人が87%見学している
7
1-b 教師付モデル(SVM)
直線で分離できない
AとBを分離できる様に
高次元に写像(カーネル)
平面で分離
8
スパース法実装例2 ARD(関連度自動決定)RVM
download http://www1.m.jcnnet.jp/mabonki/download.htm
RVM回帰 出来るだけ少ない点で回帰する   下記例では◎の3点のみで回帰
RVM識別 □とXのみで識別 RVM識別の結果 Z軸は確率値
1-c 教師付モデル(LASSO)
9
2 教師なしモデル(K-means)
正解ラベルが無いデータで区分する
K-Means法
花びらの幅、長さ、ガク片の長さで
3種類のPLOT図
正解の種類別の
PLOT図
10
3 半教師付モデル(VAE)
一部の手書数字で全数字の手書きを推定する
教師データ 推定結果
11
頻度統計とベイズ統計の比較
頻度統計
(識別モデル)
ベイズ統計
(生成モデル)
モデル適合度P値が必要
モデル適合度はモデル
改善指標AIC,BIC
4  頻度統計とベイズ統計モデル
最適な網目を
一度で計算
網目調整
繰返し
計算 結果の状態評価
適当な網目で開始
(事前確率)
最適な網目
(事後確率最大化)
12
5 ベイズ統計モデル・確率勾配法(SGD)
最近の機械学習の殆どはこの方式
13
6 時系列解析
定常波による予測:ARMA
長期トレンド除去→定常波
非定常波の予測:カルマンフィルター
14
7-a 非統計モデル(ニューロ)
ニューロモデル
sinにノイズを与えたデータをで予測
非線形計画法
非線形関数領域内を制約とする
x+yの最大値
15
7-b 非統計モデル(最短経路)
東京地下鉄の最短経路探査 ダイクストラ法
16
8 グラフィカルモデル
タイタニック号の乗船名簿と生死
からベイジアンネットを推定
性別による生死の予測
収入・学歴・会社規模・人脈・有名度
の相関より「地位」の隠れ因子を仮定
隠れ因子「地位」と各々の関係度を計測
17
9 word2vec
• 大量の文書をよんで文字をvectorで表現にする
– vectorなので加減算で推論・推薦ができる
• 連想
  vec(日本) - vec(東京) + vec(パリ) → vec(フランス)
• 推奨 映画のBackoFutureにviolenceを強くした映画は?
  vec(バックツウザフューチャ) + 2×vec(暴力) → vec(ターミネータ)
+ =2×violence
18
10-a DeepLearning CNN 画像認識
19
10-b DeepLearning LSTM 言語認識
20
10 DeepLearning 画像+言語認識
21
11 強化学習
DQN 
DeepLearning+強化学習
Sarsaλ
強化学習
22
まとめ
• 機械学習のモデルは淘汰が進んでいる
– 教師あり XGBoost(ランダム・フォレスト+ブースティング)
– 教師なし Stan(MCMC)
– 画像・音声認識 DeepLearning
• 学術上では未だ百花繚乱の状態
– 計算機の向上と多くの天才の参入によって予断できない
– DeepLearningの理論的背景がまだ解明されない
• オープン・イノベーションで誰でもチャンスがある
– データ分析(機械学習ツール)は基本的にフリー
– 理論は難しいが応用を重ねていくと面白いと感じるはず
– 理論主導の時代は終焉し、ツールや応用主導の時代

Weitere ähnliche Inhalte

Andere mochten auch

粒子フィルターによる自動運転
粒子フィルターによる自動運転粒子フィルターによる自動運転
粒子フィルターによる自動運転Masato Nakai
 
機械学習の全般について
機械学習の全般について機械学習の全般について
機械学習の全般についてMasato Nakai
 
Chainer Development Plan 2015/12
Chainer Development Plan 2015/12Chainer Development Plan 2015/12
Chainer Development Plan 2015/12Seiya Tokui
 
As Soldadas de Israel
As Soldadas de IsraelAs Soldadas de Israel
As Soldadas de IsraelPLETZ.com -
 
Icpによる原画像推定
Icpによる原画像推定Icpによる原画像推定
Icpによる原画像推定Masato Nakai
 
Inference Bayesian Network from data
Inference Bayesian Network from dataInference Bayesian Network from data
Inference Bayesian Network from dataMasato Nakai
 
Japanese Linguistics in Lucene and Solr
Japanese Linguistics in Lucene and Solr Japanese Linguistics in Lucene and Solr
Japanese Linguistics in Lucene and Solr lucenerevolution
 
出会い系を作ろうと思い立ってXXXなサイトを見ていたらDQNとつきあうことになった話
出会い系を作ろうと思い立ってXXXなサイトを見ていたらDQNとつきあうことになった話出会い系を作ろうと思い立ってXXXなサイトを見ていたらDQNとつきあうことになった話
出会い系を作ろうと思い立ってXXXなサイトを見ていたらDQNとつきあうことになった話ScenesK
 
Tensorflowで五目並べの思考アルゴリズムを作る
Tensorflowで五目並べの思考アルゴリズムを作るTensorflowで五目並べの思考アルゴリズムを作る
Tensorflowで五目並べの思考アルゴリズムを作るjugemjugemjugem
 
PRML勉強会@長岡 第4章線形識別モデル
PRML勉強会@長岡 第4章線形識別モデルPRML勉強会@長岡 第4章線形識別モデル
PRML勉強会@長岡 第4章線形識別モデルShohei Okada
 
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニングJubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニングYuya Unno
 

Andere mochten auch (20)

Vae gan nlp
Vae gan nlpVae gan nlp
Vae gan nlp
 
Ai論文サイト
Ai論文サイトAi論文サイト
Ai論文サイト
 
粒子フィルターによる自動運転
粒子フィルターによる自動運転粒子フィルターによる自動運転
粒子フィルターによる自動運転
 
機械学習の全般について
機械学習の全般について機械学習の全般について
機械学習の全般について
 
Chainer Development Plan 2015/12
Chainer Development Plan 2015/12Chainer Development Plan 2015/12
Chainer Development Plan 2015/12
 
As Soldadas de Israel
As Soldadas de IsraelAs Soldadas de Israel
As Soldadas de Israel
 
Icpによる原画像推定
Icpによる原画像推定Icpによる原画像推定
Icpによる原画像推定
 
Inference Bayesian Network from data
Inference Bayesian Network from dataInference Bayesian Network from data
Inference Bayesian Network from data
 
Japanese Linguistics in Lucene and Solr
Japanese Linguistics in Lucene and Solr Japanese Linguistics in Lucene and Solr
Japanese Linguistics in Lucene and Solr
 
出会い系を作ろうと思い立ってXXXなサイトを見ていたらDQNとつきあうことになった話
出会い系を作ろうと思い立ってXXXなサイトを見ていたらDQNとつきあうことになった話出会い系を作ろうと思い立ってXXXなサイトを見ていたらDQNとつきあうことになった話
出会い系を作ろうと思い立ってXXXなサイトを見ていたらDQNとつきあうことになった話
 
Tensorflowで五目並べの思考アルゴリズムを作る
Tensorflowで五目並べの思考アルゴリズムを作るTensorflowで五目並べの思考アルゴリズムを作る
Tensorflowで五目並べの思考アルゴリズムを作る
 
KDD2015論文読み会
KDD2015論文読み会KDD2015論文読み会
KDD2015論文読み会
 
知能型システム論(後半)
知能型システム論(後半)知能型システム論(後半)
知能型システム論(後半)
 
強化学習勉強会・論文紹介(第22回)
強化学習勉強会・論文紹介(第22回)強化学習勉強会・論文紹介(第22回)
強化学習勉強会・論文紹介(第22回)
 
PRML勉強会@長岡 第4章線形識別モデル
PRML勉強会@長岡 第4章線形識別モデルPRML勉強会@長岡 第4章線形識別モデル
PRML勉強会@長岡 第4章線形識別モデル
 
匿名化の崩壊
匿名化の崩壊匿名化の崩壊
匿名化の崩壊
 
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニングJubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニング
 
KDD2014勉強会 発表資料
KDD2014勉強会 発表資料KDD2014勉強会 発表資料
KDD2014勉強会 発表資料
 
強化学習勉強会・論文紹介(Kulkarni et al., 2016)
強化学習勉強会・論文紹介(Kulkarni et al., 2016)強化学習勉強会・論文紹介(Kulkarni et al., 2016)
強化学習勉強会・論文紹介(Kulkarni et al., 2016)
 
Principal Sensitivity Analysis
Principal Sensitivity AnalysisPrincipal Sensitivity Analysis
Principal Sensitivity Analysis
 

Ähnlich wie 機械学習の全般について 4

AIがAIを生み出す?
AIがAIを生み出す?AIがAIを生み出す?
AIがAIを生み出す?Daiki Tsuchiya
 
確率統計-機械学習その前に
確率統計-機械学習その前に確率統計-機械学習その前に
確率統計-機械学習その前にHidekatsu Izuno
 
人それぞれの競プロとの向き合い方
人それぞれの競プロとの向き合い方人それぞれの競プロとの向き合い方
人それぞれの競プロとの向き合い方Kensuke Otsuki
 
機械学習とベイズ超入門
機械学習とベイズ超入門機械学習とベイズ超入門
機械学習とベイズ超入門Ko Kikuta
 
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...Yoshitaka Ushiku
 

Ähnlich wie 機械学習の全般について 4 (6)

AIがAIを生み出す?
AIがAIを生み出す?AIがAIを生み出す?
AIがAIを生み出す?
 
確率統計-機械学習その前に
確率統計-機械学習その前に確率統計-機械学習その前に
確率統計-機械学習その前に
 
人それぞれの競プロとの向き合い方
人それぞれの競プロとの向き合い方人それぞれの競プロとの向き合い方
人それぞれの競プロとの向き合い方
 
機械学習とベイズ超入門
機械学習とベイズ超入門機械学習とベイズ超入門
機械学習とベイズ超入門
 
20181030 fun
20181030 fun20181030 fun
20181030 fun
 
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...
Women Also Snowboard: Overcoming Bias in Captioning Models(関東CV勉強会 ECCV 2018 ...
 

Mehr von Masato Nakai

Padoc_presen4R.pdf
Padoc_presen4R.pdfPadoc_presen4R.pdf
Padoc_presen4R.pdfMasato Nakai
 
Factor analysis for ml by padoc 6 r
Factor analysis for ml by padoc 6 rFactor analysis for ml by padoc 6 r
Factor analysis for ml by padoc 6 rMasato Nakai
 
報酬が殆ど得られない場合の強化学習
報酬が殆ど得られない場合の強化学習報酬が殆ど得られない場合の強化学習
報酬が殆ど得られない場合の強化学習Masato Nakai
 
Padocview anonimous2
Padocview anonimous2Padocview anonimous2
Padocview anonimous2Masato Nakai
 
presentation for padoc
presentation for padocpresentation for padoc
presentation for padocMasato Nakai
 
Ai neuro science_pdf
Ai neuro science_pdfAi neuro science_pdf
Ai neuro science_pdfMasato Nakai
 
Deep IRL by C language
Deep IRL by C languageDeep IRL by C language
Deep IRL by C languageMasato Nakai
 
Open pose時系列解析7
Open pose時系列解析7Open pose時系列解析7
Open pose時系列解析7Masato Nakai
 
Deep genenergyprobdoc
Deep genenergyprobdocDeep genenergyprobdoc
Deep genenergyprobdocMasato Nakai
 
Siftによる特徴点抽出
Siftによる特徴点抽出Siftによる特徴点抽出
Siftによる特徴点抽出Masato Nakai
 
End to end training with deep visiomotor
End to end training with deep visiomotorEnd to end training with deep visiomotor
End to end training with deep visiomotorMasato Nakai
 
強化学習の汎用化Ros
強化学習の汎用化Ros強化学習の汎用化Ros
強化学習の汎用化RosMasato Nakai
 
強化学習の汎用化Sarsa
強化学習の汎用化Sarsa強化学習の汎用化Sarsa
強化学習の汎用化SarsaMasato Nakai
 

Mehr von Masato Nakai (20)

Padoc_presen4R.pdf
Padoc_presen4R.pdfPadoc_presen4R.pdf
Padoc_presen4R.pdf
 
Factor analysis for ml by padoc 6 r
Factor analysis for ml by padoc 6 rFactor analysis for ml by padoc 6 r
Factor analysis for ml by padoc 6 r
 
報酬が殆ど得られない場合の強化学習
報酬が殆ど得られない場合の強化学習報酬が殆ど得られない場合の強化学習
報酬が殆ど得られない場合の強化学習
 
Padocview anonimous2
Padocview anonimous2Padocview anonimous2
Padocview anonimous2
 
presentation for padoc
presentation for padocpresentation for padoc
presentation for padoc
 
Ai neuro science_pdf
Ai neuro science_pdfAi neuro science_pdf
Ai neuro science_pdf
 
Deep IRL by C language
Deep IRL by C languageDeep IRL by C language
Deep IRL by C language
 
Open pose時系列解析7
Open pose時系列解析7Open pose時系列解析7
Open pose時系列解析7
 
Team ai 3
Team ai 3Team ai 3
Team ai 3
 
Semi vae memo (2)
Semi vae memo (2)Semi vae memo (2)
Semi vae memo (2)
 
Open posedoc
Open posedocOpen posedoc
Open posedoc
 
Dr.raios papers
Dr.raios papersDr.raios papers
Dr.raios papers
 
Deep genenergyprobdoc
Deep genenergyprobdocDeep genenergyprobdoc
Deep genenergyprobdoc
 
Irs gan doc
Irs gan docIrs gan doc
Irs gan doc
 
Semi vae memo (1)
Semi vae memo (1)Semi vae memo (1)
Semi vae memo (1)
 
Siftによる特徴点抽出
Siftによる特徴点抽出Siftによる特徴点抽出
Siftによる特徴点抽出
 
End to end training with deep visiomotor
End to end training with deep visiomotorEnd to end training with deep visiomotor
End to end training with deep visiomotor
 
強化学習の汎用化Ros
強化学習の汎用化Ros強化学習の汎用化Ros
強化学習の汎用化Ros
 
Alpha gor 2
Alpha gor 2Alpha gor 2
Alpha gor 2
 
強化学習の汎用化Sarsa
強化学習の汎用化Sarsa強化学習の汎用化Sarsa
強化学習の汎用化Sarsa
 

機械学習の全般について 4