SlideShare ist ein Scribd-Unternehmen logo
1 von 34

多項式あてはめで眺めるベイズ推定
~今日からきみもベイジアン~
自己紹介
・情報系 M2
・研究:グラフィカルモデルの推定手法
・twitter : @tanutarou730
・mastodon : tanutarou@mathtod.online
・ベイズ見習い
はじめに
今日の内容は個人的な主観や誤りが含まれている可能性が
あるので、盲信するのはやめてください
質問があればtwitter経由や、
以下のslackチャンネルに疑問を書いてください(推奨)
#statistics
多項式あてはめ
今日は多項式あてはめを例にベイズ推定を説明
データ:N個 (ti, xi)
モデル:
パラメータ:ai, b
[1] https://www.r-bloggers.com/fitting-polynomial-regression-in-r/
データにフィットする
ような多項式を求める
目的:
決定的手法と確率的手法
決定的手法:確率使わずにモデルを表現
確率的手法:確率を使ってモデルを表現
注:ベイズ的手法は確率的手法に含まれる
決定的手法 確率的手法 ベイズ的手法
最小二乗法 ガウスノイズモデル ベイズ線形回帰モデル
ニューラルネットワーク 確率的ニューラルネット
ワーク
ベイジアンニューラル
ネットワーク
SVM ロジスティック回帰 ベイズロジスティック回
帰
Adaboost ランダムフォレスト ガウス過程回帰
k-means法 関連ベクトルマシン
今日の流れ
今日はこの拡張を順番に行っていき、ベイズ推定と
は何かについてみていく
Edwardによる実装 (Jupyter notebook):
https://gist.github.com/tanutarou/309cd8c0c725224d96526f25c20d3262
最小二乗法 ガウスノイズモデル ベイズ線形回帰モデル
決定的手法 確率的手法 ベイズ的手法
最小二乗法
データ点とモデルの予測値との差の平方和の最小化
微分してイコールゼロで極値を求めることで解析的に解ける
予測値
M=1(直線)のとき
1
最小二乗法の結果
多項式の次数Mは3が良さそう。 これで満足?(´・ω・`)
過学習!
ガウスノイズモデル
データにフィットする
ような確率分布を求める
確率的なモデルで多項式を表現してみる
データ:N個 (ti, xi)
モデル:
パラメータ:
[1] https://www.r-bloggers.com/fitting-polynomial-regression-in-r/
目的:
最尤推定
モデル:
データ:N個 (ti, xi)
今このモデルからデータが(独立に)得られたと仮定する。
今持っているデータが得られる確率は?
同時確率:
今得られているデータが最も高い確率で得られるようにしよう!
最尤推定
最尤推定
a, b, σについて微分してイコールゼロとおけばいい
尤度の最大化が、2乗誤差の最小化と等しい
最小二乗法はノイズに正規分布を仮定した尤度最大化
ガウスノイズモデルによる推定結果
結果として確率分布が得られる
確率的なモデルにして何がうれしい?
・正規分布の分散σも推定できるようになった
・ノイズの分布がガウス分布でない場合も最尤推定という統
一的な枠組みで推定できるようになった(柔軟なモデル設計)
・データに関する不確かさがわかる。データの分散。
いよいよベイズ
ほんとにこの分布でうれしいのだろうか?
いよいよベイズ
縮尺を下げると・・・
これで不確かさをちゃんと表現できているのか?
頻度主義とベイズ主義
頻度主義:データを生成している真の分布は1つと仮定
ベイズ主義:パラメータも確率分布を持つと考える
ベイズ主義はデータが定数だとする表が
世の中に出回っている気がする(個人的に納得できない)。
頻度主義 ベイズ主義
母数
(パラメータ)
定数 確率変数
データ 確率変数 確率変数
ベイズ的アプローチ
・頻度主義
・ベイズ主義
定数
定数
定数
確率分布!
確率分布!
確率分布!
事後確率分布
パラメータを確率変数とすると、事後確率分布を考えられる!
ベイズの定理:
何を意味しているか?
データが与えられたときに、データを生成した分布の
パラメータがθである確率
Θ:パラメータ
尤度 事前分布
エビデンス
ベイズ主義の推定方法
・MAP推定(最大事後確率推定)
・ベイズ推定
パラメータの事後分布で尤度の期待値をとって推定を行う
MAP推定を実際にやってみる
モデル
aの事前分布:
bの事前分布:
予測分布:
今回、各正規分布の標準偏差はσa=σb=1, σ=√2と仮定
MAP推定を実際にやってみる
・事後確率分布を計算しよう!
この計算は一般に非常に難しい
解析的に求められるケースは非常に限られている(共役分布)。
これが理由で、ベイズ的アプローチは式が求められても特定
のケース以外は計算が困難とされていた・・(?)
MCMCによるベイジアンの革命
MCMC(マルコフ連鎖モンテカルロ法):
計算パワーによるゴリ押しで、どんな分布を使っても事後確
率分布からのサンプリングを得られるようになった。
その他にも変分ベイズで計算時間の問題を解決するのが現在
の主流に見える
実際のサンプリング結果
a1の事前分布: bの事前分布:
a1の事後確率分布: bの事後確率分布:
3次の多項式(M=3)によるあてはめ
MAP推定の結果
3次の多項式(M=3)によるあてはめ
それほど最尤推定と比較して大きな変化はない
MAP推定(過学習の抑制)
15次の多項式(M=15)のとき
事前分布によりMAP推定のほうが過学習を抑制できてそう(?)
最尤推定
MAP推定
ベイズ推定の結果
まず事前分布からパラメータをサンプリングした結果を見て
みる(学習していない状態)
当然、とてもフィッティングしているように見えない。
ベイズ推定の結果
事後分布からのサンプリング結果。
フィッティングした。なにやらデータのないところの確率が
低そう・・
ベイズ推定の結果
縮尺を下げてみると・・・
フィッティングして、なおかつデータのないところの不確か
さが表現できている!
結果の比較
最小二乗法 ガウスノイズモデル
MAP推定 ベイズ推定
結局ベイズ主義は何がいいのか
・事前分布によって事前知識を柔軟に取り入れることが出来
る(さらなるモデルの柔軟な設計, 過学習の抑制)とくに、デー
タが少ない場合に有効。
・ベイズ推定では、不確かな部分(モデルの自信のない部分)
をデータが教えてくれる。次にどこのデータを手に入れるべ
きかがわかる(ベイズ最適化?)。
・ベイズ推定は、事後分布のすべての情報を使うので信頼の
おける推定が出来る(点推定ではない)。
・ベイズ更新ができる(事後確率分布をまた事前分布にして学
習, データが与えられるたびに更新できる)
ベイズ的アプローチのデメリット
・計算コストが高い
・事前分布の選び方の問題
最尤推定はベイズ推定の特殊な場合とみなせるので、基本的
には最尤推定に対して出来ることに関しての欠点はない(?)
ライブラリの充実
今日行ったようなプログラムは、ライブラリを使えば推定部
分は15L程度で出来る
最近Edwardは、Tensorflowに取り込まれることが決まった
python R
ベイズの学び方
ベイズ推定とグラフィカルモデル(玉木先生)
関連する部分を読む
わからない
ときは・・・
#statistics
先生
まとめ
・こんなに素晴らしいベイズ推定を手段の一つとして持た
ない理由はないです。学びましょう。
・一人で学ぶとどうしても、わかった気になってしまいま
す。そうならないようにstatisticsチャットで素朴な質問を投
げあいましょう。

Weitere ähnliche Inhalte

Was ist angesagt?

三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイNaoya Chiba
 
状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38horihorio
 
心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズHiroshi Shimizu
 
非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出
非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出
非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出hoxo_m
 
基礎からのベイズ統計学第5章
基礎からのベイズ統計学第5章基礎からのベイズ統計学第5章
基礎からのベイズ統計学第5章hiro5585
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門Kawamoto_Kazuhiko
 
心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理するHiroshi Shimizu
 
最適輸送の計算アルゴリズムの研究動向
最適輸送の計算アルゴリズムの研究動向最適輸送の計算アルゴリズムの研究動向
最適輸送の計算アルゴリズムの研究動向ohken
 
2 7.一般化線形混合モデル
2 7.一般化線形混合モデル2 7.一般化線形混合モデル
2 7.一般化線形混合モデルlogics-of-blue
 
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜SSII
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介Naoki Hayashi
 
ブラックボックス最適化とその応用
ブラックボックス最適化とその応用ブラックボックス最適化とその応用
ブラックボックス最適化とその応用gree_tech
 
Newman アルゴリズムによるソーシャルグラフのクラスタリング
Newman アルゴリズムによるソーシャルグラフのクラスタリングNewman アルゴリズムによるソーシャルグラフのクラスタリング
Newman アルゴリズムによるソーシャルグラフのクラスタリングAtsushi KOMIYA
 
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイDeep Learning JP
 
最適化超入門
最適化超入門最適化超入門
最適化超入門Takami Sato
 
深層生成モデルと世界モデル
深層生成モデルと世界モデル深層生成モデルと世界モデル
深層生成モデルと世界モデルMasahiro Suzuki
 
機械学習におけるオンライン確率的最適化の理論
機械学習におけるオンライン確率的最適化の理論機械学習におけるオンライン確率的最適化の理論
機械学習におけるオンライン確率的最適化の理論Taiji Suzuki
 
ノンパラベイズ入門の入門
ノンパラベイズ入門の入門ノンパラベイズ入門の入門
ノンパラベイズ入門の入門Shuyo Nakatani
 
幾何を使った統計のはなし
幾何を使った統計のはなし幾何を使った統計のはなし
幾何を使った統計のはなしToru Imai
 
「世界モデル」と関連研究について
「世界モデル」と関連研究について「世界モデル」と関連研究について
「世界モデル」と関連研究についてMasahiro Suzuki
 

Was ist angesagt? (20)

三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ三次元点群を取り扱うニューラルネットワークのサーベイ
三次元点群を取り扱うニューラルネットワークのサーベイ
 
状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38
 
心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ
 
非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出
非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出
非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出
 
基礎からのベイズ統計学第5章
基礎からのベイズ統計学第5章基礎からのベイズ統計学第5章
基礎からのベイズ統計学第5章
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
 
心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する
 
最適輸送の計算アルゴリズムの研究動向
最適輸送の計算アルゴリズムの研究動向最適輸送の計算アルゴリズムの研究動向
最適輸送の計算アルゴリズムの研究動向
 
2 7.一般化線形混合モデル
2 7.一般化線形混合モデル2 7.一般化線形混合モデル
2 7.一般化線形混合モデル
 
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
 
ブラックボックス最適化とその応用
ブラックボックス最適化とその応用ブラックボックス最適化とその応用
ブラックボックス最適化とその応用
 
Newman アルゴリズムによるソーシャルグラフのクラスタリング
Newman アルゴリズムによるソーシャルグラフのクラスタリングNewman アルゴリズムによるソーシャルグラフのクラスタリング
Newman アルゴリズムによるソーシャルグラフのクラスタリング
 
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
 
最適化超入門
最適化超入門最適化超入門
最適化超入門
 
深層生成モデルと世界モデル
深層生成モデルと世界モデル深層生成モデルと世界モデル
深層生成モデルと世界モデル
 
機械学習におけるオンライン確率的最適化の理論
機械学習におけるオンライン確率的最適化の理論機械学習におけるオンライン確率的最適化の理論
機械学習におけるオンライン確率的最適化の理論
 
ノンパラベイズ入門の入門
ノンパラベイズ入門の入門ノンパラベイズ入門の入門
ノンパラベイズ入門の入門
 
幾何を使った統計のはなし
幾何を使った統計のはなし幾何を使った統計のはなし
幾何を使った統計のはなし
 
「世界モデル」と関連研究について
「世界モデル」と関連研究について「世界モデル」と関連研究について
「世界モデル」と関連研究について
 

Andere mochten auch

[DLHacks LT] PytorchのDataLoader -torchtextのソースコードを読んでみた-
[DLHacks LT] PytorchのDataLoader -torchtextのソースコードを読んでみた-[DLHacks LT] PytorchのDataLoader -torchtextのソースコードを読んでみた-
[DLHacks LT] PytorchのDataLoader -torchtextのソースコードを読んでみた-Deep Learning JP
 
20171024NL研報告スライド
20171024NL研報告スライド20171024NL研報告スライド
20171024NL研報告スライドMasatoshi TSUCHIYA
 
PoisoningAttackSVM (ICMLreading2012)
PoisoningAttackSVM (ICMLreading2012)PoisoningAttackSVM (ICMLreading2012)
PoisoningAttackSVM (ICMLreading2012)Hidekazu Oiwa
 
[DL輪読会]Learning by Association - A versatile semi-supervised training method ...
[DL輪読会]Learning by Association - A versatile semi-supervised training method ...[DL輪読会]Learning by Association - A versatile semi-supervised training method ...
[DL輪読会]Learning by Association - A versatile semi-supervised training method ...Deep Learning JP
 
深層学習の判断根拠を理解するための 研究とその意義 @PRMU 2017熊本
深層学習の判断根拠を理解するための 研究とその意義 @PRMU 2017熊本深層学習の判断根拠を理解するための 研究とその意義 @PRMU 2017熊本
深層学習の判断根拠を理解するための 研究とその意義 @PRMU 2017熊本Takahiro Kubo
 
もしその単語がなかったら
もしその単語がなかったらもしその単語がなかったら
もしその単語がなかったらHiroshi Nakagawa
 
Prophet入門【R編】Facebookの時系列予測ツール
Prophet入門【R編】Facebookの時系列予測ツールProphet入門【R編】Facebookの時系列予測ツール
Prophet入門【R編】Facebookの時系列予測ツールhoxo_m
 
20170819 CV勉強会 CVPR 2017
20170819 CV勉強会 CVPR 201720170819 CV勉強会 CVPR 2017
20170819 CV勉強会 CVPR 2017issaymk2
 
On the Dynamics of Machine Learning Algorithms and Behavioral Game Theory
On the Dynamics of Machine Learning Algorithms and Behavioral Game TheoryOn the Dynamics of Machine Learning Algorithms and Behavioral Game Theory
On the Dynamics of Machine Learning Algorithms and Behavioral Game TheoryRikiya Takahashi
 
Stochastic Variational Inference
Stochastic Variational InferenceStochastic Variational Inference
Stochastic Variational InferenceKaede Hayashi
 
CVPR2016読み会 Sparsifying Neural Network Connections for Face Recognition
CVPR2016読み会 Sparsifying Neural Network Connections for Face RecognitionCVPR2016読み会 Sparsifying Neural Network Connections for Face Recognition
CVPR2016読み会 Sparsifying Neural Network Connections for Face RecognitionKoichi Takahashi
 
LCA and RMQ ~簡潔もあるよ!~
LCA and RMQ ~簡潔もあるよ!~LCA and RMQ ~簡潔もあるよ!~
LCA and RMQ ~簡潔もあるよ!~Yuma Inoue
 
Greed is Good: 劣モジュラ関数最大化とその発展
Greed is Good: 劣モジュラ関数最大化とその発展Greed is Good: 劣モジュラ関数最大化とその発展
Greed is Good: 劣モジュラ関数最大化とその発展Yuichi Yoshida
 
sublabel accurate convex relaxation of vectorial multilabel energies
sublabel accurate convex relaxation of vectorial multilabel energiessublabel accurate convex relaxation of vectorial multilabel energies
sublabel accurate convex relaxation of vectorial multilabel energiesFujimoto Keisuke
 
プログラミングコンテストでのデータ構造 2 ~動的木編~
プログラミングコンテストでのデータ構造 2 ~動的木編~プログラミングコンテストでのデータ構造 2 ~動的木編~
プログラミングコンテストでのデータ構造 2 ~動的木編~Takuya Akiba
 
ディープラーニングの産業応用とそれを支える技術
ディープラーニングの産業応用とそれを支える技術ディープラーニングの産業応用とそれを支える技術
ディープラーニングの産業応用とそれを支える技術Shohei Hido
 
PRML輪読#14
PRML輪読#14PRML輪読#14
PRML輪読#14matsuolab
 
ウェーブレット木の世界
ウェーブレット木の世界ウェーブレット木の世界
ウェーブレット木の世界Preferred Networks
 

Andere mochten auch (20)

[DLHacks LT] PytorchのDataLoader -torchtextのソースコードを読んでみた-
[DLHacks LT] PytorchのDataLoader -torchtextのソースコードを読んでみた-[DLHacks LT] PytorchのDataLoader -torchtextのソースコードを読んでみた-
[DLHacks LT] PytorchのDataLoader -torchtextのソースコードを読んでみた-
 
20171024NL研報告スライド
20171024NL研報告スライド20171024NL研報告スライド
20171024NL研報告スライド
 
PoisoningAttackSVM (ICMLreading2012)
PoisoningAttackSVM (ICMLreading2012)PoisoningAttackSVM (ICMLreading2012)
PoisoningAttackSVM (ICMLreading2012)
 
[DL輪読会]Learning by Association - A versatile semi-supervised training method ...
[DL輪読会]Learning by Association - A versatile semi-supervised training method ...[DL輪読会]Learning by Association - A versatile semi-supervised training method ...
[DL輪読会]Learning by Association - A versatile semi-supervised training method ...
 
深層学習の判断根拠を理解するための 研究とその意義 @PRMU 2017熊本
深層学習の判断根拠を理解するための 研究とその意義 @PRMU 2017熊本深層学習の判断根拠を理解するための 研究とその意義 @PRMU 2017熊本
深層学習の判断根拠を理解するための 研究とその意義 @PRMU 2017熊本
 
もしその単語がなかったら
もしその単語がなかったらもしその単語がなかったら
もしその単語がなかったら
 
Prophet入門【R編】Facebookの時系列予測ツール
Prophet入門【R編】Facebookの時系列予測ツールProphet入門【R編】Facebookの時系列予測ツール
Prophet入門【R編】Facebookの時系列予測ツール
 
20170819 CV勉強会 CVPR 2017
20170819 CV勉強会 CVPR 201720170819 CV勉強会 CVPR 2017
20170819 CV勉強会 CVPR 2017
 
On the Dynamics of Machine Learning Algorithms and Behavioral Game Theory
On the Dynamics of Machine Learning Algorithms and Behavioral Game TheoryOn the Dynamics of Machine Learning Algorithms and Behavioral Game Theory
On the Dynamics of Machine Learning Algorithms and Behavioral Game Theory
 
Stochastic Variational Inference
Stochastic Variational InferenceStochastic Variational Inference
Stochastic Variational Inference
 
CVPR2016読み会 Sparsifying Neural Network Connections for Face Recognition
CVPR2016読み会 Sparsifying Neural Network Connections for Face RecognitionCVPR2016読み会 Sparsifying Neural Network Connections for Face Recognition
CVPR2016読み会 Sparsifying Neural Network Connections for Face Recognition
 
LCA and RMQ ~簡潔もあるよ!~
LCA and RMQ ~簡潔もあるよ!~LCA and RMQ ~簡潔もあるよ!~
LCA and RMQ ~簡潔もあるよ!~
 
Greed is Good: 劣モジュラ関数最大化とその発展
Greed is Good: 劣モジュラ関数最大化とその発展Greed is Good: 劣モジュラ関数最大化とその発展
Greed is Good: 劣モジュラ関数最大化とその発展
 
sublabel accurate convex relaxation of vectorial multilabel energies
sublabel accurate convex relaxation of vectorial multilabel energiessublabel accurate convex relaxation of vectorial multilabel energies
sublabel accurate convex relaxation of vectorial multilabel energies
 
DeepLearningTutorial
DeepLearningTutorialDeepLearningTutorial
DeepLearningTutorial
 
プログラミングコンテストでのデータ構造 2 ~動的木編~
プログラミングコンテストでのデータ構造 2 ~動的木編~プログラミングコンテストでのデータ構造 2 ~動的木編~
プログラミングコンテストでのデータ構造 2 ~動的木編~
 
Dragon: A Distributed Object Storage at Yahoo! JAPAN (WebDB Forum 2017)
Dragon: A Distributed Object Storage at Yahoo! JAPAN (WebDB Forum 2017)Dragon: A Distributed Object Storage at Yahoo! JAPAN (WebDB Forum 2017)
Dragon: A Distributed Object Storage at Yahoo! JAPAN (WebDB Forum 2017)
 
ディープラーニングの産業応用とそれを支える技術
ディープラーニングの産業応用とそれを支える技術ディープラーニングの産業応用とそれを支える技術
ディープラーニングの産業応用とそれを支える技術
 
PRML輪読#14
PRML輪読#14PRML輪読#14
PRML輪読#14
 
ウェーブレット木の世界
ウェーブレット木の世界ウェーブレット木の世界
ウェーブレット木の世界
 

多項式あてはめで眺めるベイズ推定 ~今日からきみもベイジアン~