SlideShare a Scribd company logo
1 of 76
Download to read offline
5分でわかるベイズのお話
2015/08/12
@migi
ベイズの定理
ベイズ推定
ベイズ統計学
ベイズ確率
ベイジアンネットワーク
ベイジアンフィルター
このあたりの名前を1つでも
聞いたことがある人はいますか?
じゃあ
「ベイズの定理」の
「ベイズ」が
何かを知っている人いますか?
ベイズの定理を発見した人です
トーマス・ベイズ (Thomas Bayes)
1700年代初頭のイギリスの牧師さん
トーマス・ベイズ (Thomas Bayes)
1700年代初頭のイギリスの牧師さん
ベイズの定理とは?
ここで問題です
あなたは既婚者(♀)です
出張から帰ってきたら

タンスの中に見慣れぬ
女性もののパンツが…
さて、旦那さんが浮気を
している確率は?
問題というか大問題ですが
これも
ベイズの定理の範疇です
これを解くために
ベイズの定理を紹介します
DのもとでHである確率
HのもとでDである確率 × Hである確率
Dである確率
ベイズの定理
D=Data(データ), H=Hypothesis(仮定)
なぜこれが成り立つか?
トランプで説明します
ジョーカーを除く
52枚のトランプから
ハートのAを引く確率は?
Question
1/52
Answer
ジョーカーを除く
52枚のトランプから
ハートを引いて、
それがAである確率は?
Question
1/4 × 1/13 = 1/52
Answer
ジョーカーを除く
52枚のトランプから
Aを引いて、
それがハートである確率は?
Question
1/13 × 1/4 = 1/52
Answer
何が言いたいかと言うと
ハートを引いた時にAである確率
ハートを引く確率
Aを引いた時にハートである確率
Aを引く確率
×
×
社内のメガネの人の確率と
男性の確率でやっても
同じ感じですね
これを
ハートの確率 = H
Aの確率 = D
に置き換えてみます
DのもとでHである確率
Dである確率
HのもとでDである確率
Hである確率
×
×
D=Aである, H=ハートである
左辺の「Dである確率」を
右辺に移行します
DのもとでにHである確率
Dである確率
HのもとでDである確率
Hである確率
×
DのもとでHである確率
HのもとでDである確率 × Hである確率
Dである確率
最初に見せたこれと同じ形に
Q.E.D.
(大)問題に戻ります
データ=D=パンツを見つけた
仮定=H=浮気をしている
Hである確率
つまり
浮気をしている確率
よくわからんけど、世間一般的には4%の
夫婦は浮気をしているらしい
じゃあ【4%】
HのもとでDである確率
つまり
浮気していたとしてパンツが存在する確率
本当に浮気してるとしてもっと上手く隠しそうな…
じゃあ【60%】
Hである確率
つまり
パンツが存在する確率
考えるべきは
浮気をしている確率とその上でパンツがある確率
と
浮気をしていない確率とその上でパンツがある確率
浮気をしている確率とその上でパンツがある確率
4% × 60% = 2.4%
浮気をしていない確率とその上でパンツがある確率
ありうるか?
まぁ、男にはいろいろありますしね
テキトーに5%くらい
としときましょう
浮気をしていない確率とその上でパンツがある確率
(100% - 4%) × 5% = 4.8%
浮気をしている確率とその上でパンツがある確率
と
浮気をしていない確率とその上でパンツがある確率
この2つを足すと
2.4% + 4.8% = 【7.2%】
ということで
DのもとでにHである確率
Dである確率
HのもとでDである確率
Hである確率
×
D=パンツを見つけた, H=浮気をしている
パンツを見つけた時に
浮気をしている確率
7.2%
60%
4%
×
パンツを見つけた時に
浮気をしている確率
33.3%
みたいな感じになります
なんかめちゃくちゃ
恣意的ですね
それがベイズ理論です
ちなみに、専門用語
DのもとでにHである確率
Dである確率
HのもとでDである確率
Hである確率
×
事後確率
尤度
事前確率
ベイズ理論は
他にもいろいろと応用が効きます
モンティーホールのジレンマ
前に、確率と統計のLTの時に話したやつ
知らない人はggrks
モンティーホールのジレンマ
A/B/Cの3つの扉がありAを選んで司会者がCを開けた時
【Cが開けられてAに賞金がある確率】
Aに賞金があってCが開けられる確率×Aに賞金がある確率
/Cが開けられた確率
【Cが開けられてBに賞金がある確率】
Bに賞金があってCが開けられる確率×Bに賞金がある確率
/Cが開けられた確率
モンティーホールのジレンマ
※比較したいだけなので分母は同じなので省きます
【Cが開けられてAに賞金がある確率】
Aに賞金があってCが開けられる確率×Aに賞金がある確率
【Cが開けられてBに賞金がある確率】
Bに賞金があってCが開けられる確率×Bに賞金がある確率
モンティーホールのジレンマ
※それぞれの確率を代入
【Cが開けられてAに賞金がある確率】
1/2×1/3 = 1/6
【Cが開けられてBに賞金がある確率】
1×1/3 = 2/6
2倍の差が!
9.11事件
テロリストが飛行機をハイジャックして
ワールドトレードセンター(WTC)に突っ込む
最初の1機目が突っ込んだのを見てみんな
テロの可能性を認識
2機目が突っ込んだのを見てみんな
テロであることをほぼ確信
9.11事件
D = データ = WTCに飛行機が突っ込む
H = 仮定 = それはテロリストの意図した攻撃である
テロリストがそれを意図していた時に
WTCに突っ込む確率は【100%】
テロ攻撃である確率を仮に【0.005%】
テロじゃなくWTCに飛行機が突っ込む確率は
過去のデータから【0.008%】
9.11事件
これを計算すると
WTCに飛行機が突っ込んだ時にテロリストの攻撃で
ある確率は【38%】
さらにこれをさっき仮に【0.005%】としておいた
事前確率に入れ替えてもう一度計算すると
確率は【99.99%】まで跳ね上がる
なんとなく人間の感覚に
近いような
しかし
さっきから言っているように
めちゃくちゃ恣意的に思える
それがベイズ理論が
ここ300年くらい全くもって
評価されてこなかった理由です
それが今なぜ評価されているか
その理由は
ベイズ更新
とそれに伴う
理由不十分の法則
なんか新しい単語出てきましたが
2つとも今日すでに出てきてます
ベイズ更新
これを計算すると
WTCに飛行機が突っ込んだ時にテロリストの攻撃で
ある確率は【38%】
さらにこれをさっき仮に【0.005%】としておいた
事前確率に入れ替えてもう一度計算すると
確率は【99.99%】まで跳ね上がる
これ
D = データ = WTCに飛行機が突っ込む
H = 仮定 = それはテロリストの意図した攻撃である
テロリストがそれを意図していた時に
WDCに突っ込む確率は【100%】
テロ攻撃である確率を仮に【0.005%】
テロじゃなくWTCに飛行機が突っ込む確率は
過去のデータから【0.008%】
理由不十分の法則
これ
とても恣意的に見える事前確率ですが
その値が直感的なものでも
試行を繰り返すことで徐々に
正しい結果に近づいていきます
これが
人間の物事の捉え方にとても近しい
と言われています
Gmailのスパムフィルターもこの応用
「出会い」や「オオアリクイ」といったメールに含まれて
いる単語それぞれに、その単語が含まれていた
時にそのメールがスパムメールである確率を出す
↓
一定以上の確率の確率であればスパム認定
↓
ユーザの「このメールはスパムだ」
「このメールはスパムではない」ボタンを押した時の
アクションを見てベイズ更新
↓
さらに精度が高いフィルターに
オオアリクイ?????
なんでこんなタイトルになったかは
こちらで考察されています
http://antibayesian.hateblo.jp/entry/20111125/1322210338
ウェブ技術によって様々なアクションを
取得してのベイズ更新が
容易になったのと、
既存の頻度論的統計学ではできない
最適な行動を確率論的に決定すること
が重要視されてきている
↓
ベイズ理論ステキ!の潮流
ちなみに私は
恋愛やポーカーに関しても
このベイズ的な考え方で
ずっとプレイしています
(時間があれば実はここが一番話したい…)
ご清聴ありがとうございました
【参考文献】
『シグナル&ノイズ 天才データアナリストの「予測学」』
ネイト・シルバー
http://www.amazon.co.jp/dp/4822249808

More Related Content

Viewers also liked

関数型プログラミング入門 for Matlab ユーザー
関数型プログラミング入門 for Matlab ユーザー関数型プログラミング入門 for Matlab ユーザー
関数型プログラミング入門 for Matlab ユーザーIchiro Maruta
 
ゼロから始める自作 CPU 入門
ゼロから始める自作 CPU 入門ゼロから始める自作 CPU 入門
ゼロから始める自作 CPU 入門Hirotaka Kawata
 
RStanとShinyStanによるベイズ統計モデリング入門
RStanとShinyStanによるベイズ統計モデリング入門RStanとShinyStanによるベイズ統計モデリング入門
RStanとShinyStanによるベイズ統計モデリング入門Masaki Tsuda
 
指数分布とポアソン分布のいけない関係
指数分布とポアソン分布のいけない関係指数分布とポアソン分布のいけない関係
指数分布とポアソン分布のいけない関係Nagi Teramo
 
スパースモデリング入門
スパースモデリング入門スパースモデリング入門
スパースモデリング入門Hideo Terada
 
エクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについてエクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについてHiroshi Shimizu
 
混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)Takao Yamanaka
 
C++でできる!OS自作入門
C++でできる!OS自作入門C++でできる!OS自作入門
C++でできる!OS自作入門uchan_nos
 
[AWSマイスターシリーズ] AWS CLI / AWS Tools for Windows PowerShell
[AWSマイスターシリーズ] AWS CLI / AWS Tools for Windows PowerShell[AWSマイスターシリーズ] AWS CLI / AWS Tools for Windows PowerShell
[AWSマイスターシリーズ] AWS CLI / AWS Tools for Windows PowerShellAmazon Web Services Japan
 
はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-
はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-
はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-Naoki Yanai
 
Simple perceptron by TJO
Simple perceptron by TJOSimple perceptron by TJO
Simple perceptron by TJOTakashi J OZAKI
 
機械学習によるデータ分析まわりのお話
機械学習によるデータ分析まわりのお話機械学習によるデータ分析まわりのお話
機械学習によるデータ分析まわりのお話Ryota Kamoshida
 

Viewers also liked (12)

関数型プログラミング入門 for Matlab ユーザー
関数型プログラミング入門 for Matlab ユーザー関数型プログラミング入門 for Matlab ユーザー
関数型プログラミング入門 for Matlab ユーザー
 
ゼロから始める自作 CPU 入門
ゼロから始める自作 CPU 入門ゼロから始める自作 CPU 入門
ゼロから始める自作 CPU 入門
 
RStanとShinyStanによるベイズ統計モデリング入門
RStanとShinyStanによるベイズ統計モデリング入門RStanとShinyStanによるベイズ統計モデリング入門
RStanとShinyStanによるベイズ統計モデリング入門
 
指数分布とポアソン分布のいけない関係
指数分布とポアソン分布のいけない関係指数分布とポアソン分布のいけない関係
指数分布とポアソン分布のいけない関係
 
スパースモデリング入門
スパースモデリング入門スパースモデリング入門
スパースモデリング入門
 
エクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについてエクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについて
 
混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)
 
C++でできる!OS自作入門
C++でできる!OS自作入門C++でできる!OS自作入門
C++でできる!OS自作入門
 
[AWSマイスターシリーズ] AWS CLI / AWS Tools for Windows PowerShell
[AWSマイスターシリーズ] AWS CLI / AWS Tools for Windows PowerShell[AWSマイスターシリーズ] AWS CLI / AWS Tools for Windows PowerShell
[AWSマイスターシリーズ] AWS CLI / AWS Tools for Windows PowerShell
 
はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-
はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-
はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-
 
Simple perceptron by TJO
Simple perceptron by TJOSimple perceptron by TJO
Simple perceptron by TJO
 
機械学習によるデータ分析まわりのお話
機械学習によるデータ分析まわりのお話機械学習によるデータ分析まわりのお話
機械学習によるデータ分析まわりのお話
 

5分でわかるベイズのお話