【DBDA 勉強会 2013 夏】Chapter 12: Bayesian Approaches to Testing a Point (‘‘Null’’) Hypothesis

Doing Bayesian Data Analysis
Chapter 12: Bayesian Approaches to Testing
a Point (‘‘Null’’) Hypothesis
東京大学松尾研究室修士２年
飯塚修平@tushuhei
2013/08/25 1

この章の内容
1.  パラメタ評価アプローチ (estimation)
–  ひとつの事前確率
–  その値は信頼出来る？
2.  モデル比較アプローチ (model comparison)
–  ふたつの事前確率
–  どちらのモデルが信頼出来る？
3.  それぞれのアプローチの注意点
2013/08/25 2
仮説検定についてベイジアンの立場から考えよう

彼ってどんな性格なの？
どうしようもなく駄目なひとなのか、
とても潔癖で近づきがたいひとなのか、
それとも、その間のどこかなのかな。

導入
•  こういう悩みはつきない
–  これからコイントスで先行を決めるんだけど、このコインで大丈夫なのかな？
–  この新規開発した薬って本当に効くのかな？プラセボじゃないよね？
–  その他諸々の「A と B どっちがいいかな。」
à ベイジアン風に言うと「偏り θ = 0.5」という帰無仮説は棄却されるのか、それ
とも採用されるのか？
•  ベイジアンだと、伝統的統計学より進んだ考え方で検定することが
できる
–  棄却 or 採用よりも 95% HDI を得られる方が情報量が多い
–  事後確率分布を得ることで、パラメタと信頼度の関係を眺めることができる
•  今回取り上げる方法は 2 つ
–  パラメタ評価アプローチ
事後確率の 95% HDI の中に帰無値（null value, 仮説検定したい値）が入るか
–  モデル比較アプローチ
「帰無値しか許さないモデル」 vs 「それ以外の値も広く許すモデル」
2013/08/25 3

パラメタ評価アプローチ
•  基本的な考え方
–  もし帰無値が事後確率の 95% HDI の外にあれば、その帰無値は信頼できる値で
はない。
–  もし帰無値が事後確率の 95% HDI の中にあれば、その帰無値は信頼できる値の
ひとつだと言える。
•  つまり、ひとつの事前確率から事後確率を算出し、帰無値の信頼性
を評価する。
•  実際の例
–  キーボードゲーム（パラメタの値を評価する例）
–  ホットハンド・ジンクス（パラメタの値の差を評価する例）
2013/08/25 4

【例】キーボードゲーム
•  被験者に以下のようなゲームをプレイしてもらう。
•  被験者はディスプレイに表示された単語に対して適切なキーを叩く。
•  正解すると、報酬を得ることができる。ルールは図の通り。
2013/08/25 5
“radio”

“ocean”
ディスプレイ “radio”

“mountain”
キーボード F J F J
報酬報酬

【例】キーボードゲーム
•  その後被験者に対して、これまでの学習からは正解がわからないテ
ストを与える
–  ディスプレイに “radio” とのみ表示する
–  ディスプレイに ”ocean” と “mountain” の両方を表示する
•  それぞれのテストについて被験者の叩くキーが偏るか？
2013/08/25 6
[Prior] θ = (F が叩かれる回数 /
J が叩かれる回数) とし、一様
分布と仮定する。
[Likelihood] テストの結果
得られた尤度。片方のキー
に偏っている。
[Posterior] 事後確率の 95% HDI に θ = 0.5 が
含まれなかった。すなわち、被験者は 50:50
でキーを選択するのではなく、いずれかに偏っ
ていた。

【例】ホットハンド・ジンクス
•  バスケットボールのジンクス：
シュートに成功した後の方が、失敗した後よりもシュートが決まり
やすくなる。à すなわち θ_AfterSuccess と θ_AfterFailure で違い
があるのか？
•  θ_AfterSuccess - θ_AfterFailure = 0 が 95% HDI 内に入っている。
à ジンクスなんてなかった
2013/08/25 7

相関するパラメタの場合
•  それぞれの場合のθの分布に着目しても、パラメタ間の関係は見えない。
•  相関の正負は、パラメタの差（この場合 θ1 - θ2）の分布の幅に現れる。
–  正の相関à近似直線（line of equality）の幅が狭い
à 0 を 95% HDI に含まず、θ1 と θ2 が異なることを示している。
–  負の相関à近似直線の幅が広い
2013/08/25 8
θ1 とθ2 が相関する場合 θ1 とθ2 が逆相関する場合
95% HDI
0.0279 < (θ1 – θ2) < 0.206
狭い; 0 を HDI に含まない
95% HDI
-0.26 < (θ1 – θ2) < 0.494
広い; 0 を HDI に含む

ROPE の導入
•  Region of Practical Equivalence
•  ROPE を導入することで、実用的な範囲内で帰無値が信頼できるか
否かを判断できるようになる。
–  幅を持たせることで、実用上十分なのに棄却してしまう可能性を減らす。
•  基本的な考え方
–  ROPE 全体が事後確率の 95% HDI の外にあれば、その帰無値は用いることが出
来ない [1]
–  ROPE が事後確率の 95% HDI 全体を完全に含んでいれば、その帰無値は採用で
きる [2]
2013/08/25 9
ROPE 95% HDI 95% HDIROPE
[1] [2]

【例】コインは偏ってるか？
•  理想的なコイン: 表が出る確率 θ = 0.5 ß 帰無値
•  ROPE: θ = [0.45, 0.55]
•  10,000 回コインを投げて 5,200 回表が出た。
•  à 95% HDI = [0.51, 0.53]
•  帰無値は HDI に含まれないが、HDI は十分 ROPE 内に収まっている。
•  実用上、θ = 0.5 として扱って OK
2013/08/25 10
0.45 0.55ROPE 0.51 0.53
95% HDI
0.50
帰無値

モデル比較アプローチ
•  次に、モデル比較として帰無値の信頼性を考える。
•  帰無モデル (null model): M_null
–  帰無値のみを許すモデル
•  対立モデル (alternative model): M_alt
–  パラメタを広い範囲で許すモデル
•  この２つのモデルの比較として、仮説検定問題を捉え直す。
2013/08/25 11

M_null (θ1=θ2) M_alt (一様)
【例】ふたつのコインは同じ？
•  ふたつのコインの表が出る確
率はそれぞれ θ1, θ2
•  M_null: θ1 = θ2 (ふたつのコ
インは同じという帰無仮説）
•  M_alt: 一様分布
•  コイントスの回数 N = 7
•  表が出た回数 z1 = 5, z2 = 2
•  p(D|M_null) = 1.94*10^(-5)
•  p(D|M_alt) = 3.54*10^(-5)
•  p(M_null) = p(M_alt) = 0.5
2013/08/25 12
M_alt がわずかながら勝利
だが、Bayer s Factor の
値は小さい
→棄却は難しい

【例】記憶力を高める BGM は？
•  被験者にある BGM がかかっている部屋の中で 20 個の単語を暗記
してもらう。
•  θ_ij: 被験者 i が BGM j の元で単語を暗記できる割合
–  思い出せる or 思い出せない（二値）なので、ベータ関数で表すことが可能
θ_ij = beta(θ_ij|μ_j, κ_j, (1-μ_j)κ_i)
•  BGM の種類 (平均値)
1.  ヘビメタ (11.85)
2.  バッハ (9.85)
3.  ベートーベン (9.50)
4.  モーツァルト (9.60)
à  何かを覚える時はクラシックよりもヘビメタ！
à  では、この４つのグループに差があると言えるのか？
「差がある」という帰無仮説は棄却されるのか？
2013/08/25 13

•  まずはパラメタ評価アプローチに戻って、それぞれのグループ間の
パラメタに差があるか仮説検定を行う。
–  ホットハンド・ジンクスの例を参照
•  パラメタ μ_j の差をとって比較すると、各グループを [[1], [2, 3, 4]]
と分けることができる。特にグループ 1 と 3, 4 の間の差が大きい。
2013/08/25 14

•  モデル比較アプローチでは、以下２つのモデルの比較として問題を
捉え直す。
–  SameMu: ４つのグループ間で差がないとするモデル（帰無モデル）
–  DiﬀMu: ４つのグループ間で差があるとするモデル（対立モデル）
•  MCMC で見てみると、SameMu の方が勝っている。
à ４つのグループには差がない？？
2013/08/25 15

•  結局、４つのグループは同じなの？違うの？
•  【モデル比較アプローチ】
４つのパラメタをすべてのグループが共有するモデルと、それぞれ
のグループが異なるパラメタを持つモデルの比較では、前者の方が
良かった。が、ベストではない。
•  【パラメタ評価アプローチ】
４つのモデルで異なるパラメタを持たせて比較した結果、[[1], [2, 3,
4]] とグルーピングできた。
•  à グループ 1 とグループ 2, 3, 4 でパラメタを分ける 2-パラメタモ
デルが実は最も優秀である (Ex 12.1 で確認すべし)
2013/08/25 16
彼ってどんな性格なの？
どうしようもなく駄目なひとなのか、
とても潔癖で近づきがたいひとなのか、
それとも、その間のどこかなのかな。

注意点
パラメタ評価アプローチ
•  ROPE と HDI の幅の比は、帰無値が正しい確率を表しているのではない。
パラメタが帰無値に等しい確率を表しているのだ。
•  十分に比が大きい時のみ、この値は意味を持つ。何故なら、データが十分
でないとき、HDI の幅が大きくなってこの比が小さくなる可能性があるか
らだ。
モデル比較アプローチ
•  あくまで帰無モデルの信頼性は相対的なもの。
–  記憶と BGM の例を参照。
•  そのため、対立モデルは十分に吟味された、うまくいきそうなモデルを採
用すべきである。
–  慣習だからといって、何も考えずに一様分布モデルを採用するのは危険。
–  ベストなモデルがその過程で見過ごされてしまう可能性がある。
•  そのためには、事前知識を駆使して妥当なモデルを考えること。
2013/08/25 17

【DBDA 勉強会 2013 夏】Chapter 12: Bayesian Approaches to Testing a Point (‘‘Null’’) Hypothesis

Recommended

Recommended

More Related Content

Viewers also liked

Viewers also liked (9)

More from Shuhei Iitsuka

More from Shuhei Iitsuka (20)

【DBDA 勉強会 2013 夏】Chapter 12: Bayesian Approaches to Testing a Point (‘‘Null’’) Hypothesis