Weitere ähnliche Inhalte
Ähnlich wie 階層ベイズとWAIC (10)
Mehr von Hiroshi Shimizu (20)
階層ベイズとWAIC
- 11. 数式的には
• 真の分布 q(x)
– なんらかの確率分布であり,それに従ってデータxが生成される
• 統計モデル p(x|θ)
– パラメータθによってxを予測する
• パラメータの分布 p(θ|X)
– すでに得たデータXによって推定されたパラメータ
• 予測分布 p(x|X)
– すでに得たデータXによって将来得られるデータxを予測
– 統計モデルをパラメータの分布で重みづけて平均したもの
- 26. WAIC
• Widely Applicable Information Criterion
– ただし,
– 第1項はデータと予測分布の当てはまり,第2項はパ
ラメータの分散の和(パラメータの不確実さの和)
• WAIC
– データと予測分布の距離が小さいほど小さい
– パラメータの数が少ないほど小さい
– パラメータの分散が小さいほど小さい
- 45. stanの結果
• 次のコードを走らせる
data <- list(y=baseball$HR)
fit1 <- stan("hbayes2.stan",data=data,
iter=600,warmup=100,chains=2)
print(fit1,digits=3,pars=c("m","s"))
パラメータを取り出す
mu <- mean(rstan::extract(fit1)$m)
theta <- mean(rstan::extract(fit1)$s)
負の二項分布と一致
- 62. ホームランの場合
• ポアソン分布
– 140人の打力が全員等しいと過程
• 負の二項分布
– 140人の平均的な打力と,その個人差を分散パラメータで
「グローバルにモデル化」
– 「一般的に,これぐらいばらつく」を推定
• ポアソン分布+ガンマ分布の階層ベイズ
– 140人の平均的な打力をポアソンで,打力の個人差を
ローカルパラメータとして個々に推定
– 「それぞれの選手の打力はこれぐらい」を推定
- 71. glmmstanパッケージ ver1.30
• しみづが作ったパッケージ
– library(devtools)
– install_github("norimune/glmmstan")
• 負の二項分布,ベータ二項分布に対応
– 過分散評価にはこちらのWAICを見るといいと思う
• 階層線形モデルのグローバルなWAICに対応
– 普通のWAICとWAIC_gの両方が出力される
– ただし,変量効果の組が一つの場合のみ