10. チョコレートをたくさん食べさせれば
受賞者が増えるのか?(因果関係)
• No, 疑似相関かも (Maurage+2013, J. Nutrition)
10
チョコ 賞 ?チョコ 賞
or
GDP GDP
チョコ 賞
or
GDP
相関係数 0.791
P値 < 0.001
複数の因果関係が
そのような相関関係を与えるギャップ
チョコ
賞
潜在共通原因 潜在共通原因 潜在共通原因
(相関関係)
15. 因果効果(介入効果)
(Rubin, 1974; Pearl, 2000)
• xの値をcからdに(外的に)変化させた時に、
yの値が平均的にどのくらい変化するか
15
y x
f
ey ex
cxdoyEdxdoyE ||:)( 因果効果平均
cd - 線形の場合
yy
xx
efxy
efx
xy
b
b b
注: yをxに回帰しても, 回帰係数 ≠ b
(潜在共通原因fを無視してはだめ)
16. の計算
16
y x
f
ey ex yy
xx
efxy
efx
xy
b b
y x
f
ey yy efxy
x
y
b b
cxdo xの値を強制的にcにする
c
c
cxdoyE |下のモデルでの E(y) が
cxdoyE |
17. 逆に、yを変化させたら?
17
y x
f
ex
cydoxEdydoxE ||:)( 因果効果平均
y
efx xxx
0
c
注: yをxに回帰しても, 回帰係数 ≠ 0
(潜在共通原因fを無視してはだめ)
相関に基づいて因果を定義しちゃだめ
c
18. 因果探索の基本問題
18
潜在共通原因 f 潜在共通原因f 潜在共通原因f
yy
xx
efgy
efygx
,
,,
yy
xx
efxgy
efgx
,,
,
yy
xx
efgy
efgx
,
,
データ行列
x
y
~i.i.d. p x, y( )
obs.1
仮定: どれかが
データを生成
問題: どれが生成
したかを推定
obs.nobs.2 …
y x
f
y x
f
y x
f
ey ex ey ex ey ex
ex,ey, f の分布ex,ey, f の分布 ex,ey, f の分布
構
造
方
程
式
モ
デ
ル
構
造
方
程
式
モ
デ
ル
構
造
方
程
式
モ
デ
ル
19. 因果探索: 3つのアプローチ
1. ノンパラ
– 関数形にも分布にも仮定おかず どれかわからない
2. パラメトリック
– 線形+ガウス分布 どれかわからない
3. セミパラ
– 線形+非ガウス分布 どれかわかる
19
潜在共通原因f 潜在共通原因f 潜在共通原因f
yy
xx
efgy
efygx
,
,,
yy
xx
efxgy
efgx
,,
,
yy
xx
efgy
efgx
,
,
y x
f
y x
f
y x
f
ey ex ey ex ey ex
ex,ey, f の分布ex,ey, f の分布 ex,ey, f の分布
構
造
方
程
式
モ
デ
ル
構
造
方
程
式
モ
デ
ル
構
造
方
程
式
モ
デ
ル
27. • Linear Non-Gaussian Acyclic Model (LiNGAM)
(Shimizu, Hoyer, Hyvarinen, & Kerminen, 2006)
• データXから因果方向, 係数が識別可能
• PCで数百変数はokな推定アルゴリズムあり
多変数でも
27
i
ij
jiji exbx
x1 x2
x3
21b
23b13b
2e
3e
1e
- 非巡回
- 非ガウス外生変数(誤差) ei
- ei は互いに独立
(潜在共通原因なし)
eBxx or