因果推論の基礎

Hatsuru Morita
Hatsuru MoritaProfessor of Law um Tohoku University
因果推論の基礎 
――ミクロ計量経済学の最近の潮流から―― 
森田果y 
hatsuru@law.tohoku.ac.jp 
y 東北大学大学院法学研究科 
法社会学会関東研究支部定例研究会(早稲田大学) 
2014 年12 月13 日 
森田(東北大) 実証分析入門演習Dec 13, 2014 1 / 28
Introduction 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 2 / 28
Introduction 
伝統的な法学における実証分析の利用 
記述的推論 
データを要約統計量(summary statistics)・記述統計量(descritive 
statistics) の形にまとめる 
mean, median, maximum/minimum, variance など 
これだけでも,〔上手に行えば――King et al 1994〕分かることは結構 
ある 
相関関係(correlation, association) の計算 
基本的にはOLS(最小二乗法による線形回帰)やクロス集計 
差の検定 
e.g., 男女(の平均賃金etc)の間に有意な差があるかどうかの検定 
森田(東北大) 実証分析入門演習Dec 13, 2014 3 / 28
Introduction 
最近の法学研究における実証分析の利用 
より政策的な方向へ 
consequentialism | 法ルールがその目的を達成できているかどうか? 
program evaluation と呼ばれる分野との接合 
単なる記述的推論ではなく,因果推論(causal inference)の重視 
相関関係ではなく,因果関係の評価 
経済学や政治学でのトレンドを反映 
医療でのEBM なども因果推論の世界(統計学の世界では裏でつな 
がっている) 
因果推論では,推定手法(統計ソフトウェアが計算してくれる部分) 
よりも,リサーチデザイン(どこに因果関係を見いだすか,うまく 
仕組む)ことの方が重要 
森田(東北大) 実証分析入門演習Dec 13, 2014 4 / 28
因果推論の根本問題 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 5 / 28
因果推論の根本問題 
基本概念 
a la RCM (Rubin Causal Model) 
unit: 対象 
treatment: 介入がなかった場合(=control)と比較して,それが 
あった場合の効果を測定したいと考えている(政策)介入 
potential outcomes: ユニットにtreatment があった場合となかった 
場合について,ユニットが取り得る(=まだ観察されていないもの 
である点に注意!)値 
counterfactual: 実現しなかった方のpotential outcome 
causal effect: 1 つ1 つのユニットについて,treatment があった場合 
のpotential outcome とtreatment がなかった場合のpotential 
outcome との間の差 
`The Fundamental Problem of Causal Inference': 私たちは,複数の 
potential outcome のうち,最大で1 個しか観察することはできない 
から,causal effect を直接観察することはできない 
森田(東北大) 実証分析入門演習Dec 13, 2014 6 / 28
因果推論の根本問題 
具体例:単純な差分をとる場合 
ユニット=ある時点の「私」。頭痛がある。 
treatment =頭痛薬アスピリンの投与。 
Y = 2 時間後の「私」の頭痛の評価。treatment の有無で,2 通りあ 
り得る。 
Unit 当初の頭痛potential outcomes Y へのcausal effect 
X Y (Asp) Y (Not) Y (Asp)  Y (Not) 
「私」80 25 75 -50 
森田(東北大) 実証分析入門演習Dec 13, 2014 7 / 28
因果推論の前提条件 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 8 / 28
因果推論の前提条件 
基本概念:因果推論のための前提条件 
replication: 少なくとも1 つのユニットはtreatment を受け,少なく 
とも1 つのユニットはtreatment を受けない(control)。複数の対象 
の間のvariation でもいいし,単一の対象が異なる時点でvariation が 
あってもよい。 
SUTVA (stable unit-treatment-value assumption):2 つの内容がある 
a) 1 つ1 つのユニットについて,同時で1 つのtreatment しか働かず, 
control も1 種類しかない 
b) ユニット間に干渉がない(spill over effect や一般均衡効果は存在し 
ない) 
assignment mechanism: どのユニットがtreatment を受け,どのユ 
ニットがcontrol になるかを決定するメカニズム 
森田(東北大) 実証分析入門演習Dec 13, 2014 9 / 28
因果推論の前提条件 
Nユニット・処置2 つで,SUTVA が満たされるケース 
Unit X Y (1) Y (0) ユニットレベルの因果効果 
1 X1 Y1(1) Y1(0) Y1(1)  Y1(0) 
2 X2 Y2(1) Y2(0) Y2(1)  Y2(0) 
... 
... 
... 
... 
... 
i Xi Yi(1) Yi(0) Yi(1)  Yi(0) 
... 
... 
... 
... 
... 
N XN YN(1) YN(0) YN(1)  YN(0) 
森田(東北大) 実証分析入門演習Dec 13, 2014 10 / 28
因果推論の前提条件 
population level の因果効果 
Yi(1) とYi(0) を比較するのが基本 
ただし,このようなユニットレベル因果効果を直接観察することは不 
可能なので,代わりに... 
1 と0 との間の平均因果効果average causal effect 
Ave[Yi(1)  Yi(0)] = 1 
N 
ΣN 
i=1(Yi(1)  Yi(0)) 
1 と0 との間のメディアン因果効果 
Median[Yi(1)  Yi(0)] 
などなど... を推定していくことになる 
森田(東北大) 実証分析入門演習Dec 13, 2014 11 / 28
割当メカニズムの重要性 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 12 / 28
割当メカニズムの重要性 
割当メカニズム 
具体例=完璧な医者 
Potential Outcomes 
Unit Control Y (0) Treatment Y (1) 
1 13 14 
2 6 0 
3 4 1 
4 5 2 
5 6 3 
6 6 1 
7 8 10 
8 8 9 
`true' average 7 5 
average causal effect = -2 
森田(東北大) 実証分析入門演習Dec 13, 2014 13 / 28
割当メカニズムの重要性 
割当メカニズム 
完璧な医者が,一人一人について最適な治療方法を適用すると: 
W は,treatment のあり(1) なし(0) を示す 
Potential Outcomes 
Unit W Control Y (0) Treatment Y (1) 
1 1 ? 14 
2 0 6 ? 
3 0 4 ? 
4 0 5 ? 
5 0 6 ? 
6 0 6 ? 
7 1 ? 10 
8 1 ? 9 
`observed' average 5.4 11 
森田(東北大) 実証分析入門演習Dec 13, 2014 14 / 28
割当メカニズムの重要性 
補完imputation による因果推論 
完璧な医者が最善を尽くしているとなると,欠損データの補完がで 
きる: 
Potential Outcomes 
Unit W Control Y (0) Treatment Y (1) 
1 1 14 14 
2 0 6 6 
3 0 4 4 
4 0 5 5 
5 0 6 6 
6 0 6 6 
7 1 10 10 
8 1 9 9 
`observed' average 7.5 7.5 
森田(東北大) 実証分析入門演習Dec 13, 2014 15 / 28
割当メカニズムの重要性 
さまざまな割当メカニズム 
assignment mechanism: 観察される潜在的結果と欠損する潜在的結 
果を振り分けるもの: 
Pr(WjX; Y (0); Y (1)) 
混同的でないunconfounded 割当メカニズム:Pr(WjX) 
確率的なprobabilistic 割当メカニズム:Pr(Wi = 1jX; Y (0); Y (1)) 
個別的なindividualistic 割当メカニズム: 
AM / ΠN 
i=1 Pr(WijXi; Yi(0); Yi(1)) 
古典的なランダム化実験: 
AM / 
ΠN 
i=1 Pr(WijXi) 
ちなみに,プロペンシティスコア(傾向スコアpropensity score): 
Pr(Wi = 1jXi) 
森田(東北大) 実証分析入門演習Dec 13, 2014 16 / 28
ランダム化:特殊な割当メカニズム 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 17 / 28
ランダム化:特殊な割当メカニズム 
ランダム化=因果推論のもう一つの手法 
randomization =割当メカニズムを無作為なものとする(ただしX 
に依存させてもよい)ことで,treatment とcontrol とが「だいたい 
同じ」(もうちょっと言うと,共変量covariate がbalance している) 
状況に持ち込み,Yobs(1)Yobs(0) = Y (1) Y (0) となるように仕組 
む方法。基本的には,平均やメディアンなどを見る。 
最近のネット企業(典型例はfacebook: 
https://research.facebook.com/)は,ランダム化実験を実施し 
ている 
契約法・消費者法などでも,ランダム化実験の活用はどんどん増えて 
いる 
開発経済学などでも,ランダム化実験(フィールド実験)をかなり行 
うようになってきている 
けれども,社会科学においては,倫理的・法的な理由で,ランダム 
化実験を実施することができない場合がまだまだ多い 
森田(東北大) 実証分析入門演習Dec 13, 2014 18 / 28
ランダム化:特殊な割当メカニズム 
観察データの分析をランダム化実験と同じようにデザイ 
ンするには 
1 デザイン段階が完了するまで,結果データは見ないようにする 
2 意思決定者(割当メカニズムを実行している者)がどのように考え 
て割当を行っているのかについて分析し,割当に際して鍵となって 
いる共変量を取り出す 
3 この共変量が,入手できなかったり,ノイズの多いデータだったら, 
恐らくそのデータセットを使うのはあきらめて,別のデータセット 
を探した方が吉 
4 treatment/control グループが,バランスしている(=観察された共 
変量がほぼ同じような分布をしている)ようなサブグループを見つ 
け出す 
バランスしているかどうかには,分布を描いて目視してみることが 
有益 
必ずしも常に,十分なバランスが実現できるとは限らない 
この場合の推論は,当該サブグループの範囲内であることに注意 
森田(東北大) 実証分析入門演習Dec 13, 2014 19 / 28
さまざまな因果推論の手法 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 20 / 28
さまざまな因果推論の手法 
マッチング 
ランダム化実験の基本アイデア 
treatment/control の間で,共変量にバランスがとれた状態を実現する 
それならば,treatment に属する各ユニットについて,共変量が「同 
じ」ユニットをcontrol から選び出してきて比較すれば良い: 
matching 
共変量が全く同じものをマッチング 
共変量ができるだけ近いものをマッチング 
propensity score でマッチング 
最近のビッグデータでは,かなり正確なマッチングが実現できるよ 
うになってきている 
cf. ビッグデータ関連では,EL も発展してきている(まだまだ 
applied の世界での実例はあまり見ないが...) 
森田(東北大) 実証分析入門演習Dec 13, 2014 21 / 28
さまざまな因果推論の手法 
DD/DiD 
differences-in-differences: (Y1T (1)  Y0C(1))  (Y0T (0)  Y0C(0)) 
時点Treatment Control 
時点0 Y1T (0) Y0T (0) Y1C(0) Y0C(0) 
時点1 Y1T (1) Y0T (1) Y1C(1) Y0C(1) 
Red texts are counterfactuals. 
私たちが知りたいもの:Y1T (1)  Y0T (1) 
一見,それらしそうな選択し: 
ビフォーアフター:Y1T (1)  Y0T (0) 
処置群vs コントロール群:Y1T (1)  Y0C(1) 
森田(東北大) 実証分析入門演習Dec 13, 2014 22 / 28
さまざまな因果推論の手法 
DD/DiD 
森田(東北大) 実証分析入門演習Dec 13, 2014 23 / 28
さまざまな因果推論の手法 
FE 
森田(東北大) 実証分析入門演習Dec 13, 2014 24 / 28
さまざまな因果推論の手法 
IV/LATE 
confounded な割当メカニズムについても利用可能 
natural experiment を探す:instrumental variable 
具体例(Angrist のベトナム戦争徴兵制のくじ) 
従軍経験が賃金に与える影響の測定 
ベトナム戦争時の徴兵は,くじ:ランダムな自然実験 
くじに「当選する」かどうかはランダムだが,くじに当選することに 
よって従軍確率が増加し,それによって賃金は左右される 
wrong IV とweak IV に注意 
wrong IV:「IV が従属変数に影響するのは,内生的な説明変数を通じ 
てだけ」というexclusion restriction [only through condition] が充足さ 
れない 
weak IV:IV と内生的な説明変数との相関関係が弱い 
また,IV はLATE (local average treatment effect on compliers) に過 
ぎない〔されどLATE〕 
complier = IV によって影響を受けるユニット 
森田(東北大) 実証分析入門演習Dec 13, 2014 25 / 28
さまざまな因果推論の手法 
RD 
恣意的な規制・介入が存在している場合 
その規制の近傍では,ランダム化が実現しているはず 
それであれば,近傍のデータを取り出せば,規制の有無の影響を測定 
できるはず 
具体例 
負債額に基づく規制の変化 
世帯収入に基づく社会保障給付の変化 
森田(東北大) 実証分析入門演習Dec 13, 2014 26 / 28
因果推論と構造推定 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 27 / 28
因果推論と構造推定 
因果推論vs 構造推定 
因果推論:最小限の前提に依拠して,因果関係を推定 
伝統的な計量経済学における構造推定:世界が(経済学)モデルに 
したがって動いていると仮定した上で,モデルのパラメタを推定 
いわゆる構造方程式(SEM/structural equation model)とは違う 
両者の対立点 
internal validity vs external validity 
前提条件の明示 
経済学教育への影響 
分野の違い 
森田(東北大) 実証分析入門演習Dec 13, 2014 28 / 28
1 von 28

Recomendados

統計的因果推論への招待 -因果構造探索を中心に- von
統計的因果推論への招待 -因果構造探索を中心に-統計的因果推論への招待 -因果構造探索を中心に-
統計的因果推論への招待 -因果構造探索を中心に-Shiga University, RIKEN
27.3K views56 Folien
『バックドア基準の入門』@統数研研究集会 von
『バックドア基準の入門』@統数研研究集会『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会takehikoihayashi
39K views122 Folien
相関と因果について考える:統計的因果推論、その(不)可能性の中心 von
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心takehikoihayashi
55.4K views54 Folien
統計的因果推論 勉強用 isseing333 von
統計的因果推論 勉強用 isseing333統計的因果推論 勉強用 isseing333
統計的因果推論 勉強用 isseing333Issei Kurahashi
21.6K views43 Folien
因果探索: 基本から最近の発展までを概説 von
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説Shiga University, RIKEN
15.3K views47 Folien
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展 von
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展Shiga University, RIKEN
13.6K views130 Folien

Más contenido relacionado

Was ist angesagt?

比例ハザードモデルはとってもtricky! von
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!takehikoihayashi
82.3K views43 Folien
非ガウス性を利用した 因果構造探索 von
非ガウス性を利用した因果構造探索非ガウス性を利用した因果構造探索
非ガウス性を利用した 因果構造探索Shiga University, RIKEN
5.5K views56 Folien
機械学習による統計的実験計画(ベイズ最適化を中心に) von
機械学習による統計的実験計画(ベイズ最適化を中心に)機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)Kota Matsui
13.1K views216 Folien
21世紀の手法対決 (MIC vs HSIC) von
21世紀の手法対決 (MIC vs HSIC)21世紀の手法対決 (MIC vs HSIC)
21世紀の手法対決 (MIC vs HSIC)Toru Imai
24.4K views34 Folien
正準相関分析 von
正準相関分析正準相関分析
正準相関分析Akisato Kimura
15K views19 Folien

Was ist angesagt?(20)

比例ハザードモデルはとってもtricky! von takehikoihayashi
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!
takehikoihayashi82.3K views
機械学習による統計的実験計画(ベイズ最適化を中心に) von Kota Matsui
機械学習による統計的実験計画(ベイズ最適化を中心に)機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)
Kota Matsui13.1K views
21世紀の手法対決 (MIC vs HSIC) von Toru Imai
21世紀の手法対決 (MIC vs HSIC)21世紀の手法対決 (MIC vs HSIC)
21世紀の手法対決 (MIC vs HSIC)
Toru Imai24.4K views
構造方程式モデルによる因果探索と非ガウス性 von Shiga University, RIKEN
構造方程式モデルによる因果探索と非ガウス性構造方程式モデルによる因果探索と非ガウス性
構造方程式モデルによる因果探索と非ガウス性
グラフィカル Lasso を用いた異常検知 von Yuya Takashina
グラフィカル Lasso を用いた異常検知グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知
Yuya Takashina15.2K views
因果推論の奥へ: "What works" meets "why it works" von takehikoihayashi
因果推論の奥へ: "What works" meets "why it works"因果推論の奥へ: "What works" meets "why it works"
因果推論の奥へ: "What works" meets "why it works"
takehikoihayashi23.3K views
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012) von Taiji Suzuki
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
統計的学習理論チュートリアル: 基礎から応用まで (Ibis2012)
Taiji Suzuki7.8K views
ベイズ推論とシミュレーション法の基礎 von Tomoshige Nakamura
ベイズ推論とシミュレーション法の基礎ベイズ推論とシミュレーション法の基礎
ベイズ推論とシミュレーション法の基礎
Tomoshige Nakamura20.2K views
グラフィカルモデル入門 von Kawamoto_Kazuhiko
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
Kawamoto_Kazuhiko117.9K views
星野「調査観察データの統計科学」第3章 von Shuyo Nakatani
星野「調査観察データの統計科学」第3章星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章
Shuyo Nakatani33.2K views
深層生成モデルと世界モデル von Masahiro Suzuki
深層生成モデルと世界モデル深層生成モデルと世界モデル
深層生成モデルと世界モデル
Masahiro Suzuki16.6K views
関数データ解析の概要とその方法 von Hidetoshi Matsui
関数データ解析の概要とその方法関数データ解析の概要とその方法
関数データ解析の概要とその方法
Hidetoshi Matsui9.6K views
Rubinの論文(の行間)を読んでみる-傾向スコアの理論- von Koichiro Gibo
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
Koichiro Gibo6.8K views
ベイズ統計学の概論的紹介 von Naoki Hayashi
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
Naoki Hayashi78.9K views
DID, Synthetic Control, CausalImpact von Yusuke Kaneko
DID, Synthetic Control, CausalImpactDID, Synthetic Control, CausalImpact
DID, Synthetic Control, CausalImpact
Yusuke Kaneko25.9K views

Similar a 因果推論の基礎

Gasshuku98 von
Gasshuku98Gasshuku98
Gasshuku98隆浩 安
1.6K views137 Folien
明日から読めるメタ・アナリシス von
明日から読めるメタ・アナリシス明日から読めるメタ・アナリシス
明日から読めるメタ・アナリシスYasuyuki Okumura
65.3K views118 Folien
Fumitot ver.2.3 von
Fumitot ver.2.3Fumitot ver.2.3
Fumitot ver.2.3FumitoT
2K views33 Folien
「診断精度研究のメタ分析」の入門 von
「診断精度研究のメタ分析」の入門「診断精度研究のメタ分析」の入門
「診断精度研究のメタ分析」の入門yokomitsuken5
11.8K views70 Folien
ソフトウェアテストの再検討 von
ソフトウェアテストの再検討 ソフトウェアテストの再検討
ソフトウェアテストの再検討 ikedkana
991 views16 Folien
傾向スコアの概念とその実践 von
傾向スコアの概念とその実践傾向スコアの概念とその実践
傾向スコアの概念とその実践Yasuyuki Okumura
93.6K views61 Folien

Similar a 因果推論の基礎(20)

明日から読めるメタ・アナリシス von Yasuyuki Okumura
明日から読めるメタ・アナリシス明日から読めるメタ・アナリシス
明日から読めるメタ・アナリシス
Yasuyuki Okumura65.3K views
Fumitot ver.2.3 von FumitoT
Fumitot ver.2.3Fumitot ver.2.3
Fumitot ver.2.3
FumitoT2K views
「診断精度研究のメタ分析」の入門 von yokomitsuken5
「診断精度研究のメタ分析」の入門「診断精度研究のメタ分析」の入門
「診断精度研究のメタ分析」の入門
yokomitsuken511.8K views
ソフトウェアテストの再検討 von ikedkana
ソフトウェアテストの再検討 ソフトウェアテストの再検討
ソフトウェアテストの再検討
ikedkana991 views
傾向スコアの概念とその実践 von Yasuyuki Okumura
傾向スコアの概念とその実践傾向スコアの概念とその実践
傾向スコアの概念とその実践
Yasuyuki Okumura93.6K views
患者報告式アウトカム尺度における 臨床的意味のある変化の定め方 von Yasuyuki Okumura
患者報告式アウトカム尺度における臨床的意味のある変化の定め方患者報告式アウトカム尺度における臨床的意味のある変化の定め方
患者報告式アウトカム尺度における 臨床的意味のある変化の定め方
Yasuyuki Okumura10.3K views
ベイズ入門 von Zansa
ベイズ入門ベイズ入門
ベイズ入門
Zansa 9.8K views
Analysis of clinical trials using sas 勉強用 isseing333 von Issei Kurahashi
Analysis of clinical trials using sas 勉強用 isseing333Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333
Issei Kurahashi7.1K views
GRADEの基礎:概要と問題設定 von Yuko Masuzawa
GRADEの基礎:概要と問題設定GRADEの基礎:概要と問題設定
GRADEの基礎:概要と問題設定
Yuko Masuzawa1.7K views
事前登録のやり方 von Yuki Yamada
事前登録のやり方事前登録のやり方
事前登録のやり方
Yuki Yamada1.2K views
2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演 von Ryuichi Ueda
2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演
2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演
Ryuichi Ueda10.6K views
明日から読める無作為化比較試験: 行動療法研究に求められる統計学 von Yasuyuki Okumura
明日から読める無作為化比較試験: 行動療法研究に求められる統計学明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
Yasuyuki Okumura11.9K views
Jcors_2021年アドベントカレンダー企画スライド von MasayaITO6
Jcors_2021年アドベントカレンダー企画スライドJcors_2021年アドベントカレンダー企画スライド
Jcors_2021年アドベントカレンダー企画スライド
MasayaITO6491 views
効果測定入門 Rによる傾向スコア解析 von aa_aa_aa
効果測定入門  Rによる傾向スコア解析効果測定入門  Rによる傾向スコア解析
効果測定入門 Rによる傾向スコア解析
aa_aa_aa10.2K views
データサイエンス概論第一=1-3 平均と分散 von Seiichi Uchida
データサイエンス概論第一=1-3 平均と分散データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散
Seiichi Uchida3.8K views
理科教育学研究のための統計分析入門 von Hiroshi Unzai
理科教育学研究のための統計分析入門理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門
Hiroshi Unzai745 views
20170202 srws第七回統合、層別・感度分析、欠測への対処 von SR WS
20170202 srws第七回統合、層別・感度分析、欠測への対処20170202 srws第七回統合、層別・感度分析、欠測への対処
20170202 srws第七回統合、層別・感度分析、欠測への対処
SR WS2.3K views
20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処 von SR WS
20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処
20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処
SR WS382 views

因果推論の基礎

  • 1. 因果推論の基礎 ――ミクロ計量経済学の最近の潮流から―― 森田果y hatsuru@law.tohoku.ac.jp y 東北大学大学院法学研究科 法社会学会関東研究支部定例研究会(早稲田大学) 2014 年12 月13 日 森田(東北大) 実証分析入門演習Dec 13, 2014 1 / 28
  • 2. Introduction Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 2 / 28
  • 3. Introduction 伝統的な法学における実証分析の利用 記述的推論 データを要約統計量(summary statistics)・記述統計量(descritive statistics) の形にまとめる mean, median, maximum/minimum, variance など これだけでも,〔上手に行えば――King et al 1994〕分かることは結構 ある 相関関係(correlation, association) の計算 基本的にはOLS(最小二乗法による線形回帰)やクロス集計 差の検定 e.g., 男女(の平均賃金etc)の間に有意な差があるかどうかの検定 森田(東北大) 実証分析入門演習Dec 13, 2014 3 / 28
  • 4. Introduction 最近の法学研究における実証分析の利用 より政策的な方向へ consequentialism | 法ルールがその目的を達成できているかどうか? program evaluation と呼ばれる分野との接合 単なる記述的推論ではなく,因果推論(causal inference)の重視 相関関係ではなく,因果関係の評価 経済学や政治学でのトレンドを反映 医療でのEBM なども因果推論の世界(統計学の世界では裏でつな がっている) 因果推論では,推定手法(統計ソフトウェアが計算してくれる部分) よりも,リサーチデザイン(どこに因果関係を見いだすか,うまく 仕組む)ことの方が重要 森田(東北大) 実証分析入門演習Dec 13, 2014 4 / 28
  • 5. 因果推論の根本問題 Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 5 / 28
  • 6. 因果推論の根本問題 基本概念 a la RCM (Rubin Causal Model) unit: 対象 treatment: 介入がなかった場合(=control)と比較して,それが あった場合の効果を測定したいと考えている(政策)介入 potential outcomes: ユニットにtreatment があった場合となかった 場合について,ユニットが取り得る(=まだ観察されていないもの である点に注意!)値 counterfactual: 実現しなかった方のpotential outcome causal effect: 1 つ1 つのユニットについて,treatment があった場合 のpotential outcome とtreatment がなかった場合のpotential outcome との間の差 `The Fundamental Problem of Causal Inference': 私たちは,複数の potential outcome のうち,最大で1 個しか観察することはできない から,causal effect を直接観察することはできない 森田(東北大) 実証分析入門演習Dec 13, 2014 6 / 28
  • 7. 因果推論の根本問題 具体例:単純な差分をとる場合 ユニット=ある時点の「私」。頭痛がある。 treatment =頭痛薬アスピリンの投与。 Y = 2 時間後の「私」の頭痛の評価。treatment の有無で,2 通りあ り得る。 Unit 当初の頭痛potential outcomes Y へのcausal effect X Y (Asp) Y (Not) Y (Asp) Y (Not) 「私」80 25 75 -50 森田(東北大) 実証分析入門演習Dec 13, 2014 7 / 28
  • 8. 因果推論の前提条件 Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 8 / 28
  • 9. 因果推論の前提条件 基本概念:因果推論のための前提条件 replication: 少なくとも1 つのユニットはtreatment を受け,少なく とも1 つのユニットはtreatment を受けない(control)。複数の対象 の間のvariation でもいいし,単一の対象が異なる時点でvariation が あってもよい。 SUTVA (stable unit-treatment-value assumption):2 つの内容がある a) 1 つ1 つのユニットについて,同時で1 つのtreatment しか働かず, control も1 種類しかない b) ユニット間に干渉がない(spill over effect や一般均衡効果は存在し ない) assignment mechanism: どのユニットがtreatment を受け,どのユ ニットがcontrol になるかを決定するメカニズム 森田(東北大) 実証分析入門演習Dec 13, 2014 9 / 28
  • 10. 因果推論の前提条件 Nユニット・処置2 つで,SUTVA が満たされるケース Unit X Y (1) Y (0) ユニットレベルの因果効果 1 X1 Y1(1) Y1(0) Y1(1) Y1(0) 2 X2 Y2(1) Y2(0) Y2(1) Y2(0) ... ... ... ... ... i Xi Yi(1) Yi(0) Yi(1) Yi(0) ... ... ... ... ... N XN YN(1) YN(0) YN(1) YN(0) 森田(東北大) 実証分析入門演習Dec 13, 2014 10 / 28
  • 11. 因果推論の前提条件 population level の因果効果 Yi(1) とYi(0) を比較するのが基本 ただし,このようなユニットレベル因果効果を直接観察することは不 可能なので,代わりに... 1 と0 との間の平均因果効果average causal effect Ave[Yi(1) Yi(0)] = 1 N ΣN i=1(Yi(1) Yi(0)) 1 と0 との間のメディアン因果効果 Median[Yi(1) Yi(0)] などなど... を推定していくことになる 森田(東北大) 実証分析入門演習Dec 13, 2014 11 / 28
  • 12. 割当メカニズムの重要性 Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 12 / 28
  • 13. 割当メカニズムの重要性 割当メカニズム 具体例=完璧な医者 Potential Outcomes Unit Control Y (0) Treatment Y (1) 1 13 14 2 6 0 3 4 1 4 5 2 5 6 3 6 6 1 7 8 10 8 8 9 `true' average 7 5 average causal effect = -2 森田(東北大) 実証分析入門演習Dec 13, 2014 13 / 28
  • 14. 割当メカニズムの重要性 割当メカニズム 完璧な医者が,一人一人について最適な治療方法を適用すると: W は,treatment のあり(1) なし(0) を示す Potential Outcomes Unit W Control Y (0) Treatment Y (1) 1 1 ? 14 2 0 6 ? 3 0 4 ? 4 0 5 ? 5 0 6 ? 6 0 6 ? 7 1 ? 10 8 1 ? 9 `observed' average 5.4 11 森田(東北大) 実証分析入門演習Dec 13, 2014 14 / 28
  • 15. 割当メカニズムの重要性 補完imputation による因果推論 完璧な医者が最善を尽くしているとなると,欠損データの補完がで きる: Potential Outcomes Unit W Control Y (0) Treatment Y (1) 1 1 14 14 2 0 6 6 3 0 4 4 4 0 5 5 5 0 6 6 6 0 6 6 7 1 10 10 8 1 9 9 `observed' average 7.5 7.5 森田(東北大) 実証分析入門演習Dec 13, 2014 15 / 28
  • 16. 割当メカニズムの重要性 さまざまな割当メカニズム assignment mechanism: 観察される潜在的結果と欠損する潜在的結 果を振り分けるもの: Pr(WjX; Y (0); Y (1)) 混同的でないunconfounded 割当メカニズム:Pr(WjX) 確率的なprobabilistic 割当メカニズム:Pr(Wi = 1jX; Y (0); Y (1)) 個別的なindividualistic 割当メカニズム: AM / ΠN i=1 Pr(WijXi; Yi(0); Yi(1)) 古典的なランダム化実験: AM / ΠN i=1 Pr(WijXi) ちなみに,プロペンシティスコア(傾向スコアpropensity score): Pr(Wi = 1jXi) 森田(東北大) 実証分析入門演習Dec 13, 2014 16 / 28
  • 17. ランダム化:特殊な割当メカニズム Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 17 / 28
  • 18. ランダム化:特殊な割当メカニズム ランダム化=因果推論のもう一つの手法 randomization =割当メカニズムを無作為なものとする(ただしX に依存させてもよい)ことで,treatment とcontrol とが「だいたい 同じ」(もうちょっと言うと,共変量covariate がbalance している) 状況に持ち込み,Yobs(1)Yobs(0) = Y (1) Y (0) となるように仕組 む方法。基本的には,平均やメディアンなどを見る。 最近のネット企業(典型例はfacebook: https://research.facebook.com/)は,ランダム化実験を実施し ている 契約法・消費者法などでも,ランダム化実験の活用はどんどん増えて いる 開発経済学などでも,ランダム化実験(フィールド実験)をかなり行 うようになってきている けれども,社会科学においては,倫理的・法的な理由で,ランダム 化実験を実施することができない場合がまだまだ多い 森田(東北大) 実証分析入門演習Dec 13, 2014 18 / 28
  • 19. ランダム化:特殊な割当メカニズム 観察データの分析をランダム化実験と同じようにデザイ ンするには 1 デザイン段階が完了するまで,結果データは見ないようにする 2 意思決定者(割当メカニズムを実行している者)がどのように考え て割当を行っているのかについて分析し,割当に際して鍵となって いる共変量を取り出す 3 この共変量が,入手できなかったり,ノイズの多いデータだったら, 恐らくそのデータセットを使うのはあきらめて,別のデータセット を探した方が吉 4 treatment/control グループが,バランスしている(=観察された共 変量がほぼ同じような分布をしている)ようなサブグループを見つ け出す バランスしているかどうかには,分布を描いて目視してみることが 有益 必ずしも常に,十分なバランスが実現できるとは限らない この場合の推論は,当該サブグループの範囲内であることに注意 森田(東北大) 実証分析入門演習Dec 13, 2014 19 / 28
  • 20. さまざまな因果推論の手法 Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 20 / 28
  • 21. さまざまな因果推論の手法 マッチング ランダム化実験の基本アイデア treatment/control の間で,共変量にバランスがとれた状態を実現する それならば,treatment に属する各ユニットについて,共変量が「同 じ」ユニットをcontrol から選び出してきて比較すれば良い: matching 共変量が全く同じものをマッチング 共変量ができるだけ近いものをマッチング propensity score でマッチング 最近のビッグデータでは,かなり正確なマッチングが実現できるよ うになってきている cf. ビッグデータ関連では,EL も発展してきている(まだまだ applied の世界での実例はあまり見ないが...) 森田(東北大) 実証分析入門演習Dec 13, 2014 21 / 28
  • 22. さまざまな因果推論の手法 DD/DiD differences-in-differences: (Y1T (1) Y0C(1)) (Y0T (0) Y0C(0)) 時点Treatment Control 時点0 Y1T (0) Y0T (0) Y1C(0) Y0C(0) 時点1 Y1T (1) Y0T (1) Y1C(1) Y0C(1) Red texts are counterfactuals. 私たちが知りたいもの:Y1T (1) Y0T (1) 一見,それらしそうな選択し: ビフォーアフター:Y1T (1) Y0T (0) 処置群vs コントロール群:Y1T (1) Y0C(1) 森田(東北大) 実証分析入門演習Dec 13, 2014 22 / 28
  • 23. さまざまな因果推論の手法 DD/DiD 森田(東北大) 実証分析入門演習Dec 13, 2014 23 / 28
  • 24. さまざまな因果推論の手法 FE 森田(東北大) 実証分析入門演習Dec 13, 2014 24 / 28
  • 25. さまざまな因果推論の手法 IV/LATE confounded な割当メカニズムについても利用可能 natural experiment を探す:instrumental variable 具体例(Angrist のベトナム戦争徴兵制のくじ) 従軍経験が賃金に与える影響の測定 ベトナム戦争時の徴兵は,くじ:ランダムな自然実験 くじに「当選する」かどうかはランダムだが,くじに当選することに よって従軍確率が増加し,それによって賃金は左右される wrong IV とweak IV に注意 wrong IV:「IV が従属変数に影響するのは,内生的な説明変数を通じ てだけ」というexclusion restriction [only through condition] が充足さ れない weak IV:IV と内生的な説明変数との相関関係が弱い また,IV はLATE (local average treatment effect on compliers) に過 ぎない〔されどLATE〕 complier = IV によって影響を受けるユニット 森田(東北大) 実証分析入門演習Dec 13, 2014 25 / 28
  • 26. さまざまな因果推論の手法 RD 恣意的な規制・介入が存在している場合 その規制の近傍では,ランダム化が実現しているはず それであれば,近傍のデータを取り出せば,規制の有無の影響を測定 できるはず 具体例 負債額に基づく規制の変化 世帯収入に基づく社会保障給付の変化 森田(東北大) 実証分析入門演習Dec 13, 2014 26 / 28
  • 27. 因果推論と構造推定 Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 27 / 28
  • 28. 因果推論と構造推定 因果推論vs 構造推定 因果推論:最小限の前提に依拠して,因果関係を推定 伝統的な計量経済学における構造推定:世界が(経済学)モデルに したがって動いていると仮定した上で,モデルのパラメタを推定 いわゆる構造方程式(SEM/structural equation model)とは違う 両者の対立点 internal validity vs external validity 前提条件の明示 経済学教育への影響 分野の違い 森田(東北大) 実証分析入門演習Dec 13, 2014 28 / 28