SlideShare ist ein Scribd-Unternehmen logo
1 von 26
データベース時代の
研究デザイン
~ Quasi-experimental design ~
沖縄県立中部病院 臨床研究推進委員会
2017/8/22(TUE) 17:00-18:00
@第一会議室
Koichiro Gibo, MD, MMSc
はじめに
• 研究ってめんどくさいですよね?
• 超めんどくさがりにもできるだけ楽にできて、なおかつ学術的
にも評価の高いデザインをご紹介します。
• キーワードは..
1. データベースやレジストリを使う
2. Counterfactual(反事実)
3. Quasi-experimental design(準実験デザイン)
研究者の必須要件とは?
• 統計?
• ではなく、リサーチクエスチョンとデザインが
組めること
臨床疫学研究とは
臨床研究はデザインが9割
データ集めるのしんどい
• 古典的な前向き疫学的デザインでは、計画を立てて、デー
タを集める必要がある。これが..
•実にしんどい!
• カルテみたりデータベース(電子カルテ、学会のレジストリ、
DPCデータetc.)使えばいいじゃん!
チャートレビューの落とし穴
チャートレビューによる研究
は国際的に通用しない
Looking Through the Retrospectoscope: Reducing Bias in Emergency Medicine Chart Review Studies Kaji, Amy H. et al. Annals
of Emergency Medicine , Volume 64 , Issue 3 , 292 - 298
データベース研究(レジストリ)
• 目的のしっかりした、研究前提で、かつデータマネージがしっ
かりできているレジストリだと良い研究が結構簡単にできる。
– 例:JEANスタディ、救急蘇生統計、学会主導データ
• 国際的な学術論文を書きたい!というのなら、これらのレジス
トリベースの研究が手っ取り早い。
• 欠点:
– データ処理が大変でプログラミングスキルがないと詰む可能性が高
い。
– 高度な統計手法を必要とすることが多い
データベース研究(電子カルテ、DPCデータetc)
• もともと研究目的ではないもの
• レジストリと較べて
• 利点:
– 入手しやすい
– nが多く、観察期間も長いことが多い
• 欠点:
– 欲しい変数がないことが多い
– データマネージができていないと、GIGO(garbage in, garbage
out)
– 従来の研究デザインでは強いバイアスを生じうる
データベース研究のためのデザイン
• 中断時系列解析(ITS: interrupted time-series)
• 自己対照ケースシリーズ(SCCS: self-controlled
case series)
• この2つを紹介
重要な脱線:因果とは?
• 医学研究の目的は畢竟、原因と結果の関係(因果)を探ること。
• Question:
• コーラを飲む(原因・介入) → ゲップが出る(結果):本当?
思考実験: 因果推論の根本問題
https://www.slideshare.net/R
SS6/choosing-appropriate-
statistical-test-rss6-2104
思考実験: 因果推論の根本問題
https://www.slideshare.net/R
SS6/choosing-appropriate-
statistical-test-rss6-2104
Counterfactual (反事実)
• 因果推論を行う上で重要な概念
• デザインや統計学的手法で反事実
を推測することで、因果推論が可能
• 統計学:傾向スコア、周辺構造モデ
ル、do演算子
• デザイン:RCT、前向きコホート、
Quasi-experimental design
• RCT>>その他
中断時系列デザイン(ITS)
• Quasi-experimental design (準実験デザイン)の一つ
• もともと社会経済科学で使用されてきた。
• 図で理解するほうが早い。
中断時系列デザイン(ITS)
James Lopez Bernal, Steven Cummins, Antonio Gasparrini; Interrupted time series regression for the evaluation of public health interventions:
a tutorial, International Journal of Epidemiology, Volume 46, Issue 1, 1 February 2017, Pages 348–355
Counterfactual
インパクトモデルはアプリオリに決定する
James Lopez Bernal, Steven Cummins, Antonio Gasparrini; Interrupted time series regression for the evaluation of public health interventions:
a tutorial, International Journal of Epidemiology, Volume 46, Issue 1, 1 February 2017, Pages 348–355
時系列モデルは4要素からなる
1.レベル(切片)
2.トレンド
3.季節性/周期性
4.(自己回帰性)
季節性を除去してトレンド部分を
抽出する
James Lopez Bernal, Steven Cummins, Antonio Gasparrini; Interrupted time series regression for the evaluation of public health interventions:
a tutorial, International Journal of Epidemiology, Volume 46, Issue 1, 1 February 2017, Pages 348–355
中断時系列デザイン:ITS
• 例:
• 大阪府における救急隊用のスマートフォンアプリ(ORION)
によるたらいまわしの減少効果について
ITS まとめ
• 何らかの制度やシステムが変化した前後の時系列を比較
して、その変化による因果効果を調べることができる。
• 例:OCHでは11年前に血液培養採取時の消毒方法が当
時の研修医の研究によって劇的に変化した。この採取法に
よりコンタミ率がどうなったかについて、その前後の比較的
長期間のデータが得られれば、十分ITSによる因果推論が
可能。
• データベース主体の研究では非常に有用
自己対照ケースシリーズ(SCCS)
• 似たようなものに"Before and After design"というのもある。
• もともとワクチン接種と副反応の関係をみるために使われた
自己対照のコンセプト
全観察期間
肥満手術
B
・
・
コントロール期間
: 2年
介入期間
: 2年
Aさん
心不全による
ED受診or入院肥満手術を受けたケー
ス群(ケースシリーズ)
Before After
自己対照ケースシリーズ(SCCS)
• 利点:
– ケース群だけで良い。そのためコントロール群を設定することによる
バイアスを避けることができる。
– 時間非依存性変数(例:性別)をすべて調整できる。そのため複雑な
統計モデルを立てる必要がなくなる
• 欠点:
– 縦断的なデータベースが必要
– データの前処理が結構複雑
– コントロール期間内のイベントによって介入が引き起こされる(因果
の逆転)ことがないことが条件
)(ケース肥満患者数
入院 受診orED
条件付きポアソン回帰
• 因果関係を述べるにはいくつかの仮定が必要だが、非常に
有用な方法
• ケース群だけを選べば良く、そのケース群の縦断的なデータ
があれば使えるかも。
• アウトカムのイベントはできるだけ早く起きるタイプのほうが
良い。
• 例:ある手術とまだ文献的に知られていない副作用との因果
関係を見たいときなど
SCCS:まとめ
Enjoy your research !

Weitere ähnliche Inhalte

Was ist angesagt?

傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装
takehikoihayashi
 
多重代入法の書き方 公開用
多重代入法の書き方 公開用 多重代入法の書き方 公開用
多重代入法の書き方 公開用
Koichiro Gibo
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
Shintaro Fukushima
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
takehikoihayashi
 
ブートストラップ法とその周辺とR
ブートストラップ法とその周辺とRブートストラップ法とその周辺とR
ブートストラップ法とその周辺とR
Daisuke Yoneoka
 

Was ist angesagt? (20)

「操作変数法」の報告事例
「操作変数法」の報告事例「操作変数法」の報告事例
「操作変数法」の報告事例
 
傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装
 
多重代入法の書き方 公開用
多重代入法の書き方 公開用 多重代入法の書き方 公開用
多重代入法の書き方 公開用
 
ロジスティック回帰分析の書き方
ロジスティック回帰分析の書き方ロジスティック回帰分析の書き方
ロジスティック回帰分析の書き方
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
 
分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門
 
潜在クラス分析
潜在クラス分析潜在クラス分析
潜在クラス分析
 
質的変数の相関・因子分析
質的変数の相関・因子分析質的変数の相関・因子分析
質的変数の相関・因子分析
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
 
中断時系列分析の書き方
中断時系列分析の書き方中断時系列分析の書き方
中断時系列分析の書き方
 
フェーズI/IIに置けるベイジアン・アダプティブ・メソッド
フェーズI/IIに置けるベイジアン・アダプティブ・メソッドフェーズI/IIに置けるベイジアン・アダプティブ・メソッド
フェーズI/IIに置けるベイジアン・アダプティブ・メソッド
 
201707srws第六回その2メタアナリシス・異質性・出版バイアス
201707srws第六回その2メタアナリシス・異質性・出版バイアス201707srws第六回その2メタアナリシス・異質性・出版バイアス
201707srws第六回その2メタアナリシス・異質性・出版バイアス
 
生存時間分析の書き方
生存時間分析の書き方生存時間分析の書き方
生存時間分析の書き方
 
社会心理学者のための時系列分析入門_小森
社会心理学者のための時系列分析入門_小森社会心理学者のための時系列分析入門_小森
社会心理学者のための時系列分析入門_小森
 
ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択
 
ブートストラップ法とその周辺とR
ブートストラップ法とその周辺とRブートストラップ法とその周辺とR
ブートストラップ法とその周辺とR
 
生存時間分析数理の基礎
生存時間分析数理の基礎生存時間分析数理の基礎
生存時間分析数理の基礎
 
2 4.devianceと尤度比検定
2 4.devianceと尤度比検定2 4.devianceと尤度比検定
2 4.devianceと尤度比検定
 
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
 
TreeAge チュートリアル
TreeAge チュートリアルTreeAge チュートリアル
TreeAge チュートリアル
 

Ähnlich wie データベース時代の疫学研究デザイン

20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザイン
20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザイン20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザイン
20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザイン
kulibrarians
 
ICST2015勉強会 ICST2017に向けて
ICST2015勉強会 ICST2017に向けてICST2015勉強会 ICST2017に向けて
ICST2015勉強会 ICST2017に向けて
Hironori Washizaki
 
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
Matsushita Laboratory
 
科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?
科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?
科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?
Masatsura IGAMI
 
コンセプト資料 Open research-140207
コンセプト資料 Open research-140207コンセプト資料 Open research-140207
コンセプト資料 Open research-140207
murakamitubasa
 

Ähnlich wie データベース時代の疫学研究デザイン (20)

20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザイン
20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザイン20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザイン
20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザイン
 
図書館データを研究推進にMOTTO利活用するための情報デザイン@京都大学図書館勉強会20131025
図書館データを研究推進にMOTTO利活用するための情報デザイン@京都大学図書館勉強会20131025図書館データを研究推進にMOTTO利活用するための情報デザイン@京都大学図書館勉強会20131025
図書館データを研究推進にMOTTO利活用するための情報デザイン@京都大学図書館勉強会20131025
 
探求の道 Lead Clearly
探求の道 Lead Clearly探求の道 Lead Clearly
探求の道 Lead Clearly
 
rcast_20140411
rcast_20140411rcast_20140411
rcast_20140411
 
CiNii Researchと大学図書館(2018.6.18)
CiNii Researchと大学図書館(2018.6.18)CiNii Researchと大学図書館(2018.6.18)
CiNii Researchと大学図書館(2018.6.18)
 
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回 サイエンスリンケージデータベースの使い方
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回サイエンスリンケージデータベースの使い方SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回サイエンスリンケージデータベースの使い方
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回 サイエンスリンケージデータベースの使い方
 
170907第3回hcru ws
170907第3回hcru ws170907第3回hcru ws
170907第3回hcru ws
 
ICST2015勉強会 ICST2017に向けて
ICST2015勉強会 ICST2017に向けてICST2015勉強会 ICST2017に向けて
ICST2015勉強会 ICST2017に向けて
 
リスク可視化の基本的方法
リスク可視化の基本的方法リスク可視化の基本的方法
リスク可視化の基本的方法
 
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
 
研究データ流通を支える情報基盤とは
研究データ流通を支える情報基盤とは研究データ流通を支える情報基盤とは
研究データ流通を支える情報基盤とは
 
戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介
戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介
戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介
 
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
 
科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?
科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?
科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?
 
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
 
コンセプト資料 Open research-140207
コンセプト資料 Open research-140207コンセプト資料 Open research-140207
コンセプト資料 Open research-140207
 
デザイン学会2106
デザイン学会2106デザイン学会2106
デザイン学会2106
 
研究のデザイン入門2017
研究のデザイン入門2017研究のデザイン入門2017
研究のデザイン入門2017
 
研究オープンデータにおける大学と研究者の役割
研究オープンデータにおける大学と研究者の役割研究オープンデータにおける大学と研究者の役割
研究オープンデータにおける大学と研究者の役割
 
エンジニアリングテックとは何なのか.pdf
エンジニアリングテックとは何なのか.pdfエンジニアリングテックとは何なのか.pdf
エンジニアリングテックとは何なのか.pdf
 

データベース時代の疫学研究デザイン