SlideShare ist ein Scribd-Unternehmen logo
1 von 39
Downloaden Sie, um offline zu lesen
心理與行為資料
中的因與果
黃從仁
模型建構與資訊學實驗室
臺灣大學心理學系
Hanging	suicides
US	spending	on	science
US	spending	on	science,	space,	and	technology
	correlates	with	
Suicides	by	hanging,	strangulation	and	suffocation
Hanging	suicides US	spending	on	science
1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009
1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009
6000	suicides
8000	suicides
4000	suicides
10000	suicides
$15	billion
$20	billion
$25	billion
$30	billion
tylervigen.com
科研經費 & 自殺率
海濤法師:「假的!」
共整合 (Cointegration)
指隨機事件(如GPS座標)有真實的相關
( R : egcm {egcm}, ca.jo {urca} )
Engle & Granger, 1987; Johansen, 1991; Phillips & Ouliaris, 1990
真相關 vs. 假相關
可透過多元迴歸或實驗法來檢驗真假
Aldrich, 1995; Pearson, 1897
© Shane Turnbull
相關不能推論因果
因果推論的陷阱與方法
資料科學中的因果
“相關不能推論因果”
這句話和“大數據”出現的頻率有相關
大數據中的相關
可以幫助我們看清楚局部與全局的趨勢
Robinson, 1950
大數據時代重相關不重因果
「知道what(相關)就夠了,沒必要知道why(因果) 」
Google提示相關字
信用與行為的相關
懷孕與購物形態相關
啤酒與尿布常被合購
因果不是那麼重要 (?)
例如推薦購買不需要了解因果
相關能暗示因果
客服說什麼話(因)能增進顧客消費(果)?
Takeuchi et al., 2007
>
~

<

~
驗證實驗(N=22+61)的結果邊緣顯著(p=0.0674)
© Shane Turnbull
相關不能推論因果
因果推論的陷阱與方法
資料科學中的因果
因果中的 INUS 條件
非必要但充分的條件中,不充分但非多餘的部分
風險因子(因) 事件(果)
性格違常
長期失業
有家庭狀況
有藥酒毒癮
…
隨機殺人
關鍵資料的搜集
因果關係中的「因」API有提供嗎?
彈孔位置 & 飛機失事
沒有搜集到因果關係中的「因」
應強化機頭,機尾,機翼,或機身來避免失事?
相關 vs. 因果
主要的差別在有沒有“做”
Pearl, 2000
真實因果: P( 果 | 做(因) ) > P( 果 | 做(~因) )
機率因果: P( 果 | 因 ) > P( 果 | ~因 )
因果關係的定義
假設X為因(自變項),Y為果(依變項)
Shadish et al., 2002
1.時序上X須先於Y
2.X與Y須共變
3.X最合理解釋Y的變化
故實驗最能確立因果
不是總能做實驗 (?)
假設要研究種族vs.膚色效應(如廣告效果)
可以把受試者塗成黑人或至少把照片PS一下
非隨機分派: 自然實驗與類實驗
混淆變項常透過共變數分析(ANCOVA)來控制
Beckett et al., 2006; Egan, 2015
社會經濟地位
影響智力測驗分數,學業成就,健康狀況等
類實驗 : 奧斯卡金像獎 & 壽命 (1/2)
Redelmeier & Singh, 2001
曾被提名者均壽79.7
不曾被提名者均壽75.8
社經地位(因)影響壽命(果)嗎?
長壽效應在矯正完 immortal time bias 後就不顯著
類實驗 : 奧斯卡金像獎 & 壽命 (2/2)
Sylvestre et al., 2006
倒果為因:活得過久才更有機會被提名
不會被提名
不會被提名
會被提名
會被提名
沒提
有提
Immortal time bias 在生醫資料庫分析中也常見
生醫範例 : ICU存活率 & 寶可夢療法
Suissa, 2007, 2008
不打算玩
不打算玩
打算玩
打算玩
沒玩
有玩
© Shane Turnbull
相關不能推論因果
因果推論的陷阱與方法
資料科學中的因果
同時性的機率因果 : 規則
可用購物籃分析來找條件機率:P(1|3)≠P(3|1)
( R : apriori {arules} )
TID Items
100 1 3 4
200 2 3 5
300 1 2 3 5
400 2 5
Database D itemset sup.
{1} 2
{2} 3
{3} 3
{4} 1
{5} 3
itemset sup.
{1} 2
{2} 3
{3} 3
{5} 3
Scan D
C1
L1
itemset
{1 2}
{1 3}
{1 5}
{2 3}
{2 5}
{3 5}
itemset sup
{1 2} 1
{1 3} 2
{1 5} 1
{2 3} 2
{2 5} 3
{3 5} 2
itemset sup
{1 3} 2
{2 3} 2
{2 5} 3
{3 5} 2
L2
C2 C2
Scan D
Agrawal et al., 1993
實務上很難從症狀推論疾病
範例 : 心理異常症狀 & 疾病分類
Lin & Huang, 2016
size:lift
color:lift
{OutBurst, +9 items} − 58 rules
{Vindictive, +11 items} − 61 rules
{Sleep, +28 items} − 21880 rules
{LotsAlcohol, +24 items} − 357 rules
{FearNeg, +31 items} − 23604 rules
{DepMood, +57 items} − 67543 rules
{Restless, +20 items} − 4338 rules
{DepMood, +62 items} − 28597 rules
{FearSoci, +24 items} − 48262 rules
{FearSoci, +28 items} − 2126 rules
{LotsAlcohol, +39 items} − 1258 rules
{Sleep, +25 items} − 15061 rules
{FearAnx, +28 items} − 17881 rules
{ControlWorry, +20 items} − 12786 rules
{ApartDistress, +16 items} − 249 rules
{FearAnx, +22 items} − 1493 rules
{DepMood, +14 items} − 3996 rules
{DepMood, +40 items} − 27203 rules
{Sleep, +33 items} − 1001 rules
{DepMood, +35 items} − 26671 rules
{Alcohol}
{S.Phobia}
{GAD}
{Drug}
{PTSD}
{SociPhobia}
{MDDH}
{MDD}
{Dysthymia}
{CD}
{Tobacco}
{PanicATT}
{PanicD}
{Agorophobia}
{ODDH}
{ODD}
{SepAnxiety}
{IEDH}
{IED}
LHS
RHS
同時性的機率因果 : 網絡
可用有向非循環圖(DAG)來表示因果
( R : ida {pcalg} )
Maathuis et al., 2010
真實因果 估計因果
透過網絡來檢視心理異常症狀間的關係
範例 : 解構與重建構心理疾病 (1/2)
Lin & Huang, 2016
再利用網絡集群演算法來重新分類疾病
( R : infomap.community {igraph} )
範例 : 解構與重建構心理疾病 (2/2)
Lin & Huang, 2016
	

- 	
	

- 	
	

	
A
	
	
A 	
C D
	
	
	
	
	
A 	
	
C
B 	

C D	
	
 + 	

	
+
人格
特質
1
5
4
3
2
6
7
8
反射模型:心理特質(因)造就外顯行為(果)
範例 : 人格特質與行為 (1/4)
外顯行為的相關為假相關 Cramer et al., 
2012
人格
特質
1
5
4
3
2
6
7
8
形成模型:外顯行為(因)定義心理特質(果)
範例 : 人格特質與行為 (2/4)
不同面向的行為有某種一致性 Cramer et al., 
2012
行為
1
行為
4
行為
3
行為
9
行為
8
行為
7
行為
6
行為
2
行為
5
A 特質
B 特質
Bridge
網絡模型:外顯行為彼此互為因果
範例 : 人格特質與行為 (3/4)
特質由一群共變的行為來定義 Cramer et al., 
2012
網絡模型:外顯行為彼此互為因果
範例 : 人格特質與行為 (4/4)
Cramer et al., 
2012
非同時性的因果: Granger Causality
檢驗先發生的X能否預測後發生的Y
( R : grangertest {lmtest} )
Granger, 1969
範例 : 雞生蛋? 蛋生雞?
Thurman  Fisher, 1988
+
可用granger causality來檢驗
範例 : 心理異常症狀的進程
可透過網絡模型的模擬來預測
Lin  Huang, 2016
Irr
(a)
(b)
Time
LossInt
DepMood
Appetite
Weight
Sleep
Psychomotor
Fatigue
Worthless
Concentrate
DeathThought
Hopelessness
Esteem
AnxWorry
ControlWorry
Restless
Irr
MuscleTension
DepMood
Appetite
Weight
Sleep
Psychomotor
Fatigue
Worthless
Concentrate
DeathThought
Hopelessness
Esteem
AnxWorry
ControlWorry
Restless
Irr
MuscleTension
LossInt
LossInt
DepMood
Appetite
Weight
Sleep
Psychomotor
Fatigue
Worthless
Concentrate
DeathThought
Hopelessness
Esteem
AnxWorry
ControlWorry
Restless
Irr
MuscleTension
LossInt
DepMood
Appetite
Weight
Sleep
Psychomotor
Fatigue
Worthless
Concentrate
DeathThought
Hopelessness
Esteem
AnxWorry
ControlWorry
Restless
Irr
MuscleTension
LossInt
DepMood
Appetite
Weight
Sleep
Psychomotor
Fatigue
Worthless
Concentrate
DeathThought
Hopelessness
Esteem
AnxWorry
ControlWorry
Restless
Irr
MuscleTension
LossInt
DepMood
Appetite
Weight
Sleep
Psychomotor
Fatigue
Worthless
Concentrate
DeathThought
Hopelessness
Esteem
AnxWorry
ControlWorry
Restless
Irr
MuscleTension
LossInt
DepMood
Appetite
Weight
Sleep
Psychomotor
Fatigue
Worthless
Concentrate
DeathThought
Hopelessness
Esteem
AnxWorry
ControlWorry
Restless
Irr
MuscleTension
LossInt
DepMood
Appetite
Weight
Sleep
Psychomotor
Fatigue
Worthless
Concentrate
DeathThought
Hopelessness
Esteem
AnxWorry
ControlWorry
Restless
Irr
MuscleTension
系統動力學
Lin, 2015
強調因果相依
先天↔後天
生理↔心理
情感↔認知
個性↔情境
個體↔環境
© Shane Turnbull
相關不能推論因果
因果推論的陷阱與方法
資料科學中的因果
心理與行為資料
中的因與果
黃從仁
模型建構與資訊學實驗室
臺灣大學心理學系

Weitere ähnliche Inhalte

Andere mochten auch

[系列活動] 一日搞懂生成式對抗網路
[系列活動] 一日搞懂生成式對抗網路[系列活動] 一日搞懂生成式對抗網路
[系列活動] 一日搞懂生成式對抗網路台灣資料科學年會
 
[系列活動] Data exploration with modern R
[系列活動] Data exploration with modern R[系列活動] Data exploration with modern R
[系列活動] Data exploration with modern R台灣資料科學年會
 
[系列活動] 使用 R 語言建立自己的演算法交易事業
[系列活動] 使用 R 語言建立自己的演算法交易事業[系列活動] 使用 R 語言建立自己的演算法交易事業
[系列活動] 使用 R 語言建立自己的演算法交易事業台灣資料科學年會
 
[系列活動] 智慧製造與生產線上的資料科學 (製造資料科學:從預測性思維到處方性決策)
[系列活動] 智慧製造與生產線上的資料科學 (製造資料科學:從預測性思維到處方性決策)[系列活動] 智慧製造與生產線上的資料科學 (製造資料科學:從預測性思維到處方性決策)
[系列活動] 智慧製造與生產線上的資料科學 (製造資料科學:從預測性思維到處方性決策)台灣資料科學年會
 
[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹
[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹
[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹台灣資料科學年會
 

Andere mochten auch (6)

[系列活動] 一日搞懂生成式對抗網路
[系列活動] 一日搞懂生成式對抗網路[系列活動] 一日搞懂生成式對抗網路
[系列活動] 一日搞懂生成式對抗網路
 
[系列活動] Data exploration with modern R
[系列活動] Data exploration with modern R[系列活動] Data exploration with modern R
[系列活動] Data exploration with modern R
 
[系列活動] Python爬蟲實戰
[系列活動] Python爬蟲實戰[系列活動] Python爬蟲實戰
[系列活動] Python爬蟲實戰
 
[系列活動] 使用 R 語言建立自己的演算法交易事業
[系列活動] 使用 R 語言建立自己的演算法交易事業[系列活動] 使用 R 語言建立自己的演算法交易事業
[系列活動] 使用 R 語言建立自己的演算法交易事業
 
[系列活動] 智慧製造與生產線上的資料科學 (製造資料科學:從預測性思維到處方性決策)
[系列活動] 智慧製造與生產線上的資料科學 (製造資料科學:從預測性思維到處方性決策)[系列活動] 智慧製造與生產線上的資料科學 (製造資料科學:從預測性思維到處方性決策)
[系列活動] 智慧製造與生產線上的資料科學 (製造資料科學:從預測性思維到處方性決策)
 
[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹
[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹
[系列活動] 無所不在的自然語言處理—基礎概念、技術與工具介紹
 

心理與行為資料中的因與果-黃從仁