Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.

人口統計應用於選舉預測-蔡佳泓

3.487 Aufrufe

Veröffentlicht am

人口統計應用於選舉預測-蔡佳泓

Veröffentlicht in: Daten & Analysen
  • Als Erste(r) kommentieren

人口統計應用於選舉預測-蔡佳泓

  1. 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 人口統計運用在選舉預測 蔡佳泓 國立政治大學選舉研究中心暨東亞研究所 tsaich@nccu.edu.tw August 22, 2015 2015 台灣資料科學愛好者年會 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 1/378/22/2015 1 / 37
  2. 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 主要報告內容 1 台北市長選舉預測結果 2 選舉預測方法 何謂多層次分析 迴歸模型 3 為什麼要用多層次分析模型 4 選舉行為模型 多層次分析與貝氏統計 5 多層次分析以及事後加權 6 2004 年預測模型 7 結論 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 2/378/22/2015 2 / 37
  3. 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 台北市市長選舉柯文哲得票率中位數預測 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 3/378/22/2015 3 / 37
  4. 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 二十個縣市長選舉民進黨得票率之預測 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 4/378/22/2015 4 / 37
  5. 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 如何進行選舉預測 把各個縣市、選區視為一個「層次」,或者是次類別。 假設每個縣市有其共通性,但是也有特殊的地方。 從民調資料得到民眾對於候選人或政黨的支持,然後加上選區的人 口結構,或者加上上次的選舉結果,克服民意調查中民眾不表態的 問題。 利用貝氏統計克服各個層次樣本規模不一、點估計的不確定程度 (標準誤)過大的問題。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 5/378/22/2015 5 / 37
  6. 6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 多層次分析的意義 多層次分析指的是考慮依變數與自變數的關係之外,而且需要估計 不同群體的個體之間的差異。 如果我們把所有的樣本放在一起進行分析,可能忽略了個體所屬群 體之間的差異。如果我們區隔群體分別分析,又忽略了個體之間的 差異。 多層次分析可以用廣泛線性模型 (Generalized Linear Model) 進行, 但是貝氏統計可以更佳地估計樣本的不確定性。 多層次分析幫助研究者處理個體與總體資料。例如,每一個縣市有 多少人喜歡某項政策?有多少人會支持某位候選人等等。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 6/378/22/2015 6 / 37
  7. 7. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 迴歸模型一 迴歸的目的是找到依變數或是反應變數 (outcome)Y 與一個或是一 個以上的預測變數 (predictor)X 的函數關係。 迴歸的基礎觀念是條件機率,也就是迴歸線逼近在 X 成立的條件 下,Y 的平均值。所以模型的對象是 E[Y|X],也就是 X 變化時,Y 的平均值變化大小。 母體迴歸函數 (Population regression function) 一般表示為 E(Y|X) = β0 + Xβ1 (1) 我們盡可能逼近 X 各個值的 Y 的平均數的函數。一旦找到這樣的迴 歸函數,可以用來預測其他的觀察值,或是進行因果推論。 E(Y|X) 表示固定 X 之後 Y 的平均值,等於 β0 + Xβ1。 隨機樣本的迴歸模型表示為 Yi = β0 + β1xi + ϵi。 迴歸對於 x 沒有任何假設,但是假設 ϵi 的平均值為 0,變異數不隨 著 x 變動而變動。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 7/378/22/2015 7 / 37
  8. 8. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 迴歸模型二 隨機樣本的迴歸模型表示為 yi = β0 + β1xi + ϵi。 迴歸對於 x 沒有任何假設,但是假設 ϵi 的平均值為 0,這樣才能得 到 β1 的無偏估計,也就是等於母體的 β1。而且假設變異數不隨著 x 變動而變動,這樣的估計 β1 才有最小的不確定性。 y 可以是任意數,但是當 y 只有 0 與 1,雖然 β1 仍然是無偏估計, 但是並非最佳估計,進行假設檢定時會得到錯誤的結論。 因為 y 只有 0 與 1,所以平均值 E(Y) 介於 0 與 1,可詮釋成機率 Pr(yi = 1)。 當 y 只有 0 與 1,有可能出現 x 對於 y 的影響 β1 會隨著抽樣得到 x (例如家庭收入)的範圍改變而改變,而不是固定不變。 因此,當 y 只有 0 與 1,而我們又希望用線性模型逼近 x 與 y 之間的 關係時,把 y 轉換成 log Pi (1−Pi) ,變成沒有上下限的依變數。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 8/378/22/2015 8 / 37
  9. 9. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 迴歸模型三 當 y 只有 0 與 1,而我們又希望用線性模型逼近 x 與 y 之間的關係 時,把 y 取對數轉換成 log Pi (1−Pi) ,變成沒有上下限的依變數,符合 線性模型的要求。 Pi 0 0.1 0.2 0.3 0.5 ... 1 log Pi (1−Pi) -Inf -2.19 -1.38 -0.84 0 ... Inf 上表顯示 Pi 在 0 與 1 會得到無限小與無限大,因此當 y 變異數太小 得到的結果需謹慎推論。 因為 logistic 分佈適合以上的非線性關係,所以用”logistic probability unit” 指機率模型,簡稱為 logit。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 9/378/22/2015 9 / 37
  10. 10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 分析步驟 1 從民意調查資料,找出依變數 Y,以及自變數 X,假設 E(Y|X) = β0 + β1X 2 如果 Y 是二元變數,例如投票給兩個政黨其中之一,或者是支持不 支持獨立,可以假定 Y 與 X 之間為非線性模型,也就是 Pr(Y = 1)=logit−1(β0 + β1X) 或者是 P(y = 1) 1 − P(y = 1) = exp(β0 + β1X) 3 把 β0 換成 α0,代表各個縣市的截距。 4 為了配合人口統計資料,β1 代表人口變項 X 的係數,X 可以是性 別、教育程度、年齡等類別變數或者是兩兩變數的交互作用。 5 估計得到的係數,代入模型之後得到 Y 的預測值:θ1, . . . , θn 6 計算人口資料每一細格的百分比,乘上 θj,得到每一細格 Pr(Y = 1),累加起來為特定特徵人口的 Pr(Y = 1)。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 10/378/22/2015 10 / 37
  11. 11. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 多層次模型與一般模型比較 一般迴歸模型以個體資料為主,無法納入總體資料。而且個體之間 如果有地區的差異,無法處理不同地區有不同樣本數規模造成不同 標準誤。 多層次分析把所有的個體納入估計,所以得到的係數估計應該有較 小的標準誤。 多層次分析也可以納入總體資料來估計不同地區的差異. 相較於全部匯集 (complete pooling) 以及完全不匯集 (no pooling),多 層次分析的概念是部分匯集 (partial pooling)。所得到的係數估計介 於兩者之間。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 11/378/22/2015 11 / 37
  12. 12. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 二元的投票模型 -1 假設我們隨機調查一千位二十歲以上成年人,其中投票選擇是二分 類,例如投給國民黨是 1,其它是 0。而且我們詢問受訪者的政黨認 同、經濟評估、教育程度、地區等等來解釋投票行為。模型可以寫 成: Pr(yi = 1)= logit−1 (β0 + βpartisanship partisanshipi + βeconomy economyi+ βeducation educationi + βage agei+ α city j[i] ) (2) 根據模型 (2) 估計得到的係數, 可以得到每一個人投票給國民黨的預 測機率 0∼1。但是縣市的差異例如「北藍南綠中??」並沒有出現在 這個模型。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 12/378/22/2015 12 / 37
  13. 13. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 二元的投票模型 -2 多層次模型不僅解釋個體的差異,而且解釋群體(縣市)的差異。 例如,在模型 (3),我們用上一次縣市的總統選舉結果或者是經濟成 長的指標以及縣市所在的區域,解釋每一個縣市民眾投票的變異。 換句話說,我們假設民眾的投票行為決定於 1 個人的政治態度與社經背景 2 所在縣市的整體政治或經濟指標 α city j = β1 previous election + αregion regionm[j] for j= 1, · · · , 5 (3) 用韓國以及台灣的 2012 年總統選舉為例,其中用各省市的收入變 化解釋韓國選舉的選舉(收入變化越大越會投票給补槿惠)。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 13/378/22/2015 13 / 37
  14. 14. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Figure 1: Map of GNP’s Vote Shares in the Korean Presidential Election, 2012 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 13/378/22/2015 13 / 37
  15. 15. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Figure 2: Map of KMT’s Vote Shares in Taiwan’s Presidential Election, 2012 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 13/378/22/2015 13 / 37
  16. 16. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Table 1: Linear Mixed Effect Models of Voting for Saenuri in South Korean Presidential Election, 2012 Intercept Individual-level Province-level Intercept 0.470∗∗∗ −0.081 −0.262∗ (0.057) (0.070) (0.108) Saenuri identification 0.696∗∗∗ 0.695∗∗∗ (0.023) (0.023) Conservative 0.020∗∗∗ 0.020∗∗∗ (0.005) (0.005) Retrospective Economic Evaluation 0.060∗∗∗ 0.060∗∗∗ (0.014) (0.014) Age 0.017∗ 0.017† (0.009) (0.009) Education −0.000 −0.002 (0.017) (0.017) Female 0.005 0.004 (0.018) (0.018) Change in Individual Income 2.311∗ (1.028) AIC 1447.765 470.773 466.248 BIC 1462.611 515.313 515.736 Log Likelihood -720.882 -226.386 -223.124 Num. obs. 1042 1042 1042 Num. groups: Province 15 15 15 Variance: Province.(Intercept) 0.044 0.005 0.003 Variance: Residual 0.225 0.085 0.085 Notes: ***p < 0.001, **p < 0.01, *p < 0.05. Standard errors are in parentheses. 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 14/378/22/2015 14 / 37
  17. 17. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 多層次模型與一般模型比較 根據前面的分析,多層次分析把所有的個體納入估計,所以得到的 係數估計應該有較小的標準誤。 相較於全部匯集 (complete pooling) 以及完全不匯集 (no pooling),多 層次分析的概念是部分匯集 (partial pooling)。所得到的係數估計介 於兩者之間。 例如我們用民眾對於五個縣市社會福利等政策的滿意程度,加上各 縣市的財政資料、預測民眾對於社會福利等政策預算是否應該增加 的態度,經過估計得到係數,跟分開縣市估計的結果加以比較。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 14/378/22/2015 14 / 37
  18. 18. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 一般模型與多層次模型對照圖 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 15/378/22/2015 15 / 37
  19. 19. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 雖然多層次分析可以結合個體與總體資料,同時解釋個體與群體的 差異,但是每個群體的觀察值數目不同,如果我們要從模型估計結 果反推得到每個群體的投票機率,可能有問題。 我們希望能夠運用人口資料細格的資料進行資料加權,提高係數估 計的價值。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 16/378/22/2015 16 / 37
  20. 20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 多層次分析與貝氏統計 貝氏統計允許研究者用觀察到的資訊 (y) 更新對於母體參數 θ 的估 計。 根據貝氏定理,我們所感興趣的參數 θ 服從一機率分佈,先驗機率 p(θ) 與「概似函數」(likelihood function) p(y|θ) 的乘積,等於後驗分 佈 (posterior distribution),或者是 p(θ|y)。 Bayes Theorem p(θ|y) ∝ p(θ)p(y|θ) 統計推論來自於後驗分佈 p(y|θ) 抽樣得到的值。 多層次模型依據馬可夫鏈蒙地卡羅 (Markov Chain Monte Caro, MCMC) 拆解複雜的條件機率。透過 WinBugs 或是 JAGS 不斷地根 據觀察到的自變數、依變數等資料,所構成的條件機率抽樣。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 17/378/22/2015 17 / 37
  21. 21. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 以韓國 2007 總統選舉為例 韓國政治有地區的分歧:保守黨多半來自東南部,反對黨來自西南 部,北部則是兩黨勢力平均。 因此,解釋投票行為時,除了政治態度之外,需要考慮選民所在地 區。 Pr(yi = GNP)= logit−1 (β0 + βpartisanship partisanshipi + βideology ideologyi+ βeconomy economyi + βpartisanship·ideology partisanshipi · ideologyi+ α province j[i] ) (4) α province j = β1 previous election + αregion regionm[j] for j= 1, · · · , 5 (5) 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 18/378/22/2015 18 / 37
  22. 22. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 18/378/22/2015 18 / 37
  23. 23. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 18/378/22/2015 18 / 37
  24. 24. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 多層次分析以及事後加權 以上的分析加上人口變項可以增加預測的準確性,被稱為多層次迴 歸以及事後加權(Multi-level Regression and Post-stratification, MRP) 為了利用人口統計,個體層次主要用人口變項預測行為,總體層次 可用過去的投票紀錄調整各縣市的預測結果。 模型可分成個體與總體兩層次: Pr(yi = 1)= logit−1 (β0 + βfemale × femalei + αeducation k[i] + α age l[i] + α education×age k[i],l[i] + α city j[i] ) (6) α city j = β1 × Previous Election + αarea × aream[j] for j= 1, · · · , 20 (7) 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 19/378/22/2015 19 / 37
  25. 25. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 先驗機率的設定 p(θ|y) 是我們要估計的參數,包括平均數以及變異數,而且我們要 用 p(θ) 輔助。 WinBUGS 等軟體可以從 p(θ|y) 進行抽樣,幫助我們估計 θ。但是樣 本與參數 θ 之間的差距,用一個準確性的指標 (precision parameter) 表示。 截距的先驗機率設定為常態分佈,變異數設定為 σ2,1/σ2 為準確 性,並且設定服從一致分佈 (uniform distribution)。 αage ∼ N(0, τ) τage = 1/σ2 αedu ∼ N(0, τedu ) τedu = 1/σ2 αage·edu ∼ N(0, τ) τage·edu = 1/σ2 σ2 ∼ unif(0.001, 10) (8)蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 20/378/22/2015 20 / 37
  26. 26. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 事後加權 用 θj 代表多層次分析模型所得到的預測值,也就是: θj = logit−1 (Xjβ + ∑ S αS ) 其中 αS 代表每個縣市,而 X 代表各個自變項,在求出 β 之後,代 入人口統計的資料,得到預測值 θj。 θS = ∑ j∈JS Nj × θj ∑ j∈JS Nj (9) 而 Nj 代表某一個細分類的母體人口數,因此 θS 代表每一個都市的 事後加權所得到的平均值: 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 21/378/22/2015 21 / 37
  27. 27. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2010 年人口及住宅普查資料 依據統計法規定,政府於民國 45 年舉辦第 1 次臺閩地區戶口普查, 迄今已辦理 5 次普查。 採「公務登記輔以抽樣調查」方式辦理,共抽選 16% 樣本普查區進 行全面訪查(非普查)。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 22/378/22/2015 22 / 37
  28. 28. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 行政院主計總處 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 23/378/22/2015 23 / 37
  29. 29. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 24/378/22/2015 24 / 37
  30. 30. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2010 年人口及住宅普查資料 l 01010000100007 2112271122141000221410000017 01010000300001 2132371415322200153222000018 01010000300009 2111223424242200242422000018 01010000800002 2112252226411000142323000017 · · · · · · 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 24/378/22/2015 24 / 37
  31. 31. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 用 Stata 轉換資料格式 R code infix sex 17 age 18-19 edu 27-27 language 31 town 1-4 using "P99C3.txt" 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 25/378/22/2015 25 / 37
  32. 32. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 資料描述 經過變數定義之後,資料總共有 20 個縣市 4 組教育程度:國小、國中、高中職、大學及以上 5 組年齡層:15-24 歲,25-34 歲,35-44 歲,45-54 歲,55 歲以上 性別 總共有 2,896,446 人分佈在 800 個細格中 例如,台北市有 272,401 人,宜蘭縣有 72,579 人 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 26/378/22/2015 26 / 37
  33. 33. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stata 資料截圖 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 27/378/22/2015 27 / 37
  34. 34. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2014 縣市長選舉預測 利用 TEDS 於今年六月、九月所做的總統滿意度電話調查資料(約 2000 份樣本),估計多層次模型: Pr(yi = 1)= logit−1 (β0 + βfemale × femalei + αeducation k[i] + α age l[i] + α education×age k[i],l[i] + α city j[i] ) (10) 使用 2012 年總統選舉民進黨候選人在各縣市的得票率預測各縣市 的差距。 α city j = β1 · 2012 DPP’s Vote Share + αarea · aream[j] for j= 1, · · · , 20 (11) 使用 2010 年的人口普查資料,進行 MRP 估計各縣市得票率。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 28/378/22/2015 28 / 37
  35. 35. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 柯文哲得票率預測 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 29/378/22/2015 29 / 37
  36. 36. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 比較各縣市 MRP 估計以及調查資料之民進黨得票率 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 30/378/22/2015 30 / 37
  37. 37. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 比較 MRP 估計以及最後民進黨得票率 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 31/378/22/2015 31 / 37
  38. 38. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2004 年的預測模型 俞振華、蔡佳泓,2006,〈如何利用全國性民調推估地方民意?多 層次貝式定理估計模型與分層加權的應用〉,《台灣政治學刊》,10 (1):5-38. 用 2000 年總統選舉中民進黨的得票率預測縣市在 2004 年總統選舉 的差異。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 32/378/22/2015 32 / 37
  39. 39. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2004 總統選舉民進黨得票率之預測 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 33/378/22/2015 33 / 37
  40. 40. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 結論 1 多層次分析可幫助我們克服次層級 (sub-level) 樣本數不太一致時的 推論問題,得到信賴區間較小、不確定性較低的估計。 2 多層次分析可結合個體與總體資料。 3 如果加上人口資料,進行 MRP 分析,也就是事後加權,即使樣本數 少,仍然可以得到較準確的估計。 4 挑選預測次層級之間差異的總體變數是一大難題,必須配合人口統 計資料。 5 要預測比縣市更小的單位例如立委選舉結果需要長期、大量的訪問 資料。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 34/378/22/2015 34 / 37
  41. 41. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 報告完畢、敬請指教 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 35/378/22/2015 35 / 37
  42. 42. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . One More Thing. . . 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 36/378/22/2015 36 / 37
  43. 43. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 政大選研中心的網路民調以及市長選舉結果 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 37/378/22/2015 37 / 37

×