Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.

20170501 R 軟體經驗分享

629 Aufrufe

Veröffentlicht am

#RinVGHKS

Veröffentlicht in: Bildung
  • Als Erste(r) kommentieren

20170501 R 軟體經驗分享

  1. 1. 1 李昕迪李昕迪 高雄榮民總醫院核醫部高雄榮民總醫院核醫部 Department of Nuclear MedicineDepartment of Nuclear Medicine Kaohsiung Veterans General HospitalKaohsiung Veterans General Hospital RR 軟體經驗分享軟體經驗分享 2017-05-012017-05-01 勞動節勞動節
  2. 2. 2 自我介紹 ● 李昕迪 / mcdlee ● 核醫部總醫師 ● 從 2013 年夏天開始學習 R 軟體
  3. 3. 3 調查一下 ● 之前曾經應用過統計嗎? ● 有用過 Excel 的函數嗎? ● 以前就聽過 R 了嗎?
  4. 4. 4 安裝 ● 請安裝 R 的主程式 ● 請安裝編輯環境 RStudio ● 安裝 package ,今天會用到: ◆ tidyverse ◆ psych ◆ ggplot2 ◆ reshape2 ◆ plyr
  5. 5. 5 為了避免中文亂碼 ● Tool > Project options > Code editing > Text encoding 請選 UTF-8 https://support.rstudio.com/hc/en-us/articles/200532197-Character-Encoding
  6. 6. 6 http://wd.vghtpe.gov.tw/biostat /
  7. 7. 7 ● Fond by Ross Ihaka and Robert Gentleman in the University of Auckland in New Zealand in 1993 ● 內涵包羅萬象 ◆ 統計、畫圖 ◆ 這幾年因 Data mining 而爆紅
  8. 8. 2013 年以前 「試算表」是 我大半人生的統計工具 ( 檢定除外 )
  9. 9. 1998 年 ● 學會了用「增益集」中的分 析工具箱產生分析統計等資 料 ● 建立常態分布的峰態、峰度 等概念
  10. 10. 試算表的缺點 ● 程式和資料混在一起,而且不夠盡興 ● 版本控制不容易 ● 跨平台相容問題 ◆ Open Document ◆ Google Document ● 沒有讀寫資料庫的功能
  11. 11. R 的特色 ● 它本身是一種程式語言 ● 跨平台 ● 開放原始碼社群很發達
  12. 12. ● Reshape the data ● 各種優化
  13. 13. 17 ● CityBike 地圖 https://github.com/mcdlee/KHCityBike https://mcdlee.shinyapps.io/KHCityBike/ ● 社區醫療群地圖 ● 學分 CSV 產生器 https://github.com/mcdlee/LectureCSV
  14. 14. 18 特殊的統計需求 ● Propensity score matching ● Structural Equation Modeling ● Machine learning
  15. 15. 19 今天講的 R 會比較簡化 ● 我刻意只使用其中一種資料物件: data.frame ◆ 但還有其他的,例如 vector 、 matrix 、 list ,還有 package 自己定義的物件 ● 今天不講像程式的面向 ◆ 例如 loop 或 function ● 目標是上完今天的課,可以讓你: ◆ 獨力完成一篇 original article 的統計 ◆ 有一些基礎可以自學你需要的功能
  16. 16. 2020 前言講完了前言講完了
  17. 17. 21 今天的教材 ● 資料整理和繪圖 ◆ RStudio Cheatsheet ● Data Transformation ● Data Visualization ● 檢定 ◆ 中國醫藥大學 生物統計研究所 ◆ 金門大學陳鍾誠老師 ◆ Quick-R
  18. 18. 22 準備你的資料 ● 你一定會想到 Excel ( 或其他試算表 ) ● 大原則 ◆ 一個 column 代表一個 變數 ◆ 一個 row 代表一個病人 ( 或一次觀察 )
  19. 19. 23 常見錯誤
  20. 20. 24 合併儲存格
  21. 21. 25 在數字的變數裡面加文字
  22. 22. 26 同一個變數用不同的表達方式
  23. 23. 27 一個 row 裡面有兩個不相干的人
  24. 24. 28 其他注意事項 ● 編號或索引,分析到一半發現不對勁可以回過頭來看是不是輸入錯誤 ● 格子裡面的內容盡量簡明,但不要讓人看不懂。 ● 一個現象要用不只一個變數描述會比較容易處理,但代價是你會得到一個很寬的表格: ◆ 例如 副作用 ● 有些變數是另一些變數計算出來的結果,可以不用輸入,讓電腦計算即可。
  25. 25. 29 要收集哪些資料?
  26. 26. 30 我想知道 ... 我用不同交通工具上班花的時間
  27. 27. 31 ● 交通工具、耗費時間 ● 日期、交通工具、耗費時間 ● 日期、交通工具、天氣、出發時間、到達時間 ● 日期、交通工具、天氣、出發時間、停好車的時間、到達辦 公室的時間 ● 日期、交通工具、天氣、選擇的路線、出發時間、停好車的 時間、到達辦公室的時間
  28. 28. 32 怎麼規劃你要收集的變數 就決定你可以回答的問題
  29. 29. 33 來介紹今天的資料
  30. 30. 34 就是今天的課前問卷
  31. 31. 35 事先整理 ● 過濾前面所說的常見錯誤 ● 避免重複的變數名稱 ● 我會避免中文的變數名稱
  32. 32. 36 資料匯入
  33. 33. 37 ● 程式碼 ◆ *.r file ● 資料匯出 ◆ 試算表或表格 ( 如右 ) ◆ R markdown 可以製造一個網頁出來
  34. 34. 38 簡單的敘述統計 ● summary() ● 調整變數的性質 ◆ as.factor() ◆ as.Date() ◆ … ● describeBy()
  35. 35. 39 資料再整理 ● 製造新的變數 ◆ 例如: BMI ● 製造整理過的表格 ◆ 有時要為了之後要用的套件調整新表格的欄位 ● 例如等下要介紹的作圖
  36. 36. 40 作圖 ● 用原始資料即可 ◆ Scatter plot ◆ Boxplot ◆ Histogram ● 需要先產生新表格 ◆ Barplot
  37. 37. 4141 統計檢定統計檢定
  38. 38. 42 今天要介紹的檢定種類 ● T-test ◆ One-sample ◆ Independent Two-sample ● One-tail ● Two-tail ◆ Paired T-test ◆ 替代方案 ● Chi-square test
  39. 39. 43 所有的檢定都有共同的脈絡 ● 先建立虛無假設 ● 再推翻虛無假設
  40. 40. 44 各種 T-test 的虛無假設 ● 通常需要 n >= 30 ● One-sample: H0: μ = 某數 ● Independent Two-sample ◆ Two-tail: H0: μ1 = μ2 ( 醫學期刊最常用 ) ◆ One-tail: H0: μ1 >= μ2 or μ1<=μ2 ● Paired T-test ◆ 每個的差值組成的新集合 μ = 0
  41. 41. 45 各種 T-test 的 R 語法 ● One-sample: t.test(y, mu=3) [ 檢驗是否平均值為 3] ● Independent Two-sample ◆ Two-tail: H0: μ1 = μ2 t.test(y~x) t.test(y1,y2) ◆ One-tail: H0: t.test(y~x, alternative=”greater”) t.test(y~x, alternative=”less”) ● Paired T-test ◆ t.test(y1,y2, paired=TRUE)
  42. 42. 46 如果不是常態分佈怎麼辦? ● 無母數分析 ◆ 兩組: Mann-Whitney U Test ● wilcox.test(y~A) wilcox.test(y1,y2) wilcox.text(y1,y2,paired=TRUE) ◆ 多組: Kruskal Wallis Test ● kruskal.test(y~A)
  43. 43. 47 Chi-square ● 虛無假設: X 和 Y 彼此獨立 ● 推翻虛無假設之後還要找是 哪兩組之間沒有彼此獨立 ● R 語法: chisq.test(x,y) x1 x2 x3 y1 n11 n21 n31 y2 n21 n22 n32 Patient X Y A X1 Y1 B X1 Y1 C X2 Y2 D X2 Y2 E X2 Y1 F X3 Y2 ... ... ...
  44. 44. 4848 Any QuestionAny Question or Suggestion?or Suggestion?

×