17. 分析設計
● 評価方法
○ 事故発生からの死亡率は 0.9%と不均衡データとなっているため、
評価指標としてPR-AUC(Precision-Recall Area Under the Curve)を用いる。
■ 不均衡データの場合、 AUCが0.8くらいと高い場合でも、
満足のいく性能を得られないことが多い。
■ 参考:"The Relationship Between Precision-Recall and ROC Curves"
17
41. 参考情報
● Davis and Goadrich (2006), "The Relationship Between Precision-Recall and ROC Curves", ICML
● Mr_Sakaue, “警察庁オープンデータの前処理と死亡事故発生予測のための機械学習について ”, 個
人ブログ
● HASEGAWA etal (2007), "A BASIC STUDY ON TRAFFIC ACCIDENT DATA ANALYSIS USING
SUPPORT VECTOR MACHINE", Journal of the Eastern Asia Society for Transportation Studies,
Vol. 7
● Meraldo Antonio (2019), "Live Prediction of Traffic Accident Risks Using Machine Learning and
Google Maps", Towards Data Science
● https://github.com/KamonohashiPerry/traffic_accident_analysis
● Zhang et al (2018), "A Deep Learning Approach for Detecting Traffic Accidents from Social
Media Data", Transportation Research Part C: Emerging Technologies
41