1. 빅데이터의 다음 단계는
예측 분석이다
김경훈
코어닷투데이
kyunghoon@core.today
20211123
경희대학교
2. https://core.today

2
초록
예측 분석은 더 나은 의사결정을 내리기 위해 미래 행위를 예측하고자
경험(데이터)으로부터 배우는 기술을 말한다. 구글과 아마존을 포함하
여 인터넷 시대를 이끄는 기업들은 기계학습 기반의 예측 모델에 의존
하는 비즈니스 모델을 갖고 있으며, 딥러닝 등 고도화된 기술을 통해
더 나은 인공지능 예측 모델들이 범람하고 있다. 지금의 시대에 예측
분석을 위한 데이터 활용 비즈니스 사례를 살펴보고, 딥러닝 전문가는
각 산업에 어떠한 역할을 해야 하는지 논한다.
8. https://core.today

8
기계학습?
— Tom Mitchell, Machine Learning, (1998)
만약 작업 T에 대해 기준 P로 측정한 성능이 경험 E로 인해 향상되었다면,
그 프로그램은 작업 T에 대해 기준 P의 관점에서 경험 E로부터 "배웠다"라고 말할 수 있다.
http://t-robotics.blogspot.com/2014/05/machine-learning.html
작업 T : 새로 받은 이메일의 스팸 구분
기준 P : 얼마나 정확하게 스팸을 골라냈는가? (accuracy, …)
경험 E : 사용자에 의해서 레이블 된 이메일 데이터베이스
e.g., 사용자 피드백 — “스팸으로 이동”, “스팸이 아님”
11. https://core.today

11
기계학습을 수행하기 위해 필요한 능력
http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram
https://www.lucypark.kr/blog/2015/06/21/the-data-science-venn-diagram/
Drew Conway의 The Data Science Venn Diagram
12. https://core.today

12
기계학습을 수행하기 위해 필요한 능력
http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram
https://www.lucypark.kr/blog/2015/06/21/the-data-science-venn-diagram/
Drew Conway의 The Data Science Venn Diagram
데이터 해커!
- 커맨드라인 사용
- 벡터 연산 이해
- 알고리듬적 사고
- …
13. https://core.today

13
기계학습을 수행하기 위해 필요한 능력
http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram
https://www.lucypark.kr/blog/2015/06/21/the-data-science-venn-diagram/
Drew Conway의 The Data Science Venn Diagram
데이터 해커!
- 커맨드라인 사용
- 벡터 연산 이해
- 알고리듬적 사고
- …
인사이트 추출!
- 적절한 수학, 통계학적 방법론 적용
- 결과에 대한 최소한의 이해/해석
- …
18. 1차 산업
혁
명은 증기기관!
the number of Operative Hours to Process 1001b of cotton
https://books.google.co.kr/books?id=PjZdDwAAQBAJ&pg=PA12&lpg=PA12&dq=spinning+mule+%22o.h.p%22&source=bl&ots=jmw5V_JNGA&sig=ACfU3U1a77MIZ8bqNeM-WyoahegEqabglA&hl=ko&sa=X&ved=2ahUKEwjSvbetxsfzAhXUad4KHSvBBt4Q6AF6BAgXEAM#v=onepage&q=spinning%20mule%20%22o.h.p%22&f=false
37. https://core.today

37
비즈니스 애널리틱스
어
떤
일이 있었는지 (What happened?)
과거 데이터를 통해 밝히는 묘사 분석(Descriptive Analytics)
발생한
현
상에 대한
원
인을 찾는 (Why did it happen?)
진단 분석(Diagnostic Analytics)
앞으로 어
떤
일이 생길지 예측하는 (What will happen?)
예측 분석(Predictive Analytics)
예측 분
석
을 통해 예상할 수 있는 것들을 어떻게 만들어 낼 수 있는지
(How can we make it happen?)
의사결정에 도움을 주는 처방 분석(Prescriptive Analytics)
38. https://core.today

38
기술 분석 (묘사 분석)
첫 번째 단계인 '묘사'는 데이터 분석의 가장 기본적인 지표를 의미한다.
과거에 발생한 일과 현재 발생한 일을 정확하게 살펴보는 것을 이야기하며,
지역 별로 많이 판매된 상품, 고객들의 불만 사항 등을 파악할 수 있다.
다만, 단순히 소비자의 반응이 '좋다', '나쁘다'를 파악하는 것이 아니라
무엇을 '좋아'하거나 "싫어"하는지까지 파악해야 한다.
https://reasley.com/single/155
어
떤
일이 일어났는가?
39. https://core.today

39
진단 분석
두 번째 단계인 '진단'은 묘사 단계에서 찾아낸 분석 내용의 원인을 이해하는 과정이다.
분기 별로 매출 차이가 발생한 이유나,
고객 불만 사항이 최근 1년간 더 많이 발생했다면
그 이유가 무엇인지 데이터 기반으로 확인하는 것이다.
https://reasley.com/single/155
왜 일어났는가?
40. https://core.today

40
예측 분석
세 번째 단계인 '예측'은 데이터를 통해 기업과 조직의 미래, 고객의 행동을 예측하는 과정이다.
사용자들의 단어 패턴을 분석하여 특정 고객의 이탈 가능성이나,
특정 제품의 검색 이력을 토대로 판매 가능성이 높은 상품을 추천하기도 한다.
즉, 데이터가 기업 성장의 발판이 되는 시대가 왔다고 이야기할 수 있다.
https://reasley.com/single/155
무슨 일이 일어날 것인가?
41. https://core.today

41
처방 분석
네 번째 단계인 '처방'은 앞선 예측을 바탕으로 이뤄지는 최적화 과정이다.
특정 시점에 어떤 액션을 취해야 고객의 이탈을 막는지,
어느 정도의 예산을 분배하여 광고 효과를 최대화 할 수 있는지 등
가장 효과적인 방법으로 이익을 가져오기 위한 행동이다.
4단계 분석 과정 중 가장 어려운 부분에 해당한다.
https://reasley.com/single/155
우리는 무엇을 해야할 것인가?
48. https://core.today

48
범죄 예측 모델 PredPol
https://digital.hbs.edu/platform-rctom/submission/machine-learning-at-predpol-risks-biases-and-opportunities-for-predictive-policing/
49. https://core.today

49
데이터 기반 예측 치안 Data-Informed Predictive Policing
https://themarkup.org/ask-the-markup/2020/08/20/does-predictive-police-technology-contribute-to-bias
71. https://core.today

71
사회적 거리두기 강도에 따른 감염 확산 방지 영향 예측 (Science)
https://www.ibs.re.kr/cop/bbs/BBSMSTR_000000001003/selectBoardArticle.do?nttId=20165&pageIndex=1&searchCnd=&searchWrd=
그림 속 실선은 실제 역학 데이터, 점선은 예상치를 나타내며 빨간색, 주황색, 초록색 선은 각각 약한 사회적 거리두기, 강력한 사회적 거리두기, 접촉 금지 조치
https://www.science.org/doi/10.1126/science.abb9789
76. https://core.today

76
예측은 해석보다 우위에 있다
많은 예측 분석 프로젝트는 미래를 예측하는 데 목적이 있는 것이지
세상을 이해하고 무엇이 그렇게 작동하게 만드는지 알아내는 것이 목적이 아니다.
그러니 그저 제대로 작동하기만 하면 된다.
예측 분석은 해결책을 찾아 제시하는 것에 목표를 두고 수행된다.
- 에릭 시겔
77. https://core.today

77
기계학습을 수행하기 위해 필요한 능력
http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram
https://www.lucypark.kr/blog/2015/06/21/the-data-science-venn-diagram/
Drew Conway의 The Data Science Venn Diagram
80. https://core.today

80
예측 사회에 살고 있는 우리들..
예측 분석 사회에서 살아남기 위한 가장 좋은 방법은
예측 모델의 목적, 기법, 한계를 이해하는 것!
아는 것만으로는 충분하지 않다. 적용해야만 한다.
의지만으로 충분하지 않다. 실행해야 한다.
- 요한 볼프강 폰 괴테
“