7. 데이터 분석가의 SKILLSET 무엇인가?
도메인 전문가
데이터 핸들링
문제 정의 & 모델링
가설검증 & 최적화
의사결정 & 서비스
8. 데이터 분석가의 SKILLSET - 도메인전문가
CS
Finance
E-Commerce
Manufacture
Game
Telecomm
Medical
HR
모든 영역을
잘하는 분석가
어디에도
없습니다
9. 데이터 분석가의 SKILLSET - 도메인전문가
데이터 분석가
“분석을 해보니 A방식으로 하시
는 것이 매출에 도움이 됩니다”
도메인 전문가
“알고있는데 규제 때문에 못해요”
10. 데이터 분석가의 SKILLSET - 도메인전문가
특정 분야의 도메인 전문성을
가진 분석가가 되어야 합니다.
Domain
Data
Scientist
It’s yours!
11. 데이터 분석가의 SKILLSET – 문제 정의
센서 데이터 “분석”을 해주세요
CRM 데이터 “분석”을 해주세요
퇴사를 “예측”해주세요
“현업의 요구사항을 구체화하는 것은..
분석가의 일이기도 합니다.“
12. 데이터 분석가의 SKILLSET – 문제 정의
분석가가 생각하는 것보다
현업의 문제는 어려울 수 있습니다.
숨어있는 이해관계
나의 KPI와 다른 목표
상관없는 데이터
13. 데이터 분석가의 SKILLSET – 데이터 핸들링
“로그인 한 고객중에 접속한 첫
페이지 중에 특정한 메뉴에서
12분 이하로 머물렀던 고객 중
35세에서 42세 사이의 남자
고객들의 생필품 구매 평균은?
14. 데이터 분석가의 SKILLSET – 데이터 핸들링
- https://blog.appliedai.com/data-science-tools/
자신의 도구를 가지세요
“제가 사용하는 R package는 12개 이내입니다”
15. 데이터 분석가의 SKILLSET – 문제 모델링
“기기의 센서 데이터를 활용하여
냉장고 고장진단을 하고 싶어요.”
Deep learning? Regression?
Tree? Clustering? Optimization?
“무슨 모델을 써야 하는가?”
16. 데이터 분석가의 SKILLSET – 문제 모델링
- berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/
“냉장고 안 시원해요”
분석가: 학습 데이터는 있나요?
현업: 없어요
분석가: 네?
현업: 냉장고가 안 시원한 조건은
대충 알아요
17. 데이터 분석가의 SKILLSET – 문제 모델링
- berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/
Bayesian Network
(Expert system)
“냉장고 안 시원해요”
1.느끼는 냉기 차이는 사람마다 다르다
2.온도 센터의 위치에 따라 냉장고
측정 온도가 달라 질 수 있다.
3. 냉기 약함에 대한 조건에 확신이 없다
“불확실성”
“도메인지식”
확률 추론이
필요해
18. 데이터 분석가의 SKILLSET – 문제 모델링
- berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/
“기기의 센서 데이터를 활용하여
냉장고 고장진단을 하고 싶어요.”
“문제에 맞는 모델을 선택 하
실 수 있는 능력이 필요합니다.”
19. 데이터 분석가의 SKILLSET – 가설 검증 & 최적화
- berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/
분석가: “여성이 남성보다 퀵보드를
30% 더 구매하니 핑크색 퀵보드를
100억대 생산을 더 해야 합니다.”
“당신의 분석 리포트는
중요한 의사결정의 정보입니다”
그런데…..
20. 데이터 분석가의 SKILLSET – 가설 검증 & 최적화
- https://en.wikipedia.org/wiki/Anscombe%27s_quartet
알고 보니 이런 데이터
21. 데이터 분석가의 SKILLSET – 의사결정
- https://en.wikipedia.org/wiki/Anscombe%27s_quartet
현업
미국인들은 하루에 얼마나 얼음
을 뽑아 먹고 있나요?
분석가
관련 리포트 제공해 드립니다.
22. 데이터 분석가의 SKILLSET – 의사결정
- https://en.wikipedia.org/wiki/Anscombe%27s_quartet
“기초 통계량만 뽑는 사람이 될 것인가?”
“분석 리포트만 쓰는 글짓기 선수가 될 것인가?
“왜 당신의 리포트는 항상 유첨(Appendix)?”
“당신의 업의 형태를 이해하세요.
분석이 주류(Mainstream)인지?”
23. 데이터 분석의 SKILLSET – 서비스
- https://en.wikipedia.org/wiki/Anscombe%27s_quartet
데이터 서비스
인공지능
분석가가 분석만 한다고 생각하시나요?
데이터만 있으면 무엇이든 할 수 있습니다.
25. 인지적 편안함
원인은 통계를 이긴다
휴리스틱과 편향
- berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/
데이터 분석의 SKILLSET – Good Storyteller
26. "철수는 수줍음이 많고 소심한 편이다. 착하고 성실하며 꼼꼼하고
특히, 정리정돈을 잘한다. 다른 사람에게 거의 관심이 없으며 주변
일에 거의 관심을 보이지 않는다."
철수의 직업은 다음 보기중 어떤 것일 확률이 높을까?
1) 도서관 사서 2) 대형마트 판매직
질문을 읽고 정답을 맞춰 보세요.
- http://blog.yes24.com/blog/blogMain.aspx?blogid=sapiens99&artSeqNo=8823284
27. 전국에 있는 도서관 사서수와 대형마트 판매직원 수를 비교해보자.
대형마트 판매직원 수가 압도적으로 많다. 대형마트 판매직원 숫자
가 99고 도서관 사서가 1 이라면, 확율은 99%, 1% 일 것이다. 성
격적인 부분을 고려하더라도 철수는 '소심하고 꼼꼼한 대형마트 판
매직원'일 확률이 훨씬 높다.
정답은 여기에
“원인이 통계를 이기는 일은 흔하다”
- http://blog.yes24.com/blog/blogMain.aspx?blogid=sapiens99&artSeqNo=8823284
28. 경험을 통한 믿음은 견고합니다.
데이터 분석가의 SKILLSET – Good Storyteller
데이터 분석가:
“데이터 분석 결과 TV의 광고 효과는 미비
합니다.”
현업 담당자:
“무슨 말씀 이세요? 9시 뉴스 시청자가 얼
마 인줄 아세요? TV광고는 필수입니다.
“원인이 통계를 이긴다”
29. 보고 시 회사에서 와서
P-value를
거의 이야기 한적이 없다.
데이터 분석가의 SKILLSET – Good Storyteller
당신의 분석결과를 어떻게 전달 할 것인가?
30. Context is King
=
Good Communication
데이터 분석의 SKILLSET – Good Storyteller
회사 경영자(CEO)의 KPI는….
- https://finance.naver.com/item/main.nhn?code=066570
31. 데이터 분석가의 SKILLSET – Good Storyteller
당신의 분석결과를 어떻게 전달 할 것인가?
“업의 이해”
“조직이해관계 파악”
“효과적인 전달능력”
32. 데이터 분석가에게 필요한 SKILLSET 이란…
도메인 전문가
데이터 핸들링
문제 정의 & 모델링
가설검증 & 최적화
의사결정 & 서비스
Good
Storyteller
35. 데이터 분석가에게 필요한 SKILLSET 이란…
- berkeleysciencereview: http://berkeleysciencereview.com/how-to-become-a-data-scientist-before-you-graduate/
본인의 개성과 성향에 맞는 역할을
선택하세요.