SlideShare a Scribd company logo
1 of 31
Download to read offline
무덤에서 요람까지
통계와 함께
(보험과 통계 그리고 진로)
2015.12
통계분석연구회 운영자
악사손해보험 CRM 팀 Expert
2
Contents
1. 보험과 통계
2. 인생과 통계역정
3. 통계학 진로
4. 데이터 시대 인재상
통계학의 정의
 통계학 (Statistics)의 어원
 그리스 로마시대의 국가(status)의 통치 상태(State)를 살피는 것에서 유래
 과거 징세를 목적으로 인구수조사와 지가계산에서부터 통계학은 시작
 Statistics = 국가 (State) + 산술(Arithmetic)
 統 計 = 모아서 계산하다. 統 (합치다) + 計 (셈하다)
목적대상
자료수집
정리요약
분석(추정,예측,검증)
모집단
전수조사, 표본조사
기술통계학 ( Descriptive Statistics)
추측통계학 ( Inferential Statistics)
가입 또는 가입예정 고객 전체
가입고객 전체, 일부 고객
보험료, 손해액, 사고건수, 연령, …
재가입 유무, VIP고객 선정, …
손해보험
관 점
 학술적 의미의 통계
 통계의 필수 항목
기술 통계학과 추론 통계학
iv
통계치를 이용한
통계적 기법을 통해
대상 고객을 추정 및 예측
추정 및 검증 i
자동차 보험 가입고객 전체
모집단 (population)
ii표본 (Sample)
재가입 시점이 지난 고객 추출
iii 표본특성치의 정리
표본으로 추출된 고객의 정보
정리
보험사고 빈도, 심도
가입년차, 보험료, …
 모집단의 일부에서 추출된 표본의 정보를 이용하여 모집단의 특정치 정리하여
추정하고 검정하며 그리고 예측하는 학문이다.
추론 통계학
기술 통계학
* 기술(記述) 통계는 측정이나 실험에서 수집한 자료의 정리, 표현, 요약, 해석 등을 통해 자료의 특성을 규명하는
통계적 방법
* 추론 통계는 기술통계로 어떤 모집단에서 구한 표본정보를 가지고 그 모집단의 특성 및 가능성 등을 추론해내는
통계적 방법
통계적 추론
 정보를 분석하여 모집단의 특성을 추론함.
Q : 보험가입자 중 사고 위험이 높은 모집단은 어떤 경우일까?
고객 정보
운행하는 요일
운행하는 시간대
보험 가입 경력
운전자 연령
운전자 성별
정보 분석
일요일의 사고발생률은 15.7%로 가장
높았으며 월요일이 11.8%로 가장 낮음
오후2시부터 8시 사이에 전체 사고의 약
40% 발생
가입경력 3년 이상의 사고 발생율은
4.8%인데 반해 초보운전은 8.1%
전국적으로 30세 미만 운전자의 사고
발생율이 7.1%로 다른 연령층에 비해 높음.
특히 인천(8.7%), 서울(8%)
남자는 4.9%, 여자는 5.9%임. 여자가
남자보다 20% 사고 발생율이 높음
추정
일요일 오후
2시~8시 사이에
30세 미만의 여성
초보운전자들의
경우 사고 발행율이
매우 높음
 모수의 추정
상관관계와 회귀분석
변수 사이의 관련성 및 그에 따른 예측
통계적 관점
보험사고에 영향을 미치는 변수는 ?
보험 관점
몸무게
키
보험사고
연령
차량종류
사고경험
법규위반
주행거리
…
 상관관계
상관관계와 회귀분석
 두 변수 사이의 관계식을 파악하여 한 변수의 값으로부터 다른 변수의 값에 대한 예측이 필요한 경우
 두 변수 사이의 함수적인 관계에 대해 통계적으로 분석하는 방법
영향을 주는 변수 영향을 받는 변수
설명변수 (Explanatory Variable) 반응변수 (Response Variable)
독립변수 (Independent Variable) 종속변수 (Dependent Variable)
X변수 Y변수
연령
차량종류
사고
경험
지역
성별
…
법규위반
경험
주행
거리
보험적 관점
보험사고
 회귀분석
8
손 해 보 험 과 통 계
보험료
(요율/UW)
고객
(가치관리)
전산기술 보상
(손해사정)
영업
(성과관리)
마케팅
(채널관리)
보험과
통계
9
CRM Team’s Main task
Enterprise
Information System
DATA
Intellegence
Business
Re-engineering
Maximize
Customer Value
Information
Knowledge
Business
Assessment
CRM
Business Intelligence
Through Big Data
10
CRM 팀 업무
CRM 팀
팀장
팀원 6명
1) EIS (Enterprise Information System) 시스템 운영.
2) KMS OLAP (On-Line Analytical Processing ) 시스템 운영.
3) 유관 부서 통계 분석 지원 및 비즈니스 기반의 SAS/OLAP 교육 진행.
1. 임원 정보 시스템(EIS-정보계 시스템) 운영
1) 자동차 New_biz Outbound Loading CR 스코링
2) 자동차 New_biz Outbound Loading U/W 스코링
3) 자동차 갱신 스코링, 자동차 마일리지 스코링
4) Contractual Customer’s Life-Time Value 시스템
5) 자동차 사기적발(Auto the Fraud Detection) 시스템
2. 데이터 분석 기법을 활용한 영업 효율성 향상.
1) 고객 프로파일 분석 및 고객 운영 전략 기획
2) 갱신율 모니터링 과 고객 세분화/ Targeting 전략 분석 및 수립
3) 각종 활동성 분석 리포트 생성 / 관리
4) 리스크 관리를 위한 손해율 예측 시스템
5) 자동차 통합 지표 분석 시스템 운영 (LR/CR/RR)
3. 비즈니스 의사 결정 지원을 위한 분석 지원 업무
1) 영업과 마케팅 효율성 향상 프로세스 기획 및 지원
2) SR 역량 진단 시스템 - TSR, FR and LSR (Sales SR)
신입 SR 정착 시스템, SR intensive care 시스템
3) 영업 시스템 내 계약 정보 및 고객 프로파일 프로세스 기획 및 운영
4. 마케팅 활동과 영업 효율성 측정 업무
Biz Scope
1. Improve Biz Process
through Statistical Analysis
2. Support Biz decision by
various segment and analysis
3. Enforce CRM Activity
고객 재가입 예측 모델
Characteristic
선택
기초변수 분석
Modeling
Scoring /
Segmentation
Assessment
Group 별 지표분석
• 변수선택 방법으로는 변수 별로 갱신율과의 상대적의 dependency를 고려하여 (Information / Chi-
squared statistic 등) 변수선택을 하기도 하나, 그 외 data visualization 등을 고려할 수 도 있음.
• 선택된 변수를 통한 기초분석을 통해 Pattern 파악 및 연관성 분석
• 관련 변수들을 이용하여 예측력이 뛰어난 Bagging Tree Modeling 실시
• 생성된 모델에 데이터를 적용하여 스코어 산출을 통한 Segmentation 실시.
• Modeling 단계에서 생성된 모델의 형태 및 Scoring 단계에서 산출된 각 그룹의 갱신율을 통해 모델의
성능 파악 (훈련자료와 테스트자료로 분류하여 실시)
• 문제점 발생 시 또는 리모델링의 필요 시 앞의 모든 과정을 검토함.
• Action Plan 도출을 위한 각 그룹별 갱신율 및 특징 파악을 위한 지표분석 실시
리모델링검토
 고객의 재가입(갱신)을 가능성을 Scoring 하여 고객을 분류
 일반적으로 Scoring을 위한 Process는 다음과 같음
 모델링 프로세스
"데이터는 나보다 나를 더 잘 알고 있다”
고객 재가입 예측 모델
서비스정보
계약정보
고객정보
관계코드 피보험자 연령대 피보험자 성별
피보험자 주소지 지역등급 접촉가능 여부
우편발송처 이벤트 당첨여부 가입경력
긴급출동 건수 재 갱신대상 여부 주소변경여부
차량대체 여부 갱신적용보험료 주유적립 휫수
이벤트메일
거부
보험메일
거부
Sales Mail
Open 수
Non-Sales Mail
Open 수
할인할증 법규 위반율 특별할증율
동일증권여부 전담보구분 자손가입
자차가입 무보험가입여부 연령한정특약
배서횟수 금액배서횟수 불평배서횟수
경과보험료 자차 경과보험료 담보변경 이력
인수에러유형 차량연식 차량 수/자동
차종 3년간 사고 휫수
전계약 사고점수
운전자범위특약 분납불이행횟수 긴급출동특약
사고건수 면책건수
사망자수부상자수 발생 손해액
차량가액
연속형 변수 이산형 변수
 갱신 모델링을 위한 주요변수
고객 재가입 예측 모델
분석 Data Frame Segmentation
만기 2007년
1월 ~ 5월
고객정보
서비스정보계약정보
만기 2007년
1월 ~ 4월
만기 2007년
5월
Original Data Frame
Random
Sampling
Re-Test
Data Frame
Training
Data Frame
Test
Data Frame
70%
30%
Modeling Data Frame
Training Data Modeling
3rd
2nd
1
2 10
6
4
…
…
1st
Modeling
각 Data Frame Prediction
Re-Test
Data Frame
Training
Data Frame
Test
Data Frame
3rd
2nd
1
2 10
6
4
…
…
1st
Model
93.30%
88.37%
84.99%
82.79%
80.52%
77.73%
74.52%
70.58%
66.10%
55.31%
50.00%
55.00%
60.00%
65.00%
70.00%
75.00%
80.00%
85.00%
90.00%
95.00%
100.00%
Group1Group2Group3Group4Group5Group6Group7Group8Group9Group10
갱신율
스코어 등비율
구간별 갱신율
Training
Data
Frame
스코어 등비율 구간별갱신율
90.44%
84.14%
82.16%
80.26%
78.02%
76.50%75.10%
72.94%
70.77%
63.91%
50.00%
55.00%
60.00%
65.00%
70.00%
75.00%
80.00%
85.00%
90.00%
95.00%
Group1Group2Group3Group4Group5Group6Group7Group8Group9Group10
갱신율
스코어 등비율 구간별갱신율
88.47%
83.94%
82.28%
80.26%
78.03%
76.46%
74.24%
72.56%
70.73%
65.63%
50.00%
55.00%
60.00%
65.00%
70.00%
75.00%
80.00%
85.00%
90.00%
95.00%
Group1 Group2 Group3 Group4 Group5 Group6 Group7 Group8 Group9 Group10
갱신율
Test
Data
Frame
Re-Test
Data
Frame
Prediction
 갱신 모델링 프로세스
고객 재가입 예측 모델
 스코어의 분포는 평균이 0.774 인 정규분포임
 스코어가 높을 수록 갱신율이 증가하는 추세임
 하위 스코어의 경우 건수가 작아 조금의 역전현상이
발생함
 산출된 스코어를 이용하여 10개의 Group 별 갱신율
을 보면 1 Group과 10 Group과의 갱신율은 약
19.57% 차이를 보임
 1 Group ~ 5 Group은 평균 갱신율 보다 높음
구성비
갱신율
피보험자 스코어 구성비 및 갱신율 스코어 등비율 구간별 갱신율
갱신율
평균 갱신율 : 77.42%
0.00%
5.00%
10.00%
15.00%
20.00%
25.00%
30.00%
35.00%
40.00%
0.0%
10.0%
20.0%
30.0%
40.0%
50.0%
60.0%
70.0%
80.0%
90.0%
100.0%
구성비(%) 갱신율(%)
86.19%
83.38%
81.41%
79.92%79.38%
76.43%75.42%
74.28%
71.16%
66.62%
50.00%
55.00%
60.00%
65.00%
70.00%
75.00%
80.00%
85.00%
90.00%
Group1 Group2 Group3 Group4 Group5 Group6 Group7 Group8 Group9 Group10
 산출된 스코어를 이용하여 10개의 등비율로 Segmentation 후 각 Group별 재가입율(갱신율)은
아래과 같음
 갱신 모델링 결과
인생과 통계역정
입시 통계
인구 통계
노후 통계
취업 통계
 경쟁률
 진학률
 취업률(대학알리미)
업무 통계
 추세분석
 효과분석
 현황분석
 집계통계
 정책 통계
 교육 통계
 조세 통계
 의학 통계
 연금 통계
 재취업
투자 통계
 년봉 및 근로 조건
 퇴사율 관리
 인사 관리
 주식
 부동산
 자산관리
 창업통계
"내가 쓰는 통계학이라는 말은 국민들이 누리는 행복의 양을 조사하고 앞으로 개선해나갈 목적
으로 나라의 상태를 탐구하는 것을 말한다." - 존 싱클레어
창업 통계
 상권분석
 지역 및 업종 분석
16
통계학 진로 – 복합 예술의 기반
금융회사
대학 입학처
제조 품질관리
산업공학
스포츠 통계
바이오
임상 통계
기업 통계 분석
고객 분석(CRM)
여론 및 마케팅 조사
통계청/기상청
신용정보회사
경영 마케팅 빅데이터데이터사이언티스트
각종 공사/공단/협회
포춘지의 '직업을 위한 2015년 Best&Worst 학위(석사이상)
미래의 유망 직업 1위가 '통계학 박사'
빅데이터 시대에 떠오르는 직업, 데이터 과학자
- 데이터 과학자, 유망직종, 유망직업
구글의 수석 경제분석가 핼 배리언은 향후 10년 동안 유망직종으로 통계 전문가 가운데 빅 데
이터로부터 다양한 정보를 얻을 수 있는 데이터 과학자를 언급
E-스포츠
게임회사
복합/융합
학문
통계
17
진실을 탐구하는 학문
[평균의 함정]
[심슨의 패러독스]
‘세상에는 세 가지 거짓말이 있다.
그냥 거짓말과 새빨간 거짓말, 그리고 통계.’
- 소설가 출신 영국 총리 디즈레일리(Benjamin Disraeli)
18
직업기초능력 - 국가직무능력표준(NSC)
의사소통능력
글과 말을 읽고 들음으로써 다른 사람이 뜻한 바를 파악하고, 자기가 뜻한 바를 글과 말을 통해 정확하게 쓰
거나 말하는 능력
수리능력 사칙연산, 통계, 확률의 의미를 정확하게 이해하고, 이를 업무에 적용하는 능력
문제해결능력
문제 상황이 발생하였을 경우, 창조적이고 논리적인 사고를 통하여 이를 올바르게 인식하고 적절히 해결하
는 능력
자기개발능력 업무를 추진하는데 스스로를 관리하고 개발하는 능력
자원관리능력
업무를 수행하는데 시간, 자본, 재료 및 시설, 인적자원 등의 자원 가운데 무엇이 얼마나 필요한지를 확인하
고, 이용 가능한 자원을 최대한 수집하여 실제 업무에 어떻게 활용할 것인지를 계획하고, 계획대로 업무 수행
에 이를 할당하는 능력
대인관계능력 업무를 수행함에 있어 접촉하게 되는 사람들과 문제를 일으키지 않고 원만하게 지내는 능력
정보능력
업무와 관련된 정보를 수집하고, 이를 분석하여 의미 있는 정보를 찾아내며, 의미 있는 정보를 업무수행에 적
절하도록 조직하고, 조직된 정보를 관리하며, 업무 수행에 이러한 정보를 활용하고, 이러한 제 과정에 컴퓨터
를 사용하는 능력
기술능력
업무를 수행함에 있어 도구, 장치 등을 포함하여 필요한 기술에는 어떠한 것들이 있는지 이해하고, 실제로 업
무를 수행함에 있어 적절한 기술을 선택하여 적용하는 능력
조직이해능력 업무를 원활하게 수행하기 위해 국제적인 추세를 포함하여 조직의 체제와 경영에 대해 이해하는 능력
직업윤리능력 업무를 수행함에 있어 원만한 직업생활을 위해 필요한 태도, 매너, 올바른 직업관
국가직무능력표준(NSC)은 산업현장에서 직무를 수행하기 위해 요구되는 지식,기술,소양 등의 내용을 국가가 산업부분별,
수준별로 체계화한 것으로 산업현장의 직무를 성공적으로 수행하기 위해 필요한 능력(지식, 기술, 태도)을 국가적 차원에
서 표준화한 것을 의미합니다.
<출처: 산업인력공단 국가직무능력표준 (http://www.ncs.go.kr)>
19
21세기 요구되는 인재상
통전
• 데이터 처리 / DB / SQL
/ 빅데이터
• 하둡 / 데이터 이해
• 시각화
• SAS / R-Project/ SPSS
• 통계지식/수학 /
회귀분석/ 다변량
• 데이터 기반 의사결정
및 예측 능력
• 머신러닝/데이터마이닝
• 영어/창조적 마인드
• 호기심/창의력/소통 능력
• 능동적인 태도
• 자기개발 능력
• 해당 산업 지식
• 데이터 기반 기획/
마케팅
• 비즈니스 프로세스 지식
• 비즈니스 컨설팅
21세기
핵심인재
(분석적 사고력)
계
산
비
지
스
개
인
역
량
니
“자신의 성격과 능력에 맞춰서 능력 개발 또는 보완 방법 필요”
20
통계와 첫 만남을 준비하는 통계인을 위한
추천 도서
 벌거벗은 통계학 (찰스 윌런. 책읽는
수요일)
경제학자 찰스 윌런이 야구와 골프에서
광고와 선거에 이르기까지 숫자의 의미를
해석해주는 책입니다. 오늘의 흐름을 정확히
읽어 내일의 변화를 예측하는 통계의 힘을
익히고 싶은 사람이라면 누구라도 이 책이
도움이 될 것입니다.
 통계 속의 재미있는 세상이야기
(통계청)
부담없이 읽으며, 논리적 사고력과
사물에 대한 통찰력을 키우고, 통계에
자연스럽게 알 수 있다
 괴짜통계학 (김진호. 한국경제신문사)
노스트라다무스가 희대의 예언가라고
생각하시나요? 아니면 사기꾼이라고
생각하시나요? 어떻게 해석하느냐에 따라
결과가 판이하게 달라지는 재미있는 통계
사례들을 모은 책입니다.
 세상에서 가장 쉬운 통계학입문
(고지마 히로유키. 지상사)
중학교 수준의 수학으로 통계학을 쉽게
설명한 입문서. ‘이런 것이
통계구나’라는 감을 잡기에 좋은
책입니다.
 세상에서 가장 재미있는 통계학
(아트후프만 · 울코트스미스저. 궁리출판)
그림이 포함되어 있어 이해하기 쉬운 책.
방송과 신문에서 나오는 ‘신뢰수준 95%에
오차는플러스 마이너스 5%.’ 등의 말이
무엇인지 알고 싶다면 읽어 볼 만한 책입니다.
 괴짜가 사랑한 통계학 (그레이엄 테터솔.
한겨레출판)
“지금 즉시 전국의 전봇대 개수를 이야기해
보시오”라는 질문에는 뭐라고 대답해야
할까요? 통계학적 사고로 기상천외한
문제들을 풀어가는 책입니다
<고려대 입학처 전공안내>
21
추천 영화
 10 Must Watch Movies on Data Science and Machine Learning
출처 : http://www.analyticsvidhya.com/blog/2015/11/10-watch-movies-data-science-machine-learning/
22
- 교육목표 : 평소 어렵게 생각했던 통계를 쉽고 재미있는 방식으로 접근하여 통계자료가
일상생활에서 어떻게 활용하는지 직접 실습해봄으로써 합리적 사고 능력을 배양한다.
- 교육내용 : 출항 통계호 / 분임활동 / 발표 및 강평 / 소양교육
- 교육목표 : 중학생들에게 통계에 대한 올바른 이해 확립, 합리적 사고능력의 배양 및 팀원과의
협력을 통한 문제해결 능력을 향상한다.
- 교육내용 : 통계적 사고방식/그래프의 활용/창의적 문제해결/통계자료 수집/통계포스터 작성
통계 교육원 - 통계 아카데미
고등학생 통계아카데미
- 교육목표 : 통계에 대한 올바른 이해를 돕고 팀원과의 협력을 통한 문제해결 능력을 향상한다.
- 교육내용 : 과학과 통계 / 인성과 통계 / 창의와 통계 / 분임토의 및 발표
대학생 통계실무워크숍 - 교육목표 : 학교에서 배운 이론이 실무에 어떻게 적용되는지 실습해봄으로써 통계 활용능력
향상 및 통계에 대한 이해의 폭을 확대한다.
- 교육내용 : 조사기획 입문 / 조사주제 및 표본 선정 / 조사표 설계 / 자료 수집
대학원생 통계논문작성
- 교육목표 : 통계를 전공하지 않은 대학원생이 학술논문과 보고서 작성 시 국가통계활용과 의미
있는 통계분석 방법을 적용할 수 있다.
- 교육내용 : 통계적 방법 및 연구방법 개요 / 기초적 가설검정 / 논문적용 통계분석
어린이 통계캠프
중학생 통계아카데미
초등교사 통계연수
- 교육목표 : 초등교사의 통계적 마인드와 지도방법을 학습하여 학생들에게 생활 속 유용한
통계를 창의적으로 지도할 수 있도록 한다.
- 교육내용 : 통계교육 지도 길잡이 / 통계정보검색 / 통계와 창의성 / 소양교육
<출처: 통계교육원 (http://sti.kostat.go.kr/)>
통계적 사고방식
(이러닝교육)
- 교육목표 : 통계에 대한 전반적인 기본지식을 이해하기 쉽도록 이야기 형식으로 구성하여 흥미
있는 학습이 되도록 하고 이를 통해 통계의 필요성을 인식하고 학습동기를 유발하는 계기 제공.
- 교육내용 : 통계와 통계학 소개/자료를 요약한다는 것은/신문기사로 보는 통계/통계적
의사결정
23
통계관련 참여 행사
 전국학생통계활용대회 (통계청)
창의력을 개발하고 탐구심과
커뮤니케이션 능력 배양을 목표로 통계
포스터 경진대회로 진행
 서울대학교 데이터마이닝 캠프(한국
BI 데이터마이닝 학회)
대학진학을 앞 둔 고등학교 학생들에게
미래형 연구응용 분야이자, 학제 간
분야인 데이터마이닝에 대하여 소개
 글로벌 데이터톤(미래창조과학부)
아시아의 빅데이터 활용 문화 확산 및
글로벌 인재 발굴을 위한 데이터 활용
아이디어 경진대회
 슈퍼컴퓨터 활용 아이디어 경진대회
복잡한 과학기술, 사회, 문화, 경제 등의
사회 현안 문제를 슈퍼컴퓨터를 이용하여
해결할 수 있는 톡!톡! 뛰는 기발하고
창의적인 아이디어 모집
24
진로 추천 사이트
25|
통계 관련 자격증
■ 사회조사분석사 ( Survey Analyst )
■ 품질경영기사 (Engineer Quality Management)
■ 보험계리사
■ 재무위험관리사
■ 한국DB진흥원 : 데이터 분석 준전문가(ADsP), 데이터
분석 전문가(ADP)
■ CRM 협회 자격인증 : CRM 전문가, 마케팅통계분석가,
데이터마이닝전문가, 고객 DB분석가
■ 경영 빅데이터 분석사(한경아카데미)
출처 : 통계 분석과 BI(Business Intelligence) 관련 인증 자격증 안내
여름방학, 통계 자격증과 함께(작성자 통계청)
'제 값 하는' 빅 데이터 자격증 11종(CIOKOREA)
■ 콜럼비아대 - 데이터 과학 전문성 인증시험,
델라웨어대 - 애널리틱스 자격증: 빅 데이터 최적화
■ EMC 데이터 과학자 협회 자격증
■ 레볼루션 애널리틱스 - 레볼루션 R 엔터프라이즈
프로페셔널
■ Google’s Certifications
■ SAS Certifications
■ IBM SPSS Statistics Certification
■ Microsoft SQL Server
■ IBM Cognos Certifications
■ MicroStrategy
■ Oracle
■ SAP Certifications
26
[참고] 엑셀(Excel)의 단계
• 처음 들어봄
• 수식 계산기
• 셀서식
• 기본 함수/IF구문
• Vlookup
• 함수마법사
• 엑셀 홈페이지 참여
• 고수의
매크로/배열수식에
감탄
• 자신에 대한 자괴감
• 데이터 베이스 관심
• 부분합/피벗테이블
• 쿼리와 매크로
• VBA 입문
• 매크로 기록기
• 순환문
• 사용자 정의 폼
• 알고리즘 부재 회의
• 프로젝트 효율성 고민
초보1단계 초보2단계 초보3단계
• 엑셀 다시 공부
• 관련 모임 참여
• 업무 이외에도 관심
• 엑셀 주변에
관심(API / 엑세스)
• 다른 프로그램과
연동 고민
• 고난도의 자료/도서
• 여러 프로젝트 수행
• 중수를 인지(타인은
고수로 모심)
• 자신의 문제 해결
가능
• 개념의 중요성 인지
• 알고리즘
공부(자료구조,재귀호
출, 정렬 등)
• 영어/수학 한탄
• 사업 구상
• 보살의 단계 - 수양
중급1단계 중급2단계 중급3단계
출처 : 엑사모 고수 강용림 (현재 원문 미존재)
(http://cafe.daum.net/statsas/O0DR/1)
27
[참고] 참 고 페 이 지
■ 통계분석연구회 “통계진로정보” 게시판
■ 통계교육원 열린교육방 게시판
■ 대학알리미(www.academyinfo.go.kr) - 학과별 취업 현황과 연구 성과, 교육 여건 등에 대한 정보 제공
■ 전공 및 개별 학교별 취업률 자료 제공처(통계학과 취업률) : http://cafe.daum.net/statsas/KqTP/365
■ 워크넷(work.go.kr)
한국직업전망(http://www.work.go.kr/consltJobCarpa/srch/korJobProspect/korJobProspectSrchByJobCl.do)
■ 한국직업능력개발원(krivet.re.kr)
■ 한국직업능력개발원 커리어넷-미래의 직업세계 (career.go.kr)
■ 한국고용정보원 - 진로길라잡이 / 진로선택을 위한 학과정보(keis.or.kr)
직업정보 : http://www.keis.or.kr/www/board/NR_boardList.do?bbsCd=1010
진로진학 Q&A 50선 / 한국직업전망 / 미래를 함께할 새로운 직업 / 색다른 직업 생생한 인터뷰 /
청소년들이 궁금해 하는 99가지 직업이야기 / 중고생 한국직업사전-알고싶은 직업, 만나고 싶은
직업
■ 대한상공회의소(korcham.net)
■ 한국산업인력공단(hrdkorea.or.kr) 자격증 정보제공(q-net.or.kr)
■ 잡영(jobyoung.go.kr)
■ 한국고용정보원 "내일을 Job아라" 동영상서비스(직업/학과정보 동영상)
28
[참고] 참 고 문 서
■ 통계분석연구회 통계진로게시판
■ 악사손해보험 CRM팀 12년 역사
■ [동영상] AXA 손해보험의 CRM과 데이터 사이언스 / 금기돈 팀장(AXA)
■ [데이터사이언티스트를 찾아서] “과거 CRM이 현재 빅데이터의 자양분”
■ [데이터사이언티스트를 찾아서] 데이터 사이언티스트, 빅데이터를 논하다
■ 우리회사 특별한 조직-악사손해보험 ‘경영기획본부 CRM팀’ (보험신보)
■ 어떻게 하면 데이터 사이언티스트가 될 수 있나요? (하용호 대표)
29
통계분석연구회 소개
통계분석연구회
1. 사이트 주소 : http://cafe.daum.net/statsas
2. 회원수 : 49,263 (2015.12월 기준)
3. 개설일 : 2000.01.18
4. 운영 사이트
- 페이스북 : www.facebook.com/groups/statsas
5. 주요 사항
- 2003년 SPSS KOREA의 SIG 멤버 선정
- 2008년 SPSS 온라인 우수 커뮤니티 선정
- 2009년 제15회 통계의날 통계청장 표창(운영자)
- 2011년 제17회 통계의날 국무총리 표창(연구회)
- SAS KOREA 지원 클럽
• 통계 대중화 및 빅데이터 시대 선도
• 통계 이론과 현장 활용 분석 방법 토론의 장 마련
• 통계 정보, 통계 분석 자료 공유
• 통계 관련 취업 정보 및 통계진로정보
• 통계와 빅데이터 분석 정보 공유
• 다양한 통계 문화 활동
• 통계진흥원 통계 재능 기부 활동 지원
30
End of Document
자신의 미래를 책임 질 수 있도록 현재의
나에게 최선을 다하시기를 바랍니다.
31
데이터과학자 기본 역량 - 정보화진흥원
■ 빅데이터 역량 모델 (빅데이터 커리큘럼 참조모델 1.0)
<빅데이터 커리큘럼 참조 모델 Ver 1.0>
기반역량
창의적 문제해결 및 전략적 의사소통 등 데이터 과학자로서의 역할을 수행하기 위해 기본적으로
요구되는 역량 (교육과목 : 창의적 사고훈련 / 프리젠테이션과 커뮤니케이션 / 설득 커뮤니케이
션 / 조직문화와 커뮤니케이션)
기술역량
다양한 데이터 전처리 및 대용량 데이터 관리를 위한 플랫폼을 운영/개발, 나아가 응용 플랫폼을
구축 할 수 있는 역량 (컴퓨터 응용 프로그램 및 인프라/하둡 분산 파일 시스템의 구조와 활용)
분석역량
분석의 기본 이론 및 지식을 바탕으로 분석 Tool을 활용하여 다양한 데이터로부터 분석 결과물을
도출할 수 있는 역량 (수리적 사고와 표현 / 분석적 사고의 향상 / 통계분석 기법 / OLPA / 데이
터 마이닝 프로세스 / 텍스트 마이닝 / 빅데이터 분석 결과 시각화 방법 및 적용)
사업역량
다양한 산업과 업무 측면의 새로운 가치 창출을 위해 분석 방향성을 수립하고, 가설 및 모델 수
립, 최적화 및 분석 성과 평가를 수행할 수 있는 역량 (경영학 개론 / 산업별 빅데이터 적용전략
/ 분석기획 방법론 / 프로젝트 관리개론 / 의사결정 기법의 이해 / 전략 기반의 빅데이터 사업
기획)
학부 1∼2학년
학부 3∼4학년
대학원 석사 이상

More Related Content

Similar to [통계페스티발] 무덤에서 요람까지 통계와 함께

데이터 분석 동향과 비즈스프링이 제공하는 데이터
데이터 분석 동향과 비즈스프링이 제공하는 데이터데이터 분석 동향과 비즈스프링이 제공하는 데이터
데이터 분석 동향과 비즈스프링이 제공하는 데이터BizSpring Inc.
 
[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자neuroassociates
 
韩国Ppt高手收集的ppt图表素材[免积分下载]
韩国Ppt高手收集的ppt图表素材[免积分下载]韩国Ppt高手收集的ppt图表素材[免积分下载]
韩国Ppt高手收集的ppt图表素材[免积分下载]fgf201213
 
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아K data
 
BS501 발표자료
BS501 발표자료BS501 발표자료
BS501 발표자료Park Sungpil
 
Mitigation of big data regulation deogtae kim
Mitigation of big data regulation deogtae kimMitigation of big data regulation deogtae kim
Mitigation of big data regulation deogtae kimDeogtae Kim
 
[도서 리뷰] 헤드 퍼스트 데이터 분석 ( Head First Data Analysis )
[도서 리뷰]  헤드 퍼스트 데이터 분석 ( Head First Data Analysis )[도서 리뷰]  헤드 퍼스트 데이터 분석 ( Head First Data Analysis )
[도서 리뷰] 헤드 퍼스트 데이터 분석 ( Head First Data Analysis )Seung-Woo Kang
 
MindsLab seminar(20140527) 02_빅이슈 해결을 위한 빅데이터 사용
MindsLab seminar(20140527) 02_빅이슈 해결을 위한 빅데이터 사용MindsLab seminar(20140527) 02_빅이슈 해결을 위한 빅데이터 사용
MindsLab seminar(20140527) 02_빅이슈 해결을 위한 빅데이터 사용Taejoon Yoo
 
분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질Sun Young Kim
 
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해pinetreeopenclass
 
기계학습 현재와미래 Pdf
기계학습 현재와미래 Pdf기계학습 현재와미래 Pdf
기계학습 현재와미래 Pdf효근 윤
 
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...Jungmin Lee
 
실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루Jaimie Kwon (권재명)
 
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다승화 양
 
150514 경북대학교(콘텐츠산업과 창업)
150514 경북대학교(콘텐츠산업과 창업)150514 경북대학교(콘텐츠산업과 창업)
150514 경북대학교(콘텐츠산업과 창업)Hee Dae Kim
 
세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석
세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석
세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석Kwang Woo NAM
 

Similar to [통계페스티발] 무덤에서 요람까지 통계와 함께 (20)

HR Analytics
HR AnalyticsHR Analytics
HR Analytics
 
데이터 분석 동향과 비즈스프링이 제공하는 데이터
데이터 분석 동향과 비즈스프링이 제공하는 데이터데이터 분석 동향과 비즈스프링이 제공하는 데이터
데이터 분석 동향과 비즈스프링이 제공하는 데이터
 
[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자
 
韩国Ppt高手收集的ppt图表素材[免积分下载]
韩国Ppt高手收集的ppt图表素材[免积分下载]韩国Ppt高手收集的ppt图表素材[免积分下载]
韩国Ppt高手收集的ppt图表素材[免积分下载]
 
보험사, 빅데이터에 답을 묻다
보험사, 빅데이터에 답을 묻다보험사, 빅데이터에 답을 묻다
보험사, 빅데이터에 답을 묻다
 
빅데이터
빅데이터빅데이터
빅데이터
 
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
 
BS501 발표자료
BS501 발표자료BS501 발표자료
BS501 발표자료
 
Mitigation of big data regulation deogtae kim
Mitigation of big data regulation deogtae kimMitigation of big data regulation deogtae kim
Mitigation of big data regulation deogtae kim
 
[도서 리뷰] 헤드 퍼스트 데이터 분석 ( Head First Data Analysis )
[도서 리뷰]  헤드 퍼스트 데이터 분석 ( Head First Data Analysis )[도서 리뷰]  헤드 퍼스트 데이터 분석 ( Head First Data Analysis )
[도서 리뷰] 헤드 퍼스트 데이터 분석 ( Head First Data Analysis )
 
MindsLab seminar(20140527) 02_빅이슈 해결을 위한 빅데이터 사용
MindsLab seminar(20140527) 02_빅이슈 해결을 위한 빅데이터 사용MindsLab seminar(20140527) 02_빅이슈 해결을 위한 빅데이터 사용
MindsLab seminar(20140527) 02_빅이슈 해결을 위한 빅데이터 사용
 
분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질분석 현장에서 요구되는 데이터과학자의 역량과 자질
분석 현장에서 요구되는 데이터과학자의 역량과 자질
 
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
 
기계학습 현재와미래 Pdf
기계학습 현재와미래 Pdf기계학습 현재와미래 Pdf
기계학습 현재와미래 Pdf
 
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
 
HR과 빅데이터
HR과 빅데이터HR과 빅데이터
HR과 빅데이터
 
실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루
 
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
 
150514 경북대학교(콘텐츠산업과 창업)
150514 경북대학교(콘텐츠산업과 창업)150514 경북대학교(콘텐츠산업과 창업)
150514 경북대학교(콘텐츠산업과 창업)
 
세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석
세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석
세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석
 

[통계페스티발] 무덤에서 요람까지 통계와 함께

  • 1. 무덤에서 요람까지 통계와 함께 (보험과 통계 그리고 진로) 2015.12 통계분석연구회 운영자 악사손해보험 CRM 팀 Expert
  • 2. 2 Contents 1. 보험과 통계 2. 인생과 통계역정 3. 통계학 진로 4. 데이터 시대 인재상
  • 3. 통계학의 정의  통계학 (Statistics)의 어원  그리스 로마시대의 국가(status)의 통치 상태(State)를 살피는 것에서 유래  과거 징세를 목적으로 인구수조사와 지가계산에서부터 통계학은 시작  Statistics = 국가 (State) + 산술(Arithmetic)  統 計 = 모아서 계산하다. 統 (합치다) + 計 (셈하다) 목적대상 자료수집 정리요약 분석(추정,예측,검증) 모집단 전수조사, 표본조사 기술통계학 ( Descriptive Statistics) 추측통계학 ( Inferential Statistics) 가입 또는 가입예정 고객 전체 가입고객 전체, 일부 고객 보험료, 손해액, 사고건수, 연령, … 재가입 유무, VIP고객 선정, … 손해보험 관 점  학술적 의미의 통계  통계의 필수 항목
  • 4. 기술 통계학과 추론 통계학 iv 통계치를 이용한 통계적 기법을 통해 대상 고객을 추정 및 예측 추정 및 검증 i 자동차 보험 가입고객 전체 모집단 (population) ii표본 (Sample) 재가입 시점이 지난 고객 추출 iii 표본특성치의 정리 표본으로 추출된 고객의 정보 정리 보험사고 빈도, 심도 가입년차, 보험료, …  모집단의 일부에서 추출된 표본의 정보를 이용하여 모집단의 특정치 정리하여 추정하고 검정하며 그리고 예측하는 학문이다. 추론 통계학 기술 통계학 * 기술(記述) 통계는 측정이나 실험에서 수집한 자료의 정리, 표현, 요약, 해석 등을 통해 자료의 특성을 규명하는 통계적 방법 * 추론 통계는 기술통계로 어떤 모집단에서 구한 표본정보를 가지고 그 모집단의 특성 및 가능성 등을 추론해내는 통계적 방법
  • 5. 통계적 추론  정보를 분석하여 모집단의 특성을 추론함. Q : 보험가입자 중 사고 위험이 높은 모집단은 어떤 경우일까? 고객 정보 운행하는 요일 운행하는 시간대 보험 가입 경력 운전자 연령 운전자 성별 정보 분석 일요일의 사고발생률은 15.7%로 가장 높았으며 월요일이 11.8%로 가장 낮음 오후2시부터 8시 사이에 전체 사고의 약 40% 발생 가입경력 3년 이상의 사고 발생율은 4.8%인데 반해 초보운전은 8.1% 전국적으로 30세 미만 운전자의 사고 발생율이 7.1%로 다른 연령층에 비해 높음. 특히 인천(8.7%), 서울(8%) 남자는 4.9%, 여자는 5.9%임. 여자가 남자보다 20% 사고 발생율이 높음 추정 일요일 오후 2시~8시 사이에 30세 미만의 여성 초보운전자들의 경우 사고 발행율이 매우 높음  모수의 추정
  • 6. 상관관계와 회귀분석 변수 사이의 관련성 및 그에 따른 예측 통계적 관점 보험사고에 영향을 미치는 변수는 ? 보험 관점 몸무게 키 보험사고 연령 차량종류 사고경험 법규위반 주행거리 …  상관관계
  • 7. 상관관계와 회귀분석  두 변수 사이의 관계식을 파악하여 한 변수의 값으로부터 다른 변수의 값에 대한 예측이 필요한 경우  두 변수 사이의 함수적인 관계에 대해 통계적으로 분석하는 방법 영향을 주는 변수 영향을 받는 변수 설명변수 (Explanatory Variable) 반응변수 (Response Variable) 독립변수 (Independent Variable) 종속변수 (Dependent Variable) X변수 Y변수 연령 차량종류 사고 경험 지역 성별 … 법규위반 경험 주행 거리 보험적 관점 보험사고  회귀분석
  • 8. 8 손 해 보 험 과 통 계 보험료 (요율/UW) 고객 (가치관리) 전산기술 보상 (손해사정) 영업 (성과관리) 마케팅 (채널관리) 보험과 통계
  • 9. 9 CRM Team’s Main task Enterprise Information System DATA Intellegence Business Re-engineering Maximize Customer Value Information Knowledge Business Assessment CRM Business Intelligence Through Big Data
  • 10. 10 CRM 팀 업무 CRM 팀 팀장 팀원 6명 1) EIS (Enterprise Information System) 시스템 운영. 2) KMS OLAP (On-Line Analytical Processing ) 시스템 운영. 3) 유관 부서 통계 분석 지원 및 비즈니스 기반의 SAS/OLAP 교육 진행. 1. 임원 정보 시스템(EIS-정보계 시스템) 운영 1) 자동차 New_biz Outbound Loading CR 스코링 2) 자동차 New_biz Outbound Loading U/W 스코링 3) 자동차 갱신 스코링, 자동차 마일리지 스코링 4) Contractual Customer’s Life-Time Value 시스템 5) 자동차 사기적발(Auto the Fraud Detection) 시스템 2. 데이터 분석 기법을 활용한 영업 효율성 향상. 1) 고객 프로파일 분석 및 고객 운영 전략 기획 2) 갱신율 모니터링 과 고객 세분화/ Targeting 전략 분석 및 수립 3) 각종 활동성 분석 리포트 생성 / 관리 4) 리스크 관리를 위한 손해율 예측 시스템 5) 자동차 통합 지표 분석 시스템 운영 (LR/CR/RR) 3. 비즈니스 의사 결정 지원을 위한 분석 지원 업무 1) 영업과 마케팅 효율성 향상 프로세스 기획 및 지원 2) SR 역량 진단 시스템 - TSR, FR and LSR (Sales SR) 신입 SR 정착 시스템, SR intensive care 시스템 3) 영업 시스템 내 계약 정보 및 고객 프로파일 프로세스 기획 및 운영 4. 마케팅 활동과 영업 효율성 측정 업무 Biz Scope 1. Improve Biz Process through Statistical Analysis 2. Support Biz decision by various segment and analysis 3. Enforce CRM Activity
  • 11. 고객 재가입 예측 모델 Characteristic 선택 기초변수 분석 Modeling Scoring / Segmentation Assessment Group 별 지표분석 • 변수선택 방법으로는 변수 별로 갱신율과의 상대적의 dependency를 고려하여 (Information / Chi- squared statistic 등) 변수선택을 하기도 하나, 그 외 data visualization 등을 고려할 수 도 있음. • 선택된 변수를 통한 기초분석을 통해 Pattern 파악 및 연관성 분석 • 관련 변수들을 이용하여 예측력이 뛰어난 Bagging Tree Modeling 실시 • 생성된 모델에 데이터를 적용하여 스코어 산출을 통한 Segmentation 실시. • Modeling 단계에서 생성된 모델의 형태 및 Scoring 단계에서 산출된 각 그룹의 갱신율을 통해 모델의 성능 파악 (훈련자료와 테스트자료로 분류하여 실시) • 문제점 발생 시 또는 리모델링의 필요 시 앞의 모든 과정을 검토함. • Action Plan 도출을 위한 각 그룹별 갱신율 및 특징 파악을 위한 지표분석 실시 리모델링검토  고객의 재가입(갱신)을 가능성을 Scoring 하여 고객을 분류  일반적으로 Scoring을 위한 Process는 다음과 같음  모델링 프로세스 "데이터는 나보다 나를 더 잘 알고 있다”
  • 12. 고객 재가입 예측 모델 서비스정보 계약정보 고객정보 관계코드 피보험자 연령대 피보험자 성별 피보험자 주소지 지역등급 접촉가능 여부 우편발송처 이벤트 당첨여부 가입경력 긴급출동 건수 재 갱신대상 여부 주소변경여부 차량대체 여부 갱신적용보험료 주유적립 휫수 이벤트메일 거부 보험메일 거부 Sales Mail Open 수 Non-Sales Mail Open 수 할인할증 법규 위반율 특별할증율 동일증권여부 전담보구분 자손가입 자차가입 무보험가입여부 연령한정특약 배서횟수 금액배서횟수 불평배서횟수 경과보험료 자차 경과보험료 담보변경 이력 인수에러유형 차량연식 차량 수/자동 차종 3년간 사고 휫수 전계약 사고점수 운전자범위특약 분납불이행횟수 긴급출동특약 사고건수 면책건수 사망자수부상자수 발생 손해액 차량가액 연속형 변수 이산형 변수  갱신 모델링을 위한 주요변수
  • 13. 고객 재가입 예측 모델 분석 Data Frame Segmentation 만기 2007년 1월 ~ 5월 고객정보 서비스정보계약정보 만기 2007년 1월 ~ 4월 만기 2007년 5월 Original Data Frame Random Sampling Re-Test Data Frame Training Data Frame Test Data Frame 70% 30% Modeling Data Frame Training Data Modeling 3rd 2nd 1 2 10 6 4 … … 1st Modeling 각 Data Frame Prediction Re-Test Data Frame Training Data Frame Test Data Frame 3rd 2nd 1 2 10 6 4 … … 1st Model 93.30% 88.37% 84.99% 82.79% 80.52% 77.73% 74.52% 70.58% 66.10% 55.31% 50.00% 55.00% 60.00% 65.00% 70.00% 75.00% 80.00% 85.00% 90.00% 95.00% 100.00% Group1Group2Group3Group4Group5Group6Group7Group8Group9Group10 갱신율 스코어 등비율 구간별 갱신율 Training Data Frame 스코어 등비율 구간별갱신율 90.44% 84.14% 82.16% 80.26% 78.02% 76.50%75.10% 72.94% 70.77% 63.91% 50.00% 55.00% 60.00% 65.00% 70.00% 75.00% 80.00% 85.00% 90.00% 95.00% Group1Group2Group3Group4Group5Group6Group7Group8Group9Group10 갱신율 스코어 등비율 구간별갱신율 88.47% 83.94% 82.28% 80.26% 78.03% 76.46% 74.24% 72.56% 70.73% 65.63% 50.00% 55.00% 60.00% 65.00% 70.00% 75.00% 80.00% 85.00% 90.00% 95.00% Group1 Group2 Group3 Group4 Group5 Group6 Group7 Group8 Group9 Group10 갱신율 Test Data Frame Re-Test Data Frame Prediction  갱신 모델링 프로세스
  • 14. 고객 재가입 예측 모델  스코어의 분포는 평균이 0.774 인 정규분포임  스코어가 높을 수록 갱신율이 증가하는 추세임  하위 스코어의 경우 건수가 작아 조금의 역전현상이 발생함  산출된 스코어를 이용하여 10개의 Group 별 갱신율 을 보면 1 Group과 10 Group과의 갱신율은 약 19.57% 차이를 보임  1 Group ~ 5 Group은 평균 갱신율 보다 높음 구성비 갱신율 피보험자 스코어 구성비 및 갱신율 스코어 등비율 구간별 갱신율 갱신율 평균 갱신율 : 77.42% 0.00% 5.00% 10.00% 15.00% 20.00% 25.00% 30.00% 35.00% 40.00% 0.0% 10.0% 20.0% 30.0% 40.0% 50.0% 60.0% 70.0% 80.0% 90.0% 100.0% 구성비(%) 갱신율(%) 86.19% 83.38% 81.41% 79.92%79.38% 76.43%75.42% 74.28% 71.16% 66.62% 50.00% 55.00% 60.00% 65.00% 70.00% 75.00% 80.00% 85.00% 90.00% Group1 Group2 Group3 Group4 Group5 Group6 Group7 Group8 Group9 Group10  산출된 스코어를 이용하여 10개의 등비율로 Segmentation 후 각 Group별 재가입율(갱신율)은 아래과 같음  갱신 모델링 결과
  • 15. 인생과 통계역정 입시 통계 인구 통계 노후 통계 취업 통계  경쟁률  진학률  취업률(대학알리미) 업무 통계  추세분석  효과분석  현황분석  집계통계  정책 통계  교육 통계  조세 통계  의학 통계  연금 통계  재취업 투자 통계  년봉 및 근로 조건  퇴사율 관리  인사 관리  주식  부동산  자산관리  창업통계 "내가 쓰는 통계학이라는 말은 국민들이 누리는 행복의 양을 조사하고 앞으로 개선해나갈 목적 으로 나라의 상태를 탐구하는 것을 말한다." - 존 싱클레어 창업 통계  상권분석  지역 및 업종 분석
  • 16. 16 통계학 진로 – 복합 예술의 기반 금융회사 대학 입학처 제조 품질관리 산업공학 스포츠 통계 바이오 임상 통계 기업 통계 분석 고객 분석(CRM) 여론 및 마케팅 조사 통계청/기상청 신용정보회사 경영 마케팅 빅데이터데이터사이언티스트 각종 공사/공단/협회 포춘지의 '직업을 위한 2015년 Best&Worst 학위(석사이상) 미래의 유망 직업 1위가 '통계학 박사' 빅데이터 시대에 떠오르는 직업, 데이터 과학자 - 데이터 과학자, 유망직종, 유망직업 구글의 수석 경제분석가 핼 배리언은 향후 10년 동안 유망직종으로 통계 전문가 가운데 빅 데 이터로부터 다양한 정보를 얻을 수 있는 데이터 과학자를 언급 E-스포츠 게임회사 복합/융합 학문 통계
  • 17. 17 진실을 탐구하는 학문 [평균의 함정] [심슨의 패러독스] ‘세상에는 세 가지 거짓말이 있다. 그냥 거짓말과 새빨간 거짓말, 그리고 통계.’ - 소설가 출신 영국 총리 디즈레일리(Benjamin Disraeli)
  • 18. 18 직업기초능력 - 국가직무능력표준(NSC) 의사소통능력 글과 말을 읽고 들음으로써 다른 사람이 뜻한 바를 파악하고, 자기가 뜻한 바를 글과 말을 통해 정확하게 쓰 거나 말하는 능력 수리능력 사칙연산, 통계, 확률의 의미를 정확하게 이해하고, 이를 업무에 적용하는 능력 문제해결능력 문제 상황이 발생하였을 경우, 창조적이고 논리적인 사고를 통하여 이를 올바르게 인식하고 적절히 해결하 는 능력 자기개발능력 업무를 추진하는데 스스로를 관리하고 개발하는 능력 자원관리능력 업무를 수행하는데 시간, 자본, 재료 및 시설, 인적자원 등의 자원 가운데 무엇이 얼마나 필요한지를 확인하 고, 이용 가능한 자원을 최대한 수집하여 실제 업무에 어떻게 활용할 것인지를 계획하고, 계획대로 업무 수행 에 이를 할당하는 능력 대인관계능력 업무를 수행함에 있어 접촉하게 되는 사람들과 문제를 일으키지 않고 원만하게 지내는 능력 정보능력 업무와 관련된 정보를 수집하고, 이를 분석하여 의미 있는 정보를 찾아내며, 의미 있는 정보를 업무수행에 적 절하도록 조직하고, 조직된 정보를 관리하며, 업무 수행에 이러한 정보를 활용하고, 이러한 제 과정에 컴퓨터 를 사용하는 능력 기술능력 업무를 수행함에 있어 도구, 장치 등을 포함하여 필요한 기술에는 어떠한 것들이 있는지 이해하고, 실제로 업 무를 수행함에 있어 적절한 기술을 선택하여 적용하는 능력 조직이해능력 업무를 원활하게 수행하기 위해 국제적인 추세를 포함하여 조직의 체제와 경영에 대해 이해하는 능력 직업윤리능력 업무를 수행함에 있어 원만한 직업생활을 위해 필요한 태도, 매너, 올바른 직업관 국가직무능력표준(NSC)은 산업현장에서 직무를 수행하기 위해 요구되는 지식,기술,소양 등의 내용을 국가가 산업부분별, 수준별로 체계화한 것으로 산업현장의 직무를 성공적으로 수행하기 위해 필요한 능력(지식, 기술, 태도)을 국가적 차원에 서 표준화한 것을 의미합니다. <출처: 산업인력공단 국가직무능력표준 (http://www.ncs.go.kr)>
  • 19. 19 21세기 요구되는 인재상 통전 • 데이터 처리 / DB / SQL / 빅데이터 • 하둡 / 데이터 이해 • 시각화 • SAS / R-Project/ SPSS • 통계지식/수학 / 회귀분석/ 다변량 • 데이터 기반 의사결정 및 예측 능력 • 머신러닝/데이터마이닝 • 영어/창조적 마인드 • 호기심/창의력/소통 능력 • 능동적인 태도 • 자기개발 능력 • 해당 산업 지식 • 데이터 기반 기획/ 마케팅 • 비즈니스 프로세스 지식 • 비즈니스 컨설팅 21세기 핵심인재 (분석적 사고력) 계 산 비 지 스 개 인 역 량 니 “자신의 성격과 능력에 맞춰서 능력 개발 또는 보완 방법 필요”
  • 20. 20 통계와 첫 만남을 준비하는 통계인을 위한 추천 도서  벌거벗은 통계학 (찰스 윌런. 책읽는 수요일) 경제학자 찰스 윌런이 야구와 골프에서 광고와 선거에 이르기까지 숫자의 의미를 해석해주는 책입니다. 오늘의 흐름을 정확히 읽어 내일의 변화를 예측하는 통계의 힘을 익히고 싶은 사람이라면 누구라도 이 책이 도움이 될 것입니다.  통계 속의 재미있는 세상이야기 (통계청) 부담없이 읽으며, 논리적 사고력과 사물에 대한 통찰력을 키우고, 통계에 자연스럽게 알 수 있다  괴짜통계학 (김진호. 한국경제신문사) 노스트라다무스가 희대의 예언가라고 생각하시나요? 아니면 사기꾼이라고 생각하시나요? 어떻게 해석하느냐에 따라 결과가 판이하게 달라지는 재미있는 통계 사례들을 모은 책입니다.  세상에서 가장 쉬운 통계학입문 (고지마 히로유키. 지상사) 중학교 수준의 수학으로 통계학을 쉽게 설명한 입문서. ‘이런 것이 통계구나’라는 감을 잡기에 좋은 책입니다.  세상에서 가장 재미있는 통계학 (아트후프만 · 울코트스미스저. 궁리출판) 그림이 포함되어 있어 이해하기 쉬운 책. 방송과 신문에서 나오는 ‘신뢰수준 95%에 오차는플러스 마이너스 5%.’ 등의 말이 무엇인지 알고 싶다면 읽어 볼 만한 책입니다.  괴짜가 사랑한 통계학 (그레이엄 테터솔. 한겨레출판) “지금 즉시 전국의 전봇대 개수를 이야기해 보시오”라는 질문에는 뭐라고 대답해야 할까요? 통계학적 사고로 기상천외한 문제들을 풀어가는 책입니다 <고려대 입학처 전공안내>
  • 21. 21 추천 영화  10 Must Watch Movies on Data Science and Machine Learning 출처 : http://www.analyticsvidhya.com/blog/2015/11/10-watch-movies-data-science-machine-learning/
  • 22. 22 - 교육목표 : 평소 어렵게 생각했던 통계를 쉽고 재미있는 방식으로 접근하여 통계자료가 일상생활에서 어떻게 활용하는지 직접 실습해봄으로써 합리적 사고 능력을 배양한다. - 교육내용 : 출항 통계호 / 분임활동 / 발표 및 강평 / 소양교육 - 교육목표 : 중학생들에게 통계에 대한 올바른 이해 확립, 합리적 사고능력의 배양 및 팀원과의 협력을 통한 문제해결 능력을 향상한다. - 교육내용 : 통계적 사고방식/그래프의 활용/창의적 문제해결/통계자료 수집/통계포스터 작성 통계 교육원 - 통계 아카데미 고등학생 통계아카데미 - 교육목표 : 통계에 대한 올바른 이해를 돕고 팀원과의 협력을 통한 문제해결 능력을 향상한다. - 교육내용 : 과학과 통계 / 인성과 통계 / 창의와 통계 / 분임토의 및 발표 대학생 통계실무워크숍 - 교육목표 : 학교에서 배운 이론이 실무에 어떻게 적용되는지 실습해봄으로써 통계 활용능력 향상 및 통계에 대한 이해의 폭을 확대한다. - 교육내용 : 조사기획 입문 / 조사주제 및 표본 선정 / 조사표 설계 / 자료 수집 대학원생 통계논문작성 - 교육목표 : 통계를 전공하지 않은 대학원생이 학술논문과 보고서 작성 시 국가통계활용과 의미 있는 통계분석 방법을 적용할 수 있다. - 교육내용 : 통계적 방법 및 연구방법 개요 / 기초적 가설검정 / 논문적용 통계분석 어린이 통계캠프 중학생 통계아카데미 초등교사 통계연수 - 교육목표 : 초등교사의 통계적 마인드와 지도방법을 학습하여 학생들에게 생활 속 유용한 통계를 창의적으로 지도할 수 있도록 한다. - 교육내용 : 통계교육 지도 길잡이 / 통계정보검색 / 통계와 창의성 / 소양교육 <출처: 통계교육원 (http://sti.kostat.go.kr/)> 통계적 사고방식 (이러닝교육) - 교육목표 : 통계에 대한 전반적인 기본지식을 이해하기 쉽도록 이야기 형식으로 구성하여 흥미 있는 학습이 되도록 하고 이를 통해 통계의 필요성을 인식하고 학습동기를 유발하는 계기 제공. - 교육내용 : 통계와 통계학 소개/자료를 요약한다는 것은/신문기사로 보는 통계/통계적 의사결정
  • 23. 23 통계관련 참여 행사  전국학생통계활용대회 (통계청) 창의력을 개발하고 탐구심과 커뮤니케이션 능력 배양을 목표로 통계 포스터 경진대회로 진행  서울대학교 데이터마이닝 캠프(한국 BI 데이터마이닝 학회) 대학진학을 앞 둔 고등학교 학생들에게 미래형 연구응용 분야이자, 학제 간 분야인 데이터마이닝에 대하여 소개  글로벌 데이터톤(미래창조과학부) 아시아의 빅데이터 활용 문화 확산 및 글로벌 인재 발굴을 위한 데이터 활용 아이디어 경진대회  슈퍼컴퓨터 활용 아이디어 경진대회 복잡한 과학기술, 사회, 문화, 경제 등의 사회 현안 문제를 슈퍼컴퓨터를 이용하여 해결할 수 있는 톡!톡! 뛰는 기발하고 창의적인 아이디어 모집
  • 25. 25| 통계 관련 자격증 ■ 사회조사분석사 ( Survey Analyst ) ■ 품질경영기사 (Engineer Quality Management) ■ 보험계리사 ■ 재무위험관리사 ■ 한국DB진흥원 : 데이터 분석 준전문가(ADsP), 데이터 분석 전문가(ADP) ■ CRM 협회 자격인증 : CRM 전문가, 마케팅통계분석가, 데이터마이닝전문가, 고객 DB분석가 ■ 경영 빅데이터 분석사(한경아카데미) 출처 : 통계 분석과 BI(Business Intelligence) 관련 인증 자격증 안내 여름방학, 통계 자격증과 함께(작성자 통계청) '제 값 하는' 빅 데이터 자격증 11종(CIOKOREA) ■ 콜럼비아대 - 데이터 과학 전문성 인증시험, 델라웨어대 - 애널리틱스 자격증: 빅 데이터 최적화 ■ EMC 데이터 과학자 협회 자격증 ■ 레볼루션 애널리틱스 - 레볼루션 R 엔터프라이즈 프로페셔널 ■ Google’s Certifications ■ SAS Certifications ■ IBM SPSS Statistics Certification ■ Microsoft SQL Server ■ IBM Cognos Certifications ■ MicroStrategy ■ Oracle ■ SAP Certifications
  • 26. 26 [참고] 엑셀(Excel)의 단계 • 처음 들어봄 • 수식 계산기 • 셀서식 • 기본 함수/IF구문 • Vlookup • 함수마법사 • 엑셀 홈페이지 참여 • 고수의 매크로/배열수식에 감탄 • 자신에 대한 자괴감 • 데이터 베이스 관심 • 부분합/피벗테이블 • 쿼리와 매크로 • VBA 입문 • 매크로 기록기 • 순환문 • 사용자 정의 폼 • 알고리즘 부재 회의 • 프로젝트 효율성 고민 초보1단계 초보2단계 초보3단계 • 엑셀 다시 공부 • 관련 모임 참여 • 업무 이외에도 관심 • 엑셀 주변에 관심(API / 엑세스) • 다른 프로그램과 연동 고민 • 고난도의 자료/도서 • 여러 프로젝트 수행 • 중수를 인지(타인은 고수로 모심) • 자신의 문제 해결 가능 • 개념의 중요성 인지 • 알고리즘 공부(자료구조,재귀호 출, 정렬 등) • 영어/수학 한탄 • 사업 구상 • 보살의 단계 - 수양 중급1단계 중급2단계 중급3단계 출처 : 엑사모 고수 강용림 (현재 원문 미존재) (http://cafe.daum.net/statsas/O0DR/1)
  • 27. 27 [참고] 참 고 페 이 지 ■ 통계분석연구회 “통계진로정보” 게시판 ■ 통계교육원 열린교육방 게시판 ■ 대학알리미(www.academyinfo.go.kr) - 학과별 취업 현황과 연구 성과, 교육 여건 등에 대한 정보 제공 ■ 전공 및 개별 학교별 취업률 자료 제공처(통계학과 취업률) : http://cafe.daum.net/statsas/KqTP/365 ■ 워크넷(work.go.kr) 한국직업전망(http://www.work.go.kr/consltJobCarpa/srch/korJobProspect/korJobProspectSrchByJobCl.do) ■ 한국직업능력개발원(krivet.re.kr) ■ 한국직업능력개발원 커리어넷-미래의 직업세계 (career.go.kr) ■ 한국고용정보원 - 진로길라잡이 / 진로선택을 위한 학과정보(keis.or.kr) 직업정보 : http://www.keis.or.kr/www/board/NR_boardList.do?bbsCd=1010 진로진학 Q&A 50선 / 한국직업전망 / 미래를 함께할 새로운 직업 / 색다른 직업 생생한 인터뷰 / 청소년들이 궁금해 하는 99가지 직업이야기 / 중고생 한국직업사전-알고싶은 직업, 만나고 싶은 직업 ■ 대한상공회의소(korcham.net) ■ 한국산업인력공단(hrdkorea.or.kr) 자격증 정보제공(q-net.or.kr) ■ 잡영(jobyoung.go.kr) ■ 한국고용정보원 "내일을 Job아라" 동영상서비스(직업/학과정보 동영상)
  • 28. 28 [참고] 참 고 문 서 ■ 통계분석연구회 통계진로게시판 ■ 악사손해보험 CRM팀 12년 역사 ■ [동영상] AXA 손해보험의 CRM과 데이터 사이언스 / 금기돈 팀장(AXA) ■ [데이터사이언티스트를 찾아서] “과거 CRM이 현재 빅데이터의 자양분” ■ [데이터사이언티스트를 찾아서] 데이터 사이언티스트, 빅데이터를 논하다 ■ 우리회사 특별한 조직-악사손해보험 ‘경영기획본부 CRM팀’ (보험신보) ■ 어떻게 하면 데이터 사이언티스트가 될 수 있나요? (하용호 대표)
  • 29. 29 통계분석연구회 소개 통계분석연구회 1. 사이트 주소 : http://cafe.daum.net/statsas 2. 회원수 : 49,263 (2015.12월 기준) 3. 개설일 : 2000.01.18 4. 운영 사이트 - 페이스북 : www.facebook.com/groups/statsas 5. 주요 사항 - 2003년 SPSS KOREA의 SIG 멤버 선정 - 2008년 SPSS 온라인 우수 커뮤니티 선정 - 2009년 제15회 통계의날 통계청장 표창(운영자) - 2011년 제17회 통계의날 국무총리 표창(연구회) - SAS KOREA 지원 클럽 • 통계 대중화 및 빅데이터 시대 선도 • 통계 이론과 현장 활용 분석 방법 토론의 장 마련 • 통계 정보, 통계 분석 자료 공유 • 통계 관련 취업 정보 및 통계진로정보 • 통계와 빅데이터 분석 정보 공유 • 다양한 통계 문화 활동 • 통계진흥원 통계 재능 기부 활동 지원
  • 30. 30 End of Document 자신의 미래를 책임 질 수 있도록 현재의 나에게 최선을 다하시기를 바랍니다.
  • 31. 31 데이터과학자 기본 역량 - 정보화진흥원 ■ 빅데이터 역량 모델 (빅데이터 커리큘럼 참조모델 1.0) <빅데이터 커리큘럼 참조 모델 Ver 1.0> 기반역량 창의적 문제해결 및 전략적 의사소통 등 데이터 과학자로서의 역할을 수행하기 위해 기본적으로 요구되는 역량 (교육과목 : 창의적 사고훈련 / 프리젠테이션과 커뮤니케이션 / 설득 커뮤니케이 션 / 조직문화와 커뮤니케이션) 기술역량 다양한 데이터 전처리 및 대용량 데이터 관리를 위한 플랫폼을 운영/개발, 나아가 응용 플랫폼을 구축 할 수 있는 역량 (컴퓨터 응용 프로그램 및 인프라/하둡 분산 파일 시스템의 구조와 활용) 분석역량 분석의 기본 이론 및 지식을 바탕으로 분석 Tool을 활용하여 다양한 데이터로부터 분석 결과물을 도출할 수 있는 역량 (수리적 사고와 표현 / 분석적 사고의 향상 / 통계분석 기법 / OLPA / 데이 터 마이닝 프로세스 / 텍스트 마이닝 / 빅데이터 분석 결과 시각화 방법 및 적용) 사업역량 다양한 산업과 업무 측면의 새로운 가치 창출을 위해 분석 방향성을 수립하고, 가설 및 모델 수 립, 최적화 및 분석 성과 평가를 수행할 수 있는 역량 (경영학 개론 / 산업별 빅데이터 적용전략 / 분석기획 방법론 / 프로젝트 관리개론 / 의사결정 기법의 이해 / 전략 기반의 빅데이터 사업 기획) 학부 1∼2학년 학부 3∼4학년 대학원 석사 이상