SlideShare a Scribd company logo
1 of 13
Download to read offline
Boosted Decision Tree를 사용한
Lending Club의 채무자 원리금 상환
/ 상환실패 예측
Data Science School 2기
이성진
발표 개요
• 주제 선정 이유
• 의사결정 나무
• Ada Boost
• 모델 적용
• 결과
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
현실에서의 2가지 분류 문제들
주가의 상승 / 주가의 하락
스팸 / 비-스팸
마케팅 메일 응답 / 마케팅 메일 비응답
원리금 완납 / 완리금 완납 실패
주제 선정 이유
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
현실 세계에서의 2가지 Classification 사례들
주가의 상승 / 주가의 하락 ?
파산 / 상환
스팸 / 비-스팸
마케팅 메일 응답 / 마케팅 메일 비응답
원리금 완납 / 완리금 완납 실패
랜딩클럽 2016년 1분기 데이터
주제 선정 이유
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
데이터 전처리
데이터 전처리(재료손질)
-> 모델(요리법) 적용
(42538, 111)
데이터 전처리
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
(42538, 111)
(42506, 26)
데이터 전처리
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
(42538, 111)
(42506, 26)
(42506, 55)
데이터 전처리
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
의사결정나무
연소득
(>$30K)
취업 기갂(년)
(>3)
주택 보유 여부
파
산
y n
상
환
과거 파산 여부
y n
파
산
상
환
y n
파
산
y n
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
에이다부스트(Adaboost)
Step1:
각 분류모델의 성능에 따라
가중치 w 부여
Step2:
각 모델들을 가중치에 따라
결합하여 새로운 모델 4 생성
W1*Model1 +
W2*Model2 +
W3*Model3
= > New model 4
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
Performance and Result
데이터사이언스스쿨 이성진 (github.com/lsjhome007)
감사합니다.
데이터사이언스스쿨 이성진 (github.com/lsjhome007)

More Related Content

More from FAST CAMPUS

More from FAST CAMPUS (20)

데이터 사이언스 익스텐션 스쿨 강의자료 3
데이터 사이언스 익스텐션 스쿨 강의자료 3데이터 사이언스 익스텐션 스쿨 강의자료 3
데이터 사이언스 익스텐션 스쿨 강의자료 3
 
데이터 사이언스 익스텐션 스쿨 강의자료 2
데이터 사이언스 익스텐션 스쿨 강의자료 2데이터 사이언스 익스텐션 스쿨 강의자료 2
데이터 사이언스 익스텐션 스쿨 강의자료 2
 
데이터 사이언스 익스텐션 스쿨 강의자료 1
데이터 사이언스 익스텐션 스쿨 강의자료 1데이터 사이언스 익스텐션 스쿨 강의자료 1
데이터 사이언스 익스텐션 스쿨 강의자료 1
 
패스트캠퍼스 디지털 마케팅 스쿨 최성연 수강생 포트폴리오
패스트캠퍼스 디지털 마케팅 스쿨 최성연 수강생 포트폴리오패스트캠퍼스 디지털 마케팅 스쿨 최성연 수강생 포트폴리오
패스트캠퍼스 디지털 마케팅 스쿨 최성연 수강생 포트폴리오
 
패스트캠퍼스 디지털 마케팅 스쿨 김규리 수강생 포트폴리오
패스트캠퍼스 디지털 마케팅 스쿨 김규리 수강생 포트폴리오패스트캠퍼스 디지털 마케팅 스쿨 김규리 수강생 포트폴리오
패스트캠퍼스 디지털 마케팅 스쿨 김규리 수강생 포트폴리오
 
패스트캠퍼스 UX/UI 디자인 스쿨 1기 수료생 최의정님 포트폴리오
패스트캠퍼스 UX/UI 디자인 스쿨 1기 수료생 최의정님 포트폴리오패스트캠퍼스 UX/UI 디자인 스쿨 1기 수료생 최의정님 포트폴리오
패스트캠퍼스 UX/UI 디자인 스쿨 1기 수료생 최의정님 포트폴리오
 
[패스트캠퍼스] 애자일에 대한 오해와 진실
[패스트캠퍼스] 애자일에 대한 오해와 진실[패스트캠퍼스] 애자일에 대한 오해와 진실
[패스트캠퍼스] 애자일에 대한 오해와 진실
 
[패스트캠퍼스] 애자일,누굴 위한 것인가
[패스트캠퍼스] 애자일,누굴 위한 것인가[패스트캠퍼스] 애자일,누굴 위한 것인가
[패스트캠퍼스] 애자일,누굴 위한 것인가
 
[패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템
[패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템[패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템
[패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템
 
강의소개 - 왕초보의 프로그래밍 첫걸음 캠프
강의소개 - 왕초보의 프로그래밍 첫걸음 캠프강의소개 - 왕초보의 프로그래밍 첫걸음 캠프
강의소개 - 왕초보의 프로그래밍 첫걸음 캠프
 
[ 유니티게임제작캠프 ] 취업준비는피씨방에서
[ 유니티게임제작캠프 ] 취업준비는피씨방에서[ 유니티게임제작캠프 ] 취업준비는피씨방에서
[ 유니티게임제작캠프 ] 취업준비는피씨방에서
 
UI/UX 디자인 기본부터 알아봅시다.
UI/UX 디자인 기본부터 알아봅시다.UI/UX 디자인 기본부터 알아봅시다.
UI/UX 디자인 기본부터 알아봅시다.
 
[패스트캠퍼스] 업무자동화 자기계발
[패스트캠퍼스] 업무자동화 자기계발[패스트캠퍼스] 업무자동화 자기계발
[패스트캠퍼스] 업무자동화 자기계발
 
[패스트캠퍼스] 업무자동화 알파고
[패스트캠퍼스] 업무자동화 알파고[패스트캠퍼스] 업무자동화 알파고
[패스트캠퍼스] 업무자동화 알파고
 
나도 코딩 공부 시작하고 싶다! (웹/파이썬)
나도 코딩 공부 시작하고 싶다! (웹/파이썬)나도 코딩 공부 시작하고 싶다! (웹/파이썬)
나도 코딩 공부 시작하고 싶다! (웹/파이썬)
 
[강의소개] 프로그래밍 입문자가 안드로이드와 잘 사귀려면?
[강의소개] 프로그래밍 입문자가 안드로이드와 잘 사귀려면?[강의소개] 프로그래밍 입문자가 안드로이드와 잘 사귀려면?
[강의소개] 프로그래밍 입문자가 안드로이드와 잘 사귀려면?
 
회귀분석을 통한 노트북 거래 가격 회귀모형 및 예측
회귀분석을 통한 노트북 거래 가격 회귀모형 및 예측회귀분석을 통한 노트북 거래 가격 회귀모형 및 예측
회귀분석을 통한 노트북 거래 가격 회귀모형 및 예측
 
영화 최종 관객 수 회귀모형 및 예측
영화 최종 관객 수 회귀모형 및 예측영화 최종 관객 수 회귀모형 및 예측
영화 최종 관객 수 회귀모형 및 예측
 
손해비용 최소화를 위한 신용평가 분류 모형(Cost sensitive classification)
손해비용 최소화를 위한 신용평가 분류 모형(Cost sensitive classification)손해비용 최소화를 위한 신용평가 분류 모형(Cost sensitive classification)
손해비용 최소화를 위한 신용평가 분류 모형(Cost sensitive classification)
 
Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측
Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측
Nba 경기결과 데이터를 활용한 선수 연봉 회귀모형 및 예측
 

Boosted decision tree를 활용한 lending club의 채무자 원리금 상환 여부 예측