SlideShare ist ein Scribd-Unternehmen logo
1 von 10
Downloaden Sie, um offline zu lesen
Výsledky backtestu
propensitního modelu
1 0 . 9 . 2 0 2 0 M a r t i n H a n z a l
2
~400 000 klientů
Data
PROP_12M … Pravděpodobnost čerpání
úvěru během 12M
SCORE … logistická transformace PROP_12M
3
Target … čerpání úvěru v EQB během 12M
Gini = 0,738
AUC = 0,869
K-S = 0,586
Performance
4
Odhadovaná (x) vs. pozorovaná (y) pravděpodobnost
Performance
0
0,1
0,2
0,3
0,4
0,5
0,6
0 0,1 0,2 0,3 0,4 0,5 0,6
Targetrate
avg PROP_12M
5
Doba do čerpání
Performance
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Relativníkumulativníčetnost(celek)
Doba do čerpání [měsíce]
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Relativníkumulativníčetnost(načerpané)
Doba do čerpání [měsíce]
SCORE_QUINT1
SCORE_QUINT2
SCORE_QUINT3
SCORE_QUINT4
SCORE_QUINT5
6
SCORE vs. počet úvěrů v EQB za celou historii klienta (CNT_CL_EVER)
Subpopulace
CNT_CL_EVER GINI AUC K-S
0 0,586 0,793 0,433
1 0,447 0,724 0,328
[2; 3] 0,365 0,682 0,261
[4; 7] 0,281 0,641 0,199
[8; 15] 0,162 0,581 0,125
>= 16 0,085 0,542 0,158
TARGET rate
CNT_CL_EVER
0 1 [2; 3] [4; 7] [8; 15] >= 16 TOTAL
PROP_12M_20TILE
1 0,10% 0,00% 0,00% 0,10%
2 0,30% 2,70% 0,00% 0,00% 0,30%
3 0,40% 1,00% 0,00% 0,00% 0,50%
4 0,60% 1,60% 0,60% 5,90% 0,60%
5 0,90% 0,60% 0,00% 0,00% 0,90%
6 1,10% 1,70% 0,00% 0,00% 1,10%
7 1,60% 0,90% 0,00% 0,00% 1,60%
8 1,80% 2,20% 2,30% 0,00% 1,80%
9 2,30% 2,50% 17,90% 0,00% 2,30%
10 2,90% 3,10% 3,80% 0,00% 2,90%
11 3,40% 4,20% 4,80% 0,00% 3,50%
12 4,20% 5,10% 8,60% 0,00% 4,30%
13 5,50% 4,30% 5,70% 0,00% 5,20%
14 7,10% 7,10% 6,60% 0,00% 0,00% 7,10%
15 8,30% 10,40% 9,80% 0,00% 9,40%
16 10,90% 14,50% 14,50% 12,00% 13,10%
17 11,90% 18,20% 21,30% 17,70% 16,90%
18 17,70% 25,70% 28,10% 28,60% 0,00% 25,20%
19 30,20% 33,90% 37,30% 39,00% 39,00% 100,00% 35,90%
20 41,10% 45,10% 50,80% 54,90% 71,20% 89,10% 54,60%
TOTAL 3,10% 15,90% 30,60% 48,00% 70,50% 89,30% 9,40%
7
SCORE vs. transakční aktivita klienta (CLN_SEG)
Subpopulace
CLN_SEG GINI AUC K-S
ACT 0,724 0,862 0,584
SAC 0,721 0,860 0,588
NEW 0,559 0,779 0,455
NAC 0,681 0,840 0,556
SAV 0,746 0,873 0,621
CLOSED 0,572 0,786 0,465
TARGET rate
CLN_SEG
ACT SAC NEW NAC SAV CLOSED TOTAL
PROP_12M_20TILE
1 0,20% 0,10% 0,00% 0,10% 0,00% 0,10% 0,10%
2 0,40% 0,40% 0,00% 0,30% 0,10% 0,10% 0,30%
3 0,60% 0,30% 0,00% 0,50% 0,40% 0,20% 0,50%
4 0,70% 0,40% 0,80% 0,60% 1,50% 0,30% 0,60%
5 1,10% 1,10% 1,80% 0,80% 0,50% 0,50% 0,90%
6 1,40% 1,10% 0,50% 0,80% 2,50% 0,30% 1,10%
7 1,90% 1,40% 1,00% 1,50% 0,00% 0,30% 1,60%
8 2,10% 2,00% 2,40% 1,40% 0,00% 0,50% 1,80%
9 2,70% 3,30% 1,60% 1,70% 2,10% 0,70% 2,30%
10 3,60% 2,80% 3,00% 1,80% 0,00% 0,80% 2,90%
11 4,30% 3,50% 4,50% 2,20% 0,00% 1,10% 3,50%
12 5,80% 5,40% 4,40% 2,40% 5,00% 1,60% 4,30%
13 6,70% 6,10% 5,60% 3,80% 7,30% 2,30% 5,20%
14 8,00% 9,50% 6,90% 6,70% 4,30% 2,20% 7,10%
15 10,00% 11,60% 9,80% 9,10% 4,30% 2,90% 9,40%
16 14,40% 16,70% 14,10% 12,00% 11,10% 3,80% 13,10%
17 19,50% 21,50% 19,50% 15,30% 0,00% 3,80% 16,90%
18 27,80% 28,30% 25,10% 20,40% 11,10% 4,70% 25,20%
19 38,50% 35,20% 35,50% 26,10% 0,00% 9,20% 35,90%
20 57,60% 48,00% 48,80% 32,70% 0,00% 12,00% 54,60%
TOTAL 13,70% 11,40% 11,20% 4,70% 0,40% 1,50% 9,40%
8
Příklady subpopulací:
→ CLN_SEG = ACT & CNT_CL_EVER >= 8
↓ CLN_SEG = ACT & CNT_CL_EVER = 0
↘ CLN_SEG = NAC & CNT_CL_EVER <= 1
Subpopulace
9
Subpopulace
0
7
14
21
28
35
42
49
56
63
70
0%
20%
40%
60%
80%
100%
2,092
1,278
1,065
0,865
0,665
0,465
0,265
0,065
-0,135
-0,335
-0,535
-0,735
-0,935
-1,135
-1,335
cum.#clients[tis.]
cum.%TARGET
SCORE cutoff
TARGET = 12M DISB CL
TARGET = 3M DISB CL
cum. # clients
0
6
12
18
24
30
36
0%
10%
20%
30%
40%
50%
60%
1,149
-0,638
-1,057
-1,288
-1,492
-1,692
-1,893
-2,093
-2,293
-2,493
-2,693
-2,893
-3,093
-3,293
-3,493
cum.#clients[tis.]
cum.%TARGET
SCORE cutoff
0,0
0,3
0,6
0,9
1,2
1,5
1,8
2,1
2,4
2,7
3,0
0%
20%
40%
60%
80%
100%
2,025
1,404
1,235
1,117
1,013
0,905
0,798
0,681
0,565
0,436
0,275
0,061
-0,253
-0,763
cum.#clients[tis.]
cum.%TARGET
SCORE cutoff
TARGET rate
CNT_CL_EVER
0 1 [2; 3] [4; 7] [8; 15] >= 16
CLN_SEG
ACT 4,8% 24,8% 39,2% 54,6% 73,9% 92,7%
SAC 2,6% 18,9% 31,0% 44,9% 63,3%
NEW 5,5% 27,8% 57,9%
NAC 1,2% 9,1% 17,7% 27,4% 41,1%
SAV 0,3% 3,2% 9,8%
CLOSED 0,8% 2,7% 4,7% 8,6%
% CLN TARGET rate GINI AUC K-S
31% 1,2% 0,51 0,75 0,38
1% 70,9% 0,17 0,59 0,13
69% 12,4% 0,67 0,84 0,53
31 % populace 1 % populace 69 % populace
10
• Potvrzení předpokládané síly modelu
AUC = 87
• Model má sílu i na „problematických“ subpopulacích
noví, neaktivní, neúvěroví klienti
• Přidaná hodnota na ~ 70 % populace
Závěr

Weitere ähnliche Inhalte

Mehr von Profinit

Reference Data Management
Reference Data ManagementReference Data Management
Reference Data ManagementProfinit
 
Cloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloudCloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloudProfinit
 
Building big data pipelines—lessons learned
Building big data pipelines—lessons learnedBuilding big data pipelines—lessons learned
Building big data pipelines—lessons learnedProfinit
 
Understand your data dependencies – Key enabler to efficient modernisation
 Understand your data dependencies – Key enabler to efficient modernisation  Understand your data dependencies – Key enabler to efficient modernisation
Understand your data dependencies – Key enabler to efficient modernisation Profinit
 
Propensity Modelling for Banks
Propensity Modelling for BanksPropensity Modelling for Banks
Propensity Modelling for BanksProfinit
 
Legacy systems modernisation
Legacy systems modernisationLegacy systems modernisation
Legacy systems modernisationProfinit
 
Automating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data StoresAutomating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data StoresProfinit
 
4 Steps Towards Data Transparency
4 Steps Towards Data Transparency4 Steps Towards Data Transparency
4 Steps Towards Data TransparencyProfinit
 
Software systems modernisation
Software systems modernisationSoftware systems modernisation
Software systems modernisationProfinit
 
Odborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum MobileOdborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum MobileProfinit
 
Data Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí clouduData Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí clouduProfinit
 
Detekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přáteléDetekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přáteléProfinit
 
Propensitní modelování
Propensitní modelováníPropensitní modelování
Propensitní modelováníProfinit
 
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...Profinit
 
Profinit webinar: Instalment Detector
Profinit webinar: Instalment DetectorProfinit webinar: Instalment Detector
Profinit webinar: Instalment DetectorProfinit
 
Profinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publishProfinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publishProfinit
 
2019 09-23-snidane qa-public
2019 09-23-snidane qa-public2019 09-23-snidane qa-public
2019 09-23-snidane qa-publicProfinit
 
2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-full2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-fullProfinit
 
2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyneProfinit
 
Matedatový sklad
Matedatový skladMatedatový sklad
Matedatový skladProfinit
 

Mehr von Profinit (20)

Reference Data Management
Reference Data ManagementReference Data Management
Reference Data Management
 
Cloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloudCloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloud
 
Building big data pipelines—lessons learned
Building big data pipelines—lessons learnedBuilding big data pipelines—lessons learned
Building big data pipelines—lessons learned
 
Understand your data dependencies – Key enabler to efficient modernisation
 Understand your data dependencies – Key enabler to efficient modernisation  Understand your data dependencies – Key enabler to efficient modernisation
Understand your data dependencies – Key enabler to efficient modernisation
 
Propensity Modelling for Banks
Propensity Modelling for BanksPropensity Modelling for Banks
Propensity Modelling for Banks
 
Legacy systems modernisation
Legacy systems modernisationLegacy systems modernisation
Legacy systems modernisation
 
Automating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data StoresAutomating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data Stores
 
4 Steps Towards Data Transparency
4 Steps Towards Data Transparency4 Steps Towards Data Transparency
4 Steps Towards Data Transparency
 
Software systems modernisation
Software systems modernisationSoftware systems modernisation
Software systems modernisation
 
Odborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum MobileOdborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum Mobile
 
Data Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí clouduData Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí cloudu
 
Detekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přáteléDetekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přátelé
 
Propensitní modelování
Propensitní modelováníPropensitní modelování
Propensitní modelování
 
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
 
Profinit webinar: Instalment Detector
Profinit webinar: Instalment DetectorProfinit webinar: Instalment Detector
Profinit webinar: Instalment Detector
 
Profinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publishProfinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publish
 
2019 09-23-snidane qa-public
2019 09-23-snidane qa-public2019 09-23-snidane qa-public
2019 09-23-snidane qa-public
 
2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-full2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-full
 
2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne
 
Matedatový sklad
Matedatový skladMatedatový sklad
Matedatový sklad
 

Výsledky backtestu propensitního modelu

  • 1. Výsledky backtestu propensitního modelu 1 0 . 9 . 2 0 2 0 M a r t i n H a n z a l
  • 2. 2 ~400 000 klientů Data PROP_12M … Pravděpodobnost čerpání úvěru během 12M SCORE … logistická transformace PROP_12M
  • 3. 3 Target … čerpání úvěru v EQB během 12M Gini = 0,738 AUC = 0,869 K-S = 0,586 Performance
  • 4. 4 Odhadovaná (x) vs. pozorovaná (y) pravděpodobnost Performance 0 0,1 0,2 0,3 0,4 0,5 0,6 0 0,1 0,2 0,3 0,4 0,5 0,6 Targetrate avg PROP_12M
  • 5. 5 Doba do čerpání Performance 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Relativníkumulativníčetnost(celek) Doba do čerpání [měsíce] 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Relativníkumulativníčetnost(načerpané) Doba do čerpání [měsíce] SCORE_QUINT1 SCORE_QUINT2 SCORE_QUINT3 SCORE_QUINT4 SCORE_QUINT5
  • 6. 6 SCORE vs. počet úvěrů v EQB za celou historii klienta (CNT_CL_EVER) Subpopulace CNT_CL_EVER GINI AUC K-S 0 0,586 0,793 0,433 1 0,447 0,724 0,328 [2; 3] 0,365 0,682 0,261 [4; 7] 0,281 0,641 0,199 [8; 15] 0,162 0,581 0,125 >= 16 0,085 0,542 0,158 TARGET rate CNT_CL_EVER 0 1 [2; 3] [4; 7] [8; 15] >= 16 TOTAL PROP_12M_20TILE 1 0,10% 0,00% 0,00% 0,10% 2 0,30% 2,70% 0,00% 0,00% 0,30% 3 0,40% 1,00% 0,00% 0,00% 0,50% 4 0,60% 1,60% 0,60% 5,90% 0,60% 5 0,90% 0,60% 0,00% 0,00% 0,90% 6 1,10% 1,70% 0,00% 0,00% 1,10% 7 1,60% 0,90% 0,00% 0,00% 1,60% 8 1,80% 2,20% 2,30% 0,00% 1,80% 9 2,30% 2,50% 17,90% 0,00% 2,30% 10 2,90% 3,10% 3,80% 0,00% 2,90% 11 3,40% 4,20% 4,80% 0,00% 3,50% 12 4,20% 5,10% 8,60% 0,00% 4,30% 13 5,50% 4,30% 5,70% 0,00% 5,20% 14 7,10% 7,10% 6,60% 0,00% 0,00% 7,10% 15 8,30% 10,40% 9,80% 0,00% 9,40% 16 10,90% 14,50% 14,50% 12,00% 13,10% 17 11,90% 18,20% 21,30% 17,70% 16,90% 18 17,70% 25,70% 28,10% 28,60% 0,00% 25,20% 19 30,20% 33,90% 37,30% 39,00% 39,00% 100,00% 35,90% 20 41,10% 45,10% 50,80% 54,90% 71,20% 89,10% 54,60% TOTAL 3,10% 15,90% 30,60% 48,00% 70,50% 89,30% 9,40%
  • 7. 7 SCORE vs. transakční aktivita klienta (CLN_SEG) Subpopulace CLN_SEG GINI AUC K-S ACT 0,724 0,862 0,584 SAC 0,721 0,860 0,588 NEW 0,559 0,779 0,455 NAC 0,681 0,840 0,556 SAV 0,746 0,873 0,621 CLOSED 0,572 0,786 0,465 TARGET rate CLN_SEG ACT SAC NEW NAC SAV CLOSED TOTAL PROP_12M_20TILE 1 0,20% 0,10% 0,00% 0,10% 0,00% 0,10% 0,10% 2 0,40% 0,40% 0,00% 0,30% 0,10% 0,10% 0,30% 3 0,60% 0,30% 0,00% 0,50% 0,40% 0,20% 0,50% 4 0,70% 0,40% 0,80% 0,60% 1,50% 0,30% 0,60% 5 1,10% 1,10% 1,80% 0,80% 0,50% 0,50% 0,90% 6 1,40% 1,10% 0,50% 0,80% 2,50% 0,30% 1,10% 7 1,90% 1,40% 1,00% 1,50% 0,00% 0,30% 1,60% 8 2,10% 2,00% 2,40% 1,40% 0,00% 0,50% 1,80% 9 2,70% 3,30% 1,60% 1,70% 2,10% 0,70% 2,30% 10 3,60% 2,80% 3,00% 1,80% 0,00% 0,80% 2,90% 11 4,30% 3,50% 4,50% 2,20% 0,00% 1,10% 3,50% 12 5,80% 5,40% 4,40% 2,40% 5,00% 1,60% 4,30% 13 6,70% 6,10% 5,60% 3,80% 7,30% 2,30% 5,20% 14 8,00% 9,50% 6,90% 6,70% 4,30% 2,20% 7,10% 15 10,00% 11,60% 9,80% 9,10% 4,30% 2,90% 9,40% 16 14,40% 16,70% 14,10% 12,00% 11,10% 3,80% 13,10% 17 19,50% 21,50% 19,50% 15,30% 0,00% 3,80% 16,90% 18 27,80% 28,30% 25,10% 20,40% 11,10% 4,70% 25,20% 19 38,50% 35,20% 35,50% 26,10% 0,00% 9,20% 35,90% 20 57,60% 48,00% 48,80% 32,70% 0,00% 12,00% 54,60% TOTAL 13,70% 11,40% 11,20% 4,70% 0,40% 1,50% 9,40%
  • 8. 8 Příklady subpopulací: → CLN_SEG = ACT & CNT_CL_EVER >= 8 ↓ CLN_SEG = ACT & CNT_CL_EVER = 0 ↘ CLN_SEG = NAC & CNT_CL_EVER <= 1 Subpopulace
  • 9. 9 Subpopulace 0 7 14 21 28 35 42 49 56 63 70 0% 20% 40% 60% 80% 100% 2,092 1,278 1,065 0,865 0,665 0,465 0,265 0,065 -0,135 -0,335 -0,535 -0,735 -0,935 -1,135 -1,335 cum.#clients[tis.] cum.%TARGET SCORE cutoff TARGET = 12M DISB CL TARGET = 3M DISB CL cum. # clients 0 6 12 18 24 30 36 0% 10% 20% 30% 40% 50% 60% 1,149 -0,638 -1,057 -1,288 -1,492 -1,692 -1,893 -2,093 -2,293 -2,493 -2,693 -2,893 -3,093 -3,293 -3,493 cum.#clients[tis.] cum.%TARGET SCORE cutoff 0,0 0,3 0,6 0,9 1,2 1,5 1,8 2,1 2,4 2,7 3,0 0% 20% 40% 60% 80% 100% 2,025 1,404 1,235 1,117 1,013 0,905 0,798 0,681 0,565 0,436 0,275 0,061 -0,253 -0,763 cum.#clients[tis.] cum.%TARGET SCORE cutoff TARGET rate CNT_CL_EVER 0 1 [2; 3] [4; 7] [8; 15] >= 16 CLN_SEG ACT 4,8% 24,8% 39,2% 54,6% 73,9% 92,7% SAC 2,6% 18,9% 31,0% 44,9% 63,3% NEW 5,5% 27,8% 57,9% NAC 1,2% 9,1% 17,7% 27,4% 41,1% SAV 0,3% 3,2% 9,8% CLOSED 0,8% 2,7% 4,7% 8,6% % CLN TARGET rate GINI AUC K-S 31% 1,2% 0,51 0,75 0,38 1% 70,9% 0,17 0,59 0,13 69% 12,4% 0,67 0,84 0,53 31 % populace 1 % populace 69 % populace
  • 10. 10 • Potvrzení předpokládané síly modelu AUC = 87 • Model má sílu i na „problematických“ subpopulacích noví, neaktivní, neúvěroví klienti • Přidaná hodnota na ~ 70 % populace Závěr