2. Data
› CRM (individuální zákazníci)
– jméno, příjmení, věk, pohlaví, fakturační adresa
› Volání a SMS
– 2 měsíce
– kdo, komu, kdy, kde, jak dlouho
– cca 200 GB
› Poloha
– 1 měsíc
– kdo, kdy, kde
– cca 500 GB
6. 6
Trénovací množina
6
Spojíme zákazníky na stejné
kontaktní adrese se stejným
příjmením
Omezíme se na zákazníky
opačného pohlaví
Věkový rozdíl mezi zákazníky
<= 15 let
10. Domácnosti mezi sebou komunikují víc
ODCHOZÍ
VOLANÍ
PŘÍCHOZÍ
VOLANÍ
ODCHOZÍ
SMS
PŘÍCHOZÍ
SMS
VOLÁM JENOM
MANŽELCE
VŮBEC NEVOLÁM
MANŽELCE
DOMÁCNOSTI
OSTATNÍ
17. Výsledky modelování
Predikce
jiny rodina
Realita jiny 5000 123
rodina 150 555
Ztracená příležitost
Když neoslovím nějakou rodinu
Predikce
jiný
vztah
rodina
Realita jiný vztah 5000 123
rodina 150 555
27. Jak často domácnosti bývají spolu o víkendech?
SKORO
NEBÝVAJÍ
BÝVAJÍ
POŘÁD
DOMÁCNOSTI
OSTATNÍ
28. Když dáme do modelu všechno co máme
RECALL
PRECISION
BETA
ALPHA*
ALPHA
GAMMA
29. Máme šum v trénovací množině
› Alespoň 15 % rodin nebylo spolu žádný víkend za prosinec 2017:
– Sourozenci
– Rozvod
– Chyby párování
› Zdroje chyb:
– Nejlepší kamarád
– Rodinné byty
– Děti
– Vice SIM
› Hodně dat ne znamená hodně informací!
30. Kam dál?
› Získání bohatší trénovací množiny
› Sjednocení zákazníků s dvěma SIM
› Další datové zdroje