SlideShare ist ein Scribd-Unternehmen logo
1 von 14
Downloaden Sie, um offline zu lesen
Искусственный интеллект в кредитном скоринге
Что такое искусственный
интеллект?
Роботы?
Программы?
Распознавание
объектов, речи,
etc?
Машинное
обучение?
Искусственный интеллект – совокупность его разделов
«ИИ» в кредитном скоринге
Искусственный интеллект в
кредитном скоринге
Машинное обучение
(application,
behaviour scoring)
Feature Engineering and
Selection Нейронные сети
Две основные проблемы:
•Проблема качества модели (методология)
•Проблема данных (новых, качественных фич)
Предпосылки исследования:
 Черты лица, в свою очередь, зависят от генов.
Согласно Гарвардскому исследованию близнецов: 1/3 поведения формирует генетика,
2/3 - воспитание и характер
Могут ли черты лица влиять на кредитоспособность?
Проверка гипотезы:
 На микрофинансовом сегменте: выборка данных – 632 000 займов
 Набор переменных: id заемщика, пол, возраст, регион, объем займа, срок займа,
показатели просрочки, фото заемщика, показатели кредитной истории,
макроэкономические переменные и т.д.
 Обучающая выборка - 80% от общего объема займов
 Тестовая выборка – 20% от общего объема выборки
Обучение Предсказание
Распознаем лица и опорные точки
Подсчет пропорций
Добавление остальных переменных
Обучение моделей
Отбор лучшего ансамбля
Проверка на тестовой выборке
Распознаём лицо
Добавляем «переменные»
Подаём на вход обученной модели
Получаем результат
Нюансы:
1. Повороты головы
2. Несколько лиц на
фото
3. Разное расстояние до
объекта
4. Низкое качество
Только фото:
Повороты головы негативно сказываются на
прогноз, так как при поворотах приходится
представлять голову (лицо) в 3d, что
негативно влияет на восстановление
расположения основных лицевых фич
 Пол+возраст+сумма займа+фото.
С дополнительными
переменными:
Паспорта vs реальные фото
 В случае с паспортами мы имеем: унифицированное расстояние,
отсутствие поворотов головы.
 … НО
 Разный возраст
 Отсутствие эмоций и мимики
 Плохое качество сканированных копий
Фотография заёмщика при
получении кредита является более
предпочтительной, чем скан
паспорта, ввиду вышеизложенных
факторов
Результаты модели
 Общий прирост точности за счет машинного обучения
 Прирост точности на 1,5% при включении лицевых фич
Этично или нет?
 Любой скоринг при выдаче кредита – дискриминационный процесс, в связи с
вышесказанным - вполне этично.
Перспективы использования
технологии:
 Общая просроченная задолженность на 1 января 2017 года –
2,7 триллиона рублей
 Потенциал ежегодной экономии по РФ приблизительно 40,5
млрд. рублей
О нас
 FscoreLab
 data science компания, специализирующаяся на создании
нетривиальных алгоритмов для повышения точности кредитного
скоринга на стыке машинного обучение и компьютерного зрения
 Никита Николаев
Директор FscoreLab
СПБГЭУ, директор бизнес школы Grand School, со-основатель
системы дистанционного обучения Grand Class

Weitere ähnliche Inhalte

Ähnlich wie Искусственный интеллект в кредитном скоринге

Ähnlich wie Искусственный интеллект в кредитном скоринге (20)

шикин
шикин шикин
шикин
 
Бизнес план Credit App
Бизнес план Credit AppБизнес план Credit App
Бизнес план Credit App
 
Мировые тренды банковской информатизации CNews. С.Макаров
Мировые тренды банковской информатизации   CNews. С.МакаровМировые тренды банковской информатизации   CNews. С.Макаров
Мировые тренды банковской информатизации CNews. С.Макаров
 
Борис Фадичев, Relation rate: Анализ данных социальных сетей
 Борис Фадичев,  Relation rate: Анализ данных социальных сетей Борис Фадичев,  Relation rate: Анализ данных социальных сетей
Борис Фадичев, Relation rate: Анализ данных социальных сетей
 
РИФ 2016, Предикативная аналитика
РИФ 2016, Предикативная аналитикаРИФ 2016, Предикативная аналитика
РИФ 2016, Предикативная аналитика
 
Dsml for business.full version
Dsml for business.full versionDsml for business.full version
Dsml for business.full version
 
Презентация Владимира Шикина с конференции «BIG DATA: банки, финансовые компа...
Презентация Владимира Шикина с конференции «BIG DATA: банки, финансовые компа...Презентация Владимира Шикина с конференции «BIG DATA: банки, финансовые компа...
Презентация Владимира Шикина с конференции «BIG DATA: банки, финансовые компа...
 
Электронный банкинг: не для средних умов?
Электронный банкинг: не для средних умов?Электронный банкинг: не для средних умов?
Электронный банкинг: не для средних умов?
 
Гринчук Александр - Практическое применение Data mining технологий-ооо «нанот...
Гринчук Александр - Практическое применение Data mining технологий-ооо «нанот...Гринчук Александр - Практическое применение Data mining технологий-ооо «нанот...
Гринчук Александр - Практическое применение Data mining технологий-ооо «нанот...
 
i3_skills
i3_skillsi3_skills
i3_skills
 
Отборное с РИФ 2014: тренды, кейсы, советы
Отборное с РИФ 2014: тренды, кейсы, советыОтборное с РИФ 2014: тренды, кейсы, советы
Отборное с РИФ 2014: тренды, кейсы, советы
 
2017-05-06 02 Илья Сиганов. Зачем учить машины?
2017-05-06 02 Илья Сиганов. Зачем учить машины?2017-05-06 02 Илья Сиганов. Зачем учить машины?
2017-05-06 02 Илья Сиганов. Зачем учить машины?
 
Зачем учить машины?
Зачем учить машины?Зачем учить машины?
Зачем учить машины?
 
Презентация Александра Кириллова с конференции «BIG DATA: банки, финансовые к...
Презентация Александра Кириллова с конференции «BIG DATA: банки, финансовые к...Презентация Александра Кириллова с конференции «BIG DATA: банки, финансовые к...
Презентация Александра Кириллова с конференции «BIG DATA: банки, финансовые к...
 
Николай Марин, Исполнительный Архитектор IBM: Практика IBM в цифровой трансф...
Николай Марин, Исполнительный Архитектор IBM:  Практика IBM в цифровой трансф...Николай Марин, Исполнительный Архитектор IBM:  Практика IBM в цифровой трансф...
Николай Марин, Исполнительный Архитектор IBM: Практика IBM в цифровой трансф...
 
5 core skills of future for i3
5 core skills of future for i3 5 core skills of future for i3
5 core skills of future for i3
 
тренды Hr 2014
тренды Hr 2014тренды Hr 2014
тренды Hr 2014
 
Cовременные тенденции против устаревших стереотипов бизнеса
Cовременные тенденции против устаревших стереотипов бизнесаCовременные тенденции против устаревших стереотипов бизнеса
Cовременные тенденции против устаревших стереотипов бизнеса
 
Рычаг на себя. Ошибки выбора объекта управления
Рычаг на себя. Ошибки выбора объекта управленияРычаг на себя. Ошибки выбора объекта управления
Рычаг на себя. Ошибки выбора объекта управления
 
Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015
 

Mehr von rusbase

Mehr von rusbase (20)

Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
 
P2P кредитование и народное поручительство
P2P кредитование и народное поручительство P2P кредитование и народное поручительство
P2P кредитование и народное поручительство
 
Francis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech RussiaFrancis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech Russia
 
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech RussiaРуслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
 
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech RussiaАлексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
 
Алексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech RussiaАлексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech Russia
 
Алексей Архипов, Мастерчейн - FinTech Russia
Алексей Архипов, Мастерчейн  - FinTech RussiaАлексей Архипов, Мастерчейн  - FinTech Russia
Алексей Архипов, Мастерчейн - FinTech Russia
 
Максим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech RussiaМаксим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech Russia
 
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
 
Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016
 
Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016
 
Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016
 
Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016
 
Сергей Лоншаков — проект "Дрон сотрудник" — ICBDA2016
Сергей Лоншаков — проект "Дрон сотрудник" — ICBDA2016Сергей Лоншаков — проект "Дрон сотрудник" — ICBDA2016
Сергей Лоншаков — проект "Дрон сотрудник" — ICBDA2016
 
Наталья Полковникова – Global Innovation Labs – ICBDA2016
Наталья Полковникова – Global Innovation Labs – ICBDA2016Наталья Полковникова – Global Innovation Labs – ICBDA2016
Наталья Полковникова – Global Innovation Labs – ICBDA2016
 
Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016
Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016
Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016
 
Анатолий Климчук – ARTOX Media International – ICBDA 2016
Анатолий Климчук – ARTOX Media International – ICBDA 2016Анатолий Климчук – ARTOX Media International – ICBDA 2016
Анатолий Климчук – ARTOX Media International – ICBDA 2016
 
Алексей Смирнов – Актион – ICBDA 2016
Алексей Смирнов – Актион – ICBDA 2016Алексей Смирнов – Актион – ICBDA 2016
Алексей Смирнов – Актион – ICBDA 2016
 
Александр Воронов – BURDA – ICBDA 2016
Александр Воронов – BURDA – ICBDA 2016Александр Воронов – BURDA – ICBDA 2016
Александр Воронов – BURDA – ICBDA 2016
 
Евгений Никульчев — МТИ — ICBDA2016
Евгений Никульчев — МТИ — ICBDA2016Евгений Никульчев — МТИ — ICBDA2016
Евгений Никульчев — МТИ — ICBDA2016
 

Искусственный интеллект в кредитном скоринге

  • 1. Искусственный интеллект в кредитном скоринге
  • 2. Что такое искусственный интеллект? Роботы? Программы? Распознавание объектов, речи, etc? Машинное обучение? Искусственный интеллект – совокупность его разделов
  • 3. «ИИ» в кредитном скоринге Искусственный интеллект в кредитном скоринге Машинное обучение (application, behaviour scoring) Feature Engineering and Selection Нейронные сети Две основные проблемы: •Проблема качества модели (методология) •Проблема данных (новых, качественных фич)
  • 4. Предпосылки исследования:  Черты лица, в свою очередь, зависят от генов. Согласно Гарвардскому исследованию близнецов: 1/3 поведения формирует генетика, 2/3 - воспитание и характер Могут ли черты лица влиять на кредитоспособность?
  • 5. Проверка гипотезы:  На микрофинансовом сегменте: выборка данных – 632 000 займов  Набор переменных: id заемщика, пол, возраст, регион, объем займа, срок займа, показатели просрочки, фото заемщика, показатели кредитной истории, макроэкономические переменные и т.д.  Обучающая выборка - 80% от общего объема займов  Тестовая выборка – 20% от общего объема выборки
  • 6. Обучение Предсказание Распознаем лица и опорные точки Подсчет пропорций Добавление остальных переменных Обучение моделей Отбор лучшего ансамбля Проверка на тестовой выборке Распознаём лицо Добавляем «переменные» Подаём на вход обученной модели Получаем результат
  • 7. Нюансы: 1. Повороты головы 2. Несколько лиц на фото 3. Разное расстояние до объекта 4. Низкое качество
  • 8. Только фото: Повороты головы негативно сказываются на прогноз, так как при поворотах приходится представлять голову (лицо) в 3d, что негативно влияет на восстановление расположения основных лицевых фич
  • 9.  Пол+возраст+сумма займа+фото. С дополнительными переменными:
  • 10. Паспорта vs реальные фото  В случае с паспортами мы имеем: унифицированное расстояние, отсутствие поворотов головы.  … НО  Разный возраст  Отсутствие эмоций и мимики  Плохое качество сканированных копий Фотография заёмщика при получении кредита является более предпочтительной, чем скан паспорта, ввиду вышеизложенных факторов
  • 11. Результаты модели  Общий прирост точности за счет машинного обучения  Прирост точности на 1,5% при включении лицевых фич
  • 12. Этично или нет?  Любой скоринг при выдаче кредита – дискриминационный процесс, в связи с вышесказанным - вполне этично.
  • 13. Перспективы использования технологии:  Общая просроченная задолженность на 1 января 2017 года – 2,7 триллиона рублей  Потенциал ежегодной экономии по РФ приблизительно 40,5 млрд. рублей
  • 14. О нас  FscoreLab  data science компания, специализирующаяся на создании нетривиальных алгоритмов для повышения точности кредитного скоринга на стыке машинного обучение и компьютерного зрения  Никита Николаев Директор FscoreLab СПБГЭУ, директор бизнес школы Grand School, со-основатель системы дистанционного обучения Grand Class