O documento discute o uso de aprendizado de máquina e redes neurais para prevenção de fraudes. Apresenta casos de fraudes em cartões de crédito e seguros e como modelos de machine learning podem identificar padrões de fraude de forma mais eficaz do que regras definidas manualmente. Também descreve a plataforma ADS, que usa redes neurais treinadas com grandes volumes de dados para reconhecer padrões de fraude automaticamente.
2. o Empresa
o Mercado
o O que é aprendizado de máquina
o Porque usar para prevenção de fraudes
o Como aplicar ao seu negócio
o ADS Platform
3. Empresa
A Tesla ADS é uma empresa com foco em sistemas integrados e
automatizados de decisão.
Como integrante do Startup Program da SAP e AWS Activate da Amazon
Web Services, nossas plataformas de serviços rodam usando o conjunto das
melhores tecnologias do mercado, para servir como base para criação dos
modelos de inteligência artificial.
5. Fraudes em Cartão de Crédito
https://www.spcbrasil.org.br/
spc_brasil_apresentacao_pesquisa_fraudes_20141.pdf
Cartão
de
crédito
clonado:
Ø 53%
Descobriu
conferindo
a
fatura
Ø 72%
Cancelaram
o
cartão
de
crédito
Ø 63%
Foram
res=tuídos
integralmente
Ø 66%
Ficaram
mais
criteriozos
com
o
uso
do
cartão
Cartão
de
crédito
é
o
quinto
lugar
em
nas
fraudes
mais
ocorridas
6. Fraudes em Cartão de Crédito
http://noticias.serasaexperian.com.br/maio-registra-161-102-tentativas-de-
fraude-contra-o-consumidor-revela-indicador-serasa-experian/
Maio de 2015 registrou:
-161.102 tentativas de fraude conhecida como roubo de identidade
- Uma tentativa de fraude a cada 16,6 segundos no país.
7. Fraudes em Seguros
http://www.cnseg.org.br/cnseg/servicos-apoio/noticias/
fraude-prejudica-todo-o-sistema-de-seguros.html
A Confederação Nacional das Empresas de Seguros Gerais, Previdência Privada
e Vida, Saúde Suplementar e Capitalização (CNseg)
Como um câncer, a fraude prejudica todo o sistema de seguros.
Os impactos da fraude não só para a seguradora, mas também para toda a
sociedade, uma vez que isso gera aumento do preço do seguro e prejudica a
entrada de novos consumidores. “Sem novos entrantes no mercado, fica mais
complicado ter preços mais acessíveis”
8. Fraudes em Seguros
http://www.cnseg.org.br/cnseg/servicos-apoio/noticias/
fraude-prejudica-todo-o-sistema-de-seguros.html
Em números, as fraudes comprovadas, sem considerar previdência, saúde e
capitalização, somaram R$ 448 milhões em 2014, ou seja, 1,7% em relação aos
sinistros avisados dos Seguros Gerais.
Em 2013, as fraudes totalizaram R$ 350 milhões (1,5%) e em 2012, R$ 340
milhões (1,2%). “Se colocar esse índice em cima dos sinistros suspeitos, o
indicador sobe para 20%. Em cima dos sinistros investigados, avança para 25%.
9. O que é aprendizado
de máquina
(machine learning)
15. Fraude é adversa
Disciplinas como
otimização para
ferramentas de busca
tem competidores de
acordo com regras…
...prevenção de
fraude tem
adversários hostis
propositalmente
quebrando as
regras
16. Padrões de Fraudes mudam rapidamente
Regras geradas por
humanos não evoluem
rápido suficiente
Cada barra é um dia
Esta é $691,000
17. Fraude é de cauda-longa
Soma dos
casos menores
é mais danosa
que os casos
maiores
país
varejo
emissor
cartão
valor
18. Regras Humanas Vs Modelos de Máquina
Regras Humanas
Olhar
para
todas
transações
para
cada
varejo
nos
úl=mos
30
dias
Calcular
a
taixa
de
de
desvio
padrão
do
declínio
para
cada
varejo
por
dia.
Criar
uma
regra
para
cada
segmento
de
varejo
Ação:
Negar
transações
quando
a
taixe
de
declínio
aumentar
no
fator
de
3x.
Um tamanho para todas
regras, muitas revisões
manuais
Modelos de Máquina(Redes Neurais)
Olhar
para
todas
transações
negadas
para
cada
varejo
nos
úl=mos
3
anos
usando
princípios
de
Big
Data
Calcular
a
taixa
padrão
de
desvio
para
cada
varejo
por
dia,
por
hora,
localização,
milhares
de
maneiras...
Criar
um
modelo
probabilís=co
para
cada
varejo
para
capturar
as
nuâncias
de
cada
um.
Ação:
Negar
transações
quando
a
probabilidade
da
taixa
de
declínio
aumentar
o
risco
além
do
normal
dependendo
do
comportamento
do
lojista
Modelos probabilísticos
encontram nuâncias de
cada caso
20. Visão do processo
Processo de aprendizado
Passos para criação da
Rede Neural
Pegar
Dados
Design
Modelo
Treinar
/Testar
Comparar Publicar
1. Pegar dados - dados históricos,
terceiros, dados proprietátios.
2. Design do Modelo – Desenhar
as funcionalidades do modelo que
irão inferir no comportamento.
3. Treinar/Testar – Aprendizado
supervisionado. Inferir uma função
de dados nomeados consiste em
exemplos de treinamento.
4. Comparação – Comparar
contra a base, performance contra
base atual para entender
melhorias de performance.
5. Publicação – Prover novas
configurações da caixa de areia
para ambiente de produção
21. Muitas escolhas para treinar as Redes Neurais
Modelos probabilísticos
encontram nuâncias de
cada caso
Qual é uma
zebra?
Métodos
22. Como sabemos que funciona?
ü ROC Curves
ü Ranges de detecção
ü Ranges de Falso Positivo
ü Objetivo: Maior taixa de detecção com menor taixa de
falso positivo
MEDINDO E AVALIANDO A PERFORMANCE DA REDE
23. O que você precisa
Infraestrutura
Storage
Memória
Processadores
Largura de banda
Time
Cientistas de dados
Engenheiros
Analista
Dados
Base treinamento
Over/Undersampling
Overfitting
Sistema de predição em
que a linha verde
representa um modelo
sobreajustado e a linha
preta um modelo
regularizado.
25. Quebrando as regras
Humanos+computadores=máquina definitiva de previsão
Entendível
Escala de
Big-Data
Fácil de usar – Machine Learning para todos
Aprendizado de Máquina Contínuo
“Testes de caixa branca
para análises diárias”
“Em memória ,
distribuída”
“democratizar o acesso para aprendizado estatístico avançado”
27. ADS Platform
A
ADS
Pla]orm
roda
100%
em
memória
no
topo
do
SAP
HANA
e
dentro
da
melhor
infraestrutura
de
cloud
compu=ng
do
mercado,
atendendo
aos
mais
exigentes
compliances
como
PCI-‐DSS
e
HIPPA.
Através
do
treinamento
das
nossas
Redes
Neurais
com
quan=dades
massivas
de
dados,
nossos
modelos
de
IA
aprendem
e
reconhecem
novos
padrões
automa=camente,
sem
necessidade
de
reescrever
código.
28. ADS Platform
ü Precisão de 96% em menos de 1,5 s
ü Análises geográficas em tempo real
ü %Erro: ADS Platform 4% Vs +40% Processo tradicional
Proposta de valor
ü Redução de risco e custo
ü Tempo de resposta instantâneo
Sistema atual de tomada de decisões tornou-se completamente obsoleto.
29. ADS Platform - Telas
ü Dashboard
ü Contendo o resumo diário e mensal dos
modelos das redes neurais
ü Geoint (Geoprocessamento+inteligência)
30. ADS Platform - Telas
ü Aplicação
Para testar manualmente os
modelos das redes.
31. ADS Platform - Telas
ü API
Token e documentação da API
para integração, com resumo das
chamadas