SlideShare ist ein Scribd-Unternehmen logo
1 von 28
Downloaden Sie, um offline zu lesen
Painel 04   03 - leon - Construção de modelos preditivos para melhoria na seleção de processos de compensação de crédito tributário
 Crises financeiras e restrições orçamentárias
 Redução de Auditores-Fiscais nas
administrações tributárias e aduaneiras de todo
o mundo
 Aumento na carga de trabalho (contribuintes,
solicitações de compensação, importação e
exportação)
2
3
 Saída: pedir mais gente ou trabalhar melhor?
4
 Trabalhar melhor = selecionar melhor o que
deve ser trabalhado
 Volume de dados não permite mais análises de
especialistas sem auxílio de ferramentas
 Análise de dados: encontrar padrões,
correlações e realizar predições a partir de
massas de dados* e conhecimento de
especialistas nos processos de trabalho 5
6
 Compensação de crédito: utilizar um crédito
para quitar um débito (diferentes tributos ou
não)
 Ex: pagamento a maior (erro na hora de pagar
um “carnê leão”) pode ser restituído (receber o
valor de volta) ou compensado
 Vantagem da compensação: processo mais
célere em comparação com a restituição 7
 O Sistema de Controle de Crédito (SCC) analisa a
soliticação e, com base em alguns parâmetros de
risco, defere, indefere ou separa a compensaçao
para análise manual do Auditor-Fiscal.
 Estoque de processos de análise manual se elevou
sobremaneira. Classificar melhor as solicitações
para escolher aqueles com maior risco de
indeferimento
8
Fonte: https://www.serpro.gov.br/tema/noticias-tema/de-volta-para-o-contribuinte
9
 Problema: seleção de solicitações para análise manual
pode gerar compensações indevidas, afetando o saldo
líquido de arrecadação
 Proposta: melhorar a seleção de processos de
compensação tributária utilizando modelos preditivos
 Reduzir os riscos para aumentar a análise de
processos que tenham mais riscos de indeferimento
(equívoco do contribuinte ou fraude)
10
 Mestrado em Computação Aplicada - UnB
 Orientador: Prof. Dr. João Carlos Felix
 Coorientador: Prof. Dr. Rommel Novaes Carvalho
(de novo esse cara?)
 Predizer se uma solicitação de compensação
será indeferida
11
12
 Quais características do contribuinte são mais
importantes estatisticamente para definir se
haverá deferimento ou não da solicitação de
compensação?
 Para novas solicitações de crédito, quais as
chances de serem ou não deferidas?
13
 Ensaio inicial: 1a
Região Fiscal da RFB, que
abrange as unidades federativas do DF, GO,
MT, MS e TO
 +- 8000 famílias trabalhadas manualmente
(classificadas) por Auditores-Fiscais
 1 família são todas as solicitações de
compensação relativas a um mesmo crédito
14
 Tratamentos básicos:
 Retirada de acentos
 Exclusão de linhas com poucas informações ou
nulas
 Transformação de tipos de dados
 Os dados foram todos trabalhos utilizando o
software R (R Studio).
15
 Uma família pode ter solicitações deferidas e
indeferidas
 Limite arbritrário: acima de 70% do valor do
crédito indeferido é uma família indeferida,
abaixo de 70% é considerada deferida
16
 Do total de variáveis dependentes, foram
escolhidas 8 (oito) para iniciar as análise de
importância e significância estatística e para
construção dos modelos
 Variáveis escolhidas por especialistas em
compensação de crédito
17
 Responder aos questionamentos realizados no
entendimento do negócio.
 Regressão logística para entender quais
características da compensação/contribuinte
mais influenciam na decisão de
deferimento/indeferimento
18
 Regressão logística: somente 4 das 8 delas se
mostraram estatisticamente significativas para
explicar o modelo
 Modelos preditivos: regressão logística, o
algoritmo Naive Bayes e Random Forests.
19
 Para todos os modelos a base foi separada em
duas, uma de treinamento e outra para testes
na proporção 80 para 20%.
 Base de treinamento foi utilizada para realizar a
chamada validação cruzada (cross-validation),
que permite que uma mesma base seja usada
tanto para treinamento quanto para validação
para achar um modelo menos sobreajustado
20
21
22
 Boa técnica: usar regressão para escolher as
variáveis antes da confecção dos modelos
preditivos (modelos com todas as variáveis não
passou de 0.53 de acurácia).
 Resultados interessantes, cerca de 70% de
acerto nas predições
23
 Nem sempre acertar mais significa melhora no
processo de seleção de trabalhos
 Indicador de performance de processo é
necessário: valor indeferido/família analisada
 Resultado: fracasso completo
24
 Retornar ao entendimento do negócio para
avaliar por tipo de crédito (Saldo negativo de
IRPJ, PIS/Cofins não cumulativo, etc)
 Resultado: um pouco melhor
25
26
 Análise por tipo de crédito com retirada de
outliers (instituições financeiras, grandes
empreiteiras)
 Amostras maiores (8a
RF)
 A partir de um modelo com boa predição,
aplicar em algumas unidades
27
Obrigado!
Auditor-Fiscal Leon Sólon da Silva – leon.silva@rfb.gov.br
Auditor-Fiscal Márcio Vital Santos de Araujo – marcio.vital@rfb.gov.br

Más contenido relacionado

Andere mochten auch

Painel 05 01 - ricardo carvalho - Filiação Partidária e Risco de Corrupção ...
Painel 05   01 - ricardo carvalho - Filiação Partidária e Risco de Corrupção ...Painel 05   01 - ricardo carvalho - Filiação Partidária e Risco de Corrupção ...
Painel 05 01 - ricardo carvalho - Filiação Partidária e Risco de Corrupção ...Tribunal de Contas da União - TCU (Oficial)
 
Painel 04 02 - Jedson Passos - Análise Sistêmica de Orçamentos de Obras Púb...
Painel 04   02 - Jedson Passos - Análise Sistêmica de Orçamentos de Obras Púb...Painel 04   02 - Jedson Passos - Análise Sistêmica de Orçamentos de Obras Púb...
Painel 04 02 - Jedson Passos - Análise Sistêmica de Orçamentos de Obras Púb...Tribunal de Contas da União - TCU (Oficial)
 
Instrumentos de Transparência para a Administração Pública Local
Instrumentos de Transparência para a Administração Pública LocalInstrumentos de Transparência para a Administração Pública Local
Instrumentos de Transparência para a Administração Pública LocalNuno Salvador
 
O Uso de Tecnologia da Informação na Prevenção e no Combate à Corrupção
O Uso de Tecnologia da Informação na Prevenção e no Combate à CorrupçãoO Uso de Tecnologia da Informação na Prevenção e no Combate à Corrupção
O Uso de Tecnologia da Informação na Prevenção e no Combate à CorrupçãoEditora Fórum
 

Andere mochten auch (20)

Painel 05 01 - ricardo carvalho - Filiação Partidária e Risco de Corrupção ...
Painel 05   01 - ricardo carvalho - Filiação Partidária e Risco de Corrupção ...Painel 05   01 - ricardo carvalho - Filiação Partidária e Risco de Corrupção ...
Painel 05 01 - ricardo carvalho - Filiação Partidária e Risco de Corrupção ...
 
Lancamento do Portal de inovação do TCU
Lancamento do Portal de inovação do TCULancamento do Portal de inovação do TCU
Lancamento do Portal de inovação do TCU
 
Painel 04 01 - Rommel Carvalho - uso de mineração de dados e textos para cá...
Painel 04   01 - Rommel Carvalho - uso de mineração de dados e textos para cá...Painel 04   01 - Rommel Carvalho - uso de mineração de dados e textos para cá...
Painel 04 01 - Rommel Carvalho - uso de mineração de dados e textos para cá...
 
Control social 2016 - la visión del Tribunal de Cuentas de la Unión - 1
Control social 2016 - la visión del Tribunal de Cuentas de la Unión - 1Control social 2016 - la visión del Tribunal de Cuentas de la Unión - 1
Control social 2016 - la visión del Tribunal de Cuentas de la Unión - 1
 
Análisis de datos 2016 - la visión del tribunal de cuentas de la unión.
Análisis de datos 2016 -  la visión del tribunal de cuentas de la unión.Análisis de datos 2016 -  la visión del tribunal de cuentas de la unión.
Análisis de datos 2016 - la visión del tribunal de cuentas de la unión.
 
Presentación del ccc - TCU
Presentación del ccc   - TCUPresentación del ccc   - TCU
Presentación del ccc - TCU
 
Painel 04 02 - Jedson Passos - Análise Sistêmica de Orçamentos de Obras Púb...
Painel 04   02 - Jedson Passos - Análise Sistêmica de Orçamentos de Obras Púb...Painel 04   02 - Jedson Passos - Análise Sistêmica de Orçamentos de Obras Púb...
Painel 04 02 - Jedson Passos - Análise Sistêmica de Orçamentos de Obras Púb...
 
Geotecnologías - 2016 - la visión del ministerio del medio ambiente.
Geotecnologías - 2016 - la visión del ministerio del medio ambiente.Geotecnologías - 2016 - la visión del ministerio del medio ambiente.
Geotecnologías - 2016 - la visión del ministerio del medio ambiente.
 
Taller Innovación - Innovación como solución para problemas complejos - TCU
Taller Innovación - Innovación como solución para problemas complejos - TCUTaller Innovación - Innovación como solución para problemas complejos - TCU
Taller Innovación - Innovación como solución para problemas complejos - TCU
 
Painel 03 04 - André Vital - Avaliação de Risco em Contratos de Obras Rodov...
Painel 03   04 - André Vital - Avaliação de Risco em Contratos de Obras Rodov...Painel 03   04 - André Vital - Avaliação de Risco em Contratos de Obras Rodov...
Painel 03 04 - André Vital - Avaliação de Risco em Contratos de Obras Rodov...
 
Instrumentos de Transparência para a Administração Pública Local
Instrumentos de Transparência para a Administração Pública LocalInstrumentos de Transparência para a Administração Pública Local
Instrumentos de Transparência para a Administração Pública Local
 
Innovación como solución para problemas complejos -2016- TCU - 2
Innovación como solución para problemas complejos -2016-   TCU - 2Innovación como solución para problemas complejos -2016-   TCU - 2
Innovación como solución para problemas complejos -2016- TCU - 2
 
Control social 2016 - la visión del Tribunal de Cuentas de la Unión.
Control social 2016 -  la visión del Tribunal de Cuentas de la Unión.Control social 2016 -  la visión del Tribunal de Cuentas de la Unión.
Control social 2016 - la visión del Tribunal de Cuentas de la Unión.
 
La visión del ministerio de planificación- TCU
La visión del ministerio de planificación- TCULa visión del ministerio de planificación- TCU
La visión del ministerio de planificación- TCU
 
Presentación del instituto serzedello corrêa - TCU
Presentación del instituto serzedello corrêa  - TCUPresentación del instituto serzedello corrêa  - TCU
Presentación del instituto serzedello corrêa - TCU
 
O Uso de Tecnologia da Informação na Prevenção e no Combate à Corrupção
O Uso de Tecnologia da Informação na Prevenção e no Combate à CorrupçãoO Uso de Tecnologia da Informação na Prevenção e no Combate à Corrupção
O Uso de Tecnologia da Informação na Prevenção e no Combate à Corrupção
 
Dawarehouse e OLAP
Dawarehouse e OLAPDawarehouse e OLAP
Dawarehouse e OLAP
 
Ministro Benjamin Zymler (TCU) - Apresentação "Colóquio: As Novas Vertentes d...
Ministro Benjamin Zymler (TCU) - Apresentação "Colóquio: As Novas Vertentes d...Ministro Benjamin Zymler (TCU) - Apresentação "Colóquio: As Novas Vertentes d...
Ministro Benjamin Zymler (TCU) - Apresentação "Colóquio: As Novas Vertentes d...
 
Control social 2016 - la visión de la cámara de diputados.
Control social 2016 -  la visión de la cámara de diputados.Control social 2016 -  la visión de la cámara de diputados.
Control social 2016 - la visión de la cámara de diputados.
 
Design thinking 2016 - Herramientas
Design thinking 2016 -  HerramientasDesign thinking 2016 -  Herramientas
Design thinking 2016 - Herramientas
 

Ähnlich wie Painel 04 03 - leon - Construção de modelos preditivos para melhoria na seleção de processos de compensação de crédito tributário

Contas a Receber
Contas a ReceberContas a Receber
Contas a ReceberEdno Santos
 
MVAR- Criacao de Valor utilizando uma Gestao de Risco Operacional mais eficaz...
MVAR- Criacao de Valor utilizando uma Gestao de Risco Operacional mais eficaz...MVAR- Criacao de Valor utilizando uma Gestao de Risco Operacional mais eficaz...
MVAR- Criacao de Valor utilizando uma Gestao de Risco Operacional mais eficaz...MVAR Solucoes e Servicos
 
Apresentação Conceitos TOC (Theory Of Constraints)
Apresentação Conceitos TOC (Theory Of Constraints)Apresentação Conceitos TOC (Theory Of Constraints)
Apresentação Conceitos TOC (Theory Of Constraints)RZachi
 
Apresentação Theory Of Constraints
Apresentação Theory Of ConstraintsApresentação Theory Of Constraints
Apresentação Theory Of ConstraintsRZachi
 
Análise Inteligente para Administrações Tributárias
Análise Inteligente para Administrações TributáriasAnálise Inteligente para Administrações Tributárias
Análise Inteligente para Administrações TributáriasLeonardo Loureiro
 
Gestão de tesouraria
Gestão de tesourariaGestão de tesouraria
Gestão de tesourariaEdno Santos
 
Monitoramento Contínuo e Auditoria Contínua
Monitoramento Contínuo e Auditoria ContínuaMonitoramento Contínuo e Auditoria Contínua
Monitoramento Contínuo e Auditoria ContínuaVIXTEAM
 
Inadimplência - O risco da concessão de crédito
Inadimplência - O risco da concessão de créditoInadimplência - O risco da concessão de crédito
Inadimplência - O risco da concessão de créditoTatiana Barros Prestes Gomes
 
Ciência de Dados no Combate à Corrupção
Ciência de Dados no Combate à CorrupçãoCiência de Dados no Combate à Corrupção
Ciência de Dados no Combate à CorrupçãoRommel Carvalho
 
CONTAS A PAGAR E RECEBER
CONTAS A PAGAR E RECEBERCONTAS A PAGAR E RECEBER
CONTAS A PAGAR E RECEBEREdno Santos
 
[FM2S] Yellow Belt- Módulo 1 - Case DMAIC AME.pptx.pdf
[FM2S] Yellow Belt- Módulo 1 - Case DMAIC AME.pptx.pdf[FM2S] Yellow Belt- Módulo 1 - Case DMAIC AME.pptx.pdf
[FM2S] Yellow Belt- Módulo 1 - Case DMAIC AME.pptx.pdfJuninho82
 
Monitoramento e Avaliacao de Programas de Conformidade APOSTILA
Monitoramento e Avaliacao de Programas de Conformidade APOSTILAMonitoramento e Avaliacao de Programas de Conformidade APOSTILA
Monitoramento e Avaliacao de Programas de Conformidade APOSTILAGilberto C Porto
 
Advoco brasil o cliente odeia surpresas
Advoco brasil   o cliente odeia surpresasAdvoco brasil   o cliente odeia surpresas
Advoco brasil o cliente odeia surpresasAndre Medeiros
 
Relatório parcial caixa automático [Design de Interação PUC/MG]
Relatório parcial caixa automático [Design de Interação PUC/MG]Relatório parcial caixa automático [Design de Interação PUC/MG]
Relatório parcial caixa automático [Design de Interação PUC/MG]Leandro Alves
 
WEBINAR BPT EloGroup 30/09/2016 - Business Process Transformation
WEBINAR BPT EloGroup 30/09/2016 - Business Process TransformationWEBINAR BPT EloGroup 30/09/2016 - Business Process Transformation
WEBINAR BPT EloGroup 30/09/2016 - Business Process TransformationEloGroup
 

Ähnlich wie Painel 04 03 - leon - Construção de modelos preditivos para melhoria na seleção de processos de compensação de crédito tributário (20)

Contas a Receber
Contas a ReceberContas a Receber
Contas a Receber
 
Plano de Cargos e Salários - Como implantar na empresa
Plano de Cargos e Salários - Como implantar na empresaPlano de Cargos e Salários - Como implantar na empresa
Plano de Cargos e Salários - Como implantar na empresa
 
MVAR- Criacao de Valor utilizando uma Gestao de Risco Operacional mais eficaz...
MVAR- Criacao de Valor utilizando uma Gestao de Risco Operacional mais eficaz...MVAR- Criacao de Valor utilizando uma Gestao de Risco Operacional mais eficaz...
MVAR- Criacao de Valor utilizando uma Gestao de Risco Operacional mais eficaz...
 
Apresentação Conceitos TOC (Theory Of Constraints)
Apresentação Conceitos TOC (Theory Of Constraints)Apresentação Conceitos TOC (Theory Of Constraints)
Apresentação Conceitos TOC (Theory Of Constraints)
 
Apresentação Theory Of Constraints
Apresentação Theory Of ConstraintsApresentação Theory Of Constraints
Apresentação Theory Of Constraints
 
Análise Inteligente para Administrações Tributárias
Análise Inteligente para Administrações TributáriasAnálise Inteligente para Administrações Tributárias
Análise Inteligente para Administrações Tributárias
 
Gestão de tesouraria
Gestão de tesourariaGestão de tesouraria
Gestão de tesouraria
 
Monitoramento Contínuo e Auditoria Contínua
Monitoramento Contínuo e Auditoria ContínuaMonitoramento Contínuo e Auditoria Contínua
Monitoramento Contínuo e Auditoria Contínua
 
Inadimplência - O risco da concessão de crédito
Inadimplência - O risco da concessão de créditoInadimplência - O risco da concessão de crédito
Inadimplência - O risco da concessão de crédito
 
Ciência de Dados no Combate à Corrupção
Ciência de Dados no Combate à CorrupçãoCiência de Dados no Combate à Corrupção
Ciência de Dados no Combate à Corrupção
 
Etapas dmaic
Etapas dmaicEtapas dmaic
Etapas dmaic
 
Risco de credito
Risco de creditoRisco de credito
Risco de credito
 
Desenvolvimento Custos Gerenciais
Desenvolvimento Custos GerenciaisDesenvolvimento Custos Gerenciais
Desenvolvimento Custos Gerenciais
 
CONTAS A PAGAR E RECEBER
CONTAS A PAGAR E RECEBERCONTAS A PAGAR E RECEBER
CONTAS A PAGAR E RECEBER
 
[FM2S] Yellow Belt- Módulo 1 - Case DMAIC AME.pptx.pdf
[FM2S] Yellow Belt- Módulo 1 - Case DMAIC AME.pptx.pdf[FM2S] Yellow Belt- Módulo 1 - Case DMAIC AME.pptx.pdf
[FM2S] Yellow Belt- Módulo 1 - Case DMAIC AME.pptx.pdf
 
Monitoramento e Avaliacao de Programas de Conformidade APOSTILA
Monitoramento e Avaliacao de Programas de Conformidade APOSTILAMonitoramento e Avaliacao de Programas de Conformidade APOSTILA
Monitoramento e Avaliacao de Programas de Conformidade APOSTILA
 
Advoco brasil o cliente odeia surpresas
Advoco brasil   o cliente odeia surpresasAdvoco brasil   o cliente odeia surpresas
Advoco brasil o cliente odeia surpresas
 
Painel 01 01 - tiago hillermam - Análise de Cobranças Suspeitas de Consult...
Painel 01   01 - tiago hillermam - Análise de Cobranças Suspeitas  de Consult...Painel 01   01 - tiago hillermam - Análise de Cobranças Suspeitas  de Consult...
Painel 01 01 - tiago hillermam - Análise de Cobranças Suspeitas de Consult...
 
Relatório parcial caixa automático [Design de Interação PUC/MG]
Relatório parcial caixa automático [Design de Interação PUC/MG]Relatório parcial caixa automático [Design de Interação PUC/MG]
Relatório parcial caixa automático [Design de Interação PUC/MG]
 
WEBINAR BPT EloGroup 30/09/2016 - Business Process Transformation
WEBINAR BPT EloGroup 30/09/2016 - Business Process TransformationWEBINAR BPT EloGroup 30/09/2016 - Business Process Transformation
WEBINAR BPT EloGroup 30/09/2016 - Business Process Transformation
 

Mehr von Tribunal de Contas da União - TCU (Oficial)

Mehr von Tribunal de Contas da União - TCU (Oficial) (8)

Painel 03 01 - Rommel Carvalho - detecção preventiva de fracionamento de co...
Painel 03   01 - Rommel Carvalho - detecção preventiva de fracionamento de co...Painel 03   01 - Rommel Carvalho - detecção preventiva de fracionamento de co...
Painel 03 01 - Rommel Carvalho - detecção preventiva de fracionamento de co...
 
Painel 02 03 - Rommel Carvalho - identificação automática de tipos de pedid...
Painel 02   03 - Rommel Carvalho - identificação automática de tipos de pedid...Painel 02   03 - Rommel Carvalho - identificação automática de tipos de pedid...
Painel 02 03 - Rommel Carvalho - identificação automática de tipos de pedid...
 
Painel 02 02 - Thiago Marzagão - classificação automatizada de produtos em...
Painel 02   02 - Thiago Marzagão -  classificação automatizada de produtos em...Painel 02   02 - Thiago Marzagão -  classificação automatizada de produtos em...
Painel 02 02 - Thiago Marzagão - classificação automatizada de produtos em...
 
Painel 02 01 patrícia maia - Uso de Técnicas de Mineração de Textos Aplica...
Painel 02   01 patrícia maia - Uso de Técnicas de Mineração de Textos  Aplica...Painel 02   01 patrícia maia - Uso de Técnicas de Mineração de Textos  Aplica...
Painel 02 01 patrícia maia - Uso de Técnicas de Mineração de Textos Aplica...
 
Painel 01 02 - felipe fonseca - Classificação de clientes bancários com bai...
Painel 01   02 - felipe fonseca - Classificação de clientes bancários com bai...Painel 01   02 - felipe fonseca - Classificação de clientes bancários com bai...
Painel 01 02 - felipe fonseca - Classificação de clientes bancários com bai...
 
Painel 00 02 - Gilson Libório - a visão da controladoria-geral da união
Painel 00   02 - Gilson Libório - a visão da controladoria-geral da uniãoPainel 00   02 - Gilson Libório - a visão da controladoria-geral da união
Painel 00 02 - Gilson Libório - a visão da controladoria-geral da união
 
Painel 00 01 - wesley - Análise de dados como ferramenta estratégica para o...
Painel 00   01 - wesley - Análise de dados como ferramenta estratégica para o...Painel 00   01 - wesley - Análise de dados como ferramenta estratégica para o...
Painel 00 01 - wesley - Análise de dados como ferramenta estratégica para o...
 
Painel 01 03 - leonardo teles - Projeto CNAE: Algoritmo para classificação ...
Painel 01   03 - leonardo teles - Projeto CNAE: Algoritmo para classificação ...Painel 01   03 - leonardo teles - Projeto CNAE: Algoritmo para classificação ...
Painel 01 03 - leonardo teles - Projeto CNAE: Algoritmo para classificação ...
 

Painel 04 03 - leon - Construção de modelos preditivos para melhoria na seleção de processos de compensação de crédito tributário

  • 2.  Crises financeiras e restrições orçamentárias  Redução de Auditores-Fiscais nas administrações tributárias e aduaneiras de todo o mundo  Aumento na carga de trabalho (contribuintes, solicitações de compensação, importação e exportação) 2
  • 3. 3
  • 4.  Saída: pedir mais gente ou trabalhar melhor? 4
  • 5.  Trabalhar melhor = selecionar melhor o que deve ser trabalhado  Volume de dados não permite mais análises de especialistas sem auxílio de ferramentas  Análise de dados: encontrar padrões, correlações e realizar predições a partir de massas de dados* e conhecimento de especialistas nos processos de trabalho 5
  • 6. 6
  • 7.  Compensação de crédito: utilizar um crédito para quitar um débito (diferentes tributos ou não)  Ex: pagamento a maior (erro na hora de pagar um “carnê leão”) pode ser restituído (receber o valor de volta) ou compensado  Vantagem da compensação: processo mais célere em comparação com a restituição 7
  • 8.  O Sistema de Controle de Crédito (SCC) analisa a soliticação e, com base em alguns parâmetros de risco, defere, indefere ou separa a compensaçao para análise manual do Auditor-Fiscal.  Estoque de processos de análise manual se elevou sobremaneira. Classificar melhor as solicitações para escolher aqueles com maior risco de indeferimento 8
  • 10.  Problema: seleção de solicitações para análise manual pode gerar compensações indevidas, afetando o saldo líquido de arrecadação  Proposta: melhorar a seleção de processos de compensação tributária utilizando modelos preditivos  Reduzir os riscos para aumentar a análise de processos que tenham mais riscos de indeferimento (equívoco do contribuinte ou fraude) 10
  • 11.  Mestrado em Computação Aplicada - UnB  Orientador: Prof. Dr. João Carlos Felix  Coorientador: Prof. Dr. Rommel Novaes Carvalho (de novo esse cara?)  Predizer se uma solicitação de compensação será indeferida 11
  • 12. 12
  • 13.  Quais características do contribuinte são mais importantes estatisticamente para definir se haverá deferimento ou não da solicitação de compensação?  Para novas solicitações de crédito, quais as chances de serem ou não deferidas? 13
  • 14.  Ensaio inicial: 1a Região Fiscal da RFB, que abrange as unidades federativas do DF, GO, MT, MS e TO  +- 8000 famílias trabalhadas manualmente (classificadas) por Auditores-Fiscais  1 família são todas as solicitações de compensação relativas a um mesmo crédito 14
  • 15.  Tratamentos básicos:  Retirada de acentos  Exclusão de linhas com poucas informações ou nulas  Transformação de tipos de dados  Os dados foram todos trabalhos utilizando o software R (R Studio). 15
  • 16.  Uma família pode ter solicitações deferidas e indeferidas  Limite arbritrário: acima de 70% do valor do crédito indeferido é uma família indeferida, abaixo de 70% é considerada deferida 16
  • 17.  Do total de variáveis dependentes, foram escolhidas 8 (oito) para iniciar as análise de importância e significância estatística e para construção dos modelos  Variáveis escolhidas por especialistas em compensação de crédito 17
  • 18.  Responder aos questionamentos realizados no entendimento do negócio.  Regressão logística para entender quais características da compensação/contribuinte mais influenciam na decisão de deferimento/indeferimento 18
  • 19.  Regressão logística: somente 4 das 8 delas se mostraram estatisticamente significativas para explicar o modelo  Modelos preditivos: regressão logística, o algoritmo Naive Bayes e Random Forests. 19
  • 20.  Para todos os modelos a base foi separada em duas, uma de treinamento e outra para testes na proporção 80 para 20%.  Base de treinamento foi utilizada para realizar a chamada validação cruzada (cross-validation), que permite que uma mesma base seja usada tanto para treinamento quanto para validação para achar um modelo menos sobreajustado 20
  • 21. 21
  • 22. 22
  • 23.  Boa técnica: usar regressão para escolher as variáveis antes da confecção dos modelos preditivos (modelos com todas as variáveis não passou de 0.53 de acurácia).  Resultados interessantes, cerca de 70% de acerto nas predições 23
  • 24.  Nem sempre acertar mais significa melhora no processo de seleção de trabalhos  Indicador de performance de processo é necessário: valor indeferido/família analisada  Resultado: fracasso completo 24
  • 25.  Retornar ao entendimento do negócio para avaliar por tipo de crédito (Saldo negativo de IRPJ, PIS/Cofins não cumulativo, etc)  Resultado: um pouco melhor 25
  • 26. 26
  • 27.  Análise por tipo de crédito com retirada de outliers (instituições financeiras, grandes empreiteiras)  Amostras maiores (8a RF)  A partir de um modelo com boa predição, aplicar em algumas unidades 27
  • 28. Obrigado! Auditor-Fiscal Leon Sólon da Silva – leon.silva@rfb.gov.br Auditor-Fiscal Márcio Vital Santos de Araujo – marcio.vital@rfb.gov.br