SlideShare ist ein Scribd-Unternehmen logo
1 von 36
Downloaden Sie, um offline zu lesen
Do papel ao Digital com
Document
Understanding
Samuel Simão
2
Desenvolvedor RPA UiARD UiPath
samuelsimao47@gmail.com
Samuel Simão
Palestrante
3
1. Parte I – O que é Document Understanding?
• O que ele pode fazer?
• Quais benefícios podemos alcançar?
• Cenário de exemplo do UiPath AI Summit
2. Parte II – Como ele funciona?
• Etapas do framework
3. Parte III – Prática dentro do UiPath Studio
Sumário
O que é Document
Understanding?
Parte I
6
O que é o Document Understanding?
7
• Ferramenta da UiPath para leitura de
documentos;
O que é o Document Understanding?
8
• Ferramenta da uipath para leitura de
documentos;
• Baseado em tecnologias de OCR, NLP e
Machine Learning;
O que é o Document Understanding?
OCR NLP ML
=
9
• Ferramenta da uipath para leitura de
documentos;
• Baseado em tecnologias de OCR, NLP e
Machine Learning;
• Permite utilização de modelos pré-treinados ou
uso dos seus próprios modelos.
O que é o Document Understanding?
OCR NLP ML
=
11
O que ele é capaz de fazer?
12
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
O que ele é capaz de fazer?
Formulários Identidades Passaportes
Estruturados
13
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
O que ele é capaz de fazer?
Faturas Ordens de
Compra
Contas
Semi-Estruturados
14
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
O que ele é capaz de fazer?
Não-Estruturados
Contratos Registros
de Saúde
Emails
15
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
• Documentos escaneados, rotacionados
O que ele é capaz de fazer?
16
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
• Documentos escaneados, rotacionados
• Escritos a mão, assinados
O que ele é capaz de fazer?
17
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
• Documentos escaneados, rotacionados
• Escritos a mão, assinados
• Extenções de arquivos pdf, jpeg, png, etc
O que ele é capaz de fazer?
18
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
• Documentos escaneados, rotacionados
• Escritos a mão, assinados
• Extenções de arquivos pdf, jpeg, png, etc
• Validação humana
O que ele é capaz de fazer?
19
Que benefícios podem ser alcançados?
20
• Tempos de processamento mais rápidos
• Menos erros humanos
• Redução de gargalo por aprovação de
documentos
Que benefícios podem ser alcançados?
Velocidade Acurácia Rentável
21
Cenário hipotético de exemplo
22
• A empresa FacAfiada, do setor industrial, quer
automatizar o processo de registro de boletos
recebidos de seus fornecedores
• Cada fornecedor tem seu formato de documento
e seu layout
• Esse processo pode ser demorado, propenso a
erros humanos e caro;
Cenário hipotético de exemplo
Fonte do
Documento
Todo processo de identificação e
extração é feito pelos funcionários
Enviados por
email,
scanneados
Verificar &
Registrar
Sistemas de
registro
23
Triagem
2 min
As-is do cenário hipotético
1. Documentos chegam por email;
2. Funcionário leva 12min por documento;
3. 20.000h gastas para processar 100.000 documentos.
Fonte do
Documento
As-is do processamento do documento
Enviados por
email,
scanneados
Verificar &
Registrar
Sistemas de
registro
Processo
10 min
100% 100.000 docs*12min
manual = 20.000 hrs
Volume=100.000
24
Triagem
2 min
As-is do cenário hipotético
1. Documentos chegam por email;
2. Funcionário leva 12min por documento;
3. 20.000h gastas para processar 100.000 documentos.
Fonte do
Documento
As-is do processamento do documento
&
Tempo médio de processo
Enviados por
email,
scanneados
Verificar &
Registrar
Sistemas de
registro
O valor da solução normalmente é medido em...
Verificar &
Registrar
Taxa de Processamento direto
Straight through processing (STP) rate
Relacionado com o tempo de Valor
Processo
10 min
100% 100.000 docs*12min
manual = 20.000 hrs
Volume=100.000
Fonte do
Documento
25
Cálculo do valor gerado
Taxa de
Processamento
Direto (STP)
Frequência
de Humano
no ciclo
(HITL)
100%
Documentos
descartados
&
Tempo médio de processo
Fonte de
Documento
Verificar &
Registrar
Taxa de Processamento direto
26
Cálculo do valor gerado
Taxa de
Processamento
Direto (STP)
Frequência
de Humano
no ciclo
(HITL)
Tempo médio
de validação
(AHT)
100%
FTE time
Documentos
descartados
&
Tempo médio de processo
Fonte de
Documento
Verificar &
Registrar
Taxa de Processamento direto
CÁLCULO
FUNDAMENTAL
DE VALOR
Frequência
de Humano
no ciclo
(HITL)
27
Exemplo do cálculo de valor
Destino do
Boleto
Fonte do
Documento
Clientes /
fornecedores
CoE Especialistas
Do negócio
Validação intuitiva
(eficiente)
1
min
Validação
Humana
Necessária
Validação
Automatizada
Lógica /
Depara
Sistema de
registro
Extração
com ML
28
Exemplo do cálculo de valor
1min*100,000 = 1667 hrs
92% redução
Se 100%
Validação
humana
1min*50,000 = 833 hrs
96% redução
100,000 docs*12min
= 20,000 hrs
100%
manual
Destino do
Boleto
Fonte do
Documento
Clientes /
fornecedores
CoE Especialistas
Do negócio
Validação intuitiva
(eficiente)
1
min
Validação
Humana
Necessária
Validação
Automatizada
Lógica /
Depara
Sistema de
registro
Extração
com ML
Se 50%
Validação
humana
Como ele funciona?
Parte II
31
Framework
32
Framework
Taxonomia Digitize Classify Extract Validate Export
33
Taxonomia Digitize Classify Extract Validate Export
• Define os tipos de documentos da automação;
• Define os campos extraídos de cada documento.
De Boletos bancários, eu quero extrair:
- Nome do Banco (texto);
- Código de barras (texto);
- Data do vencimento (data);
- Valor total (número)
BancoBom
BancoBom
34
Digitize
Taxonomia Digitize Classify Extract Validate Export
• Usa OCR para identificar textos e suas posições;
• É possível utilizar vários tipos de OCR.
BancoBom
BancoBom
35
Digitize Classify Extract Validate Export
Taxonomia
• Identifica o tipo de documento.
• Uso de modelos de classificação
• Há validação de regras de negócios
BancoBom
BancoBom
Com base nos textos identificados, o
classificador retorna uma % de
chance de um arquivo ser referente a
um documento definido na taxonomia.
36
Valores extraídos:
- Nome do Banco = BancoBom
- Código de barras = 23791.11103 6000...
- Data do vencimento = 2011-01-25
- Valor total = 20000000,00
Digitize Classify Extract Validate Export
Taxonomia
• Extrai as informações lidas no documento.
• Uso de modelos de extração
• Há validação de regras de negócios
BancoBom
BancoBom
37
Digitize Classify Extract Validate Export
Taxonomia
• Quando necessário, pede ajuda para um
humano validar a classificação e/ou extração;
• Permite retreino dos modelos;
Valores extraídos:
- Nome do Banco = BancoBom
- Código de barras = 23791.11103 6000...
- Data do vencimento = 2011-01-29
- Valor total = 20000000,00
BancoBom
BancoBom
38
Em json:
{"Nome do Banco":" BancoBom“, “Código
de barras”: “23791.11103 6000...”, “Data
do vencimento”: “2011-01-29”, “Valor
total”: 20000000.00}
Em excel:
Digitize Classify Extract Validate Export
Taxonomia
• Exporta os dados extraídos para uso posterior;
• Enviar para uma queue, salvar em excel,
mandar um json para outro sistema...
39
Framework

Weitere ähnliche Inhalte

Ähnlich wie Do papel ao digital com Document Understanding

Forca de Digital & RPA
Forca de Digital & RPAForca de Digital & RPA
Forca de Digital & RPAEduardo Britto
 
Produtividade das Engenharias
Produtividade das EngenhariasProdutividade das Engenharias
Produtividade das EngenhariasNilo Guimaraes
 
Robotic Process Automation - Desafios dos Projetos de Automação [Semana das M...
Robotic Process Automation - Desafios dos Projetos de Automação [Semana das M...Robotic Process Automation - Desafios dos Projetos de Automação [Semana das M...
Robotic Process Automation - Desafios dos Projetos de Automação [Semana das M...Kelly Sganderla
 
Engenharia de Software - Unimep/Pronatec - Aula 4
Engenharia de Software - Unimep/Pronatec - Aula 4Engenharia de Software - Unimep/Pronatec - Aula 4
Engenharia de Software - Unimep/Pronatec - Aula 4André Phillip Bertoletti
 
BPM Day SP 2018 - O Impacto das Capacidades Robóticas nos Processos das Organ...
BPM Day SP 2018 - O Impacto das Capacidades Robóticas nos Processos das Organ...BPM Day SP 2018 - O Impacto das Capacidades Robóticas nos Processos das Organ...
BPM Day SP 2018 - O Impacto das Capacidades Robóticas nos Processos das Organ...Eduardo Britto
 
RPA - Apresentação Conceitual - iProcess
RPA - Apresentação Conceitual - iProcessRPA - Apresentação Conceitual - iProcess
RPA - Apresentação Conceitual - iProcessEduardo Britto
 
Tendências e Possibilidades do Mercado de Digitalização de Documentos
Tendências e Possibilidades do Mercado de Digitalização de DocumentosTendências e Possibilidades do Mercado de Digitalização de Documentos
Tendências e Possibilidades do Mercado de Digitalização de DocumentosGomaq
 
Robotic Process Automation (RPA) - Apresentação Conceitual
Robotic Process Automation (RPA) - Apresentação ConceitualRobotic Process Automation (RPA) - Apresentação Conceitual
Robotic Process Automation (RPA) - Apresentação ConceitualEduardo Britto
 
RPA - Portfólio de Serviços iProcess com RPA uiPath
RPA - Portfólio de Serviços iProcess com RPA uiPathRPA - Portfólio de Serviços iProcess com RPA uiPath
RPA - Portfólio de Serviços iProcess com RPA uiPathEduardo Britto
 
UiPathChapter_Introducao_ao_RPA_v1.0.pptx
UiPathChapter_Introducao_ao_RPA_v1.0.pptxUiPathChapter_Introducao_ao_RPA_v1.0.pptx
UiPathChapter_Introducao_ao_RPA_v1.0.pptxMarceloCruz310283
 
Apresentação impeto
Apresentação impetoApresentação impeto
Apresentação impetoImpeto Web
 
RPA - Apresentação Conceitual com uiPath
RPA - Apresentação Conceitual com uiPathRPA - Apresentação Conceitual com uiPath
RPA - Apresentação Conceitual com uiPathEduardo Britto
 
O papel do Arquiteto de Soluções na RPA.
O papel do Arquiteto de Soluções na RPA.O papel do Arquiteto de Soluções na RPA.
O papel do Arquiteto de Soluções na RPA.Sergio Marmilicz
 
01 14092011-1530-paulo-carneiro
01 14092011-1530-paulo-carneiro01 14092011-1530-paulo-carneiro
01 14092011-1530-paulo-carneiroguiabusinessmedia
 
RPA - Portfólio de Serviços iProcess
RPA - Portfólio de Serviços iProcessRPA - Portfólio de Serviços iProcess
RPA - Portfólio de Serviços iProcessEduardo Britto
 
Software de impressão segura por biometria - Thiarlei - Impressão Gerenciada
Software de impressão segura por biometria - Thiarlei - Impressão GerenciadaSoftware de impressão segura por biometria - Thiarlei - Impressão Gerenciada
Software de impressão segura por biometria - Thiarlei - Impressão GerenciadaThiarlei Macedo
 
IBM - Portal & Colaboracao
IBM - Portal & Colaboracao IBM - Portal & Colaboracao
IBM - Portal & Colaboracao Francis Ricalde
 
Menos teste e mais qualidade - como equilibrar essa equação?
Menos teste e mais qualidade - como equilibrar essa equação?Menos teste e mais qualidade - como equilibrar essa equação?
Menos teste e mais qualidade - como equilibrar essa equação?Igor Abade
 

Ähnlich wie Do papel ao digital com Document Understanding (20)

Forca de Digital & RPA
Forca de Digital & RPAForca de Digital & RPA
Forca de Digital & RPA
 
Produtividade das Engenharias
Produtividade das EngenhariasProdutividade das Engenharias
Produtividade das Engenharias
 
Robotic Process Automation - Desafios dos Projetos de Automação [Semana das M...
Robotic Process Automation - Desafios dos Projetos de Automação [Semana das M...Robotic Process Automation - Desafios dos Projetos de Automação [Semana das M...
Robotic Process Automation - Desafios dos Projetos de Automação [Semana das M...
 
Engenharia de Software - Unimep/Pronatec - Aula 4
Engenharia de Software - Unimep/Pronatec - Aula 4Engenharia de Software - Unimep/Pronatec - Aula 4
Engenharia de Software - Unimep/Pronatec - Aula 4
 
BPM Day SP 2018 - O Impacto das Capacidades Robóticas nos Processos das Organ...
BPM Day SP 2018 - O Impacto das Capacidades Robóticas nos Processos das Organ...BPM Day SP 2018 - O Impacto das Capacidades Robóticas nos Processos das Organ...
BPM Day SP 2018 - O Impacto das Capacidades Robóticas nos Processos das Organ...
 
RPA - Apresentação Conceitual - iProcess
RPA - Apresentação Conceitual - iProcessRPA - Apresentação Conceitual - iProcess
RPA - Apresentação Conceitual - iProcess
 
iColabora_Turbina
iColabora_TurbinaiColabora_Turbina
iColabora_Turbina
 
Tendências e Possibilidades do Mercado de Digitalização de Documentos
Tendências e Possibilidades do Mercado de Digitalização de DocumentosTendências e Possibilidades do Mercado de Digitalização de Documentos
Tendências e Possibilidades do Mercado de Digitalização de Documentos
 
Robotic Process Automation (RPA) - Apresentação Conceitual
Robotic Process Automation (RPA) - Apresentação ConceitualRobotic Process Automation (RPA) - Apresentação Conceitual
Robotic Process Automation (RPA) - Apresentação Conceitual
 
RPA - Portfólio de Serviços iProcess com RPA uiPath
RPA - Portfólio de Serviços iProcess com RPA uiPathRPA - Portfólio de Serviços iProcess com RPA uiPath
RPA - Portfólio de Serviços iProcess com RPA uiPath
 
UiPathChapter_Introducao_ao_RPA_v1.0.pptx
UiPathChapter_Introducao_ao_RPA_v1.0.pptxUiPathChapter_Introducao_ao_RPA_v1.0.pptx
UiPathChapter_Introducao_ao_RPA_v1.0.pptx
 
Apresentação impeto
Apresentação impetoApresentação impeto
Apresentação impeto
 
RPA - Apresentação Conceitual com uiPath
RPA - Apresentação Conceitual com uiPathRPA - Apresentação Conceitual com uiPath
RPA - Apresentação Conceitual com uiPath
 
Unidade 2 - o Computador e seus Componentes
Unidade 2 - o Computador e seus ComponentesUnidade 2 - o Computador e seus Componentes
Unidade 2 - o Computador e seus Componentes
 
O papel do Arquiteto de Soluções na RPA.
O papel do Arquiteto de Soluções na RPA.O papel do Arquiteto de Soluções na RPA.
O papel do Arquiteto de Soluções na RPA.
 
01 14092011-1530-paulo-carneiro
01 14092011-1530-paulo-carneiro01 14092011-1530-paulo-carneiro
01 14092011-1530-paulo-carneiro
 
RPA - Portfólio de Serviços iProcess
RPA - Portfólio de Serviços iProcessRPA - Portfólio de Serviços iProcess
RPA - Portfólio de Serviços iProcess
 
Software de impressão segura por biometria - Thiarlei - Impressão Gerenciada
Software de impressão segura por biometria - Thiarlei - Impressão GerenciadaSoftware de impressão segura por biometria - Thiarlei - Impressão Gerenciada
Software de impressão segura por biometria - Thiarlei - Impressão Gerenciada
 
IBM - Portal & Colaboracao
IBM - Portal & Colaboracao IBM - Portal & Colaboracao
IBM - Portal & Colaboracao
 
Menos teste e mais qualidade - como equilibrar essa equação?
Menos teste e mais qualidade - como equilibrar essa equação?Menos teste e mais qualidade - como equilibrar essa equação?
Menos teste e mais qualidade - como equilibrar essa equação?
 

Do papel ao digital com Document Understanding

  • 1. Do papel ao Digital com Document Understanding Samuel Simão
  • 2. 2 Desenvolvedor RPA UiARD UiPath samuelsimao47@gmail.com Samuel Simão Palestrante
  • 3. 3 1. Parte I – O que é Document Understanding? • O que ele pode fazer? • Quais benefícios podemos alcançar? • Cenário de exemplo do UiPath AI Summit 2. Parte II – Como ele funciona? • Etapas do framework 3. Parte III – Prática dentro do UiPath Studio Sumário
  • 4. O que é Document Understanding? Parte I
  • 5. 6 O que é o Document Understanding?
  • 6. 7 • Ferramenta da UiPath para leitura de documentos; O que é o Document Understanding?
  • 7. 8 • Ferramenta da uipath para leitura de documentos; • Baseado em tecnologias de OCR, NLP e Machine Learning; O que é o Document Understanding? OCR NLP ML =
  • 8. 9 • Ferramenta da uipath para leitura de documentos; • Baseado em tecnologias de OCR, NLP e Machine Learning; • Permite utilização de modelos pré-treinados ou uso dos seus próprios modelos. O que é o Document Understanding? OCR NLP ML =
  • 9. 11 O que ele é capaz de fazer?
  • 10. 12 • Lidar com documentos estruturados, semi- estruturados e não estruturados; O que ele é capaz de fazer? Formulários Identidades Passaportes Estruturados
  • 11. 13 • Lidar com documentos estruturados, semi- estruturados e não estruturados; O que ele é capaz de fazer? Faturas Ordens de Compra Contas Semi-Estruturados
  • 12. 14 • Lidar com documentos estruturados, semi- estruturados e não estruturados; O que ele é capaz de fazer? Não-Estruturados Contratos Registros de Saúde Emails
  • 13. 15 • Lidar com documentos estruturados, semi- estruturados e não estruturados; • Documentos escaneados, rotacionados O que ele é capaz de fazer?
  • 14. 16 • Lidar com documentos estruturados, semi- estruturados e não estruturados; • Documentos escaneados, rotacionados • Escritos a mão, assinados O que ele é capaz de fazer?
  • 15. 17 • Lidar com documentos estruturados, semi- estruturados e não estruturados; • Documentos escaneados, rotacionados • Escritos a mão, assinados • Extenções de arquivos pdf, jpeg, png, etc O que ele é capaz de fazer?
  • 16. 18 • Lidar com documentos estruturados, semi- estruturados e não estruturados; • Documentos escaneados, rotacionados • Escritos a mão, assinados • Extenções de arquivos pdf, jpeg, png, etc • Validação humana O que ele é capaz de fazer?
  • 17. 19 Que benefícios podem ser alcançados?
  • 18. 20 • Tempos de processamento mais rápidos • Menos erros humanos • Redução de gargalo por aprovação de documentos Que benefícios podem ser alcançados? Velocidade Acurácia Rentável
  • 20. 22 • A empresa FacAfiada, do setor industrial, quer automatizar o processo de registro de boletos recebidos de seus fornecedores • Cada fornecedor tem seu formato de documento e seu layout • Esse processo pode ser demorado, propenso a erros humanos e caro; Cenário hipotético de exemplo Fonte do Documento Todo processo de identificação e extração é feito pelos funcionários Enviados por email, scanneados Verificar & Registrar Sistemas de registro
  • 21. 23 Triagem 2 min As-is do cenário hipotético 1. Documentos chegam por email; 2. Funcionário leva 12min por documento; 3. 20.000h gastas para processar 100.000 documentos. Fonte do Documento As-is do processamento do documento Enviados por email, scanneados Verificar & Registrar Sistemas de registro Processo 10 min 100% 100.000 docs*12min manual = 20.000 hrs Volume=100.000
  • 22. 24 Triagem 2 min As-is do cenário hipotético 1. Documentos chegam por email; 2. Funcionário leva 12min por documento; 3. 20.000h gastas para processar 100.000 documentos. Fonte do Documento As-is do processamento do documento & Tempo médio de processo Enviados por email, scanneados Verificar & Registrar Sistemas de registro O valor da solução normalmente é medido em... Verificar & Registrar Taxa de Processamento direto Straight through processing (STP) rate Relacionado com o tempo de Valor Processo 10 min 100% 100.000 docs*12min manual = 20.000 hrs Volume=100.000 Fonte do Documento
  • 23. 25 Cálculo do valor gerado Taxa de Processamento Direto (STP) Frequência de Humano no ciclo (HITL) 100% Documentos descartados & Tempo médio de processo Fonte de Documento Verificar & Registrar Taxa de Processamento direto
  • 24. 26 Cálculo do valor gerado Taxa de Processamento Direto (STP) Frequência de Humano no ciclo (HITL) Tempo médio de validação (AHT) 100% FTE time Documentos descartados & Tempo médio de processo Fonte de Documento Verificar & Registrar Taxa de Processamento direto CÁLCULO FUNDAMENTAL DE VALOR Frequência de Humano no ciclo (HITL)
  • 25. 27 Exemplo do cálculo de valor Destino do Boleto Fonte do Documento Clientes / fornecedores CoE Especialistas Do negócio Validação intuitiva (eficiente) 1 min Validação Humana Necessária Validação Automatizada Lógica / Depara Sistema de registro Extração com ML
  • 26. 28 Exemplo do cálculo de valor 1min*100,000 = 1667 hrs 92% redução Se 100% Validação humana 1min*50,000 = 833 hrs 96% redução 100,000 docs*12min = 20,000 hrs 100% manual Destino do Boleto Fonte do Documento Clientes / fornecedores CoE Especialistas Do negócio Validação intuitiva (eficiente) 1 min Validação Humana Necessária Validação Automatizada Lógica / Depara Sistema de registro Extração com ML Se 50% Validação humana
  • 29. 32 Framework Taxonomia Digitize Classify Extract Validate Export
  • 30. 33 Taxonomia Digitize Classify Extract Validate Export • Define os tipos de documentos da automação; • Define os campos extraídos de cada documento. De Boletos bancários, eu quero extrair: - Nome do Banco (texto); - Código de barras (texto); - Data do vencimento (data); - Valor total (número) BancoBom BancoBom
  • 31. 34 Digitize Taxonomia Digitize Classify Extract Validate Export • Usa OCR para identificar textos e suas posições; • É possível utilizar vários tipos de OCR. BancoBom BancoBom
  • 32. 35 Digitize Classify Extract Validate Export Taxonomia • Identifica o tipo de documento. • Uso de modelos de classificação • Há validação de regras de negócios BancoBom BancoBom Com base nos textos identificados, o classificador retorna uma % de chance de um arquivo ser referente a um documento definido na taxonomia.
  • 33. 36 Valores extraídos: - Nome do Banco = BancoBom - Código de barras = 23791.11103 6000... - Data do vencimento = 2011-01-25 - Valor total = 20000000,00 Digitize Classify Extract Validate Export Taxonomia • Extrai as informações lidas no documento. • Uso de modelos de extração • Há validação de regras de negócios BancoBom BancoBom
  • 34. 37 Digitize Classify Extract Validate Export Taxonomia • Quando necessário, pede ajuda para um humano validar a classificação e/ou extração; • Permite retreino dos modelos; Valores extraídos: - Nome do Banco = BancoBom - Código de barras = 23791.11103 6000... - Data do vencimento = 2011-01-29 - Valor total = 20000000,00 BancoBom BancoBom
  • 35. 38 Em json: {"Nome do Banco":" BancoBom“, “Código de barras”: “23791.11103 6000...”, “Data do vencimento”: “2011-01-29”, “Valor total”: 20000000.00} Em excel: Digitize Classify Extract Validate Export Taxonomia • Exporta os dados extraídos para uso posterior; • Enviar para uma queue, salvar em excel, mandar um json para outro sistema...