O documento descreve o framework do Document Understanding da UiPath, que permite a leitura e extração de informações de documentos digitais. O framework inclui etapas de taxonomia, digitalização, classificação, extração, validação e exportação de dados, utilizando tecnologias como OCR, NLP e machine learning. Isso permite a automação do processamento de documentos de forma rápida, precisa e escalável.
3. 3
1. Parte I – O que é Document Understanding?
• O que ele pode fazer?
• Quais benefícios podemos alcançar?
• Cenário de exemplo do UiPath AI Summit
2. Parte II – Como ele funciona?
• Etapas do framework
3. Parte III – Prática dentro do UiPath Studio
Sumário
6. 7
• Ferramenta da UiPath para leitura de
documentos;
O que é o Document Understanding?
7. 8
• Ferramenta da uipath para leitura de
documentos;
• Baseado em tecnologias de OCR, NLP e
Machine Learning;
O que é o Document Understanding?
OCR NLP ML
=
8. 9
• Ferramenta da uipath para leitura de
documentos;
• Baseado em tecnologias de OCR, NLP e
Machine Learning;
• Permite utilização de modelos pré-treinados ou
uso dos seus próprios modelos.
O que é o Document Understanding?
OCR NLP ML
=
10. 12
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
O que ele é capaz de fazer?
Formulários Identidades Passaportes
Estruturados
11. 13
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
O que ele é capaz de fazer?
Faturas Ordens de
Compra
Contas
Semi-Estruturados
12. 14
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
O que ele é capaz de fazer?
Não-Estruturados
Contratos Registros
de Saúde
Emails
13. 15
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
• Documentos escaneados, rotacionados
O que ele é capaz de fazer?
14. 16
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
• Documentos escaneados, rotacionados
• Escritos a mão, assinados
O que ele é capaz de fazer?
15. 17
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
• Documentos escaneados, rotacionados
• Escritos a mão, assinados
• Extenções de arquivos pdf, jpeg, png, etc
O que ele é capaz de fazer?
16. 18
• Lidar com documentos estruturados, semi-
estruturados e não estruturados;
• Documentos escaneados, rotacionados
• Escritos a mão, assinados
• Extenções de arquivos pdf, jpeg, png, etc
• Validação humana
O que ele é capaz de fazer?
18. 20
• Tempos de processamento mais rápidos
• Menos erros humanos
• Redução de gargalo por aprovação de
documentos
Que benefícios podem ser alcançados?
Velocidade Acurácia Rentável
20. 22
• A empresa FacAfiada, do setor industrial, quer
automatizar o processo de registro de boletos
recebidos de seus fornecedores
• Cada fornecedor tem seu formato de documento
e seu layout
• Esse processo pode ser demorado, propenso a
erros humanos e caro;
Cenário hipotético de exemplo
Fonte do
Documento
Todo processo de identificação e
extração é feito pelos funcionários
Enviados por
email,
scanneados
Verificar &
Registrar
Sistemas de
registro
21. 23
Triagem
2 min
As-is do cenário hipotético
1. Documentos chegam por email;
2. Funcionário leva 12min por documento;
3. 20.000h gastas para processar 100.000 documentos.
Fonte do
Documento
As-is do processamento do documento
Enviados por
email,
scanneados
Verificar &
Registrar
Sistemas de
registro
Processo
10 min
100% 100.000 docs*12min
manual = 20.000 hrs
Volume=100.000
22. 24
Triagem
2 min
As-is do cenário hipotético
1. Documentos chegam por email;
2. Funcionário leva 12min por documento;
3. 20.000h gastas para processar 100.000 documentos.
Fonte do
Documento
As-is do processamento do documento
&
Tempo médio de processo
Enviados por
email,
scanneados
Verificar &
Registrar
Sistemas de
registro
O valor da solução normalmente é medido em...
Verificar &
Registrar
Taxa de Processamento direto
Straight through processing (STP) rate
Relacionado com o tempo de Valor
Processo
10 min
100% 100.000 docs*12min
manual = 20.000 hrs
Volume=100.000
Fonte do
Documento
23. 25
Cálculo do valor gerado
Taxa de
Processamento
Direto (STP)
Frequência
de Humano
no ciclo
(HITL)
100%
Documentos
descartados
&
Tempo médio de processo
Fonte de
Documento
Verificar &
Registrar
Taxa de Processamento direto
24. 26
Cálculo do valor gerado
Taxa de
Processamento
Direto (STP)
Frequência
de Humano
no ciclo
(HITL)
Tempo médio
de validação
(AHT)
100%
FTE time
Documentos
descartados
&
Tempo médio de processo
Fonte de
Documento
Verificar &
Registrar
Taxa de Processamento direto
CÁLCULO
FUNDAMENTAL
DE VALOR
Frequência
de Humano
no ciclo
(HITL)
25. 27
Exemplo do cálculo de valor
Destino do
Boleto
Fonte do
Documento
Clientes /
fornecedores
CoE Especialistas
Do negócio
Validação intuitiva
(eficiente)
1
min
Validação
Humana
Necessária
Validação
Automatizada
Lógica /
Depara
Sistema de
registro
Extração
com ML
26. 28
Exemplo do cálculo de valor
1min*100,000 = 1667 hrs
92% redução
Se 100%
Validação
humana
1min*50,000 = 833 hrs
96% redução
100,000 docs*12min
= 20,000 hrs
100%
manual
Destino do
Boleto
Fonte do
Documento
Clientes /
fornecedores
CoE Especialistas
Do negócio
Validação intuitiva
(eficiente)
1
min
Validação
Humana
Necessária
Validação
Automatizada
Lógica /
Depara
Sistema de
registro
Extração
com ML
Se 50%
Validação
humana
30. 33
Taxonomia Digitize Classify Extract Validate Export
• Define os tipos de documentos da automação;
• Define os campos extraídos de cada documento.
De Boletos bancários, eu quero extrair:
- Nome do Banco (texto);
- Código de barras (texto);
- Data do vencimento (data);
- Valor total (número)
BancoBom
BancoBom
31. 34
Digitize
Taxonomia Digitize Classify Extract Validate Export
• Usa OCR para identificar textos e suas posições;
• É possível utilizar vários tipos de OCR.
BancoBom
BancoBom
32. 35
Digitize Classify Extract Validate Export
Taxonomia
• Identifica o tipo de documento.
• Uso de modelos de classificação
• Há validação de regras de negócios
BancoBom
BancoBom
Com base nos textos identificados, o
classificador retorna uma % de
chance de um arquivo ser referente a
um documento definido na taxonomia.
33. 36
Valores extraídos:
- Nome do Banco = BancoBom
- Código de barras = 23791.11103 6000...
- Data do vencimento = 2011-01-25
- Valor total = 20000000,00
Digitize Classify Extract Validate Export
Taxonomia
• Extrai as informações lidas no documento.
• Uso de modelos de extração
• Há validação de regras de negócios
BancoBom
BancoBom
34. 37
Digitize Classify Extract Validate Export
Taxonomia
• Quando necessário, pede ajuda para um
humano validar a classificação e/ou extração;
• Permite retreino dos modelos;
Valores extraídos:
- Nome do Banco = BancoBom
- Código de barras = 23791.11103 6000...
- Data do vencimento = 2011-01-29
- Valor total = 20000000,00
BancoBom
BancoBom
35. 38
Em json:
{"Nome do Banco":" BancoBom“, “Código
de barras”: “23791.11103 6000...”, “Data
do vencimento”: “2011-01-29”, “Valor
total”: 20000000.00}
Em excel:
Digitize Classify Extract Validate Export
Taxonomia
• Exporta os dados extraídos para uso posterior;
• Enviar para uma queue, salvar em excel,
mandar um json para outro sistema...