- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Como extrair dados de recibos
- Faturas retreinadas com um campo adicional
- Como extrair dados de formulários
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 4506T - Pacote de ML
- 990 - Pacote de ML - Prévia
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Passaportes - Pacote de ML
- Contracheques — Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Requisitos de Hardware
- Pipelines
- Document Manager
- Serviços de OCR
- Aprendizagem profunda
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Licenciamento
- Atividades
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Como extrair dados de recibos
O objetivo desta página é ajudar os usuários iniciantes a se familiarizarem com o Document Understanding.
Para implantações de produção escaláveis, é altamente recomendável usar o Document Understanding Process disponível no UiPath Studio na seção Modelos.
Este início rápido mostra como extrair dados de recibos usando o modelo de ML Recibos pronto para uso com seu endpoint público correspondente.
A validação pode ser feita a partir do Validation Station ou usando o Validation Action no Action Center. Ambas as opções são descritas nas seções a seguir.
Nesta seção, vamos validar os resultados da extração usando o Validation Station.
Para criar um fluxo de trabalho básico usando o Modelo de ML de Recibos, siga as etapas abaixo.
- Crie um processo em branco
- Instale os pacotes de atividades exigidos
- Crie uma taxonomia
- Digitalize o documento
- Extraia os dados usando o modelo de ML de Recibos
- Valide os resultados usando o Validation Station
- Exporte os resultados da extração
Agora, vamos ver cada passo em detalhes.
- Execute o UiPath Studio.
- Em INÍCIO, no modo de exibição Backstage, clique em Processo para criar um projeto.
- A janela Novo processo em branco é exibida. Nesta janela, insira um nome para o novo projeto. Se desejar, você também pode adicionar uma descrição para classificar seus projetos com mais facilidade.
- Clique em Criar. O novo projeto será aberto no Studio.
No botão Gerenciar Pacotes na faixa de opções, além dos pacotes de atividades principais (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) que são adicionados ao projeto por padrão, instale o seguintes pacotes de atividades:
Depois que os pacotes de atividades estiverem instalados, liste os campos obrigatórios. O modelo de ML de Recibos suporta a extração de dados para os campos abaixo:
- name -
Text
- vendor-addr -
Address
- total -
Number
- date -
Date
- phone -
Text
- currency -
Text
- expense-type -
Text
- items -
Table
- description -
Text
- line-amount -
Number
- unit-price -
Number
- quantity -
Number
- description -
Abra o Gerenciador de Taxonomia e crie um grupo chamado Documentos Semiestruturados, uma categoria chamada Finanças e um tipo de documento chamado Recibos. Crie os campos listados acima com nomes amigáveis com os respectivos tipos de dados.
- No arquivo Main.xaml, adicione uma atividade Carregar taxonomia e crie uma variável para a saída da taxonomia.
- Adicione uma atividade Digitize Document com UiPath Document OCR. Forneça a propriedade de entrada Caminho do Documento e crie variáveis de saída para Texto do Documento e Modelo de Objeto do Documento.
- Lembre-se de adicionar a Chave de API do Document Understanding na atividade UiPath Document OCR.
- Adicione uma atividade de Data Extraction Scope e preencha as propriedades.
- Arraste e solte uma atividade do Machine Learning Extractor. Um pop-up com três parâmetros de entrada, Endpoint, Habilidade de ML e ApiKey, é exibido na tela.
- Preencha o parâmetro Ponto de extremidade com o Ponto de extremidade Receipts Public, ou seja
https://du.uipath.com/ie/receipts
, e forneça a chave de API do Document Understanding. - Clique em Obter capacidades.
- O próximo passo é configurar o extrator. Configurar o extrator significa mapear os campos que você criou no Gerenciador de Taxonomia para os campos disponíveis no modelo de ML como mostrado na imagem abaixo:
- Para usar o Machine Learning Extractor com uma Habilidade de ML, escolha a Habilidade de ML na lista suspensa e configure o extrator.
- Você deve ter seu robô assistente conectado ao mesmo tenant que sua Habilidade de ML.
Para verificar os resultados através do Validation Station, arraste e solte a atividade Present Validation Station e forneça os detalhes de entrada.
DataSet
que contém várias tabelas que podem ser gravadas em um arquivo Excel ou usadas diretamente em um processo downstream.
Baixe este projeto de exemplo usando este link.
O exemplo contém dois fluxos de trabalho:
- Main.xaml - neste fluxo de trabalho, os resultados da extração são validados usando o Validation Station; isso está descrito na seção acima
- Main - Unattended.xaml - neste fluxo de trabalho, os resultados da extração são validados usando a Validation Action; isso é descrito na seção a seguir
Agora, vamos ver como usar uma Validation Action (ação de validação) do Action Center em vez de utilizar o Validation Station.
Quando uma automação inclui decisões que um humano deve tomar, como aprovações, escalações e exceções, o UiPath Action Center torna fácil e eficiente a transferência do processo de robô para humano. E de volta para o robô.
As atividades do Action Center do Document Understanding vêm com o pacote UiPath.IntelligentOCR.Activities e o pacote UiPath.Persistance.Activities. Não se esqueça de habilitar atividades de Persistência nas Configurações Gerais do UiPath Studio:
A produtividade pode ser aumentada adicionando um processo de orquestração que adiciona ações de validação de documentos no Action Center, tanto no On-Premisse Orchestrator quanto na Automation Cloud. Essa ação reduz a necessidade de armazenar os documentos localmente, ter um robô instalado em cada máquina operada por humanos ou obrigar o robô a esperar que os usuários humanos terminem a validação.
Mais detalhes aqui.
Repita as etapas 1 a 5 descritas na seção acima.
Em seguida, em vez de usar a atividade Present Validation Station, use as atividades Create Document Validation Action e Wait for Document Validation Action e Resume.
A imagem abaixo mostra a atividade Create Document Validation Action e suas propriedades.
Isso cria uma ação de validação de documento no Action Center. O produto de saída da atividade Create Document Validation Action pode ser usado com a atividade Wait for Document Validation Action and Resume para suspender e retomar fluxos de trabalho de orquestração após a conclusão da ação humana no Action Center.
- Usando o modelo de ML de Recibos com o Endpoint Público e o Validation Station
- 1. Crie um processo em branco
- 2. Instale os pacotes de atividades exigidos
- 3. Crie uma taxonomia
- 4. Digitalize o documento
- 5. Extraia os dados usando o modelo de ML de Recibos
- 6. Valide os resultados usando o Validation Station
- 7. Exporte os resultados da extração
- Baixe o exemplo
- Usando o modelo de ML de Recibos com Endpoint Público e Validation Action
- Como funcionam as tarefas no Action Center?
- Como funciona o Validation Action?
- Como usar o Validation Action?