- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- 990 - Pacote de ML - Prévia
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Passaportes - Pacote de ML
- Contracheques — Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos – Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Requisitos de Hardware
- Pipelines
- Document Manager
- Serviços de OCR
- Idiomas suportados
- Aprendizagem profunda
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Licenciamento
- Atividades
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Guia do usuário do Document Understanding.
A caixa de diálogo Importar dados permite importar facilmente novos documentos para serem rotulados ou revisados.
Selecione o botão Importar na barra de gerenciamento.
A caixa de diálogo contém os seguintes controles:
- Campo de texto Batch name - é obrigatório inserir um nome para sua exportação, caso contrário, a seção Procurar ou arrastar arquivos será desabilitada; um nome válido pode ter até 24 caracteres e não deve conter caracteres especiais.
- Caixa de seleção Faça deste um conjunto de avaliação - se selecionada, o conjunto de dados é usado para fins de avaliação.
- Seção Procurar ou soltar arquivos – selecione Procurar arquivos para carregar para navegar pelo seu diretório ou simplesmente arraste e solte os arquivos dentro do quadro.
-
Seção de Status – selecione (carregar o log de importação anterior) para verificar o status da importação mais recente; ao carregar dados, na seção de Status, você recebe uma visão geral de seus arquivos e é solicitado a prosseguir com a importação selecionando SIM ou abortar a importação selecionando CANCELAR.
Existem 4 tipos de importação suportados no Document Manager:
- Importação de esquema
- Importação de documentos brutos (máximo de 2000 páginas e 4000 MiB por importação)
- Importação de conjunto de dados do Document Manager (4000 MiB por importação)
- Importação de conjunto de dados da Estação de Validação (máximo de 2000 páginas e 4000 MiB por importação)
Importação de esquema
Se deseja iniciar uma nova sessão no Document Manager usando o mesmo esquema de uma sessão existente, siga estas etapas:
- Selecione o botão Exportar na barra de gerenciamento.
- Na caixa de diálogo Exportar arquivos, marque a opção Esquema.
- Selecione o botão Exportar dentro da caixa de diálogo. Um
.zip
arquivo é exportado. arquivo - Selecione o botão Importar na barra de gerenciamento.
- Carregue ou arraste e solte o arquivo
.zip
diretamente na nova sessão do Document Manager (não descompacte). Nesta etapa, você também pode fazer upload de um esquema predefinido. - Selecione SIM na seção de Status para prosseguir com a importação. O esquema é importado.
A importação de esquema agora pode ser aplicada para campos de vários valores.
Importação de documentos brutos
.pdf
, .tiff
, .png
, .jpg
.
.zip
não são suportados para importação de documentos brutos.
As configurações de OCR precisam ser definidas antes da importação.
Importação do conjunto de dados do Document Manager
.zip
que foi exportado originalmente e importá-lo diretamente para a nova instância do Document Manager.
Se sua nova instância do Document Manager estiver completamente vazia (sem dados e sem campos definidos), os documentos com rótulos e o esquema serão importados.
Se sua nova instância do Document Manager já tiver campos definidos, o conjunto de dados recém-importado precisará ter os mesmos campos ou um subconjunto desses campos. Caso contrário, a importação será rejeitada.
- Descompacte o arquivo do conjunto de dados.
- Edite o arquivo
scheman.json
do arquivo. - Remova todas as propriedades
display_name
do arquivojson
e salve-o. - Compacte o conjunto de dados de volta e importe-o para a sessão no local.
Dividir grandes conjuntos de dados
.zip
em vários arquivos .zip
menores que 1 GB e com menos de 1500 arquivos.
Importação do conjunto de dados do Validation Station
Como seu fluxo de trabalho de RPA processa documentos usando um modelo de ML existente, alguns documentos podem exigir validação manual usando a atividade Estação de Validação (disponível em robôs attended ou no navegador usando o Orchestrator Action Center).
Os dados validados gerados na Validation Station podem ser exportados usando a atividade Machine Learning Extractor Trainer e podem ser usados para treinar modelos de ML.
- Configure o Machine Learning Extractor Trainer para gerar dados em uma pasta com caminho
<Trainer/Output/Folder>
(use qualquer caminho de pasta vazio). - Execute um fluxo de trabalho de RPA, incluindo o Validation Station e o Machine Learning Extractor Trainer.
- O Machine Learning Extractor Trainer cria três subpastas: documents, metadata e predictions dentro da pasta output.
- Compacte o arquivo
<Trainer/Output/Folder>
para obter um arquivo.zip
, por exemplo TrainerOutputFolder.zip. - Importe o arquivo
.zip
para o Document Manager, que detecta que a importação contém dados produzidos pelo Machine Learning Extractor Trainer e importa os dados de acordo.
Se houver campos ausentes exigidos pelo conjunto de dados, uma mensagem de erro será exibida na caixa de diálogo de importação.