- Visão geral
- Introdução
- Atividades
- Painéis de insights
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Limitações de tráfego
- Configuração de OCR
- Pipelines
- Serviços de OCR
- Idiomas suportados
- Aprendizagem profunda
- Licenciamento
Guia do usuário do Document Understanding.
Importar documentos
A caixa de diálogo Importar dados permite importar facilmente novos documentos para serem rotulados ou revisados.
Clique no botão Importar na barra de gerenciamento.
A caixa de diálogo contém os seguintes controles:
- Campo de texto Batch name - é obrigatório inserir um nome para sua exportação, caso contrário, a seção Procurar ou arrastar arquivos será desabilitada; um nome válido pode ter até 24 caracteres e não deve conter caracteres especiais.
- Caixa de seleção Faça deste um conjunto de avaliação - se selecionada, o conjunto de dados é usado para fins de avaliação.
- Seção Procurar ou arrastar arquivos - clique em Procurar arquivos para fazer upload para navegar pelo seu diretório ou simplesmente arraste e solte os arquivos dentro do quadro.
-
Seção Status - clique em (carregar log de importação anterior) para visualizar o status da última importação; ao fazer upload de dados, na seção Status, você acessa uma visão geral de seus arquivos e é solicitado a prosseguir com a importação clicando em SIM ou abortar a importação clicando em CANCELAR.
Existem 4 tipos de importação suportados no Document Manager:
- Importação de esquema
- Importação de documentos brutos (máximo de 2000 páginas e 4000 MiB por importação)
- Importação de conjunto de dados do Document Manager (4000 MiB por importação)
- Importação de conjunto de dados da Estação de Validação (máximo de 2000 páginas e 4000 MiB por importação)
Se deseja iniciar uma nova sessão no Document Manager usando o mesmo esquema de uma sessão existente, siga estas etapas:
- Clique no botão Exportar na barra de gerenciamento.
- Na caixa de diálogo Exportar arquivos, marque a opção Esquema.
- Clique no botão Exportar dentro da caixa de diálogo. Um arquivo
.zip
é exportado. - Clique no botão Importar na barra de gerenciamento.
- Carregue ou arraste e solte o arquivo
.zip
diretamente na nova sessão do Document Manager (não descompacte). Nesta etapa, você também pode fazer upload de um esquema predefinido. - Clique em SIM na seção Status para prosseguir com a importação. O esquema é importado.
A importação de esquema agora pode ser aplicada para campos de vários valores.
.pdf
, .tiff
, .png
, .jpg
.
.zip
não são suportados para importação de documentos brutos.
As configurações de OCR precisam ser definidas antes da importação.
Siga os passos abaixo:
.zip
que foi exportado originalmente e importá-lo diretamente para a nova instância do Document Manager.
Se sua nova instância do Document Manager estiver completamente vazia (sem dados e sem campos definidos), os documentos com rótulos e o esquema serão importados.
Se sua nova instância do Document Manager já tiver campos definidos, o conjunto de dados recém-importado precisará ter os mesmos campos ou um subconjunto desses campos. Caso contrário, a importação será rejeitada.
- Descompacte o arquivo do conjunto de dados.
- Edite o arquivo
scheman.json
do arquivo. - Remova todas as propriedades
display_name
do arquivojson
e salve-o. - Compacte o conjunto de dados de volta e importe-o para a sessão no local.
Dividir grandes conjuntos de dados
.zip
em vários arquivos .zip
menores que 1 GB e com menos de 1500 arquivos.
Como seu fluxo de trabalho de RPA processa documentos usando um modelo de ML existente, alguns documentos podem exigir validação manual usando a atividade Estação de Validação (disponível em robôs attended ou no navegador usando o Orchestrator Action Center).
Os dados validados gerados na Estação de Validação podem ser exportados usando a atividade Machine Learning Extractor Trainer e podem ser usados para treinar modelos de ML com a funcionalidade descrita abaixo.
Siga os passos abaixo:
- Configure o Machine Learning Extractor Trainer para gerar dados em uma pasta com caminho
<Trainer/Output/Folder>
(use qualquer caminho de pasta vazio). - Execute um fluxo de trabalho de RPA, incluindo o Validation Station e o Machine Learning Extractor Trainer.
- O Machine Learning Extractor Trainer cria três subpastas: documents, metadata e predictions dentro da pasta output.
- Compacte o arquivo
<Trainer/Output/Folder>
para obter um arquivo.zip
, por exemplo TrainerOutputFolder.zip. - Importe o arquivo
.zip
para o Document Manager, que detecta que a importação contém dados produzidos pelo Machine Learning Extractor Trainer e importa os dados de acordo.
Se houver campos ausentes exigidos pelo conjunto de dados, uma mensagem de erro será exibida na caixa de diálogo de importação.