- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 4506T - Pacote de ML
- 990 - Pacote de ML - Prévia
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Passaportes - Pacote de ML
- Contracheques — Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Requisitos de Hardware
- Pipelines
- Document Manager
- Serviços de OCR
- Aprendizagem profunda
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Licenciamento
- Atividades
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guia do usuário do Document Understanding.
A interface do usuário
A interface do Document Manager contém os seguintes painéis:
- Barra de gerenciamento
- Campos de coluna
- Campos Regulares
- Campos de Classificação
- Exibição de Documento
Exibidos na parte superior da página no Document Manager.
Permite realizar várias operações: navegar entre documentos, excluir/restaurar um documento, pesquisar/filtrar documentos, executar previsões de modelos de IA, importar e exportar documentos.
Esses são os itens disponíveis na barra de gerenciamento:
Item |
Ícone |
Description |
---|---|---|
Navegação |
|
Navegue entre os documentos que correspondam ao filtro ativo. Entre as duas setas, um contador é exibido. Ele ilustra o número do documento atual do número total de documentos que correspondem à pesquisa/filtro ativo. |
Pesquisar |
|
Existem duas funcionalidades de pesquisa:
|
Excluir / Restaurar |
|
Excluir ou restaurar um documento. Os documentos excluídos podem ser encontrados no filtro excluído. |
Importar |
|
Abra a caixa de diálogo Importar dados. |
Exportar |
|
Abra a caixa de diálogo Exportar arquivos. |
Nome e tipo do documento |
N/A |
O nome do documento atualmente ativo e seu tipo. Há três tipos de documentos:
Os documentos de treinamento e validação fazem parte dos conjuntos de dados de treinamento usados pelos Pipelines de treinamento. Os documentos de avaliação são ignorados pelos pipelines de treinamento e devem ser usados apenas pelos Pipelines de Avaliação no AI Center. Esses documentos são os que foram marcados como de avaliação ao marcar a caixa de seleção Marcar este conjunto como avaliação na caixa de diálogo Importar dados. |
Fazer download |
A opção está disponível na lista suspensa ao lado do nome do documento. Clique no ícone para baixar um arquivo Zip contendo o documento original. Além do documento original, todas as páginas convertidas internamente pelo Document Manager para imagens
.jpeg também são baixadas.
| |
Excluir permanentemente |
A opção está disponível na lista suspensa ao lado do nome do documento. Exclui permanentemente arquivos individuais. As imagens
.pdf e todas as suas imagens .jpeg são excluídas do conjunto de dados do AI Center e todos os metadados são excluídos do banco de dados.
Ao clicar no botão, uma mensagem pop-up é exibida, perguntando se você tem certeza de que deseja excluir permanentemente o documento. Clique em OK para continuar ou Cancelar para voltar à tela anterior. | |
Nome do lote |
N/A |
O nome do lote atual. |
Nome da sessão |
N/A |
O nome da sessão atual. |
Predict |
Execute as previsões do modelo de IA e exiba os resultados. Após configurar a Pré-rotulagem, o botão é habilitado na barra de gerenciamento. Clique nele para pré-rotular o documento atual. | |
Configurações |
Defina as configurações de OCR e Pré-rotulagem ou acesse o painel Como fazer.... Consulte mais detalhes abaixo. |
Vamos entender um pouco mais a fundo a diferença entre as opções Excluir e Excluir permanentemente.
- A opção Excluir exclui os arquivos, mas não os remove totalmente do seu projeto. Os arquivos excluídos ainda podem ser encontrados no filtro excluído da barra de Pesquisa e podem ser restaurados usando a opção Restaurar.
-
A opção Excluir permanentemente remove os arquivos selecionados sem qualquer possibilidade de restaurá-los.
A de pesquisa exposta tem duas partes:
-
Pesquisar usando os filtros internos: filtra os documentos com base nas opções de lote/categoria disponíveis no menu suspenso.
Selecionar mais opções torna a pesquisa mais restritiva. Por exemplo, selecionar Batch import1 e Excluído traz apenas os documentos importados na Batch import1 que são excluídos.
Tome nota de combinações que sempre geram uma lista vazia: selecionar Batch import1 e Batch import2 nunca gera um documento já que a seleção é restritiva e nenhum documento pode estar em dois lotes ao mesmo tempo.
-
Pesquisar em documentos usando palavras-chave: esta barra de pesquisa filtra a informação com base em uma entrada de texto. Você deve inserir a(s) palavra(s)-chave como texto livre na barra de pesquisa. A pesquisa busca a(s) palavra(s)-chave no conteúdo de um documento ou em seu nome. A pesquisa de várias palavras retorna resultados quando as palavras são adjacentes, excluindo qualquer pontuação entre elas.
-
A pesquisa dentro do documento permite pesquisar instâncias de texto apenas no documento atual. A barra de pesquisa, , pode ser encontrada no canto inferior esquerdo da tela.
O botão Configurações tem duas opções disponíveis:
- Configurações, onde você pode configurar o serviço de OCR ou pré-rotulagem
- Como fazer..., cujo propósito é ser um menu de ajuda
OCR
Para importar documentos para o Document Manager, é obrigatório configurar um serviço de OCR.
As seguintes opções estão disponíveis:
This setting is available only for Document Types (Data Manager sessions) created in AI Center. When created in Document UnderstandingTM, this setting is inherited from the Project Settings. If you want to modify these settings in Document UnderstandingTM, go back to the Project view and open Project Settings from the bottom left.
As opções na nuvem são:
- UiPath® Document OCR -
https://du.uipath.com/ocr
; - OCR para chinês, japonês e coreano
- Google Cloud Vision OCR, que tem a melhor cobertura de idioma;
- Google Cloud OCR para japonês ideal para leitura de documentos em japonês;
- Microsoft Read OCR.
A configuração do OCR requer que o serviço de OCR tenha um URL. Esses são os URLs possíveis que você pode usar:
- URLs públicas, como
https://du.uipath.com/ocr
ou URLs de terceiros do Google Vision OCR ou Microsoft Read OCR
A chave de API correspondente para o mecanismo de OCR selecionado. Por exemplo, para UiPath Document OCR, você precisa usar a chave de API do Document Understanding. Obrigatório para Document Manager Cloud e Document Manager On-Prem Online. Não é necessário para o Document Manager On-Prem Air-gapped.
Para obter mais informações, consulte a página Uso na nuvem e no local.
Estabelece se o processo de OCR deve ser aplicado ou não a documentos em PDF. Se definido como True, o OCR é aplicado a todas as páginas PDF do documento. Se definido como False, apenas o texto inserido digitalmente é extraído. Quando definido como Auto (automático), avalia se o documento requer a aplicação do algoritmo OCR dependendo do documento de entrada. O valor padrão é Auto.
Se você já possui um modelo capaz de extrair alguns dos campos que precisam de rotulagem e há apenas alguns campos extras que exigem rotulagem manual, você pode economizar tempo usando a funcionalidade Pré-rotulagem do Document Manager.
A pré-rotulagem mescla os resultados do ponto de extremidade de pré-rotulagem, que você ajusta nas configurações de Pré-rotulagem.
As seguintes opções estão disponíveis:
A pré-rotulagem exige que o modelo de ML tenha um URL. Verifique os seguintes URLs possíveis que você pode usar:
- URLs públicos, como
https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders
.Acesse Pontos de extremidade públicos para ver a lista completa de pontos de extremidade.
- URLs de Habilidades de ML que foram tornados públicos no On-premises AI Center ou no Cloud AI Center.
A chave de API do AI Units/Document Understanding. A chave de API de pré-rotulagem é a chave de API do Document Understanding da organização, na qual Se encontra a habilidade.
A chave é obrigatória para o Cloud Document Manager e o On-premises Online Document Manager. A chave é opcional para o Document Manager on-premises isolado.
A opção Como fazer... abre o menu de ajuda do Document Manager.
No menu de ajuda, você pode encontrar as seguintes informações:
- A versão do Document Manager
- O link Documentação que leva a esta página de documentação.
- A seção Controles de rotulagem que exibe os controles a serem usados ao manipular dados.
- A seção Atalhos do documento que exibe os atalhos usados para executar várias operações, como navegação e dimensionamento da interface do usuário.
- A seção Configuração que exibe detalhes sobre a configuração da instância conforme executada durante a instalação.
Controles de Rotulamento
Command |
Description |
---|---|
Clicar com o Botão Esquerdo do Mouse | Seleciona caixas. Se usado em conjunto com a tecla de atalho do campo, atribui as informações selecionadas ao campo. |
Backspace / Delete | Remove o valor com tag de um campo. |
Clicar com o Botão Direito do Mouse | Exibe o texto OCR e o rótulo atual. |
Enter ou barra invertida | Agrupa ou desagrupa linhas de tabela que abrangem várias linhas de texto. |
Atalhos de Documento
Atalho |
Description |
---|---|
Alt + Seta para a esquerda / Seta para a direita | Alterna entre documentos. |
Alt + Delete | Exclui ou recupera um documento. |
Ctrl + Rolar do mouse | Altera a escala do documento aumentando ou diminuindo o zoom. |
- Criar novo campo de coluna
- Editar campo
- Expande/recolhe valores de campo de coluna
Para obter mais detalhes sobre campos de coluna, visite esta seção.
- Cria um novo campo regular
- Editar campo
Para obter mais detalhes sobre campos regulares, visite esta seção.
- Cria um novo campo de classificação
- Editar campo
Para obter mais detalhes sobre campos de classificação, visite esta seção.
Ctrl
+ rolagem do mouse.
Você pode rotular documentos selecionando as caixas de palavras e atribuindo-as a um campo pressionando uma tecla. Você também pode clicar com o botão direito do mouse na caixa de palavras e verificar as informações extraídas.
Para obter mais detalhes sobre como rotular documentos, visite esta página.
Quando você abre uma nova sessão do Document Manager ou quando tem um filtro vazio, algumas diretrizes são exibidas na visualização do documento:
Além disso, as falhas de carregamento também são exibidas na visualização do documento:
- Barra de gerenciamento
- Opções Excluir e Excluir permanentemente
- Opção de pesquisa
- Menu de configurações
- Método de OCR
- URL de OCR
- Chave de OCR
- Aplicar OCR em PDFs
- Previsão/pré-rotulagem
- URL de pré-rotulamento
- Chave de pré-rotulamento
- Como...
- Campos de coluna
- Campos regulares
- Campos de Classificação
- Exibição de Documento