- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- 990 - Pacote de ML - Prévia
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Passaportes - Pacote de ML
- Contracheques — Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos – Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Requisitos de Hardware
- Pipelines
- Document Manager
- Serviços de OCR
- Idiomas suportados
- Aprendizagem profunda
- Painéis de insights
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Licenciamento
- Atividades
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding user guide
A interface do usuário
A interface do Document Manager contém os seguintes painéis:
- Barra de gerenciamento
- Campos de coluna
- Campos Regulares
- Campos de Classificação
- Exibição de Documento
Barra de gerenciamento
Exibidos na parte superior da página no Document Manager.
Permite realizar várias operações: navegar entre documentos, excluir/restaurar um documento, pesquisar/filtrar documentos, executar previsões de modelos de IA, importar e exportar documentos.
Esses são os itens disponíveis na barra de gerenciamento:
| Item | Description |
|---|---|
| Navegação | Navegue entre os documentos que correspondam ao filtro ativo. Entre as duas setas, um contador é exibido. Ele ilustra o número do documento atual do número total de documentos que correspondem à pesquisa/filtro ativo. |
| Pesquisar | Existem duas funcionalidades de pesquisa:
|
| Excluir / Restaurar | Excluir ou restaurar um documento. Os documentos excluídos podem ser encontrados no filtro excluído. |
| Importar | Abra a caixa de diálogo Importar dados. |
| Exportar | Abra a caixa de diálogo Exportar arquivos. |
| Nome e tipo do documento | O nome do documento atualmente ativo e seu tipo. Há três tipos de documentos:
Os documentos de treinamento e validação fazem parte dos conjuntos de dados de treinamento usados pelos Pipelines de treinamento. Evaluation documents are ignored by Training Pipelines and are intended to only be used by Evaluation pipelines in AI Center. These documents are the ones that were marked as evaluation by selecting the Mark this an evaluation set checkbox in the Import data dialog box. |
| Fazer download | A opção está disponível na lista suspensa ao lado do nome do documento. .jpeg imagens também são baixadas. |
| Excluir permanentemente | A opção está disponível na lista suspensa ao lado do nome do documento. .pdf e todas as suas imagens .jpeg são excluídas do conjunto de dados do AI Center e todos os metadados são excluídos do banco de dados. When selecting the button, a pop-up message appears asking you if you are sure you want to permanently delete the document. Choose OK to continue or Cancel to revert to the previous screen. |
| Nome do lote | O nome do lote atual. |
| Nome da sessão | O nome da sessão atual. |
| Predict | Execute as previsões do modelo de IA e exiba os resultados. Após configurar a Pré-rotulagem, o botão é habilitado na barra de gerenciamento. Selecione-o para rotular previamente o documento atual. |
| Configurações | Defina as configurações de OCR e Pré-rotulagem ou acesse o painel Como fazer.... |
Opções Excluir e Excluir permanentemente
Let's go a little bit deeper in understanding the difference between Delete and Permanently Delete options.
- The Delete option deletes the files, but not removing them entirely from your project. The deleted files can still be found under the deleted filter from the Search bar and restored by using the Restore option.
- The Permanently Delete option deletes the selected files without any possibility of restoring them.
Opção de pesquisa
Three search options are available in total, two are present in the management bar from the top of the page, and one is using the
icon from the bottom left side of the page.
Please note that for Forms AI only the following built-in filters are available: deleted, labelled, unlabelled.
A de pesquisa exposta tem duas partes:
- Search using the built-in filters: filters the documents based on the batch/category available options from the drop-down menu.
Selecting more options makes the search more restrictive. For example selecting Batch import1 and Deleted is bringing up only the documents imported in the Batch import1 which are deleted.
Take note of combinations that will always return an empty list: selecting Batch import1 and Batch import2 would never return a document since the selection is restrictive and no document can be in two batches at a time.
- Search in documents using keywords: this search bar filters the information based on a text input. You have to enter the keyword(s) as free text in the Search bar. The search looks for the keyword(s) in a document's content or the document name. Multiple words search returns results when the words are adjacent, excluding any punctuation in between them.
Alongside the two bar searches, there is also an inside the document search, identifiable by this
sign.
- Search inside the document: allows you to search for instances of text solely in your current document. The search bar,
, can be found at the bottom left hand side of the screen.
Menu de configurações
O botão Configurações tem duas opções disponíveis:
- Settings where you can configure the OCR service or Prelabelling
- How to... which has the purpose of a help menu
OCR
Para importar documentos para o Document Manager, é obrigatório configurar um serviço de OCR.

Método de OCR
This setting is available only for Document Types (Data Manager sessions) created in AI Center. When created in Document UnderstandingTM, this setting is inherited from the Project Settings. If you want to modify these settings in Document UnderstandingTM, go back to the Project view and open Project Settings from the bottom left.
As opções na nuvem são:
- UiPath® Document OCR -
https://du.uipath.com/ocr; - OCR para chinês, japonês e coreano
- Google Cloud Vision OCR, que tem a melhor cobertura de idioma;
- Google Cloud OCR para japonês ideal para leitura de documentos em japonês;
- Microsoft Read OCR.
URL de OCR
A configuração do OCR requer que o serviço de OCR tenha um URL. Esses são os URLs possíveis que você pode usar:
- URLs públicas, como
https://du.uipath.com/ocrou URLs de terceiros do Google Vision OCR ou Microsoft Read OCR
Chave de OCR
A chave de API correspondente para o mecanismo de OCR selecionado. Por exemplo, para UiPath Document OCR, você precisa usar a chave de API do Document Understanding. Obrigatório para Document Manager Cloud e Document Manager On-Prem Online. Não é necessário para o Document Manager On-Prem Air-gapped.
For more information, check the Cloud and on-premises usage page.
Aplicar OCR em PDFs
Estabelece se o processo de OCR deve ser aplicado ou não a documentos em PDF. Se definido como True, o OCR é aplicado a todas as páginas PDF do documento. Se definido como False, apenas o texto inserido digitalmente é extraído. Quando definido como Auto (automático), avalia se o documento requer a aplicação do algoritmo OCR dependendo do documento de entrada. O valor padrão é Auto.
Previsão/pré-rotulagem
Se você já possui um modelo capaz de extrair alguns dos campos que precisam de rotulagem e há apenas alguns campos extras que exigem rotulagem manual, você pode economizar tempo usando a funcionalidade Pré-rotulagem do Document Manager.
Prelabelling merges the results of the Prelabelling endpoint, that you configure in the Prelabelling settings.

As seguintes opções estão disponíveis:
URL de pré-rotulamento
A pré-rotulagem exige que o modelo de ML tenha um URL. Verifique os seguintes URLs possíveis que você pode usar:
- Public URLs such as
https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders. Visit Public Endpoints to check the full list of endpoints. - URLs de Habilidades de ML que foram tornados públicos no On-premises AI Center ou no Cloud AI Center.
Chave de pré-rotulamento
A chave de API do AI Units/Document Understanding. A chave de API de pré-rotulagem é a chave de API do Document Understanding da organização, na qual Se encontra a habilidade.
A chave é obrigatória para o Cloud Document Manager e o On-premises Online Document Manager. A chave é opcional para o Document Manager on-premises isolado.
Como...
The How to... option opens the Document Manager help menu.
No menu de ajuda, você pode encontrar as seguintes informações:
- The Document Manager version.
- O link Documentação que leva a esta página de documentação.
- A seção Controles de rotulagem que exibe os controles a serem usados ao manipular dados.
- A seção Atalhos do documento que exibe os atalhos usados para executar várias operações, como navegação e dimensionamento da interface do usuário.
- A seção Configuração que exibe detalhes sobre a configuração da instância conforme executada durante a instalação.
Controles de Rotulamento
| Command | Description |
|---|---|
| Clicar com o Botão Esquerdo do Mouse | Seleciona caixas. Se usado em conjunto com a tecla de atalho do campo, atribui as informações selecionadas ao campo. |
| Backspace / Delete | Remove o valor com tag de um campo. |
| Clicar com o Botão Direito do Mouse | Exibe o texto OCR e o rótulo atual. |
| Enter ou barra invertida | Agrupa ou desagrupa linhas de tabela que abrangem várias linhas de texto. |
Atalhos de Documento
| Atalho | Description |
|---|---|
| Alt + Seta para a esquerda / Seta para a direita | Alterna entre documentos. |
| Alt + Delete | Exclui ou recupera um documento. |
| Ctrl + Rolar do mouse | Altera a escala do documento aumentando ou diminuindo o zoom. |
Campos de coluna
Os campos de coluna têm as seguintes opções:
- Criar novo campo de coluna

- Editar campo

- Expande/recolhe valores de campo de coluna

For more details on column fields, visit this section.
Campos regulares
Os campos regulares têm as seguintes opções:
- Cria um novo campo regular

- Editar campo

For more details on regular fields, visit this section.
Campos de Classificação
Os campos de classificação têm as seguintes opções:
- Cria um novo campo de classificação

- Editar campo

For more details on classification fields, visit this section.
Exibição de Documento
Para documentos de várias páginas, você pode rolar naturalmente pelas páginas como em qualquer visualizador de PDF. Para aumentar ou diminuir o zoom, use Ctrl + rolagem do mouse.
Você pode rotular documentos selecionando as caixas de palavras e atribuindo-as a um campo pressionando uma tecla. Você também pode clicar com o botão direito do mouse na caixa de palavras e verificar as informações extraídas.
For more details on how to label documents, visit this page.
Quando você abre uma nova sessão do Document Manager ou quando tem um filtro vazio, algumas diretrizes são exibidas na visualização do documento:

Além disso, as falhas de carregamento também são exibidas na visualização do documento:

- Barra de gerenciamento
- Opções Excluir e Excluir permanentemente
- Opção de pesquisa
- Menu de configurações
- Método de OCR
- URL de OCR
- Chave de OCR
- Aplicar OCR em PDFs
- Previsão/pré-rotulagem
- URL de pré-rotulamento
- Chave de pré-rotulamento
- Como...
- Campos de coluna
- Campos regulares
- Campos de Classificação
- Exibição de Documento