Document Understanding
2022.10
falso
Imagem de fundo do banner
Guia do usuário do Document Understanding.
Última atualização 19 de abril de 2024

Sobre o Document Manager

O UiPath Document Manager é um aplicativo web leve, que permite aos usuários preparar, revisar e fazer correções nos conjuntos de dados necessários para treinamento e avaliação de modelos de Machine Learning do Document Understanding. Ele permite que vários usuários executem uma variedade de operações:

Defina e configure os campos a serem extraídos por um modelo de ML.

Importe documentos para rotulagem.

Pré-rotule documentos usando um modelo de ML preexistente e pronto para uso, como Extração de Fatura ou Extração de Recibo, fornecido pela UiPath, ou usando um modelo treinado utilizando o AI Center.

Rotule documentos.

Exporte documentos no formato esperado pelos Pipelines de Treinamento do AI Center.

A interface do usuário

A interface do Document Manager contém os seguintes painéis:

Barra de gerenciamento

Exibidos na parte superior da página no Document Manager.

Permite realizar várias operações: navegar entre documentos, excluir/restaurar um documento, pesquisar/filtrar documentos, executar previsões de modelos de IA, importar e exportar documentos.

Esses são os itens disponíveis na barra de gerenciamento:

Item

Ícone

Description

Navegação

Navegue entre os documentos que correspondam ao filtro ativo.

Entre as duas setas, um contador é exibido. Ele ilustra o número do documento atual do número total de documentos que correspondem à pesquisa/filtro ativo.

Pesquisar ou filtrar documentos. O filtro também é aplicado ao exportar documentos. Você também pode filtrar por palavras em um documento ou por nomes de documentos.

Excluir / Restaurar

/

Excluir ou restaurar um documento. Os documentos excluídos podem ser encontrados no filtro excluído.

Abra a caixa de diálogo Importar dados.

Abra a caixa de diálogo Exportar arquivos.

Nome e tipo do documento

N/A

O nome do documento atualmente ativo e seu tipo.

Há três tipos de documentos:

  • Documento de treinamento
  • Documento de validação
  • Documento de avaliação

Os documentos de treinamento e validação fazem parte dos conjuntos de dados de treinamento usados pelos Pipelines de treinamento.

Os documentos de avaliação são ignorados pelos pipelines de treinamento e devem ser usados apenas pelos pipelines de avaliação no AI Center. Esses documentos são os que foram marcados como de avaliação ao marcar a caixa de seleção Marcar este conjunto como avaliação na caixa de diálogo Importar dados.

Fazer download

A opção está disponível na lista suspensa ao lado do nome do documento.

Clique no ícone para baixar um arquivo Zip contendo o documento original. Além do documento original, todas as páginas convertidas internamente pelo Document Manager para imagens .jpeg também são baixadas.

Excluir permanentemente



A opção está disponível na lista suspensa ao lado do nome do documento.

Exclui permanentemente arquivos individuais. As imagens .pdf e todas as suas imagens .jpeg são excluídas do conjunto de dados do AI Center e todos os metadados são excluídos do banco de dados.

Ao clicar no botão, uma mensagem pop-up é exibida, perguntando se você tem certeza de que deseja excluir permanentemente o documento. Clique em OK para continuar ou Cancelar para voltar à tela anterior.

Nome da sessão

N/A

O nome da sessão atual.

Predict

Execute as previsões do modelo de IA e exiba os resultados.

Após configurar a Pré-rotulagem, o botão é habilitado na barra de gerenciamento. Clique nele para pré-rotular o documento atual.

No momento, usar a opção Prever com Pontos de extremidade públicos pré-rotula apenas as primeiras 10 páginas de um documento. Este é um problema conhecido e uma correção está em andamento. Usar a opção Prever com Habilidades de ML no AI Center, no entanto, não impõe essa limitação.

Configurações

Defina as configurações de OCR e Pré-rotulagem ou acesse o painel Como fazer.... Consulte mais detalhes abaixo.

Opções Excluir e Excluir permanentemente

Vamos entender um pouco mais a fundo a diferença entre as opções Excluir e Excluir permanentemente.

  • A opção Excluir exclui os arquivos, mas não os remove totalmente do seu projeto. Os arquivos excluídos ainda podem ser encontrados no filtro excluído da barra de Pesquisa e podem ser restaurados usando a opção Restaurar.
  • A opção Excluir permanentemente remove os arquivos selecionados sem qualquer possibilidade de restaurá-los.

    Observe o uso de ambas as opções no GIF abaixo:



Opção de pesquisa

A barra de pesquisa é um campo de entrada de texto e um menu suspenso.

As opções de pesquisa podem ser inseridas escrevendo na barra de pesquisa ou selecionando um filtro no menu suspenso. Há três maneiras principais de inicializar uma pesquisa:

  1. Usando os filtros integrados disponíveis no menu suspenso da barra de pesquisa. Você pode escolher qualquer um dos seguintes filtros: conjunto de treinamento, conjunto de validação, conjunto de validação de treinamento, conjunto de avaliação, excluído, rotulado, não rotulado.
    Observação: observe que, para Forms AI, apenas os seguintes filtros integrados estão disponíveis: excluído, rotulado, não rotulado.


  2. Usando os nomes de lote de importação. Eles também estão disponíveis no menu suspenso da barra de pesquisa. Se adicionado manualmente, o formato é batch:name, sendo name substituído pelo nome que você deu a um lote no momento da importação, por exemplo, batch:invoices1
  3. Usando palavras-chave. Você deve inserir a(s) palavra(s)-chave como texto livre na barra de pesquisa. A pesquisa busca a(s) palavra(s)-chave no conteúdo de um documento ou em seu nome.

Você pode optar por usar uma ou mais opções de pesquisa. Cada opção adicional usada lança uma rede de pesquisa mais específica. Veja alguns exemplos de pesquisa que começam lançando uma ampla rede e progridem lentamente para uma pesquisa mais refinada:

  • iniciar uma pesquisa labelled retorna todos os documentos labelled no conjunto de dados.
  • iniciar uma pesquisa batch:invoices1 retorna todos os documentos que constituem o lote invoices1.
  • iniciar uma pesquisa labelled batch:invoices1 retorna todos os documentos rotulados que fazem parte do lote invoices1.
  • iniciar uma pesquisa labelled batch:invoices1 vermont retorna todos os documentos rotulados do lote invoices1 que contêm a palavra-chave inserida, neste caso vermont, no nome do documento ou em seu conteúdo.

A barra de pesquisa possui um menu suspenso que, ao ser aberto, exibe os seguintes filtros:

  • train-set - Indica o número de documentos a serem usados para treinar o modelo. Ação automatizada.
  • validate-set - Indica o número de documentos a serem usados para validar o modelo após a conclusão de seu treinamento. A divisão entre os conjuntos de treinamento e validação é de 80% e 20%. Ação automatizada.
  • train-validate-set - Indica o número de documentos encontrados nos filtros train-set e validate-set. Ação automatizada.
  • evaluation-set - Indica o número de documentos que tiveram a caixa de seleção do conjunto de avaliação marcada durante a importação e devem ser usados para avaliar o modelo no estágio de pipeline de treinamento. Mais informações podem ser encontradas aqui. Ação manual.
  • excluído - Especifica o número de documentos excluídos. Mais informações podem ser encontradas aqui.
  • labelled- Especifica o número de documentos que possuem rótulos. Um rótulo é definido por pelo menos um campo marcado/editado manualmente por documento.
  • unlabelled - Especifica o número de documentos que não possuem rótulos.
  • batch:name - Especifica os documentos que foram incluídos na mesma ação de importação.

A alocação de um documento para os conjuntos de treinamento ou validação é feita pelo aplicativo no momento da importação.

O documento importado é incorporado pelo conjunto de avaliação se a caixa de seleção do conjunto de avaliação estiver marcada durante a importação.

Menu de configurações

O botão de configurações tem duas opções disponíveis:

  • Configurações, onde você pode configurar o serviço de OCR ou pré-rotulagem
  • Como fazer..., cujo propósito é ser um menu de ajuda
Para importar documentos para o Document Manager, é obrigatório configurar um serviço de OCR.


As seguintes opções estão disponíveis:

Método de OCR

As opções na nuvem são:

  • UiPath Document OCR - https://du.uipath.com/ocr;
  • Google Cloud Vision OCR, que tem a melhor cobertura de idioma;
  • Google Cloud OCR para japonês ideal para leitura de documentos em japonês;
  • Microsoft Read OCR.

URL de OCR

A configuração do OCR requer que o serviço de OCR tenha um URL. Esses são os URLs possíveis que você pode usar:

Chave de OCR

A chave de API correspondente para o mecanismo de OCR selecionado. Por exemplo, para UiPath Document OCR, você precisa usar a chave de API do Document Understanding. Obrigatório para Document Manager Cloud e Document Manager On-Prem Online. Não é necessário para o Document Manager On-Prem Air-gapped.

Pré-rotulamento

Se você já possui um modelo que pode extrair alguns dos campos que precisam de rotulagem e há apenas alguns campos extras que exigem rotulagem manual, você pode economizar muito tempo usando o recurso de pré-rotulagem do Document Manager.



As seguintes opções estão disponíveis:

URL de pré-rotulamento

A pré-rotulagem exige que o modelo de ML tenha um URL. Esses são os URLs possíveis que você pode usar:

  • URLs públicos, como https://du.uipath.com/ie/invoices ou https://du.uipath.com/ie/purchase_orders
  • Veja a lista completa de pontos de extremidade aqui
  • URLs de habilidades de ML que foram tornados públicos no AI Center no local ou no AI Center Cloud

Chave de pré-rotulamento

A chave de API do Document Understanding. Obrigatório para Document Manager Cloud e Document Manager On-Prem Online. Não é necessário para o Document Manager On-Prem Air-gapped.

Como...

A opção Como fazer... acessa o menu de ajuda do Document Manager.



Nela, você pode encontrar:

  • A versão do Document Manager
  • O link Documentação que leva a esta página de documentação.
  • A seção Controles de rotulagem que exibe os controles a serem usados ao manipular dados.
  • A seção Atalhos do documento que exibe os atalhos usados para executar várias operações, como navegação e dimensionamento da interface do usuário.
  • A seção Configuração que exibe detalhes sobre a configuração da instância conforme executada durante a instalação.

Campos de coluna

Os campos de coluna têm as seguintes opções:

  • Criar novo campo de coluna docs image
  • Editar campo docs image
  • Expande/recolhe valores de campo de coluna docs image

Para obter mais detalhes sobre campos de coluna, visite esta seção.

Campos Regulares

Os campos regulares têm as seguintes opções:

  • Cria um novo campo regular docs image
  • Editar campo docs image

Para obter mais detalhes sobre campos regulares, visite esta seção.

Campos de Classificação

Os campos de classificação têm as seguintes opções:

  • Cria um novo campo de classificação docs image
  • Editar campo docs image

Para obter mais detalhes sobre campos de classificação, visite esta seção.

Exibição de Documento

Para documentos de várias páginas, você pode rolar naturalmente pelas páginas como em qualquer visualizador de PDF. Para aumentar ou diminuir o zoom, use Ctrl + rolagem do mouse.

Você pode rotular documentos selecionando as caixas de palavras e atribuindo-as a um campo pressionando uma tecla. Você também pode clicar com o botão direito do mouse na caixa de palavras e verificar as informações extraídas.

Para obter mais detalhes sobre como rotular documentos, visite esta página.

Quando você abre uma nova sessão do Document Manager ou quando tem um filtro vazio, algumas diretrizes são exibidas na visualização do documento:



Além disso, as falhas de carregamento também são exibidas na visualização do documento:



  • A interface do usuário
  • Barra de gerenciamento
  • Campos de coluna
  • Campos Regulares
  • Campos de Classificação
  • Exibição de Documento

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.