document-understanding
latest
false
UiPath logo, featuring letters U and I in white

Guia do usuário do Document Understanding.

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Última atualização 12 de dez de 2024

Tipos de documentos (Document Manager)

Os tipos de documentos permitem que você prepare, revise e faça correções nos conjuntos de dados necessários para treinamento e avaliação dos modelos de Machine Learning do Document UnderstandingTM. Ele permite que vários usuários executem uma variedade de operações:
  • Defina e configure os campos a serem extraídos por um modelo de ML.
  • Importe documentos para rotulagem.
  • Pré-rotule documentos usando um modelo de ML preexistente e pronto para uso, como Extração de Fatura ou Extração de Recibo, fornecido pela UiPath, ou usando um modelo treinado utilizando o AI Center.
  • Rotule documentos.
  • Exporte documentos no formato esperado pelos Pipelines de Treinamento do AI Center.

Criar tipo de documento

Depois que um projeto for criado e aberto, você pode criar um novo Tipo de documento clicando no botão Novo e selecionando a opção Usando IA semiestruturada. Uma nova janela é exibida solicitando informações adicionais.

Estas são as opções disponíveis ao criar uma nova sessão de Tipo de Documento. Ao preencher esses valores, você obtém uma estimativa do tamanho recomendado para o conjunto de dados a ser usado como ponto de partida.

Além disso, ao selecionar o tipo de documento pré-configurado, seu esquema é preenchido e configurado automaticamente, o que permite que você se beneficie dos modelos pré-treinados disponíveis no AI Center. Isso elimina a necessidade de importar manualmente esquemas predefinidos, acelera seu trabalho e reduz erros custosos.

Adicionalmente, o ponto de extremidade para Pré-rotulamento é preenchido automaticamente com o ponto de extremidade relevante, o que torna mais conveniente usar o Pré-rotulamento logo após abrir o novo Tipo de Documento.



Opção

Description

Nome (obrigatório)

Forneça um nome para o novo tipo de documento.

Tipo de documento pré-configurado (obrigatório)

Selecione um dos tipos de documentos pré-configurados e pré-treinados disponíveis na lista suspensa.

Campos regulares pré-configurados (opcional)

Selecione qual dos campos regulares predefinidos você gostaria de criar para seu esquema

Campos de coluna pré-configurados (opcional)

Selecione qual dos campos de coluna predefinidos você gostaria de extrair de seus documentos.

Campos de classificação pré-configurados (opcional)

Selecione qual dos campos de classificação pré-definidos gostaria de extrair de seus documentos.

Campos regulares personalizados (opcional)

Digite o número de campos regulares adicionais que gostaria de extrair de seus documentos.

Campos de coluna personalizados (opcional)

Digite o número de campos de coluna adicionais que gostaria de extrair de seus documentos.

Número de idiomas (opcional)

Insira o número de idiomas presente nos documentos que precisa extrair.

Número de layouts (opcional)

Insira o número de layouts para os documentos que deseja extrair.

Observação: selecionar um tipo de documento gera um número recomendado de páginas que precisam ser utilizadas para compor o conjunto de dados.

A interface do usuário

A interface do Document Manager contém os seguintes painéis:

  • Barra de gerenciamento
  • Campos de coluna
  • Campos Regulares
  • Campos de Classificação
  • Exibição de Documento

Barra de gerenciamento

Exibidos na parte superior da página no Document Manager.

Permite realizar várias operações: navegar entre documentos, excluir/restaurar um documento, pesquisar/filtrar documentos, executar previsões de modelos de IA, importar e exportar documentos.

Esses são os itens disponíveis na barra de gerenciamento:

Item

Ícone

Description

Navegação

Navegue entre os documentos que correspondam ao filtro ativo.

Entre as duas setas, um contador é exibido. Ele ilustra o número do documento atual do número total de documentos que correspondem à pesquisa/filtro ativo.

Pesquisar


docs image

Existem duas funcionalidades de pesquisa:

  • Filtros internos: filtra os documentos com base nas opções de lote/categoria disponíveis no menu suspenso.

  • Usando palavras-chave: filtra os documentos com base em entrada de texto.

Excluir / Restaurar


docs image

docs image

Excluir ou restaurar um documento. Os documentos excluídos podem ser encontrados no filtro excluído.

Importar


docs image

Abra a caixa de diálogo Importar dados.

Exportar


docs image

Abra a caixa de diálogo Exportar arquivos.

Nome e tipo do documento

N/A

O nome do documento atualmente ativo e seu tipo.

Há três tipos de documentos:

  • Documento de treinamento

  • Documento de validação

  • Documento de avaliação

Os documentos de treinamento e validação fazem parte dos conjuntos de dados de treinamento usados pelos Pipelines de treinamento.

Os documentos de avaliação são ignorados pelos pipelines de treinamento e devem ser usados apenas pelos Pipelines de Avaliação no AI Center. Esses documentos são os que foram marcados como de avaliação ao marcar a caixa de seleção Marcar este conjunto como avaliação na caixa de diálogo Importar dados.

Fazer download


docs image

A opção está disponível na lista suspensa ao lado do nome do documento.

Clique no ícone para baixar um arquivo Zip contendo o documento original. Além do documento original, todas as páginas convertidas internamente pelo Document Manager para imagens .jpeg também são baixadas.

Excluir permanentemente

docs image

A opção está disponível na lista suspensa ao lado do nome do documento.

Exclui permanentemente arquivos individuais. As imagens .pdf e todas as suas imagens .jpeg são excluídas do conjunto de dados do AI Center e todos os metadados são excluídos do banco de dados.

Ao clicar no botão, uma mensagem pop-up é exibida, perguntando se você tem certeza de que deseja excluir permanentemente o documento. Clique em OK para continuar ou Cancelar para voltar à tela anterior.

Nome do lote

N/A

O nome do lote atual.

Nome da sessão

N/A

O nome da sessão atual.

Predict

Observação: a funcionalidade Prever depende do UiPath DocPath, mas apenas para tenants com base na região da Europa. Se seu tenant estiver localizado em uma região fora da Europa, essa funcionalidade usará a arquitetura do modelo da geração anterior.

docs image

Execute as previsões do modelo de IA e exiba os resultados.

Após configurar a Pré-rotulagem, o botão é habilitado na barra de gerenciamento. Clique nele para pré-rotular o documento atual.

O botão tem três opções:
  • Prever: mescla os resultados do endpoint de pré-rotulagem (em configurações de pré-rotulagem) e a Previsão generativa. Se não houver nenhum endpoint de pré-rotulagem configurado, todos os campos serão previstos usando apenas Previsão generativa.
  • Previsão generativa: prevê todos os campos usando a capacidade de Previsão generativa.
  • Previsão do modelo: prevê campos usando o modelo de endpoint de pré-rotulagem configurado nos ajustes de pré-rotulagem.

A funcionalidade Anotação generativa (pré-rotulagem) descarta todos os valores de campo editados manualmente para todos os tipos de campos e exclui todas as tags do documento.

No momento, usar a opção Prever com Endpoints públicos pré-rotula apenas as primeiras 10 páginas de um documento. Este é um problema conhecido e uma correção está em andamento. Usar a opção Prever com Habilidades de ML no AI Center, no entanto, não impõe essa limitação.

A pré-rotulagem generativa não consome AI Units ao usar pontos de extremidade públicos ou habilidades implantadas no Automation Cloud™ a partir de sessões do Document Manager hospedadas no Automation Cloud. A pré-rotulagem generativa consome AI Units ao chamar um ponto de extremidade público de uma sessão hospedada no Automation Suite ou ao chamar uma habilidade implantada no Automation Suite a partir de uma sessão do Document Manager hospedada no Automation Cloud.

Configurações


docs image

Defina as configurações de OCR e Pré-rotulagem ou acesse o painel Como fazer.... Consulte mais detalhes abaixo.

Opções Excluir e Excluir permanentemente

Vamos entender um pouco mais a fundo a diferença entre as opções Excluir e Excluir permanentemente.

  • A opção Excluir exclui os arquivos, mas não os remove totalmente do seu projeto. Os arquivos excluídos ainda podem ser encontrados no filtro excluído da barra de Pesquisa e podem ser restaurados usando a opção Restaurar.
  • A opção Excluir permanentemente remove os arquivos selecionados sem qualquer possibilidade de restaurá-los.

Opção de pesquisa

Estão disponíveis três opções de pesquisa no total, duas estão presentes na barra de gerenciamento no topo da página e uma aparece usando o íconedocs image do canto inferior esquerdo da página.
Observação: observe que, para Forms AI, apenas os seguintes filtros integrados estão disponíveis: excluído, rotulado, não rotulado.

A de pesquisa exposta tem duas partes:

  • Pesquisar usando os filtros internos: filtra os documentos com base nas opções de lote/categoria disponíveis no menu suspenso.

Atenção:

Selecionar mais opções torna a pesquisa mais restritiva. Por exemplo, selecionar Batch import1 e Excluído traz apenas os documentos importados na Batch import1 que são excluídos.

Tome nota de combinações que sempre geram uma lista vazia: selecionar Batch import1 e Batch import2 nunca gera um documento já que a seleção é restritiva e nenhum documento pode estar em dois lotes ao mesmo tempo.

  • Pesquisar em documentos usando palavras-chave: esta barra de pesquisa filtra a informação com base em uma entrada de texto. Você deve inserir a(s) palavra(s)-chave como texto livre na barra de pesquisa. A pesquisa busca a(s) palavra(s)-chave no conteúdo de um documento ou em seu nome. A pesquisa de várias palavras retorna resultados quando as palavras são adjacentes, excluindo qualquer pontuação entre elas.

Observação: juntamente com as duas barras de pesquisa, também há uma pesquisa dentro do documento, identificável por esse sinaldocs image.
  • A pesquisa dentro do documento permite pesquisar instâncias de texto apenas no documento atual. A barra de pesquisa, , pode ser encontrada no canto inferior esquerdo da tela.

Menu de configurações

O botão Configurações tem duas opções disponíveis:

  • Configurações, onde você pode configurar o serviço de OCR ou pré-rotulagem
  • Como fazer..., cujo propósito é ser um menu de ajuda
OCR

Para importar documentos para o Document Manager, é obrigatório configurar um serviço de OCR.



As seguintes opções estão disponíveis:

Método de OCR

Essa configuração está disponível apenas para Tipos de Documento (sessões do Data Manager) criadas no AI Center. Quando criada no Document UnderstandingTM, essa configuração é herdada das Configurações do Projeto. Se você deseja modificar essas configurações no Document UnderstandingTM, volte para a visualização do Projeto e abra as Configurações do Projeto na parte inferior esquerda.

As opções na nuvem são:

  • UiPath® Document OCR - https://du.uipath.com/ocr;
  • OCR para chinês, japonês e coreano
  • Google Cloud Vision OCR, que tem a melhor cobertura de idioma;
  • Google Cloud OCR para japonês ideal para leitura de documentos em japonês;
  • Microsoft Read OCR.

URL de OCR

A configuração do OCR requer que o serviço de OCR tenha um URL. Esses são os URLs possíveis que você pode usar:

  • URLs públicas, como https://du.uipath.com/ocr ou URLs de terceiros do Google Vision OCR ou Microsoft Read OCR

Chave de OCR

A chave de API correspondente para o mecanismo de OCR selecionado. Por exemplo, para UiPath Document OCR, você precisa usar a chave de API do Document Understanding. Obrigatório para Document Manager Cloud e Document Manager On-Prem Online. Não é necessário para o Document Manager On-Prem Air-gapped.

Para obter mais informações, consulte a página Uso na nuvem e no local.

Aplicar OCR em PDFs

Estabelece se o processo de OCR deve ser aplicado ou não a documentos em PDF. Se definido como True, o OCR é aplicado a todas as páginas PDF do documento. Se definido como False, apenas o texto inserido digitalmente é extraído. Quando definido como Auto (automático), avalia se o documento requer a aplicação do algoritmo OCR dependendo do documento de entrada. O valor padrão é Auto.

Previsão/pré-rotulagem

Observação: a funcionalidade Prever depende do UiPath DocPath, mas apenas para tenants com base na região da Europa. Se seu tenant estiver localizado em uma região fora da Europa, essa funcionalidade usará a arquitetura do modelo da geração anterior.

Se você já possui um modelo capaz de extrair alguns dos campos que precisam de rotulagem e há apenas alguns campos extras que exigem rotulagem manual, você pode economizar tempo usando a funcionalidade Pré-rotulagem do Document Manager.

A pré-rotulagem mescla os resultados do ponto de extremidade de Pré-rotulagem, que você ajusta nas configurações de Pré-rotulagem e de Previsão generativa.

Se não houver nenhum ponto de extremidade de Pré-rotulagem configurado, todos os campos serão previstos usando apenas Previsão generativa.



As seguintes opções estão disponíveis:

URL de pré-rotulamento

A pré-rotulagem exige que o modelo de ML tenha um URL. Verifique os seguintes URLs possíveis que você pode usar:

  • URLs públicos, como https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders.

    Acesse Pontos de extremidade públicos para ver a lista completa de pontos de extremidade.

  • URLs de Habilidades de ML que foram tornados públicos no On-premises AI Center ou no Cloud AI Center.

Chave de pré-rotulamento

A chave de API do AI Units/Document Understanding. A chave de API de pré-rotulagem é a chave de API do Document Understanding da organização, na qual Se encontra a habilidade.

A chave é obrigatória para o Cloud Document Manager e o On-premises Online Document Manager. A chave é opcional para o Document Manager on-premises isolado.

Como...

A opção Como fazer... abre o menu de ajuda do Document Manager.

No menu de ajuda, você pode encontrar as seguintes informações:

  • A versão do Document Manager
  • O link Documentação que leva a esta página de documentação.
  • A seção Controles de rotulagem que exibe os controles a serem usados ao manipular dados.
  • A seção Atalhos do documento que exibe os atalhos usados para executar várias operações, como navegação e dimensionamento da interface do usuário.
  • A seção Configuração que exibe detalhes sobre a configuração da instância conforme executada durante a instalação.
Controles de Rotulamento

Command

Description

Clicar com o Botão Esquerdo do Mouse

Seleciona caixas. Se usado em conjunto com a tecla de atalho do campo, atribui as informações selecionadas ao campo.

Backspace / Delete

Remove o valor com tag de um campo.

Clicar com o Botão Direito do Mouse

Exibe o texto OCR e o rótulo atual.

Enter ou barra invertida

Agrupa ou desagrupa linhas de tabela que abrangem várias linhas de texto.
Atalhos de Documento

Atalho

Description

Alt + Seta para a esquerda / Seta para a direita

Alterna entre documentos.

Alt + Delete

Exclui ou recupera um documento.

Ctrl + Rolar do mouse

Altera a escala do documento aumentando ou diminuindo o zoom.

Campos de coluna

Os campos de coluna têm as seguintes opções:
  • Criar novo campo de coluna docs image
  • Editar campo docs image
  • Expande/recolhe valores de campo de coluna docs image

Para obter mais detalhes sobre campos de coluna, visite esta seção.

Campos regulares

Os campos regulares têm as seguintes opções:
  • Cria um novo campo regular docs image
  • Editar campo docs image

Para obter mais detalhes sobre campos regulares, visite esta seção.

Campos de Classificação

Os campos de classificação têm as seguintes opções:
  • Cria um novo campo de classificação docs image
  • Editar campo docs image

Para obter mais detalhes sobre campos de classificação, visite esta seção.

Exibição de Documento

Para documentos de várias páginas, você pode rolar naturalmente pelas páginas como em qualquer visualizador de PDF. Para aumentar ou diminuir o zoom, use Ctrl + rolagem do mouse.

Você pode rotular documentos selecionando as caixas de palavras e atribuindo-as a um campo pressionando uma tecla. Você também pode clicar com o botão direito do mouse na caixa de palavras e verificar as informações extraídas.

Para obter mais detalhes sobre como rotular documentos, visite esta página.

Quando você abre uma nova sessão do Document Manager ou quando tem um filtro vazio, algumas diretrizes são exibidas na visualização do documento:



Além disso, as falhas de carregamento também são exibidas na visualização do documento:



Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.