Document Understanding
Mais recente
falso
Imagem de fundo do banner
Guia do usuário do Document Understanding.
Última atualização 30 de abr de 2024

IA de formulários

O Forms AI faz parte do Document Understanding e pode ser usado para carregar e processar formulários estruturados com layouts e campos padrão.

Criar IA de formulários

O Forms AI é o primeiro método de extração disponível no Document Understanding. Leia mais informações sobre como criar um novo projeto no Document Understanding.

Depois que um projeto é criado, você precisa seguir as próximas etapas para criar um tipo de documento usando o Forms AI dentro do projeto.

  • Abra seu projeto e clique no botão Novo tipo de documento.



    Uma caixa de diálogo é aberta, solicitando um nome para seu tipo de documento.



Se deseja treinar seus classificadores de documentos diretamente do Document Understanding, pode usar a funcionalidade One Click Classification.

Observação: os formulários de layout fixo usados com o Forms AI podem ter um comprimento máximo de cinco páginas.

Converter um Forms AI em um Tipo de Documento Semiestruturado

Você pode converter um tipo de documento do Forms AI em um tipo de documento semiestruturado.

Ao converter um tipo de documento do Forms AI para um tipo de documento semiestruturado (Document Manager), você pode usar todas as funcionalidades disponíveis no Document Manager

A opção de conversão é ideal para cenários complexos para treinar um modelo de Machine Learning de Deep Learning mais potente.

Como converter uma sessão de IA de formulários

Existem duas opções que você pode escolher se decidir converter uma sessão de IA de formulários em uma sessão do Document Manager.

Na lista Tipos de documentos do projeto

É possível converter um Tipo de documento diretamente da lista de Tipos de documento do projeto.

Acesse o menu Abrir do tipo de documento que deseja converter e clique na opção Converter para Semiestruturado . Uma janela pop-up é exibida solicitando que você confirme as Actions.

Atenção:

Após um Tipo de documento ser convertido, não é possível reverter as Actions.

O exemplo a seguir explica como usar a funcionalidade de conversão.



De uma sessão de IA de formulários aberta

Abra uma sessão do Forms AI já criada para convertê-la em uma sessão semiestruturada.

Na sessão aberta, clique em Acessar menu e, em seguida, clique na opção Converter para semiestruturado.

Atenção: depois que um Tipo de documento for convertido, você não pode reverter a ação.

O botão Converter em Semiestruturado não é exibido se o projeto não tiver um link do AI Center.

O exemplo a seguir explica como usar a funcionalidade de conversão.



Importar documentos

Depois que o novo Forms AI for criado, uma nova janela será aberta, exigindo que você importe os dados. Você pode importar no mínimo dois documentos e no máximo vinte documentos, cada um com no máximo cinco páginas. Arraste e solte ou procure os arquivos para carregá-los.



Importar documentos é outra maneira de converter de Forms AI para o tipo de documento de IA semiestruturada. Uma opção aparece se você tentar carregar mais de 20 documentos ou se algum dos documentos tiver mais de 20 páginas. Um pop-up é exibido na tela, perguntando se você deseja converter a sessão FormsAI em uma semiestruturada.



Os campos extraídos automaticamente também devem ser verificados quanto à precisão do Tipo de conteúdo. Por exemplo, se um campo de data foi extraído automaticamente, o Tipo de Conteúdo deverá ser date. Quaisquer imprecisões devem ser corrigidas manualmente.

Barra de gerenciamento

Na parte superior da página, você pode encontrar a barra de gerenciamento. A barra de gerenciamento permite realizar várias operações: navegar entre documentos, excluir/restaurar um documento, pesquisar/filtrar documentos, executar previsões de modelos de IA, importar e exportar documentos.

Esses são os itens disponíveis na barra de gerenciamento:

Item

Ícone

Description

Navegação

Navegue entre os documentos que correspondam ao filtro ativo.

Entre as duas setas, um contador é exibido. Ele ilustra o número do documento atual do número total de documentos que correspondem à pesquisa/filtro ativo.

Pesquisar e Pesquisar no documento

Pesquisar - inicie uma pesquisa ou filtre os documentos. O filtro também é aplicado ao exportar documentos. Você pode filtrar por palavras de um documento ou por nomes de documentos.

Pesquisar no documento - inicie uma pesquisa de texto dentro do documento clicando em ou usando o atalho Ctrl + Shift + F

Excluir / Restaurar

/

Excluir ou restaurar um documento. Os documentos excluídos podem ser encontrados no filtro excluído.

Importar

Abra a caixa de diálogo Importar dados.

Exportar

Abra a caixa de diálogo Exportar arquivos.

Nome e tipo do documento

N/A

O nome do documento atualmente ativo e seu tipo.

Fazer download

A opção está disponível na lista suspensa ao lado do nome do documento.

Clique no ícone para baixar um arquivo Zip contendo o documento original. Além do documento original, todas as páginas convertidas internamente pelo Document Manager para imagens .jpeg também são baixadas.

Excluir permanentemente

docs image

A opção está disponível na lista suspensa ao lado do nome do documento.

Exclui permanentemente arquivos individuais. As imagens .pdf e todas as suas imagens .jpeg são excluídas do conjunto de dados do AI Center e todos os metadados são excluídos do banco de dados.

Ao clicar no botão, uma mensagem pop-up é exibida, perguntando se você tem certeza de que deseja excluir permanentemente o documento. Clique em OK para continuar ou Cancelar para voltar à tela anterior.

Predict

Execute as previsões do modelo de IA e exiba os resultados.

Após configurar a Pré-rotulagem, o botão é habilitado na barra de gerenciamento. Clique nele para pré-rotular o documento atual.

No momento, usar a opção Prever com Pontos de extremidade públicos pré-rotula apenas as primeiras 10 páginas de um documento. Este é um problema conhecido e uma correção está em andamento. Usar a opção Prever com Habilidades de ML no AI Center, no entanto, não impõe essa limitação.

Publicar

Publica o extrator Forms AI e cria o link associado, disponível na lista de extratores do projeto.

Configurações

Defina as configurações de OCR e Pré-rotulagem ou acesse o painel Como fazer....

O botão de configurações tem duas opções disponíveis:

  • Configurações, onde você pode visualizar a definições de OCR, que é preenchida automaticamente a partir das Configurações do projeto.
  • Omodo de acessibilidade torna os valores brutos visíveis

  • Como fazer... , onde você pode encontrar todos os atalhos e controles disponíveis.

Sessão

N/A

O nome da sessão atual, localizado na parte superior da página, ao lado do logotipo UiPath Document Understanding.

Vamos entender um pouco mais a fundo a diferença entre as opções Excluir e Excluir permanentemente.

  • A opção Excluir exclui os arquivos, sem removê-los permanentemente do seu projeto. Você ainda pode encontrar os arquivos excluídos no filtro excluído da barra de Pesquisa e restaurá-los usando a opção Restaurar .
  • A opção Excluir permanentemente remove os arquivos selecionados sem qualquer possibilidade de restaurá-los.

    Consulte abaixo o uso de ambas as opções:



O botão Configurações tem duas opções disponíveis:

  • Configurações - onde você pode configurar o serviço de OCR
  • Como fazer... - cujo propósito é ser um menu de ajuda


Campos de coluna

Criar um novo campo de coluna

  1. Clique em docs image na seção de tabela na parte superior da página para adicionar um novo campo Coluna. A janela Criar campo de coluna é exibida.
  2. Preencha um nome exclusivo para o campo no espaço Inserir nome único de campo. O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado _ e traço -.
  3. Clique em OK.

Editar um campo de coluna

Clique no botão Editar campo. As opções disponíveis para campos de coluna podem ser encontradas na tabela abaixo.

Opção

Description

Nome do campo

O nome exclusivo para o campo.

O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado _ e traço -.

Tipo de Conteúdo

O tipo de conteúdo de um campo:

  • string: apropriado para nomes ou endereços de empresas, bem como condições de pagamento ou para qualquer outro campo em que o desenvolvedor de RPA prefira construir a lógica de análise ou formatação manualmente, no fluxo de trabalho de RPA.
  • number: apropriado para valores ou quantidades, com análise inteligente dos separadores decimais/de milhares.
  • date: o modelo analisa, formata e unifica a saída em formato aaaa-mm-dd.
  • phone: apropriado para números de telefone. A formatação remove letras e parênteses e substitui espaços por traços.
  • id-no: apropriado para códigos alfanuméricos, números de identificação, é semelhante ao tipo de conteúdo string, mas inclui a remoção de quaisquer caracteres antes de dois pontos :. Se o número de identificação que você precisa extrair pode conter dois-pontos :caracteres, use string como tipo de conteúdo para evitar perda de dados.

Atalho

A tecla de atalho para o campo. Uma ou duas chaves permitidas.

Dividir itens

Marque esta caixa de seleção se deseja que este campo seja usado como delimitador entre itens de linha ou linhas em uma tabela. Qualquer linha na qual esse campo apareça é considerada um novo item de linha ou linha na tabela. É mais comumente usado em campos Valor de linha nos itens de linha Fatura.

Clique em Salvar para salvar suas configurações.

O Agrupamento de linhas da tabela é diferente daquele no AI Center Document Manager. Aqui, as linhas são agrupadas automaticamente com base no estado da caixa de seleção Dividir itens nos campos de cada coluna. Isso é relevante apenas para tabelas com linhas que contêm várias linhas de texto. Nesse caso, você deve marcar a caixa de seleção Dividir itens em qualquer um dos campos que tenham apenas uma linha para cada linha da tabela. Por exemplo, em uma fatura, o valor do item de linha seria um campo típico no qual você pode marcar a opção Dividir itens. No contexto do Forms AI, você faria a mesma coisa nos formulários.

O exemplo abaixo mostra uma descrição de linha de duas linhas para um item. Para este caso, o campo da coluna descrição não tem a opção Dividir itens marcada, enquanto os outros dois campos da coluna têm a opção Dividir itens marcada.



Excluir um campo de coluna

Para excluir um campo de coluna, siga estas etapas:

  1. Clique no botão docs image Editar campo correspondente ao campo de coluna que deseja excluir.
  2. Clique no botão Excluir.
  3. Clique em OK.
  4. O campo da coluna e seus dados rotulados associados são excluídos.

Campos

Criar um novo campo

  1. Clique em docs image no painel direito na seção Campos. A janela Criar um novo campo regular é exibida.
  2. Preencha um nome exclusivo para o campo no espaço Inserir nome único de campo. O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado _ e traço -.
  3. Clique em OK.

Excluir todos os campos

  1. Clique em docs image na seção de tabela localizada na parte superior da página para excluir todos os campos criados. Use esta função para excluir todos os campos, incluindo campos Regular e de Coluna, e todos os rótulos nos documentos da coleção atual de Tipo de Documento. Esta ação não pode ser desfeita.
  2. Clique no botão Excluir na caixa de diálogo Excluir todos os campos.

Editar um campo

Clique no botão Editar campo. As opções disponíveis para campos regulares podem ser encontradas na tabela abaixo.

Opção

Description

Nome do campo

O nome exclusivo para o campo.

O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado _ e traço -.

Tipo de Conteúdo

O tipo de conteúdo de um campo:

  • string: apropriado para nomes ou endereços de empresas, bem como condições de pagamento ou para qualquer outro campo em que o desenvolvedor de RPA prefira construir a lógica de análise ou formatação manualmente, no fluxo de trabalho de RPA.
  • number: apropriado para valores ou quantidades, com análise inteligente dos separadores decimais/de milhares.
  • date: o modelo analisa, formata e unifica a saída em formato aaaa-mm-dd.
  • phone: apropriado para números de telefone. A formatação remove letras e parênteses e substitui espaços por traços.
  • id-no: apropriado para códigos alfanuméricos, números de identificação, é semelhante ao tipo de conteúdo string, mas inclui a remoção de quaisquer caracteres antes de dois pontos :. Se o número de identificação que você precisa extrair pode conter dois-pontos :caracteres, use string como tipo de conteúdo para evitar perda de dados.

Atalho

A tecla de atalho para o campo. Uma ou duas chaves permitidas.

Multilinha

Geral

Clique em Salvar para salvar suas configurações.

Excluir um campo regular

Para excluir um campo regular, siga estas etapas:

  1. Clique no botão docs image Editar campo correspondente ao campo regular que deseja excluir.
  2. Clique no botão Excluir.
  3. Clique em OK.
  4. O campo e seus dados rotulados associados são excluídos.

Visualização e rotulagem de documentos

Para documentos de várias páginas, você pode rolar naturalmente pelas páginas como em qualquer visualizador de PDF. Para aumentar ou diminuir o zoom, use Ctrl + rolagem do mouse.

Você pode rotular documentos selecionando as caixas de palavras e atribuindo-as a um campo pressionando uma tecla. Você também pode clicar com o botão direito do mouse na caixa de palavras e verificar as informações extraídas.

Para obter mais detalhes sobre como rotular documentos, visite esta página.

Caixas de seleção

As caixas de seleção disponíveis no Forms AI devem ser rotuladas manualmente para cada campo. As caixas de seleção das tabelas também podem ser rotuladas usando a opção Campos de coluna . Quando uma caixa de seleção é rotulada no Forms AI, as caixas marcadas e desmarcadas devem ser consideradas.

Aqui , você pode encontrar informações mais detalhadas sobre como rotular as caixas de seleção.

Você pode optar por integrar seu projeto do Document Understanding em um fluxo de trabalho de RPA seguindo as etapas apresentadas aqui.

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.