- Visão geral
- Introdução
- Atividades
- Painéis de insights
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Limitações de tráfego
- Configuração de OCR
- Pipelines
- Serviços de OCR
- Idiomas suportados
- Aprendizagem profunda
- Licenciamento
Guia do usuário do Document Understanding.
IA de formulários
A Forms AI faz parte do Document UnderstandingTM e pode ser usada para carregar e processar formulários estruturados com layouts e campos padrão.
O Forms AI é o primeiro método de extração disponível no Document Understanding. Leia mais informações sobre como criar um novo projeto no Document Understanding.
Depois que um projeto é criado, você precisa seguir as próximas etapas para criar um tipo de documento usando o Forms AI dentro do projeto.
- Abra seu projeto.
- Selecione o botão Novo tipo de documento.
- Adicione um nome para seu tipo de documento.
Se deseja treinar seus classificadores de documentos diretamente do Document Understanding, pode usar a funcionalidade One Click Classification.
Você pode converter um tipo de documento do Forms AI em um tipo de documento semiestruturado.
Ao converter um tipo de documento do Forms AI para um tipo de documento semiestruturado (Document Manager), você pode usar todas as funcionalidades disponíveis no Document Manager
A opção de conversão é ideal para cenários complexos para treinar um modelo de Machine Learning de Deep Learning mais potente.
Existem duas opções que você pode escolher se decidir converter uma sessão de IA de formulários em uma sessão do Document Manager.
É possível converter um Tipo de documento diretamente da lista de Tipos de documento do projeto.
Acesse o menu Abrir do tipo de documento que deseja converter e clique na opção Converter para Semiestruturado . Uma janela pop-up é exibida solicitando que você confirme as Actions.
Após um Tipo de documento ser convertido, não é possível reverter as Actions.
Abra uma sessão do Forms AI já criada para convertê-la em uma sessão semiestruturada.
Na sessão aberta, clique no menu Acessarem seguida, clique na opção Converter para semiestruturada .
O botão Converter em Semiestruturado não é exibido se o projeto não tiver um link do AI Center.
Depois que o novo Forms AI for criado, uma nova janela será aberta, exigindo que você importe os dados. Você pode importar no mínimo dois documentos e no máximo vinte documentos, cada um com no máximo cinco páginas. Arraste e solte ou procure os arquivos para carregá-los.
Importar documentos é outra maneira de converter de Forms AI para o tipo de documento de IA semiestruturada. Uma opção aparece se você tentar carregar mais de 20 documentos ou se algum dos documentos tiver mais de 20 páginas. Um pop-up é exibido na tela, perguntando se você deseja converter a sessão FormsAI em uma semiestruturada.
Os campos extraídos automaticamente também devem ser verificados quanto à precisão do Tipo de conteúdo. Por exemplo, se um campo de data foi extraído automaticamente, o Tipo de Conteúdo deverá ser date. Quaisquer imprecisões devem ser corrigidas manualmente.
Na parte superior da página, você pode encontrar a barra de gerenciamento. A barra de gerenciamento permite realizar várias operações: navegar entre documentos, excluir/restaurar um documento, pesquisar/filtrar documentos, executar previsões de modelos de IA, importar e exportar documentos.
Esses são os itens disponíveis na barra de gerenciamento:
Item |
Ícone |
Description |
---|---|---|
Navegação |
|
Navegue entre os documentos que correspondam ao filtro ativo. Entre as duas setas, um contador é exibido. Ele ilustra o número do documento atual do número total de documentos que correspondem à pesquisa/filtro ativo. |
Pesquisar e Pesquisar no documento |
|
Pesquisar - inicie uma pesquisa ou filtre os documentos. O filtro também é aplicado ao exportar documentos. Você pode filtrar por palavras de um documento ou por nomes de documentos. Pesquisar no documento - inicie uma pesquisa de texto dentro do documento clicando em ou usando o atalho Ctrl + Shift + F |
Excluir / Restaurar |
/ |
Excluir ou restaurar um documento. Os documentos excluídos podem ser encontrados no filtro excluído. |
Importar |
|
Abra a caixa de diálogo Importar dados. |
Exportar |
|
Abra a caixa de diálogo Exportar arquivos. |
Nome e tipo do documento |
N/A |
O nome do documento atualmente ativo e seu tipo. |
Fazer download |
|
A opção está disponível na lista suspensa ao lado do nome do documento. Clique no ícone para baixar um arquivo Zip contendo o documento original. Além do documento original, todas as páginas convertidas internamente pelo Document Manager para imagens
.jpeg também são baixadas.
|
Excluir permanentemente |
A opção está disponível na lista suspensa ao lado do nome do documento. Exclui permanentemente arquivos individuais. As imagens
.pdf e todas as suas imagens .jpeg são excluídas do conjunto de dados do AI Center e todos os metadados são excluídos do banco de dados.
Ao clicar no botão, uma mensagem pop-up é exibida, perguntando se você tem certeza de que deseja excluir permanentemente o documento. Clique em OK para continuar ou Cancelar para voltar à tela anterior. | |
Predict |
|
Execute as previsões do modelo de IA e exiba os resultados. Após configurar a Pré-rotulagem, o botão é habilitado na barra de gerenciamento. Clique nele para pré-rotular o documento atual. No momento, usar a opção Prever com Pontos de extremidade públicos pré-rotula apenas as primeiras 10 páginas de um documento. Este é um problema conhecido e uma correção está em andamento. Usar a opção Prever com Habilidades de ML no AI Center, no entanto, não impõe essa limitação. |
Publicar |
|
Publica o extrator Forms AI e cria o link associado, disponível na lista de extratores do projeto. |
Configurações |
|
Defina as configurações de OCR e Pré-rotulagem ou acesse o painel Como fazer.... O botão de configurações tem duas opções disponíveis:
|
Sessão |
N/A |
O nome da sessão atual, encontrado na parte superior da página, ao lado do logotipo da UiPath® Document UnderstandingTM. |
Vamos entender um pouco mais a fundo a diferença entre as opções Excluir e Excluir permanentemente.
- A opção Excluir exclui os arquivos, sem removê-los permanentemente do seu projeto. Você ainda pode encontrar os arquivos excluídos no filtro excluído da barra de Pesquisa e restaurá-los usando a opção Restaurar .
- A opção Excluir permanentemente remove os arquivos selecionados sem qualquer possibilidade de restaurá-los.
O botão Configurações tem duas opções disponíveis:
- Configurações - onde você pode configurar o serviço de OCR
- Como fazer... - cujo propósito é ser um menu de ajuda
- Clique em na seção de tabela na parte superior da página para adicionar um novo campo Coluna. A janela Criar campo de coluna é exibida.
- Preencha um nome exclusivo para o campo no espaço Inserir nome único de campo. O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado
_
e traço-
. - Clique em OK.
Clique no botão Editar campo. As opções disponíveis para campos de coluna podem ser encontradas na tabela abaixo.
Opção |
Description |
---|---|
Nome do campo |
O nome exclusivo para o campo. O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado
_ e traço - .
|
Tipo de Conteúdo |
O tipo de conteúdo de um campo:
|
Atalho |
A tecla de atalho para o campo. Uma ou duas chaves permitidas. |
Dividir itens |
Marque esta caixa de seleção se deseja que este campo seja usado como delimitador entre itens de linha ou linhas em uma tabela. Qualquer linha na qual esse campo apareça é considerada um novo item de linha ou linha na tabela. É mais comumente usado em campos Valor de linha nos itens de linha Fatura. |
Clique em Salvar para salvar suas configurações.
O Agrupamento de linhas da tabela é diferente daquele no AI Center Document Manager. Aqui, as linhas são agrupadas automaticamente com base no estado da caixa de seleção Dividir itens nos campos de cada coluna. Isso é relevante apenas para tabelas com linhas que contêm várias linhas de texto. Nesse caso, você deve marcar a caixa de seleção Dividir itens em qualquer um dos campos que tenham apenas uma linha para cada linha da tabela. Por exemplo, em uma fatura, o valor do item de linha seria um campo típico no qual você pode marcar a opção Dividir itens. No contexto do Forms AI, você faria a mesma coisa nos formulários.
- Clique em no painel direito na seção Campos. A janela Criar um novo campo regular é exibida.
- Preencha um nome exclusivo para o campo no espaço Inserir nome único de campo. O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado
_
e traço-
. - Clique em OK.
- Clique em na seção de tabela localizada na parte superior da página para excluir todos os campos criados. Use esta função para excluir todos os campos, incluindo campos Regular e de Coluna, e todos os rótulos nos documentos da coleção atual de Tipo de Documento. Essa ação não pode ser desfeita.
- Clique no botão Excluir na caixa de diálogo Excluir todos os campos.
Editar um campo
Clique no botão Editar campo. As opções disponíveis para campos regulares podem ser encontradas na tabela abaixo.
Opção |
Description |
---|---|
Nome do campo |
O nome exclusivo para o campo. O campo não aceita letras maiúsculas. Pode conter apenas letras minúsculas, números, sublinhado
_ e traço - .
|
Tipo de Conteúdo |
O tipo de conteúdo de um campo:
|
Atalho |
A tecla de atalho para o campo. Uma ou duas chaves permitidas. |
Multilinha |
Geral |
Clique em Salvar para salvar suas configurações.
Ctrl
+ rolagem do mouse.
Você pode rotular documentos selecionando as caixas de palavras e atribuindo-as a um campo pressionando uma tecla. Você também pode clicar com o botão direito do mouse na caixa de palavras e verificar as informações extraídas.
Para obter mais detalhes sobre como rotular documentos, visite esta página.
As caixas de seleção disponíveis no Forms AI devem ser rotuladas manualmente para cada campo. As caixas de seleção das tabelas também podem ser rotuladas usando a opção Campos de coluna . Quando uma caixa de seleção é rotulada no Forms AI, as caixas marcadas e desmarcadas devem ser consideradas.
Aqui , você pode encontrar informações mais detalhadas sobre como rotular as caixas de seleção.
Você pode optar por integrar seu projeto do Document Understanding em um fluxo de trabalho de RPA seguindo as etapas apresentadas aqui.
- Criar IA de formulários
- Converta um Forms AI em um tipo de documento semiestruturado
- Como converter uma sessão do Forms AI
- Na lista Tipos de documentos do projeto
- De uma sessão de IA de formulários aberta
- Importar documentos
- Barra de gerenciamento
- Campos de coluna
- Criar um novo campo de coluna
- Editar um campo de coluna
- Excluir um campo de coluna
- Campos
- Criar um novo campo
- Excluir todos os campos
- Excluir um campo regular
- Visualização e rotulagem de documentos
- Caixas de seleção