- Visão geral
- Introdução
- Atividades
- Painéis de insights
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Limitações de tráfego
- Configuração de OCR
- Pipelines
- Serviços de OCR
- Idiomas suportados
- Aprendizagem profunda
- Licenciamento
Guia do usuário do Document Understanding.
Pesquisar documentos
Três recursos de pesquisa estão disponíveis no total, dois estão presentes na barra de gerenciamento, na parte superior da página e um está usando a ação no canto inferior esquerdo da página.
A funcionalidade Pesquisar da barra de gerenciamento consiste em:
- Pesquisar usando os filtros internos: filtra os documentos com base nas opções de lote/categoria disponíveis no menu suspenso.
Atenção:
Selecionar mais opções torna a pesquisa mais restritiva. Por exemplo, selecionar Batch import1 e Excluído traz apenas os documentos importados na Batch import1 que são excluídos.
Tome nota de combinações que sempre geram uma lista vazia: selecionar Batch import1 e Batch import2 nunca gera um documento já que a seleção é restritiva e nenhum documento pode estar em dois lotes ao mesmo tempo.
- Pesquisar em todos os documentos no conjunto de dados usando palavras-chave: essa entrada de pesquisa filtra as informações com base na entrada de texto. Você deve inserir a(s) palavra(s)-chave como texto livre no campo de pesquisa. A pesquisa busca a(s) palavra(s)-chave no conteúdo de um documento ou no nome do documento. A pesquisa de várias palavras retorna resultados quando as palavras são adjacentes, excluindo qualquer pontuação entre elas.
- Pesquisar dentro do documento exibido atualmente: permite pesquisar instâncias de texto apenas em seu documento atual. A barra de pesquisa, , pode ser encontrado no lado inferior esquerdo da tela.
Cada filtro exibe entre parênteses o número de documentos que atendem aos critérios.
Existem sete palavras-chave predefinidas, a saber:
- Conjunto de treinamento e validação
- Conjunto de treinamento
- Conjunto de avaliação
- Conjunto de validação
- Excluído
- com rótulo
- sem rótulo
Observe que, para Forms AI, apenas os seguintes filtros integrados estão disponíveis: excluído, rotulado, não rotulado.
Além dessas palavras-chave predefinidas, você também pode filtrar com base em lotes nomeados, dependendo de quantos lotes você importou para o Document Manager:
- Lote <batch_name_1>
- Lote <batch_name_2>
- Lote <batch_name_3>
- etc.
Você deve inserir a(s) palavra(s)-chave como texto livre no campo Pesquisar. A pesquisa busca a(s) palavra(s)-chave no conteúdo de um documento ou no nome do documento.
Você pode pesquisar usando mais de uma palavra de texto: apenas os documentos que contêm essas palavras específicas, uma após a outra, são exibidos.
A pesquisa não diferencia maiúsculas de minúsculas.
Você pode filtrar usando uma palavra-chave: por exemplo, se você selecionar rotulado, apenas os documentos rotulados serão exibidos
Você pode filtrar usando mais de uma palavra-chave: por exemplo, se você selecionar rotulado e conjunto de treinamento, apenas os documentos rotulados marcados como treinados serão exibidos. A ordem em que as palavras-chave aparecem não importa.
Inicie uma pesquisa no documento atual clicando no ícone na parte inferior esquerda da tela, digitando o texto que deseja pesquisar e pressionando Enter.
Todas as instâncias de texto correspondentes à pesquisa são destacadas em amarelo e o visualizador de documentos é rolado automaticamente para a primeira posição. Para navegar de uma instância de texto para outra, pressione Enter ou Page Down e Page Up.
A opção Pesquisar possui um menu suspenso que, ao ser aberto, exibe os seguintes filtros:
- Conjunto de treinamento — Indica o número de documentos a serem usados para treinar o modelo. Ação automatizada.
- Conjunto de validação — Indica o número de documentos a serem usados para validar o modelo após a conclusão do treinamento. A divisão entre os conjuntos de treinamento e validação é de 80% e 20%. Ação automatizada.
- Conjunto de treinamento e validação - Indica o número de documentos encontrados nos filtros train-set e validate-set. Ação automatizada.
- Evaluation-set — indica o número de documentos que tiveram a caixa de seleção do conjunto de avaliação marcada durante a importação e devem ser usados para avaliar o modelo no estágio de pipeline de treinamento. Mais informações podem ser encontradas aqui. Ação manual.
- excluído - Especifica o número de documentos excluídos. Mais informações podem ser encontradas aqui.
- labelled- Especifica o número de documentos que possuem rótulos. Um rótulo é definido por pelo menos um campo marcado/editado manualmente por documento.
- unlabelled - Especifica o número de documentos que não possuem rótulos.
- Nome do lote - Especifica os documentos que foram incluídos na mesma ação de importação.
A alocação de um documento para os conjuntos de treinamento ou validação é feita pelo aplicativo no momento da importação.
Os documentos importados acabam no conjunto de avaliação se a caixa de seleção do conjunto de avaliação estiver marcada durante a importação.