- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Pacotes de ML
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Endpoints públicos
- Idiomas suportados
- Painéis de insights
- Dados e segurança
- Licenciamento
- Como fazer
Anotar documentos
Depois de criar com sucesso seu projeto e carregar seus documentos para um tipo de documento específico, eles serão pré-anotados automaticamente. Isso é feito usando uma combinação de modelos generativos e especializados, com base no esquema do tipo de documento. O esquema define claramente os campos que você deseja extrair de um tipo de documento específico. Para encontrar o esquema do tipo de documento, acesse a página Anotação e verifique a seção Campos.
As pré-anotações são indicadas com sublinhados no texto dentro do documento e não podem ser excluídas. Se estiverem incorretas e não puderem ser correspondidas a um campo específico, você pode ignorá-las. Durante o processo de treinamento, apenas campos confirmados são usados para treinamento, enquanto os sublinhados não são levados em consideração.
À medida que você continua a adicionar mais anotações, os sublinhados pré-anotados devem se alinhar progressivamente à sua entrada. Pode haver algumas inconsistências entre sublinhados e campos anotados pelo usuário no começo. No entanto, à medida que você faz mais anotações e o modelo melhora, os sublinhados devem se alinhar com mais precisão aos dados fornecidos pelo usuário.
Na imagem a seguir, o endereço de envio foi pré-anotado incorretamente para incluir o nome da pessoa.
Para corrigir isso, você só precisa confirmar o endereço de envio. Não é necessário remover o texto sublinhado relacionado ao nome. À medida que você continua com sua anotação e corrige esses erros, as ocasiões em que o texto sublinhado não se alinhar ao campo confirmado devem diminuir.
- Os tipos de documentos personalizados não são anotados automaticamente. Você precisa pré-anotar manualmente documentos que são um tipo de documento personalizado.
- Para disparar o treinamento do modelo, é necessário um mínimo de 40 operações. Por exemplo, se você tiver 20 documentos, você precisaria anotar pelo menos dois campos por documento, resultando em um total de 40 operações.
Depois que todos os documentos forem carregados e pré-anotados, seu objetivo será validar ou modificar os campos pré-anotados. Para um documento em que todos os campos são pré-anotados com precisão, selecione Confirmar para aprovar todos os campos de uma vez. Um documento, uma vez confirmado, será significado com um símbolo de blindagem verde na lista de documentos.
Se um documento for confirmado apenas parcialmente, ele será marcado com um símbolo de blindagem vazio na lista de documentos. Isso simboliza que o processo de anotação para esse documento específico está em progresso. Seu objetivo final deve ser garantir que todos os documentos estejam Confirmados.
- A pré-anotação está correta e deve ser validada.
- A pré-anotação não está correta, e o campo está presente no documento.
- A pré-anotação não está correta, e o campo está ausente no documento.
- Não há pré-anotação.
Se a pré-anotação estiver incorreta, escolha o texto e o campo corretos e selecione Confirmar.
Você pode alterar as configurações do tipo de documento na visualização Anotar.
Para fazer isso, clique no ícone de três pontos ⁝ no lado direito do campo Pesquisar nomes de documentos e selecione Configurações.
- Modelo base: as estimativas de tamanho do conjunto de dados usadas nas Ações recomendadas dependem do modelo base usado no treinamento. Usar o modelo de base mais semelhante ao tipo de documento reduzirá a quantidade da tarefa de anotação necessária.
- Número de idiomas: a estimativa de tamanho do conjunto de dados usada nas Ações recomendadas depende do número de idiomas no conjunto de dados. Mais idiomas geralmente exigem mais anotações.