Atividades - Classificador generativo

activities

latest

false

Atividades do Document Understanding

Importante :

A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Classificador generativo — Boas práticas

Boas práticas para classificar documentos usando modelos generativos em fluxos de trabalho IntelligentOCR.

O classificador generativo permite classificar documentos usando modelos generativos. Você pode encontrar dicas e truques sobre como obter o máximo proveito dos seus fluxos de trabalho com o classificador generativo nesta página.

Classificação de um grande número de documentos

Considere que você tem um grande número de contratos que precisa classificar em diferentes categorias. Para otimizar esse processo com o classificador generativo, siga as boas práticas descritas nesta página.

Otimizando seus prompts de entrada

Para otimizar seus prompts de entrada, forneça o máximo de contexto possível. Forneça uma descrição detalhada de cada tipo de documento. Por exemplo, o seguinte texto pode ser considerado ao classificar uma fatura: “Uma fatura é um documento emitido por um vendedor a um comprador, detalhando produtos ou serviços fornecidos, suas quantidades e preços. Isso inclui detalhes do vendedor e do comprador, número da fatura, data, valor total devido e condições de pagamento. As faturas são usadas para solicitar pagamentos e manutenção de registros em transações comerciais"

Para que o modelo generativo funcione de forma eficaz, é necessário fornecer um contexto amplo, em vez de descrições breves e vagas no estilo de documento, que podem resultar em erros óbvios.

Como otimizar seu fluxo de trabalho

Para otimizar seu fluxo de trabalho, comece criando uma pasta para mover arquivos classificados para evitar classificação redundante.

Crie um conjunto de amostra de documentos antes de automatizar um conjunto de dados maior. Esse conjunto de amostra deve incluir PDFs corrompidos e protegidos por senha para testar o fluxo de trabalho. Como uma boa prática, inclua uma atividade Teste de Captura no fluxo de trabalho para evitar falhas que possam ocorrer devido a arquivos PDF corrompidos ou protegidos por senha. Depois que a atividade Teste de Captura estiver em vigor, o fluxo de trabalho poderá ser testado no conjunto de amostra para garantir sua eficácia.

No fluxo de trabalho, resultados de digitalização de cache (texto de documentos e modelo de objeto de documento) para economizar tempo ao testar várias vezes no mesmo arquivo.

Nesta página

Classificação de um grande número de documentos
Otimizando seus prompts de entrada
Como otimizar seu fluxo de trabalho

Esta página foi útil?

AnteriorExtrator generativo — boas práticas

AvançarNotas de versão

Classificação de um grande número de documentos​

Otimizando seus prompts de entrada​

Como otimizar seu fluxo de trabalho​

Esta página foi útil?

Classificação de um grande número de documentos

Otimizando seus prompts de entrada

Como otimizar seu fluxo de trabalho