activities

latest

false

Importante :

A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Atividades de Document Understanding

Última atualização 5 de dez de 2024

Classificador generativo — Boas práticas

O classificador generativo permite classificar documentos usando modelos generativos. Você pode encontrar dicas e truques sobre como obter o máximo proveito dos seus fluxos de trabalho com o classificador generativo nesta página.

Classificação de um grande número de documentos

Considere que você tem um grande número de contratos que precisa classificar em diferentes categorias. Para otimizar esse processo com o classificador generativo, siga as boas práticas descritas nesta página.

Otimizando seus prompts de entrada

Para otimizar seus prompts de entrada, forneça o máximo de contexto possível. Forneça uma descrição detalhada de cada tipo de documento. Por exemplo, o seguinte texto pode ser considerado ao classificar uma fatura: “Uma fatura é um documento emitido por um vendedor a um comprador, detalhando os produtos ou serviços fornecidos, suas quantidades e preços. Inclui os detalhes do vendedor e do comprador, o número da fatura, a data, o valor total devido e as condições de pagamento. As faturas são usadas para solicitar pagamentos e manter registros nas transações comerciais”

Para que o modelo generativo funcione de forma eficaz, é necessário fornecer um contexto amplo, em vez de descrições breves e vagas no estilo de documento, que podem resultar em erros óbvios.

Como otimizar seu fluxo de trabalho

Para otimizar seu fluxo de trabalho, comece criando uma pasta para mover arquivos classificados para evitar classificação redundante.

Crie um conjunto amostral de documentos antes de automatizar um conjunto de dados maior. Esse conjunto de amostra deve incluir PDFs corrompidos e protegidos por senha para testar o fluxo de trabalho. Como uma boa prática, inclua uma atividade Try Catch no fluxo de trabalho para evitar falhas que podem ocorrer devido a arquivos PDF corrompidos ou protegidos por senha. Depois que a atividade Try Catch estiver em vigor, o fluxo de trabalho poderá ser testado no conjunto de amostra para garantir sua eficácia.

No fluxo de trabalho, resultados de digitalização de cache (texto de documentos e modelo de objeto de documento) para economizar tempo ao testar várias vezes no mesmo arquivo.

Nesta página