Atividades - Extrator generativo

activities

latest

false

Atividades do Document Understanding

Importante :

A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Extrator generativo — boas práticas

Boas práticas para extrair dados de documentos usando prompts generativos dentro de fluxos de trabalho das Atividades do Document Understanding.

Observação:

Para maior estabilidade, o número de solicitações é limitado ao máximo de 50.
A resposta, resultado da extração, também chamada de Conclusão, tem um limite de 700 palavras. O número é de até 700 palavras. Isso significa que você não pode extrair mais de 700 palavras de um único prompt. Se os requisitos de extração forem superiores a esse limite, você poderá dividir o documento em várias páginas, processá-las individualmente e, então, mesclar os resultados.

Use linguagem precisa

Imagine que você está fazendo a quatro ou cinco pessoas diferentes a pergunta que você gostaria de fazer no prompt generativo. Se você consegue visualizar essas pessoas dando respostas ligeiramente diferentes, então sua linguagem é muito ambígua e você precisa reescrever para torná-la mais precisa.

Especifique um formato de saída

Para tornar sua pergunta mais específica, peça ao extrator para retornar a resposta em um formato padronizado. Isso reduz a ambiguidade, aumenta a precisão das respostas e simplifica o processamento subsequente.

Por exemplo, se estiver pedindo ao prompt generativo que obtenha uma data, especifique como deseja que a data retorne: return date in yyyy-mm-dd format. Se você precisar apenas do ano, especifique: return the year, as a four digit number.

Você também pode usar essa abordagem para números. Por exemplo, você pode especificar: return numbers which appear in parentheses as negative ou return number in ##,###.## format para padronizar o separador decimal e o separador de milhares para facilitar o processamento subsequente.

Forneça opções esperadas

Um caso especial de formatação ocorre quando a resposta faz parte de um conjunto conhecido de possíveis respostas.

Por exemplo, em um formulário de aplicativo, você pode perguntar: What is the applicant’s marital status? Possible answers: Married, Unmarried, Separated, Divorced, Widowed, Other.

Isso não apenas simplifica o processamento subsequente, mas também aumenta a precisão das respostas.

Etapa por etapa

Para maximizar a precisão, divida perguntas complexas em etapas simples. Em vez de perguntar What is the termination date of this contract?, você deve perguntar First find termination section of contract, then determine termination date, then return date in yyyy-mm-dd format.

Há muitas maneiras de desmembrar suas perguntas. Você pode até escrever sua solicitação como um pequeno programa de computador, como o seguinte:

Execute the following program:

Find termination section or clause

Find termination date

Return termination date in yyyy-mm-dd format

Stop
Execute the following program:

Find termination section or clause

Find termination date

Return termination date in yyyy-mm-dd format

Stop

Definir o que você deseja em um estilo de programação, potencialmente até mesmo usando a sintaxe JSON ou XML, força o modelo Generativo a usar suas habilidades de programação, o que aumenta a precisão ao seguir instruções.

Evite problemas aritméticos ou lógicos

Não peça ao extrator para realizar somas, multiplicação, subtração, comparações ou qualquer outra operação aritmética, pois ele comete erros básicos, além de ser muito lento e caro em comparação com um fluxo de trabalho de robô simples, que nunca cometerá erros e é muito mais rápido e barato.

Não peça para que ele realize lógica complexa do tipo se-então-senão, pelas mesmas razões mencionadas acima. O fluxo de trabalho do robô é muito mais preciso e eficiente com esse tipo de operações.

Tabelas

O Extrator generativo atualmente não suporta campos de coluna. Embora você possa extrair tabelas menores por meio de perguntas regulares e analisar sua saída, observe que essa é apenas uma solução alternativa e vem com restrições. Ele não foi projetado nem é recomendado para extrair tabelas genéricas e arbitrariamente grandes.

Extrair dados de tabelas é um desafio para o extrator Generativo, pois a tecnologia de IA Generativa opera em sequências lineares de texto e não compreende informações visuais bidimensionais em imagens.

Para extração de tabela usando modelos generativos, você pode usar o recurso do UiPath IXP™, Extrações generativas para documentos complexos e não estruturados.

Nível confidencial

Os modelos de IA Generativa não fornecem níveis de confiança para as previsões. No entanto, o objetivo é detectar erros, e os níveis de confiança são apenas uma maneira possível de alcançar esse objetivo — e não a melhor. Uma maneira muito melhor e mais confiável de detectar erros é fazer a mesma pergunta de várias maneiras diferentes. Quanto mais diferente for a declaração da pergunta, melhor. Se todas as respostas convergem para um resultado comum, a probabilidade de erro é muito baixa. Se as respostas discordarem, a probabilidade de erro é alta.

Por exemplo, você pode repetir a mesma pergunta duas, três ou até cinco vezes (dependendo de quão crucial é evitar erros não detectados em seu procedimento), combinando as sugestões mencionadas acima em combinações variadas. Se todas as respostas forem consistentes, a revisão humana pode não ser necessária. No entanto, se alguma das respostas diferir, poderá ser necessária a revisão manual por uma pessoa do Action Center.

Nesta página

Use linguagem precisa
Especifique um formato de saída
Forneça opções esperadas
Etapa por etapa
Evite problemas aritméticos ou lógicos
Tabelas
Nível confidencial

Esta página foi útil?

AnteriorCriar pré-contratação no Workday com base no CV

AvançarClassificador generativo — Boas práticas

Use linguagem precisa​

Especifique um formato de saída​

Forneça opções esperadas​

Etapa por etapa​

Evite problemas aritméticos ou lógicos​

Tabelas​

Nível confidencial​