Atividades
Mais recente
falso
Imagem de fundo do banner
Atividades de Document Understanding
Última atualização 29 de abr de 2024

Extrator generativo - boas práticas

Observação: para uma melhor estabilidade, limite o número de solicitações para não mais do que 30 por chamada.

Use linguagem precisa

Imagine que você está fazendo a quatro ou cinco pessoas diferentes a pergunta que você gostaria de fazer no prompt generativo. Se você consegue visualizar essas pessoas dando respostas ligeiramente diferentes, então sua linguagem é muito ambígua e você precisa reescrever para torná-la mais precisa.

Especifique um formato de saída

Para tornar sua pergunta mais específica, peça ao extrator para retornar a resposta em um formato padronizado. Isso reduz a ambiguidade, aumenta a precisão das respostas e simplifica o processamento subsequente.

Por exemplo, se estiver pedindo ao prompt generativo que obtenha uma data, especifique como deseja que a data retorne: return date in yyyy-mm-dd format. Se você precisar apenas do ano, especifique: return the year, as a four digit number.
Você também pode usar essa abordagem para números. Por exemplo, você pode especificar: return numbers which appear in parentheses as negative ou return number in ##,###.## format para padronizar o separador decimal e o separador de milhares para facilitar o processamento subsequente.

Forneça opções esperadas

Um caso especial de formatação ocorre quando a resposta faz parte de um conjunto conhecido de possíveis respostas.

Por exemplo, em um formulário de aplicativo, você pode perguntar: What is the applicant’s marital status? Possible answers: Married, Unmarried, Separated, Divorced, Widowed, Other.

Isso não apenas simplifica o processamento subsequente, mas também aumenta a precisão das respostas.

Etapa por etapa

Para maximizar a precisão, divida perguntas complexas em etapas simples. Em vez de perguntar What is the termination date of this contract?, você deve perguntar First find termination section of contract, then determine termination date, then return date in yyyy-mm-dd format.
Há muitas maneiras de desmembrar suas perguntas. Você pode até mesmo escrever sua solicitação como um pequeno programa de computador:
Execute the following program:

1: Find termination section or clause

2: Find termination date

3: Return termination date in yyyy-mm-dd format

4: StopExecute the following program:

1: Find termination section or clause

2: Find termination date

3: Return termination date in yyyy-mm-dd format

4: Stop

Definir o que você deseja em um estilo de programação, potencialmente até mesmo usando a sintaxe JSON ou XML, força o modelo Generativo a usar suas habilidades de programação, o que aumenta a precisão ao seguir instruções.

Evite problemas aritméticos ou lógicos

Não peça ao extrator para realizar somas, multiplicação, subtração, comparações ou qualquer outra operação aritmética, pois ele comete erros básicos, além de ser muito lento e caro em comparação com um fluxo de trabalho de robô simples, que nunca cometerá erros e é muito mais rápido e barato.

Não peça para que ele realize lógica complexa do tipo se-então-senão, pelas mesmas razões mencionadas acima. O fluxo de trabalho do robô é muito mais preciso e eficiente com esse tipo de operações.

Tabelas

Extrair dados de tabelas é um desafio para o Extrator generativo. A tecnologia de IA generativa opera em strings lineares de texto e não entende informações visuais bidimensionais em imagens. Ele não pode extrair campos de tabela conforme definido no Gerenciador de Taxonomia, mas pode extrair texto e tabelas de documentos.

Para extrair dados de tabelas de maneira otimizada, você pode escolher pelo menos duas abordagens:
  • Peça ao Extrator generativo para retornar colunas separadamente e, em seguida, monte as linhas por conta própria em um fluxo de trabalho. Você pode perguntar: Please return the Unit Prices on this invoice, as a list from top to bottom, as a list in the format [<UnitPrice1>, <UnitPrice2>,…]
  • Peça a ele para retornar cada linha separadamente, como um objeto JSON. Você pode perguntar: Please return the line items of this invoice as an JSON array of JSON objects, each object in format: {"description”: <description>, “quantity”:<quantity>, “unit_price”:<unit price>, “amount”:<amount>}.

Nível confidencial

Os modelos de IA Generativa não fornecem níveis de confiança para as previsões. No entanto, o objetivo é detectar erros, e os níveis de confiança são apenas uma maneira possível de alcançar esse objetivo — e não a melhor. Uma maneira muito melhor e mais confiável de detectar erros é fazer a mesma pergunta de várias maneiras diferentes. Quanto mais diferente for a declaração da pergunta, melhor. Se todas as respostas convergem para um resultado comum, a probabilidade de erro é muito baixa. Se as respostas discordarem, a probabilidade de erro é alta.

Para obter os melhores resultados, recomendamos fazer a mesma pergunta 5 vezes de maneiras diferentes, combinando as recomendações acima. Se todas as 5 respostas forem idênticas, a revisão humana pode não ser necessária. Se uma resposta for diferente, ainda pode haver uma alta probabilidade de que as outras 4 respostas estejam corretas. No entanto, se 2 ou mais respostas forem diferentes, a revisão manual humana no Action Center é necessária.

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.