activities
latest
false
Importante :
A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.
UiPath logo, featuring letters U and I in white

Atividades de Document Understanding

Última atualização 5 de dez de 2024

Extrator generativo — boas práticas

Observação:
  • Para maior estabilidade, o número de solicitações é limitado ao máximo de 50.
  • A resposta, resultado da extração, também chamada de Conclusão, tem um limite de 700 palavras. Isso é limitado a 700 palavras. Isso significa que você não pode extrair mais de 700 palavras de um único prompt. Se seus requisitos de extração excederem esse limite, você poderá dividir o documento em várias páginas, processá-las individualmente e mesclar os resultados posteriormente.

Use linguagem precisa

Imagine que você está fazendo a quatro ou cinco pessoas diferentes a pergunta que você gostaria de fazer no prompt generativo. Se você consegue visualizar essas pessoas dando respostas ligeiramente diferentes, então sua linguagem é muito ambígua e você precisa reescrever para torná-la mais precisa.

Especifique um formato de saída

Para tornar sua pergunta mais específica, peça ao extrator para retornar a resposta em um formato padronizado. Isso reduz a ambiguidade, aumenta a precisão das respostas e simplifica o processamento subsequente.

Por exemplo, se estiver pedindo ao prompt generativo que obtenha uma data, especifique como deseja que a data retorne: return date in yyyy-mm-dd format. Se você precisar apenas do ano, especifique: return the year, as a four digit number.
Você também pode usar essa abordagem para números. Por exemplo, você pode especificar: return numbers which appear in parentheses as negative ou return number in ##,###.## format para padronizar o separador decimal e o separador de milhares para facilitar o processamento subsequente.

Forneça opções esperadas

Um caso especial de formatação ocorre quando a resposta faz parte de um conjunto conhecido de possíveis respostas.

Por exemplo, em um formulário de aplicativo, você pode perguntar: What is the applicant’s marital status? Possible answers: Married, Unmarried, Separated, Divorced, Widowed, Other.

Isso não apenas simplifica o processamento subsequente, mas também aumenta a precisão das respostas.

Etapa por etapa

Para maximizar a precisão, divida perguntas complexas em etapas simples. Em vez de perguntar What is the termination date of this contract?, você deve perguntar First find termination section of contract, then determine termination date, then return date in yyyy-mm-dd format.
Há muitas maneiras de desmembrar suas perguntas. Você pode até escrever sua solicitação como um pequeno programa de computador, como o seguinte:
Execute the following program:

1: Find termination section or clause

2: Find termination date

3: Return termination date in yyyy-mm-dd format

4: StopExecute the following program:

1: Find termination section or clause

2: Find termination date

3: Return termination date in yyyy-mm-dd format

4: Stop

Definir o que você deseja em um estilo de programação, potencialmente até mesmo usando a sintaxe JSON ou XML, força o modelo Generativo a usar suas habilidades de programação, o que aumenta a precisão ao seguir instruções.

Evite problemas aritméticos ou lógicos

Não peça ao extrator para realizar somas, multiplicação, subtração, comparações ou qualquer outra operação aritmética, pois ele comete erros básicos, além de ser muito lento e caro em comparação com um fluxo de trabalho de robô simples, que nunca cometerá erros e é muito mais rápido e barato.

Não peça para que ele realize lógica complexa do tipo se-então-senão, pelas mesmas razões mencionadas acima. O fluxo de trabalho do robô é muito mais preciso e eficiente com esse tipo de operações.

Tabelas

O Extrator generativo atualmente não suporta campos de coluna. Embora você possa extrair tabelas menores por meio de perguntas regulares e analisar sua saída, observe que essa é apenas uma solução alternativa e vem com restrições. Ele não foi projetado nem é recomendado para extrair tabelas genéricas e arbitrariamente grandes.

Extrair dados de tabelas é um desafio para o extrator Generativo, pois a tecnologia de IA Generativa opera em sequências lineares de texto e não compreende informações visuais bidimensionais em imagens. No entanto, você ainda pode extrair dados de tabelas, escolhendo entre pelo menos 2 abordagens diferentes, descritas nos exemplos a seguir:
  • Uma abordagem é pedir ao extrator Generativo para retornar as colunas separadamente e, em seguida, montar as linhas você mesmo em um fluxo de trabalho. Nesse caso, você pode perguntar: Please return the Unit Prices on this invoice, as a list from top to bottom, as a list in the format [<UnitPrice1>, <UnitPrice2>,…]
  • Outra abordagem é pedir que ele retorne cada linha separadamente, como um objeto JSON. Nesse caso, você pode perguntar: Please return the line items of this invoice as an JSON array of JSON objects, each object in format: {"description”: <description>, “quantity”:<quantity>, “unit_price”:<unit price>, “amount”:<amount>}.

Nível confidencial

Os modelos de IA Generativa não fornecem níveis de confiança para as previsões. No entanto, o objetivo é detectar erros, e os níveis de confiança são apenas uma maneira possível de alcançar esse objetivo — e não a melhor. Uma maneira muito melhor e mais confiável de detectar erros é fazer a mesma pergunta de várias maneiras diferentes. Quanto mais diferente for a declaração da pergunta, melhor. Se todas as respostas convergem para um resultado comum, a probabilidade de erro é muito baixa. Se as respostas discordarem, a probabilidade de erro é alta.

Por exemplo, você pode repetir a mesma pergunta duas, três ou até cinco vezes (dependendo de quão crucial é evitar erros não detectados em seu procedimento), combinando as sugestões mencionadas acima em combinações variadas. Se todas as respostas forem consistentes, a revisão humana pode não ser necessária. No entanto, se alguma das respostas diferir, poderá ser necessária a revisão manual por uma pessoa do Action Center.

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.