ixp
latest
false
  • Visão geral
    • Introdução
    • Extraindo Dados de documentos não estruturados
    • Criação e implantação de modelos
    • Cotas
  • Criação do modelo
    • Visão geral
    • Gerenciando projetos
    • Carregando documentos de amostra​
    • Revisando previsões
    • Validando previsões de extração
    • Configuração do modelo
  • Validação do modelo
  • Implantação do modelo
  • Perguntas frequentes
UiPath logo, featuring letters U and I in white

Guia do usuário de Documentos complexos e não estruturados

Última atualização 3 de nov de 2025

Configuração do modelo

Visão geral

Você pode configurar o LLM subjacente, bem como suas definições na opção Configuração do modelo na guia Criar.



As configurações disponíveis são:
  • Pré-processamento inteligente:
    • Nenhum
    • Modelo de tabela - Mini
    • Modelo de tabela
  • Modelo de extração:
    • GPT-4o
    • Gemini
  • Opções avançadas:
    • Atribuição
    • Temperatura
    • P superior
    • Semente
    • Penalidade de frequência
    • Solicitar substituição

Ajuste essas configurações para melhorar a precisão das previsões do modelo e aprimorar seu desempenho.

Pré-processamento inteligente

As opções de pré-processamento inteligentes melhoram o desempenho da previsão quando os documentos são difíceis para os modelos interpretarem, devido à formatação complexa.

Isso inclui as seguintes opções:
  • Nenhum - Essa opção padrão é adequada para a maioria dos documentos que não têm conteúdo tabular.
  • Modelo de tabela - mini - Otimizado para conteúdo tabular e latência. Esta opção é mais adequada para documentos com tabelas simples ou várias tabelas.
  • Modelo de tabela - Otimizado para conteúdo tabular mais complexo. Essa opção é mais adequada para documentos com tabelas aninhadas complexas, tabelas com células mescladas, pontos de marcação ou tabelas que abrangem várias páginas.
    Observação:
    • Embora isso tenha o melhor desempenho em tabelas complexas, ele aumenta a latência das previsões.
    • Essa funcionalidade depende dos modelos do Gemini por meio do AI Trust Layer.

Exemplo de pré-processamento inteligente

A imagem a seguir contém um exemplo de uma extração que consulta o LLM sem usar o modo Modelo de tabela, onde os valores da coluna this period são confundidos com os de outra coluna year to date.

A imagem a seguir contém um exemplo de uma extração usando o modo Modelo de tabela, onde os valores de ambas as colunas, this period e year to date, são extraídos corretamente.

Modelos de extração

A opção Modelo de extração representa o LLM subjacente usado para a extração.

Os modelos disponíveis são:
  • GPT-4o
  • Gemini

Escolha do modelo mais adequado

Diferentes modelos terão um desempenho diferente para diferentes casos de uso, mas recomenda-se que você use o Gemini onde possível. Vários outros recursos de pré e pós-processamento, que ajudam a otimizar o desempenho e a experiência do usuário, também são baseados no Gemini.

O GPT-4o tem uma restrição de 50 páginas e só pode processar mais páginas usando a funcionalidade de chamada iterativa visualizada atualmente.

A Gemini pode processar documentos na Extração e Processamento Inteligente de até 200 páginas em uma única chamada, com contagens de páginas maiores suportadas na visualização. O limite de Gemini pode variar um pouco com base na densidade de valores de campo dentro do documento. O modelo Gemini tem um limite de entrada de 200 páginas por padrão, em comparação com o limite de entrada de 50 páginas do GPT-4o. Além disso, o Gemini tem uma janela de contexto de saída maior, o que permite que ele lide com mais valores de campos.

Mudança de um modelo para outro

Para alternar de um modelo para outro, use a lista suspensa da opção Modelo de extração e selecione Salvar. Isso disparará uma nova versão do projeto a ser criada e novas previsões a serem geradas automaticamente.

Importante: para projetos maduros, as taxonomias, particularmente instruções e previsões confirmadas, especialmente para campos inferidos, são normalmente otimizadas para um tipo de modelo em detrimento de outro. É provável que após a troca, as pontuações de desempenho caiam, pois algumas iterações nas instruções e a reavaliação das previsões podem ser necessárias para desfazer otimizações específicas do modelo que podem afetar o desempenho do outro modelo.

Se você precisar mudar o modelo por motivo de desempenho, verifique primeiro se o modelo alternativo pode resolver o problema principal que o modelo atual não pode solucionar. Se puder, otimize o novo modelo para melhorar as métricas de desempenho em Measure.

Opções avançadas

As opções avançadas permitem que você personalize as configurações para seus modelos, selecione qual método de atribuição usar e use a substituição da solicitação.

Observação: o uso de substituição da solicitação é recomendado apenas em casos excepcionais.

Expandir a configuração para visualização de todas as opções disponíveis:

  • Atribuição - O método usado para atribuir previsões à parte ou texto relevante no documento. Selecione uma das seguintes opções:
    • Baseada em regras - Usa um conjunto extenso de regras e heurísticas para fazer a correspondência dos intervalos corretos em uma página com os valores previstos do modelo. Essa é uma opção de baixa latência, mas sacrifica o desempenho em termos de atribuições bem-sucedidas em comparação com a opção baseada em modelo.
    • Baseada em modelo - Usa uma chamada de LLM adicional para fazer a correspondência bem-sucedida dos valores previstos com os intervalos corretos na página, pois esses valores podem muitas vezes ser repetidos em diferentes partes da página. Essa é a opção de mais desempenho em termos de atribuições bem-sucedidas, mas adiciona alguma latência às previsões. Essa opção depende do uso de modelos do Gemini.
  • Temperatura – A temperatura de amostragem a ser usada. Selecione um número entre 0,0 e 2,0. Valores mais altos tornam a saída mais aleatória.
  • P superior - Amostras apenas de tokens com a massa de probabilidade top_p​. Selecione um número entre 0,0 e 1,0.
  • Semente – Se especificado, as solicitações repetidas com a mesma semente e parâmetros devem retornar o mesmo resultado.
  • Penalidade de frequência – Selecione um número entre -2,0 e 2,0. Os valores positivos reduzem a probabilidade de o modelo repetir tokens que já apareceram no texto.
  • Substituição de solicitação – Substitui a solicitação do sistema padrão por um novo valor. Esta opção está desabilitada por padrão. Uma vez habilitadas, as opções de solicitação Acrescentar instruções de tarefa e Acrescentar instruções de campo são habilitadas para configuração.
Observação: a equipe da UiPath® pesquisou e otimizou os padrões para as configurações do modelo, como Temperatura, P superior e Frequência. Como resultado, você não precisa ajustar esses valores, a menos que você saiba de quais configurações específicas você precisa.

  • Visão geral
  • Pré-processamento inteligente
  • Exemplo de pré-processamento inteligente
  • Modelos de extração
  • Opções avançadas

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo
Confiança e segurança
© 2005-2025 UiPath. Todos os direitos reservados.