Guia do usuário de Documentos complexos e não estruturados

Última atualização 3 de nov de 2025

Configuração do modelo

Visão geral

Você pode configurar o LLM subjacente, bem como suas definições na opção Configuração do modelo na guia Criar.

As configurações disponíveis são:

Pré-processamento inteligente:
- Nenhum
- Modelo de tabela - Mini
- Modelo de tabela
Modelo de extração:
- GPT-4o
- Gemini
Opções avançadas:
- Atribuição
- Temperatura
- P superior
- Semente
- Penalidade de frequência
- Solicitar substituição

Ajuste essas configurações para melhorar a precisão das previsões do modelo e aprimorar seu desempenho.

Pré-processamento inteligente

As opções de pré-processamento inteligentes melhoram o desempenho da previsão quando os documentos são difíceis para os modelos interpretarem, devido à formatação complexa.

Isso inclui as seguintes opções:

Nenhum - Essa opção padrão é adequada para a maioria dos documentos que não têm conteúdo tabular.
Modelo de tabela - mini - Otimizado para conteúdo tabular e latência. Esta opção é mais adequada para documentos com tabelas simples ou várias tabelas.
Modelo de tabela - Otimizado para conteúdo tabular mais complexo. Essa opção é mais adequada para documentos com tabelas aninhadas complexas, tabelas com células mescladas, pontos de marcação ou tabelas que abrangem várias páginas.
Observação:
- Embora isso tenha o melhor desempenho em tabelas complexas, ele aumenta a latência das previsões.
- Essa funcionalidade depende dos modelos do Gemini por meio do AI Trust Layer.

Exemplo de pré-processamento inteligente

A imagem a seguir contém um exemplo de uma extração que consulta o LLM sem usar o modo Modelo de tabela, onde os valores da coluna this period são confundidos com os de outra coluna year to date.

A imagem a seguir contém um exemplo de uma extração usando o modo Modelo de tabela, onde os valores de ambas as colunas, this period e year to date, são extraídos corretamente.

Modelos de extração

A opção Modelo de extração representa o LLM subjacente usado para a extração.

Os modelos disponíveis são:

GPT-4o
Gemini

Escolha do modelo mais adequado

Diferentes modelos terão um desempenho diferente para diferentes casos de uso, mas recomenda-se que você use o Gemini onde possível. Vários outros recursos de pré e pós-processamento, que ajudam a otimizar o desempenho e a experiência do usuário, também são baseados no Gemini.

O GPT-4o tem uma restrição de 50 páginas e só pode processar mais páginas usando a funcionalidade de chamada iterativa visualizada atualmente.

A Gemini pode processar documentos na Extração e Processamento Inteligente de até 200 páginas em uma única chamada, com contagens de páginas maiores suportadas na visualização. O limite de Gemini pode variar um pouco com base na densidade de valores de campo dentro do documento. O modelo Gemini tem um limite de entrada de 200 páginas por padrão, em comparação com o limite de entrada de 50 páginas do GPT-4o. Além disso, o Gemini tem uma janela de contexto de saída maior, o que permite que ele lide com mais valores de campos.

Mudança de um modelo para outro

Para alternar de um modelo para outro, use a lista suspensa da opção Modelo de extração e selecione Salvar. Isso disparará uma nova versão do projeto a ser criada e novas previsões a serem geradas automaticamente.

Importante: para projetos maduros, as taxonomias, particularmente instruções e previsões confirmadas, especialmente para campos inferidos, são normalmente otimizadas para um tipo de modelo em detrimento de outro. É provável que após a troca, as pontuações de desempenho caiam, pois algumas iterações nas instruções e a reavaliação das previsões podem ser necessárias para desfazer otimizações específicas do modelo que podem afetar o desempenho do outro modelo.

Se você precisar mudar o modelo por motivo de desempenho, verifique primeiro se o modelo alternativo pode resolver o problema principal que o modelo atual não pode solucionar. Se puder, otimize o novo modelo para melhorar as métricas de desempenho em Measure.

Opções avançadas

As opções avançadas permitem que você personalize as configurações para seus modelos, selecione qual método de atribuição usar e use a substituição da solicitação.

Observação: o uso de substituição da solicitação é recomendado apenas em casos excepcionais.

Expandir a configuração para visualização de todas as opções disponíveis:

Atribuição - O método usado para atribuir previsões à parte ou texto relevante no documento. Selecione uma das seguintes opções:
- Baseada em regras - Usa um conjunto extenso de regras e heurísticas para fazer a correspondência dos intervalos corretos em uma página com os valores previstos do modelo. Essa é uma opção de baixa latência, mas sacrifica o desempenho em termos de atribuições bem-sucedidas em comparação com a opção baseada em modelo.
- Baseada em modelo - Usa uma chamada de LLM adicional para fazer a correspondência bem-sucedida dos valores previstos com os intervalos corretos na página, pois esses valores podem muitas vezes ser repetidos em diferentes partes da página. Essa é a opção de mais desempenho em termos de atribuições bem-sucedidas, mas adiciona alguma latência às previsões. Essa opção depende do uso de modelos do Gemini.
Temperatura – A temperatura de amostragem a ser usada. Selecione um número entre 0,0 e 2,0. Valores mais altos tornam a saída mais aleatória.
P superior - Amostras apenas de tokens com a massa de probabilidade top_p. Selecione um número entre 0,0 e 1,0.
Semente – Se especificado, as solicitações repetidas com a mesma semente e parâmetros devem retornar o mesmo resultado.
Penalidade de frequência – Selecione um número entre -2,0 e 2,0. Os valores positivos reduzem a probabilidade de o modelo repetir tokens que já apareceram no texto.
Substituição de solicitação – Substitui a solicitação do sistema padrão por um novo valor. Esta opção está desabilitada por padrão. Uma vez habilitadas, as opções de solicitação Acrescentar instruções de tarefa e Acrescentar instruções de campo são habilitadas para configuração.

Observação: a equipe da UiPath® pesquisou e otimizou os padrões para as configurações do modelo, como Temperatura, P superior e Frequência. Como resultado, você não precisa ajustar esses valores, a menos que você saiba de quais configurações específicas você precisa.

Nesta página