- Visão geral
- Criação do modelo
- Validação do modelo
- Implantação do modelo
- Perguntas frequentes

Guia do usuário de Documentos complexos e não estruturados
Você pode configurar o LLM subjacente, bem como suas definições na opção Configuração do modelo na guia Criar.
- Pré-processamento inteligente:
- Nenhum
- Modelo de tabela - Mini
- Modelo de tabela
- Modelo de extração:
- GPT-4o
- Gemini
- Opções avançadas:
- Atribuição
- Temperatura
- P superior
- Semente
- Penalidade de frequência
- Solicitar substituição
Ajuste essas configurações para melhorar a precisão das previsões do modelo e aprimorar seu desempenho.
As opções de pré-processamento inteligentes melhoram o desempenho da previsão quando os documentos são difíceis para os modelos interpretarem, devido à formatação complexa.
- Nenhum - Essa opção padrão é adequada para a maioria dos documentos que não têm conteúdo tabular.
- Modelo de tabela - mini - Otimizado para conteúdo tabular e latência. Esta opção é mais adequada para documentos com tabelas simples ou várias tabelas.
- Modelo de tabela - Otimizado para conteúdo tabular mais complexo. Essa opção é mais adequada para documentos com tabelas aninhadas complexas, tabelas com células mescladas, pontos de marcação ou tabelas que abrangem várias páginas.
Observação:
- Embora isso tenha o melhor desempenho em tabelas complexas, ele aumenta a latência das previsões.
- Essa funcionalidade depende dos modelos do Gemini por meio do AI Trust Layer.
Exemplo de pré-processamento inteligente
this period são confundidos com os de outra coluna year to date.this period e year to date, são extraídos corretamente.A opção Modelo de extração representa o LLM subjacente usado para a extração.
- GPT-4o
- Gemini
Escolha do modelo mais adequado
Diferentes modelos terão um desempenho diferente para diferentes casos de uso, mas recomenda-se que você use o Gemini onde possível. Vários outros recursos de pré e pós-processamento, que ajudam a otimizar o desempenho e a experiência do usuário, também são baseados no Gemini.
O GPT-4o tem uma restrição de 50 páginas e só pode processar mais páginas usando a funcionalidade de chamada iterativa visualizada atualmente.
A Gemini pode processar documentos na Extração e Processamento Inteligente de até 200 páginas em uma única chamada, com contagens de páginas maiores suportadas na visualização. O limite de Gemini pode variar um pouco com base na densidade de valores de campo dentro do documento. O modelo Gemini tem um limite de entrada de 200 páginas por padrão, em comparação com o limite de entrada de 50 páginas do GPT-4o. Além disso, o Gemini tem uma janela de contexto de saída maior, o que permite que ele lide com mais valores de campos.
Mudança de um modelo para outro
Para alternar de um modelo para outro, use a lista suspensa da opção Modelo de extração e selecione Salvar. Isso disparará uma nova versão do projeto a ser criada e novas previsões a serem geradas automaticamente.
Se você precisar mudar o modelo por motivo de desempenho, verifique primeiro se o modelo alternativo pode resolver o problema principal que o modelo atual não pode solucionar. Se puder, otimize o novo modelo para melhorar as métricas de desempenho em Measure.
As opções avançadas permitem que você personalize as configurações para seus modelos, selecione qual método de atribuição usar e use a substituição da solicitação.
Expandir a configuração para visualização de todas as opções disponíveis:
- Atribuição - O método usado para atribuir previsões à parte ou texto relevante no documento. Selecione uma das seguintes opções:
- Baseada em regras - Usa um conjunto extenso de regras e heurísticas para fazer a correspondência dos intervalos corretos em uma página com os valores previstos do modelo. Essa é uma opção de baixa latência, mas sacrifica o desempenho em termos de atribuições bem-sucedidas em comparação com a opção baseada em modelo.
- Baseada em modelo - Usa uma chamada de LLM adicional para fazer a correspondência bem-sucedida dos valores previstos com os intervalos corretos na página, pois esses valores podem muitas vezes ser repetidos em diferentes partes da página. Essa é a opção de mais desempenho em termos de atribuições bem-sucedidas, mas adiciona alguma latência às previsões. Essa opção depende do uso de modelos do Gemini.
- Temperatura – A temperatura de amostragem a ser usada. Selecione um número entre 0,0 e 2,0. Valores mais altos tornam a saída mais aleatória.
- P superior - Amostras apenas de tokens com a massa de probabilidade
top_p. Selecione um número entre 0,0 e 1,0. - Semente – Se especificado, as solicitações repetidas com a mesma semente e parâmetros devem retornar o mesmo resultado.
- Penalidade de frequência – Selecione um número entre -2,0 e 2,0. Os valores positivos reduzem a probabilidade de o modelo repetir tokens que já apareceram no texto.
- Substituição de solicitação – Substitui a solicitação do sistema padrão por um novo valor. Esta opção está desabilitada por padrão. Uma vez habilitadas, as opções de solicitação Acrescentar instruções de tarefa e Acrescentar instruções de campo são habilitadas para configuração.