- Visão geral
- Criação do modelo
- Validação do modelo
- Implantação do modelo
- Consumo de modelos
- API
- Perguntas frequentes
Guia do usuário de Documentos complexos e não estruturados
Essa funcionalidade está disponível em visualização na região do Japão.
Visão geral
O modelo de layout para linguagens estendidas é uma opção de pré-processamento inteligente no Extração e Processamento Inteligente (IXP) que melhora a precisão da extração. É uma etapa de normalização opcional usada em conjunto com o modelo de extração principal, que ajuda a melhorar a forma como os documentos são representados antes que o LLM os processe, especialmente para documentos em que a posição das informações na página é importante, como tabelas, formulários, layouts multicolunas ou documentos baseados em caixas de seleção.
Antes que o modelo de extração processe o conteúdo, o modelo de layout (linguagens estendidas) analisa a estrutura visual do documento, incluindo como o texto e outros elementos são organizados na página. Ele foi projetado especificamente para melhorar a precisão para documentos que usam conjuntos de caracteres estendidos e layouts complexos, em que outras opções de pré-processamento podem capturar a estrutura do documento com menos precisão.
Benefícios
A funcionalidade Modelo de Layout (linguagens estendidas) inclui os seguintes benefícios:
- Pré-processamento com foco na estrutura – Melhora a forma como o layout do documento é interpretado durante a extração, sem alterar prompts ou alternar modelos. É particularmente eficaz quando a precisão depende mais da estrutura do documento do que do significado do conteúdo.
- Mapeamento de linhas/colunas mais preciso – Preserva relacionamentos nos quais a estrutura é crítica.
- Extração aprimorada de caixas de seleção – Detecção e mapeamento mais confiáveis dos campos de caixas de seleção.
- Integração perfeita do fluxo de trabalho – Funciona dentro do processo de Extração e Processamento Inteligente (IXP) existente para testes, validação, pontuação e comparação de versão.
Uso do modelo de layout
Para usar o modelo de layout, proceda da seguinte forma:
- Navegue até a guia Criar.
- Selecione Configuração do modelo.
- Em Pré-processamento inteligente, selecione Modelo de layout (linguagens estendidas).
Quando usar o modelo de layout
Use essa funcionalidade quando a precisão da extração com as opções de pré-processamento Nenhum, Modelo de tabela - mini ou Modelo de tabela for menor do que o esperado.
Essa funcionalidade é particularmente eficaz nos seguintes cenários:
- Demonstrações e relatórios financeiros densos — Declarações de corretagem, solicitações de empréstimos, relatórios de serviços e outros documentos nos quais várias linhas, seções e tabelas aninhadas precisam permanecer alinhadas.
- Formulários com muitas caixas de seleção — Formulários de seguros, saúde, integração e regulamentados com muitas caixas de seleção adjacentes ou repetidas, em que o principal modo de falha é o mapeamento correto das caixas de seleção para os campos.
- Documentos operacionais de itens de linha — Listas de empacotamento, ordens de inserção, ordens de serviço, manifestos e documentos semelhantes em que o reconhecimento correto de linhas é mais importante do que a compreensão semântica ampla.
- Conjuntos de documentos de baixo desempenho — Famílias de documentos que têm desempenho inferior à extração padrão, especialmente quando os erros ocorrem devido a incompatibilidades de linhas/colunas ou de caixas de seleção, em vez de problemas de instrução.
Exemplo de pré-processamento do modelo de layout (linguagens estendidas)
A imagem a seguir contém um exemplo de uma extração que consulta o LLM sem usar o modelo de layout (linguagens estendidas). Os modos de encerramento único e sem saque de dinheiro são extraídos incorretamente conforme selecionado pelo solicitante.

A imagem a seguir contém um exemplo de uma extração que usa o modelo de layout (linguagens estendidas), em que os valores de ambos os campos são extraídos corretamente. Nenhuma alteração de instrução foi aplicada.
