- Vue d'ensemble (Overview)
- Construction de modèles
- Vue d'ensemble (Overview)
- Gérer des projets
- Téléversement d'exemples de documents
- Examen des prédictions
- Valider les prédictions d'extraction
- Modèle de mise en page pour les langues étendues
- Validation du modèle
- Déploiement du modèle
- Utiliser des modèles
- API
- Questions fréquemment posées
Guide de l'utilisateur des documents complexes et non structurés
Cette fonctionnalité est disponible en aperçu dans la région Japon.
Vue d'ensemble (Overview)
Le modèle de mise en page pour les langues étendues est une option de prétraitement intelligente dans Extraction et traitement intelligents (IXP) qui améliore la précision de l'extraction. Il s'agit d'une étape de normalisation facultative utilisée conjointement avec le modèle d'extraction principal qui aide à améliorer la façon dont les documents sont représentés avant que le LLM ne les traite, en particulier pour les documents où la position des informations sur la page compte, tels que les tables, les formulaires, les mises en page multi-colonnes ou les documents basés sur des cases à cocher.
Avant que le modèle d’extraction traite le contenu, le modèle de mise en page (langues étendues) analyse la structure visuelle du document, y compris la façon dont le texte et les autres éléments sont disposés sur la page. Il est spécifiquement conçu pour améliorer la précision des documents qui utilisent des ensembles de caractères étendus et des mises en page complexes, où d'autres options de prétraitement peuvent capturer la structure du document avec moins de précision.
Bénéfices
La fonctionnalité Modèle de mise en page (langues étendues) inclut les avantages suivants :
- Prétraitement axé sur la structure – Améliore la façon dont la mise en page du document est interprétée pendant l'extraction, sans modifier les invites ou changer de modèle. Il est particulièrement efficace lorsque la précision dépend davantage de la structure du document que de la signification du contenu.
- Mappage lignes/colonnes plus précis - Préserve les relations où la structure est critique.
- Extraction améliorée des cases à cocher - Détection et un mappage plus fiables des champs des cases à cocher.
- Intégration transparente du workflow - Fonctionne dans le processus d'extraction et de traitement intelligents (IXP) existant pour les tests, la validation, la notation et la comparaison des versions.
Utilisation du modèle de mise en page
Pour utiliser le modèle de mise en page, procédez comme suit :
- Naviguez vers l'onglet Créer.
- Sélectionnez Configuration du modèle.
- Sous Prétraitement intelligent, sélectionnez Modèle de mise en page (langues étendues).
Quand utiliser le modèle de mise en page
Utilisez cette fonctionnalité lorsque la précision de l'extraction avec les options de prétraitement Aucun, Modèle de table - mini ou Modèle de table est inférieure à celle prévue.
Cette fonctionnalité est particulièrement efficace dans les scénarios suivants :
- États financiers et rapports denses - Relevés de courtage, demandes de prêt, rapports de service et autres documents où plusieurs lignes, sections et tables imbriquées doivent rester alignées.
- Formulaires comportant de nombreuses cases à cocher - Assurance, soins de santé, intégration et formulaires réglementés avec de nombreuses cases à cocher adjacentes ou répétées, où le principal mode d'échec est le mappage correct de la case à cocher au champ.
- Documents opérationnels composé de lignes - Listes de colisage, commandes d'insertion, commandes de service, manifestes et documents similaires où la reconnaissance correcte des lignes est plus importante qu'une compréhension sémantique large.
- Ensembles de documents peu performants - Familles de documents qui sont sous-performantes avec l'extraction standard, en particulier lorsque les erreurs proviennent d'inadéquations de ligne/colonne ou de case à cocher plutôt que de problèmes d'instructions.
Exemple de prétraitement du modèle de mise en page (langues étendues)
L’image suivante contient un exemple d’extraction interrogant le LLM sans utiliser le modèle de mise en page (langues étendues). Les options Single-Closing et No Cash Out sont extraites de manière incorrecte comme ayant été sélectionnées par le demandeur.
L’image suivante contient un exemple d’extraction utilisant le modèle de mise en page (langues étendues), où les valeurs des deux champs sont extraites correctement. Aucune modification d’instruction n’a été appliquée.