document-understanding

latest

false

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Guide de l'utilisateur pour les projets modernes Document Understanding

PRODUIT :

Dernière mise à jour 10 avr. 2025

Fonctionnalités génératives

L’IA générative est une forme de technologie d’IA qui exploite les modèles d’apprentissage automatique (ML) pour créer et générer de nouveaux contenus, données ou informations.

Les Grands modèles de langage (LLM) sont essentiels aux tâches d’IA les plus génératives. Il s’agit de modèles ML entraînés sur une grande quantité de données textuelles, conçus pour générer du texte de type humain. Les LLM peuvent également comprendre et répondre aux invites en complétant des phrases ou des paragraphes à la manière d’un humain.

Annotation générative

Principalement appliqués lors du processus d’annotation automatique de documents à l’étape de création, ces modèles génératifs accélèrent la conception de la taxonomie et accélèrent l’entraînement des modèles.

La pré-annotation dans Document Understanding se fait à l’aide d’une combinaison de modèles génératifs et spécialisés, basée sur le schéma du type de document. Le schéma permet de définir clairement les champs que vous souhaitez extraire d’un type de document particulier.

Pour mieux comprendre le fonctionnement de l’annotation générative et comment l’utiliser efficacement dans vos projets, consultez la page Annoter des documents.

Extraction générative

L’extraction générative est une fonctionnalité essentielle de Document Understanding^TM qui utilise la puissance de modèles d’IA générative. Ces modèles sont configurés à l’aide d’activités et sont principalement utilisés au moment de l’exécution pour l’extraction de données.

L’extraction générative est capable de déchiffrer et d’extraire des informations spécifiques de documents non structurés ou semi-structurés. Par exemple, elle peut numériser une facture et récupérer avec précision des détails tels que la date, le montant facturé et le nom de l’entreprise. Cela permet une collecte d’informations rapide, efficace et très précise à partir de différents types de documents.

Activités connexes

Astuce : pour plus d’informations sur une utilisation plus efficace des activités d’extraction générative, consultez la page Extracteur génératif - Bonnes pratiques.

Plusieurs activités ont été mises en place pour vous aider à bénéficier des fonctionnalités d’extraction générative :

Package d’activités Document Understanding :
- Extraire les données du document (Extract Document Data), paramètre Invite (Prompt) après avoir choisi l’extracteur génératif.
Package d’activités ML Document Understanding :
- Extraction générative
Package d’activités IntelligentOCR :
- Étendue de l’extraction de données (Data Extraction Scope), paramètre AppliquerValidationAutomatique (ApplyAutoValidation).

Vous pouvez également utiliser les API Document Understanding pour tirer parti des fonctionnalités d’extraction générative.

Modèles pris en charge

Les extracteurs génératifs disponibles dans le projet Prédéfini génératif (Generative Predefined) peuvent être utilisés pour les documents décrits dans le tableau suivant :

Remarque : les extracteurs longue mise en page de document complexe et les extracteurs de mise en page de document court ne sont actuellement pas disponibles dans Automation Cloud^TM pour les environnements du secteur public (FedRamp).

Tableau 1. Scénarios pris en charge pour les extracteurs génératifs
Extracteur	Scénario recommandé	Fournisseur	Disponibilité régionale
Extracteur de mise en page simple de document long	Recommandé pour les documents de forme longue contenant principalement du texte et des en-têtes. Par exemple, vous pouvez utiliser l'extracteur de mise en page simple de document long sur des documents tels que des contrats de location, des accords généraux de service ou d'autres documents similaires.	Azure OpenAI	Royaume-Uni, Australie, Inde, Canada
Extracteur de mise en page complexe de document long	Recommandé pour les documents de longue durée avec des mises en page complexes, tels que des images, du texte manuscrit, des éléments de formulaire ou des mises en page distinctes telles que les zones de légende flottantes. Vous pouvez utiliser cet extracteur sur des documents longs tels que les polices d'assurance, qui ont généralement une mise en page complexe.	Azure OpenAI	États-Unis, Union européenne, Japon, Singapour
Extracteur de mise en page complexe de document court	Recommandé pour les documents plus courts (de 20 pages maximum) contenant des images, du texte manuscrit, des éléments de formulaire ou des mises en page complexes, telles que des zones de légende flottantes. Vous pouvez utiliser cet extracteur sur des documents tels que des identifiants du secteur public ou des formulaires de prise en charge à des fins médicales, qui ont généralement une mise en page plus courte mais plus complexe.	Azure OpenAI	États-Unis, Union européenne, Japon, Singapour

¹ La prise en charge multi-modale fait référence à la capacité d'extraire différents types d'entrées de données, telles que le texte, les images, le texte manuscrit, etc.

Classification générative

La classification générative utilise des modèles d’IA pour classer automatiquement les documents immédiatement après leur téléchargement.

Ce processus de classification automatique exploite les modèles ML pour « lire » le contenu d’un document, comprendre son contexte et, par conséquent, le classer dans des catégories prédéfinies. De cette façon, le système peut gérer et organiser efficacement plusieurs types de documents.

En classant avec précision les documents non structurés ou semi-structurés, la classification générative améliore le workflow de traitement des documents, fait gagner du temps et améliore la gestion globale des documents.

Activités connexes

Astuce : pour plus d’informations sur l’utilisation plus efficace des activités de classification générative, consultez la page Classifieur génératif - Bonnes pratiques.

Plusieurs activités ont été mises en place pour vous aider à bénéficier des fonctionnalités de classification générative :

Package d’activités Document Understanding :
- Classer un document (Classify Document)
Package d’activités ML Document Understanding :
- Classifieur génératif

Vous pouvez également utiliser les API Document Understanding pour exploiter les fonctionnalités de classification générative.

Validation générative

La validation générative est une fonctionnalité distincte de Document Understanding qui joue un rôle important pendant le processus de validation. Cette fonctionnalité est principalement utilisée après l’étape d’extraction pour valider le score de confiance de l’extraction effectuée à l’aide de modèles spécialisés.

Lorsque le score de confiance d’un modèle ML pour une extraction de document est faible, la validation générative est utilisée pour vérifier la sortie. Ce processus de validation nécessite que les modèles ML spécialisés et génératifs travaillent ensemble pour garantir l’exactitude.

Si les deux modèles produisent la même sortie, la validation humaine peut être ignorée, ce qui permet une amélioration significative de l’efficacité de la validation. Ce processus permet non seulement de gagner du temps au cours de l’étape de validation des documents, mais également d’améliorer les performances de vos modèles en utilisant un modèle génératif secondaire pour vérifier la sortie, garantissant un niveau de précision plus élevé.

Activités connexes

Plusieurs activités ont été mises en place pour vous aider à bénéficier des fonctionnalités de validation générative :

Package d’activités Document Understanding :
- Extraire les données du document, paramètre Validation automatique (Auto-validation)
Package d’activités IntelligentOCR :
- Étendue de l’extraction de données, paramètres AppliquerValidationAutomatique (ApplyAutoValidation) et SeuilConfianceValidationAutomatique (AutoValidationConfidenceThreshold)

Vous pouvez également utiliser les API Document Understanding pour tirer parti des fonctionnalités de validation générative.

Sommaire de la page

Annotation générative
Extraction générative
Activités connexes
Modèles pris en charge
Classification générative
Activités connexes
Validation générative
Activités connexes

Cette page vous a-t-elle été utile ?

PrécédentAppels API

SuivantConsuming models from different environments

Support et Services

Obtenez l'aide dont vous avez besoin

UiPath Academy

Formation RPA - Cours d'automatisation

UiPath Forum

Forum de la communauté UiPath

Confiance et sécurité

Conditions d’utilisation

Politique de confidentialité

Politique de cookies