document-understanding
latest
false
Important :
La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.
UiPath logo, featuring letters U and I in white

Guide de l'utilisateur pour les projets modernes Document Understanding

Dernière mise à jour 10 avr. 2025

Fonctionnalités génératives

L’IA générative est une forme de technologie d’IA qui exploite les modèles d’apprentissage automatique (ML) pour créer et générer de nouveaux contenus, données ou informations.

Les Grands modèles de langage (LLM) sont essentiels aux tâches d’IA les plus génératives. Il s’agit de modèles ML entraînés sur une grande quantité de données textuelles, conçus pour générer du texte de type humain. Les LLM peuvent également comprendre et répondre aux invites en complétant des phrases ou des paragraphes à la manière d’un humain.

Annotation générative

Principalement appliqués lors du processus d’annotation automatique de documents à l’étape de création, ces modèles génératifs accélèrent la conception de la taxonomie et accélèrent l’entraînement des modèles.

La pré-annotation dans Document Understanding se fait à l’aide d’une combinaison de modèles génératifs et spécialisés, basée sur le schéma du type de document. Le schéma permet de définir clairement les champs que vous souhaitez extraire d’un type de document particulier.

Pour mieux comprendre le fonctionnement de l’annotation générative et comment l’utiliser efficacement dans vos projets, consultez la page Annoter des documents.

Extraction générative

L’extraction générative est une fonctionnalité essentielle de Document UnderstandingTM qui utilise la puissance de modèles d’IA générative. Ces modèles sont configurés à l’aide d’activités et sont principalement utilisés au moment de l’exécution pour l’extraction de données.

L’extraction générative est capable de déchiffrer et d’extraire des informations spécifiques de documents non structurés ou semi-structurés. Par exemple, elle peut numériser une facture et récupérer avec précision des détails tels que la date, le montant facturé et le nom de l’entreprise. Cela permet une collecte d’informations rapide, efficace et très précise à partir de différents types de documents.

Activités connexes

Astuce : pour plus d’informations sur une utilisation plus efficace des activités d’extraction générative, consultez la page Extracteur génératif - Bonnes pratiques.
Plusieurs activités ont été mises en place pour vous aider à bénéficier des fonctionnalités d’extraction générative :

Vous pouvez également utiliser les API Document Understanding pour tirer parti des fonctionnalités d’extraction générative.

Modèles pris en charge

Les extracteurs génératifs disponibles dans le projet Prédéfini génératif (Generative Predefined) peuvent être utilisés pour les documents décrits dans le tableau suivant :
Remarque : les extracteurs longue mise en page de document complexe et les extracteurs de mise en page de document court ne sont actuellement pas disponibles dans Automation CloudTM pour les environnements du secteur public (FedRamp).
Tableau 1. Scénarios pris en charge pour les extracteurs génératifs
ExtracteurScénario recommandéFournisseurDisponibilité régionalePrise en charge multimodale1
Extracteur de mise en page simple de document longRecommandé pour les documents de forme longue contenant principalement du texte et des en-têtes. Par exemple, vous pouvez utiliser l'extracteur de mise en page simple de document long sur des documents tels que des contrats de location, des accords généraux de service ou d'autres documents similaires. Azure OpenAIRoyaume-Uni, Australie, Inde, CanadaNon disponible
Extracteur de mise en page complexe de document longRecommandé pour les documents de longue durée avec des mises en page complexes, tels que des images, du texte manuscrit, des éléments de formulaire ou des mises en page distinctes telles que les zones de légende flottantes. Vous pouvez utiliser cet extracteur sur des documents longs tels que les polices d'assurance, qui ont généralement une mise en page complexe. Azure OpenAIÉtats-Unis, Union européenne, Japon, Singapouravailable
Extracteur de mise en page complexe de document courtRecommandé pour les documents plus courts (de 20 pages maximum) contenant des images, du texte manuscrit, des éléments de formulaire ou des mises en page complexes, telles que des zones de légende flottantes. Vous pouvez utiliser cet extracteur sur des documents tels que des identifiants du secteur public ou des formulaires de prise en charge à des fins médicales, qui ont généralement une mise en page plus courte mais plus complexe. Azure OpenAIÉtats-Unis, Union européenne, Japon, Singapouravailable

1 La prise en charge multi-modale fait référence à la capacité d'extraire différents types d'entrées de données, telles que le texte, les images, le texte manuscrit, etc.

Classification générative

La classification générative utilise des modèles d’IA pour classer automatiquement les documents immédiatement après leur téléchargement.

Ce processus de classification automatique exploite les modèles ML pour « lire » le contenu d’un document, comprendre son contexte et, par conséquent, le classer dans des catégories prédéfinies. De cette façon, le système peut gérer et organiser efficacement plusieurs types de documents.

En classant avec précision les documents non structurés ou semi-structurés, la classification générative améliore le workflow de traitement des documents, fait gagner du temps et améliore la gestion globale des documents.

Activités connexes

Astuce : pour plus d’informations sur l’utilisation plus efficace des activités de classification générative, consultez la page Classifieur génératif - Bonnes pratiques.
Plusieurs activités ont été mises en place pour vous aider à bénéficier des fonctionnalités de classification générative :

Vous pouvez également utiliser les API Document Understanding pour exploiter les fonctionnalités de classification générative.

Validation générative

La validation générative est une fonctionnalité distincte de Document Understanding qui joue un rôle important pendant le processus de validation. Cette fonctionnalité est principalement utilisée après l’étape d’extraction pour valider le score de confiance de l’extraction effectuée à l’aide de modèles spécialisés.

Lorsque le score de confiance d’un modèle ML pour une extraction de document est faible, la validation générative est utilisée pour vérifier la sortie. Ce processus de validation nécessite que les modèles ML spécialisés et génératifs travaillent ensemble pour garantir l’exactitude.

Si les deux modèles produisent la même sortie, la validation humaine peut être ignorée, ce qui permet une amélioration significative de l’efficacité de la validation. Ce processus permet non seulement de gagner du temps au cours de l’étape de validation des documents, mais également d’améliorer les performances de vos modèles en utilisant un modèle génératif secondaire pour vérifier la sortie, garantissant un niveau de précision plus élevé.

Activités connexes

Plusieurs activités ont été mises en place pour vous aider à bénéficier des fonctionnalités de validation générative :
  • Package d’activités Document Understanding :
  • Package d’activités IntelligentOCR :

Vous pouvez également utiliser les API Document Understanding pour tirer parti des fonctionnalités de validation générative.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White