Activités Document Understanding

Dernière mise à jour 11 juin 2025

Extraire les données du document

UiPath.IntelligentOCR.StudioWeb.Activities.ExtractDocumentDataWithDocumentData<UiPath.IntelligentOCR.StudioWeb.Activities.DataExtraction.ExtendedExtractionResultForDocumentData>

Description

Extrait les données d'un fichier d'entrée ou d'un objet Données du document (Document Data) et stocke les résultats dans un objet Données du document (Document Data).

Avant de commencer

Prérequis

L’activité Extraire les données du document (Extract Document Data) nécessite des objets d’entrée de type Données de document (Document Data) ou Fichier (File). Un cas d’utilisation possible pour utiliser cette activité consiste à la précéder d’une activité Classer un document (Classify Document), qui génère un objet de type Données du document (Document Data).

Options d'entrée

L'activité Extraire les données du document (Extract Document Data) reçoit en entrée l'un des choix suivants :

Données du document (Document Data) : à partir de l'activité Classer un document (Classify Document)
Fichier (File) : à partir des activités Obtenir un fichier/dossier (Get File/Folder) ou Obtenir l'e-mail le plus récent (Get Newest Email)

Langues prises en charge pour les modèles génératifs

Les langues prises en charge pour les modèles génératifs sont les mêmes que celles du moteur OCR utilisé, qui dépend du projet. Pour les projets prédéfinis et prédéfinis génératifs , le moteur OCR utilisé est UiPath Document OCR. Pour plus d’informations, consultez la page Langues prises en charge par l’OCR .

Modèles utilisés par l’activité

L’activité Extraire les données du document (Extract Document Data) utilise les éléments suivants :

Modèles spécialisés pré-entraînés disponibles prêts à l’emploi, basés sur DocPath.
Modèles pré-entraînés personnalisés, déployés dans les projets modernes et classiques Document Understanding.
Modèles d’extraction génératifs.

Limites connues

Le type de projet Génératif prédéfini et les extracteurs correspondants ne sont pas disponibles dans Automation Suite.

Compatibilité du projet

Windows | Multiplate-forme

Configuration

Module Designer

Entrée (Input) : vous devez spécifier le fichier lui-même, ou les Données du document (Document Data), au cas où vous auriez déjà utilisé d'autres activités Document Understanding dans votre workflow (par exemple, Classer un document (Classify Document)).
Important : un fichier peut avoir au maximum 500 pages. Les fichiers dépassant cette limite ne pourront pas être extraits.
Projet (Project) : vous devez sélectionner votre projet Document Understanding dans la liste déroulante. Les options disponibles sont les suivantes :
- Prédéfini (Predefined) : type de projet classique qui utilise des modèles spécialisés pré-entraînés recommandés dans le cadre de scénarios standard.
  Pour plus d’informations sur la logique de facturation d’un projet classique, consultez la section Logique de mesure et de facturation.
- Génératif prédéfini : type de projet moderne utilisant des modèles génératifs pré-entraînés acceptant des instructions en tant qu’entrée pour l’extraction des données de document.
  Pour plus d'informations sur la logique de facturation des projets modernes, consultez la section Logique de mesure et de facturation.
- Projets du locataire et du dossier auxquels vous êtes connecté.
- Vous pouvez créer un projet personnalisé en accédant à Document Understanding.
  Pour plus d'informations, consultez la section Introduction à la création de modèles.
Remarque : si vous avez créé plus de 500 projets sur votre locataire et que vous utilisez l’activité Extraire les données du document (Extract Document Data), UiPath Studio ou Studio Web n’affichera aucun projet au-delà des 500 initiaux. Par conséquent, ces projets ne peuvent pas être utilisés.

Extracteur (Extractor) : après avoir sélectionné un projet, vous pouvez également sélectionner l'extracteur que vous souhaitez utiliser.
- Pour le projet prédéfini, deux choix s’offrent à vous :
  - Sélectionnez un modèle pré-entraîné. Consultez Modèles prêts à l’emploi pour obtenir une liste des modèles pré-entraînés que vous pouvez utiliser.
    Remarque : l'activité Extraire les données du document (Extract Document Data) extrait les informations des champs disponibles sur le type de document de l'extracteur sélectionné (indépendamment du type réel du document). Cela ne s'applique pas aux modèles génératifs.
  - Sélectionnez l’extracteur génératif.
    Remarque : les informations envoyées à l’extracteur génératif sont envoyées à une instance de modèle LLM. Cette instance n’est pas accessible au public, ne stocke pas les données envoyées et ne les utilise pas à des fins d’entraînement.
    
    Important :
    Cette fonctionnalité fait actuellement partie d'un processus d'audit et ne doit pas être considérée comme faisant partie de l'autorisation FedRAMP tant que la révision n'est pas finalisée. Consultez ici la liste complète des fonctionnalités en cours de révision.
- Pour le projet Génératif prédéfini, vous disposez de trois choix d’extraction, qui s’adapteront chacun à une mise en page de document spécifique :
  - Extracteur de mise en page simple de document long : recommandé pour les longs documents contenant principalement du texte et des en-têtes. Par exemple, vous pouvez utiliser l’extracteur de mise en page simple de document long sur des documents tels que des contrats de location, des accords de service ou d’autres documents similaires.
  - Extracteur de mise en page complexe de documents longs (Aperçu) : recommandé pour les documents de formulaire longs qui incluent des éléments tels que des images, l’écriture manuscrite, des contrôles de formulaire, des zones de légende flottantes ou d’autres types de mise en page complexes. Par exemple, vous pouvez utiliser l'extracteur de mise en page complexe de document long sur des documents tels que des polices d'assurance ou d'autres documents similaires.
  - Extracteur de mise en page complexe de document court (Aperçu) : recommandé pour les documents de courte durée qui incluent des éléments tels que des images, l’écriture manuscrite, le contrôle de formulaire, des zones de légende flottantes ou d’autres types de mise en page complexes. Par exemple, vous pouvez utiliser l' Extracteur de mise en page complexe de document court (Short Document Complex Layout Extractor) sur des documents tels que des informations d’identification Government, des formulaires de prise en charge des soins de santé ou d’autres documents similaires.
- Utiliser le résultat de la classification: si la propriété Générer un type de données est définie sur false, vous pouvez opter pour l'option Utiliser le résultat de la classification . Cette option utilise automatiquement un extracteur recommandé en fonction du type de document résultant de l'activité Classer un document (Classify Document) .
  Si plusieurs extracteurs peuvent fonctionner avec ce type de document, l'activité renvoie une erreur. Dans ce scénario, vous devez sélectionner manuellement votre extracteur préféré.
Détails du type de document : ce champ s’affiche si vous choisissez l’option Génératif. Invite pour identifier les champs à extraire, fournie sous forme de paires clé-valeur, où la clé représente le nom du champ et la valeur une description de celui-ci, permettant à l’extracteur d’identifier la valeur correspondante. Sélectionnez le champ pour obtenir une invite avec les options suivantes, fournies par paires :
- Nom du champ (Field name) : vous devez saisir le nom du champ à extraire (ex. Date d'échéance) (limite de 30 caractères)
- Instruction : vous devez fournir des instructions sur les informations devant être extraites pour le champ correspondant. Le nombre maximum de caractères autorisés est de 1000. Le résultat d’extraction résultant, également appelé Complétion, dispose d’une limite de mots de 700. Il est limité à 700 mots. Cela signifie que vous ne pouvez pas extraire plus de 700 mots à partir d’une seule invite. Si vos besoins d’extraction dépassent cette limite, vous pouvez diviser le document en plusieurs pages, les traiter individuellement, puis fusionner les résultats.
Astuce : pour connaître les bonnes pratiques d'utilisation des invites génératives, consultez la page Extracteur génératif - Bonnes pratiques .
Version ou balise : utilisez cette propriété lorsque vous utilisez un projet moderne Document Understanding existant. Sélectionnez la balise qui correspond à la version de projet à partir de laquelle vous souhaitez traiter les données. Par exemple, si vous choisissez la balise Production affectée à la version 3, l’activité traitera les données de la version 3 de votre projet dans l’environnement de production.
La valeur par défaut de Version est Organisation (Staging). Si la balise Organisation n’existe pas dans votre projet sélectionné, la valeur par défaut est Production.

Pour plus d'informations sur les versions, consultez la section Publication de modèles.
Type de document : lorsque vous choisissez une balise dans le champ Version, l’activité sélectionne automatiquement le premier type de document déployé dans la version pertinente de votre projet choisi. De plus, l’activité affiche les champs d’extraction liés au type de document que vous avez choisi.

Panneau propriétés

Entrée

Délai d' attente (secondes) (Timeout (seconds) : délai d'exécution maximal (en secondes) pour l'appel vers le modèle génératif. Si l'opération dépasse ce délai, elle est automatiquement arrêtée pour éviter les retards ou les blocages. Cette propriété s'affiche uniquement si l' extracteur génératif est sélectionné en tant qu'extracteur.
Validation automatique - Utilisez cette option pour activer la validation automatique, une fonctionnalité qui permet de valider les résultats obtenus pour l'extraction de données par rapport à un modèle génératif. La valeur par défaut du champ Validation automatique est False.
- Seuil de confiance ( Confidence threshold ) : ce champ devient visible une fois que vous avez activé la Validation automatique (Auto-validation). Les résultats de l'extraction inférieurs au seuil sont comparés au modèle d'extraction génératif. Si elles correspondent, le système ajuste la confiance d'extraction pour répondre à la valeur limite. Les valeurs de seuil possibles sont comprises entre 0 et 100.
  Si la valeur est définie sur 0, aucune validation n'est appliquée. Cependant, si vous définissez une valeur spécifique (de 0 à 100), le système vérifie tous les résultats d'extraction inférieurs à cette valeur. Par exemple, si vous définissez un seuil de confiance de 80 %, le système appliquera la validation générative pour les champs avec une confiance inférieure à 80 %.
  
  Remarque : la validation automatique n'est disponible que pour les modèles d'extraction spécialisés.
Générer un type de données (Generate Data Type) : si défini sur True, indique que la sortie doit être générée en fonction de l’extracteur sélectionné, résultant en un objet IDocumentData<ExtractorType>. Sinon, si défini sur False, indique que la génération de données doit être ignorée, ce qui permet d’obtenir un objet IDocumentData<DictionaryData> générique.
Consultez la page Données du document pour plus de détails et les limitations disponibles pour les deux types d’objets.

Sortie

Données du document (Document Data ) : toutes les données de champ extraites du fichier. Les informations peuvent également être reçues de Classer un document (Classify Document).
Visitez la page Données du document pour en savoir plus sur le fonctionnement des données de document et sur la façon d’utiliser les résultats extraits pour les champs à une ou plusieurs valeurs.

Connexion externe lors de la conception

La connexion externe au moment de la conception vous permet de tirer parti de l'activité à l'aide de ressources Document Understanding provenant d'autres projets ou locataires. Avant de configurer ces propriétés, assurez-vous d'avoir rempli les prérequis mentionnés à la page Configuration de la connexion externe du runtime . Une fois ces étapes terminées, vous pouvez ensuite procéder à la configuration de la connexion externe du runtime.

ID d'application (App ID) : saisissez l'ID d'application de l'application externe que vous avez précédemment créée.
Clé secrète de l'application (App secret) : saisissez la clé secrète de l'application de l'application externe que vous avez précédemment créée.
URL du locataire (Tenant URL) : saisissez l'URL du locataire sur lequel vous avez créé l'application externe. Il s’agit du locataire à partir duquel vous utiliserez les ressources au moment de la conception.
L'URL doit être au format suivant : https://<baseURL>/<OrganizationName>/<TenantName>.

Connexion externe du runtime

La connexion externe de runtime vous permet d'exécuter l'activité via des robots locaux. Avant de configurer ces propriétés, assurez-vous d'avoir rempli les prérequis mentionnés à la page Configuration de la connexion externe du runtime . Une fois ces étapes terminées, vous pouvez ensuite procéder à la configuration de la connexion externe du runtime.

Ressource d' informations d'identification du runtime (Runtime Credentials Asset) : utilisez ce champ lorsque vous devez accéder aux ressources Document Understanding alors que le robot est connecté à un Orchestrator local ou à partir d'un locataire différent. Vous pouvez choisir de saisir une ressource d'informations d’identification, à des fins d'authentification, de l’une des manières suivantes :
- Dans la liste déroulante, sélectionnez la ressource d’informations d’identification souhaitée dans l’Orchestrator auquel le Robot UiPath® est connecté.
- Saisissez manuellement le chemin d’accès à la ressource d’informations d’identification Orchestrator où vous stockez les informations d’identification de l’application externe pour accéder au projet.
  Le format du chemin d'accès doit être : <OrchestratorFolderName>/<AssetName>.
URL du locataire au runtime : utilisez ce champ, conjointement au champ Ressource d’informations d’identification du runtime. Saisissez l’URL du locataire auquel le robot se connectera afin d’exécuter l’extraction. L’URL doit être au format suivant : https://<baseURL>/<OrganizationName>/<TenantName>.

Modèles pris en charge

Les extracteurs génératifs disponibles dans le projet Prédéfini génératif (Generative Predefined) peuvent être utilisés pour les documents décrits dans le tableau suivant :

Remarque : les extracteurs longue mise en page de document complexe et les extracteurs de mise en page de document court ne sont actuellement pas disponibles dans Automation Cloud^TM pour les environnements du secteur public (FedRamp).

Tableau 1. Scénarios pris en charge pour les extracteurs génératifs
Extracteur	Scénario recommandé	Fournisseur	Disponibilité régionale
Extracteur de mise en page simple de document long	Recommandé pour les documents de forme longue contenant principalement du texte et des en-têtes. Par exemple, vous pouvez utiliser l'extracteur de mise en page simple de document long sur des documents tels que des contrats de location, des accords généraux de service ou d'autres documents similaires.	Azure OpenAI	Royaume-Uni, Australie, Inde, Canada
Extracteur de mise en page complexe de document long	Recommandé pour les documents de longue durée avec des mises en page complexes, tels que des images, du texte manuscrit, des éléments de formulaire ou des mises en page distinctes telles que les zones de légende flottantes. Vous pouvez utiliser cet extracteur sur des documents longs tels que les polices d'assurance, qui ont généralement une mise en page complexe.	Azure OpenAI	États-Unis, Union européenne, Japon, Singapour
Extracteur de mise en page complexe de document court	Recommandé pour les documents plus courts (de 20 pages maximum) contenant des images, du texte manuscrit, des éléments de formulaire ou des mises en page complexes, telles que des zones de légende flottantes. Vous pouvez utiliser cet extracteur sur des documents tels que des identifiants du secteur public ou des formulaires de prise en charge à des fins médicales, qui ont généralement une mise en page plus courte mais plus complexe.	Azure OpenAI	États-Unis, Union européenne, Japon, Singapour

¹ La prise en charge multi-modale fait référence à la capacité d'extraire différents types d'entrées de données, telles que le texte, les images, le texte manuscrit, etc.

Utilisation de l'extracteur génératif

Pour commencer rapidement à utiliser les fonctionnalités génératives de l’activité Extraire les données du document (Extract Document Data), procédez aux étapes suivantes :

Ajoutez une activité Extraire les données du document .
Dans la liste déroulante Projet, sélectionnez Génératif Prédéfini.
Pour le champ Extracteur, sélectionnez l’un des extracteurs suivants : Extracteur de mise en page simple de document long, Extracteur de mise en page complexe de document long ou Extracteur de mise en page complexe de document court.
La propriété Détails du type de document s’affiche dans le corps de l’activité.

Pour Dictionnaire, indiquez vos instructions sous la forme de paires clé-valeur de dictionnaire, où :

Nom de champ représente le nom du champ que vous souhaitez extraire du document. Par exemple, email address.
Instruction représente l’instruction sur les informations que vous souhaitez donner à l’extracteur pour l’extraction du champ. Il s’agit de la description utilisée par l’extracteur génératif pour identifier la valeur correspondante.
Par exemple, consultez la table suivante pour un exemple de paires clé-valeur :

Table 2. Exemples de paires clé-valeur pour l'invite de l'extracteur génératif
Nom du champ	Instruction
Nom	« Quel est le nom du candidat ? »
Exécution actuelle	« Quelle est la tâche actuelle du candidat ? »
Employeur	« Quel est l'employeur actuel du candidat ? »