UiPath Documentation
activities
latest
false

Activités Document Understanding

Dernière mise à jour 5 mai 2026

Données du document

Les Données du document sont une ressource qui sert à la fois de variable d’entrée et de sortie dans vos workflows Document Understanding. L'objet Données du document contient toutes les informations nécessaires d'un seul document. Si vous classez un document, l’objet inclut le Type de document. Si vous extrayez des données, l'objet contient les champs extraits correspondants. Quelle que soit l'activité, les données de document contiennent systématiquement le texte du document et le DOM (modèle d'objet de document).

Avec les Données du document, vous pouvez : collecter toutes les informations nécessaires sur un document dans une seule variable, enregistrer des données dans chaque propriété de l'objet et les réutiliser pour d'autres activités du workflow.

Les données des documents contiennent des informations sur les attributs suivants :

  • TypeDocument: fournit des données sur le type de document identifié, renseignées par des activités telles que Classer un document ou Créer une tâche de validation de classification.
  • Données: contient les valeurs de champ extraites. Il est généré à la demande par la propriété Générer des données , qui génère un type de sortie de IDocumentData<ExtractorType>. Lorsque la propriété Générer des données est définie sur False, vous ne pouvez accéder aux valeurs de champ extraites que via des méthodes de type Get.
  • DétailsFichier: contient les détails sur le fichier IResource.
    Remarque :

    IResource est un pointeur universel qui localise et accède aux données utilisées dans vos workflows multiplateformes. IResource fait office de conteneur stockant des références aux données locales ( telles que les fichiers locaux ) ou externes ( telles que les fichiers cloud ) qui ne sont pas seulement enregistrées dans votre workflow actuel. Ces données peuvent provenir de diverses sources. Pour plus d'informations sur IResource et les propriétés qu'il expose, consultez Utiliser des ressources de fichiers et de dossiers.

  • SousDocuments: comprend une collection de Données de document, renseignées par des activités telles que Créer une tâche de validation de classification.
  • DocumentMetadata: contient des informations sur le traitement du document, telles que :
    • Langue détectée par texte
    • Champs extraits sous forme de table de données
    • Modèle d’objet document (DOM): contient le modèle d’objet document qui est utilisé par toutes les activités. Les métadonnées du document sont mises à jour par l’activité qui traite le document en premier. Une fois renseignées, les métadonnées sont partagées avec toutes les activités réussies qui reçoivent l’objet Données du document, et sont utilisées par celles-ci.
      Astuce :

      Hormis si une activité est la première activité Document Understanding d’un workflow Studio, utilisez les Données du document en tant qu’entrée. Utilisez la variable Fichier comme entrée uniquement si l'activité est la première partie Document Understanding d'un workflow Studio.

Comprendre et accéder aux données

Les données du document contiennent des informations détaillées sur les résultats de l’extraction. Les données peuvent être de deux types, selon que vous choisissez de les générer à la demande, afin que vous puissiez les utiliser ultérieurement dans votre workflow, ou bien ne pas les générer, afin que vous puissiez y effectuer des méthodes get et set , conçues dans les implémentations avancées, afin d’augmenter la flexibilité.

La propriété Générer un type de données dans l’activité Extraire les données du document vous permet de choisir si vous générez ou non les données à la demande. Référez-vous aux scénarios suivants :

  • Lorsque vous définissez Générer le type de données sur True (le paramètre par défaut : les données du document sont générées en tant que IDocumentData<ExtractorType>. Ces données sont générées à la demande et modifiées en fonction des modifications apportées à l’activité Extraire les données du document. Avec ce paramètre, vous ne pouvez pas modifier le type de document dans la station de validation, et JIT (Juste à temps) est sélectionné par défaut.
  • Lorsque vous définissez Générer le type de données sur False: les données du document seront générées sous la forme IDocumentData<DictionaryData>. Avec ce paramètre, la propriété Données du document ne sera plus générée et vous ne pourrez pas la parcourir. Vous pouvez accéder à ses données à l’aide de méthodes spécifiques, en vous basant sur l’ID de champ. Ces ID deviennent disponibles lors de la configuration du type de document ou lors de la récupération des informations à l'aide d'API. Consultez les pages Modifier ou ajouter de nouveaux champs et Obtenir l’API de demande d’extraction pour plus d’informations.
    • Lorsque vous définissez Générer un type de données sur False pour l’extraction générative, les champs récupérés correspondent aux noms fournis dans l’invite. Par exemple, si le nom du champ dans l’invite est défini comme a b c (y compris les espaces), vous devez utiliser le même que l’ID du champ lorsque vous utilisez les méthodes spécifiques.

Transmettre des données de documents vers des activités

Lorsque vous utilisez Données du document, le premier objet de sortie est créé à partir de votre fichier d'entrée. Après avoir créé cet objet, nous vous recommandons de le transmettre à vos prochaines activités. En le passant à vos prochaines activités, vous pouvez réutiliser le Texte (Text) et le DOM de votre fichier d’origine. Cette approche vous évite de renumériser le fichier à chaque fois.

Utilisation des résultats d'extraction pour les champs à une ou plusieurs valeurs

Si vous configurez un champ de type de document pour qu’il soit à plusieurs valeurs, le système attend plusieurs valeurs. Un exemple pourrait être une question à choix multiples dans un formulaire. Les résultats apparaissent dans l'attribut à valeurs multiples du champ, renvoyé sous forme de liste. Si le champ de type de document est configuré pour être à valeur unique, le système renvoie le résultat dans l’attribut de valeur du champ par défaut.

Le tableau suivant vous montre comment les Données du document renvoient des champs à une et plusieurs valeurs :

Tableau 1. Les valeurs renvoyées par les Données du document pour les champs à valeur unique et à valeurs multiples

ne comporte pas de valeurA une valeurComporte deux valeurs ou plusDocumentData.Data.FieldName.ValueDocumentData.Data.FieldName.MultiValues
Valeur uniqueOui (Yes)Non (No)S/O""null
Valeur uniqueNon (No)Oui (Yes)S/Onull
Valeurs multiplesOui (Yes)Non (No)Non (No)""[] (tableau vide)
Valeurs multiplesNon (No)Oui (Yes)Non (No)[<tableau avec une valeur identique à .Value>]
Valeurs multiplesNon (No)Non (No)Oui (Yes)[<tableau avec n valeurs, la première valeur étant identique à .Value>]

Renvoyer les champs extraits sous forme de table de données

Vous pouvez renvoyer les champs extraits d’un document en tant que Table de données, à l’aide de l’objet Données du document. Vous pouvez ensuite utiliser la variable Table de données dans les activités Excel.

Pour renvoyer les champs extraits sous forme de table de données, choisissez la sortie ResultsAsDatatable pour l’activité Extraire les données du document .

Propriétés

Les propriétés de la variable Données du document peuvent être renseignées et utilisées par une ou plusieurs activités. Selon l’activité renseignant la variable, les propriétés peuvent différer. Consultez la liste suivante :

  • TypeDocument : l’activité Classer un document renseigne les valeurs suivantes :
    • DisplayName : nom du type de document.
    • ID (utilisé pour les modèles prêts à l'emploi) : Nom du type de document.
    • Confiance: confiance de la classification.
    • URL: URL à partir de laquelle le type de document est accessible ; elles peuvent être personnalisées ou prédéfinies, référencées via le projet concerné dans le centre Document Understanding.
  • Champs - Extraire les données du document, Créer une tâche de validation, Créer une tâche de validation et attendre, Attendre la tâche de validation et Reprendre renseignent les valeurs suivantes :
    • Valeur du champ: valeur d’extraction du champ.
    • Score de confiance d'extraction: le score de confiance de l'extraction, tel que fourni par le modèle.
    • Score de confiance OCR: score de confiance fourni par le moteur OCR.
  • Détails du fichier : les activités créant l'objet Données du document, recevant un fichier en tant qu'entrée, renseignent les valeurs suivantes :
    • Nom complet: nom complet du fichier.
    • Extension: extension du fichier.
    • Plage de pages: la plage de pages du fichier.
  • Sous-documents: Collection de données de document, renseignées par l'activité Classer un document .
    Remarque :

    Cette option n'est pas renseignée actuellement et sera ajoutée à l'avenir avec des capacités de validation de classification et de fractionnement.

  • MétadonnéesDocument:
    • DOM: Modèle d'objet de document, utilisé par toutes les activités. )
    • Texte: Tout le texte extrait. )
    • Langue: la langue détectée dans le document. )
    • Confiance fractionnée: si le document est fractionné, le document est renvoyé par le modèle de fractionnement. (renseigné par l'activité Classer un document )
      Remarque :

      Cette option n'est pas renseignée actuellement et sera ajoutée à l'avenir avec des capacités de validation de classification et de fractionnement.

    • Résultats en tant que tables de données: champs exportés en tant que table de données. (remplis par l’activité Extraire les données du document ).

Cette page vous a-t-elle été utile ?

Connecter

Besoin d'aide ? Assistance

Vous souhaitez apprendre ? UiPath Academy

Vous avez des questions ? UiPath Forum

Rester à jour