Activités (Activities)
Plus récente (Latest)
False
Image de fond de la bannière
Activités Document Understanding
Dernière mise à jour 29 avr. 2024

Données du document

Les Données du document sont une ressource qui sert à la fois de variable d’entrée et de sortie dans vos workflows Document Understanding. L'objet Données du document contient toutes les informations nécessaires d'un seul document. Si vous classez un document, l’objet inclut le Type de document. Si vous extrayez des données, l'objet contient les champs extraits correspondants. Quelle que soit l'activité, les données de document contiennent systématiquement le texte du document et le DOM (modèle d'objet de document).

Avec les Données du document, vous pouvez : collecter toutes les informations nécessaires sur un document dans une seule variable, enregistrer des données dans chaque propriété de l'objet et les réutiliser pour d'autres activités du workflow.

Les données des documents contiennent des informations sur les attributs suivants :

  • TypeDocument: fournit des données sur le type de document identifié, remplies par des activités telles que Classer un document (Classify Document) ou Créer une tâche de validation de classification ( Create Classification Validation Task)
  • Données(Data) : contient les valeurs de champ extraites, remplies par des activités telles que Extraire les données du document (Extract Document Data) ou Créer une tâche de validation de document ( Create Document Validation Task) .
  • DétailsFichier: contient des détails sur les IResource.
  • Sous-documents ( SubDocuments): comprend une collection de données de document, remplies par des activités telles que Créer une tâche de validation de classification (Create Classification Validation Task).
  • MétadonnéesDocument: contient des informations sur le traitement du document, telles que :
    • Langue détectée par texte
    • Champs extraits sous forme de table de données
    • DOM (Document Object Model): contient le modèle d'objet de document qui est utilisé par toutes les activités.
    La valeur DocumentMetadata est mise à jour par l'activité qui traite en premier le document. Une fois renseignées, les métadonnées sont partagées avec et utilisées par toutes les activités suivantes qui reçoivent l'objet Données du document (Document Data).
    Astuce : sauf si une activité est la première activité Document Understanding d'un workflow Studio, utilisez les Données du document en tant qu'entrée. Utilisez la variable Fichier (File) comme entrée uniquement si l'activité est la première partie Document Understanding d'un workflow Studio.

Propriétés

Les propriétés de la variable Données du document (Document Data) peuvent être renseignées et utilisées par une ou plusieurs activités. Selon l'activité renseignant la variable, les propriétés peuvent différer.

Nom d'attributPropriétéDescriptionActivités renseignant la valeur
Type de documentDisplayName (utilisé pour les modèles personnalisés)Nom du type de documentClasser un document (Classify Document)
ID (utilisé pour les modèles prêts à l’emploi)Nom du type de document
ConfidenceConfiance de classification
URLURL où le type de document est accessible ; cela peut être personnalisé ou prédéfini, référencé via le projet correspondant dans le centre Document Understanding.
ChampsValeurs de champValeur d'extraction du champ
Score de confiance d'extractionScore de confiance de l'extraction, tel que fourni par le modèle
Score de confidence OCRScore de confiance fourni par le moteur OCR
Détails du fichierNomCompletLe nom complet du fichierActivités créant l'objet Données du document (Document Data), recevant un fichier en tant qu'entrée
ExtensionExtension du fichier
Page RangePlage de pages du fichier
Sous-documentsNACollecte de données de documents
Remarque : ce champ n'est pas renseigné actuellement et sera ajouté à l'avenir avec des fonctionnalités de validation de classification et de fractionnement.
Classer un document (Classify Document)
MetadataNAInformations sur le traitement du documentActivités créant l'objet Données du document (Document Data), recevant un fichier en entrée.
DOMNALe modèle d'objet du document, utilisé par toutes les activités
TexteNATout le texte extrait
Détecter la langueNALa langue détectée dans le document
Niveau de confiance fractionnéNASi le document est fractionné, le document est renvoyé par le modèle de fractionnement
Remarque : ce champ n'est pas renseigné actuellement et sera ajouté à l'avenir avec des fonctionnalités de validation de classification et de fractionnement.
Classer un document (Classify Document)
Résultats sous forme de table de donnéesNAChamps exportés sous forme de table de donnéesExtraire les données du document

Transmettre des données de documents vers des activités

Lorsque vous utilisez Données du document, le premier objet de sortie est créé à partir de votre fichier d'entrée. Après avoir créé cet objet, nous vous recommandons de le transmettre à vos prochaines activités. En le passant à vos prochaines activités, vous pouvez réutiliser le Texte (Text) et le DOM de votre fichier d’origine. Cette approche vous évite de renumériser le fichier à chaque fois.

Utilisation des résultats d'extraction pour les champs à une ou plusieurs valeurs

Si vous configurez un champ de type de document pour qu’il soit à plusieurs valeurs, le système attend plusieurs valeurs. Un exemple pourrait être une question à choix multiples dans un formulaire. Les résultats apparaissent dans l'attribut à valeurs multiples du champ, renvoyé sous forme de liste. Si le champ de type de document est configuré pour être à valeur unique, le système renvoie le résultat dans l’attribut de valeur du champ par défaut.

Le tableau suivant vous montre comment les Données du document renvoient des champs à une et plusieurs valeurs :

Type de champne comporte pas de valeurA une valeurComporte deux valeurs ou plusDocumentData.Data.FieldName.ValueDocumentData.Data.FieldName.MultiValues
Valeur unique Oui (Yes)Non (No)S/O""null
Valeur uniqueNon (No)Oui (Yes)S/O<value that was identified><valeur identifiée>null
Valeurs multiplesOui (Yes)Non (No)Non (No)""[] (tableau vide)
Valeurs multiplesNon (No)Oui (Yes)Non (No)<value that was identified><valeur identifiée>[<tableau avec une valeur identique à .Value>]
Valeurs multiplesNon (No)Non (No)Oui (Yes)<first value that was identified><première valeur identifiée>[<tableau avec n valeurs, la première valeur étant identique à .Value>]

Renvoyer les champs extraits sous forme de table de données

Vous pouvez renvoyer les champs que vous avez extraits d'un document en tant que table de données, à l'aide de l'objet Données du document. Vous pouvez ensuite utiliser la variable TableDonnées (Data Table) à l'intérieur des activités Excel.

Pour renvoyer les champs extraits sous forme de table de données, choisissez la sortie ResultsAsDataTable pour l'activité Extraire les données du document (Extract Document Data) .

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Logo Uipath blanc
Confiance et sécurité
© 2005-2024 UiPath. All rights reserved.