Activités (Activities)
Plus récente (Latest)
False
Image de fond de la bannière
Activités Document Understanding
Dernière mise à jour 10 avril. 2024

Extraire les données du document

UiPath.IntelligentOCR.StudioWeb.Activities.ExtractDocumentDataWithDocumentData<UiPath.IntelligentOCR.StudioWeb.Activities.DataExtraction.ExtendedExtractionResultForDocumentData>

Extrait les données d'un fichier d'entrée ou d'un objet Données du document (Document Data) et stocke les résultats dans un objet Données du document (soit celui reçu pour la section Entrée, soit un objet nouvellement créé pour le fichier d'entrée).

Remarque :

L'activité Extraire les données du document (Extract Document Data) nécessite une activité qui la précède, qui peut fournir un objet Données du document (Document Data) (produit en tant que sortie par d'autres activités Document Understanding, par exemple Classer un document (Classify Document).

L'activité Extraire les données du document (Extract Document Data) reçoit en entrée l'un des choix suivants :
  • Données du document (Document Data) : à partir de l'activité Classer un document (Classify Document)
  • Fichier (File) : à partir des activités Obtenir un fichier/dossier (Get File/Folder) ou Obtenir l'e-mail le plus récent (Get Newest Email)

Les langues prises en charge pour les modèles génératifs sont les mêmes que le moteur OCR utilisé utilisé. Pour plus d'informations, consultez la page Langues prises en charge par l'OCR .

Compatibilité du projet : multiplateforme

Propriétés

  • Projet (Project) : vous devez sélectionner votre projet Document Understanding dans le menu déroulant. Les options disponibles sont les suivantes :
    • Prédéfini (Predefined) : le projet par défaut
    • Vous pouvez créer un projet personnalisé en accédant à Document Understanding.
  • Extracteur (Extractor) : vous devez choisir l'extracteur du projet sélectionné. Pour le projet prédéfini, les options disponibles sont :
    • L'un des paquets ML trouvés ici
      Remarque : l’activité Extraire les données du document (Extract Document Data) remplace le type de document par l’extracteur sélectionné. Ceci ne s'applique pas aux modèles génératifs.
    • Génératif
  • Invite (Prompt) : ce champ s'affiche si vous choisissez l'option Génératif (Generative). Invite pour identifier les champs à extraire, fournie sous forme de paires clé-valeur, où la clé représente le nom du champ et la valeur une description de celui-ci, permettant à l'extracteur d'identifier la valeur correspondante. Cliquez sur le champ pour obtenir une invite avec les options suivantes, fournies par paires :
    • Nom du champ (Field name) : vous devez saisir le nom du champ à extraire (ex. Date d'échéance) (limite de 30 caractères)
    • Invite générative (Generative prompt) : vous devez fournir l'invite en tant qu'entrée pour l'Extracteur génératif. (limite de 500 caractères)
    Astuce : pour connaître les bonnes pratiques d'utilisation des invites génératives, consultez la page Extracteur génératif - Bonnes pratiques .
  • Entrée (Input) : vous devez spécifier le fichier lui-même, ou les Données du document (Document Data), au cas où vous auriez déjà utilisé d'autres activités Document Understanding dans votre workflow (par exemple, Classer un document (Classify Document)).

Entrée

  • Délai d'attente (secondes) (aperçu) : délai d'exécution maximal (en secondes) pour l'appel vers le modèle génératif. Si l'opération dépasse ce délai, elle est automatiquement arrêtée pour éviter les retards ou les blocages. Cette propriété s'affiche uniquement si l' extracteur génératif est sélectionné en tant qu'extracteur.
Sortie
  • Données du document : toutes les données de champ extraites du fichier. Les informations peuvent également être reçues de Classer le document (Classify Document).
    Dans le cas de champs à valeurs multiples, toutes les valeurs sont renvoyées dans les Données du document (Document Data). Les valeurs sont disponibles dans DocumentData.Data.FieldName.MultiValues[]. Si la valeur MultiValue est null, cela signifie que le champ respectif n'est pas un champ à valeurs multiples. Si la propriété MultiValues est un tableau (même si elle est vide []), cela signifie que le champ correspondant est un champ à valeurs multiples.
Remarque : les données envoyées à l'extracteur génératif seront envoyées à une instance de modèle LLM qui n'est pas accessible au public, ne la quitteront pas et, une fois traitées, ne seront pas stockées ou utilisées à des fins d'entraînement.
Remarque : l'activité Extraire les données du document (Extract Document Data) utilise des points de terminaison publics.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Logo Uipath blanc
Confiance et sécurité
© 2005-2024 UiPath. All rights reserved.