- Vue d'ensemble (Overview)
- Document Processing Contracts
- Notes de publication
- À propos des contrats de traitement de documents
- Classe Zone
- Interface ActivitéIPersisted
- Classe PrettyBoxConverter
- Interface ActivitéIClassifier
- Interface FournisseurIClassifieurCapacités
- Classe TypeDocumentClassifieur
- Classe RésultatClassifieur
- Classe ActivitéCodeClassifieur
- Classe ActivitéClassifieurNatif
- Classe ActivitéClassifieurCodeAsync
- Classe CapacitéClassifieurTypeDocument
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ActivitéExtracteurCodeAsync
- Classe ActivitéExtracteurCode
- Classe ExtracteurTypeDocument
- Classe ExtracteurDocumentTypeCapacités
- Classe ExtracteurChampCapacités
- Classe ActivitéExtracteurNatif
- Classe ExtracteurRésultat
- FieldValue Class
- FieldValueResult Class
- Interface FournisseurICapabilities
- Interface ActivitéIExtractor
- Classe ChargeUtileExtracteur
- Énumération PrioritéActionDocument
- Classe DocumentActionData
- Énumération StatutActionDocument
- Énumération TypeActionDocument
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe DonnéesUtilisateur
- Classe Documents
- Classe RésultatDivisionDocument
- Classe ExtensionDom
- Classe Page
- Classe SectionPage
- Classe Polygone
- Classe ConvertisseurPolygones
- Classe de métadonnées
- Classe GroupeMot
- Classe Mot
- Énumération SourceTraitement
- Classe CelluleRésultatsTable
- Classe ValeurTableRésultats
- Classe InformationsColonnesTableRésultats
- Classe TableRésultats
- Énumération Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Énumération TypeSection
- Énumération TypeGroupeMot
- ProjectionTexteIDocument Interface
- Classe RésultatClassification
- Classe RésultatExtraction
- Classe ResultatsDocument
- Classe ResultatsLimitesDocument
- Classe ResultatsDonnéesPoint
- Classe RésultatsValeur
- Classe ResultatsContenuRéference
- Classe ResultatsValeurJetons
- Classe ResultatsChampDérivé
- Énumération ResultatsSourceDonnées
- Classe ResultatsConstantes
- Classe ChampValeurSimple
- Classe ValeurChampTable
- Classe GroupeDocument
- Classe DocumentTaxonomie
- Classe TypeDocument
- Classe Champ
- Énumération TypeChamp
- FieldValueDetails Class
- Classe InfoLangage
- Classe SaisieMétadonnées
- Énumération TypeTexte
- Classe TypeFieldTypeField Class
- Interface ActivitéISuivi
- ITrainableActivity Interface
- Interface ActivitéClassifieurITrainable
- Interface ActivitéExtracteurITrainable
- Classe ActivitéFormationClassifieurCodeAsync
- Classe ActivitéFormationClassifieurCode
- Classe ActivitéFormationClassifieurNatif
- Classe ActivitéFormationExtracteurCodeAsync
- Classe ActivitéFormationExtracteurCode
- Classe ActivitéFormationExtracteurNative
- Numériseur de Document Understanding
- Document Understanding ML
- Serveur local OCR Document Understanding
- Document Understanding
- Notes de publication
- À propos du package d’activités Document Understanding
- Compatibilité du projet
- Configuration de la connexion externe
- Définir le mot de passe du PDF
- Merge PDFs
- Get PDF Page Count
- Extraire le texte PDF (Extract PDF Text)
- Extract PDF Images
- Extract PDF Page Range
- Extraire les données du document
- Create Validation Task and Wait
- Attendre la tâche de validation et reprendre
- Create Validation Task
- Classer un document (Classify Document)
- Créer une tâche de validation de classification (Create Classification Validation Task)
- Créer une tâche de validation de classification et attendre (Create Classification Validation Task and Wait)
- Attendre la tâche de validation de la classification et reprendre
- IntelligentOCR
- Notes de publication
- À propos du package d'activités IntelligentOCR
- Compatibilité du projet
- Configuration de l'authentification
- Load Taxonomy
- Digitize Document
- Classify Document Scope
- Keyword Based Classifier
- Classifieur de projet Document Understanding (Document Understanding Project Classifier)
- Intelligent Keyword Classifier
- Create Document Classification Action
- Créer une action de validation de document (Create Document Validation Action)
- Retrieve Document Validation Artifacts
- Attendre l'action de classification du document et reprendre
- Tester l'étendue des classifieurs
- Outil d'entraînement de classifieur basé sur des mots-clés
- Intelligent Keyword Classifier Trainer
- Data Extraction Scope
- Extracteur de projet Document Understanding (Document Understanding Project Extractor)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Tester l'étendue des extracteurs
- Export Extraction Results
- Services ML
- OCR
- Contrats OCR
- Notes de publication
- À propos des contrats OCR
- Compatibilité du projet
- Interface ActivitéIOCR
- Classe OCRCodeAsync
- Classe ActivitéCodeOCR
- Classe ActivitéOCRNatif
- Classe Caractère
- Classe RésultatOCR
- Classe Mot
- Énumération StylesPolice
- Énumération RotationOCR
- Classe OCRCapabilities
- Classe BaseCaptureOCR
- Classe UsineCaptureOCR
- Classe BaseContrôleCapture
- Énumération UtilisationCaptureMoteur
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Non listé] Abbyy
- Notes de publication
- À propos du package d'activités Abbyy
- Compatibilité du projet
- Reconnaissance optique des caractères ABBYY (ABBYY OCR)
- Reconnaissance optique des caractères ABBYY Cloud (ABBYY Cloud OCR)
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Classer un document (Classify Document)
- Traiter le document (Process Document)
- Valider le document (Validate Document)
- Exporter le document (Export Document)
- Obtenir le champ (Get Field)
- Obtenir la table (Get Table)
- Prepare Validation Station Data
- [Non listé] Abbyy intégré

Activités Document Understanding
Notes de publication
Date de publication : 16 avril 2025
Extraire les données du document selon le type de document classé : utiliser un extracteur basé sur le résultat de l'opération de classification
DocumentData.DataType
. Dans la liste des extracteurs, choisissez Utiliser le résultat de la classification (Use Classification Result) pour l'extracteur suggéré. Consultez la page Extraire les données d'un document pour plus d'informations sur l'utilisation des résultats de la classification pour sélectionner un extracteur.
Pour fournir des capacités d’extraction adaptées à une catégorie de documents, vous pouvez désormais utiliser un type de projet moderne dédié appelé Prédéfini génératif (Generative Predefined). Ce type de projet propose les extracteurs suivants :
- Long Documents Simple Layout – This is the existent Generative Extractor.
- Long Documents Complex Layout (Preview) – Optimized for long form documents that include images, handwriting, form elements or other complex layouts, such as floating callout boxes. Examples of documents that are suitable for this extractor: insurance policies, or other similar long form documents with complex layouts.
- Short Document Complex Layout (Preview) – Optimized for short documents that include images, handwriting, form elements or other complex layouts like floating callout boxes. For example: identity cards, or healthcare intake forms with complex layouts.
Pour plus d’informations, consultez Extraire les données du document.
Pour utiliser un instantané d'un modèle, les activités et les API vous permettent désormais d'utiliser certaines versions de vos projets lors de la classification et de l'extraction. Les propriétés Balise (Tag) et Version (Version) fournissent un contrôle granulaire pour l'utilisation d'une version d'un modèle publié. Pour plus d'informations sur l'utilisation de versions avec DocumentUnderstanding.Activities , consultez Classer un document et Extraire les données d'un document. Pour plus d’informations sur l’exposition de la version dans votre projet, consultez Détails du document. Pour plus d'informations sur les API nouvellement disponibles pour la consommation de balises et de versions, consultez API de découverte et API de numérisation.
Vous pouvez désormais utiliser les activités Classer un document (Classify Document) et Extraire les données du document (Extract Document Data) même si le robot est connecté à un Orchestrator local. Au moment de la conception, vous pouvez utiliser des ressources Document Understanding provenant de différentes organisations ou de différents locataires. De même, au moment de l'exécution, vous pouvez exécuter ces activités tout en étant connecté à un Orchestrator local dans Studio.
Les nouvelles propriétés Connexion externe au moment de la conception (Design-time external connection) et Connexion externe au runtime (Runtime external connection) vous permettent d'utiliser directement les informations d'identification d'application externe, ou les informations d'identification stockées dans Orchestrator, pour accéder aux ressources Document Understanding pendant la phase de conception ou de runtime.
- Pour le projet Prédéfini génératif (Generative Predefined) , l' Extracteur génératif existant s'appelle désormais Extracteur de mise en page simple de document long (Long Document Simple Layout Extractor).
- Lors de la sélection d'un extracteur pour les types de projet génératifs, l'ancienne collection d'invites dans les activités Classer un document (Classify Document) et Extraire les données du document (Extract Document Data) a été renommée Détails du type de document (Document Type details), ce qui décrit plus précisément l'objectif de la collection.
- Dans la collection de détails du Type de document mis à jour, l'ancienne colonne d'invite générative est maintenant Instruction. Le champ Instruction représente les instructions que vous souhaitez offrir sur les informations qui doivent être extraites pour un certain nom de champ.
Pour plus d’informations sur les mises à jour, consultez les activités Classer un document (Classify Document) et Extraire les données d’un document (Extract Document Data) .
- La partie de numérisation de vos workflows de traitement de documents peut désormais reconnaître et renvoyer les données des documents contenant des valeurs entourées, soulignées ou barrées.
Date de publication : 19 novembre 2024
Un processus de classification et d’extraction de longue durée échouait en raison d’un délai d’attente par défaut expiré. Nous additionnons désormais l’ensemble des délais d’attente définis dans les activités pour calculer le délai d’attente global pour toutes les opérations en arrière-plan. Par ailleurs, nous avons amélioré le message d’erreur afin de clarifier la cause de l’échec dans cette situation spécifique.
Date de publication : 3 octobre 2024
Désactiver la génération de données de document à la demande pour plus de flexibilité dans les implémentations avancées
False
, le type de sortie passe de IDocumentData<ExtractorType>
à IDocumentData<DictionaryData>
. La définition de la propriété Générer le type de données (Generate Data Type) sur Flase
simplifie la récupération et la modification des valeurs de champ et vous permet de modifier le type de document dans la station de validation.
Consultez les pages Extraire les données du document et Données du document pour découvrir comment utiliser la propriété Générer le type de données (Generate Data Type) et les méthodes à utiliser pour accéder aux résultats de l’extraction.
Vous pouvez désormais configurer le compartiment de stockage Orchestrator pour qu’il fonctionne avec des options supplémentaires pour les activités Créer une tâche de validation de classification (Create Classification Validation Task) et Créer une tâche de validation de classification et attendre ( Create Classification Validation Task and Wait). Si aucun compartiment de stockage spécifique n’a été créé, vous pouvez en créer un par défaut.
- L’exécution d’un workflow Studio Web sur un robot Mac échouait avec l’exception suivante : « Impossible de charger le fichier ou l’assembly ’UiPath.DocumentUnderstanding.Common.SDK’ » (Could not load file or assembly ’UiPath.DocumentUnderstanding.Common.SDK).
- Les activités responsables de la création des tâches Action Center cessait de fonctionner lors de la correction manuelle de certains nombres ou dates dans un document.
- Correction d’une erreur qui se produisait dans Studio Web lors de la reprise d’un workflow. Auparavant, cette erreur se produisait après la première validation d’une classification de document, qui impliquait la récupération de fichiers depuis Microsoft OneDrive et leur validation dans Action Center.
Date de publication : 3 octobre 2024
Nous avons amélioré la stabilité du produit en mettant à jour nos dépendances communes vers les versions les plus récentes. Cette mise à niveau est automatique et ne nécessite aucune action de votre part.
Date de publication : 31 juillet 2024
Date de publication : 5 juin 2024
Nous avons amélioré la stabilité du produit en mettant à jour nos dépendances communes vers les versions les plus récentes. Cette mise à niveau est automatique et ne nécessite aucune action de votre part.
Date de publication : 5 juin 2024
Nous avons amélioré la stabilité du produit en révisant certaines dépendances.
Date de publication : 27 mai 2024
- Augmentation de la taille des invites de 500 à 1 000 caractères par question pour une meilleure clarté dans vos instructions. De plus, si vous atteignez la limite de taille d'invite de 1000 caractères par question, vous recevrez une erreur « Limite dépassée ».
- Amélioration des messages d’erreur pour l’activité Extraire les données de documents (Extract Document Data) pour une plus grande clarté et un débogage plus facile.
Date de publication : 29 avril 2024
Ces notes de publication contiennent toutes les mises à jour effectuées entre novembre 2023 et mars 2024.
UiPath.DocumentUnderstanding.Activities package.
Amélioration de la confiance d’extraction pour Extraire les données de documents
Nous avons amélioré notre activité Extraire les données de documents (Extract Document Data) pour augmenter la précision du score et réduire le temps de validation. Cette amélioration des propriétés Validation automatique et Seuil de confiance permet la vérification croisée des résultats d’extraction de modèles spécifiques par rapport à un modèle génératif.
Consultez la page Extraire les données de documents (Extract Document Data) pour apprendre à augmenter les niveaux de confiance de vos extractions.
Tâches de validation de la classification
Nous sommes ravis de vous annoncer que les activités suivantes sont désormais disponibles :
- Créer une tâche de validation de classification (Create Classification Validation Task): permet de créer une tâche de validation dans Action Center.
- Créer une tâche de validation de classification et attendre ( Create Classification Validation Task and Wait) : permet de créer une tâche de validation dans Action Center et de suspendre le workflow jusqu’à la fin.
- Attendre la tâche de validation de la classification et reprendre ( Wait for Classification Validation Task and Resume) : permet de suspendre l'exécution du workflow en cours jusqu'à ce qu'une action de validation de document spécifiée soit terminée.
- Vous pouvez désormais configurer le compartiment de stockage Orchestrator pour qu'il fonctionne avec des options supplémentaires pour les activités Créer une tâche de validation (Create Validation Task) et Attendre (Wait) et Créer une tâche de validation (Create Validation Task) . Si aucun compartiment de stockage spécifique n'a été créé, vous pouvez en créer un par défaut.
- La propriété Délai d'attente facultative est désormais disponible pour les activités Extraire les données du document (Extract Document Data) et Classer un document (Classify Document) . Ce paramètre configure un délai d'attente pour les activités.
- L’extracteur sélectionné dans l’activité Extraire les données du document (Extract Document Data) remplace désormais le type de document. Ne s'applique pas aux modèles génératifs.
- En cas de champs à valeurs multiples, toutes les valeurs sont renvoyées sous Données du document (Document Data) pour l’activité Extraire les données du document (Extract Document Data). Les valeurs sont disponibles dans
DocumentData.Data.FieldName.MultiValues[]
. - Cette version apporte les mises à jour suivantes à l'objet Données du document (Document Data) :
- La propriété Nom de l'attribut Type de document ( Document Type) est remplacée par ce qui suit :
- DisplayName pour les modèles personnalisés
- ID des modèles prêts à l'emploi
- Deux nouvelles propriétés sont ajoutées, renseignées à partir du résultat de l’infrastructure Document Understanding :
- ID
- DisplayName
- La propriété Nom de l'attribut Type de document ( Document Type) est remplacée par ce qui suit :
Les tableaux de bord Document Understanding Insights existants, actuellement en préversion, n’affichent plus les données du package multiplateforme DocumentUnderstanding.Activities. Ils ne signalent désormais que les données des workflows IntelligentOCR.Activities.
Les données de DocumentUnderstanding.Activities multiplate-forme sont désormais signalées dans un nouveau tableau de bord Insights distinct.
- La propriété de sortie ClassificationResults de l’activité Créer une tâche de validation de classification (Create Classification Validation Task) est renommée DonnéesDocument.
Attention :La propriété
CreatedClassificationValidationTask.ClassificationResults
ne sera pas disponible après la mise à niveau si elle se trouve dans votre workflow actuel. - La propriété de sortie ExtractionResults de l’activité Créer une tâche de validation (Create Validation Task) est renommée DonnéesDocument.
Attention :Si votre workflow utilise la propriété
CreatedDocumentValidationTask.ExtractionResults
, celle-ci ne sera pas disponible après la mise à niveau. - Correction d’un problème où l’activité Attendre la tâche de validation et reprendre (Wait for Validation Task and Resume) ne reconnaissait pas les nombres au format
3.1342,7
, provoquant une erreur « La chaîne d’entrée n’était pas au format correct ». Tous les formats de nombres sont désormais entièrement pris en charge.
Date de publication : 1er novembre 2023
- Activité Classer un document (Classify Document)
- Activité Extraire les données du document (Extract Document Data)
Le package UiPath.DocumentUnderstanding.Activities est désormais pris en charge sur les systèmes macOS.
- Create Validation Task and Wait
- Attendre la tâche de validation du document et reprendre
Date de publication : 11 mai 2023
- Nous avons corrigé un bogue qui provoquait l'interruption du chargement de l’activité Extraire les données du document (Extract Document Data) lorsqu’un modèle était utilisé.
- Nous avons corrigé un bogue où les champs
ActionCatalog
ne fonctionnaient pas pour les activités Créer une action de validation de document (Create Document Validation Action) et Créer une tâche de validation et attendre (Create Validation Task and Wait). - Nous avons corrigé un bogue qui provoquait une erreur lorsque l’activité Classer un document (Classify Document) était utilisée dans un workflow.
Date de publication : 11 mai 2023
Nous avons corrigé un bogue où les utilisateurs obtenaient une erreur lorsqu’ils essayaient d’utiliser la valeur d’un champ extrait avec l’activité Extraire les données du document (Extract Document Data) et que la valeur n’était pas présente.
Date de publication : 5 mai 2023
L’activité Extraire le texte PDF ( Extract PDF Text) est le dernier ajout au package, vous permettant d’extraire tous les caractères d’un fichier PDF spécifié et de le stocker dans une variable de chaîne. Lorsque l'option Appliquer l'OCR (Apply OCR) est activée, elle extrait les informations à l'aide de l'OCR, et lorsqu'elle est désactivée, elle extrait le contenu natif.
Deux activités ont vu leurs noms mis à jour et une activité a des champs mis à jour :
- Créer une tâche de validation de document est devenu Créer une tâche de validation.
- Attendre la tâche de validation de document et reprendre (Wait for Document Validation Task and Resume) devient Attendre la tâche de validation et reprendre (Wait for Validation Task and Resume).
- Définir le mot de passe du PDF propose désormais des noms de champs plus détaillés, tels que :
- Nouveau Mot de passe administrateur
- Nouveau Mot de passe « Open »
- Mot de passe « Manage » actuel
- Mot de passe « Open » actuel
- v2.14.0
- Extraire les données du document selon le type de document classé : utiliser un extracteur basé sur le résultat de l'opération de classification
- Nouveautés
- Capacités d’extraction améliorées grâce à de nouveaux extracteurs
- Utilisation de balises et de versions pour référencer les projets modernes Document Understanding
- Prise en charge des activités à partir d’une configuration locale
- Améliorations
- v2.12.1
- Résolution de bogues
- v2.4.5
- Résolution de bogues
- v2.9.6
- Résolution de bogues
- v2.12.0
- Nouveautés
- Désactiver la génération de données de document à la demande pour plus de flexibilité dans les implémentations avancées
- Améliorations
- Résolution de bogues
- v2.2.6
- v2.9.5
- Résolution de bogues
- v2.9.4
- Résolution de bogues
- v2.9.3
- Résolution de bogues
- v2.4.3
- v2.9.2
- v2.9.1
- Améliorations
- Résolution de bogues
- v2.9.0
- Nouveautés
- Améliorations
- Limites connues
- Résolution de bogues
- v2.4.2
- Résolution de bogues
- v2.4.1
- Disponibilité générale des fonctionnalités génératives
- Nouvelles fonctionnalités et améliorations
- v2.4.0
- Disponibilité générale des activités Document Understanding
- v2.2.4
- Nouvelles fonctionnalités et améliorations
- v2.2.3
- Résolution de bogues
- v2.2.2
- Résolution de bogues
- Problèmes connus
- v2.2.1
- Nouvelles fonctionnalités et améliorations