- Vue d'ensemble (Overview)
- Document Processing Contracts
- Notes de publication
- À propos des contrats de traitement de documents
- Classe Zone
- Interface ActivitéIPersisted
- Classe PrettyBoxConverter
- Interface ActivitéIClassifier
- Interface FournisseurIClassifieurCapacités
- Classe TypeDocumentClassifieur
- Classe RésultatClassifieur
- Classe ActivitéCodeClassifieur
- Classe ActivitéClassifieurNatif
- Classe ActivitéClassifieurCodeAsync
- Classe CapacitéClassifieurTypeDocument
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ActivitéExtracteurCodeAsync
- Classe ActivitéExtracteurCode
- Classe ExtracteurTypeDocument
- Classe ExtracteurDocumentTypeCapacités
- Classe ExtracteurChampCapacités
- Classe ActivitéExtracteurNatif
- Classe ExtracteurRésultat
- FieldValue Class
- FieldValueResult Class
- Interface FournisseurICapabilities
- Interface ActivitéIExtractor
- Classe ChargeUtileExtracteur
- Énumération PrioritéActionDocument
- Classe DocumentActionData
- Énumération StatutActionDocument
- Énumération TypeActionDocument
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe DonnéesUtilisateur
- Classe Documents
- Classe RésultatDivisionDocument
- Classe ExtensionDom
- Classe Page
- Classe SectionPage
- Classe Polygone
- Classe ConvertisseurPolygones
- Classe de métadonnées
- Classe GroupeMot
- Classe Mot
- Énumération SourceTraitement
- Classe CelluleRésultatsTable
- Classe ValeurTableRésultats
- Classe InformationsColonnesTableRésultats
- Classe TableRésultats
- Énumération Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Énumération TypeSection
- Énumération TypeGroupeMot
- ProjectionTexteIDocument Interface
- Classe RésultatClassification
- Classe RésultatExtraction
- Classe ResultatsDocument
- Classe ResultatsLimitesDocument
- Classe ResultatsDonnéesPoint
- Classe RésultatsValeur
- Classe ResultatsContenuRéference
- Classe ResultatsValeurJetons
- Classe ResultatsChampDérivé
- Énumération ResultatsSourceDonnées
- Classe ResultatsConstantes
- Classe ChampValeurSimple
- Classe ValeurChampTable
- Classe GroupeDocument
- Classe DocumentTaxonomie
- Classe TypeDocument
- Classe Champ
- Énumération TypeChamp
- FieldValueDetails Class
- Classe InfoLangage
- Classe SaisieMétadonnées
- Énumération TypeTexte
- Classe TypeFieldTypeField Class
- Interface ActivitéISuivi
- ITrainableActivity Interface
- Interface ActivitéClassifieurITrainable
- Interface ActivitéExtracteurITrainable
- Classe ActivitéFormationClassifieurCodeAsync
- Classe ActivitéFormationClassifieurCode
- Classe ActivitéFormationClassifieurNatif
- Classe ActivitéFormationExtracteurCodeAsync
- Classe ActivitéFormationExtracteurCode
- Classe ActivitéFormationExtracteurNative
- Numériseur de Document Understanding
- Document Understanding ML
- Serveur local OCR Document Understanding
- Document Understanding
- Notes de publication
- À propos du package d’activités Document Understanding
- Compatibilité du projet
- Configuration de la connexion externe
- Définir le mot de passe du PDF
- Merge PDFs
- Get PDF Page Count
- Extraire le texte PDF (Extract PDF Text)
- Extract PDF Images
- Extract PDF Page Range
- Create Validation Task and Wait
- Attendre la tâche de validation et reprendre
- Create Validation Task
- Classer un document (Classify Document)
- Classer le document - Aperçu
- Créer une tâche de validation de classification (Create Classification Validation Task)
- Créer une tâche de validation de classification et attendre (Create Classification Validation Task and Wait)
- Attendre la tâche de validation de la classification et reprendre
- IntelligentOCR
- Notes de publication
- À propos du package d'activités IntelligentOCR
- Compatibilité du projet
- Configuration de l'authentification
- Load Taxonomy
- Digitize Document
- Classify Document Scope
- Keyword Based Classifier
- Classifieur de projet Document Understanding (Document Understanding Project Classifier)
- Intelligent Keyword Classifier
- Create Document Classification Action
- Créer une action de validation de document (Create Document Validation Action)
- Retrieve Document Validation Artifacts
- Attendre l'action de classification du document et reprendre
- Tester l'étendue des classifieurs
- Outil d'entraînement de classifieur basé sur des mots-clés
- Intelligent Keyword Classifier Trainer
- Data Extraction Scope
- Extracteur de projet Document Understanding (Document Understanding Project Extractor)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Tester l'étendue des extracteurs
- Export Extraction Results
- Services ML
- OCR
- Contrats OCR
- Notes de publication
- À propos des contrats OCR
- Compatibilité du projet
- Interface ActivitéIOCR
- Classe OCRCodeAsync
- Classe ActivitéCodeOCR
- Classe ActivitéOCRNatif
- Classe Caractère
- Classe RésultatOCR
- Classe Mot
- Énumération StylesPolice
- Énumération RotationOCR
- Classe OCRCapabilities
- Classe BaseCaptureOCR
- Classe UsineCaptureOCR
- Classe BaseContrôleCapture
- Énumération UtilisationCaptureMoteur
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Non listé] Abbyy
- Notes de publication
- À propos du package d'activités Abbyy
- Compatibilité du projet
- Reconnaissance optique des caractères ABBYY (ABBYY OCR)
- Reconnaissance optique des caractères ABBYY Cloud (ABBYY Cloud OCR)
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Classer un document (Classify Document)
- Traiter le document (Process Document)
- Valider le document (Validate Document)
- Exporter le document (Export Document)
- Obtenir le champ (Get Field)
- Obtenir la table (Get Table)
- Prepare Validation Station Data
- [Non listé] Abbyy intégré

Activités Document Understanding
PREVIEWClasser le document - Aperçu
UiPath.IntelligentOCR.StudioWeb.Activities.ClassifyDocument
Vous pouvez utiliser cette activité pour classer les documents en sélectionnant un classifieur et un document que vous souhaitez classer.
Le type de projet Génératif prédéfini et les extracteurs correspondants ne sont pas disponibles dans Automation Suite.
Module Designer
- Entrée (Input) : indiquez le fichier d'entrée ou l'objet Données du document (Document Data).
Important : un fichier peut avoir au maximum 500 pages. Les fichiers dépassant cette limite ne pourront pas être classifiés.Astuce : lorsque vos fichiers ne sont pas stockés en tant que variable de type
IResource
, il existe une option pour effectuer une conversion. Utilisez pour celaLocalResource.FromPath(<reference_to_the_file>)
dans le champ de propriété d’entrée.Prenons le cas d’un scénario dans lequel vous allez parcourir une liste de fichiers à l’aide d’une activité Pour chaque (For Each). Supposons quecurrentItem
soit votre variable d’itération. Pour convertircurrentItem
enIResource
, collezLocalResource.FromPath(currentItem)
dans le champ Entrée. - Projet Document Understanding : vous devez sélectionner votre projet Document Understanding dans le menu déroulant. Les options disponibles sont :
- Prédéfini (Predefined) : projet qui utilise des modèles spécialisés pré-entraînés recommandés dans le cadre de scénarios standard.
- Génératif prédéfini : projet utilisant des modèles génératifs pré-entraînés acceptant des instructions comme entrée pour la classification ou l’extraction des données d’un document.
- Projet du locataire et du dossier auxquels vous êtes connecté
- Vous pouvez créer un nouveau projet en sélectionnant l’icône + .
Remarque : si vous avez créé plus de 500 projets sur votre locataire et que vous utilisez l'activité Classer un document (Classify Document), UiPath Studio ou Studio Web n'affichera aucun projet au-delà des 500 valeurs initiales. Par conséquent, ces projets ne peuvent pas être utilisés. - Classifieur (Classifier) : si vous utilisez le projet prédéfini, vous pouvez sélectionner le classifieur Document Understanding souhaité dans le menu déroulant.
Remarque : les données envoyées au classifieur génératif seront envoyées à une instance de modèle LLM qui n'est pas accessible au public, ne la quitteront pas et, une fois traitées, ne seront pas stockées ou utilisées à des fins d'entraînement.
- Pour le projet prédéfini, deux choix s’offrent à vous :
- Classification ML : classifieur basé sur ML.
- Classifieur génératif (Generative Classifier) : le type de classifieur génératif.
Important :
Cette fonctionnalité fait actuellement partie d'un processus d'audit et ne doit pas être considérée comme faisant partie de l'autorisation FedRAMP tant que la révision n'est pas finalisée. Consultez ici la liste complète des fonctionnalités en cours de révision.
- Détails du type de document : instructions pour identifier les types de documents, fournie sous forme de paires clé-valeur, où la clé représente le nom du type de document et la valeur la description de celui-ci, permettant au classifieur d’identifier ces documents.
- Clé : indiquez le nom du type de document à utiliser pour le résultat de la classification (limite de 30 caractères).
- Valeur : vous devez fournir des instructions au Classifieur génératif sur la façon d’identifier le type de document. Le nombre maximum de caractères autorisés est de 1 000.
- Détails du type de document : instructions pour identifier les types de documents, fournie sous forme de paires clé-valeur, où la clé représente le nom du type de document et la valeur la description de celui-ci, permettant au classifieur d’identifier ces documents.
- Pour le projet Génératif prédéfini, vous pouvez utiliser uniquement le classifieur génératif.
- Pour le projet prédéfini, deux choix s’offrent à vous :
- Version (Aperçu) : utilisez cette propriété lorsque vous utilisez un projet moderne Document Understanding existant. Sélectionnez la balise qui correspond à la version de projet à partir de laquelle vous souhaitez traiter les données. Par exemple, si vous choisissez la balise Production affectée à la version 3, l'activité traitera les données de la version 3 de votre projet dans l'environnement de production.
La valeur par défaut de Version est Organisation (Staging). Si la balise Organisation n’existe pas dans votre projet sélectionné, la valeur par défaut est Production.
Après avoir sélectionné une balise, l'activité affiche une liste des types de documents pris en charge pour cette version.
Panneau propriétés
Options avancées
- Confiance minimum (Minimum confidence) : spécifiez le seuil de confiance minimum relatif au type de document attribué au moment de la classification. Si le score de confiance d’un document est inférieur à ce seuil, le Type de document sera défini sur « inconnu ».
Astuce : la plupart des types de documents génèrent une prédiction associée à un niveau de confiance. Cette propriété empêche les faux positifs en tenant uniquement compte des prédictions avec un niveau de confiance supérieur à certain seuil. Vous pouvez identifier un niveau de confiance optimal en testant divers documents dans votre workflow, en enregistrant les résultats dans une feuille de calcul Excel, par exemple, puis en analysant la valeur la plus adéquate pour définir un seuil.
Connexion externe lors de la conception
La connexion externe au moment de la conception vous permet de tirer parti de l'activité à l'aide de ressources Document Understanding provenant d'autres projets ou locataires. Avant de configurer ces propriétés, assurez-vous d'avoir rempli les prérequis mentionnés à la page Configuration de la connexion externe du runtime . Une fois ces étapes terminées, vous pouvez ensuite procéder à la configuration de la connexion externe du runtime.
- ID d'application (App ID) : saisissez l'ID d'application de l'application externe que vous avez précédemment créée.
- Clé secrète de l'application (App secret) : saisissez la clé secrète de l'application de l'application externe que vous avez précédemment créée.
- URL du locataire (Tenant URL) : saisissez l'URL du locataire sur lequel vous avez créé l'application externe. Il s’agit du locataire à partir duquel vous utiliserez les ressources au moment de la conception.
L'URL doit être au format suivant :
https://<baseURL>/<OrganizationName>/<TenantName>
.
Entrée
- Délai d' attente (secondes) (Timeout (seconds) : délai d'exécution maximal (en secondes) pour l'appel vers le modèle génératif. Si l'opération dépasse ce délai, elle est automatiquement arrêtée pour éviter les retards ou les blocages. Cette propriété s'affiche uniquement si le classifieur génératif est sélectionné en tant que classifieur.
Sortie
- Données du document (Document Data) : toutes les données de champ validées extraites du fichier.
Connexion externe du runtime
La connexion externe de runtime vous permet d'exécuter l'activité via des robots locaux. Avant de configurer ces propriétés, assurez-vous d'avoir rempli les prérequis mentionnés à la page Configuration de la connexion externe du runtime . Une fois ces étapes terminées, vous pouvez ensuite procéder à la configuration de la connexion externe du runtime.
- Ressource d' informations d'identification du runtime (Runtime Credentials Asset) : utilisez ce champ lorsque vous devez accéder aux ressources Document Understanding alors que le robot est connecté à un Orchestrator local ou à partir d'un locataire différent. Vous pouvez choisir de saisir une ressource d'informations d’identification, à des fins d'authentification, de l’une des manières suivantes :
- Dans la liste déroulante, sélectionnez la ressource d’informations d’identification souhaitée dans l’Orchestrator auquel le Robot UiPath® est connecté.
- Saisissez manuellement le chemin d’accès à la ressource d’informations d’identification Orchestrator où vous stockez les informations d’identification de l’application externe pour accéder au projet.
Le format du chemin d'accès doit être :
<OrchestratorFolderName>/<AssetName>
.
- URL du locataire au runtime : utilisez ce champ, conjointement au champ Ressource d’informations d’identification du runtime. Saisissez l’URL du locataire auquel le robot se connectera afin d’exécuter la classification. L’URL doit être au format suivant :
https://<baseURL>/<OrganizationName>/<TenantName>
.
Pour commencer rapidement à utiliser les fonctionnalités génératives de l’activité Classer un document (Classify Document), procédez aux étapes suivantes :
- Ajouter une activité Classifier un document (Classify Document)
- Dans la liste déroulante Projet, sélectionnez Prédéfini ou Génératif Prédéfini.
- Pour Classifieur(Classifier), sélectionnez Classifieur génératif ( Generative Classifier).
La propriété Détails du type de document s’affiche dans le corps de l’activité.
- Dans la collection Détails du type de document, fournissez vos instructions sous la forme de paires clé-valeur de dictionnaire, où :
- La clé représente le type de document (exemple : CV).
- La valeur représente l' invite générative: la description utilisée par le classifieur génératif pour identifier les types de documents.
Par exemple, consultez la table suivante pour un exemple de paires clé-valeur :
Tableau 1. Paires clé-valeur utilisées comme invite pour le classifieur génératif Clé (Key) Valeur (Value) CV « Trouvez des mots-clés de CV courants tels que "Formation", "Compétences" et "Expérience". » Facture « Trouvez des noms de champs courants tels que « Numéro de facture », « Facturation à » ou « Montant total ». »
Image 1. Paires clé-valeur utilisées en tant qu’invite pour l’extracteur génératif