- Vue d'ensemble (Overview)
- Document Processing Contracts
- Notes de publication
- À propos des contrats de traitement de documents
- Classe Zone
- Interface ActivitéIPersisted
- Classe PrettyBoxConverter
- Interface ActivitéIClassifier
- Interface FournisseurIClassifieurCapacités
- Classe TypeDocumentClassifieur
- Classe RésultatClassifieur
- Classe ActivitéCodeClassifieur
- Classe ActivitéClassifieurNatif
- Classe ActivitéClassifieurCodeAsync
- Classe CapacitéClassifieurTypeDocument
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ActivitéExtracteurCodeAsync
- Classe ActivitéExtracteurCode
- Classe ExtracteurTypeDocument
- Classe ExtracteurDocumentTypeCapacités
- Classe ExtracteurChampCapacités
- Classe ActivitéExtracteurNatif
- Classe ExtracteurRésultat
- FieldValue Class
- FieldValueResult Class
- Interface FournisseurICapabilities
- Interface ActivitéIExtractor
- Classe ChargeUtileExtracteur
- Énumération PrioritéActionDocument
- Classe DocumentActionData
- Énumération StatutActionDocument
- Énumération TypeActionDocument
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe DonnéesUtilisateur
- Classe Documents
- Classe RésultatDivisionDocument
- Classe ExtensionDom
- Classe Page
- Classe SectionPage
- Classe Polygone
- Classe ConvertisseurPolygones
- Classe de métadonnées
- Classe GroupeMot
- Classe Mot
- Énumération SourceTraitement
- Classe CelluleRésultatsTable
- Classe ValeurTableRésultats
- Classe InformationsColonnesTableRésultats
- Classe TableRésultats
- Énumération Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Énumération TypeSection
- Énumération TypeGroupeMot
- ProjectionTexteIDocument Interface
- Classe RésultatClassification
- Classe RésultatExtraction
- Classe ResultatsDocument
- Classe ResultatsLimitesDocument
- Classe ResultatsDonnéesPoint
- Classe RésultatsValeur
- Classe ResultatsContenuRéference
- Classe ResultatsValeurJetons
- Classe ResultatsChampDérivé
- Énumération ResultatsSourceDonnées
- Classe ResultatsConstantes
- Classe ChampValeurSimple
- Classe ValeurChampTable
- Classe GroupeDocument
- Classe DocumentTaxonomie
- Classe TypeDocument
- Classe Champ
- Énumération TypeChamp
- FieldValueDetails Class
- Classe InfoLangage
- Classe SaisieMétadonnées
- Énumération TypeTexte
- Classe TypeFieldTypeField Class
- Interface ActivitéISuivi
- ITrainableActivity Interface
- Interface ActivitéClassifieurITrainable
- Interface ActivitéExtracteurITrainable
- Classe ActivitéFormationClassifieurCodeAsync
- Classe ActivitéFormationClassifieurCode
- Classe ActivitéFormationClassifieurNatif
- Classe ActivitéFormationExtracteurCodeAsync
- Classe ActivitéFormationExtracteurCode
- Classe ActivitéFormationExtracteurNative
- Classe BasicDataPoint : aperçu
- Classe GestionnaireRésultatExtraction - aperçu
- Document Understanding ML
- Serveur local OCR Document Understanding
- Document Understanding
- Notes de publication
- À propos du package d’activités Document Understanding
- Compatibilité du projet
- Configuration de la connexion externe
- Définir le mot de passe du PDF
- Merge PDFs
- Get PDF Page Count
- Extraire le texte PDF (Extract PDF Text)
- Extract PDF Images
- Extract PDF Page Range
- Extraire les données du document
- Create Validation Task and Wait
- Attendre la tâche de validation et reprendre
- Create Validation Task
- Classer un document (Classify Document)
- Créer une tâche de validation de classification (Create Classification Validation Task)
- Créer une tâche de validation de classification et attendre (Create Classification Validation Task and Wait)
- Attendre la tâche de validation de la classification et reprendre
- IntelligentOCR
- Notes de publication
- À propos du package d'activités IntelligentOCR
- Compatibilité du projet
- Load Taxonomy
- Digitize Document
- Classify Document Scope
- Keyword Based Classifier
- Classifieur de projet Document Understanding (Document Understanding Project Classifier)
- Intelligent Keyword Classifier
- Create Document Classification Action
- Créer une action de validation de document (Create Document Validation Action)
- Retrieve Document Validation Artifacts
- Attendre l'action de classification du document et reprendre
- Tester l'étendue des classifieurs
- Outil d'entraînement de classifieur basé sur des mots-clés
- Intelligent Keyword Classifier Trainer
- Data Extraction Scope
- Extracteur de projet Document Understanding (Document Understanding Project Extractor)
- Entraîneur d’extracteur de projet Document Understanding
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Caviarder le document
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Tester l'étendue des extracteurs
- Export Extraction Results
- Extracteur d'apprentissage automatique
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Classifieur génératif
- Extracteur génératif
- Configuration de l'authentification
- Valider des documents avec des actions App
- Valider manuellement des documents numérisés
- Extraction de données basée sur des ancres à l'aide de l'Extracteur de formulaires intelligent
- Station de validation
- Activités génératives - Bonnes pratiques
- Extracteur génératif - Bonnes pratiques
- Classifieur génératif - Bonnes pratiques
- Services ML
- OCR
- Contrats OCR
- Notes de publication
- À propos des contrats OCR
- Compatibilité du projet
- Interface ActivitéIOCR
- Classe OCRCodeAsync
- Classe ActivitéCodeOCR
- Classe ActivitéOCRNatif
- Classe Caractère
- Classe RésultatOCR
- Classe Mot
- Énumération StylesPolice
- Énumération RotationOCR
- Classe OCRCapabilities
- Classe BaseCaptureOCR
- Classe UsineCaptureOCR
- Classe BaseContrôleCapture
- Énumération UtilisationCaptureMoteur
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Non listé] Abbyy
- Notes de publication
- À propos du package d'activités Abbyy
- Compatibilité du projet
- Reconnaissance optique des caractères ABBYY (ABBYY OCR)
- Reconnaissance optique des caractères ABBYY Cloud (ABBYY Cloud OCR)
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Classer un document (Classify Document)
- Traiter le document (Process Document)
- Valider le document (Validate Document)
- Exporter le document (Export Document)
- Obtenir le champ (Get Field)
- Obtenir la table (Get Table)
- Prepare Validation Station Data
- [Non listé] Abbyy intégré
Activités Document Understanding
UiPath.DocumentUnderstanding.ML.Activities.GenerativeExtractor
Description
Vous permet d'extraire des documents à l'aide de modèles génératifs.
Pour connaître les bonnes pratiques relatives à l’utilisation des invites génératives, consultez la page Extracteur génératif - Bonnes pratiques .
- Les langues prises en charge pour les modèles génératifs sont les mêmes que celles du moteur OCR utilisé. Pour plus d’informations, consultez la page Langues prises en charge par l’OCR .
- L’activité Extracteur génératif ne prend pas en charge l’extraction des champs de table définis dans le Gestionnaire de taxonomie ou l’extraction de tables. Cependant, il peut extraire du texte de documents.
Compatibilité du projet
Windows - Héritage | Windows
Configuration
Module Designer
- Gérer les détails du champ : sélectionnez cette option pour ouvrir l’assistant Invite de l’extracteur génératif .
Panneau propriétés
Authentification
Les propriétés d’authentification de cette activité vous permettent de l’exécuter via des robots locaux. Avant de configurer ces propriétés, veillez à bien respecter les exigences détaillées sur la page. Une fois ces étapes terminées, vous pouvez remplir les propriétés d’authentification de l’activité.
- Ressource d’informations d’identification de runtime
- Utilisez ce champ lorsque vous avez besoin d’accéder aux fonctionnalités d’extraction générative de Document Understanding lorsque le Robot est connecté à un Orchestrator local ou bien à partir d’un locataire différent. À des fins d’authentification, vous pouvez choisir de saisir une ressource d’informations d’identification de l’une des manières suivantes :
-
Dans la liste déroulante, sélectionnez la ressource d’informations d’identification souhaitée dans l’Orchestrator auquel le robot UiPath® est connecté.
-
Entrez manuellement le chemin d'accès à l'activité Orchestrator Credential Asset où vous stockez les informations d'identification de l'application externe pour accéder aux fonctionnalités génératives.
Le format du chemin d'accès doit être :
<OrchestratorFolderName>/<AssetName>.
- URL du locataire au runtime : utilisez ce champ, conjointement au champ Ressource d’informations d’identification du runtime . Saisissez l’URL du locataire auquel le robot se connectera afin d’exécuter l’extraction générative. L’URL doit être au format suivant :
https://<baseURL>/<OrganizationName>/<TenantName>.
Commun
- NomAffichage (DisplayName) - Nom affiché de l'activité.
Divers
- Privé (Private) - Si cette option est sélectionnée, les valeurs des variables et des arguments ne sont plus enregistrées au niveau Détaillé (Verbose).
Server
- RetryOnFailure - Automatically retries the machine learning model execution, to eliminate transient network errors. If checked, the activity retries the execution.
- Timeout (milliseconds) - Specifies the amount of time (in milliseconds) to wait for a response from the server before an error is thrown. The default value is 100000 milliseconds (100 seconds).
Utilisation de l'assistant Extracteur génératif (Generative Extractor)
L’assistant de l’ invite de l’extracteur génératif vous permet de sélectionner un type de document spécifique et un champ. Vous pouvez également sélectionner une valeur facultative pour spécifier davantage les détails du champ correspondant. De plus, l'assistant vous permet d'attribuer un type d'extracteur génératif différent pour chaque type de document, ce qui permet une personnalisation selon les tailles et les mises en page variables de vos documents.
L'invite sert à identifier les champs à extraire, fournie sous forme de paires clé-valeur, où la clé représente le nom du champ et la valeur une description de celui-ci, permettant à l'extracteur d'identifier la valeur correspondante. Les mêmes détails de champ ne peuvent pas être utilisés pour différents champs dans le même type de document.
Figure 1. L’invite de l’extracteur génératif

Les descriptions de champs saisies dans l’assistant Invite de l’extracteur génératif sont intégrées dans l’invite utilisée par le modèle génératif.
Les descriptions de champs saisies dans les zones de saisie de l'assistant Configurer les extracteurs ne sont pas utilisées par le modèle génératif.
- Sélectionnez un type de document et des champs dans la liste des types de documents définis. La sélection du champ s'effectue dans l'assistant Configurer les extracteurs et l'invite est définie dans l'assistant Invite des extracteurs génératifs .
- Vous pouvez éventuellement choisir parmi trois types d'extracteurs génératifs par type de document. Les options de l’extracteur génératif sont les suivantes :
- Extracteur de mise en page simple de document long
- Extracteur de mise en page complexe de document long
- Extracteur de mise en page complexe de document court
- Ajoutez une valeur facultative pour définir les détails du champ. Il peut s'agir d'une brève description du type de document. Le nombre maximum de caractères autorisés est de 1 000.