- Vue d'ensemble (Overview)
- Document Processing Contracts
- Notes de publication
- À propos des contrats de traitement de documents
- Classe Zone
- Interface ActivitéIPersisted
- Classe PrettyBoxConverter
- Interface ActivitéIClassifier
- Interface FournisseurIClassifieurCapacités
- Classe TypeDocumentClassifieur
- Classe RésultatClassifieur
- Classe ActivitéCodeClassifieur
- Classe ActivitéClassifieurNatif
- Classe ActivitéClassifieurCodeAsync
- Classe CapacitéClassifieurTypeDocument
- Classe ActivitéExtracteurCodeAsync
- Classe ActivitéExtracteurCode
- Classe ExtracteurTypeDocument
- Classe ExtracteurDocumentTypeCapacités
- Classe ExtracteurChampCapacités
- Classe ActivitéExtracteurNatif
- Classe ExtracteurRésultat
- Interface FournisseurICapabilities
- Interface ActivitéIExtractor
- Classe ChargeUtileExtracteur
- Énumération PrioritéActionDocument
- Classe DocumentActionData
- Énumération StatutActionDocument
- Énumération TypeActionDocument
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe DonnéesUtilisateur
- Classe Documents
- Classe RésultatDivisionDocument
- Classe ExtensionDom
- Classe Page
- Classe SectionPage
- Classe Polygone
- Classe ConvertisseurPolygones
- Classe de métadonnées
- Classe GroupeMot
- Classe Mot
- Énumération SourceTraitement
- Classe CelluleRésultatsTable
- Classe ValeurTableRésultats
- Classe InformationsColonnesTableRésultats
- Classe TableRésultats
- Énumération Rotation
- Énumération TypeSection
- Énumération TypeGroupeMot
- ProjectionTexteIDocument Interface
- Classe RésultatClassification
- Classe RésultatExtraction
- Classe ResultatsDocument
- Classe ResultatsLimitesDocument
- Classe ResultatsDonnéesPoint
- Classe RésultatsValeur
- Classe ResultatsContenuRéference
- Classe ResultatsValeurJetons
- Classe ResultatsChampDérivé
- Énumération ResultatsSourceDonnées
- Classe ResultatsConstantes
- Classe ChampValeurSimple
- Classe ValeurChampTable
- Classe GroupeDocument
- Classe DocumentTaxonomie
- Classe TypeDocument
- Classe Champ
- Énumération TypeChamp
- Classe InfoLangage
- Classe SaisieMétadonnées
- Énumération TypeTexte
- Classe TypeFieldTypeField Class
- Interface ActivitéISuivi
- ITrainableActivity Interface
- Interface ActivitéClassifieurITrainable
- Interface ActivitéExtracteurITrainable
- Classe ActivitéFormationClassifieurCodeAsync
- Classe ActivitéFormationClassifieurCode
- Classe ActivitéFormationClassifieurNatif
- Classe ActivitéFormationExtracteurCodeAsync
- Classe ActivitéFormationExtracteurCode
- Classe ActivitéFormationExtracteurNative
- Numériseur de Document Understanding
- Document Understanding ML
- Serveur local OCR Document Understanding
- Document Understanding
- Notes de publication
- À propos du package d’activités Document Understanding
- Compatibilité du projet
- Définir le mot de passe du PDF
- Merge PDFs
- Get PDF Page Count
- Extraire le texte PDF (Extract PDF Text)
- Extract PDF Images
- Extract PDF Page Range
- Extraire les données du document
- Create Validation Task and Wait
- Attendre la tâche de validation et reprendre
- Create Validation Task
- Classer un document (Classify Document)
- Créer une tâche de validation de classification (Create Classification Validation Task)
- Créer une tâche de validation de classification et attendre (Create Classification Validation Task and Wait)
- Attendre la tâche de validation de la classification et reprendre
- IntelligentOCR
- Notes de publication
- À propos du package d'activités IntelligentOCR
- Compatibilité du projet
- Configuration de l'authentification
- Load Taxonomy
- Digitize Document
- Classify Document Scope
- Keyword Based Classifier
- Classifieur de projet Document Understanding (Document Understanding Project Classifier)
- Intelligent Keyword Classifier
- Create Document Classification Action
- Attendre l'action de classification du document et reprendre
- Tester l'étendue des classifieurs
- Outil d'entraînement de classifieur basé sur des mots-clés
- Intelligent Keyword Classifier Trainer
- Data Extraction Scope
- Extracteur de projet Document Understanding (Document Understanding Project Extractor)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Tester l'étendue des extracteurs
- Export Extraction Results
- Services ML
- OCR
- Contrats OCR
- Notes de publication
- À propos des contrats OCR
- Compatibilité du projet
- Interface ActivitéIOCR
- Classe OCRCodeAsync
- Classe ActivitéCodeOCR
- Classe ActivitéOCRNatif
- Classe Caractère
- Classe RésultatOCR
- Classe Mot
- Énumération StylesPolice
- Énumération RotationOCR
- Classe OCRCapabilities
- Classe BaseCaptureOCR
- Classe UsineCaptureOCR
- Classe BaseContrôleCapture
- Énumération UtilisationCaptureMoteur
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Non listé] Abbyy
- Notes de publication
- À propos du package d'activités Abbyy
- Compatibilité du projet
- Reconnaissance optique des caractères ABBYY (ABBYY OCR)
- Reconnaissance optique des caractères ABBYY Cloud (ABBYY Cloud OCR)
- FlexiCapture Classifier
- FlexiCapture Extractor
- FlexiCapture Scope
- Classer un document (Classify Document)
- Traiter le document (Process Document)
- Valider le document (Validate Document)
- Exporter le document (Export Document)
- Obtenir le champ (Get Field)
- Obtenir la table (Get Table)
- Prepare Validation Station Data
- [Non listé] Abbyy intégré
Machine Learning Extractor Trainer
UiPath.DocumentUnderstanding.ML.Activities.MachineLearningExtractorTrainer
Active la collecte de données qui ont été traitées via Validation Station afin qu'elles puissent être importées dans Document Manager. Cette activité ne peut être utilisée que dans l'activité Tester l'étendue des extracteurs (Train Extractors Scope).
Module Designer
Stockage local
- Dossier de sortie (Output Folder ) - Répertoire dans lequel les données collectées sont stockées. Une fois les données stockées, elles peuvent être importées dans des outils d’apprentissage automatique.
Sélectionnez Ensemble de données privé dans Projet
- Ensemble de données : l'ensemble de données dans lequel les données d'entraînement peuvent être téléchargées. Si le robot est connecté à un locataire sur lequel AI Center est activé, vous pouvez voir tous les ensembles de données d'AI Center dans le menu déroulant et sélectionner le dossier dans lequel télécharger les documents validés à l'aide du menu déroulant.
- Projet (Project) : le projet dans lequel les données d'entraînement peuvent être téléchargées.
Remarque : la sélection de projets et d’ensembles de données est activée uniquement en cas de connexion à Orchestrator. Consultez la page Gestion des ensembles de données pour plus d’informations sur les ensembles de données publics/privés.
Fournissez un Point de terminaison de l'Ensemble de données public
- Clé API de l'ensemble de données : la clé d'authentification de l'ensemble de données.
- Point de terminaison du jeu de données ( Dataset Endpoint ) : le point de terminaison du jeu de données où les données d'entraînement peuvent être téléchargées. Une fois qu’un jeu de données est public, il est accessible en dehors de l’environnement UiPath® via un point de terminaison et à l’aide d’une clé API. Faites-le si vous souhaitez télécharger des ensembles de données vers une instance AI Center à laquelle vous n'êtes pas connecté (par exemple dans le cas des déploiements hybrides où AI Center se trouve sur Cloud et le robot est connecté à un locataire local).
Panneau propriétés
Commun
- NomAffichage (DisplayName) - Nom affiché de l'activité.
Stockage local
- Dossier de sortie (Output Folder ) - Répertoire dans lequel les données collectées sont stockées. Une fois les données stockées, elles peuvent être importées dans des outils d’apprentissage automatique.
Divers
- Privé (Private) - Si cette option est sélectionnée, les valeurs des variables et des arguments ne sont plus enregistrées au niveau Détaillé (Verbose).
Fournissez un Point de terminaison de l'Ensemble de données public
- Clé API de l'ensemble de données : la clé d'authentification de l'ensemble de données.
- Point de terminaison du jeu de données ( Dataset Endpoint ) : le point de terminaison du jeu de données où les données d'entraînement peuvent être téléchargées. Une fois qu’un jeu de données est public, il est accessible en dehors de l’environnement UiPath® via un point de terminaison et à l’aide d’une clé API. Faites-le si vous souhaitez télécharger des ensembles de données vers une instance AI Center à laquelle vous n'êtes pas connecté (par exemple dans le cas des déploiements hybrides où AI Center se trouve sur Cloud et le robot est connecté à un locataire local).
Sélectionnez Ensemble de données privé dans Projet
- Ensemble de données : l'ensemble de données dans lequel les données d'entraînement peuvent être téléchargées. Si le robot est connecté à un locataire sur lequel AI Center est activé, vous pouvez voir tous les ensembles de données d'AI Center dans le menu déroulant et sélectionner le dossier dans lequel télécharger les documents validés à l'aide du menu déroulant.
-
Projet (Project) : le projet dans lequel les données d'entraînement peuvent être téléchargées.
Remarque : la sélection de projets et d’ensembles de données est activée uniquement en cas de connexion à Orchestrator. Consultez la page Gestion des ensembles de données pour plus d’informations sur les ensembles de données publics/privés.
Server
- RetryOnFailure (RetryOnFailure) : Nouvelle tentative en cas d’échec temporaire. Ce champ prend uniquement en charge les valeurs booléennes (Vrai (True), Faux (False)). La valeur par défaut est Vrai.
- Délai d'attente (en millisecondes) : Spécifie la durée (en millisecondes) d'attente d'une réponse du serveur avant qu'une erreur soit générée. La valeur par défaut est de 100 000 millisecondes (100 secondes).
Utilisation de l'assistant d'entraînement de l'extracteur d'apprentissage automatique (Machine Learning Extractor Training Wizard)
Le Machine Learning Extractor Trainer recueille les commentaires humains pour vous, dans un répertoire de votre choix. Une fois que vous avez collecté des données et que vous souhaitez réentraîner un modèle ML, vous pouvez simplement compresser le contenu du répertoire et le télécharger dans Document Manager pour collecter et filtrer les données.
Pour utiliser l’activité Entraîneur d’extracteur d’apprentissage automatique (Machine Learning Extractor Trainer), procédez aux étapes suivantes :
- Utilisez l'assistant Taxonomy Manager pour définir vos types de documents et vos champs.
- Ajoutez un Machine Learning Extractor Trainer dans une activité Tester l'étendue des extracteurs (Train Extractors Scope).
- Dans l’assistant Extracteur d’apprentissage automatique (Machine Learning Extractor) qui s’ouvre automatiquement, saisissez les informations pour le champ Point de terminaison (Endpoint). Vous pouvez choisir l’un des points de terminaison publics. Consultez Points de terminaison publics pour plus d’informations sur les points de terminaison publics.
- Cochez la case des Mettre à jour les arguments d'activité (Update activity arguments) si vous souhaitez également utiliser les valeurs saisies comme arguments d'entrée pour l'activité, plus précisément pour le point de terminaison (Endpoint).
- Sélectionnez Obtenir des capacités.
L'assistant se ferme après cette opération
- Entrez une valeur pour Dossier de sortie (Output Folder).
- Sélectionnez l'option Configurer les extracteurs (Configure Extractors) du champ Entraîner l'étendue des extracteurs (Train Extractors Scope).
Un assistant s'affiche.
Image 1. Assistant de configuration des extracteurs
- L’entraîneur d’extracteur d’apprentissage automatique est maintenant prêt à être configuré. Développez le type de document auquel vous souhaitez l’appliquer et commencez à sélectionner les champs sur lesquels vous souhaitez effectuer l’entraînement en sélectionnant les cases à côté des champs appropriés.
- Remplissez les zones de texte soit manuellement, soit en sélectionnant, dans la liste déroulante disponible, les données correctes que vous souhaitez associer à chaque champ. La liste déroulante contient tous les champs que l’entraîneur d’extracteur d’apprentissage automatique déclare comme capacité d’extraction à l’aide du point de terminaison entré dans l’assistant de l’extracteur d’apprentissage automatique.
Remarque : si vous sélectionnez la case mais que vous laissez la zone de texte vide, cette dernière sera automatiquement remplie avec l’ID de type de document de la taxonomie locale. Les modifications s’appliquent après l’enregistrement. Si vous souhaitez éviter d’utiliser une longue chaîne pour l’ID de champ, nous vous recommandons de saisir manuellement une valeur au cas où vous n’auriez pas accès à la taxonomie interne de l’extracteur.
- Pour vérifier si vous utilisez les dernières fonctionnalités de l’extracteur, vous pouvez sélectionnez Obtenir ou actualiser les capacités de l’extracteur (Get or refresh extractor capabilities), qui va ouvrir l’assistant de l’entraîneur d’extracteur d’apprentissage automatique.
- La sélection de l'une des options dans une liste déroulante confirme automatiquement ce champ.
- Pour entraîner un extracteur en fonction de son résultat d'extraction, vous pouvez définir la valeur alphanumérique exacte dans le champ Alias d'infrastructure (Framework Alias) précédemment utilisé pour un extracteur.
- Sélectionnez Enregistrer (Save) une fois que tous les champs sont correctement configurés.
Attention : vous ne pouvez pas choisir la même option pour deux champs distincts.
Intégration de Document Understanding
L’activité Extracteur de formulaires (Form Extractor) fait partie des Solutions Document Understanding. Consultez le document Document Understanding Guide pour plus d'informations.