activities

latest

false

Important :

Veuillez noter que ce contenu a été localisé en partie à l’aide de la traduction automatique. La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Activités Document Understanding

Dernière mise à jour 14 févr. 2025

Machine Learning Extractor Trainer

UiPath.DocumentUnderstanding.ML.Activities.MachineLearningExtractorTrainer

Description

Active la collecte de données qui ont été traitées via Validation Station afin qu'elles puissent être importées dans Document Manager. Cette activité ne peut être utilisée que dans l'activité Tester l'étendue des extracteurs (Train Extractors Scope).

Compatibilité du projet

Windows - Héritage | Windows

Configuration

Module Designer

Stockage local

Dossier de sortie (Output Folder ) - Répertoire dans lequel les données collectées sont stockées. Une fois les données stockées, elles peuvent être importées dans des outils d’apprentissage automatique.

Sélectionnez Ensemble de données privé dans Projet

Ensemble de données : l'ensemble de données dans lequel les données d'entraînement peuvent être téléchargées. Si le robot est connecté à un locataire sur lequel AI Center est activé, vous pouvez voir tous les ensembles de données d'AI Center dans le menu déroulant et sélectionner le dossier dans lequel télécharger les documents validés à l'aide du menu déroulant.
Projet (Project) : le projet dans lequel les données d'entraînement peuvent être téléchargées.
Remarque : la sélection de projets et d’ensembles de données est activée uniquement en cas de connexion à Orchestrator. Consultez la page Gestion des ensembles de données pour plus d’informations sur les ensembles de données publics/privés.

Fournissez un Point de terminaison de l'Ensemble de données public

Clé API de l'ensemble de données : la clé d'authentification de l'ensemble de données.
Point de terminaison du jeu de données ( Dataset Endpoint ) : le point de terminaison du jeu de données où les données d'entraînement peuvent être téléchargées. Une fois qu’un jeu de données est public, il est accessible en dehors de l’environnement UiPath® via un point de terminaison et à l’aide d’une clé API. Faites-le si vous souhaitez télécharger des ensembles de données vers une instance AI Center à laquelle vous n'êtes pas connecté (par exemple dans le cas des déploiements hybrides où AI Center se trouve sur Cloud et le robot est connecté à un locataire local).

Panneau propriétés

Commun

NomAffichage (DisplayName) - Nom affiché de l'activité.

Stockage local

Dossier de sortie (Output Folder ) - Répertoire dans lequel les données collectées sont stockées. Une fois les données stockées, elles peuvent être importées dans des outils d’apprentissage automatique.

Divers

Privé (Private) - Si cette option est sélectionnée, les valeurs des variables et des arguments ne sont plus enregistrées au niveau Détaillé (Verbose).

Fournissez un Point de terminaison de l'Ensemble de données public

Clé API de l'ensemble de données : la clé d'authentification de l'ensemble de données.
Point de terminaison du jeu de données ( Dataset Endpoint ) : le point de terminaison du jeu de données où les données d'entraînement peuvent être téléchargées. Une fois qu’un jeu de données est public, il est accessible en dehors de l’environnement UiPath® via un point de terminaison et à l’aide d’une clé API. Faites-le si vous souhaitez télécharger des ensembles de données vers une instance AI Center à laquelle vous n'êtes pas connecté (par exemple dans le cas des déploiements hybrides où AI Center se trouve sur Cloud et le robot est connecté à un locataire local).

Sélectionnez Ensemble de données privé dans Projet

Ensemble de données : l'ensemble de données dans lequel les données d'entraînement peuvent être téléchargées. Si le robot est connecté à un locataire sur lequel AI Center est activé, vous pouvez voir tous les ensembles de données d'AI Center dans le menu déroulant et sélectionner le dossier dans lequel télécharger les documents validés à l'aide du menu déroulant.
Projet (Project) : le projet dans lequel les données d'entraînement peuvent être téléchargées.

Remarque : la sélection de projets et d’ensembles de données est activée uniquement en cas de connexion à Orchestrator. Consultez la page Gestion des ensembles de données pour plus d’informations sur les ensembles de données publics/privés.

Server

RetryOnFailure (RetryOnFailure) : Nouvelle tentative en cas d’échec temporaire. Ce champ prend uniquement en charge les valeurs booléennes (Vrai (True), Faux (False)). La valeur par défaut est Vrai.
Délai d'attente (en millisecondes) : Spécifie la durée (en millisecondes) d'attente d'une réponse du serveur avant qu'une erreur soit générée. La valeur par défaut est de 100 000 millisecondes (100 secondes).

Utilisation de l'assistant d'entraînement de l'extracteur d'apprentissage automatique (Machine Learning Extractor Training Wizard)

Le Machine Learning Extractor Trainer recueille les commentaires humains pour vous, dans un répertoire de votre choix. Une fois que vous avez collecté des données et que vous souhaitez réentraîner un modèle ML, vous pouvez simplement compresser le contenu du répertoire et le télécharger dans Document Manager pour collecter et filtrer les données.

Comment utiliser

Pour utiliser l’activité Entraîneur d’extracteur d’apprentissage automatique (Machine Learning Extractor Trainer), procédez aux étapes suivantes :

Utilisez l'assistant Taxonomy Manager pour définir vos types de documents et vos champs.
Ajoutez un Machine Learning Extractor Trainer dans une activité Tester l'étendue des extracteurs (Train Extractors Scope).
Dans l’assistant Extracteur d’apprentissage automatique (Machine Learning Extractor) qui s’ouvre automatiquement, saisissez les informations pour le champ Point de terminaison (Endpoint). Vous pouvez choisir l’un des points de terminaison publics. Consultez Points de terminaison publics pour plus d’informations sur les points de terminaison publics.
Cochez la case des Mettre à jour les arguments d'activité (Update activity arguments) si vous souhaitez également utiliser les valeurs saisies comme arguments d'entrée pour l'activité, plus précisément pour le point de terminaison (Endpoint).
Sélectionnez Obtenir des capacités.
L'assistant se ferme après cette opération
Entrez une valeur pour Dossier de sortie (Output Folder).
Sélectionnez l'option Configurer les extracteurs (Configure Extractors) du champ Entraîner l'étendue des extracteurs (Train Extractors Scope).
Un assistant s'affiche.

Image 1. Assistant de configuration des extracteurs
L’entraîneur d’extracteur d’apprentissage automatique est maintenant prêt à être configuré. Développez le type de document auquel vous souhaitez l’appliquer et commencez à sélectionner les champs sur lesquels vous souhaitez effectuer l’entraînement en sélectionnant les cases à côté des champs appropriés.
Remplissez les zones de texte soit manuellement, soit en sélectionnant, dans la liste déroulante disponible, les données correctes que vous souhaitez associer à chaque champ. La liste déroulante contient tous les champs que l’entraîneur d’extracteur d’apprentissage automatique déclare comme capacité d’extraction à l’aide du point de terminaison entré dans l’assistant de l’extracteur d’apprentissage automatique.
Remarque : si vous sélectionnez la case mais que vous laissez la zone de texte vide, cette dernière sera automatiquement remplie avec l’ID de type de document de la taxonomie locale. Les modifications s’appliquent après l’enregistrement. Si vous souhaitez éviter d’utiliser une longue chaîne pour l’ID de champ, nous vous recommandons de saisir manuellement une valeur au cas où vous n’auriez pas accès à la taxonomie interne de l’extracteur.
Pour vérifier si vous utilisez les dernières fonctionnalités de l’extracteur, vous pouvez sélectionnez Obtenir ou actualiser les capacités de l’extracteur (Get or refresh extractor capabilities), qui va ouvrir l’assistant de l’entraîneur d’extracteur d’apprentissage automatique.
La sélection de l'une des options dans une liste déroulante confirme automatiquement ce champ.
Pour entraîner un extracteur en fonction de son résultat d'extraction, vous pouvez définir la valeur alphanumérique exacte dans le champ Alias d'infrastructure (Framework Alias) précédemment utilisé pour un extracteur.
Sélectionnez Enregistrer (Save) une fois que tous les champs sont correctement configurés.
Attention : vous ne pouvez pas choisir la même option pour deux champs distincts.

Intégration de Document Understanding

L’activité Extracteur de formulaires (Form Extractor) fait partie des Solutions Document Understanding. Consultez le document Document Understanding Guide pour plus d'informations.

Sommaire de la page