UiPath Documentation
activities
latest
false

Activités Document Understanding

Dernière mise à jour 5 mai 2026

Machine Learning Extractor Trainer

UiPath.DocumentUnderstanding.ML.Activities.MachineLearningExtractorTrainer

Description

Active la collecte de données qui ont été traitées via Validation Station afin qu'elles puissent être importées dans Document Manager. Cette activité ne peut être utilisée que dans l'activité Tester l'étendue des extracteurs .

Compatibilité du projet

Windows - Héritage | Windows

Configuration

Module Designer

Stockage local

  • Output Folder - The directory where the collected data is stored. Once the data is stored, it can be imported into machine learning training tools.

Sélectionnez Ensemble de données privé dans Projet

  • Ensemble de données : l’ensemble de données dans lequel les données d’entraînement peuvent être téléchargées. Si le robot est connecté à un locataire sur lequel AI Center est activé, vous pouvez voir tous les jeux de données d'AI Center dans le menu déroulant et sélectionner le dossier où télécharger les documents validés à l'aide du menu déroulant.
  • Project - The project where the training data can be uploaded.
    Remarque :

    La sélection de projets et d’ensembles de données est activée uniquement en cas de connexion à Orchestrator. Consultez la page Gestion des ensembles de données pour plus d’informations sur les ensembles de données publics/privés.

Fournissez un Point de terminaison de l'Ensemble de données public

  • Dataset ApiKey - The authentication key of the dataset.
  • Point de terminaison du jeu de données : le point de terminaison du jeu de données où les données d’entraînement peuvent être téléchargées. Une fois qu’un ensemble de données est public, il est accessible en dehors de l’environnement UiPath® via un point de terminaison et à l’aide d’une clé API. Faites-le si vous souhaitez télécharger des ensembles de données vers une instance AI Center à laquelle vous n'êtes pas connecté (par exemple dans le cas des déploiements hybrides où AI Center est sur le Cloud et où le robot est connecté à un locataire sur site).
Panneau propriétés

Commun

  • NomAffichage (DisplayName) - Nom affiché de l'activité.

Stockage local

  • Output Folder - The directory where the collected data is stored. Once the data is stored, it can be imported into machine learning training tools.

Divers

  • Privé (Private) - Si cette option est sélectionnée, les valeurs des variables et des arguments ne sont plus enregistrées au niveau Détaillé (Verbose).

Fournissez un Point de terminaison de l'Ensemble de données public

  • Dataset ApiKey - The authentication key of the dataset.
  • Point de terminaison du jeu de données : le point de terminaison du jeu de données où les données d’entraînement peuvent être téléchargées. Une fois qu’un ensemble de données est public, il est accessible en dehors de l’environnement UiPath® via un point de terminaison et à l’aide d’une clé API. Faites-le si vous souhaitez télécharger des ensembles de données vers une instance AI Center à laquelle vous n'êtes pas connecté (par exemple dans le cas des déploiements hybrides où AI Center est sur le Cloud et où le robot est connecté à un locataire sur site).

Sélectionnez Ensemble de données privé dans Projet

  • Ensemble de données : l’ensemble de données dans lequel les données d’entraînement peuvent être téléchargées. Si le robot est connecté à un locataire sur lequel AI Center est activé, vous pouvez voir tous les jeux de données d'AI Center dans le menu déroulant et sélectionner le dossier où télécharger les documents validés à l'aide du menu déroulant.
  • Project - The project where the training data can be uploaded.
    Remarque :

    La sélection de projets et d’ensembles de données est activée uniquement en cas de connexion à Orchestrator. Consultez la page Gestion des ensembles de données pour plus d’informations sur les ensembles de données publics/privés.

Server

  • RetryOnFailure - Retry on transient failure. This field only supports Boolean values (True, False). The default value is True.
  • Timeout (milliseconds) - Specifies the amount of time (in milliseconds) to wait for a response from the server before an error is thrown. The default value is 100000 milliseconds (100 seconds).

Utilisation de l'assistant d'entraînement de l'extracteur d'apprentissage automatique (Machine Learning Extractor Training Wizard)

Le Machine Learning Extractor Trainer recueille les commentaires humains pour vous, dans un répertoire de votre choix. Une fois que vous avez collecté des données et que vous souhaitez réentraîner un modèle ML, vous pouvez simplement compresser le contenu du répertoire et le télécharger dans Document Manager pour collecter et filtrer les données.

Comment utiliser

Pour utiliser l’activité Entraîneur d’extracteur d’apprentissage automatique (Machine Learning Extractor Trainer), procédez aux étapes suivantes :

  1. Utilisez l'assistant Taxonomy Manager pour définir vos types de documents et vos champs.

  2. Ajoutez un Machine Learning Extractor Trainer dans une activité Tester l'étendue des extracteurs (Train Extractors Scope).

  3. Dans l’assistant Extracteur d’apprentissage automatique (Machine Learning Extractor) qui s’ouvre automatiquement, saisissez les informations pour le champ Point de terminaison (Endpoint). Vous pouvez choisir l’un des points de terminaison publics. Consultez Points de terminaison publics pour plus d’informations sur les points de terminaison publics.

  4. Cochez la case des Mettre à jour les arguments d'activité (Update activity arguments) si vous souhaitez également utiliser les valeurs saisies comme arguments d'entrée pour l'activité, plus précisément pour le point de terminaison (Endpoint).

  5. Sélectionnez Obtenir des capacités. L’assistant se ferme après cette opération

  6. Entrez une valeur pour Dossier de sortie (Output Folder).

  7. Select the Configure Extractors option in the Train Extractors Scope. A wizard is displayed.

    Graphique 1. Assistant de configuration des extracteurs

    Assistant de configuration des extracteurs

  8. L'entraîneur d'extracteur d'apprentissage automatique (Machine Learning Extractor Trainer) est maintenant prêt à être configuré. Développez le type de document auquel vous souhaitez l’appliquer et commencez à sélectionner les champs sur lesquels vous souhaitez effectuer l’entraînement en sélectionnant les cases à côté des champs appropriés.

  9. Remplissez les zones de texte soit manuellement, soit en sélectionnant, dans la liste déroulante disponible, les données correctes que vous souhaitez associer à chaque champ. La liste déroulante contient tous les champs que l’entraîneur d’extracteur d’apprentissage automatique déclare comme capacité d’extraction à l’aide du point de terminaison entré dans l’assistant de l’extracteur d’apprentissage automatique.

    Remarque :

    Si vous sélectionnez la case mais que vous laissez la zone de texte vide, cette dernière sera automatiquement remplie avec l’ID de type de document de la taxonomie locale. Les modifications s'appliquent après l'enregistrement. Si vous souhaitez éviter d'utiliser une longue chaîne pour l'ID de champ, nous vous recommandons de saisir manuellement une valeur au cas où vous n'auriez pas accès à la taxonomie interne de l'extracteur.

  10. Pour vérifier si vous utilisez les dernières fonctionnalités de l’extracteur, vous pouvez sélectionnez Obtenir ou actualiser les capacités de l’extracteur (Get or refresh extractor capabilities), qui va ouvrir l’assistant de l’entraîneur d’extracteur d’apprentissage automatique.

  11. La sélection de l'une des options dans une liste déroulante confirme automatiquement ce champ.

  12. Pour entraîner un extracteur en fonction de son résultat d'extraction, vous pouvez définir la valeur alphanumérique exacte dans le champ Alias d'infrastructure (Framework Alias) précédemment utilisé pour un extracteur.

  13. Sélectionnez Enregistrer (Save) une fois que tous les champs sont correctement configurés.

    Important :

    Vous ne pouvez pas choisir la même option pour deux champs distincts.

Intégration de Document Understanding

L’activité Extracteur de formulaires fait partie des Solutions Document Understanding. Consultez le document Document Understanding Guide pour plus d'informations.

Cette page vous a-t-elle été utile ?

Connecter

Besoin d'aide ? Assistance

Vous souhaitez apprendre ? UiPath Academy

Vous avez des questions ? UiPath Forum

Rester à jour