Activités (Activities)
Plus récente (Latest)
False
Image de fond de la bannière
Activités Document Understanding
Dernière mise à jour 10 avril. 2024

Machine Learning Extractor Trainer

UiPath.DocumentUnderstanding.ML.Activities.MachineLearningExtractorTrainer

Active la collecte de données qui ont été traitées via Validation Station afin qu'elles puissent être importées dans Document Manager. Cette activité ne peut être utilisée que dans l'activité Tester l'étendue des extracteurs (Train Extractors Scope).

Propriétés

Commun
  • NomAffichage (DisplayName) - Nom affiché de l'activité.
Stockage local
  • Dossier de sortie (Output Folder ) - Répertoire dans lequel les données collectées sont stockées. Une fois les données stockées, elles peuvent être importées dans des outils d’apprentissage automatique.
Divers
  • Privé (Private) - Si cette option est sélectionnée, les valeurs des variables et des arguments ne sont plus enregistrées au niveau Détaillé (Verbose).
Fournissez un Point de terminaison de l'Ensemble de données public
  • Clé API de l'ensemble de données : la clé d'authentification de l'ensemble de données.
  • Point de terminaison du jeu de données (Dataset Endpoint) : le point de terminaison du jeu de données où les données d’entraînement peuvent être téléchargées. Une fois qu'un ensemble de données est public, il est accessible en dehors de l'environnement UiPath via un point de terminaison et à l'aide d'une clé API. Faites-le si vous souhaitez télécharger des ensembles de données vers une instance AI Center à laquelle vous n'êtes pas connecté (par exemple dans le cas des déploiements hybrides où AI Center se trouve sur Cloud et le robot est connecté à un locataire local).
Sélectionnez Ensemble de données privé dans Projet
  • Ensemble de données : l'ensemble de données dans lequel les données d'entraînement peuvent être téléchargées. Si le robot est connecté à un locataire sur lequel AI Center est activé, vous pouvez voir tous les ensembles de données d'AI Center dans le menu déroulant et sélectionner le dossier dans lequel télécharger les documents validés à l'aide du menu déroulant.
  • Projet (Project) : le projet dans lequel les données d'entraînement peuvent être téléchargées.

    Remarque : la sélection de projets et de jeux de données n'est activée que lorsque vous êtes connecté à Orchestrator. Vous trouverez plus d'informations sur les ensembles de données publics/privés ici.
Server
  • RetryOnFailure (RetryOnFailure) : Nouvelle tentative en cas d’échec temporaire. Ce champ prend uniquement en charge les valeurs booléennes (Vrai (True), Faux (False)). La valeur par défaut est Vrai.
  • Délai d'attente (en millisecondes) : Spécifie la durée (en millisecondes) d'attente d'une réponse du serveur avant qu'une erreur soit générée. La valeur par défaut est de 100 000 millisecondes (100 secondes).

Utilisation de l'assistant d'entraînement de l'extracteur d'apprentissage automatique (Machine Learning Extractor Training Wizard)

Le Machine Learning Extractor Trainer recueille les commentaires humains pour vous, dans un répertoire de votre choix. Une fois que vous avez collecté des données et que vous souhaitez réentraîner un modèle ML, vous pouvez simplement compresser le contenu du répertoire et le télécharger dans Document Manager pour la curation.

Comment utiliser

Vous trouverez ci-dessous les étapes à suivre pour utiliser l'activité Machine Learning Extractor Trainer.

  1. Utilisez l'assistant Taxonomy Manager pour définir vos types de documents et vos champs.
  2. Faites glisser un Machine Learning Extractor Trainer dans une activité Entraîner l'étendue des extracteurs (Train Extractors Scope).
  3. Dans l'assistant Machine Learning Extractor qui s'ouvre automatiquement, ajoutez les informations sur le point de terminaison (Endpoint). Vous pouvez choisir l'un des points de terminaison publics disponibles ici.
  4. Cochez la case des Mettre à jour les arguments d'activité (Update activity arguments) si vous souhaitez également utiliser les valeurs saisies comme arguments d'entrée pour l'activité, plus précisément pour le point de terminaison (Endpoint).
  5. Cliquez sur le bouton Obtenir des capacités (Get Capabilities). L'assistant se ferme après cette opération.
  6. Entrez une valeur pour Dossier de sortie (Output Folder).
  7. Sélectionnez l'option Configurer les extracteurs (Configure Extractors) du champ Entraîner l'étendue des extracteurs (Train Extractors Scope). Un assistant s'affiche.



  8. L'entraîneur d'extracteur d'apprentissage automatique (Machine Learning Extractor Trainer) est maintenant prêt à être configuré. Développez le type de document auquel vous souhaitez l'appliquer et commencez à sélectionner les champs sur lesquels vous souhaitez effectuer l'entraînement en cochant les cases à côté des champs appropriés.
  9. Remplissez les zones de texte soit manuellement, soit en sélectionnant, dans la liste déroulante disponible, les données correctes que vous souhaitez associer à chaque champ. La liste déroulante contient tous les champs que l'entraîneur d'extracteur d'apprentissage automatique (Machine Learning Extractor Trainer) déclare comme capacité d'extraction à l'aide du point de terminaison entré dans l'assistant de l'extracteur d'apprentissage automatique.

    Remarque : si vous cochez la case mais que vous laissez la zone de texte vide, cette dernière sera automatiquement remplie avec l'ID de type de document (Document Type ID) de la taxonomie locale. Les modifications s'appliquent après l'enregistrement. Si vous souhaitez éviter d'utiliser une longue chaîne pour l'ID de champ, nous vous recommandons de saisir manuellement une valeur au cas où vous n'auriez pas accès à la taxonomie interne de l'extracteur.
  10. Pour vérifier si vous utilisez les dernières fonctionnalités de l'extracteur, vous pouvez cliquer sur Obtenir ou actualiser les capacités de l'extracteur (Get or refresh extractor capabilities) qui ouvre l'assistant Machine Learning Extractor.
  11. La sélection de l'une des options dans une liste déroulante confirme automatiquement ce champ.



  12. Pour entraîner un extracteur en fonction de son résultat d'extraction, vous pouvez définir la valeur alphanumérique exacte dans le champ Alias d'infrastructure (Framework Alias) précédemment utilisé pour un extracteur.
  13. Sélectionnez le bouton Enregistrer (Save) une fois que tous les champs sont correctement configurés.

    Attention : vous ne pouvez pas choisir la même option pour deux champs distincts.
Intégration de Document Understanding

L’activité Extracteur de formulaires (Form Extractor) fait partie des Solutions Document Understanding. Consultez le document Document Understanding Guide pour plus d'informations.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Logo Uipath blanc
Confiance et sécurité
© 2005-2024 UiPath. All rights reserved.