document-understanding
2020.10
false
- Démarrage
- Composants de l'infrastructure
- Vue d’ensemble de l’extraction des données
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- FlexiCapture Extractor
- Activités liées à l'extraction de données
- Document Understanding dans AI Center
- Pipelines
- Paquets ML
- Data Manager
- Services OCR
- Licences
- Référence (Reference)
Machine Learning Extractor Trainer
Obsolète
Guide de l'utilisateur de Document Understanding
Last updated 29 juil. 2024
Machine Learning Extractor Trainer
Le Machine Learning Extractor Trainer recueille les commentaires humains pour vous, dans un répertoire de votre choix. Une fois que vous avez collecté des données et que vous souhaitez réentraîner un modèle ML, vous pouvez simplement compresser le contenu du répertoire et le télécharger dans Data Manager pour la curation.
La même règle que pour l'Extracteur d'apprentissage automatique (Machine Learning Extractor) s'applique au Machine Learning Extractor Trainer. Voir ici.
Vous trouverez ci-dessous les étapes à suivre pour utiliser l'activité Machine Learning Extractor Trainer.
- Utilisez l'assistant Taxonomy Manager pour définir vos types de documents et vos champs.
- Faites glisser un Machine Learning Extractor Trainer dans une activité Entraîner l'étendue des extracteurs (Train Extractors Scope).
- Dans l'assistant Machine Learning Extractor qui s'ouvre automatiquement, ajoutez les informations sur le point de terminaison (Endpoint).
- Cochez la case des Mettre à jour les arguments d'activité (Update activity arguments) si vous souhaitez également utiliser les valeurs saisies comme arguments d'entrée pour l'activité, plus précisément pour le point de terminaison (Endpoint).
- Cliquez sur le bouton Obtenir des capacités (Get Capabilities). L'assistant se ferme après cette opération.
- Entrez une valeur pour Dossier de sortie (Output Folder).
- Sélectionnez l'option Configurer les extracteurs (Configure Extractors) du champ Entraîner l'étendue des extracteurs (Train Extractors Scope). Un assistant s'affiche.
- L'entraîneur d'extracteur d'apprentissage automatique (Machine Learning Extractor Trainer) est maintenant prêt à être configuré. Développez le type de document auquel vous souhaitez l'appliquer et commencez à sélectionner les champs sur lesquels vous souhaitez effectuer l'entraînement en cochant les cases à côté des champs appropriés.
- Remplissez les zones de texte soit manuellement, soit en sélectionnant, dans la liste déroulante disponible, les données correctes que vous souhaitez associer à chaque champ. La liste déroulante contient tous les champs que l'entraîneur d'extracteur d'apprentissage automatique (Machine Learning Extractor Trainer) déclare comme capacité d'extraction à l'aide du point de terminaison entré dans l'assistant de l'extracteur d'apprentissage automatique.
Remarque : Si vous cochez la case mais que vous laissez la zone de texte vide, cette dernière sera automatiquement remplie avec l'ID de type de document (Document Type ID) de la taxonomie locale. Les modifications s'appliquent après l'enregistrement. Si vous souhaitez éviter d'utiliser une longue chaîne pour l'ID de champ, nous vous recommandons de saisir manuellement une valeur au cas où vous n'auriez pas accès à la taxonomie interne de l'extracteur.
- Pour vérifier si vous utilisez les dernières fonctionnalités de l'extracteur, vous pouvez cliquer sur Obtenir ou actualiser les capacités de l'extracteur (Get or refresh extractor capabilities) qui ouvre l'assistant Machine Learning Extractor.
- La sélection de l'une des options dans une liste déroulante confirme automatiquement ce champ.
- Pour entraîner un extracteur en fonction de son résultat d'extraction, vous pouvez définir la valeur alphanumérique exacte dans le champ Alias d'infrastructure (Framework Alias) précédemment utilisé pour un extracteur.
- Sélectionnez le bouton Enregistrer (Save) une fois que tous les champs sont correctement configurés.
Attention : vous ne pouvez pas choisir la même option pour deux champs distincts.