- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d’ensemble de l'entraînement de la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Machine Learning Classifier Trainer
- Activités liées à l'entraînement de la classification des documents
- Paquets ML
- Pipelines
- Data Manager
- Services OCR
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Licences
- Référence (Reference)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guide de l'utilisateur de Document Understanding
Extracteur d'apprentissage automatique
L'extracteur d'apprentissage machine est un outil d'extraction de données utilisant des modèles d'apprentissage automatique afin d'identifier et de signaler les données ciblées aux fins de l'extraction de données.
Cette activité fonctionne de pair avec les modèles Document Understanding UiPath afin de les utiliser dans vos workflows.
L'approche ML est fortement recommandée pour les documents structurés ou semi-structurés dans lesquels les mises en page des différents fournisseurs de documents varient considérablement. Compte tenu de son approche d'apprentissage automatique, l'extracteur utilise un modèle d'apprentissage automatique entraîné, qui apprend et peut ensuite déduire des valeurs pour les champs ciblés, même à partir de documents et de mises en page qu'il n'avait jamais vus auparavant. En d'autres termes, si les documents ne suivent pas un modèle de texte ou de mise en page, l'extracteur d'apprentissage automatique peut répondre aux besoins de votre cas d'utilisation.
Le modèle d'apprentissage automatique peut être utilisé de plusieurs manières :
- avec l'un des points de terminaison publics d'UiPath Document Understanding, si vous souhaitez utiliser des modèles génériques ciblant certains types de documents ; ou alors
- avec des modèles d'apprentissage automatique formés sur mesure à partir des modèles UiPath Document Understanding disponibles.
Cet extracteur peut être entraîné/réentraîné. Consultez la section Comment entraîner (How to Train) pour en savoir plus.
Vous devez utiliser
- l'un des points de terminaison publics de Document Understanding d'UiPath aux fins de l'extraction de données, ou
- des modèles d'apprentissage automatique hébergés dans AI Center dans Automation Cloud, ou
- des modèles d'apprentissage automatique hébergés dans AI Center sur site, mais sous licence via Automation Cloud – vous devez utiliser votre clé API Automation Cloud Document Understanding.
Pour utiliser l'extracteur d'apprentissage automatique avec une licence sur site, vous devez héberger vos modèles Document Understanding dans votre instance sur site AI Center (installation à vide).
Si le point de terminaison que vous utilisez est sous licence via Automation Cloud, vous devez fournir votre clé d'API Cloud Document Understanding.
Si vous utilisez l'extracteur d'apprentissage automatique avec un point de terminaison public UiPath Document Understanding ou avec une compétence ML publique dans AI Center, vous devez configurer l'argument Point de terminaison (Endpoint) de l'activité avec l'URL correspondante.
Si vous utilisez l'extracteur d'apprentissage automatique avec une compétence ML déployée, vous devez configurer l'argument ML Skill de l'activité avec la sélection appropriée dans votre liste de compétences ML hébergée sur AI Center.
Si vous essayez de définir les deux options, une erreur s'affiche soit dans l'assistant de configuration, soit directement dans le workflow :
Pour en savoir plus sur le Machine Learning Extractor Trainer, veuillez consulter cette page.