- Démarrage
- Composants de l'infrastructure
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Keyword Based Classifier
- Intelligent Keyword Classifier
- FlexiCapture Classifier
- Machine Learning Classifier
- Activités liées à la classification des documents
- Vue d’ensemble de l'entraînement de la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Machine Learning Classifier Trainer
- Activités liées à l'entraînement de la classification des documents
- Vue d’ensemble de l’extraction des données
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- FlexiCapture Extractor
- Activités liées à l'extraction de données
- Paquets ML
- Pipelines
- Data Manager
- Services OCR
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Apprentissage profond
- Licences
- Référence (Reference)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guide de l'utilisateur de Document Understanding
Utiliser Data Manager
Cette page décrit comment utiliser Data Manager pour labelliser un nouvel ensemble de données et recycler un modèle ML.
Lancez la session de labellisation de données créée dans Première expérience d'exécution (First Run Experience) et accédez aux paramètres pour configurer l'OCR.
Choisissez l'OCR que vous avez l'intention d'utiliser dans le menu déroulant de la Méthode OCR (OCR method). Pour UiPathDocumentOCR, collez la clé de licence Document Understanding (récupérez la clé API Document Understanding à partir de la page Admin > Licence (License)), puis collez l'URL OCR que vous avez générée lors du déploiement de UiPathDocumentOCR.
Configurez la pré-labellisation avec les modèles que vous avez déployés en suivant les instructions détaillées ici. Collez le point de terminaison public du modèle de compétence ML et la clé de licence Document Understanding, puis cliquez sur Enregistrer (Save).
Pour plus de détails, veuillez consulter la documentation ici : .
Cliquez sur le bouton Importer (Import) depuis la session Data Manager.
Donnez un nom au jeu de données et cliquez sur Parcourir les fichiers à télécharger (Browse files to upload).
Sélectionnez le document que vous souhaitez télécharger.
Cliquez sur OUI (YES).
Pour plus de détails, veuillez consulter la documentation ici : Importer des documents.
Cliquez sur pour créer des champs à extraire.
Vous pouvez créer jusqu'à 40 champs.
Pour cet exercice de validation, vous pouvez créer des champs de facture courants tels que date, nom, numero-de-facture et total. Veuillez vous assurer de modifier le type de contenu en conséquence : date (date), nom (string), numéro de facture (string) et total (nombre).
Pour plus de détails, veuillez consulter la documentation ici : Créer et configurer des champs.
Vous pouvez maintenant commencer à labelliser les documents.
Cliquez sur le bouton Prédire (Predict) en haut pour utiliser le modèle de facture de base pour prédire les libellés des champs définis et les corriger si la prédiction est erronée.
d
pour labelliser la date dans l'exemple ci-dessous).
Utilisez la flèche du haut pour passer au document suivant jusqu'à ce que vous ayez terminé la validation des libellés pour toutes les factures téléchargées.
Pour plus de détails sur la labellisation des documents, veuillez consulter la documentation ici : Labelliser les documents.
Assurez-vous de sélectionner l'ensemble de données correct dans le filtrage des ensembles de données et cliquez sur le bouton Exporter (Export) .
Cliquez sur Exporter (Export).
Accédez à Ensembles de données (Datasets) sous le même projet AI Center : vous devriez pouvoir voir l'ensemble de données d'entraînement exporté.
Pour plus de détails, veuillez consulter la documentation : Exporter des documents.
Former un modèle personnalisé sur AI Center
Accédez à Pipelines > Créer un nouveau fichier (Create new). Veuillez sélectionner le type d'exécution d'évaluation, sélectionner le package de modèle et l'ensemble de données d'entrée.
Veuillez sélectionner le sous-dossier sous Exporter (Export) comme ensemble de données d'entrée.
Cliquez sur Créer (Create) pour démarrer le pipeline. L'exécution du pipeline sur les machines à processeur peut prendre 1 à 2 heures.
Accédez à Compétences ML (ML Skills) et créez une nouvelle compétence ML.
Choisissez le même package de modèle de facture créé auparavant. Comme nous avons reformé le modèle, il existe maintenant une nouvelle version mineure du package (1 vs 0). Assurez-vous de sélectionner le dernier.
Une fois la compétence ML créée, accédez à Modifier le déploiement actuel (Modify current deployment) pour rendre la compétence ML publique. Activez la bascule et cliquez sur Confirmer (Confirm).
Copiez l'URL de la compétence ML publique pour une utilisation ultérieure.
Félicitations ! Vous avez maintenant recyclé un modèle Facture (Invoice) avec votre propre ensemble de données et créé le point de terminaison pour accéder au modèle.