- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Keyword Based Classifier
- Intelligent Keyword Classifier
- FlexiCapture Classifier
- Machine Learning Classifier
- Activités liées à la classification des documents
- Vue d’ensemble de l'entraînement de la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Machine Learning Classifier Trainer
- Activités liées à l'entraînement de la classification des documents
- Vue d’ensemble de l’extraction des données
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- FlexiCapture Extractor
- Activités liées à l'extraction de données
- Consommation de données
- Paquets ML
- Pipelines
- Document Manager
- Services OCR
- Document Understanding déployé dans Automation Suite
- Installer et utiliser
- Première expérience d'exécution
- Déployer UiPathDocumentOCR
- Déployer un paquet ML prêt à l'emploi
- Offres groupées hors ligne 2022.10.0
- Offres groupées hors ligne 2022.10.2
- Bundles 2022.10.4 hors ligne
- Bundles hors ligne 2022.10.6
- Bundles 2022.10.9 hors ligne
- Bundles 2022.10.10 hors ligne
- Bundles 2022.10.11 hors ligne
- Bundles 2022.10.12 hors ligne
- Bundles 2022.10.13 hors ligne
- Bundles 2022.10.14 hors ligne
- Utiliser le gestionnaire de documents
- Utiliser l'infrastructure
- Document Understanding déployé dans une version AI Center autonome
- Apprentissage profond
- Licences
- Référence (Reference)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Utiliser le gestionnaire de documents
Cette page décrit comment utiliser Data Manager pour labelliser un nouvel ensemble de données et recycler un modèle ML.
Lancez la session de labellisation de données créée dans Première expérience d'exécution (First Run Experience) et accédez aux paramètres pour configurer l'OCR.
Choisissez l’OCR que vous avez l’intention d’utiliser dans le menu déroulant de la Méthode OCR (OCR method). Pour UiPathDocumentOCR, collez la clé de licence Document UnderstandingTM (récupérez la clé API Document Understanding à partir de la page Admin > Licence (License)), puis collez l’URL OCR que vous avez générée lors du déploiement de UiPathDocumentOCR.
Configurez la pré-labellisation avec les modèles que vous avez déployés en suivant les instructions détaillées ici. Collez le point de terminaison public du modèle de compétence ML et la clé de licence Document Understanding, puis cliquez sur Enregistrer (Save).
Pour plus de détails, veuillez consulter la documentation ici : Utiliser un schéma prédéfini.
- Cliquez sur le bouton Importer (Import) depuis une session Data Manager.
- Donnez un nom à l’ensemble de données et cliquez sur Parcourir les fichiers à télécharger (Browse files to upload).
- Sélectionnez le document que vous souhaitez télécharger.
- Cliquez sur OUI (YES).
Cliquez sur pour créer des champs à extraire.
Vous pouvez créer jusqu'à 40 champs.
Pour cet exercice de validation, vous pouvez créer des champs de facture courants tels que date, nom, numero-de-facture et total. Veuillez vous assurer de modifier le type de contenu en conséquence : date (date), nom (string), numéro de facture (string) et total (nombre).
Vous pouvez maintenant commencer à labelliser les documents.
Cliquez sur le bouton Prédire (Predict) en haut pour utiliser le modèle de facture de base pour prédire les libellés des champs définis et les corriger si la prédiction est erronée.
d
pour labelliser la date dans l'exemple ci-dessous).
Utilisez la flèche du haut pour passer au document suivant jusqu'à ce que vous ayez terminé la validation des libellés pour toutes les factures téléchargées.
- Assurez-vous de sélectionner l'ensemble de données correct dans le filtrage des ensembles de données et cliquez sur le bouton Exporter (Export) .
- Sélectionnez Exporter(Export) .
- Accédez à Ensembles de données (Datasets) sous le même projet AI Center : vous devriez pouvoir voir l'ensemble de données d'entraînement exporté.
Former un modèle personnalisé sur AI Center
- Accédez à Pipelines > Créer un nouveau fichier (Create new). Veuillez sélectionner le type d'exécution d'évaluation, sélectionner le package de modèle et l'ensemble de données d'entrée.
- Sélectionnez le sous-dossier sous Exporter (Export) comme ensemble de données d’entrée.
- Sélectionnez Créer (Create) pour démarrer le pipeline. L’exécution du pipeline sur les machines à processeur peut prendre 1 à 2 heures.
Accédez à Compétences ML (ML Skills) et créez une nouvelle compétence ML.
Choisissez le même package de modèle de facture créé auparavant. Comme nous avons reformé le modèle, il existe maintenant une nouvelle version mineure du package (1 vs 0). Assurez-vous de sélectionner le dernier.
Une fois la compétence ML créée, accédez à Modifier le déploiement actuel (Modify current deployment) pour rendre la compétence ML publique. Activez la bascule et cliquez sur Confirmer (Confirm).
Copiez l'URL de la compétence ML publique pour une utilisation ultérieure.
Félicitations ! Vous avez maintenant recyclé un modèle Facture (Invoice) avec votre propre ensemble de données et créé le point de terminaison pour accéder au modèle.