- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- 990 - Paquet ML - Aperçu
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Passeports - Paquet ML
- Fiches de paie - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Prérequis matériels
- Pipelines
- Document Manager
- Services OCR
- Apprentissage profond
- Tableaux de bord Insights.
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Activités (Activities)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Utiliser le gestionnaire de documents
Cette page décrit comment utiliser Data Manager pour labelliser un nouvel ensemble de données et recycler un modèle ML.
Lancez la session de labellisation de données créée dans Première expérience d'exécution (First Run Experience) et accédez aux paramètres pour configurer l'OCR.
Choisissez l'OCR que vous avez l'intention d'utiliser dans le menu déroulant de la Méthode OCR (OCR method ). Pour UiPathDocumentOCR, collez la clé de licence Document UnderstandingTM (récupérez la clé API Document Understanding à partir de la page Admin > Licence (License)), puis collez l'URL OCR que vous avez générée lors du déploiement de UiPathDocumentOCR.
Configurez la pré-labellisation avec les modèles que vous avez déployés en suivant les instructions détaillées ici. Collez le point de terminaison public du modèle de compétence ML et la clé de licence Document Understanding, puis cliquez sur Enregistrer (Save).
Pour plus de détails, veuillez consulter la documentation ici : Utiliser un schéma prédéfini.
- Cliquez sur le bouton Importer (Import) depuis une session Data Manager.
- Donnez un nom à l’ensemble de données et cliquez sur Parcourir les fichiers à télécharger (Browse files to upload).
- Sélectionnez le document que vous souhaitez télécharger.
- Cliquez sur OUI (YES).
Cliquez sur pour créer des champs à extraire.
Vous pouvez créer jusqu'à 40 champs.
Pour cet exercice de validation, vous pouvez créer des champs de facture courants tels que date, nom, numero-de-facture et total. Veuillez vous assurer de modifier le type de contenu en conséquence : date (date), nom (string), numéro de facture (string) et total (nombre).
Vous pouvez maintenant commencer à labelliser les documents.
Cliquez sur le bouton Prédire (Predict) en haut pour utiliser le modèle de facture de base pour prédire les libellés des champs définis et les corriger si la prédiction est erronée.
d
pour labelliser la date dans l'exemple ci-dessous).
Utilisez la flèche du haut pour passer au document suivant jusqu'à ce que vous ayez terminé la validation des libellés pour toutes les factures téléchargées.
- Assurez-vous de sélectionner l'ensemble de données correct dans le filtrage des ensembles de données et cliquez sur le bouton Exporter (Export) .
- Sélectionnez Exporter(Export) .
- Accédez à Ensembles de données (Datasets) sous le même projet AI Center : vous devriez pouvoir voir l'ensemble de données d'entraînement exporté.
Former un modèle personnalisé sur AI Center
- Accédez à Pipelines > Créer un nouveau fichier (Create new). Veuillez sélectionner le type d'exécution d'évaluation, sélectionner le package de modèle et l'ensemble de données d'entrée.
- Sélectionnez le sous-dossier sous Exporter (Export) comme ensemble de données d’entrée.
- Sélectionnez Créer (Create) pour démarrer le pipeline. L’exécution du pipeline sur les machines à processeur peut prendre 1 à 2 heures.
Accédez à Compétences ML (ML Skills) et créez une nouvelle compétence ML.
Choisissez le même package de modèle de facture créé auparavant. Comme nous avons reformé le modèle, il existe maintenant une nouvelle version mineure du package (1 vs 0). Assurez-vous de sélectionner le dernier.
Une fois la compétence ML créée, accédez à Modifier le déploiement actuel (Modify current deployment) pour rendre la compétence ML publique. Activez la bascule et cliquez sur Confirmer (Confirm).
Copiez l'URL de la compétence ML publique pour une utilisation ultérieure.
Félicitations ! Vous avez maintenant recyclé un modèle Facture (Invoice) avec votre propre ensemble de données et créé le point de terminaison pour accéder au modèle.