- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d’ensemble de l'entraînement de la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Machine Learning Classifier Trainer
- Activités liées à l'entraînement de la classification des documents
- Paquets ML
- Pipelines
- Data Manager
- Services OCR
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Licences
- Référence (Reference)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guide de l'utilisateur de Document Understanding
À propos du gestionnaire de données
UiPath Document Manager est une application Web légère qui permet aux utilisateurs de préparer, de réviser et d'apporter des corrections aux ensembles de données requis pour l'entraînement et l'évaluation des modèles d'apprentissage automatique de Document Understanding.
Voici les méthodes de déploiement sur site :
- Data Manager dans la version locale d'AI Center. Ceci est en disponibilité générale et entièrement pris en charge pour les scénarios de production. Il n'y a pas de limite sur la taille des ensembles de données pouvant être importés, à l'exception du réentraînement automatique qui a toujours la limite de 2 000 pages ou 2 Go par importation. Pour toutes les méthodes de déploiement d'AI Center disponibles pour les versions locales, veuillez consulter cette page.
Data Manager permet à plusieurs utilisateurs d'effectuer diverses opérations liées à la gestion des lots de données, à la préparation des données et à la configuration du modèle :
Définir et configurer les champs à extraire par un modèle ML.
Importer des documents à des fins de labellisation
Pré-labelliser des documents à l'aide d'un modèle ML préexistant, tel que les modèles Extraction de factures (Invoice Extraction) ou Extraction de reçus (Receipt Extraction) fournis par UiPath prêts à l'emploi, ou à l'aide d'un modèle entraîné à l'aide d'AI Center.
Labelliser des documents
Exporter des documents au format attendu par les pipelines d'entraînement AI Center.
L'interface du Data Manager contient les panneaux suivants :
Affiché en haut de la page dans le Data Manager.
Vous permet d'effectuer plusieurs opérations : naviguer entre les documents, supprimer/restaurer un document, rechercher/filtrer des documents, exécuter des prédictions de modèle d'IA, importer et exporter des documents.
Voici les options disponibles dans la barre de gestion :
Option |
Icon |
Description |
---|---|---|
Navigation |
|
Naviguez entre les documents qui correspondent au filtre actif. Entre les deux flèches, un compteur s'affiche. Il représente le numéro du document actuel sur le nombre total de documents qui correspondent au filtre ou à la recherche active. |
|
Rechercher ou filtrer des documents. Un filtre est également appliqué lors de l'exportation de documents. Vous pouvez également filtrer par mots d'un document ou par noms de documents. | |
Supprimer / Restaurer |
/ |
Supprime ou restaure un document. Les documents supprimés peuvent être trouvés sous le filtre supprimé (deleted). |
Prévoir (Predict) |
|
Exécutez les prédictions du modèle d'IA et affichez les résultats. Après avoir configuré le prébalisage, le bouton est activé dans la barre de gestion. Cliquez dessus pour prébaliser le document actuel. Pour le moment, l'utilisation de l'option Prévoir (Predict) avec les prébalisages Points de terminaison publics (Public Endpoints) ne prébalise que les 10 premières pages d'un document. Il s'agit d'un problème connu et un correctif est en préparation. Cependant, utiliser l'option Prévoir (Predict) avec des compétences ML dans AI Center n'impose pas une telle limitation. |
|
Ouvrez la boîte de dialogue Importer des données (Import data). | |
|
Ouvrez la boîte de dialogue Exporter les fichiers (Export files). | |
|
Cliquez sur l'icône pour télécharger un fichier zip contenant le document original. | |
|
Configurez les paramètres d'OCR et de pré-labellisation, ou accédez au panneau Comment... (How to...). Voir ci-dessous. |
Télécharger
.jpeg
sont également téléchargées.
Nom et type du document, nom de la session
Sur le côté droit de l'icône, vous pouvez voir le nom du document actuellement actif, son type et le nom de la session.
Il existe trois types de documents :
- Document de formation
- Document de validation
- Document d’évaluation
Les documents d’entraînement et de validation font partie des ensembles de données d’entraînement utilisés par les Pipelines d'entraînement (Training Pipelines).
Les documents d’évaluation sont ignorés par les Pipelines d’entraînement (Training Pipelines) et sont destinés à être utilisés uniquement pour les Pipelines d'évaluation (Evaluation Pipelines) dans AI Center. Ces documents sont ceux qui ont été marqués comme évaluation en cochant la case Marquer cet ensemble d'évaluation (Mark this an evaluation set) dans la boîte de dialogue Importer des données (Import data).
Paramètres
Le bouton Paramètres a deux options disponibles :
- Paramètres (Settings) où vous pouvez configurer le service OCR ou le prébalisage (Prelabelling)
- Comment... qui sert de menu d'aide
OCR
Pour importer des documents dans Data Manager, il est obligatoire de configurer un service OCR.
Les options suivantes sont disponibles :
Le choix du moteur OCR à utiliser pour importer des documents dans Data Manager est déterminant.
Il est recommandé d'utiliser le même moteur pour importer les données d'apprentissage (temps d'apprentissage) que celui qui sera utilisé lors du déploiement du modèle (temps d'exécution).
Nous vous conseillons d'en essayer quelques-uns pour voir lequel fonctionne le mieux sur vos documents, et de ne faire votre choix qu'ensuite.
Les options sur site sont :
- Le conteneur de reconnaissance optique de caractères UiPath (UiPath OCR) qui prend en charge les principales langues d'Europe occidentale ;
- Le conteneur Microsoft Read (disponible en préversion auprès de Microsoft) offre également une bonne couverture linguistique ;
- Compétences ML de reconnaissance optique de caractères UiPath déployées dans AI Center sur site v2020.10 ou version ultérieure.
Les options basées sur le cloud sont :
- Reconnaissance optique de caractères de documents UiPath (UiPath Document OCR) - https://du.uipath.com/ocr ;
- Google Cloud Vision OCR qui offre la meilleure couverture linguistique ;
- Google Cloud Vision OCR for Japanese, optimal pour la lecture de documents japonais ;
- Microsoft Read OCR.
La configuration de la reconnaissance optique de caractères nécessite que le service OCR ait une URL. Voici les URL que vous pouvez utiliser :
- URL publiques telles que https://du.uipath.com/ocr ou des URL tierces de la reconnaissance optique de caractères Google Vision ou Microsoft Read
- URL du conteneur autonome de la reconnaissance optique de caractères UiPath Document fournis par UiPath déployés en local
-
URL du package de reconnaissance optique de caractères ML déployé en tant que compétences ML rendues publiques dans la version autonome d'AI Center v2020.10 ou version ultérieure
Important :Si vous exécutez la reconnaissance optique de caractères sur la même machine que Data Manager, n'utilisez paslocalhost
pour faire référence à la machine locale ; utilisez plutôt l'adresse IPDans le cas des URL de la reconnaissance optique de caractères déployée comme compétence ML publique dans AI Center sur site, utilisez l'URL telle qu'elle apparaît dans l'écran des détails des compétences ML MAI Center.
La clé API (API Key) correspondante pour le moteur OCR sélectionné. Par exemple, pour UiPath Document OCR, vous devez utiliser la clé API (API Key) Document Understanding. Obligatoire pour Data Manager Cloud et la version locale en ligne de Data Manager (Data Manager On-Prem Online). Il n'est pas requis pour la version locale physiquement isolée de Data Manager (On-Prem Air-gapped).
prébalisage
Si vous disposez déjà d'un modèle capable d'extraire certains des champs nécessitant d'être labellisés et que seuls quelques champs supplémentaires nécessitent un libellé manuel, vous pouvez gagner beaucoup de temps en utilisant la fonction de prélabellisation de Data Manager.
Les options suivantes sont disponibles :
La prélabellisation nécessite que le modèle ML possède une URL. Voici les URL que vous pouvez utiliser :
- URL publiques telles que https://du.uipath.com/ie/invoices ou https://du.uipath.com/ie/purchase_orders
- Voir la liste complète des points de terminaison ici
- URL des compétences ML rendues publiques dans la version locale d'AI Center ou AI Center Cloud
Les compétences ML dans les versions locales d'AI Center déployées dans des environnements physiquement isolés ne peuvent pas être utilisées pour la prélabellisation.
localhost
pour faire référence à la machine locale ; utilisez plutôt l'adresse IP ou le nom de domaine de la machine locale.Dans le cas des URL des compétences ML publiques dans AI Center sur site, utilisez l'URL telle qu'elle apparaît dans l'écran des détails des compétences ML MAI Center.
La clé API (API Key) de Document Understanding. Obligatoire pour Data Manager Cloud et la version locale en ligne de Data Manager (Data Manager On-Prem Online). Il n'est pas requis pour la version locale physiquement isolée de Data Manager (On-Prem Air-gapped).
Comment...
L'option Comment... accède au menu d'aide de Document Manager.
Ici, vous pouvez trouver :
- La version de Data Manager
- Le lien Documentation menant à cette page de documentation.
- La section Contrôles de libellés (Labeling Controls) qui affiche les contrôles à utiliser lors de la gestion des données.
- La section Raccourcis du document (Document Shortcuts) qui affiche les raccourcis utilisés pour effectuer diverses opérations telles que la navigation et la mise à l'échelle de l'interface utilisateur.
- La section Configuration qui affiche des détails sur la configuration de l'instance telle qu'elle a été effectuée lors de l'installation.
Les champs de colonne ont les options suivantes :
- Créer un nouveau champ de colonne
- Modifier le champ
- Développer/réduire les valeurs des champs de la colonne
Pour plus de détails sur les champs de colonne, consultez cette section.
Les champs réguliers ont les options suivantes :
- Créer un nouveau champ régulier
- Modifier le champ
Pour plus de détails sur les champs réguliers, consultez cette section.
Les champs de classification ont les options suivantes :
- Créer un nouveau champ de classification
- Modifier le champ
Pour plus de détails sur les champs de classification, consultez cette section.
Ctrl
+ molette de la souris.
Vous pouvez labelliser les documents en sélectionnant les zones de mots et en les affectant à un champ en appuyant sur une touche. Vous pouvez également cliquer avec le bouton droit sur la zone de mot et vérifier les informations extraites.
Pour plus de détails sur la labellisation des documents, visitez cette page.
Lorsque vous ouvrez une nouvelle session Data Manager ou lorsque vous avez un filtre vide, certaines directives s'affichent dans la vue du document :
De plus, les échecs de chargement sont également affichés dans la vue du document :