- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Extraction des données depuis des reçus
- Factures réentraînées avec un champ supplémentaire
- Extraire des données depuis des formulaires
- Composants de l'infrastructure
- Vue d’ensemble de l'entraînement de la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Machine Learning Classifier Trainer
- Activités liées à l'entraînement de la classification des documents
- Paquets ML
- Pipelines
- Document Manager
- Services OCR
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Apprentissage profond
- Licences
- Référence (Reference)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guide de l'utilisateur de Document Understanding
Extraction des données depuis des reçus
Le but de cette page est d'aider les nouveaux utilisateurs à se familiariser avec Document Understanding.
Pour les déploiements de production évolutifs, nous vous recommandons vivement d'utiliser le Processus Document Understanding (Document Understanding Process) disponible dans la section Modèles (Templates) d'UiPath Studio.
Ce guide de démarrage rapide vous montre comment extraire les données des reçus à l'aide du modèle ML Reçus (Receipts) prêt à l'emploi avec son point de terminaison public correspondant.
La validation peut être effectuée soit en présentant la Station de validation (Validation Station), soit en utilisant l'action de validation dans Action Center. Les deux options sont décrites dans les sections suivantes.
Dans cette section, nous allons valider les résultats d'extraction à l'aide de la Station de validation (Validation Station).
Pour créer un workflow de base à l'aide du modèle ML Reçus (Receipts), suivez les étapes ci-dessous.
- Créer un processus vierge
- Installer les packages d'activités requis
- Créer une taxonomie
- Numériser le document
- Extraire les données à l'aide du modèle ML Reçus (Receipts)
- Valider les résultats à l'aide de la Station de validation (Validation Station)
- Exporter les résultats de l'extraction
Voyons maintenant chaque étape en détail.
Lancer UiPath Studio.
Dans le mode backstage ACCUEIL (HOME), cliquez sur Traiter (Process) pour créer un nouveau projet.
La fenêtre Nouveau processus vierge (New Blank Process) s'affiche. Dans cette fenêtre, entrez un nom pour le nouveau projet. Si vous le souhaitez, vous pouvez également ajouter une description pour trier plus facilement vos projets.
Cliquez sur Créer (Create). Le nouveau projet est ouvert dans Studio.
À partir du bouton Gérer les packages (Manage Packages) du ruban, outre les packages d'activités de base (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) qui sont ajoutés au projet par défaut, installez les packages d'activités suivants :
Une fois les packages d'activités installés, répertoriez les champs obligatoires. Le modèle ML Reçus (Receipts) prend en charge l'extraction de données pour les champs ci-dessous :
- nom -
Text
- adresse-fournisseur -
Address
- total -
Number
- date -
Date
- téléphone -
Text
- devise -
Text
- type de dépense -
Text
-
éléments -
Table
- description -
Text
- montant-ligne -
Number
- prix unitaire –
Number
- quantité -
Number
- description -
Ouvrez Taxonomy Manager et créez un groupe nommé « Documents semi-structurés », une catégorie nommée « Finances » et un type de document nommé « Reçus ». Créez les champs listés ci-dessus avec des noms conviviaux ainsi que les types de données respectifs.
Dans le fichier Main.xaml, ajoutez une activité Ajouter une taxonomie (Load Taxonomy) et créez une variable pour la sortie de taxonomie.
Ajoutez une activité Numériser le document (Digitize Document) avec UiPath Document OCR. Fournissez la propriété d'entrée Chemin du document (Document Path) et créez des variables de sortie pour Texte du document (Document Text) et Modèle d'objet document (Document Object Model).
N'oubliez pas d'ajouter la clé API Document Understanding dans l'activité UiPath Document OCR.
Ajoutez une activité Étendue de l'extraction de données (Data Extraction Scope) et renseignez les propriétés.
Glissez-déposez une activité Extracteur d'apprentissage automatique (Machine Learning Extractor). Une fenêtre contextuelle avec trois paramètres d'entrée, Point de terminaison (Endpoint), Compétence ML (ML Skill) et Clé API (ApiKey) s'affiche.
Renseignez le paramètre Point de terminaison (Endpoint) avec le Point de terminaison public Reçus (Receipts Public Endpoint), à savoir https://du.uipath.com/ie/receipts, et fournissez la clé API Document Understanding.
Cliquez sur Obtenir des capacités (Get Capabilities).
L'étape suivante consiste à configurer l'extracteur. Configurer l'extracteur signifie mapper les champs que vous avez créés dans Taxonomy Manager aux champs disponibles dans le modèle ML, comme illustré dans l'image ci-dessous :
Pour utiliser l'extracteur d'apprentissage automatique (Machine Learning Extractor) avec une compétence ML, choisissez la compétence ML dans la liste déroulante et configurez l'extracteur.
Votre assistant robot doit être connecté au locataire dans lequel se trouve votre compétence ML.
Pour vérifier les résultats via la Station de validation (Validation Station), glissez-déposez l'activité Présenter la station de validation (Present Validation Station) et fournissez les détails d'entrée.
DataSet
contenant plusieurs tables, qui peuvent ensuite être écrites dans un fichier Excel ou être utilisées directement dans un processus en aval.
Téléchargez cet exemple de projet à l'aide de ce lien.
L'exemple contient deux workflows :
- Main.xaml - Dans ce workflow, les résultats d'extraction sont validés à l'aide de la station de validation (Validation Station), comme décrit dans la section ci-dessus
- Main - Unattended.xaml - Dans ce workflow, les résultats de l'extraction sont validés à l'aide de l'Action de validation (Validation Action) comme décrit dans la section suivante
Utilisation du modèle ML Reçus (Receipts) avec le Point de terminaison public (Public Endpoint) et l'Action de validation (Validation Action)
Voyons maintenant comment utiliser une action de validation d'Action Center au lieu de présenter la station de validation.
Lorsqu'une automatisation comprend des décisions qu'un utilisateur doit prendre, tel que des approbations, des escalades et des exceptions, UiPath Action Center permet de transférer facilement et efficacement le processus du robot à l'utilisateur. Et vice-versa.
Les activités Document Understanding Action Center sont fournies avec le package UiPath.IntelligentOCR.Activities et le package UiPath.Persistance.Activities. N'oubliez pas d'activer les activités de Persistance (Persistence) à partir des Paramètres généraux (General Settings) dans UiPath Studio :
La productivité peut être augmentée en ajoutant un processus d'orchestration qui ajoute des actions de validation de document dans Action Center, à la fois dans Orchestrator en local et Automation Cloud. Cette action vous évite d'avoir à stocker tous vos documents localement, d'avoir un robot installé sur chaque machine utilisée par un utilisateur ou de devoir mettre le robot en attente de la validation des utilisateurs.
Vous trouverez plus de détails ici.
Répétez les étapes 1 à 5 décrites dans la section ci-dessus.
Ensuite, au lieu d'utiliser l'activité Présenter la station de validation (Present Validation Station), utilisez les activités Créer une action de validation de document (Create Document Validation Action et Attendre une action de validation de document et Reprendre (Wait for Document Validation Action and Resume).
L'image ci-dessous montre l'activité Créer une action de validation de document (Create Document Validation Action et ses propriétés.
Cela crée une action de validation de document (document validation action) dans Action Center. La sortie de l'activité Créer une action de validation de document (Create Document Validation Action) peut ensuite être utilisée avec l'activité Attendre l'action de Validation du document et Reprendre (Wait for Document Validation Action and Resume) pour suspendre et reprendre les workflows d'orchestration à la fin de l'action de l'utilisateur dans Action Center.
- Utilisation du modèle Receipts ML avec le point de terminaison public et la Station de validation
- 1. Créer un processus vierge
- 2. Installer les packages d'activités requis
- 3. Créer une taxonomie
- 4. Numériser le document
- 5. Extraire les données à l'aide du modèle ML Reçus (Receipts)
- 6. Valider les résultats à l'aide de la Station de validation (Validation Station)
- 7. Exporter les résultats de l'extraction
- Téléchargez l'exemple
- Utilisation du modèle ML Reçus (Receipts) avec le Point de terminaison public (Public Endpoint) et l'Action de validation (Validation Action)
- Comment fonctionnent les tâches dans Action Center ?
- Comment fonctionne l'Action de validation (Validation Action) ?
- Comment utiliser l'Action de validation (Validation Action) ?