- Vue d'ensemble (Overview)
- Démarrage
- Activités (Activities)
- Tableaux de bord Insights.
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Extraction des données depuis des reçus
- Factures réentraînées avec un champ supplémentaire
- Extraire des données depuis des formulaires
- Créer une nouvelle automatisation à partir d’un fichier
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Limitations du trafic
- Configuration OCR
- Pipelines
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Licences
Guide de l'utilisateur de Document Understanding
Extraction des données depuis des reçus
L’objectif de cette page est d’aider les nouveaux utilisateurs à se familiariser avec UiPath® Document UnderstandingTM.
Pour les déploiements de production évolutifs, nous vous recommandons vivement d’utiliser le Processus Document Understanding disponible dans la section Modèles d’ UiPath® Studio.
Ce guide de démarrage rapide vous montre comment extraire les données des reçus à l'aide du modèle ML Reçus (Receipts) prêt à l'emploi avec son point de terminaison public correspondant.
La validation peut être effectuée soit en présentant la Station de validation (Validation Station), soit en utilisant l'action de validation dans Action Center. Les deux options sont décrites dans les sections suivantes.
Dans cette section, nous allons valider les résultats d'extraction à l'aide de la Station de validation (Validation Station).
Pour créer un workflow de base à l'aide du modèle ML Reçus (Receipts), suivez les étapes ci-dessous.
- Créer un processus vierge
- Installer les packages d'activités requis
- Créer une taxonomie
- Numériser le document
- Extraire les données à l'aide du modèle ML Reçus (Receipts)
- Valider les résultats à l'aide de la Station de validation (Validation Station)
- Exporter les résultats de l'extraction
Voyons maintenant chaque étape en détail.
- Lancer UiPath Studio.
- Dans le mode backstage ACCUEIL (HOME), cliquez sur Traiter (Process) pour créer un nouveau projet.
- La fenêtre Nouveau processus vierge (New Blank Process) s'affiche. Dans cette fenêtre, entrez un nom pour le nouveau projet. Si vous le souhaitez, vous pouvez également ajouter une description pour trier plus facilement vos projets.
- Cliquez sur Créer (Create). Le nouveau projet est ouvert dans Studio.
À partir du bouton Gérer les packages (Manage Packages) du ruban, outre les packages d'activités de base (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) qui sont ajoutés au projet par défaut, installez les packages d'activités suivants :
Une fois les packages d'activités installés, répertoriez les champs obligatoires. Le modèle ML Reçus (Receipts) prend en charge l'extraction de données pour les champs ci-dessous :
- nom -
Text
- adresse-fournisseur -
Address
- total -
Number
- date -
Date
- téléphone -
Text
- devise -
Text
- type de dépense -
Text
- éléments -
Table
- description -
Text
- montant-ligne -
Number
- prix unitaire –
Number
- quantité -
Number
- description -
Ouvrez Taxonomy Manager et créez un groupe nommé Documents semi-structurés, une catégorie nommée Financeet un type de document nommé Receipts. Créez les champs listés ci-dessus avec des noms conviviaux ainsi que les types de données respectifs.
- Dans le fichier Main.xaml, ajoutez une activité Ajouter une taxonomie (Load Taxonomy) et créez une variable pour la sortie de taxonomie.
- Ajoutez une activité Numériser le document (Digitize Document) avec UiPath Document OCR. Fournissez la propriété d'entrée Chemin du document (Document Path) et créez des variables de sortie pour Texte du document (Document Text) et Modèle d'objet document (Document Object Model).
- N'oubliez pas d'ajouter la clé API Document Understanding dans l'activité UiPath Document OCR.
- Ajoutez une activité Étendue de l'extraction de données (Data Extraction Scope) et renseignez les propriétés.
- Glissez-déposez une activité Extracteur d'apprentissage automatique (Machine Learning Extractor). Une fenêtre contextuelle avec trois paramètres d'entrée, Point de terminaison (Endpoint), Compétence ML (ML Skill) et Clé API (ApiKey) s'affiche.
- Renseignez le paramètre Point de terminaison (Endpoint) avec le Point de terminaison public Reçus (Receipts Public Endpoint), à savoir
https://du.uipath.com/ie/receipts
, et fournissez la clé API Document Understanding. - Cliquez sur Obtenir des capacités (Get Capabilities).
- L'étape suivante consiste à configurer l'extracteur. Configurer l'extracteur signifie mapper les champs que vous avez créés dans Taxonomy Manager aux champs disponibles dans le modèle ML, comme illustré dans l'image ci-dessous :
- Pour utiliser l'extracteur d'apprentissage automatique (Machine Learning Extractor) avec une compétence ML, choisissez la compétence ML dans la liste déroulante et configurez l'extracteur.
- Votre assistant robot doit être connecté au locataire dans lequel se trouve votre compétence ML.
Pour vérifier les résultats via la Station de validation (Validation Station), glissez-déposez l'activité Présenter la station de validation (Present Validation Station) et fournissez les détails d'entrée.
DataSet
contenant plusieurs tables, qui peuvent ensuite être écrites dans un fichier Excel ou être utilisées directement dans un processus en aval.
Téléchargez cet exemple de projet à l'aide de ce lien.
L'exemple contient deux workflows :
- Main.xaml - Dans ce workflow, les résultats d'extraction sont validés à l'aide de la station de validation (Validation Station), comme décrit dans la section ci-dessus
- Main - Unattended.xaml - Dans ce workflow, les résultats de l'extraction sont validés à l'aide de l'Action de validation (Validation Action) comme décrit dans la section suivante
Utilisation du modèle ML Reçus (Receipts) avec le Point de terminaison public (Public Endpoint) et l'Action de validation (Validation Action)
Voyons maintenant comment utiliser une action de validation d'Action Center au lieu de présenter la station de validation.
Lorsqu'une automatisation comprend des décisions qu'un utilisateur doit prendre, tel que des approbations, des escalades et des exceptions, UiPath Action Center permet de transférer facilement et efficacement le processus du robot à l'utilisateur. Et vice-versa.
Les activités Document Understanding Action Center sont fournies avec le package UiPath.IntelligentOCR.Activities et le package UiPath.Persistance.Activities. N'oubliez pas d'activer les activités de Persistance (Persistence) à partir des Paramètres généraux (General Settings) dans UiPath Studio :
La productivité peut être augmentée en ajoutant un processus d'orchestration qui ajoute des actions de validation de document dans Action Center, à la fois dans Orchestrator en local et Automation Cloud. Cette action vous évite d'avoir à stocker tous vos documents localement, d'avoir un robot installé sur chaque machine utilisée par un utilisateur ou de devoir mettre le robot en attente de la validation des utilisateurs.
Vous trouverez plus de détails ici.
Répétez les étapes 1 à 5 décrites dans la section ci-dessus.
Ensuite, au lieu d'utiliser l'activité Présenter la station de validation (Present Validation Station), utilisez les activités Créer une action de validation de document (Create Document Validation Action et Attendre une action de validation de document et Reprendre (Wait for Document Validation Action and Resume).
L'image ci-dessous montre l'activité Créer une action de validation de document (Create Document Validation Action et ses propriétés.
Cela crée une action de validation de document (document validation action) dans Action Center. La sortie de l'activité Créer une action de validation de document (Create Document Validation Action) peut ensuite être utilisée avec l'activité Attendre l'action de Validation du document et Reprendre (Wait for Document Validation Action and Resume) pour suspendre et reprendre les workflows d'orchestration à la fin de l'action de l'utilisateur dans Action Center.
- Utilisation du modèle Receipts ML avec le point de terminaison public et la Station de validation
- 1. Créer un processus vierge
- 2. Installer les packages d'activités requis
- 3. Créer une taxonomie
- 4. Numériser le document
- 5. Extraire les données à l'aide du modèle ML Reçus (Receipts)
- 6. Valider les résultats à l'aide de la Station de validation (Validation Station)
- 7. Exporter les résultats de l'extraction
- Téléchargez l'exemple
- Utilisation du modèle ML Reçus (Receipts) avec le Point de terminaison public (Public Endpoint) et l'Action de validation (Validation Action)
- Comment fonctionnent les tâches dans Action Center ?
- Comment fonctionne l'Action de validation (Validation Action) ?
- Comment utiliser l'Action de validation (Validation Action) ?