Document Understanding - Extraire des données depuis des formulaires

document-understanding

2023.10

false

Guide de l'utilisateur de Document Understanding

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Extraire des données depuis des formulaires

Extrayez des données de formulaires à l’aide des activités Document Understanding en guidant les nouveaux utilisateurs à travers les étapes principales avant de passer aux déploiements de production.

Important :

Le but de cette page est d'aider les nouveaux utilisateurs à se familiariser avec Document Understanding^TM.

Pour les déploiements de production évolutifs, nous vous recommandons vivement d’utiliser le Processus Document Understanding disponible dans la section Modèles de UiPath® Studio.

Ce guide de démarrage rapide vous guide à travers les étapes nécessaires pour extraire les informations des formulaires W-9 à l'aide de l' Extracteur de formulaires intelligents. Les formulaires W-9 sont utilisés à titre d'exemple, mais la procédure est similaire pour les autres types de documents où les données sont structurées.

En partant de zéro, voici les étapes à suivre :

Créer un processus vierge
Installer les packages d'activités requis
Créer une taxonomie
Numériser le document
Extraire les données à l'aide de l'Extracteur de formulaires intelligents (Intelligent Form Extractor)
Valider les résultats à l'aide de la Station de validation (Validation Station)
Export Extraction Results

1. Créer un processus vierge

Lancer UiPath Studio.

Dans la vue des coulisses ACCUEIL, sélectionnez Processus pour créer un nouveau projet.

La fenêtre Nouveau processus vierge (New Blank Process) s'affiche. Dans cette fenêtre, entrez un nom pour le nouveau projet. Si vous le souhaitez, vous pouvez également ajouter une description pour trier plus facilement vos projets.

Sélectionnez Créer. Le nouveau projet est ouvert dans Studio.

2. Installer les packages d'activités requis

À partir du bouton Gérer les packages (Manage Packages) du ruban, outre les packages d'activités de base (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) qui sont ajoutés au projet par défaut, installez les packages d'activités suivants :

3. Créer une taxonomie

Une fois les packages installés, dressez la liste des champs requis. Nous allons extraire des données des champs suivants :

1_Name - Text
2_BusinessName - Text
3a_Individual - Boolean
3b_CCorp - Boolean
3c_SCorp - Boolean
3d_Partnership - Boolean
3e_TrustEstate - Boolean
3f_LLC - Boolean
3f_LLC TaxClassification - Boolean
3g_Other - Boolean
3g_AutreDétail - Boolean
5_Address - Text
6_CityStateZip - Text
7_AcctNumber - Text
TIN_SSN - Text
TIN_ETN - Text
Certification_Signature - Boolean
Certification_SignatureDate - Date

Ouvrez Taxonomy Manager et créez un groupe nommé Documents semi-structurés, une catégorie nommée Finance et un type de document nommé W-9. Champs créés avec des noms conviviaux ainsi que les types de données respectifs.

4. Numériser le document

Dans le fichier Main.xaml , ajoutez une activité Ajouter une taxonomie et créez une variable pour la sortie de taxonomie.

Ajoutez une activité Numériser le document avec UiPath Document OCR. Fournissez la propriété d'entrée Chemin du document et créez des variables de sortie pour Texte du document et Modèle d'objet document.

N'oubliez pas d'ajouter la clé API Document Understanding dans l'activité UiPath Document OCR.

5. Extraire les données à l'aide de l'Extracteur de formulaires intelligents (Intelligent Form Extractor)

Ajoutez une activité Étendue de l'extraction de données (Data Extraction Scope) et renseignez les propriétés.

Faites glisser et déposez l' Extracteur de formulaires intelligents à l'intérieur. Le point de terminaison doit être rempli automatiquement avec le point de terminaison de l'Extracteur de formulaires intelligents, à savoir https://du.uipath.com/svc/intelligentforms. Fournissez la clé d’API Document Understanding.

Une fois cela fait, pour créer un nouveau modèle, sélectionnez Gérer les modèles > Créer un modèle. Une fenêtre contextuelle s'ouvre.

Sous Type de document (Document type), sélectionnez le type de document W-9 créé précédemment.

Sous Nom du document (Document name), saisissez un nom pour votre modèle.

Sous Modèle de document (PDF natif si possible), joignez un document modèle dans lequel vous allez mapper les positions des champs.

Sous Moteur OCR, sélectionnez à nouveau UiPath Document OCR. Comme avant, le point de terminaison doit être rempli automatiquement, à savoir https://du.uipath.com/ocr, et il vous suffit de fournir la clé API.

Sélectionnez Configurer pour passer à l'étape suivante. La fenêtre contextuelle du gestionnaire de modèles (Template Manager) s'ouvre.

Ici, nous devrons sélectionner les zones dans lesquelles nous voulons que l'Extracteur de formulaires intelligents (Intelligent Form Extractor) recherche nos champs. Configurez-les en suivant les étapes détaillées ici. Vous avez également la possibilité d'utiliser des ancres pour vos champs. Plus d'informations sur les ancres ici.

Vous devriez vous retrouver avec quelque chose comme ça :

Sélectionnez Save (Enregistrer). Dans cet écran, vous pouvez définir les champs manuscrits ou de signature, le cas échéant. Vous pouvez également définir des synonymes pour les champs booléens. Fermez la fenêtre une fois que vous avez terminé.

L'étape suivante consiste à configurer l'Extracteur, ce qui signifie que l'Extracteur de formulaires intelligents (Intelligent Form Extractor) traite tous les documents de type W-9.

6. Valider les résultats à l'aide de la Station de validation (Validation Station)

Pour vérifier les résultats via la Station de validation, glissez-déposez l'activité Présenter la station de validation et fournissez les détails d'entrée.

7. Exporter les résultats de l'extraction

Pour exporter les résultats d'extraction, validés ou non, glissez et déposez une activité Exporter les résultats d'extraction à la fin de votre workflow. Cela génère les résultats dans un DataSet contenant plusieurs tables, qui peuvent ensuite être écrites dans un fichier Excel ou être utilisées directement dans un processus en aval.

Téléchargez l'exemple

Téléchargez cet exemple de projet pour exécuter le workflow W-9 avec l'Extracteur de formulaires intelligents à l'aide de ce lien.

Sommaire de la page

1. Créer un processus vierge
2. Installer les packages d'activités requis
3. Créer une taxonomie
4. Numériser le document
5. Extraire les données à l'aide de l'Extracteur de formulaires intelligents (Intelligent Form Extractor)
6. Valider les résultats à l'aide de la Station de validation (Validation Station)
7. Exporter les résultats de l'extraction
Téléchargez l'exemple

Cette page vous a-t-elle été utile ?

PrécédentFactures réentraînées avec un champ supplémentaire

SuivantTaxonomie

1. Créer un processus vierge​

2. Installer les packages d'activités requis​

3. Créer une taxonomie​

4. Numériser le document​

5. Extraire les données à l'aide de l'Extracteur de formulaires intelligents (Intelligent Form Extractor)​

6. Valider les résultats à l'aide de la Station de validation (Validation Station)​

7. Exporter les résultats de l'extraction​

Téléchargez l'exemple​