- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Extraction des données depuis des reçus
- Factures réentraînées avec un champ supplémentaire
- Extraire des données depuis des formulaires
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- 990 - Paquet ML - Aperçu
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Passeports - Paquet ML
- Fiches de paie - Paquet ML
- Bons de commande - Paquet ML
- Reçus – Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Prérequis matériels
- Pipelines
- Document Manager
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Tableaux de bord Insights.
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Licences
- Activités
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding user guide
Extraire des données depuis des formulaires
The aim of this page is to help first time users get familiar with Document UnderstandingTM.
For scalable production deployments, we strongly recommend using the Document Understanding Process available in UiPath® Studio under the Templates section.
This quickstart guides you through the steps required to extract information from W-9 forms using the Intelligent Form Extractor. The W-9 forms are used as an example, but the procedure is similar for other types of documents where the data is structured.
En partant de zéro, voici les étapes à suivre :
- Créer un processus vierge
- Installer les packages d'activités requis
- Créer une taxonomie
- Numériser le document
- Extraire les données à l'aide de l'Extracteur de formulaires intelligents (Intelligent Form Extractor)
- Valider les résultats à l'aide de la Station de validation (Validation Station)
- Export Extraction Results
1. Créer un processus vierge
Lancer UiPath Studio.
In the HOME backstage view, select Process to create a new project.
La fenêtre Nouveau processus vierge (New Blank Process) s'affiche. Dans cette fenêtre, entrez un nom pour le nouveau projet. Si vous le souhaitez, vous pouvez également ajouter une description pour trier plus facilement vos projets.
Select Create. The new project is opened in Studio.
2. Installer les packages d'activités requis
From the Manage Packages button in the ribbon, besides the core activities packages (UiPath.Excel.Activities,UiPath.Mail.Activities,UiPath.System.Activities,UiPath.UIAutomation.Activities) that are added to the project by default, install the following activities packages:
3. Créer une taxonomie
Une fois les packages installés, dressez la liste des champs requis. Nous allons extraire des données des champs suivants :
- 1_Name -
Text - 2_BusinessName -
Text - 3a_Individual -
Boolean - 3b_CCorp -
Boolean - 3c_SCorp -
Boolean - 3d_Partnership -
Boolean - 3e_TrustEstate -
Boolean - 3f_LLC -
Boolean - 3f_LLC TaxClassification -
Boolean - 3g_Other -
Boolean - 3g_AutreDétail -
Boolean - 5_Address -
Text - 6_CityStateZip -
Text - 7_AcctNumber -
Text - TIN_SSN -
Text - TIN_ETN -
Text - Certification_Signature -
Boolean - Certification_SignatureDate -
Date
Open Taxonomy Manager and create a group named Structured Documents, a category named Lending Forms, and a document type named W-9. Createlisted fields with user friendly names along with respective data types.

4. Numériser le document
In the Main.xaml file, add a Load Taxonomy activity and create a variable for the taxonomy output.
Add a Digitize Document activity with UiPath Document OCR. Provide the input property Document Path and create output variables for Document Text and Document Object Model.
N'oubliez pas d'ajouter la clé API Document Understanding dans l'activité UiPath Document OCR.
5. Extraire les données à l'aide de l'Extracteur de formulaires intelligents (Intelligent Form Extractor)
Add a Data Extraction Scope activity and fill in the properties.
Drag and drop the Intelligent Form Extractor within it. The endpoint should be auto-populated with the Intelligent Form Extractor endpoint, namely https://du.uipath.com/svc/intelligentforms. Provide the Document Understanding API key.
Once that is done, to create a new template, select Manage Templates > Create Template. A pop-up window opens.
Sous Type de document (Document type), sélectionnez le type de document W-9 créé précédemment.
Sous Nom du document (Document name), saisissez un nom pour votre modèle.
Under Template document (native PDF if possible), attach a template document where you are going to map the field positions.
Under OCR Engine, select again the UiPath Document OCR. Just like before, the endpoint should be auto-populated, namely https://du.uipath.com/ocr, and you just need to provide the API Key.
Select Configure to move to the next step. The Template Manager pop-up window opens.
Here, we will need to select the areas where we want Intelligent Form Extractor to search for our fields. Configure them by following the steps detailed here. You also have the option of using anchors for your fields. More information on anchors here.
Vous devriez vous retrouver avec quelque chose comme ça :

Select Save. In this screen, you can define the handwritten or signature fields, where applicable. You can also define synonyms for Boolean fields. Close the window after you are done.

L'étape suivante consiste à configurer l'Extracteur, ce qui signifie que l'Extracteur de formulaires intelligents (Intelligent Form Extractor) traite tous les documents de type W-9.

6. Valider les résultats à l'aide de la Station de validation (Validation Station)
To check the results through Validation Station, drag and drop the Present Validation Station activity and provide the input details.

7. Exporter les résultats de l'extraction
To export the extraction results, validated or not, drag and drop an Export Extraction Results activity to the end of your workflow. This outputs the results into a DataSet that contains multiple tables, which could then be written to an Excel file or be used directly in a downstream process.

Téléchargez l'exemple
Download this sample project to execute the W-9 with Intelligent Form Extractor workflow using this link.
- 1. Créer un processus vierge
- 2. Installer les packages d'activités requis
- 3. Créer une taxonomie
- 4. Numériser le document
- 5. Extraire les données à l'aide de l'Extracteur de formulaires intelligents (Intelligent Form Extractor)
- 6. Valider les résultats à l'aide de la Station de validation (Validation Station)
- 7. Exporter les résultats de l'extraction
- Téléchargez l'exemple