- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Extraer datos de recibos
- Facturas reordenadas con un campo adicional
- Extraer datos de formularios
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos - paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Idiomas admitidos
- Aprendizaje profundo
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Licencia
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding user guide
Extraer datos de formularios
The aim of this page is to help first time users get familiar with Document UnderstandingTM.
For scalable production deployments, we strongly recommend using the Document Understanding Process available in UiPath® Studio under the Templates section.
This quickstart guides you through the steps required to extract information from W-9 forms using the Intelligent Form Extractor. The W-9 forms are used as an example, but the procedure is similar for other types of documents where the data is structured.
Partiendo de cero, estos son los pasos que hay que seguir:
- Crea un proceso en blanco
- Instala los paquetes de actividades requeridos
- Crea una taxonomía
- Digitaliza el documento
- Extraer los datos mediante el extractor inteligente de formularios
- Valida los resultados mediante la estación de validación
- Exportar resultados de extracción
1. Crea un proceso en blanco
Inicia UiPath Studio.
In the HOME backstage view, select Process to create a new project.
Se mostrará la ventana Nuevo proceso en blanco. En esta ventana, introduce un nombre para el nuevo proyecto. Si quieres, también puedes añadir una descripción para clasificar tus proyectos más fácilmente.
Select Create. The new project is opened in Studio.
2. Instala los paquetes de actividades requeridos
From the Manage Packages button in the ribbon, besides the core activities packages (UiPath.Excel.Activities,UiPath.Mail.Activities,UiPath.System.Activities,UiPath.UIAutomation.Activities) that are added to the project by default, install the following activities packages:
3. Crea una taxonomía
Una vez instalados los paquetes, enumera los campos requeridos. Realizaremos extracción de datos para los siguientes campos:
- 1_Name:
Text - 2_BusinessName:
Text - 3a_Individual:
Boolean - 3b_CCorp:
Boolean - 3c_SCorp:
Boolean - 3d_Partnership:
Boolean - 3e_TrustEstate:
Boolean - 3f_LLC:
Boolean - 3f_LLCTaxClassification:
Boolean - 3g_Other:
Boolean - 3g_OtherDetail:
Boolean - 5_Address:
Text - 6_CityStateZip:
Text - 7_AcctNumber:
Text - TIN_SSN:
Text - TIN_ETN:
Text - Certification_Signature:
Boolean - Certification_SignatureDate:
Date
Open Taxonomy Manager and create a group named Structured Documents, a category named Lending Forms, and a document type named W-9. Createlisted fields with user friendly names along with respective data types.

4. Digitaliza el documento
In the Main.xaml file, add a Load Taxonomy activity and create a variable for the taxonomy output.
Add a Digitize Document activity with UiPath Document OCR. Provide the input property Document Path and create output variables for Document Text and Document Object Model.
No te olvides de añadir la clave API de Document Understanding en la actividad de UiPath Document OCR.
5. Extrae los datos mediante el extractor inteligente de formularios
Add a Data Extraction Scope activity and fill in the properties.
Drag and drop the Intelligent Form Extractor within it. The endpoint should be auto-populated with the Intelligent Form Extractor endpoint, namely https://du.uipath.com/svc/intelligentforms. Provide the Document Understanding API key.
Once that is done, to create a new template, select Manage Templates > Create Template. A pop-up window opens.
En tipo de documento, selecciona el tipo de documento W-9 creado anteriormente.
En Nombre del documento, introduce un nombre para tu plantilla.
Under Template document (native PDF if possible), attach a template document where you are going to map the field positions.
Under OCR Engine, select again the UiPath Document OCR. Just like before, the endpoint should be auto-populated, namely https://du.uipath.com/ocr, and you just need to provide the API Key.
Select Configure to move to the next step. The Template Manager pop-up window opens.
Here, we will need to select the areas where we want Intelligent Form Extractor to search for our fields. Configure them by following the steps detailed here. You also have the option of using anchors for your fields. More information on anchors here.
Deberías terminar con algo como lo siguiente:

Select Save. In this screen, you can define the handwritten or signature fields, where applicable. You can also define synonyms for Boolean fields. Close the window after you are done.

El siguiente paso es configurar el extractor, es decir, hacer que el extractor inteligente de formularios procese todos los documentos de tipo W-9.

6. Valida los resultados mediante la estación de validación
To check the results through Validation Station, drag and drop the Present Validation Station activity and provide the input details.

7. Exporta los resultados de la extracción
To export the extraction results, validated or not, drag and drop an Export Extraction Results activity to the end of your workflow. This outputs the results into a DataSet that contains multiple tables, which could then be written to an Excel file or be used directly in a downstream process.

Descargar ejemplo
Download this sample project to execute the W-9 with Intelligent Form Extractor workflow using this link.
- 1. Crea un proceso en blanco
- 2. Instala los paquetes de actividades requeridos
- 3. Crea una taxonomía
- 4. Digitaliza el documento
- 5. Extrae los datos mediante el extractor inteligente de formularios
- 6. Valida los resultados mediante la estación de validación
- 7. Exporta los resultados de la extracción
- Descargar ejemplo