- Información general
- Primeros pasos
- Actividades
- Paneles de insights
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Detalles del modelo
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos - paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Limitaciones de tráfico
- Configuración de OCR
- Procesos
- Servicios de OCR
- Idiomas admitidos
- Aprendizaje profundo
- Datos y seguridad
- Lógica de licencias y tarificación
Guía del usuario clásica de Document Understanding
El objetivo de esta página es ayudar a los usuarios primerizos a familiarizarse con Document UnderstandingTM. Para implementaciones de producción escalables, recomendamos encarecidamente utilizar el Proceso de Document Understanding disponible en UiPath® Studio en la sección Plantillas.
Esta guía rápida te guía a través de los pasos necesarios para extraer información de los formularios W-9 utilizando el Extractor inteligente de formularios. Los formularios W-9 se utilizan como ejemplo, pero el procedimiento es similar para otros tipos de documentos en los que los datos están estructurados.
Partiendo de cero, estos son los pasos que hay que seguir:
- Crea un proceso en blanco
- Instala los paquetes de actividades requeridos
- Crea una taxonomía
- Digitaliza el documento
- Extraer los datos mediante el extractor inteligente de formularios
- Valida los resultados mediante la estación de validación
- Exportar resultados de extracción
1. Crea un proceso en blanco
Inicia UiPath Studio.
En la vista Backstage de INICIO, selecciona Proceso para crear un nuevo proyecto.
Se mostrará la ventana Nuevo proceso en blanco. En esta ventana, introduce un nombre para el nuevo proyecto. Si quieres, también puedes añadir una descripción para clasificar tus proyectos más fácilmente.
Selecciona Crear. Se abrirá el nuevo proyecto en Studio.
2. Instala los paquetes de actividades requeridos
Desde el botón Gestionar paquetes de la cinta, además de los paquetes de actividades principales (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) que se añaden al proyecto de forma predeterminada, instala los siguientes paquetes de actividades:
3. Crea una taxonomía
Una vez instalados los paquetes, enumera los campos requeridos. Realizaremos extracción de datos para los siguientes campos:
- 1_Name:
Text - 2_BusinessName:
Text - 3a_Individual:
Boolean - 3b_CCorp:
Boolean - 3c_SCorp:
Boolean - 3d_Partnership:
Boolean - 3e_TrustEstate:
Boolean - 3f_LLC:
Boolean - 3f_LLCTaxClassification:
Boolean - 3g_Other:
Boolean - 3g_OtherDetail:
Boolean - 5_Address:
Text - 6_CityStateZip:
Text - 7_AcctNumber:
Text - TIN_SSN:
Text - TIN_ETN:
Text - Certification_Signature:
Boolean - Certification_SignatureDate:
Date
Abre el Gestor de taxonomía y crea un grupo llamado Documentos estructurados, una categoría llamada Formularios de préstamo y un tipo de documento llamado W-9. Crear campos enumerados con nombres fáciles de usar junto con los tipos de datos respectivos.

4. Digitaliza el documento
En el archivo Main.xaml , añade una actividad Cargar taxonomía y crea una variable para la salida de la taxonomía.
Añade una actividad Digitalizar documento con UiPath Document OCR. Proporcione la propiedad de entrada Ruta del documento y cree variables de salida para Texto del documento y Modelo de objeto del documento.
No te olvides de añadir la clave API de Document Understanding en la actividad de UiPath Document OCR.
5. Extrae los datos mediante el extractor inteligente de formularios
Añade una actividad Alcance de la extracción de información y rellena las propiedades.
Arrastra y suelta el Extractor inteligente de formularios dentro de él. El punto final debe rellenarse automáticamente con el punto final Extractor inteligente de formularios, es decir, https://du.uipath.com/svc/intelligentforms. Proporciona la clave API de Document Understanding.
Una vez hecho eso, para crear una nueva plantilla, selecciona Administrar plantillas > Crear plantilla. Se abre una ventana emergente.
En tipo de documento, selecciona el tipo de documento W-9 creado anteriormente.
En Nombre del documento, introduce un nombre para tu plantilla.
En Documento de plantilla (PDF nativo si es posible), adjunta un documento de plantilla en el que vayas a asignar las posiciones de campo.
En Motor OCR, selecciona de nuevo UiPath Document OCR. Al igual que antes, el punto final debe rellenarse automáticamente, es decir, https://du.uipath.com/ocr, y solo tienes que proporcionar la clave API.
Selecciona Configurar para pasar al siguiente paso. Se abrirá la ventana emergente Administrador de plantillas.
Aquí tendremos que seleccionar las áreas en las que queremos que el extractor inteligente de formularios busque nuestros campos. Configúralo siguiendo los pasos detallados aquí. También tienes la opción de usar anclajes para tus campos. Obtén más información sobre los anclajes aquí.
Deberías terminar con algo como lo siguiente:

Selecciona Guardar. En esta pantalla se pueden definir los campos de escritura a mano o de firma, en su caso. También puedes definir sinónimos para los campos booleanos. Cierra la ventana cuando hayas terminado.

El siguiente paso es configurar el extractor, es decir, hacer que el extractor inteligente de formularios procese todos los documentos de tipo W-9.

6. Valida los resultados mediante la estación de validación
Para comprobar los resultados a través de la Estación de validación, arrastra y suelta la actividad Mostrar estación de validación y proporciona los detalles de entrada.

7. Exporta los resultados de la extracción
Para exportar los resultados de la extracción, validados o no, arrastra y suelta una actividad Exportar resultados de extracción al final de tu flujo de trabajo. Esto genera los resultados en un DataSet que contiene varias tablas, que luego podrían escribirse en un archivo de Excel o utilizarse directamente en un proceso posterior.

Descargar ejemplo
Descarga este proyecto de muestra para ejecutar el flujo de trabajo W-9 con extractor inteligente de formularios utilizando este enlace.
- 1. Crea un proceso en blanco
- 2. Instala los paquetes de actividades requeridos
- 3. Crea una taxonomía
- 4. Digitaliza el documento
- 5. Extrae los datos mediante el extractor inteligente de formularios
- 6. Valida los resultados mediante la estación de validación
- 7. Exporta los resultados de la extracción
- Descargar ejemplo