document-understanding
2022.4
true
UiPath logo, featuring letters U and I in white

Guía del usuario de Document Understanding

Última actualización 24 de oct. de 2024

Extraer datos de formularios

Importante:

El objetivo de esta página es ayudar a los usuarios noveles a familiarizarse con Document Understanding.

Para las implementaciones de producción escalables, recomendamos especialmente usar el Proceso de Document Understanding disponible en UiPath Studio bajo la sección de plantillas.

Esta guía rápida te indica los pasos necesarios para extraer información de los formularios W-9 con el extractor inteligente de formularios. Los formularios W-9 se usan como ejemplo, pero el procedimiento es similar para otros tipos de documentos en los que los datos están estructurados.

Partiendo de cero, estos son los pasos que hay que seguir:

  1. Crea un proceso en blanco
  2. Instala los paquetes de actividades requeridos
  3. Crea una taxonomía
  4. Digitaliza el documento
  5. Extraer los datos mediante el extractor inteligente de formularios
  6. Valida los resultados mediante la estación de validación
  7. Exportar resultados de extracción

Ahora, veamos cada paso con detalle.

1. Crea un proceso en blanco

Inicia UiPath Studio.

En la vista Backstage de INICIO, haz clic en Proceso para crear un nuevo proyecto.

Se mostrará la ventana Nuevo proceso en blanco. En esta ventana, introduce un nombre para el nuevo proyecto. Si quieres, también puedes añadir una descripción para clasificar tus proyectos más fácilmente.

Haz clic en Crear. Se abrirá el nuevo proyecto en Studio.

2. Instala los paquetes de actividades requeridos

Desde el botón Gestionar paquetes de la cinta, además de los paquetes de actividades principales (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) que se añaden al proyecto de forma predeterminada, instala los siguientes paquetes de actividades:

3. Crea una taxonomía

Una vez instalados los paquetes, enumera los campos necesarios. Llevaremos a cabo la extracción de datos para los siguientes campos:

  • 1_Name: Text
  • 2_BusinessName: Text
  • 3a_Individual: Boolean
  • 3b_CCorp: Boolean
  • 3c_SCorp: Boolean
  • 3d_Partnership: Boolean
  • 3e_TrustEstate: Boolean
  • 3f_LLC: Boolean
  • 3f_LLCTaxClassification: Boolean
  • 3g_Other: Boolean
  • 3g_OtherDetail: Boolean
  • 5_Address: Text
  • 6_CityStateZip: Text
  • 7_AcctNumber: Text
  • TIN_SSN: Text
  • TIN_ETN: Text
  • Certification_Signature: Boolean
  • Certification_SignatureDate: Date

Abre el Gestor de taxonomía y crea un grupo llamado «Documentos estructurados», una categoría llamada «Formularios de préstamo» y un tipo de documento llamado «W-9». Crea los campos antes mencionados utilizando nombres fáciles de usar junto con sus respectivos tipos de datos.



4. Digitaliza el documento

En el archivo Main.xaml, añade la actividad Cargar taxonomía y crea una variable para la salida de la taxonomía.

Añade la actividad Digitalizar documento con UiPath Document OCR. Proporciona la propiedad de entrada Ruta del documento y crea variables de salida para Texto del documento y Modelo de objeto del documento.

No te olvides de añadir la clave API de Document Understanding en la actividad de UiPath Document OCR.

5. Extrae los datos mediante el extractor inteligente de formularios

Añade la actividad Ámbito de la extracción de información y rellena las propiedades.

Arrastra y suelta el extractor inteligente de formularios dentro de él. El punto final debe autopoblarse con el punto final del extractor inteligente de formularios, a saber https://du.uipath.com/svc/intelligentforms. Proporciona la clave API de Document Understanding.

Una vez hecho esto, para crear una nueva plantilla, haz clic en Administrar las plantillas > Crear plantilla. Se abre una ventana emergente.

En tipo de documento, selecciona el tipo de documento W-9 creado anteriormente.

En Nombre del documento, introduce un nombre para tu plantilla.

En Documento de plantilla (PDF nativo si es posible), adjunta un documento de plantilla en el que vayas a asignar las posiciones de campo.

En Motor de OCR, selecciona de nuevo UiPath Document OCR. Al igual que antes, el punto final debe autopoblarse, (https://du.uipath.com/ocr), y solo tienes que proporcionar la clave API.

Haz clic en Configurar para pasar al siguiente paso. Se abrirá la ventana emergente Administrador de plantillas.

Aquí tendremos que seleccionar las áreas en las que queremos que el extractor inteligente de formularios busque nuestros campos. Configúralos siguiendo los pasos detallados aquí. También tienes la opción de usar anclajes para tus campos. Obtén más información sobre los anclajes aquí.

Deberías terminar con algo como lo siguiente:



Haz clic en Guardar. En esta pantalla se pueden definir los campos de escritura a mano o de firma, en su caso. También puedes definir sinónimos para los campos booleanos. Cierra la ventana cuando hayas terminado.



El siguiente paso es configurar el extractor, es decir, hacer que el extractor inteligente de formularios procese todos los documentos de tipo W-9.



6. Valida los resultados mediante la estación de validación

Para comprobar los resultados a través de la estación de validación, arrastra y suelta la actividad Mostrar estación de validación y proporciona los detalles de entrada.



7. Exporta los resultados de la extracción

Para exportar los resultados de la extracción, validados o no, arrastra y suelta la actividad Exportar resultados de extracción al final de tu flujo de trabajo. Esto hace que los resultados se generen en DataSet, que contiene múltiples tablas que luego podrían escribirse en un archivo de Excel o usarse directamente en un proceso posterior.


Descargar ejemplo

Descarga este proyecto de ejemplo para ejecutar el W-9 con flujo de trabajo del Extractor inteligente de formularios a través de este enlace.

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White