- Extraer datos de recibos
- Facturas reordenadas con un campo adicional
- Extraer datos de formularios
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Resumen de la clasificación de documentos
- Actividades relacionadas con la clasificación de documentos
- Clasificador de CapturaFlexible
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 4506T: paquete ML
- - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación - Paquete ML
- Certificado de origen - Paquete ML
- Cheques: paquete ML
- Certificado de producto secundario - Paquete ML
- CMS 1500: paquete ML
- Declaración de conformidad UE - Paquete ML
- Estados financieros: paquete ML
- FM1003: Paquete ML: vista previa
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas - Paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Recibos de pago: paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Idiomas admitidos
- Requisitos de hardware
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Extraer datos de formularios
El objetivo de esta página es ayudar a los usuarios noveles a familiarizarse con Document Understanding.
Para las implementaciones de producción escalables, recomendamos especialmente usar el Proceso de Document Understanding disponible en UiPath Studio bajo la sección de plantillas.
Esta guía rápida te indica los pasos necesarios para extraer información de los formularios W-9 con el extractor inteligente de formularios. Los formularios W-9 se usan como ejemplo, pero el procedimiento es similar para otros tipos de documentos en los que los datos están estructurados.
Partiendo de cero, estos son los pasos que hay que seguir:
- Crea un proceso en blanco
- Instala los paquetes de actividades requeridos
- Crea una taxonomía
- Digitaliza el documento
- Extraer los datos mediante el extractor inteligente de formularios
- Valida los resultados mediante la estación de validación
- Exportar resultados de extracción
Ahora, veamos cada paso con detalle.
1. Crea un proceso en blanco
Inicia UiPath Studio.
En la vista Backstage de INICIO, haz clic en Proceso para crear un nuevo proyecto.
Se mostrará la ventana Nuevo proceso en blanco. En esta ventana, introduce un nombre para el nuevo proyecto. Si quieres, también puedes añadir una descripción para clasificar tus proyectos más fácilmente.
Haz clic en Crear. Se abrirá el nuevo proyecto en Studio.
2. Instala los paquetes de actividades requeridos
Desde el botón Gestionar paquetes de la cinta, además de los paquetes de actividades principales (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) que se añaden al proyecto de forma predeterminada, instala los siguientes paquetes de actividades:
3. Crea una taxonomía
Una vez instalados los paquetes, enumera los campos necesarios. Llevaremos a cabo la extracción de datos para los siguientes campos:
- 1_Name:
Text
- 2_BusinessName:
Text
- 3a_Individual:
Boolean
- 3b_CCorp:
Boolean
- 3c_SCorp:
Boolean
- 3d_Partnership:
Boolean
- 3e_TrustEstate:
Boolean
- 3f_LLC:
Boolean
- 3f_LLCTaxClassification:
Boolean
- 3g_Other:
Boolean
- 3g_OtherDetail:
Boolean
- 5_Address:
Text
- 6_CityStateZip:
Text
- 7_AcctNumber:
Text
- TIN_SSN:
Text
- TIN_ETN:
Text
- Certification_Signature:
Boolean
- Certification_SignatureDate:
Date
Abre el Gestor de taxonomía y crea un grupo llamado Documentos semiestructurados, una categoría llamada Formularios de préstamo y un tipo de documento llamado W-9. Crea los campos antes mencionados utilizando nombres fáciles de usar junto con sus respectivos tipos de datos.
4. Digitaliza el documento
En el archivo Main.xaml, añade la actividad Cargar taxonomía y crea una variable para la salida de la taxonomía.
Añade la actividad Digitalizar documento con UiPath Document OCR. Proporciona la propiedad de entrada Ruta del documento y crea variables de salida para Texto del documento y Modelo de objeto del documento.
No te olvides de añadir la clave API de Document Understanding en la actividad de UiPath Document OCR.
5. Extrae los datos mediante el extractor inteligente de formularios
Añade la actividad Ámbito de la extracción de información y rellena las propiedades.
Arrastra y suelta el extractor inteligente de formularios dentro de él. El punto final debe autopoblarse con el punto final del extractor inteligente de formularios, a saber https://du.uipath.com/svc/intelligentforms. Proporciona la clave API de Document Understanding.
Una vez hecho esto, para crear una nueva plantilla, haz clic en Administrar las plantillas > Crear plantilla. Se abre una ventana emergente.
En tipo de documento, selecciona el tipo de documento W-9 creado anteriormente.
En Nombre del documento, introduce un nombre para tu plantilla.
En Documento de plantilla (PDF nativo si es posible), adjunta un documento de plantilla en el que vayas a asignar las posiciones de campo.
En Motor de OCR, selecciona de nuevo UiPath Document OCR. Al igual que antes, el punto final debe autopoblarse, (https://du.uipath.com/ocr), y solo tienes que proporcionar la clave API.
Haz clic en Configurar para pasar al siguiente paso. Se abrirá la ventana emergente Administrador de plantillas.
Aquí tendremos que seleccionar las áreas en las que queremos que el extractor inteligente de formularios busque nuestros campos. Configúralos siguiendo los pasos detallados aquí. También tienes la opción de usar anclajes para tus campos. Obtén más información sobre los anclajes aquí.
Deberías terminar con algo como lo siguiente:
Haz clic en Guardar. En esta pantalla se pueden definir los campos de escritura a mano o de firma, en su caso. También puedes definir sinónimos para los campos booleanos. Cierra la ventana cuando hayas terminado.
El siguiente paso es configurar el extractor, es decir, hacer que el extractor inteligente de formularios procese todos los documentos de tipo W-9.
6. Valida los resultados mediante la estación de validación
Para comprobar los resultados a través de la estación de validación, arrastra y suelta la actividad Mostrar estación de validación y proporciona los detalles de entrada.
7. Exporta los resultados de la extracción
Para exportar los resultados de la extracción, validados o no, arrastra y suelta la actividad Exportar resultados de extracción al final de tu flujo de trabajo. Esto hace que los resultados se generen en DataSet
, que contiene múltiples tablas que luego podrían escribirse en un archivo de Excel o usarse directamente en un proceso posterior.
Descargar ejemplo
Descarga este proyecto de ejemplo para ejecutar el W-9 con flujo de trabajo del Extractor inteligente de formularios a través de este enlace.
- 1. Crea un proceso en blanco
- 2. Instala los paquetes de actividades requeridos
- 3. Crea una taxonomía
- 4. Digitaliza el documento
- 5. Extrae los datos mediante el extractor inteligente de formularios
- 6. Valida los resultados mediante la estación de validación
- 7. Exporta los resultados de la extracción
- Descargar ejemplo