- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Extraer datos de recibos
- Facturas reordenadas con un campo adicional
- Extraer datos de formularios
- Componentes de marco
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador de CapturaFlexible
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Actividades relacionadas con la clasificación de documentos
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 4506T: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Aprendizaje profundo
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Licencia
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Extraer datos de formularios
El objetivo de esta página es ayudar a los usuarios primerizos a familiarizarse con Document UnderstandingTM.
For scalable production deployments, we strongly recommend using the Document Understanding Process available in UiPath® Studio under the Templates section.
Esta guía rápida te indica los pasos necesarios para extraer información de los formularios W-9 con el extractor inteligente de formularios. Los formularios W-9 se usan como ejemplo, pero el procedimiento es similar para otros tipos de documentos en los que los datos están estructurados.
Partiendo de cero, estos son los pasos que hay que seguir:
- Crea un proceso en blanco
- Instala los paquetes de actividades requeridos
- Crea una taxonomía
- Digitaliza el documento
- Extraer los datos mediante el extractor inteligente de formularios
- Valida los resultados mediante la estación de validación
- Exportar resultados de extracción
Ahora, veamos cada paso con detalle.
Inicia UiPath Studio.
En la vista Backstage de INICIO, haz clic en Proceso para crear un nuevo proyecto.
Se mostrará la ventana Nuevo proceso en blanco. En esta ventana, introduce un nombre para el nuevo proyecto. Si quieres, también puedes añadir una descripción para clasificar tus proyectos más fácilmente.
Haz clic en Crear. Se abrirá el nuevo proyecto en Studio.
Desde el botón Gestionar paquetes de la cinta, además de los paquetes de actividades principales (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) que se añaden al proyecto de forma predeterminada, instala los siguientes paquetes de actividades:
Una vez instalados los paquetes, enumera los campos necesarios. Llevaremos a cabo la extracción de datos para los siguientes campos:
- 1_Name:
Text
- 2_BusinessName:
Text
- 3a_Individual:
Boolean
- 3b_CCorp:
Boolean
- 3c_SCorp:
Boolean
- 3d_Partnership:
Boolean
- 3e_TrustEstate:
Boolean
- 3f_LLC:
Boolean
- 3f_LLCTaxClassification:
Boolean
- 3g_Other:
Boolean
- 3g_OtherDetail:
Boolean
- 5_Address:
Text
- 6_CityStateZip:
Text
- 7_AcctNumber:
Text
- TIN_SSN:
Text
- TIN_ETN:
Text
- Certification_Signature:
Boolean
- Certification_SignatureDate:
Date
Abre el Gestor de taxonomía y crea un grupo llamado Documentos semiestructurados, una categoría llamada Formularios de préstamo y un tipo de documento llamado W-9. Crea los campos antes mencionados utilizando nombres fáciles de usar junto con sus respectivos tipos de datos.
En el archivo Main.xaml, añade la actividad Cargar taxonomía y crea una variable para la salida de la taxonomía.
Añade la actividad Digitalizar documento con UiPath Document OCR. Proporciona la propiedad de entrada Ruta del documento y crea variables de salida para Texto del documento y Modelo de objeto del documento.
No te olvides de añadir la clave API de Document Understanding en la actividad de UiPath Document OCR.
Añade la actividad Ámbito de la extracción de información y rellena las propiedades.
Arrastra y suelta el extractor inteligente de formularios dentro de él. El punto final debe autopoblarse con el punto final del extractor inteligente de formularios, a saber https://du.uipath.com/svc/intelligentforms. Proporciona la clave API de Document Understanding.
Una vez hecho esto, para crear una nueva plantilla, haz clic en Administrar las plantillas > Crear plantilla. Se abre una ventana emergente.
En tipo de documento, selecciona el tipo de documento W-9 creado anteriormente.
En Nombre del documento, introduce un nombre para tu plantilla.
En Documento de plantilla (PDF nativo si es posible), adjunta un documento de plantilla en el que vayas a asignar las posiciones de campo.
En Motor de OCR, selecciona de nuevo UiPath Document OCR. Al igual que antes, el punto final debe autopoblarse, (https://du.uipath.com/ocr), y solo tienes que proporcionar la clave API.
Haz clic en Configurar para pasar al siguiente paso. Se abrirá la ventana emergente Administrador de plantillas.
Aquí tendremos que seleccionar las áreas en las que queremos que el extractor inteligente de formularios busque nuestros campos. Configúralos siguiendo los pasos detallados aquí. También tienes la opción de usar anclajes para tus campos. Obtén más información sobre los anclajes aquí.
Deberías terminar con algo como lo siguiente:
Haz clic en Guardar. En esta pantalla se pueden definir los campos de escritura a mano o de firma, en su caso. También puedes definir sinónimos para los campos booleanos. Cierra la ventana cuando hayas terminado.
El siguiente paso es configurar el extractor, es decir, hacer que el extractor inteligente de formularios procese todos los documentos de tipo W-9.
Para comprobar los resultados a través de la estación de validación, arrastra y suelta la actividad Mostrar estación de validación y proporciona los detalles de entrada.
DataSet
, que contiene múltiples tablas que luego podrían escribirse en un archivo de Excel o usarse directamente en un proceso posterior.
Descarga este proyecto de ejemplo para ejecutar el W-9 con flujo de trabajo del Extractor inteligente de formularios a través de este enlace.
- 1. Crea un proceso en blanco
- 2. Instala los paquetes de actividades requeridos
- 3. Crea una taxonomía
- 4. Digitaliza el documento
- 5. Extrae los datos mediante el extractor inteligente de formularios
- 6. Valida los resultados mediante la estación de validación
- 7. Exporta los resultados de la extracción
- Descargar ejemplo