- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Extraer datos de recibos
- Facturas reordenadas con un campo adicional
- Extraer datos de formularios
- Componentes de marco
- Paquetes ML
- Procesos
- Administrador de documentos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Aprendizaje profundo
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Extraer datos de recibos
El objetivo de esta página es ayudar a los usuarios noveles a familiarizarse con Document Understanding.
Para las implementaciones de producción escalables, recomendamos especialmente usar el Proceso de Document Understanding disponible en UiPath Studio bajo la sección de plantillas.
Esta guía rápida te muestra cómo extraer datos de los recibos con el modelo ML de recibos listo para usar con su correspondiente punto final público.
La validación puede realizarse presentando la estación de validación o con la acción de validación en Action Center. Ambas opciones se describen en las siguientes secciones.
En esta sección, vamos a validar los resultados de la extracción con la estación de validación.
Para crear un flujo de trabajo básico con el modelo ML de recibos, sigue los siguientes pasos.
- Crea un proceso en blanco
- Instala los paquetes de actividades requeridos
- Crea una taxonomía
- Digitaliza el documento
- Extrae los datos con el modelo ML de recibos
- Valida los resultados mediante la estación de validación
- Exporta los resultados de extracción
Ahora, veamos cada paso con detalle.
Inicia UiPath Studio.
En la vista Backstage de INICIO, haz clic en Proceso para crear un nuevo proyecto.
Se mostrará la ventana Nuevo proceso en blanco. En esta ventana, introduce un nombre para el nuevo proyecto. Si quieres, también puedes añadir una descripción para clasificar tus proyectos más fácilmente.
Haz clic en Crear. Se abrirá el nuevo proyecto en Studio.
Desde el botón Gestionar paquetes de la cinta, además de los paquetes de actividades principales (UiPath.Excel.Activities, UiPath.Mail.Activities, UiPath.System.Activities, UiPath.UIAutomation.Activities) que se añaden al proyecto de forma predeterminada, instala los siguientes paquetes de actividades:
Una vez estén instalados los paquetes de actividades, enumera los campos requeridos. El modelo ML de recibos admite la extracción de datos para los siguientes campos:
- nombre:
Text
- dirección del proveedor:
Address
- total:
Number
- fecha:
Date
- teléfono:
Text
- moneda:
Text
- tipo de gasto:
Text
-
elementos:
Table
- descripción:
Text
- importe de línea:
Number
- precio unitario:
Number
- cantidad:
Number
- descripción:
Abre el Gestor de taxonomía y crea un grupo llamado «Documentos semiestructurados», una categoría llamada «Finanzas» y un tipo de documento llamado «Recibos». Crea los campos antes mencionados utilizando nombres sencillos junto con sus respectivos tipos de datos.
En el archivo Main.xaml, añade la actividad Cargar taxonomía y crea una variable para la salida de la taxonomía.
Añade la actividad Digitalizar documento con UiPath Document OCR. Proporciona la propiedad de entrada Ruta del documento y crea variables de salida para Texto del documento y Modelo de objeto del documento.
No te olvides de añadir la clave API de Document Understanding en la actividad de UiPath Document OCR.
Añade la actividad Ámbito de la extracción de información y rellena las propiedades.
Arrastra y suelta una actividad del Extractor de aprendizaje automático. En la pantalla aparece una ventana emergente con tres parámetros de entrada, Punto final, habilidad ML y Clave API.
Rellena el parámetro Punto final con el punto final público de los recibos, es decir, https://du.uipath.com/ie/receipts, y proporciona la clave API de Document Understanding.
Haz clic en Obtener capacidades.
El siguiente paso es configurar el extractor. Para configurar el extractor hay que asignar los campos que has creado en el Gestor de taxonomía a los campos disponibles en el modelo ML, como se muestra en la siguiente imagen:
Para usar el extractor de aprendizaje automático con una habilidad ML, elige la habilidad ML del menú desplegable y configura el extractor.
Debes tener el asistente de tu UiPath Robot conectado al mismo tenant que tu habilidad ML.
Para comprobar los resultados a través de la estación de validación, arrastra y suelta la actividad Mostrar estación de validación y proporciona los detalles de entrada.
DataSet
, que contiene múltiples tablas que luego podrían escribirse en un archivo de Excel o usarse directamente en un proceso posterior.
Descarga este proyecto de muestra utilizando este enlace.
El ejemplo contiene dos flujos de trabajo:
- Main.xaml: en este flujo de trabajo, los resultados de la extracción se validan mediante la estación de validación, tal y como se describe en la sección anterior.
- Main - Unattended.xaml: en este flujo de trabajo, los resultados de la extracción se validan mediante la acción de validación, tal y como se describe en la siguiente sección.
Ahora, vamos a ver cómo usar una acción de validación de Action Center en lugar de presentar la estación de validación.
Cuando una automatización incluye decisiones que debería tomar un humano, como aprobaciones, escalamientos y excepciones, UiPath Action Center hace que sea fácil y eficiente pasar el proceso del robot al humano. Y viceversa.
Las actividades de Action Center de Document Understanding incluyen el paquete UiPath.IntelligentOCR.Activities y el paquete UiPath.Persistance.Activities. No olvides habilitar las actividades de Persistencia desde la configuración general en UiPath Studio:
Se puede aumentar la productividad añadiendo un proceso de orquestación que añada acciones de validación de documentos en Action Center, tanto en On-Premises Orchestrator como en Automation Cloud. Esta acción reduce la necesidad de almacenar los documentos localmente, tener un robot instalado en cada máquina operada por personas o hacer que el robot espere a que los usuarios terminen la validación.
Más detalles aquí.
Repite los pasos 1 a 5 descritos en la sección anterior.
Entonces, en lugar de usar la actividad Mostrar estación de validación, usa las actividades Crear acción de validación de documentos y Esperar la acción de validación de documentos y reanudar.
La siguiente imagen muestra la actividad Crear acción de validación de documentos y sus propiedades.
Esto crea una acción de validación de documentos en Action Center. El resultado de la actividad Crear acción de validación de documentos puede utilizarse con la actividad Esperar la acción de validación de documentos y reanudar para suspender y reanudar los flujos de trabajo de orquestación tras la finalización de la acción humana en Action Center.
- Uso del modelo ML de recibos con el punto final público y estación de validación
- 1. Crea un proceso en blanco
- 2. Instala los paquetes de actividades requeridos
- 3. Crea una taxonomía
- 4. Digitaliza el documento
- 5. Extrae los datos con el modelo ML de recibos
- 6. Valida los resultados mediante la estación de validación
- 7. Exporta los resultados de la extracción
- Descargar ejemplo
- Uso del modelo ML de recibos con punto final público y acción de validación
- ¿Cómo funcionan las tareas en Action Center?
- ¿Cómo funciona la acción de validación?
- ¿Cómo se usa la acción de validación?