Guía del usuario de Document Understanding

ENTREGA:

Automation Cloud Automation Cloud Public Sector Automation Suite Standalone

Última actualización 11 de nov. de 2024

Extractor con aprendizaje automático

El Extractor con aprendizaje automático es una herramienta de extracción de datos que utiliza modelos de aprendizaje automático con el fin de identificar e informar sobre los datos destinados a la extracción de datos.

Esta actividad es el complemento de los modelos de UiPath Document Understanding, como medio para consumir dichos modelos dentro de sus flujos de trabajo.

El enfoque del aprendizaje automático se recomienda especialmente para los documentos estructurados o semiestructurados en los que varían mucho los diseños de los distintos proveedores de documentos. Dado su enfoque de aprendizaje automático, el extractor utiliza un modelo de aprendizaje automático entrenado, que aprende y puede inferir valores para los campos objetivo, incluso a partir de documentos y diseños que nunca ha visto antes. Es decir, si los documentos no siguen un patrón de texto o diseño, el Extractor con aprendizaje automático puede ser una buena opción para tu caso de uso.

El modelo de aprendizaje automático puede utilizarse de diversas maneras:

con uno de los puntos finales públicos de UiPath Document Understanding, si deseas utilizar modelos genéricos dirigidos a determinados tipos de documentos o
con modelos de aprendizaje automático entrenados a medida a partir de los modelos disponibles de UiPath Document Understanding.

Este extractor se puede entrenar o reentrenar. Para obtener más información, consulta la sección Cómo entrenar.

Importante: Las imágenes con una resolución inferior a 50 x 50 píxeles no pueden procesarse, por lo que se genera un error.

Requisitos especiales

Debes utilizar:

uno de los puntos finales públicos de UiPath Document Understanding para la extracción de datos o
modelos de aprendizaje automático alojados en AI Center en Automation Cloud o
modelos de aprendizaje automático alojados en AI Center local, pero con licencia a través de Automation Cloud, en los que debes utilizar tu clave de API de Automation Cloud para Document Understanding.

Para utilizar el Extractor con aprendizaje automático bajo licencia local, debes alojar tus modelos de Document Understanding en tu instancia local de AI Center (instalación aislada).

Cómo configurar

Configuración de la actividad

Si el punto final que utilizas tiene licencia a través de Automation Cloud, debes facilitar tu clave API de Automation Cloud Document Understanding.

Si utilizas el Extractor con aprendizaje automático con un punto final público de UiPath Document Understanding o con una habilidad ML pública en AI Center, debes configurar el argumento del punto final de la actividad con la URL correspondiente.

Si utilizas el Extractor de aprendizaje automático con una habilidad ML implementada, debes configurar el argumento Habilidad ML de la actividad con la selección correcta de tu lista de habilidades ML alojadas en AI Center.

Si intentas establecer ambas opciones, se mostrará un error, ya sea en el asistente de configuración o directamente en el flujo de trabajo:

Configurar capacidades del extractor ML

La primera vez que se realiza una operación de soltar en un Ámbito de extracción de datos, el Extractor con aprendizaje automático abrirá un asistente de configuración. El mismo asistente está disponible si abres el asistente de Configurar extractores del Ámbito de extracción de datos y haces clic en el icono de configuración situado debajo del nombre del extractor.

El asistente permite introducir un Punto final o una Habilidad ML, así como proporcionar una ClaveAPI (si es necesario). Si introduces un Punto final y una ClaveAPI, debes introducirlos sin comillas, y los valores no pueden ser variables.

Si lo deseas, puedes utilizar la opción "Actualizar argumentos de la actividad" para rellenar previamente los argumentos de la actividad con los valores añadidos en el asistente.

Al hacer clic en la opción "Obtener capacidades", el Extractor con aprendizaje automático "leerá y notificará" sus capacidades internas (qué tipos de documentos y qué campos sabe procesar), con el fin de ayudarte a configurar correctamente la extracción de datos.

Se recomienda utilizar el asistente de Capacidades del extractor ML cada vez que se cambie la Habilidad ML o el Punto final utilizado en el flujo de trabajo, para garantizar así que la configuración y la asignación de taxonomía en el Ámbito de extracción de datos siguen siendo válidas.

Configurar el Extractor ML en el Ámbito de extracción de datos

Una vez ejecutado el asistente de Capacidades del extractor ML, observarás que el asistente Configurar extractores ya no muestra cuadros de texto para la asignación de taxonomía, sino listas desplegables.

Expande el tipo de documento para el que deseas extraer datos y comienza a seleccionar los campos de destino, marcando las casillas de verificación junto a los campos apropiados y seleccionando, de la lista desplegable disponible, el campo correcto del modelo ML que deseas asignar a cada campo concreto. La lista desplegable contiene todos los campos que el Extractor con aprendizaje automático, utilizando el punto final introducido en el asistente del Extractor con aprendizaje automático, declara como capacidad de extracción.

Para comprar si estás utilizando las capacidades del extractor puedes hacer clic en Obtener o actualizar las capacidades del extractor que abre el asistente del Extractor de aprendizaje automático.

Importante: No puedes elegir la misma opción para dos campos distintos.

Si deseas utilizar también las capacidades de entrenamiento del extractor, se recomienda encarecidamente introducir una cadena de caracteres alfanumérica única en el campo de configuración Alias del marco y, a continuación, utilizar exactamente el mismo valor de cadena en el campo Alias del marco correspondiente de la configuración de Entrenar el alcance de los extractores, para los entrenadores que necesiten recibir los datos de entrenamiento completos.

Selecciona el botón Guardar cuando todos los datos estén configurados correctamente.

Cómo entrenarlo

Utiliza la actividad Entrenador del extractor con aprendizaje automático dentro de un Ámbito de extractores de entrenamiento, para recopilar datos de entrenamiento para tu instancia del modelo del Extractor de aprendizaje automático. Los datos recopilados de este modo se pueden utilizar para su mejora y posterior importación con fines de entrenamiento, en tu instancia de AI Center (Cloud u On-Premises).

En esta página