- Primeros pasos
- Componentes de marco
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador inteligente de palabra clave
- Clasificador de CapturaFlexible
- Clasificador de aprendizaje automático
- Actividades relacionadas con la clasificación de documentos
- Paquetes ML
- Procesos
- Gestor de datos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Aprendizaje profundo
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Extractor con aprendizaje automático
El Extractor con aprendizaje automático es una herramienta de extracción de datos que utiliza modelos de aprendizaje automático con el fin de identificar e informar sobre los datos destinados a la extracción de datos.
Esta actividad es el complemento de los modelos de UiPath Document Understanding, como medio para consumir dichos modelos dentro de sus flujos de trabajo.
El enfoque del aprendizaje automático se recomienda especialmente para los documentos estructurados o semiestructurados en los que varían mucho los diseños de los distintos proveedores de documentos. Dado su enfoque de aprendizaje automático, el extractor utiliza un modelo de aprendizaje automático entrenado, que aprende y puede inferir valores para los campos objetivo, incluso a partir de documentos y diseños que nunca ha visto antes. Es decir, si los documentos no siguen un patrón de texto o diseño, el Extractor con aprendizaje automático puede ser una buena opción para tu caso de uso.
El modelo de aprendizaje automático puede utilizarse de diversas maneras:
- con uno de los puntos finales públicos de UiPath Document Understanding, si deseas utilizar modelos genéricos dirigidos a determinados tipos de documentos o
- con modelos de aprendizaje automático entrenados a medida a partir de los modelos disponibles de UiPath Document Understanding.
Este extractor se puede entrenar o reentrenar. Para obtener más información, consulta la sección Cómo entrenar.
Debes utilizar:
- uno de los puntos finales públicos de UiPath Document Understanding para la extracción de datos o
- modelos de aprendizaje automático alojados en AI Center en Automation Cloud o
- modelos de aprendizaje automático alojados en AI Center local, pero con licencia a través de Automation Cloud, en los que debes utilizar tu clave de API de Automation Cloud para Document Understanding.
Para utilizar el Extractor con aprendizaje automático bajo licencia local, debes alojar tus modelos de Document Understanding en tu instancia local de AI Center (instalación aislada).
Si el punto final que utilizas tiene licencia a través de Automation Cloud, debes facilitar tu clave API de Automation Cloud Document Understanding.
Si utilizas el Extractor con aprendizaje automático con un punto final público de UiPath Document Understanding o con una habilidad ML pública en AI Center, debes configurar el argumento del punto final de la actividad con la URL correspondiente.
Si utilizas el Extractor de aprendizaje automático con una habilidad ML implementada, debes configurar el argumento Habilidad ML de la actividad con la selección correcta de tu lista de habilidades ML alojadas en AI Center.
Si intentas establecer ambas opciones, se mostrará un error, ya sea en el asistente de configuración o directamente en el flujo de trabajo:
La primera vez que se realiza una operación de soltar en un Ámbito de extracción de datos, el Extractor con aprendizaje automático abrirá un asistente de configuración. El mismo asistente está disponible si abres el asistente de Configurar extractores del Ámbito de extracción de datos y haces clic en el icono de configuración situado debajo del nombre del extractor.
El asistente permite introducir un Punto final o una Habilidad ML, así como proporcionar una ClaveAPI (si es necesario). Si introduces un Punto final y una ClaveAPI, debes introducirlos sin comillas, y los valores no pueden ser variables.
Si lo deseas, puedes utilizar la opción "Actualizar argumentos de la actividad" para rellenar previamente los argumentos de la actividad con los valores añadidos en el asistente.
Al hacer clic en la opción "Obtener capacidades", el Extractor con aprendizaje automático "leerá y notificará" sus capacidades internas (qué tipos de documentos y qué campos sabe procesar), con el fin de ayudarte a configurar correctamente la extracción de datos.
Se recomienda utilizar el asistente de Capacidades del extractor ML cada vez que se cambie la Habilidad ML o el Punto final utilizado en el flujo de trabajo, para garantizar así que la configuración y la asignación de taxonomía en el Ámbito de extracción de datos siguen siendo válidas.
Una vez ejecutado el asistente de Capacidades del extractor ML, observarás que el asistente Configurar extractores ya no muestra cuadros de texto para la asignación de taxonomía, sino listas desplegables.
Expande el tipo de documento para el que deseas extraer datos y comienza a seleccionar los campos de destino, marcando las casillas de verificación junto a los campos apropiados y seleccionando, de la lista desplegable disponible, el campo correcto del modelo ML que deseas asignar a cada campo concreto. La lista desplegable contiene todos los campos que el Extractor con aprendizaje automático, utilizando el punto final introducido en el asistente del Extractor con aprendizaje automático, declara como capacidad de extracción.
Para comprar si estás utilizando las capacidades del extractor puedes hacer clic en Obtener o actualizar las capacidades del extractor que abre el asistente del Extractor de aprendizaje automático.
Si deseas utilizar también las capacidades de entrenamiento del extractor, se recomienda encarecidamente introducir una cadena de caracteres alfanumérica única en el campo de configuración Alias del marco y, a continuación, utilizar exactamente el mismo valor de cadena en el campo Alias del marco correspondiente de la configuración de Entrenar el alcance de los extractores, para los entrenadores que necesiten recibir los datos de entrenamiento completos.
Selecciona el botón Guardar cuando todos los datos estén configurados correctamente.
Utiliza la actividad Entrenador del extractor con aprendizaje automático dentro de un Ámbito de extractores de entrenamiento, para recopilar datos de entrenamiento para tu instancia del modelo del Extractor de aprendizaje automático. Los datos recopilados de este modo se pueden utilizar para su mejora y posterior importación con fines de entrenamiento, en tu instancia de AI Center (Cloud u On-Premises).