- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Paquetes ML
- Procesos
- Gestor de datos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Acerca de Data Manager
UiPath Document Manager es una aplicación web ligera que permite a los usuarios preparar, revisar y realizar correcciones en los conjuntos de datos necesarios para el entrenamiento y la evaluación de los modelos de aprendizaje automático de Document Understanding.
Estos son los métodos de implementación local:
- Data Manager en AI Center On Premises. En general, esta opción está disponible y es totalmente compatible con los escenarios de producción. No existe limitación alguna en cuanto al tamaño de los conjuntos de datos que pueden importarse, a excepción del Reentrenamiento automático, que sigue teniendo el límite de 2000 páginas o 2 GB por importación. Para conocer todos los métodos de implementación de AI Center disponibles para uso local, consulta esta página.
Data Manager permite a varios usuarios realizar diversas operaciones relacionadas con la gestión de lotes de datos, la preparación de datos y la configuración de modelos:
Define y configura los campos a extraer por un modelo ML.
Importa documentos para el etiquetado.
Preetiqueta los documentos con un modelo ML preexistente, como la extracción de facturas o la extracción de recibos proporcionados listos para usar por UiPath, o usando un modelo entrenado con AI Center.
Etiqueta los documentos.
Exporta los documentos en el formato previsto por los procesos de entrenamiento de AI Center.
La interfaz de Data Manager contiene los siguientes paneles:
Aparece en la parte superior de la página en Data Manager.
Permite realizar múltiples operaciones: navegar entre documentos, eliminar/restaurar un documento, buscar/filtrar documentos, ejecutar predicciones de modelos de IA, importar y exportar documentos.
Aquí tienes las opciones disponibles en la barra de gestión:
Opción |
Icono |
Descripción |
---|---|---|
Navegación |
|
Permite navegar entre los documentos que coinciden con el filtro activo. Entre las dos flechas aparece un contador. Muestra el número del documento actual del total de documentos que coinciden con la búsqueda o filtro activos. |
|
Busca o filtra documentos. El filtro también se aplica al exportar documentos. También puedes filtrar por palabras de un documento o por nombres de documentos. | |
Eliminar/Restaurar |
/ |
Elimina o restaura un documento. Los documentos eliminados se encuentran bajo el filtro de eliminados. |
Predecir |
|
Ejecutar las predicciones del modelo de IA y mostrar los resultados. Una vez se configure el preetiquetado, el botón se activa en la barra de administración. Haz clic en él para preetiquetar el documento actual. Por el momento, al utilizar la opción Predecir con Puntos finales públicos solo se preetiquetan las 10 primeras páginas de un documento. Este es un problema conocido y se está buscando una solución. Sin embargo, el uso de la opción Predecir con Habilidades ML en AI Center no impone tal limitación. |
|
Abre el cuadro de diálogo Importar datos. | |
|
Abre el cuadro de diálogo Exportar archivos. | |
|
Haz clic en el icono para descargar un archivo Zip que contenga el documento original. | |
|
Configura los ajustes de OCR y preetiquetado o accede al panel Tutorial. Ver a continuación. |
Descargar
.jpeg
.
Nombre del documento, tipo y nombre de la sesión
A la derecha del icono, puedes ver el nombre del documento activo en ese momento, su tipo y el nombre de la sesión.
Hay tres tipos de documentos:
- Documento de formación
- Documento de validación
- Documento de evaluación
Los documentos de entrenamiento y validación forman parte de los conjuntos de datos de entrenamiento utilizados por los Procesos de entrenamiento.
Los Procesos de entrenamiento ignoran los documentos de evaluación que solo pueden ser utilizados por los Procesos de evaluación en AI Center. Estos documentos son los que fueron marcados como evaluación al seleccionar la casilla Hacer de este un conjunto de evaluación en el cuadro de diálogo Importar datos.
Configuración
El botón de configuración tiene dos opciones disponibles:
- Ajustes donde puedes configurar el servicio OCR o de Preetiquetado
- Tutorial, que sirve como menú de ayuda.
OCR
Para importar documentos en Data Manager, es obligatorio configurar un servicio de OCR.
Las siguientes opciones están disponibles:
La elección del motor OCR que se utilizará para importar documentos en Data Manager es una decisión fundamental.
Se recomienda usar el mismo OCR para importar los datos de entrenamiento (tiempo de entrenamiento) que el que se utilizará cuando se implemente el modelo (tiempo de ejecución).
Lo ideal es que pruebes unos cuantos para ver cuál funciona mejor en tus documentos, y solo entonces tomar la decisión.
Las opciones en las instalaciones son las siguientes:
- Contenedor UiPath OCR que admite los principales idiomas de Europa Occidental;
- El contenedor Microsoft Read (disponible como vista previa de Microsoft) también tiene una buena cobertura lingüística;
- Habilidades ML de OCR UiPath implementadas en AI Center local v2020.10 o posterior.
Las opciones basadas en la nube son las siguientes:
- UiPath Document OCR: https://du.uipath.com/ocr;
- Google Cloud Vision OCR, que tiene la mejor cobertura lingüística;
- Google Cloud Vision OCR para japonés, óptimo para leer documentos en japonés;
- Microsoft Read OCR.
La configuración de OCR requiere que el servicio OCR disponga de una URL. Estas son las posibles URL que puedes usar:
- URL públicas como https://du.uipath.com/ocr o URL de terceros desde Google Vision OCR o Microsoft Read OCR
- Las URL del UiPath Document OCR independiente son proporcionadas por el UiPath implementado en las instalaciones
-
Las URL del paquete ML de OCR implementadas como Habilidades ML que se han hecho públicas en la versión 2020.10 de AI Center On-Premises o superior
Importante:Si estás ejecutando el OCR en la misma máquina que Data Manager, entonces no utiliceslocalhost
para referirte a la máquina local. pero mejor usa la dirección IP o el nombre de dominio de la máquina local.En el caso de las URL de OCR implementadas como habilidad ML pública en AI Center local, usa la URL tal y como aparece en la pantalla de detalles de la habilidad ML de AI Center.
La clave API correspondiente al motor de OCR seleccionado. Por ejemplo, para UiPath Document OCR, necesitas usar la Clave API de Document Understanding. Obligatorio para Data Manager en la nube y Data Manager local en línea. No es necesario para Data Manager local aislado.
Preetiquetado
Si ya tienes un modelo que puede extraer algunos campos que necesitan etiquetarse, y solo existen unos cuantos campos adicionales que requieren etiquetado manual, puedes ahorrar mucho tiempo utilizando la función de preetiquetado de Data Manager.
Las siguientes opciones están disponibles:
El preetiquetado requiere que el modelo ML tenga una URL. Estas son las posibles URL que puedes usar:
- URL públicas como https://du.uipath.com/ie/invoices o https://du.uipath.com/ie/purchase_orders
- Consulta la lista completa de puntos finales aquí
- URL de las habilidades ML que han sido hechas públicas en AI Center local o en AI Center en la nube.
Las Habilidades ML en AI Center On-Premises implementadas en entornos aislados no pueden utilizarse para el preetiquetado.
localhost
para referirte a la máquina local; es mejor que utilices la dirección IP o el nombre de dominio de la máquina local.
En el caso de las URL de las habilidades ML públicas en AI Center local, usa la URL tal y como aparece en la pantalla de detalles de la habilidad ML de AI Center.
La Clave API de Document Understanding. Obligatorio para Data Manager en la nube y Data Manager local en línea. No es necesario para Data Manager local aislado.
Información sobre...
Con la opción Tutorial se accede al menú de ayuda de Data Manager.
Aquí puedes encontrar lo siguiente:
- La versión de Data Manager
- El enlace Documentación que lleva a esta página de documentación.
- La sección Controles de etiquetado que muestra los controles que se usarán al manejar los datos.
- La sección Atajos de documentos que muestra los accesos directos usados para realizar diversas operaciones como la navegación y el escalado de la interfaz de usuario.
- La sección Configuración que muestra los detalles de la configuración de la instancia realizada durante la instalación.
Los campos de columna tienen las siguientes opciones:
- Crear un campo de columna nuevo
- Editar campo
- Expandir/Contraer los valores de campo de columna
Para obtener más detalles sobre los campos de columna, vista esta sección.
Los campos regulares tienen las siguientes opciones:
- Crear un campo regular nuevo
- Editar campo
Para obtener más detalles sobre los campos regulares, visita esta sección.
Los campos de clasificación tienen las siguientes opciones:
- Crear un campo de clasificación nuevo
- Editar campo
Para obtener más detalles sobre los campos de clasificación, visita esta sección.
Ctrl
a la vez que desplazas el ratón.
Puedes etiquetar los documentos seleccionando los recuadros de palabras y asignándolas a un campo con una tecla. También puedes hacer clic con el botón derecho en el recuadro de palabras y verificar la información extraída.
Para obtener más detalles sobre cómo etiquetar documentos, visita esta página.
Al abrir una nueva sesión de Data Manager, o cuando tengas un filtro vacío, algunas directrices se mostrarán en la vista de documento:
Además, los fallos de carga también se muestran en la vista de documentos: