- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Paquetes ML
- Procesos
- Administrador de documentos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Aprendizaje profundo
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Acerca de Document Manager
UiPath Document Manager es una aplicación web ligera que permite a los usuarios preparar, revisar y realizar correcciones en los conjuntos de datos necesarios para el entrenamiento y la evaluación de los modelos de aprendizaje automático de Document Understanding. Permite que varios usuarios realicen diversas operaciones:
- Define y configura los campos a extraer por un modelo ML.
- Importa documentos para el etiquetado.
- Preetiqueta los documentos con un modelo ML preexistente, como la extracción de facturas o la extracción de recibos proporcionados listos para usar por UiPath, o usando un modelo entrenado con AI Center.
- Etiqueta los documentos.
- Exporta los documentos en el formato previsto por los procesos de entrenamiento de AI Center.
La interfaz del administrador de documentos contiene los siguientes paneles:
Se muestra en la parte superior de la página en Administrador de documentos.
Permite realizar múltiples operaciones: navegar entre documentos, eliminar/restaurar un documento, buscar/filtrar documentos, ejecutar predicciones de modelos de IA, importar y exportar documentos.
Estos son los elementos disponibles en la barra de administración:
Elemento |
Icono |
Descripción |
---|---|---|
Navegación |
|
Permite navegar entre los documentos que coinciden con el filtro activo. Entre las dos flechas aparece un contador. Muestra el número del documento actual del total de documentos que coinciden con la búsqueda o filtro activos. |
Buscar |
|
Busca o filtra documentos. El filtro también se aplica al exportar documentos. También puedes filtrar por palabras de un documento o por nombres de documentos. |
Eliminar/Restaurar |
/ |
Elimina o restaura un documento. Los documentos eliminados se encuentran bajo el filtro de eliminados. |
Importar |
|
Abre el cuadro de diálogo Importar datos. |
Exportar |
|
Abre el cuadro de diálogo Exportar archivos. |
Nombre y tipo de documento |
N/D |
El nombre del documento actualmente activo y su tipo. Hay tres tipos de documentos:
Los documentos de entrenamiento y validación forman parte de los conjuntos de datos de entrenamiento utilizados por los Procesos de entrenamiento. Los Procesos de entrenamiento ignoran los documentos de evaluación que solo pueden ser utilizados por los Procesos de evaluación en AI Center. Estos documentos son los que se marcaron como evaluación seleccionando la casilla de verificación Marcar como conjunto de evaluación en el cuadro de diálogo Importar datos. |
Descargar |
|
La opción está disponible en el desplegable junto al nombre del documento. Haz clic en el icono para descargar un archivo Zip que contiene el documento original. Además del documento original, también se descargan todas las páginas convertidas internamente por el administrador de documentos en imágenes
.jpeg .
|
Eliminar de forma permanente |
|
La opción está disponible en el desplegable junto al nombre del documento. Borra permanentemente archivos individuales.
.pdf y todas sus imágenes .jpeg se eliminan del conjunto de datos de AI Center y todos los metadatos se eliminan de la base de datos.
Al hacer clic en el botón, se mostrará un mensaje emergente que te preguntará si quieres eliminar de forma definitiva el documento. Haz clic en Aceptar para continuar o Cancelar para volver a la pantalla anterior. |
Nombre de la sesión |
N/D |
El nombre de la sesión actual. |
Predecir |
|
Ejecutar las predicciones del modelo de IA y mostrar los resultados. Una vez se configure el preetiquetado, el botón se activa en la barra de administración. Haz clic en él para preetiquetar el documento actual.
|
Configuración |
|
Configura los ajustes de OCR y preetiquetado o accede al panel Tutorial. Consulta más detalles a continuación. |
El botón de configuración tiene dos opciones disponibles:
- Ajustes donde puedes configurar el servicio OCR o de Preetiquetado
- Tutorial, que sirve como menú de ayuda.
OCR
Para importar documentos en el administrador de documentos, es obligatorio configurar un servicio de OCR.
Las siguientes opciones están disponibles:
Método OCR
Las opciones basadas en la nube son las siguientes:
- UiPath Document OCR: https://du.uipath.com/ocr;
- Google Cloud Vision OCR, que tiene la mejor cobertura lingüística;
- Google Cloud Vision OCR para japonés, óptimo para leer documentos en japonés;
- Microsoft Read OCR.
URL del OCR
La configuración de OCR requiere que el servicio OCR disponga de una URL. Estas son las posibles URL que puedes usar:
- URL públicas como https://du.uipath.com/ocr o URL de terceros desde Google Vision OCR o Microsoft Read OCR
Clave OCR
La clave API correspondiente al motor de OCR seleccionado. Por ejemplo, para UiPath Document OCR, necesitas usar la Clave API de Document Understanding. Obligatorio para el administrador de documentos en la nube y el administrador de documentos local en línea. No es necesario para el administrador de documentos local aislado.
Preetiquetado
Si ya tienes un modelo que puedes extraer algunos campos que necesitan etiquetarse, y solo existen unos cuantos campos adicionales que requieren etiquetado manual, puedes ahorrar mucho tiempo utilizando la función de preetiquetado del administrador de documentos.
Las siguientes opciones están disponibles:
URL de preetiquetado
El preetiquetado requiere que el modelo ML tenga una URL. Estas son las posibles URL que puedes usar:
- URL públicas como https://du.uipath.com/ie/invoices o https://du.uipath.com/ie/purchase_orders
- Consulta la lista completa de puntos finales aquí
- URL de las habilidades ML que han sido hechas públicas en AI Center local o en AI Center en la nube.
Clave de preetiquetado
La Clave API de Document Understanding. Obligatorio para el administrador de documentos en la nube y el administrador de documentos local en línea. No es necesario para el administrador de documentos local aislado.
Información sobre...
Con la opción Tutorial accedes al menú de ayuda del administrador de documentos.
Aquí puedes encontrar lo siguiente:
- La versión del administrador de documentos
- El enlace Documentación que lleva a esta página de documentación.
- La sección Controles de etiquetado que muestra los controles que se usarán al manejar los datos.
- La sección Atajos de documentos que muestra los accesos directos usados para realizar diversas operaciones como la navegación y el escalado de la interfaz de usuario.
- La sección Configuración que muestra los detalles de la configuración de la instancia realizada durante la instalación.
Los campos de columna tienen las siguientes opciones:
- Crear un campo de columna nuevo
- Editar campo
- Expandir/Contraer los valores de campo de columna
- Para obtener más detalles sobre los campos de columna, vista esta sección.
Los campos regulares tienen las siguientes opciones:
- Crear un campo regular nuevo
- Editar campo
- Para obtener más detalles sobre los campos regulares, visita esta sección.
Los campos de clasificación tienen las siguientes opciones:
- Crear un campo de clasificación nuevo
- Editar campo
- Para obtener más detalles sobre los campos de clasificación, visita esta sección.
Ctrl
a la vez que desplazas el ratón.
Puedes etiquetar los documentos seleccionando los recuadros de palabras y asignándolas a un campo con una tecla. También puedes hacer clic con el botón derecho en el recuadro de palabras y verificar la información extraída.
- Para obtener más detalles sobre cómo etiquetar documentos, visita esta página.
Cuando se abre una nueva sesión del administrador de documentos o cuando se tiene un filtro vacío, se muestran ciertas directrices en la vista del documento:
Además, los fallos de carga también se muestran en la vista de documentos: