document-understanding
2022.10
false
Guía del usuario de Document Understanding
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 4 de sep. de 2024

Acerca de Document Manager

UiPath Document Manager es una aplicación web ligera que permite a los usuarios preparar, revisar y realizar correcciones en los conjuntos de datos necesarios para el entrenamiento y la evaluación de los modelos de aprendizaje automático de Document Understanding. Permite que varios usuarios realicen diversas operaciones:

Define y configura los campos a extraer por un modelo ML.

Importa documentos para el etiquetado.

Preetiqueta los documentos con un modelo ML preexistente, como la extracción de facturas o la extracción de recibos proporcionados listos para usar por UiPath, o usando un modelo entrenado con AI Center.

Etiqueta los documentos.

Exporta los documentos en el formato previsto por los procesos de entrenamiento de AI Center.

La interfaz de usuario

La interfaz del administrador de documentos contiene los siguientes paneles:

Barra de gestión

Se muestra en la parte superior de la página en Administrador de documentos.

Permite realizar múltiples operaciones: navegar entre documentos, eliminar/restaurar un documento, buscar/filtrar documentos, ejecutar predicciones de modelos de IA, importar y exportar documentos.

Estos son los elementos disponibles en la barra de administración:

Elemento

Icono

Descripción

Navegación

Permite navegar entre los documentos que coinciden con el filtro activo.

Entre las dos flechas aparece un contador. Muestra el número del documento actual del total de documentos que coinciden con la búsqueda o filtro activos.

Busca o filtra documentos. El filtro también se aplica al exportar documentos. También puedes filtrar por palabras de un documento o por nombres de documentos.

Eliminar/Restaurar

/

Elimina o restaura un documento. Los documentos eliminados se encuentran bajo el filtro de eliminados.

Abre el cuadro de diálogo Importar datos.

Abre el cuadro de diálogo Exportar archivos.

Nombre y tipo de documento

N/D

El nombre del documento actualmente activo y su tipo.

Hay tres tipos de documentos:

  • Documento de formación
  • Documento de validación
  • Documento de evaluación

Los documentos de entrenamiento y validación forman parte de los conjuntos de datos de entrenamiento utilizados por los Procesos de entrenamiento.

Los Procesos de entrenamiento ignoran los documentos de evaluación que solo pueden ser utilizados por los Procesos de evaluación en AI Center. Estos documentos son los que se marcaron como evaluación seleccionando la casilla de verificación Marcar como conjunto de evaluación en el cuadro de diálogo Importar datos.

Descargar

La opción está disponible en el desplegable junto al nombre del documento.

Haz clic en el icono para descargar un archivo Zip que contiene el documento original. Además del documento original, también se descargan todas las páginas convertidas internamente por el administrador de documentos en imágenes .jpeg.

Eliminar de forma permanente



La opción está disponible en el desplegable junto al nombre del documento.

Borra permanentemente archivos individuales. .pdf y todas sus imágenes .jpeg se eliminan del conjunto de datos de AI Center y todos los metadatos se eliminan de la base de datos.

Al hacer clic en el botón, se mostrará un mensaje emergente que te preguntará si quieres eliminar de forma definitiva el documento. Haz clic en Aceptar para continuar o Cancelar para volver a la pantalla anterior.

Nombre de la sesión

N/D

El nombre de la sesión actual.

Predecir

Ejecutar las predicciones del modelo de IA y mostrar los resultados.

Una vez se configure el preetiquetado, el botón se activa en la barra de administración. Haz clic en él para preetiquetar el documento actual.

Por el momento, al utilizar la opción Predecir con Puntos finales públicos solo se preetiquetan las 10 primeras páginas de un documento. Este es un problema conocido y se está buscando una solución. Sin embargo, el uso de la opción Predecir con Habilidades ML en AI Center no impone tal limitación.

Configuración

Configura los ajustes de OCR y preetiquetado o accede al panel Tutorial. Consulta más detalles a continuación.

Opciones Eliminar y Eliminar de forma permanente

Profundicemos un poco más para entender la diferencia entre las opciones Eliminar y Eliminar de forma permanente.

  • La opción Eliminar borra los archivos, pero no los elimina por completo de tu proyecto. Los archivos eliminados todavía pueden encontrarse con el filtro eliminado desde la barra Buscar y ser restaurados utilizando la opción Restaurar.
  • La opción Eliminar de forma permanente borra los archivos seleccionados sin posibilidad de restaurarlos.

    Observa el uso de ambas opciones en el siguiente archivo GIF:



Opción de búsqueda

La barra de búsqueda es a la vez un campo de entrada de texto y un menú desplegable.

Las opciones de búsqueda pueden introducirse escribiendo en la barra de búsqueda o seleccionando un filtro en el menú desplegable. Hay tres maneras principales de inicializar una búsqueda:

  1. Utilizando los filtros integrados, disponibles en el menú desplegable de la barra de búsqueda. Puedes escoger cualquier de los filtros siguientes: entrenar-conjunto, validar-conjunto, entrenar-y-validar-conjunto, conjunto-de-evaluación, eliminados, etiquetados, sin etiquetar.
    Nota: ten en cuenta que solo los siguientes filtros integrados están disponibles para Forms AI: eliminados, etiquetados, sin etiquetar.


  2. Utilizando los nombres de los lotes de importación. También están disponibles en el menú desplegable de la barra de Búsqueda. Si se añade a mano, el formato es batch:name, donde name se sustituye por el nombre que le hayas dado al lote en el momento de la importación, por ejemplo, batch:invoices1
  3. Utilizando palabras clave. Las palabras clave deben introducirse como texto libre en la barra de búsqueda. Las palabras clave se buscan en el contenido o en el nombre del documento.

Puedes optar por utilizar una o varias opciones de búsqueda. Cada opción adicional utilizada proporciona una red de búsqueda más específica. A continuación, se muestran algunos ejemplos de búsqueda que comienzan con una búsqueda amplia y progresan lentamente hacia una búsqueda más refinada:

  • una búsqueda labelled muestra todos los documentos labelled del conjunto de datos.
  • una búsqueda batch:invoices1 muestra todos los documentos que forman parte del lote invoices1.
  • iniciar una búsqueda labelled batch:invoices1 devuelve todos los documentos etiquetados que formen parte del lote invoices1.
  • una búsqueda labelled batch:invoices1 vermont muestra todos los documentos etiquetados del lote invoices1 que contengan la palabra clave introducida, en este caso vermont, ya sea en el nombre o en el contenido del documento.

La barra de búsqueda dispone de un menú desplegable que, al abrirse, muestra los siguientes filtros.

  • entrenar-conjunto: indica el número de documentos que se utilizarán para entrenar el modelo. Acción automatizada.
  • validar-conjunto: indica el número de documentos que se utilizarán para validar el modelo una vez finalizado el entrenamiento. El objetivo es que la división entre el conjunto de entrenamiento y el de validación se sitúe entre el 80 % y el 20 %. Acción automatizada.
  • entrenar-y-validar-conjunto: indica el número de documentos encontrados en los filtros entrenar-conjunto y validar-conjunto. Acción automatizada.
  • conjunto-de-evaluación: indica el número de documentos que tenían marcada la casilla de verificación conjunto de evaluación durante la importación y están destinados a ser utilizados para evaluar el modelo en la etapa de proceso de entrenamiento. Puedes encontrar más información aquí. Acción manual.
  • eliminados: especifica el número de documentos eliminados. Puedes encontrar más información aquí.
  • etiquetado: especifica el número de documentos que tienen etiquetas. Una etiqueta se define como mínimo mediante un campo etiquetado/editado manualmente por documento.
  • sin etiquetar: especifica el número de documentos que no tienen etiquetas.
  • nombre-lote: especifica los documentos que se han incluido en la misma acción de importación.

La aplicación asigna un documento a los conjuntos de entrenamiento o de validación en el momento de la importación.

El documento importado termina en el conjunto de evaluación si la casilla de verificación del conjunto de evaluación está marcada durante la importación.

Menú de ajustes

El botón de configuración tiene dos opciones disponibles:

  • Ajustes donde puedes configurar el servicio OCR o Preetiquetado.
  • Tutorial, que sirve como menú de ayuda.
Para importar documentos en el administrador de documentos, es obligatorio configurar un servicio de OCR.


Las siguientes opciones están disponibles:

Método OCR

Las opciones basadas en la nube son las siguientes:

  • UiPath Document OCR: https://du.uipath.com/ocr;
  • Google Cloud Vision OCR, que tiene la mejor cobertura lingüística;
  • Google Cloud Vision OCR para japonés, óptimo para leer documentos en japonés;
  • Microsoft Read OCR.

URL del OCR

La configuración de OCR requiere que el servicio OCR disponga de una URL. Estas son las posibles URL que puedes usar:

Clave OCR

La clave API correspondiente al motor de OCR seleccionado. Por ejemplo, para UiPath Document OCR, necesitas usar la Clave API de Document Understanding. Obligatorio para el administrador de documentos en la nube y el administrador de documentos local en línea. No es necesario para el administrador de documentos local aislado.

Preetiquetado

Si ya tienes un modelo que puedes extraer algunos campos que necesitan etiquetarse, y solo existen unos cuantos campos adicionales que requieren etiquetado manual, puedes ahorrar mucho tiempo utilizando la función de preetiquetado del administrador de documentos.



Las siguientes opciones están disponibles:

URL de preetiquetado

El preetiquetado requiere que el modelo ML tenga una URL. Estas son las posibles URL que puedes usar:

  • URL públicas como https://du.uipath.com/ie/invoices o https://du.uipath.com/ie/purchase_orders
  • Consulta la lista completa de puntos finales aquí
  • URL de las habilidades ML que han sido hechas públicas en AI Center local o en AI Center en la nube.

Clave de preetiquetado

La Clave API de Document Understanding. Obligatorio para el administrador de documentos en la nube y el administrador de documentos local en línea. No es necesario para el administrador de documentos local aislado.

Información sobre...

Con la opción Tutorial accedes al menú de ayuda del administrador de documentos.



Aquí puedes encontrar lo siguiente:

  • La versión del administrador de documentos
  • El enlace Documentación que lleva a esta página de documentación.
  • La sección Controles de etiquetado que muestra los controles que se usarán al manejar los datos.
  • La sección Atajos de documentos que muestra los accesos directos usados para realizar diversas operaciones como la navegación y el escalado de la interfaz de usuario.
  • La sección Configuración que muestra los detalles de la configuración de la instancia realizada durante la instalación.

Campos de columna

Los campos de columna tienen las siguientes opciones:

  • Crear un campo de columna nuevo docs image
  • Editar campo docs image
  • Expandir/Contraer los valores de campo de columna docs image

Para obtener más detalles sobre los campos de columna, vista esta sección.

Campos regulares

Los campos regulares tienen las siguientes opciones:

  • Crear un campo regular nuevo docs image
  • Editar campo docs image

Para obtener más detalles sobre los campos regulares, visita esta sección.

Campos de clasificación

Los campos de clasificación tienen las siguientes opciones:

  • Crear un campo de clasificación nuevo docs image
  • Editar campo docs image

Para obtener más detalles sobre los campos de clasificación, visita esta sección.

Vista de documentos

En el caso de los documentos de varias páginas, puedes desplazarte de forma natural por las páginas como en cualquier visor de PDF. Para ampliar o reducir la imagen, pulsa Ctrl a la vez que desplazas el ratón.

Puedes etiquetar los documentos seleccionando los recuadros de palabras y asignándolas a un campo con una tecla. También puedes hacer clic con el botón derecho en el recuadro de palabras y verificar la información extraída.

Para obtener más detalles sobre cómo etiquetar documentos, visita esta página.

Cuando se abre una nueva sesión del administrador de documentos o cuando se tiene un filtro vacío, se muestran ciertas directrices en la vista del documento:



Además, los fallos de carga también se muestran en la vista de documentos:



  • La interfaz de usuario
  • Barra de gestión
  • Campos de columna
  • Campos regulares
  • Campos de clasificación
  • Vista de documentos

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.