UiPath Documentation
document-understanding
latest
false

Guía del usuario clásica de Document Understanding

Última actualización 30 de abr. de 2026

Tipos de documentos (Document Manager)

Los tipos de documentos te permiten preparar, revisar y realizar correcciones en los conjuntos de datos necesarios para el entrenamiento y la evaluación de los modelos de aprendizaje automático de Document UnderstandingTM . Permite que varios usuarios realicen una variedad de operaciones:

  • Define y configura los campos a extraer por un modelo ML.
  • Importa documentos para el etiquetado.
  • Preetiqueta los documentos con un modelo ML preexistente, como la extracción de facturas o la extracción de recibos proporcionados listos para usar por UiPath, o usando un modelo entrenado con AI Center.
  • Etiqueta los documentos.
  • Exporta los documentos en el formato previsto por los procesos de entrenamiento de AI Center.

Crear tipo de documento

Una vez se crea y abre un proyecto, puedes crear un nuevo tipo de documento seleccionando el botón Nuevo y seleccionando la opción Usar IA semiestructurada. Se abre una nueva ventana que solicita información adicional.

Estas son las opciones disponibles para crear una nueva sesión de Tipo de documento. Al completar estos valores se obtiene una estimación del tamaño recomendado del conjunto de datos que se utilizará como punto de partida.

Además, al seleccionar el tipo de documento Listo para usar, se rellena y configura automáticamente tu esquema para que puedas beneficiarte de los modelos preentrenados disponibles en AI Center. Esto elimina la necesidad de importar esquemas predefinidos manualmente, acelera tu trabajo y minimiza los costosos errores.

Además, el punto final Preetiquetado se rellena automáticamente con el punto final apropiado, lo que facilita el uso de Preetiquetado inmediatamente después de abrir el nuevo tipo de documento.

Captura de pantalla de la interfaz Crear nuevo tipo de documento.

OpciónDescripción
Nombre (obligatorio)Indica un nombre para el nuevo tipo de documento.
Out-of-the-box document type (Mandatory)Selecciona uno de los tipos de documento predefinidos disponibles en la lista desplegable.
Out-of-the-box regular fields (Optional)Selecciona cuál de los campos regulares predefinidos deseas crear para tu esquema.
Out-of-the-box column fields (Optional)Selecciona cuál de los campos de columna predefinidos deseas extraer de tus documentos.
Out-of-the-box classification fields (Optional)Selecciona cuáles de los campos de clasificación predefinidos te gustaría extraer de tus documentos.
Custom regular fields (Optional)Enter the number of additional regular fields you would like to extract from your documents.
Custom column fields (Optional)Introduce el número de campos de columna adicionales que te gustaría extraer de tus documentos.
Number of languages (Optional)Introduce el número de idiomas de los documentos que necesitas extraer.
Number of layouts (Optional)Introduce el número de diseños para los documentos que necesites extraer.
Nota:

Selecting a document type generates a recommended number of pages that need to be used for the dataset.

La interfaz de usuario

La interfaz del administrador de documentos contiene los siguientes paneles:

  • Barra de gestión
  • Campos de columna
  • Campos regulares
  • Campos de clasificación
  • Vista de documentos

Barra de administración

Se muestra en la parte superior de la página en Administrador de documentos.

Permite realizar múltiples operaciones: navegar entre documentos, eliminar/restaurar un documento, buscar/filtrar documentos, ejecutar predicciones de modelos de IA, importar y exportar documentos.

Estos son los elementos disponibles en la barra de administración:

ElementoIconoDescripción
NavegaciónIcono de navegaciónPermite navegar entre los documentos que coinciden con el filtro activo. Entre las dos flechas aparece un contador. Muestra el número del documento actual del total de documentos que coinciden con la búsqueda o filtro activos.
BuscarIcono de búsquedaHay dos funcionalidades de búsqueda:
  • Filtros integrados: filtra los documentos en función de las opciones disponibles por lotes/categorías del menú desplegable.
  • Utilizar palabras clave: filtra los documentos en función de una entrada de texto.
Eliminar/RestaurarIcono Eliminar
Icono de restauración
Elimina o restaura un documento. Los documentos eliminados se encuentran bajo el filtro de eliminados.
ImportarIcono de importaciónAbre el cuadro de diálogo Importar datos.
ExportarIcono de exportaciónAbre el cuadro de diálogo Exportar archivos.
Nombre y tipo de documentoN/DEl nombre del documento actualmente activo y su tipo. Hay tres tipos de documentos:
  • Documento de formación
  • Documento de validación
  • Documento de evaluación
Los documentos de entrenamiento y validación forman parte de los conjuntos de datos de entrenamiento utilizados por los Procesos de entrenamiento. Los Procesos de entrenamiento ignoran los documentos de evaluación que solo pueden ser utilizados por los Procesos de evaluación en AI Center. Estos documentos son los que se marcaron como evaluación seleccionando la casilla de verificación Marcar como conjunto de evaluación en el cuadro de diálogo Importar datos.
DescargarIcono de descargaLa opción está disponible en el desplegable junto al nombre del documento. Selecciona el icono para descargar un archivo Zip que contenga el documento original. Además del documento original, también se descargan todas las páginas convertidas internamente por el Gestor de Documentos en .jpeg imágenes.
Eliminar de forma permanenteIcono de eliminar de forma permanenteLa opción está disponible en el desplegable junto al nombre del documento. Borra permanentemente archivos individuales. .pdf y todas sus imágenes .jpeg se eliminan del conjunto de datos de AI Center y todos los metadatos se eliminan de la base de datos. Cuando seleccionas el botón, aparece un mensaje emergente que te pregunta si estás seguro de que quieres eliminar de forma permanente el documento. Elige Aceptar para continuar o Cancelar para volver a la pantalla anterior.
Nombre del loteN/DEl nombre del lote actual.
Nombre de la sesiónN/DEl nombre de la sesión actual.
Predecir

Nota: la característica Predecir depende de UiPath Helix Extractor, pero solo para tenants basados en la región de Europa. Si tu tenant se encuentra en una región fuera de Europa, esta funcionalidad utiliza la arquitectura del modelo de generación anterior.
Icono de predicciónEjecutar las predicciones del modelo de IA y mostrar los resultados. Después de configurar el preetiquetado, el botón se habilita en la barra de gestión. Selecciónalo para etiquetar previamente el documento actual. El botón tiene tres opciones:
  • Predecir: Fusiona los resultados del punto final del preetiquetado (establecido en la Configuración de preetiquetado) y la predicción generativa. Si no hay configurado un punto final de preetiquetado, todos los campos se predicen utilizando solo Predicción generativa.
  • Predicción generativa: Predice todos los campos utilizando la capacidad Predicción generativa.
  • Previsión del modelo: predice los campos utilizando el modelo de punto final de preetiquetado configurado en la configuración de Preletiquetado.
La funcionalidad de anotación generativa (preetiquetado) descarta todos los valores de campo editados manualmente para todos los tipos de campo y elimina todas las etiquetas del documento. Por el momento, al utilizar la opción Predecir con Puntos finales públicos para Automation Cloud y Test Cloud solo se preetiquetan las 10 primeras páginas de un documento. Este es un problema conocido y se está trabajando en una solución. Sin embargo, el uso de la opción Predecir con Habilidades ML en AI Center no impone tal limitación. El preetiquetado generativo no consume unidades de IA cuando se utilizan puntos finales públicos o habilidades implementadas en Automation Cloud™ desde sesiones de Document Manager alojadas en Automation Cloud. El preetiquetado generativo consume unidades de IA cuando se llama a un punto final público desde una sesión alojada en Automation Suite, o cuando se llama a una habilidad implementada en Automation Suite desde una sesión de Document Manager alojada en Automation Cloud.
ConfiguraciónIcono de configuraciónConfigura los ajustes de OCR y preetiquetado o accede al panel Tutorial.
Opciones Eliminar y Eliminar de forma permanente

Let's go a little bit deeper in understanding the difference between Delete and Permanently Delete options.

  • The Delete option deletes the files, but not removing them entirely from your project. The deleted files can still be found under the deleted filter from the Search bar and restored by using the Restore option.
  • The Permanently Delete option deletes the selected files without any possibility of restoring them.
Opción de búsqueda

Hay tres opciones de búsqueda disponibles en total, dos están presentes en la barra de administración de la parte superior de la página y una está utilizando el Icono de búsqueda en la parte inferior izquierda de la página.

Nota:

Ten en cuenta que solo los filtros integrados siguientes están disponibles para los Formularios IA: eliminados, etiquetados, sin etiquetar.

La funcionalidad de búsqueda expuesta tiene dos partes:

  • Buscar utilizando los filtros integrados: filtra los documentos en función de las opciones disponibles por lotes/categorías del menú desplegable.

    Nota:

    Al seleccionar más opciones la búsqueda es más restrictiva. Por ejemplo, al seleccionar Importación por lotes1 y Eliminado, solo se muestran los documentos importados en la Importación por lotes1 que se eliminan. Ten en cuenta las combinaciones que siempre devolverán una lista vacía: al seleccionar Importación por lotes1 e Importación por lotes2 nunca se devolverá un documento, ya que la selección es restrictiva y ningún documento puede estar en dos lotes a la vez.

  • Buscar en documentos utilizando palabras clave: esta barra de búsqueda filtra la información en función de una entrada de texto. Las palabras clave deben introducirse como texto libre en la barra de búsqueda. La(s) palabra(s) clave se buscan tanto en el contenido como en el nombre del documento. La búsqueda de varias palabras devuelve resultados cuando las palabras son adyacentes, excluyendo cualquier signo de puntuación que haya entre ellas.

    Nota:

    Junto a las dos búsquedas de barra, también hay una búsqueda dentro de la búsqueda de documentos, identificable por este Imagen de documentosfirmar.

  • Buscar dentro del documento: te permite buscar instancias de texto únicamente en tu documento actual. La barra de búsqueda,docs image , se puede encontrar en la parte inferior izquierda de la pantalla.

Menú de ajustes

El botón de configuración tiene dos opciones disponibles:

  • Ajustes en los que se puede configurar el servicio OCR o el preetiquetado
  • Tutorial, que sirve como menú de ayuda.
OCR

Para importar documentos en el administrador de documentos, es obligatorio configurar un servicio de OCR.

Captura de pantalla de la interfaz de configuración del OCR.

Método OCR

Esta configuración solo está disponible para los tipos de documentos (sesiones de Data Manager) creados en AI Center. Cuando se crea en Document UnderstandingTM, esta configuración se hereda de la Configuración del proyecto. Si quieres modificar esta configuración en Document UnderstandingTM, vuelve a la vista Proyecto y abre Configuración del proyecto desde la parte inferior izquierda.

Las opciones basadas en la nube son las siguientes:

  • UiPath® Document OCR : https://du.uipath.com/ocr;
  • OCR para chino, japonés y coreano
  • Google Cloud Vision OCR, que tiene la mejor cobertura lingüística;
  • Google Cloud Vision OCR para japonés, óptimo para leer documentos en japonés;
  • Microsoft Read OCR.
URL del OCR

La configuración de OCR requiere que el servicio OCR disponga de una URL. Estas son las posibles URL que puedes usar:

  • URL públicas como https://du.uipath.com/ocr o URL de terceros de Google Vision OCR o Microsoft Read OCR
Clave OCR

La clave API correspondiente al motor de OCR seleccionado. Por ejemplo, para UiPath Document OCR, es necesario usar la clave API de Document Understanding. Obligatorio para el administrador de documentos en la nube y el administrador de documentos local en línea. No es necesario para el administrador de documentos local aislado.

Para obtener más información, consulta la página de uso en la nube y en las instalaciones.

Aplicar OCR en PDF

Establece si el proceso de OCR debe aplicarse o no a los documentos PDF. Si se establece como Verdadero, el OCR se aplica a todas las páginas PDF del documento. Si se establece como Falso, solo se extrae el texto escrito digitalmente. Cuando se establece en Automático, evalúa si el documento requiere aplicar el algoritmo OCR en función del documento de entrada. El valor predeterminado es Automático.

Predecir/preetiquetar

Nota:

La característica Predecir se basa en UiPath Helix Extractor, pero solo para tenants basados en la región de Europa. Si tu tenant está ubicado en una región fuera de Europa, esta funcionalidad utiliza la arquitectura del modelo de generación anterior.

Si ya tienes un modelo que puedes extraer algunos campos que necesitan etiquetarse, y solo existen unos cuantos campos adicionales que requieren etiquetado manual, puedes ahorrar mucho tiempo utilizando la función de preetiquetado del administrador de documentos.

El preetiquetado combina los resultados del punto final de preetiquetado, que se configura en la configuración de preetiquetado y el pronóstico generativo.

Si no hay configurado un punto final de preetiquetado, todos los campos se predicen utilizando solo Predicción generativa.

Captura de pantalla de la interfaz de preetiquetado.

Las siguientes opciones están disponibles:

URL de preetiquetado

El preetiquetado requiere que el modelo ML tenga una URL. Comprueba las siguientes URL posibles que puedes utilizar:

  • URL públicas como https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders. Consulta Puntos finales públicos para Automation Cloud y Test Cloud para comprobar la lista completa de puntos finales.
  • URL de habilidades ML que se han hecho públicas en AI Center local o en Cloud AI Center.
Clave de preetiquetado

La clave API de Unidades de IA/Document Understanding. La clave API de preetiquetado es la clave API de Document Understanding de la organización donde reside la habilidad.

La clave es obligatoria para Cloud Document Manager y Document Manager en línea local. La clave es opcional para Document Manager con espacios aéreos locales.

Información sobre...

La opción Tutorial abre el menú de ayuda de Document Manager.

En el menú de ayuda puedes encontrar la siguiente información:

  • La versión de Document Manager.
  • El enlace Documentación que lleva a esta página de documentación.
  • La sección Controles de etiquetado que muestra los controles que se usarán al manejar los datos.
  • La sección Atajos de documentos que muestra los accesos directos usados para realizar diversas operaciones como la navegación y el escalado de la interfaz de usuario.
  • La sección Configuración que muestra los detalles de la configuración de la instancia realizada durante la instalación.
Controles de etiquetado
ComandoDescripción
Clic izquierdoSelecciona casillas. Si se utiliza junto con la tecla de acceso rápido del campo, asigna la información seleccionada al campo.
Retroceso/SuprimirElimina el valor etiquetado de un campo.
Clic derechoMuestra el texto OCR y la etiqueta actual.
Intro o barra invertidaAgrupa o desagrupa filas de tablas que comprenden varias líneas de texto.
Atajos de documentos
AtajoDescripción
Alt + Flecha izquierda/Flecha derechaNavega entre documentos.
Alt + SuprimirElimina o recupera un documento.
Ctrl + DesplazarCambia la escala del documento ampliándolo o reduciéndolo.

Campos de columna

Los campos de columna tienen las siguientes opciones:

  • Crear un campo de columna nuevo Icono más
  • Editar campo Icono Editar
  • Expandir/Contraer los valores de campo de columna Icono de expandir o contraer

Para obtener más información sobre los campos de columna, consulta esta sección.

Campos regulares

Los campos regulares tienen las siguientes opciones:

  • Crear un campo regular nuevo Icono más
  • Editar campo Icono Editar

Para obtener más información sobre los campos regulares, consulta esta sección.

Campos de clasificación

Los campos de clasificación tienen las siguientes opciones:

  • Crear un campo de clasificación nuevo Icono más
  • Editar campo Icono Editar

Para obtener más información sobre los campos de clasificación, visita esta sección.

Vista de documentos

En el caso de los documentos de varias páginas, puedes desplazarte de forma natural por las páginas como en cualquier visor de PDF. Para ampliar o reducir la imagen, pulsa Ctrl a la vez que desplazas el ratón.

Puedes etiquetar los documentos seleccionando los recuadros de palabras y asignándolas a un campo con una tecla. También puedes hacer clic con el botón derecho en el recuadro de palabras y verificar la información extraída.

Para obtener más información sobre cómo etiquetar documentos, visita esta página.

Cuando se abre una nueva sesión del administrador de documentos o cuando se tiene un filtro vacío, se muestran ciertas directrices en la vista del documento:

Captura de pantalla de la interfaz de Document Manager.

Además, los fallos de carga también se muestran en la vista de documentos:

Captura de pantalla de un ejemplo de error de carga.

¿Te ha resultado útil esta página?

Conectar

¿Necesita ayuda? Soporte

¿Quiere aprender? UiPath Academy

¿Tiene alguna pregunta? Foro de UiPath

Manténgase actualizado