- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Aprendizaje profundo
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Licencia
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
La interfaz de usuario
La interfaz del administrador de documentos contiene los siguientes paneles:
- Barra de gestión
- Campos de columna
- Campos regulares
- Campos de clasificación
- Vista de documentos
Se muestra en la parte superior de la página en Administrador de documentos.
Permite realizar múltiples operaciones: navegar entre documentos, eliminar/restaurar un documento, buscar/filtrar documentos, ejecutar predicciones de modelos de IA, importar y exportar documentos.
Estos son los elementos disponibles en la barra de administración:
Elemento |
Icono |
Descripción |
---|---|---|
Navegación |
|
Permite navegar entre los documentos que coinciden con el filtro activo. Entre las dos flechas aparece un contador. Muestra el número del documento actual del total de documentos que coinciden con la búsqueda o filtro activos. |
Buscar |
|
Hay dos funcionalidades de búsqueda:
|
Eliminar/Restaurar |
|
Elimina o restaura un documento. Los documentos eliminados se encuentran bajo el filtro de eliminados. |
Importar |
|
Abre el cuadro de diálogo Importar datos. |
Exportar |
|
Abre el cuadro de diálogo Exportar archivos. |
Nombre y tipo de documento |
N/D |
El nombre del documento actualmente activo y su tipo. Hay tres tipos de documentos:
Los documentos de entrenamiento y validación forman parte de los conjuntos de datos de entrenamiento utilizados por los Procesos de entrenamiento. Los Procesos de entrenamiento ignoran los documentos de evaluación que solo pueden ser utilizados por los Procesos de evaluación en AI Center. Estos documentos son los que se marcaron como evaluación seleccionando la casilla de verificación Marcar como conjunto de evaluación en el cuadro de diálogo Importar datos. |
Descargar |
La opción está disponible en el desplegable junto al nombre del documento. Haz clic en el icono para descargar un archivo Zip que contiene el documento original. Además del documento original, también se descargan todas las páginas convertidas internamente por el administrador de documentos en imágenes
.jpeg .
| |
Eliminar de forma permanente |
La opción está disponible en el desplegable junto al nombre del documento. Borra permanentemente archivos individuales.
.pdf y todas sus imágenes .jpeg se eliminan del conjunto de datos de AI Center y todos los metadatos se eliminan de la base de datos.
Al hacer clic en el botón, se mostrará un mensaje emergente que te preguntará si quieres eliminar de forma definitiva el documento. Haz clic en Aceptar para continuar o Cancelar para volver a la pantalla anterior. | |
Nombre del lote |
N/D |
El nombre del lote actual. |
Nombre de la sesión |
N/D |
El nombre de la sesión actual. |
Predecir |
Ejecutar las predicciones del modelo de IA y mostrar los resultados. Una vez se configure el preetiquetado, el botón se activa en la barra de administración. Haz clic en él para preetiquetar el documento actual. | |
Configuración |
Configura los ajustes de OCR y preetiquetado o accede al panel Tutorial. Consulta más detalles a continuación. |
Profundicemos un poco más para entender la diferencia entre las opciones Eliminar y Eliminar de forma permanente.
- La opción Eliminar borra los archivos, pero no los elimina por completo de tu proyecto. Los archivos eliminados todavía pueden encontrarse con el filtro eliminado desde la barra Buscar y ser restaurados utilizando la opción Restaurar.
-
La opción Eliminar de forma permanente borra los archivos seleccionados sin posibilidad de restaurarlos.
La funcionalidad de búsqueda expuesta tiene dos partes:
-
Buscar utilizando los filtros integrados: filtra los documentos en función de las opciones disponibles por lotes/categorías del menú desplegable.
Al seleccionar más opciones la búsqueda es más restrictiva. Por ejemplo, al seleccionar Importación por lotes1 y Eliminado, solo se muestran los documentos importados en la Importación por lotes1 que se eliminan.
Ten en cuenta las combinaciones que siempre devolverán una lista vacía: al seleccionar Importación por lotes1 e Importación por lotes2 nunca se devolverá un documento, ya que la selección es restrictiva y ningún documento puede estar en dos lotes a la vez.
-
Buscar en documentos utilizando palabras clave: esta barra de búsqueda filtra la información en función de una entrada de texto. Las palabras clave deben introducirse como texto libre en la barra de búsqueda. La(s) palabra(s) clave se buscan tanto en el contenido como en el nombre del documento. La búsqueda de varias palabras devuelve resultados cuando las palabras son adyacentes, excluyendo cualquier signo de puntuación que haya entre ellas.
-
Buscar en el documento: te permite buscar instancias de texto únicamente en el documento actual. La barra de búsqueda, , se encuentra en la parte inferior izquierda de la pantalla.
El botón de configuración tiene dos opciones disponibles:
- Ajustes donde puedes configurar el servicio OCR o de Preetiquetado
- Tutorial, que sirve como menú de ayuda.
OCR
Para importar documentos en el administrador de documentos, es obligatorio configurar un servicio de OCR.
Las siguientes opciones están disponibles:
This setting is available only for Document Types (Data Manager sessions) created in AI Center. When created in Document UnderstandingTM, this setting is inherited from the Project Settings. If you want to modify these settings in Document UnderstandingTM, go back to the Project view and open Project Settings from the bottom left.
Las opciones basadas en la nube son las siguientes:
- UiPath® Document OCR -
https://du.uipath.com/ocr
; - OCR para chino, japonés y coreano
- Google Cloud Vision OCR, que tiene la mejor cobertura lingüística;
- Google Cloud Vision OCR para japonés, óptimo para leer documentos en japonés;
- Microsoft Read OCR.
La configuración de OCR requiere que el servicio OCR disponga de una URL. Estas son las posibles URL que puedes usar:
- URL públicas como
https://du.uipath.com/ocr
o URL de terceros de Google Vision OCR o Microsoft Read OCR
La clave API correspondiente al motor de OCR seleccionado. Por ejemplo, para UiPath Document OCR, es necesario usar la clave API de Document Understanding. Obligatorio para el administrador de documentos en la nube y el administrador de documentos local en línea. No es necesario para el administrador de documentos local aislado.
Para obtener más información, consulta la página de uso en la nube y en las instalaciones.
Establece si el proceso de OCR debe aplicarse o no a los documentos PDF. Si se establece como Verdadero, el OCR se aplica a todas las páginas PDF del documento. Si se establece como Falso, solo se extrae el texto escrito digitalmente. Cuando se establece en Automático, evalúa si el documento requiere aplicar el algoritmo OCR en función del documento de entrada. El valor predeterminado es Automático.
Si ya tienes un modelo que puedes extraer algunos campos que necesitan etiquetarse, y solo existen unos cuantos campos adicionales que requieren etiquetado manual, puedes ahorrar mucho tiempo utilizando la función de preetiquetado del administrador de documentos.
El preetiquetado fusiona los resultados del punto final de preetiquetado, que configuras en la configuración de preetiquetado.
Las siguientes opciones están disponibles:
El preetiquetado requiere que el modelo ML tenga una URL. Comprueba las siguientes URL posibles que puedes utilizar:
- URL públicas como
https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders
.Consulta Puntos finales públicos para ver la lista completa de puntos finales.
- URL de habilidades ML que se han hecho públicas en AI Center local o en Cloud AI Center.
La clave API de Unidades de IA/Document Understanding. La clave API de preetiquetado es la clave API de Document Understanding de la organización donde reside la habilidad.
La clave es obligatoria para Cloud Document Manager y Document Manager en línea local. La clave es opcional para Document Manager con espacios aéreos locales.
La opción Tutorial abre el menú de ayuda de Document Manager.
En el menú de ayuda puedes encontrar la siguiente información:
- La versión de Document Manager.
- El enlace Documentación que lleva a esta página de documentación.
- La sección Controles de etiquetado que muestra los controles que se usarán al manejar los datos.
- La sección Atajos de documentos que muestra los accesos directos usados para realizar diversas operaciones como la navegación y el escalado de la interfaz de usuario.
- La sección Configuración que muestra los detalles de la configuración de la instancia realizada durante la instalación.
Controles de etiquetado
Comando |
Descripción |
---|---|
Clic izquierdo | Selecciona casillas. Si se utiliza junto con la tecla de acceso rápido del campo, asigna la información seleccionada al campo. |
Retroceso/Suprimir | Elimina el valor etiquetado de un campo. |
Clic derecho | Muestra el texto OCR y la etiqueta actual. |
Intro o barra invertida | Agrupa o desagrupa filas de tablas que comprenden varias líneas de texto. |
Atajos de documentos
Atajo |
Descripción |
---|---|
Alt + Flecha izquierda/Flecha derecha | Navega entre documentos. |
Alt + Suprimir | Elimina o recupera un documento. |
Ctrl + Desplazar | Cambia la escala del documento ampliándolo o reduciéndolo. |
- Crear un campo de columna nuevo
- Editar campo
- Expandir/Contraer los valores de campo de columna
Para obtener más detalles sobre los campos de columna, vista esta sección.
- Crear un campo regular nuevo
- Editar campo
Para obtener más detalles sobre los campos regulares, visita esta sección.
- Crear un campo de clasificación nuevo
- Editar campo
Para obtener más detalles sobre los campos de clasificación, visita esta sección.
Ctrl
a la vez que desplazas el ratón.
Puedes etiquetar los documentos seleccionando los recuadros de palabras y asignándolas a un campo con una tecla. También puedes hacer clic con el botón derecho en el recuadro de palabras y verificar la información extraída.
Para obtener más detalles sobre cómo etiquetar documentos, visita esta página.
Cuando se abre una nueva sesión del administrador de documentos o cuando se tiene un filtro vacío, se muestran ciertas directrices en la vista del documento:
Además, los fallos de carga también se muestran en la vista de documentos:
- Barra de administración
- Opciones Eliminar y Eliminar de forma permanente
- Opción de búsqueda
- Menú de ajustes
- Método OCR
- URL del OCR
- Clave OCR
- Aplicar OCR en PDF
- Predecir/preetiquetar
- URL de preetiquetado
- Clave de preetiquetado
- Información sobre...
- Campos de columna
- Campos regulares
- Campos de clasificación
- Vista de documentos