- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador inteligente de palabra clave
- Clasificador de CapturaFlexible
- Clasificador de aprendizaje automático
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Paquetes ML
- Procesos
- Administrador de documentos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Instalar y utilizar
- Primera experiencia de ejecución
- Implementar UiPathDocumentOCR
- Implementar un paquete ML listo para usar
- Paquetes sin conexión 2022.10.0
- Paquetes sin conexión 2022.10.2
- Paquetes sin conexión 2022.10.4
- Paquetes sin conexión 2022.10.6
- Paquetes sin conexión 2022.10.9
- Paquetes sin conexión 2022.10.10
- Paquetes sin conexión 2022.10.11
- Paquetes sin conexión 2022.10.12
- Paquetes sin conexión 2022.10.13
- Paquetes sin conexión 2022.10.14
- Utiliza Document Manager
- Utilizar el marco
- Document Understanding implementado en AI Center independiente
- Aprendizaje profundo
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Acerca de Document Manager
UiPath Document Manager es una aplicación web ligera que permite a los usuarios preparar, revisar y realizar correcciones en los conjuntos de datos necesarios para el entrenamiento y la evaluación de los modelos de aprendizaje automático de Document Understanding. Permite que varios usuarios realicen diversas operaciones:
Define y configura los campos a extraer por un modelo ML.
Importa documentos para el etiquetado.
Preetiqueta los documentos con un modelo ML preexistente, como la extracción de facturas o la extracción de recibos proporcionados listos para usar por UiPath, o usando un modelo entrenado con AI Center.
Etiqueta los documentos.
Exporta los documentos en el formato previsto por los procesos de entrenamiento de AI Center.
La interfaz del administrador de documentos contiene los siguientes paneles:
Se muestra en la parte superior de la página en Administrador de documentos.
Permite realizar múltiples operaciones: navegar entre documentos, eliminar/restaurar un documento, buscar/filtrar documentos, ejecutar predicciones de modelos de IA, importar y exportar documentos.
Estos son los elementos disponibles en la barra de administración:
Elemento |
Icono |
Descripción |
---|---|---|
Navegación |
|
Permite navegar entre los documentos que coinciden con el filtro activo. Entre las dos flechas aparece un contador. Muestra el número del documento actual del total de documentos que coinciden con la búsqueda o filtro activos. |
|
|
Busca o filtra documentos. El filtro también se aplica al exportar documentos. También puedes filtrar por palabras de un documento o por nombres de documentos. |
Eliminar/Restaurar |
/ |
Elimina o restaura un documento. Los documentos eliminados se encuentran bajo el filtro de eliminados. |
|
|
Abre el cuadro de diálogo Importar datos. |
|
|
Abre el cuadro de diálogo Exportar archivos. |
Nombre y tipo de documento |
N/D |
El nombre del documento actualmente activo y su tipo. Hay tres tipos de documentos:
Los documentos de entrenamiento y validación forman parte de los conjuntos de datos de entrenamiento utilizados por los Procesos de entrenamiento. Los Procesos de entrenamiento ignoran los documentos de evaluación que solo pueden ser utilizados por los Procesos de evaluación en AI Center. Estos documentos son los que se marcaron como evaluación seleccionando la casilla de verificación Marcar como conjunto de evaluación en el cuadro de diálogo Importar datos. |
Descargar |
|
La opción está disponible en el desplegable junto al nombre del documento. Haz clic en el icono para descargar un archivo Zip que contiene el documento original. Además del documento original, también se descargan todas las páginas convertidas internamente por el administrador de documentos en imágenes
.jpeg .
|
Eliminar de forma permanente |
|
La opción está disponible en el desplegable junto al nombre del documento. Borra permanentemente archivos individuales.
.pdf y todas sus imágenes .jpeg se eliminan del conjunto de datos de AI Center y todos los metadatos se eliminan de la base de datos.
Al hacer clic en el botón, se mostrará un mensaje emergente que te preguntará si quieres eliminar de forma definitiva el documento. Haz clic en Aceptar para continuar o Cancelar para volver a la pantalla anterior. |
Nombre de la sesión |
N/D |
El nombre de la sesión actual. |
Predecir |
|
Ejecutar las predicciones del modelo de IA y mostrar los resultados. Una vez se configure el preetiquetado, el botón se activa en la barra de administración. Haz clic en él para preetiquetar el documento actual. Por el momento, al utilizar la opción Predecir con Puntos finales públicos solo se preetiquetan las 10 primeras páginas de un documento. Este es un problema conocido y se está buscando una solución. Sin embargo, el uso de la opción Predecir con Habilidades ML en AI Center no impone tal limitación. |
Configuración |
|
Configura los ajustes de OCR y preetiquetado o accede al panel Tutorial. Consulta más detalles a continuación. |
Opciones Eliminar y Eliminar de forma permanente
Profundicemos un poco más para entender la diferencia entre las opciones Eliminar y Eliminar de forma permanente.
- La opción Eliminar borra los archivos, pero no los elimina por completo de tu proyecto. Los archivos eliminados todavía pueden encontrarse con el filtro eliminado desde la barra Buscar y ser restaurados utilizando la opción Restaurar.
- La opción Eliminar de forma permanente borra los archivos seleccionados sin posibilidad de restaurarlos.
Observa el uso de ambas opciones en el siguiente archivo GIF:
Opción de búsqueda
La barra de búsqueda es a la vez un campo de entrada de texto y un menú desplegable.
Las opciones de búsqueda pueden introducirse escribiendo en la barra de búsqueda o seleccionando un filtro en el menú desplegable. Hay tres maneras principales de inicializar una búsqueda:
- Utilizando los filtros integrados, disponibles en el menú desplegable de la barra de búsqueda. Puedes escoger cualquier de los filtros siguientes: entrenar-conjunto, validar-conjunto, entrenar-y-validar-conjunto, conjunto-de-evaluación, eliminados, etiquetados, sin etiquetar.
Nota: ten en cuenta que solo los siguientes filtros integrados están disponibles para Forms AI: eliminados, etiquetados, sin etiquetar.
- Utilizando los nombres de los lotes de importación. También están disponibles en el menú desplegable de la barra de Búsqueda. Si se añade a mano, el formato es
batch:name
, dondename
se sustituye por el nombre que le hayas dado al lote en el momento de la importación, por ejemplo,batch:invoices1
- Utilizando palabras clave. Las palabras clave deben introducirse como texto libre en la barra de búsqueda. Las palabras clave se buscan en el contenido o en el nombre del documento.
Puedes optar por utilizar una o varias opciones de búsqueda. Cada opción adicional utilizada proporciona una red de búsqueda más específica. A continuación, se muestran algunos ejemplos de búsqueda que comienzan con una búsqueda amplia y progresan lentamente hacia una búsqueda más refinada:
- una búsqueda
labelled
muestra todos los documentoslabelled
del conjunto de datos. - una búsqueda
batch:invoices1
muestra todos los documentos que forman parte del loteinvoices1
. - iniciar una búsqueda
labelled batch:invoices1
devuelve todos los documentos etiquetados que formen parte del loteinvoices1
. - una búsqueda
labelled batch:invoices1 vermont
muestra todos los documentos etiquetados del loteinvoices1
que contengan la palabra clave introducida, en este casovermont
, ya sea en el nombre o en el contenido del documento.
La barra de búsqueda dispone de un menú desplegable que, al abrirse, muestra los siguientes filtros.
- entrenar-conjunto: indica el número de documentos que se utilizarán para entrenar el modelo. Acción automatizada.
- validar-conjunto: indica el número de documentos que se utilizarán para validar el modelo una vez finalizado el entrenamiento. El objetivo es que la división entre el conjunto de entrenamiento y el de validación se sitúe entre el 80 % y el 20 %. Acción automatizada.
- entrenar-y-validar-conjunto: indica el número de documentos encontrados en los filtros entrenar-conjunto y validar-conjunto. Acción automatizada.
- conjunto-de-evaluación: indica el número de documentos que tenían marcada la casilla de verificación conjunto de evaluación durante la importación y están destinados a ser utilizados para evaluar el modelo en la etapa de proceso de entrenamiento. Puedes encontrar más información aquí. Acción manual.
- eliminados: especifica el número de documentos eliminados. Puedes encontrar más información aquí.
- etiquetado: especifica el número de documentos que tienen etiquetas. Una etiqueta se define como mínimo mediante un campo etiquetado/editado manualmente por documento.
- sin etiquetar: especifica el número de documentos que no tienen etiquetas.
- nombre-lote: especifica los documentos que se han incluido en la misma acción de importación.
La aplicación asigna un documento a los conjuntos de entrenamiento o de validación en el momento de la importación.
El documento importado termina en el conjunto de evaluación si la casilla de verificación del conjunto de evaluación está marcada durante la importación.
Menú de ajustes
El botón de configuración tiene dos opciones disponibles:
- Ajustes donde puedes configurar el servicio OCR o Preetiquetado.
- Tutorial, que sirve como menú de ayuda.
Para importar documentos en el administrador de documentos, es obligatorio configurar un servicio de OCR.
Las siguientes opciones están disponibles:
Método OCR
Las opciones basadas en la nube son las siguientes:
- UiPath Document OCR: https://du.uipath.com/ocr;
- Google Cloud Vision OCR, que tiene la mejor cobertura lingüística;
- Google Cloud Vision OCR para japonés, óptimo para leer documentos en japonés;
- Microsoft Read OCR.
URL del OCR
La configuración de OCR requiere que el servicio OCR disponga de una URL. Estas son las posibles URL que puedes usar:
- URL públicas como https://du.uipath.com/ocr o URL de terceros desde Google Vision OCR o Microsoft Read OCR
Clave OCR
La clave API correspondiente al motor de OCR seleccionado. Por ejemplo, para UiPath Document OCR, necesitas usar la Clave API de Document Understanding. Obligatorio para el administrador de documentos en la nube y el administrador de documentos local en línea. No es necesario para el administrador de documentos local aislado.
Preetiquetado
Si ya tienes un modelo que puedes extraer algunos campos que necesitan etiquetarse, y solo existen unos cuantos campos adicionales que requieren etiquetado manual, puedes ahorrar mucho tiempo utilizando la función de preetiquetado del administrador de documentos.
Las siguientes opciones están disponibles:
URL de preetiquetado
El preetiquetado requiere que el modelo ML tenga una URL. Estas son las posibles URL que puedes usar:
- URL públicas como https://du.uipath.com/ie/invoices o https://du.uipath.com/ie/purchase_orders
- Consulta la lista completa de puntos finales aquí
- URL de las habilidades ML que han sido hechas públicas en AI Center local o en AI Center en la nube.
Clave de preetiquetado
La Clave API de Document Understanding. Obligatorio para el administrador de documentos en la nube y el administrador de documentos local en línea. No es necesario para el administrador de documentos local aislado.
Información sobre...
Con la opción Tutorial accedes al menú de ayuda del administrador de documentos.
Aquí puedes encontrar lo siguiente:
- La versión del administrador de documentos
- El enlace Documentación que lleva a esta página de documentación.
- La sección Controles de etiquetado que muestra los controles que se usarán al manejar los datos.
- La sección Atajos de documentos que muestra los accesos directos usados para realizar diversas operaciones como la navegación y el escalado de la interfaz de usuario.
- La sección Configuración que muestra los detalles de la configuración de la instancia realizada durante la instalación.
Los campos de columna tienen las siguientes opciones:
- Crear un campo de columna nuevo
- Editar campo
- Expandir/Contraer los valores de campo de columna
Para obtener más detalles sobre los campos de columna, vista esta sección.
Los campos regulares tienen las siguientes opciones:
- Crear un campo regular nuevo
- Editar campo
Para obtener más detalles sobre los campos regulares, visita esta sección.
Los campos de clasificación tienen las siguientes opciones:
- Crear un campo de clasificación nuevo
- Editar campo
Para obtener más detalles sobre los campos de clasificación, visita esta sección.
Ctrl
a la vez que desplazas el ratón.
Puedes etiquetar los documentos seleccionando los recuadros de palabras y asignándolas a un campo con una tecla. También puedes hacer clic con el botón derecho en el recuadro de palabras y verificar la información extraída.
Para obtener más detalles sobre cómo etiquetar documentos, visita esta página.
Cuando se abre una nueva sesión del administrador de documentos o cuando se tiene un filtro vacío, se muestran ciertas directrices en la vista del documento:
Además, los fallos de carga también se muestran en la vista de documentos: