Document Understanding: divisor entrenable (vista previa)

document-understanding

latest

false

Guía del usuario de Document Understanding

Importante :

La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Divisor entrenable (vista Previa)

Configura el divisor entrenable en Document Understanding para detectar los límites de los documentos y asignar tipos de documentos en paquetes de varios documentos.

Información general

El divisor entrenable utiliza el modelo Clasificador Helix para dividir y clasificar paquetes de varios documentos. Detecta los límites de los documentos automáticamente y asigna un tipo de documento a cada subdocumento detectado.

El modelo está disponible solo para tenants en Europa y los EE. UU.

Importante:

Esta característica solo admite claves gestionadas por el proveedor. Las claves administradas por el cliente (CMK) no se pueden utilizar para cifrar datos para esta característica, incluso si CMK está habilitado en el nivel de organización.

Cuando usarlo

Usa el divisor entrenable en los siguientes escenarios:

Solicitudes de hipotecas: paquetes divididos que contienen ID, formularios de solicitud y extractos bancarios.
Incorporación de Healthcare: verifica la presencia de los documentos necesarios, como certificados médicos, formularios NPI e ID.
Reclamaciones de seguro: formularios de reclamación separados, registros médicos y recibos.
Procesamiento de facturas: gestiona paquetes de facturas de varios proveedores.
Limpieza de documentos: elimina las páginas irrelevantes para que solo se procese el contenido relevante en sentido descendente.

Crear un nuevo proyecto

Al crear un nuevo proyecto, los tenants ubicados en Europa y EE. UU. pueden habilitar el nuevo modelo de divisor y clasificador. Este modelo entrenable se puede entrenar para dividir y clasificar documentos complejos, lo que permite procesar paquetes de documentos.

Sigue las instrucciones de esta página para crear un proyecto de Document Understanding^TM y habilitar el nuevo modelo de divisor y clasificador.

Requisitos previos

Antes de comenzar, asegúrate de que se cumplan las siguientes condiciones:

Tu tenant se encuentra en Europa o en los EE. UU.
Está instalada la versión 6.27.0 o posterior de IntelligentOCR.Activities.
Tienes habilitados proyectos modernos en tu tenant de Automation Cloud.
Tienes paquetes de documentos de ejemplo representativos de tu caso de uso de producción.

Abre Document Understanding.
Selecciona Crear proyecto.
Introduce el nombre de proyecto deseado.
Para Automation Cloud y Test Cloud, selecciona Moderna para utilizar la experiencia moderna.
Activa el interruptor Habilitar nuevo modelo divisor y clasificador.
Configura las Opciones avanzadas si es necesario.
1. Activa la alternancia Habilitar división para permitir que el modelo divida los documentos en archivos individuales antes de la clasificación. También puedes habilitar esta opción desde la pantalla Configuración del proyecto .
  Importante:
  Cuando la opción Habilitar división está desactivada, el modelo se ejecuta en modo de solo clasificación:
  - La interfaz de anotación de división no está disponible.
  - Los documentos no se pueden dividir manualmente.
  - Para el entrenamiento, carga documentos de una sola página o de varias páginas del mismo tipo.
  - Todas las demás funcionalidades siguen sin cambios.
2. Selecciona el método OCR en la lista desplegable Método OCR .
3. Introduce la clave API del OCR.
  Nota:
  Este campo se rellena automáticamente si seleccionas un UiPath® OCR.
4. Introduce la URL de OCR. Para obtener la lista completa de URL para UiPath OCR, consulta la página Puntos finales públicos .
5. Elige si aplicar OCR en PDF. El valor predeterminado es Automático.
Selecciona Crear.

Resultado

Su proyecto se ha creado. La sección Crear estará disponible, donde puedes cargar documentos para su extracción o clasificación.

Elige una de las dos opciones disponibles:

Extraer datos de documentos: extrae campos específicos de tus documentos, como números de factura, fechas y totales. Utiliza esta opción cuando necesites extraer campos de documentos.
Clasificar y dividir documentos: ordena los documentos por tipo y separa varios documentos dentro de un solo archivo. Utiliza esta opción cuando necesites dividir y clasificar documentos.

Extraer datos de documentos

Selecciona un tipo de documento.
Selecciona Cargar o arrastra y suelta tus archivos dentro del nuevo tipo de documento. Espera a que finalice la carga.

Clasificar y dividir documentos

Ciertos archivos complejos contienen varios tipos de documento. El divisor entrenable detecta dónde comienza y termina cada subdocumento y clasifica cada sección en consecuencia.

Selecciona Clasificar y dividir documentos.
Carga tus paquetes de documentos. Espera a que finalicen la carga y el procesamiento.
Selecciona un documento de la sección cargar.
Selecciona Dividir. Se abre la interfaz de anotación de división.
Nota:
Si el proyecto ya tiene un modelo entrenado, los documentos cargados se anotan previamente utilizando ese modelo. Esto ayuda a acelerar la anotación y te permite revisar los resultados de la predicción en nuevos documentos.
Selecciona Nuevo tipo de documento para crear un tipo de documento para cada elemento de tu taxonomía. Elija un tipo de documento predefinido o cree uno personalizado. Para los tipos de documentos personalizados, proporciona lo siguiente:
- Nombre: un nombre claro y descriptivo para el tipo de documento.
- Descripción: de una a tres frases que explican el propósito del documento y qué lo hace distinto de tipos similares.
- Indicadores clave: campos o términos separados por comas que identifican de forma única este tipo de documento. Las descripciones y los indicadores clave afectan directamente a la precisión del modelo. Si las puntuaciones de clasificación son bajas, refina las descripciones antes de añadir más datos de entrenamiento. Ejemplo para un tipo de documento Factura:
- Descripción: una solicitud de pago formal emitida por un vendedor a un comprador, que enumera elementos de línea, cantidades e importes totales adeudados.
- Indicadores clave: número de factura, fecha de la factura, importe total, información del vendedor, información del comprador, condiciones de pagoConsejos para escribir descripciones eficaces:
- Incluye terminología específica para el tipo de documento.
- Si se confunden dos tipos de documento con frecuencia, añade detalles distintivos a ambas descripciones.
Asigna las páginas no necesarias para el procesamiento posterior al tipo Desconocido . Esto incluye las páginas de portada, las páginas en blanco y las hojas de separación. El modelo predice estas páginas como Desconocidas en runtime.
Selecciona los límites entre los tipos de documento para indicar dónde comienza y termina cada documento.
Utiliza el menú desplegable para asignar cada intervalo de páginas a un tipo de documento.
Selecciona Confirmar cuando hayas terminado de anotar el documento.

Resultado

Cada subdocumento aparece en su tipo de documento correspondiente en la sección Crear . Cada subdocumento está preanotado con el esquema de su tipo de documento asignado.

Prácticas recomendadas de entrenamiento

Entrena con paquetes de documentos de producción originales y no divididos, no con documentos individuales divididos previamente.

El modelo aprende los patrones de agrupación de documentos del contexto en torno a cada tipo de documento: lo que aparece antes y después de él en un paquete real. El entrenamiento en documentos divididos previamente elimina este contexto y reduce la precisión de la división.

Enfoque recomendado:

Carga paquetes de producción que contengan varios tipos de documentos.
Incluye paquetes que representen el intervalo de pedidos y recuentos de documentos que se ven en producción.
Trata de obtener un conjunto de datos equilibrado en todos los tipos de documentos.
Nota:
El entrenamiento en documentos predivididos produce un modelo de trabajo, pero la precisión de la división es menor que cuando se entrena en paquetes originales.

Entrenamiento del modelo

Inicia el entrenamiento del modelo manualmente utilizando el botón Iniciar entrenamiento en la píldora de estado Entrenamiento del modelo , que se muestra en la esquina superior derecha del panel Clasificación . El entrenamiento no comienza automáticamente.

El botón se habilita una vez que se cumplen las dos condiciones siguientes:

Se han creado y anotado al menos cinco subdocumentos.
Nota:
Por ejemplo, si utilizas un único PDF, debe contener al menos cinco subdocumentos. Si utilizas dos PDF, uno debe contener al menos dos subdocumentos y el otro al menos tres.
se ha confirmado un documento.

Una vez alcanzado el umbral, selecciona Iniciar entrenamiento para poner en cola una ejecución. La píldora de estado pasa por En cola, entrenamiento en curso y, por último, Entrenado , mostrando la puntuación, la fecha del último entrenamiento, la duración y la versión del modelo base. Si un entrenamiento falla, el píldora muestra el error y una acción Reintentar .

Para obtener más información sobre los estados de los botones, el contador de cambios y el ciclo de vida completo del entrenamiento, consulta Iniciar una ejecución de entrenamiento.

Requisitos de datos de entrenamiento

Requisitos	Detalles
Tipos de documento mínimos	1
Muestras totales mínimas	5 documentos en todos los tipos de documentos
Muestras mínimas por tipo	1
Recomendado para obtener resultados fiables	50 a 100 paquetes
Tamaño máximo del documento	160 MB o 500 páginas
División de entrenamiento/prueba	Automático: 80 % de entrenamiento, 20 % de prueba

Mejorar los resultados del entrenamiento

Cuando el rendimiento no sea satisfactorio, utiliza uno de estos enfoques:

Refina las descripciones y los indicadores clave de los tipos de documentos de rendimiento inferior.
Añade más muestras de entrenamiento para tipos de documentos con baja precisión.

Predicciones de división y clasificación

Cada vez que se entrena un nuevo modelo, todos los documentos del proyecto reciben predicciones del modelo entrenado. Esto te permite revisar el rendimiento del modelo de clasificación.

La columna Tipo muestra la verdad sobre el terreno: el tipo de documento como anotado. La columna Tipo previsto muestra el tipo previsto por el modelo.

De forma predeterminada, solo se muestran los paquetes de documentos. Para ver los subdocumentos dentro de cada paquete, selecciona Ver y marca Incluir subdocumentos.

Las predicciones también están disponibles en la interfaz de anotación habilitando la alternancia Mostrar predicción .

Comprender las métricas

Selecciona la pestaña Medir para revisar el rendimiento del modelo.

Métrica	Qué mide	Qué hacer si es bajo
División	Precisión de la detección de límites de documentos, independiente de la clasificación	Añade datos de entrenamiento con ejemplos de límite más variados
Clasificación	Precisión de la asignación de tipo de documento, independiente de los límites	Añade más páginas de entrenamiento para tipos de documentos de bajo rendimiento
Descripción general	Puntuación combinada: el límite y la asignación de tipo deben ser correctos	Identifica si la división o la clasificación es inferior y aborda esto primero

Un subdocumento se cuenta como correcto solo cuando tanto la detección de límites como la asignación de tipo son correctas.

División

Con qué precisión detecta el modelo los límites del documento, dónde termina un documento y comienza el siguiente dentro de un archivo. Se muestra como una puntuación F1 en el nivel de página, medida independientemente de la clasificación, por lo que refleja solo la calidad dividida.

Interpreta la puntuación de la siguiente manera:

Puntuación alta: cuanto más alta sea la puntuación, mejor.
Puntuación baja: es probable que el modelo detecte transiciones de documentos a ese tipo que no encontró en el entrenamiento. Añade más ejemplos que incluyan esas transiciones.
N/A: no hay suficientes transiciones relevantes en el conjunto de evaluación para calcular una puntuación de división para este tipo.

Clasificación

Con qué precisión asigna el modelo el tipo correcto a cada página, medida independientemente de la división. Se muestra como una puntuación F1 en el nivel de página.

Interpreta la puntuación de la siguiente manera:

Puntuación alta: cuanto más alta sea la puntuación, mejor.
Puntuación baja: añade más ejemplos de ese tipo para que el modelo cubra más variaciones de diseño y contenido.

Descripción general

La medida combinada de lo bien que el modelo divide y clasifica este tipo de documento. Refleja la calidad de extremo a extremo, por lo que falla si la división o la clasificación son débiles. Cuanto más alta sea la puntuación, mejor.

Nota:

Los documentos grandes con muchas páginas Desconocidas en el conjunto de pruebas pueden reducir las puntuaciones de forma desproporcionada. Si las puntuaciones aparecen inesperadamente bajas, comprueba si los documentos atípicos están sesgando el conjunto de pruebas.

Consumir el modelo en runtime

A través de actividades de IntelligentOCR

Utiliza la actividad Clasificador de proyectos de Document Understanding del paquete IntelligentOCR. Cuando la división está habilitada en el proyecto, la actividad devuelve varios ResultadosDeClasificación, uno por subdocumento detectado. Itera sobre los resultados para realizar la validación o extracción en cada subdocumento.

A través de actividades de DocumentUnderstanding

Utiliza la actividad Clasificar documento .

A través de API

Usa el punto final classify. Cuando la división está habilitada en la versión del proyecto, el punto final realiza la división y devuelve resultados de clasificación para cada subdocumento identificado.

Importar y exportar

Exportar un conjunto de datos de modelo entrenado

Si una versión de proyecto contiene un clasificador de divisores entrenado, hay dos opciones de exportación disponibles:

Exportación del conjunto de datos de tipo de documento: exportación estándar de datos anotados.
Exportación de divisor y clasificador: exportación completa del proyecto, incluido el modelo entrenado.

Solo las versiones del proyecto con un clasificador de divisor entrenado aparecen en la lista desplegable Exportar divisor y clasificador .

Importar en un nuevo proyecto

La opción de importación está disponible en la página de clasificación vacía. Importar un archivo zip asigna los documentos a sus tipos de documento y activa el entrenamiento automáticamente.

Limitaciones

Disponible solo en tenants ubicados en Europa y los EE. UU.
Las páginas no se pueden reordenar ni eliminar en la interfaz de anotación.
La información de división no está disponible en la página Monitor.
No se admite el reentrenamiento desde Action Center para los modelos de división y clasificación.

¿Te ha resultado útil esta página?

AnteriorCrear un proyecto

Sig.Importar documentos

Información general​

Cuando usarlo​

Crear un nuevo proyecto​

Requisitos previos​

Resultado​

Extraer datos de documentos​

Clasificar y dividir documentos​

Resultado​

Prácticas recomendadas de entrenamiento​

Entrenamiento del modelo​

Requisitos de datos de entrenamiento​

Mejorar los resultados del entrenamiento​

Predicciones de división y clasificación​

Comprender las métricas​

División​

Clasificación​

Descripción general​

Consumir el modelo en runtime​

A través de actividades de IntelligentOCR​

A través de actividades de DocumentUnderstanding​

A través de API​

Importar y exportar​

Exportar un conjunto de datos de modelo entrenado​

Importar en un nuevo proyecto​

Limitaciones​

¿Te ha resultado útil esta página?

Información general

Cuando usarlo

Crear un nuevo proyecto

Requisitos previos

Resultado

Extraer datos de documentos

Clasificar y dividir documentos

Resultado

Prácticas recomendadas de entrenamiento

Entrenamiento del modelo

Requisitos de datos de entrenamiento

Mejorar los resultados del entrenamiento

Predicciones de división y clasificación

Comprender las métricas

División

Clasificación

Descripción general

Consumir el modelo en runtime

A través de actividades de IntelligentOCR

A través de actividades de DocumentUnderstanding

A través de API

Importar y exportar

Exportar un conjunto de datos de modelo entrenado

Importar en un nuevo proyecto

Limitaciones