Document Understanding
Más reciente
False
Imagen de fondo del banner
Guía del usuario de Document Understanding
Última actualización 30 de abr. de 2024

Acerca de los procesos

Los paquetes ML de Document Understanding pueden ejecutar los tres tipos de procesos:

Una vez completado, una ejecución de un proceso tiene outputs y registros asociados. Para ver esta información, en la pestaña Procesos de la barra lateral izquierda, haz clic en un proceso para abrir la vista de procesos que consiste en lo siguiente:

  • los detalles del proceso, como el tipo, el nombre y la versión del Paquete ML, el conjunto de datos, el uso de la GPU, los parámetros y el tiempo de ejecución
  • el panel de Salidas; que siempre incluye un archivo _results.json con un resumen de los detalles del proceso
  • la página Registros; los registros también pueden obtenerse en la pestaña Registros ML en la barra lateral izquierda
Todos los procesos devuelven puntuaciones en tres archivos diferentes:
  • evaluation_scores_<package name>.txt : este archivo contiene puntuaciones de precisión para todos los campos.
  • evaluation_<package name>.xlsx : este archivo contiene un desglose detallado de la precisión por campo y por lote, así como una comparación en paralelo para cada campo, con resaltados de color para los campos omitidos (rojo) o parcialmente coincidentes (amarillo).
  • evaluation_F1_scores.txt : este archivo contiene las puntuaciones F1 de todos los campos.
La precisión se obtiene dividiendo el número de coincidencias entre el número total de predicciones. Una coincidencia obtiene una importancia de 1, mientras que una coincidencia parcial obtiene una importancia correspondiente a la distancia de Levenshtein entre la predicción y el valor real.
Nota:

Las coincidencias parciales que usan la distancia de Levenshtein son el método de puntuación predeterminado en los campos con Tipo de contenido: Cadena. Todos los demás tipos de contenido (fechas, números, números de identificación, números de teléfono) solo usan la puntuación de coincidencia exacta.

Para los campos de cadena, puedes cambiar esta configuración en la pestaña Avanzado del cuadro de diálogo Configuración de campo en la vista Tipo de documento de Document Understanding.

Por ejemplo, si un conjunto de datos de evaluación tiene 100 documentos y un campo, por ejemplo, Número de orden de compra, aparece en la mitad de los documentos, entonces si el modelo predijo 40 correctamente y 10 parcialmente correctos con una distancia de Levenshtein de 0,8, entonces la la precisión sería (40 + 10 x 0,8 + 50) / 100 = 98%.

Nota:

Tenga en cuenta que los 50 documentos en los que falta el campo y el modelo no predijo nada también se cuentan como predicciones correctas.

En los procesos de entrenamiento, las puntuaciones se calculan en el conjunto de datos de validación. El conjunto de datos de validación es un subconjunto seleccionado aleatoriamente del 20% del conjunto de datos de entrenamiento total enviado en el proceso de entrenamiento.

Los procesos de entrenamiento o los procesos completos también pueden usarse para:

Atención:

Losprocesos de entrenamiento y los procesos completos admiten conjuntos de entrenamiento de un máximo de 18 000 páginas etiquetadas.

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.