Document Understanding
2022.10
False
Imagen de fondo del banner
Guía del usuario de Document Understanding
Última actualización 19 de abr. de 2024

Visión general de clasificación de documentos

¿Qué es el entrenamiento de la clasificación de documentos?

El entrenamiento de la clasificación de documentos es un componente del marco de Document Understanding que ayuda a cerrar el bucle de retroalimentación para los clasificadores que son capaces de aprender de los comentarios humanos.

Cuándo debe usarse el entrenamiento por clasificación

Puedes crear procesos de Document Understanding que no contengan ningún componente de entrenamiento. Esto puede ocurrir por múltiples razones, de las cuales algunas son:

  • los clasificadores que estás usando no son compatibles con el reentrenamiento
  • no deseas realizar un reentrenamiento, ya que prefieres que el proceso use siempre el mismo entrenamiento
  • quieres actualizar el entrenamiento del clasificador sin conexión y estás gestionando sus actualizaciones fuera de tu proceso de DU.

Sin embargo, el entrenamiento de tus clasificadores como parte del uso regular del proceso es muy beneficioso en la mayoría de los casos, porque los clasificadores pueden obtener sus propios datos de entrenamiento y realizar sus propias actualizaciones ingiriendo la información de validación humana, sin requerir que actualices tus flujos de trabajo ya existentes. Se convierten, por así decirlo, en algoritmos de autoaprendizaje que pueden enseñarse a sí mismos a actuar mejor en el futuro, basándose en lo que los humanos han validado como datos correctos.

Cómo usar el componente de entrenamiento en clasificación de documentos

El entrenamiento de la clasificación se realiza a través de la actividad Entrenar el alcance de los clasificadores. Puedes entrenar uno o más clasificadores, ya que la actividad de ámbito tiene la función de configurar y ejecutar uno o más algoritmos para el entrenamiento de la clasificación de una sola vez.

El entrenamiento de la clasificación suele ejecutarse tras la validación de la clasificación de documentos: solo los comentarios confirmados por humanos deben enviarse a los clasificadores para el entrenamiento, para garantizar la precisión de los datos de entrenamiento recibidos por los algoritmos.

El entrenamiento de la clasificación debe ejecutarse tanto en el caso de una clasificación fallida (ninguna clasificación automática, o una clasificación automática que fue corregida por el trabajador), como en el caso de una clasificación con éxito (ninguna corrección hecha por el usuario en la etapa de validación, todos los resultados automáticos confirmados). Esto se debe a que ambos casos son útiles para que los algoritmos aprendan.

Se pueden entrenar tanto los clasificadores que se han usado en la fase de clasificación de documentos, como los clasificadores que no se han usado para la predicción de la clasificación. Este último enfoque se usa para recopilar datos de entrenamiento y entrenar un clasificador desde cero, con la intención de ponerlo en práctica más adelante añadiéndolo a los flujos de trabajo de Document Understanding.

En resumen, esto es lo que hace Entrenar el alcance de los clasificadores:

  • Proporciona a todos los entrenadores de clasificadores (algoritmos de entrenamiento) las configuraciones necesarias para su ejecución.
  • Acepta uno o más entrenadores clasificadores.
  • Permite filtrar el tipo de documento y asignar la taxonomía entre la taxonomía del proyecto y cualquier taxonomía interna del clasificador.

Entrenar el alcance de los clasificadores te permite configurarlo mediante el asistente Configurar los clasificadores. Es posible personalizar:

  • qué tipos de documentos se envían para el entrenamiento a qué entrenador clasificador,
  • cuál es la asignación de la taxonomía, a nivel de tipo de documento, entre la taxonomía del proyecto y la taxonomía interna del clasificador (si la hubiera).

Entrenadores de clasificadores disponibles

Los clasificadores y sus respectivas actividades de entrenamiento se pueden encontrar en los paquetes UiPath.IntelligentOCR.Activities.

Los entrenadores clasificadores disponibles son:

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.