Communications Mining
Más reciente
False
Imagen de fondo del banner
Guía de usuario de Communications Mining
Última actualización 18 de abr. de 2024

Preguntas frecuentes sobre el entrenamiento de modelos

La información de esta página se divide en dos secciones:
  • Entrenamiento general del modelo
  • Entrenamiento de etiquetas

Entrenamiento general del modelo

¿Cuál es el objetivo de entrenar un modelo?

El objetivo de entrenar un modelo es crear un conjunto de datos de entrenamiento que sea lo más representativo posible del conjunto de datos en su conjunto, de modo que la plataforma pueda predecir con precisión y confianza las etiquetas y entidades relevantes para cada mensaje. Las etiquetas y entidades dentro de un conjunto de datos deben estar intrínsecamente vinculadas a los objetivos generales del caso de uso y proporcionar un valor comercial significativo.

¿Por qué no puedo ver nada en Discover si acabo de cargar datos en la plataforma?

Tan pronto como los datos se cargan en la plataforma, la plataforma inicia un proceso llamado aprendizaje no supervisado, mediante el cual agrupa los mensajes en grupos de intención semántica similar. Este proceso puede tardar hasta un par de horas, dependiendo del tamaño del conjunto de datos, y los clústeres aparecerán una vez que se haya completado.

¿Cuántos datos históricos necesito para entrenar un modelo?

Para poder entrenar un modelo, necesitas una cantidad mínima de datos históricos existentes. Esto se utiliza como datos de entrenamiento para proporcionar a la plataforma la información necesaria para predecir con confianza cada uno de los conceptos relevantes para tu análisis y/o automatización.

La recomendación para cualquier caso de uso es un mínimo de 12 meses de datos históricos, con el fin de capturar adecuadamente cualquier estacionalidad o irregularidad en los datos (por ejemplo, procesos de fin de mes y temporada alta).

¿Tengo que guardar mi modelo cada vez que hago un cambio?

No, no es necesario guardar el modelo después de realizar cualquier cambio. Cada vez que entrenas la plataforma con tus datos (es decir, etiquetando cualquier mensaje), se crea una nueva versión del modelo para tu conjunto de datos. Las estadísticas de rendimiento de las versiones anteriores del modelo se pueden ver en Validación.

¿Cómo sé cuál es el rendimiento del modelo?

Consulta la página Validación en la plataforma, que informa de varias medidas de rendimiento y proporciona una calificación holística del estado del modelo. Esta página se actualiza después de cada evento de entrenamiento y puede utilizarse para identificar áreas en las que el modelo puede necesitar más ejemplos de entrenamiento o algunas correcciones de etiquetas para garantizar la coherencia.

Consulta la página Validación para obtener explicaciones completas sobre el rendimiento del modelo y cómo mejorarlo.

¿Por qué solo hay 30 clústeres disponibles y podemos configurarlos individualmente?

Los clústeres son una forma útil de ayudarte a construir rápidamente tu taxonomía, pero los usuarios pasarán la mayor parte de su tiempo entrenando en Explorar en lugar de Descubrir.

Si los usuarios pasan demasiado tiempo etiquetando a través de clústeres, existe el riesgo de sobreajustar el modelo para buscar mensajes que solo se ajusten a estos clústeres al hacer predicciones. Cuantos más ejemplos variados haya para cada etiqueta, mejor será el modelo para encontrar las diferentes formas de expresar la misma intención o concepto. Esta es una de las principales razones por las que solo mostramos 30 clústeres a la vez.

Sin embargo, una vez que se ha completado el entrenamiento suficiente o se ha añadido un volumen significativo de datos a la plataforma (ver aquí), Discover vuelve a entrenar. Cuando se reentrena, tiene en cuenta el entrenamiento existente hasta la fecha e intentará presentar nuevos clústeres que no estén bien cubiertos por la taxonomía actual.

Para obtener más información sobre Discover, consulta aquí.

¿Cuántos mensajes hay en cada clúster?

Hay 30 clústeres en total, cada uno con 12 mensajes. En la plataforma, puedes filtrar el número de mensajes que se muestran en la página en incrementos de entre 6 y 12 por página. Nuestra recomendación es etiquetar 6 a la vez para garantizar que se reduce el riesgo de etiquetar parcialmente cualquier mensaje.

¿Qué significan precisión y recuperación?

La precisión y la recuperación son métricas utilizadas para medir el rendimiento de un modelo de aprendizaje automático. Puedes encontrar una descripción detallada de cada uno en la sección Uso de la validación de nuestras guías prácticas.

¿Puedo volver a una versión anterior de mi modelo?

Puedes acceder a la descripción general de la validación de modelos anteriores pasando el ratón por encima de "Versión del modelo" en la esquina superior izquierda de la página Validación. Esto puede ser útil para realizar un seguimiento y comparar el progreso a medida que entrenas tu modelo.

Si necesitas revertir tu modelo a una versión anclada anterior, consulta aquí para obtener más detalles.

Entrenamiento de etiquetas

¿Puedo cambiar el nombre de una etiqueta más adelante?

Sí, es muy fácil de hacer. Puedes ir a la configuración de cada etiqueta y cambiarle el nombre en cualquier momento. Puedes ver cómo hacerlo aquí.

¿Cómo puedo saber el número de mensajes que he etiquetado?

La información sobre tu conjunto de datos, incluido el número de mensajes que se han etiquetado, se muestra en la página Configuración de conjuntos de datos. Para ver cómo acceder, haz clic aquí.

Una de mis etiquetas está funcionando mal, ¿qué puedo hacer para mejorarlo?

Si puedes ver en la página Validación que tu etiqueta está funcionando mal, hay varias formas de mejorar su rendimiento. Consulta aquí para obtener más información.

¿Qué indica el dial rojo junto a mi etiqueta o entidad? ¿Cómo me deshago de él?

Los pequeños diales rojos junto a cada etiqueta/entidad indican si se necesitan más ejemplos para que la plataforma estime con precisión el rendimiento de la etiqueta/entidad. Los diales comienzan a desaparecer a medida que proporcionas más ejemplos de entrenamiento y desaparecerán por completo una vez que alcances los 25 ejemplos.

Después de esto, la plataforma podrá evaluar eficazmente el rendimiento de una etiqueta/entidad determinada y puede devolver una advertencia de rendimiento si la etiqueta/entidad no está en buen estado.

¿Debo evitar etiquetar mensajes vacíos/poco informativos?

La plataforma puede aprender de los mensajes vacíos y los mensajes no informativos, siempre que estén etiquetados correctamente. Sin embargo, vale la pena señalar que las etiquetas no informativas probablemente necesitarán un número significativo de ejemplos de entrenamiento, además de estar agrupadas libremente por concepto, para garantizar el mejor rendimiento.

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.