- Primeros pasos
- Equilibrio
- Clústeres
- Deriva del concepto
- Cobertura
- Conjuntos de datos
- Campos generales (anteriormente entidades)
- Etiquetas (predicciones, niveles de confianza, jerarquía, etc.)
- Modelos
- Transmisiones
- Clasificación del modelo
- Proyectos
- Precisión
- Recordar
- Mensajes revisados y no revisados
- Fuentes
- Taxonomías
- Formación
- Predicciones positivas y negativas verdaderas y falsas
- Validación
- Mensajes
- Administración
- Gestionar fuentes y conjuntos de datos
- Comprender la estructura de datos y los permisos
- Crear un origen de datos en la GUI
- Cargar un archivo CSV en un origen
- Crear un nuevo conjunto de datos
- Fuentes y conjuntos de datos multilingües
- Habilitar sentimiento en un conjunto de datos
- Modificar la configuración de un conjunto de datos
- Eliminar mensajes a través de la IU
- Eliminar un conjunto de datos
- Exportar un conjunto de datos
- Uso de integraciones de Exchange
- Preparando datos para cargar archivos .CSV
- Entrenamiento y mantenimiento de modelos
- Comprender las etiquetas, los campos generales y los metadatos
- Jerarquía de etiquetas y mejores prácticas
- Definición de los objetivos de taxonomía
- Casos de uso de análisis frente a automatización
- Convertir tus objetivos en etiquetas
- Crear tu estructura de taxonomía
- Mejores prácticas de diseño de taxonomía
- Importar tu taxonomía
- Descripción general del proceso de entrenamiento del modelo
- Anotación generativa (NUEVO)
- Comprender el estado de tu conjunto de datos
- Entrenamiento de modelos y mejores prácticas de anotación
- Entrenamiento con análisis de sentimiento de etiqueta habilitado
- Entrenamiento
- Introducción a Refinar
- Explicación de la precisión y la recuperación
- Precisión y recuperación
- ¿Cómo funciona la validación?
- Comprender y mejorar el rendimiento del modelo
- ¿Por qué una etiqueta puede tener una precisión media baja?
- Entrenamiento utilizando la etiqueta Comprobar y la etiqueta Perdida
- Entrenamiento mediante la etiqueta de aprendizaje (refinar)
- Entrenamiento mediante Buscar (Refinar)
- Comprender y aumentar la cobertura
- Mejorar el equilibrio y utilizar Reequilibrar
- Cuándo dejar de entrenar tu modelo
- Uso de campos generales
- Extracción generativa
- Uso de análisis y supervisión
- Minería de automatizaciones y comunicaciones
- Información de licencia
- Preguntas frecuentes y más
- Preguntas frecuentes sobre el acceso y la gestión de usuarios
- Preguntas frecuentes sobre la carga y gestión de datos
- Preguntas frecuentes sobre el entrenamiento de modelos
- Preguntas frecuentes sobre análisis
- Preguntas frecuentes sobre automatización
Preguntas frecuentes sobre el entrenamiento de modelos
- Entrenamiento general del modelo
- Entrenamiento de etiquetas
El objetivo de entrenar un modelo es crear un conjunto de datos de entrenamiento que sea lo más representativo posible del conjunto de datos en su conjunto, de modo que la plataforma pueda predecir con precisión y confianza las etiquetas relevantes y los campos generales para cada mensaje. Las etiquetas y los campos generales dentro de un conjunto de datos deben estar intrínsecamente vinculados a los objetivos generales del caso de uso y proporcionar un valor comercial significativo.
Tan pronto como los datos se cargan en la plataforma, la plataforma inicia un proceso llamado aprendizaje no supervisado, mediante el cual agrupa los mensajes en grupos de intención semántica similar. Este proceso puede tardar hasta un par de horas, dependiendo del tamaño del conjunto de datos, y los clústeres aparecerán una vez que se haya completado.
Para poder entrenar un modelo, necesitas una cantidad mínima de datos históricos existentes. Esto se utiliza como datos de entrenamiento para proporcionar a la plataforma la información necesaria para predecir con confianza cada uno de los conceptos relevantes para tu análisis y/o automatización.
La recomendación para cualquier caso de uso es un mínimo de 12 meses de datos históricos, con el fin de capturar adecuadamente cualquier estacionalidad o irregularidad en los datos (por ejemplo, procesos de fin de mes y temporada alta).
No, no es necesario guardar el modelo después de realizar cualquier cambio. Cada vez que entrenas la plataforma con tus datos (es decir, anotando cualquier mensaje), se crea una nueva versión del modelo para tu conjunto de datos. Las estadísticas de rendimiento de las versiones anteriores del modelo se pueden ver en Validación.
Consulta la página Validación en la plataforma, que informa de varias medidas de rendimiento y proporciona una calificación holística del estado del modelo. Esta página se actualiza después de cada evento de entrenamiento y puede utilizarse para identificar áreas en las que el modelo puede necesitar más ejemplos de entrenamiento o algunas correcciones de etiquetas para garantizar la coherencia.
Consulta la página Validación para obtener explicaciones completas sobre el rendimiento del modelo y cómo mejorarlo.
Los clústeres son una forma útil de ayudarte a construir rápidamente tu taxonomía, pero los usuarios pasarán la mayor parte de su tiempo entrenando en Explorar en lugar de Descubrir.
Si los usuarios pasan demasiado tiempo anotando a través de clústeres, existe el riesgo de sobreajustar el modelo para buscar mensajes que solo se ajusten a estos clústeres al hacer predicciones. Cuantos más ejemplos variados haya para cada etiqueta, mejor será el modelo para encontrar las diferentes formas de expresar la misma intención o concepto. Esta es una de las principales razones por las que solo mostramos 30 clústeres a la vez.
Sin embargo, una vez que se ha completado el entrenamiento suficiente o se ha añadido un volumen significativo de datos a la plataforma (ver aquí), Discover vuelve a entrenar. Cuando se reentrena, tiene en cuenta el entrenamiento existente hasta la fecha e intentará presentar nuevos clústeres que no estén bien cubiertos por la taxonomía actual.
Para obtener más información sobre Discover, consulta aquí.
Hay 30 clústeres en total, cada uno con 12 mensajes. En la plataforma, puedes filtrar el número de mensajes que se muestran en la página en incrementos de entre 6 y 12 por página. Nuestra recomendación es anotar 6 a la vez para garantizar que se reduce el riesgo de anotar parcialmente cualquier mensaje.
La precisión y la recuperación son métricas utilizadas para medir el rendimiento de un modelo de aprendizaje automático. Puedes encontrar una descripción detallada de cada uno en la sección Uso de la validación de nuestras guías prácticas.
Puedes acceder a la descripción general de la validación de modelos anteriores pasando el ratón por encima de "Versión del modelo" en la esquina superior izquierda de la página Validación. Esto puede ser útil para realizar un seguimiento y comparar el progreso a medida que entrenas tu modelo.
Si necesitas revertir tu modelo a una versión anclada anterior, consulta aquí para obtener más detalles.
Sí, es muy fácil de hacer. Puedes ir a la configuración de cada etiqueta y cambiarle el nombre en cualquier momento. Puedes ver cómo hacerlo aquí.
La información sobre tu conjunto de datos, incluido el número de mensajes que se han anotado, se muestra en la página Configuración de conjuntos de datos. Para ver cómo acceder, haz clic aquí.
Si puedes ver en la página Validación que tu etiqueta está funcionando mal, hay varias formas de mejorar su rendimiento. Consulta aquí para obtener más información.
Los pequeños diales rojos junto a cada etiqueta/campo general indican si se necesitan más ejemplos para que la plataforma estime con precisión el rendimiento de la etiqueta/campo general. Los diales comienzan a desaparecer a medida que proporcionas más ejemplos de entrenamiento y desaparecerán por completo una vez que alcances los 25 ejemplos.
Después de esto, la plataforma podrá evaluar eficazmente el rendimiento de una etiqueta/campo general determinado y puede devolver una advertencia de rendimiento si la etiqueta/campo general no está en buen estado.
La plataforma puede aprender de los mensajes vacíos y los mensajes no informativos siempre que estén anotados correctamente. Sin embargo, vale la pena señalar que las etiquetas no informativas probablemente necesitarán un número significativo de ejemplos de entrenamiento, además de estar agrupadas libremente por concepto, para garantizar el mejor rendimiento.
- Entrenamiento general del modelo
- ¿Cuál es el objetivo de entrenar un modelo?
- ¿Por qué no puedo ver nada en Discover si acabo de cargar datos en la plataforma?
- ¿Cuántos datos históricos necesito para entrenar un modelo?
- ¿Tengo que guardar mi modelo cada vez que hago un cambio?
- ¿Cómo sé cuál es el rendimiento del modelo?
- ¿Por qué solo hay 30 clústeres disponibles y podemos configurarlos individualmente?
- ¿Cuántos mensajes hay en cada clúster?
- ¿Qué significan precisión y recuperación?
- ¿Puedo volver a una versión anterior de mi modelo?
- Entrenamiento de etiquetas
- ¿Puedo cambiar el nombre de una etiqueta más adelante?
- ¿Cómo puedo saber el número de mensajes que he anotado?
- Una de mis etiquetas está funcionando mal, ¿qué puedo hacer para mejorarlo?
- ¿Qué indica el dial rojo junto a mi etiqueta o campo general? ¿Cómo me deshago de él?
- ¿Debo evitar anotar mensajes vacíos/poco informativos?