- Primeros pasos
- Equilibrio
- Clústeres
- Deriva del concepto
- Cobertura
- Conjuntos de datos
- Campos generales (anteriormente entidades)
- Etiquetas (predicciones, niveles de confianza, jerarquía, etc.)
- Modelos
- Transmisiones
- Clasificación del modelo
- Proyectos
- Precisión
- Recordar
- Mensajes revisados y no revisados
- Fuentes
- Taxonomías
- Formación
- Predicciones positivas y negativas verdaderas y falsas
- Validación
- Mensajes
- Administración
- Gestionar fuentes y conjuntos de datos
- Comprender la estructura de datos y los permisos
- Create or delete a data source in the GUI
- Cargar un archivo CSV en un origen
- Preparando datos para cargar archivos .CSV
- Crear un nuevo conjunto de datos
- Fuentes y conjuntos de datos multilingües
- Habilitar sentimiento en un conjunto de datos
- Modificar la configuración de un conjunto de datos
- Eliminar mensajes a través de la IU
- Eliminar un conjunto de datos
- Exportar un conjunto de datos
- Uso de integraciones de Exchange
- Entrenamiento y mantenimiento de modelos
- Comprender las etiquetas, los campos generales y los metadatos
- Jerarquía de etiquetas y mejores prácticas
- Definición de los objetivos de taxonomía
- Casos de uso de análisis frente a automatización
- Convertir tus objetivos en etiquetas
- Crear tu estructura de taxonomía
- Mejores prácticas de diseño de taxonomía
- Importar tu taxonomía
- Descripción general del proceso de entrenamiento del modelo
- Anotación generativa (NUEVO)
- Estado de Dastaset
- Entrenamiento de modelos y mejores prácticas de anotación
- Entrenamiento con análisis de sentimiento de etiqueta habilitado
- Comprender los requisitos de datos
- Entrenamiento
- Introducción a Refinar
- Explicación de la precisión y la recuperación
- Precisión y recuperación
- ¿Cómo funciona la validación?
- Comprender y mejorar el rendimiento del modelo
- ¿Por qué una etiqueta puede tener una precisión media baja?
- Entrenamiento utilizando la etiqueta Comprobar y la etiqueta Perdida
- Entrenamiento mediante la etiqueta de aprendizaje (refinar)
- Entrenamiento mediante Buscar (Refinar)
- Comprender y aumentar la cobertura
- Mejorar el equilibrio y utilizar Reequilibrar
- Cuándo dejar de entrenar tu modelo
- Uso de campos generales
- Extracción generativa
- Uso de análisis y supervisión
- Minería de automatizaciones y comunicaciones
- Información de licencia
- Preguntas frecuentes y más
Guía de usuario de Communications Mining
Estado de Dastaset
Cada vez que apliques etiquetas o revises campos generales en tu conjunto de datos, tu modelo se volverá a entrenar y se creará una nueva versión del modelo. Para obtener más información sobre el uso de diferentes versiones del modelo, consulta aquí.
Cuando el modelo se reentrena, toma la información más reciente que se le ha proporcionado y vuelve a calcular todas sus predicciones en el conjunto de datos. Este proceso comienza cuando se inicia el entrenamiento y, a menudo, cuando Communications Mining termina de aplicar las predicciones para una versión del modelo, ya está recalculando las predicciones para una versión más reciente del modelo. Cuando dejas de entrenar después de un período de tiempo, Communications Mining se pondrá al día en breve y aplicará las predicciones que reflejan el último entrenamiento completado en el conjunto de datos.
Este proceso puede tardar algún tiempo, dependiendo de la cantidad de entrenamiento completado, el tamaño del conjunto de datos y el número de etiquetas en la taxonomía. Communications Mining tiene una función de estado útil para ayudar a los usuarios a comprender cuándo su modelo está actualizado, o si se está reentrenando y cuánto tiempo se espera que tarde.
Cuando estés en un conjunto de datos, uno de estos dos iconos en la parte superior de la página indicará su estado actual:
Este icono indica que el conjunto de datos está actualizado y se han aplicado las predicciones de la última versión del modelo. | |
Esto indica que el modelo se está reentrenando y que las predicciones pueden no estar actualizadas. |
Si pasas el ratón por encima del icono, verás más detalles sobre el estado, como se muestra a continuación:
- Entrenamiento del modelo
Este proceso implica volver a entrenar la versión actual del modelo para crear una nueva, incorporando cualquier cambio reciente, como actualizaciones de taxonomía o anotaciones de datos. El entrenamiento del modelo suele ser rápido, aunque la duración puede variar en función de varios factores
- Aplicar predicciones
Este proceso se produce después del entrenamiento del modelo, donde la plataforma recupera y aplica predicciones de la versión del modelo entrenado a cada mensaje. La aplicación de predicciones suele ser más lenta y la duración se ve afectada principalmente por el tamaño y la complejidad del conjunto de datos.
- Complejidad de la taxonomía de etiquetas y campos
Impacto: cuantas más etiquetas y campos haya en tu conjunto de datos, más tiempo llevará entrenar el modelo y aplicar predicciones en todos los mensajes.
- Uso de la extracción generativa
Impacto: la extracción generativa requiere comprender las relaciones complejas entre etiquetas y campos, lo que requiere un modelo más grande y potente, lo que puede ralentizar el entrenamiento.
- Tamaño de tu conjunto de datos (datos anotados y no anotados)
Impacto: los grandes volúmenes de mensajes anotados aumentan los puntos de datos que el modelo debe tener en cuenta durante el entrenamiento, lo que amplía el proceso. Del mismo modo, los grandes volúmenes de mensajes no anotados pueden prolongar el tiempo necesario para aplicar las predicciones.
Nota: las predicciones aparecen en cuanto están disponibles, por lo que no es necesario esperar a que terminen de aplicarse mientras se anotan. La plataforma pasará a aplicar predicciones de la última versión del modelo entrenado si se entrena antes de que se completen las predicciones de la versión anterior. - Número de conjuntos de datos que se entrenan simultáneamente
Impacto: si varios modelos se entrenan simultáneamente en tu entorno de Communications Mining, esto puede causar ralentizaciones temporales a medida que la plataforma equilibra la carga de los servicios necesarios.
- Cuándo ponerse en contacto con el soporte
- Entrenamiento: si ninguna de las razones anteriores explica la lentitud del entrenamiento y ha estado en curso durante más de 4 horas, póngase en contacto con el soporte técnico.
- Aplicar predicciones: para conjuntos de datos grandes y complejos, la aplicación de predicciones llevará mucho tiempo. Póngase en contacto con el soporte técnico solo si este proceso ha estado en curso durante más de 24 horas para una única versión del modelo.
Nota: Esto no debería bloquear la anotación de datos, ya que siempre te beneficiarás de las nuevas predicciones a medida que estén disponibles
Si tu modelo no comienza a entrenarse en el plazo de una hora después de completar una acción que debería desencadenar el entrenamiento (como anotar mensajes con etiquetas o campos), ponte en contacto con Soporte.
Comprobación del estado de entrenamiento: puedes verificar si tu modelo se está entrenando comprobando el estado del conjunto de datos en la esquina superior derecha de cualquier página dentro de un conjunto de datos