communications-mining

latest

false

Importante :

Este contenido se ha traducido mediante traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Guía de usuario de Communications Mining

Última actualización 10 de feb. de 2025

Estado de Dastaset

Comprender el estado de tu conjunto de datos

Cada vez que apliques etiquetas o revises campos generales en tu conjunto de datos, tu modelo se volverá a entrenar y se creará una nueva versión del modelo. Para obtener más información sobre el uso de diferentes versiones del modelo, consulta aquí.

Cuando el modelo se reentrena, toma la información más reciente que se le ha proporcionado y vuelve a calcular todas sus predicciones en el conjunto de datos. Este proceso comienza cuando se inicia el entrenamiento y, a menudo, cuando Communications Mining termina de aplicar las predicciones para una versión del modelo, ya está recalculando las predicciones para una versión más reciente del modelo. Cuando dejas de entrenar después de un período de tiempo, Communications Mining se pondrá al día en breve y aplicará las predicciones que reflejan el último entrenamiento completado en el conjunto de datos.

Este proceso puede tardar algún tiempo, dependiendo de la cantidad de entrenamiento completado, el tamaño del conjunto de datos y el número de etiquetas en la taxonomía. Communications Mining tiene una función de estado útil para ayudar a los usuarios a comprender cuándo su modelo está actualizado, o si se está reentrenando y cuánto tiempo se espera que tarde.

Cuando estés en un conjunto de datos, uno de estos dos iconos en la parte superior de la página indicará su estado actual:

	Este icono indica que el conjunto de datos está actualizado y se han aplicado las predicciones de la última versión del modelo.
	Esto indica que el modelo se está reentrenando y que las predicciones pueden no estar actualizadas.

Si pasas el ratón por encima del icono, verás más detalles sobre el estado, como se muestra a continuación:

Modal de estado del conjunto de datos

Nota: A veces puedes notar que Communications Mining está en proceso de reentrenamiento, a pesar de que no hayas aplicado ninguna etiqueta o revisado ningún campo general, esto puede deberse a que nuestro equipo está implementando mejoras en nuestra plataforma y nuestros modelos que pueden requerir que los modelos reentrenar. Cualquier automatización que dependa de un número de versión de modelo específico no se verá afectada.

Resolución de problemas de entrenamiento lento de modelos

¿Por qué mi modelo se entrena lentamente?

Para empezar, es crucial diferenciar entre dos procesos distintos que a menudo se confunden:

Entrenamiento del modelo
Este proceso implica volver a entrenar la versión actual del modelo para crear una nueva, incorporando cualquier cambio reciente, como actualizaciones de taxonomía o anotaciones de datos. El entrenamiento del modelo suele ser rápido, aunque la duración puede variar en función de varios factores
Aplicar predicciones
Este proceso se produce después del entrenamiento del modelo, donde la plataforma recupera y aplica predicciones de la versión del modelo entrenado a cada mensaje. La aplicación de predicciones suele ser más lenta y la duración se ve afectada principalmente por el tamaño y la complejidad del conjunto de datos.

Varios factores pueden contribuir a que una versión de modelo particular para un conjunto de datos tarde más de lo esperado en entrenar o aplicar predicciones. Estos incluyen:

Complejidad de la taxonomía de etiquetas y campos
Impacto: cuantas más etiquetas y campos haya en tu conjunto de datos, más tiempo llevará entrenar el modelo y aplicar predicciones en todos los mensajes.
Uso de la extracción generativa
Impacto: la extracción generativa requiere comprender las relaciones complejas entre etiquetas y campos, lo que requiere un modelo más grande y potente, lo que puede ralentizar el entrenamiento.
Tamaño de tu conjunto de datos (datos anotados y no anotados)
Impacto: los grandes volúmenes de mensajes anotados aumentan los puntos de datos que el modelo debe tener en cuenta durante el entrenamiento, lo que amplía el proceso. Del mismo modo, los grandes volúmenes de mensajes no anotados pueden prolongar el tiempo necesario para aplicar las predicciones.

Nota: las predicciones aparecen en cuanto están disponibles, por lo que no es necesario esperar a que terminen de aplicarse mientras se anotan. La plataforma pasará a aplicar predicciones de la última versión del modelo entrenado si se entrena antes de que se completen las predicciones de la versión anterior.
Número de conjuntos de datos que se entrenan simultáneamente
Impacto: si varios modelos se entrenan simultáneamente en tu entorno de Communications Mining, esto puede causar ralentizaciones temporales a medida que la plataforma equilibra la carga de los servicios necesarios.
Cuándo ponerse en contacto con el soporte
- Entrenamiento: si ninguna de las razones anteriores explica la lentitud del entrenamiento y ha estado en curso durante más de 4 horas, póngase en contacto con el soporte técnico.
- Aplicar predicciones: para conjuntos de datos grandes y complejos, la aplicación de predicciones llevará mucho tiempo. Póngase en contacto con el soporte técnico solo si este proceso ha estado en curso durante más de 24 horas para una única versión del modelo.
Nota: Esto no debería bloquear la anotación de datos, ya que siempre te beneficiarás de las nuevas predicciones a medida que estén disponibles

¿Por qué mi modelo no parece estar entrenando en absoluto?

Si tu modelo no comienza a entrenarse en el plazo de una hora después de completar una acción que debería desencadenar el entrenamiento (como anotar mensajes con etiquetas o campos), ponte en contacto con Soporte.

Comprobación del estado de entrenamiento: puedes verificar si tu modelo se está entrenando comprobando el estado del conjunto de datos en la esquina superior derecha de cualquier página dentro de un conjunto de datos

En esta página