- Primeros pasos
- Equilibrio
- Clústeres
- Deriva del concepto
- Cobertura
- Conjuntos de datos
- Campos generales (anteriormente entidades)
- Etiquetas (predicciones, niveles de confianza, jerarquía, etc.)
- Modelos
- Transmisiones
- Clasificación del modelo
- Proyectos
- Precisión
- Recordar
- Mensajes anotados y no anotados
- Campos extraídos
- Fuentes
- Taxonomías
- Formación
- Predicciones positivas y negativas verdaderas y falsas
- Validación
- Mensajes
- Administración
- Gestionar fuentes y conjuntos de datos
- Comprender la estructura de datos y los permisos
- Crear o eliminar un origen de datos en la GUI
- Cargar un archivo CSV en un origen
- Preparando datos para cargar archivos .CSV
- Crear un nuevo conjunto de datos
- Fuentes y conjuntos de datos multilingües
- Habilitar sentimiento en un conjunto de datos
- Amend dataset settings
- Eliminar mensajes a través de la IU
- Eliminar un conjunto de datos
- Exportar un conjunto de datos
- Uso de integraciones de Exchange
- Entrenamiento y mantenimiento de modelos
- Comprender las etiquetas, los campos generales y los metadatos
- Jerarquía de etiquetas y mejores prácticas
- Definición de los objetivos de taxonomía
- Casos de uso de análisis frente a automatización
- Convertir tus objetivos en etiquetas
- Crear tu estructura de taxonomía
- Mejores prácticas de diseño de taxonomía
- Importar tu taxonomía
- Descripción general del proceso de entrenamiento del modelo
- Anotación generativa (NUEVO)
- Estado de Dastaset
- Entrenamiento de modelos y mejores prácticas de anotación
- Entrenamiento con análisis de sentimiento de etiqueta habilitado
- Comprender los requisitos de datos
- Entrenamiento
- Introducción a Refinar
- Explicación de la precisión y la recuperación
- Precisión y recuperación
- ¿Cómo funciona la validación?
- Comprender y mejorar el rendimiento del modelo
- ¿Por qué una etiqueta puede tener una precisión media baja?
- Entrenamiento utilizando la etiqueta Comprobar y la etiqueta Perdida
- Entrenamiento mediante la etiqueta de aprendizaje (refinar)
- Entrenamiento mediante Buscar (Refinar)
- Comprender y aumentar la cobertura
- Mejorar el equilibrio y utilizar Reequilibrar
- Cuándo dejar de entrenar tu modelo
- Uso de campos generales
- Extracción generativa
- Uso de análisis y supervisión
- Minería de automatizaciones y comunicaciones
- Información de licencia
- Preguntas frecuentes y más

Guía de usuario de Communications Mining
Jerarquía de etiquetas y mejores prácticas
Para cumplir tus objetivos empresariales, es importante entender cómo crear tu taxonomía antes de empezar a entrenar tu modelo. Esto incluye cómo nombrar y estructurar tus etiquetas, y en qué deben consistir. Para obtener más información, consulta Crear tu estructura de taxonomía.
La característica de anotación generativa utiliza nombres de etiquetas y descripciones como entrada de entrenamiento. Como resultado, es importante utilizar nombres de etiquetas claros, distintos y descriptivos. Los nombres y descripciones de las etiquetas proporcionan al modelo las mejores entradas de entrenamiento cuando genera predicciones automáticamente.
Puedes cambiar el nombre de las etiquetas y añadir niveles de jerarquía en cualquier momento. Esto te permite refinar las etiquetas y las descripciones de las etiquetas para mejorar las predicciones generadas automáticamente antes de anotar los mensajes con etiquetas.
>
, para capturar cuando un concepto de etiqueta es un subconjunto de un concepto principal más amplio.
Ejemplos de estructura de etiquetas:
- [Etiqueta principal]
- [Etiqueta principal] > [Etiqueta secundaria]
- [Etiqueta principal] > [Etiqueta de rama] > [Etiqueta secundaria]
Puedes añadir más de tres niveles de jerarquía, pero no recomendamos que lo hagas a menudo, ya que resulta complejo entrenar el modelo. Para añadir niveles adicionales de jerarquía, puedes cambiar el nombre de tus etiquetas más adelante en el proceso de entrenamiento del modelo.
>
al especificar el nombre de la etiqueta.
Para entender cómo funcionan las jerarquías, considera la Etiqueta secundaria X del diagrama en la sección Jerarquías de etiquetas .
Cuando el modelo predice que la Etiqueta secundaria X se aplica a un mensaje, también predice la Etiqueta de rama C y la Etiqueta principal 1 al mismo tiempo. Esto se debe a que la Etiqueta secundaria X es un subconjunto de las dos.
Cada nivel de jerarquía añade un nivel creciente de especificidad. Sin embargo, el modelo suele tener más confianza al asignar una etiqueta principal o de rama que una etiqueta secundaria más específica. Esto significa que el modelo puede asignar diferentes probabilidades a diferentes predicciones de etiquetas dentro de la misma jerarquía.
Por ejemplo, para un mensaje en particular, el modelo podría ser:
- 99 % de confianza en que se aplica la etiqueta principal 1.
- 88 % de confianza en que se aplica la etiqueta de rama C.
- 75 % de confianza en que se aplica la etiqueta secundaria X.
El modelo predice cada etiqueta de forma independiente, por lo que es importante que las etiquetas principales representen temas o conceptos genuinos en lugar de abstractos.
Por ejemplo, no es efectivo utilizar Proceso como etiqueta principal si agrupa procesos específicos, ya que es demasiado abstracto para que el modelo lo prediga. En cambio, un nombre de proceso específico del texto del mensaje funciona mejor como etiqueta principal, con etiquetas secundarias y de rama que representan subprocesos relevantes.
A veces, es posible que tengas que tomar decisiones difíciles con respecto a la estructura de tu taxonomía. Por ejemplo, podría ser difícil elegir si una etiqueta debe ser una etiqueta principal o una etiqueta secundaria. Esto puede suceder porque la etiqueta podría servir lógicamente como una categoría principal amplia con sus propias subcategorías, o podría ser una subcategoría específica de otra categoría principal más amplia.
Por ejemplo, imagina un conjunto de datos de reseñas de hoteles. Muchas reseñas pueden incluir el precio de varios aspectos de las vacaciones y del hotel, como el restaurante, el bar, las habitaciones, las actividades, etc.
Puedes considerar las siguientes opciones:
- Podría tener Precios como etiqueta principal, y cada aspecto específico de los precios (es decir, restaurante) como etiquetas secundarias.
- Sin embargo, también podrías tener etiquetas principales relacionadas con aspectos específicos como Restaurantes y Habitaciones, y tener Precios como etiqueta secundaria debajo de cada uno.
Cuando decidas, asegúrate de tener en cuenta lo siguiente:
- ¿Habrá un número significativo de otros conceptos relacionados con este tema más amplio que le gustaría incluir? En caso afirmativo, debería ser una etiqueta principal.
- ¿Qué es lo más importante a seguir desde la perspectiva de la información de gestión o de los informes? Teniendo en cuenta nuestro ejemplo, ¿es útil ver claramente en el análisis de Communications Mining exactamente cuántas personas están hablando de precios y sus subcategorías? ¿O es más útil ver las estadísticas generales sobre los comentarios sobre las habitaciones, los restaurantes, las actividades, etc., siendo el precio solo un aspecto de ellos?
No siempre hay una respuesta clara correcta o incorrecta en estas situaciones; en última instancia, depende de lo que más te importe a ti y a tu negocio.
Hasta ahora, hemos discutido cómo nombrar etiquetas y estructurarlas en jerarquías. Sin embargo, es posible que aún te preguntes qué debe capturar exactamente una etiqueta.
Es importante recordar que Communications Mining es una herramienta de procesamiento de lenguaje natural (NLP). La plataforma lee e interpreta cada mensaje al que se le asigna una etiqueta, y comienza a comprender cómo identificar ese concepto de etiqueta basándose principalmente en el texto que contiene.
A medida que añades ejemplos más variados y coherentes para cada etiqueta, el modelo mejora su comprensión de ese concepto de etiqueta. Una vez que una etiqueta funciona bien, evita añadir más etiquetas, ya que el proceso produciría rendimientos decrecientes. Además, evita aceptar un gran número de predicciones de alta confianza para una etiqueta, ya que esto no proporciona nueva información al modelo.
Dado que Communications Mining utiliza el lenguaje del mensaje para comprender e identificar lo que constituye los conceptos de etiqueta, la etiqueta debe ser claramente identificable a partir del texto de los mensajes a los que se aplica. Para un mensaje de correo electrónico, esto incluye tanto el asunto como el cuerpo del correo electrónico.
Cancellation > Confirmation > Termination
aplicada:
You can clearly infer the label name from the email subject and body.
Si bien el modelo puede considerar ciertas propiedades de los metadatos, como las puntuaciones de NPS, cuando se entrena en conjuntos de datos de comentarios de los clientes para ayudar a comprender el sentimiento, el texto del mensaje sigue siendo el dato más importante para los modelos de Communication Mining.
Esto significa que cada etiqueta debe ser específica en lo que pretende capturar. De lo contrario, el modelo tendrá dificultades para identificar las tendencias y patrones en el lenguaje necesario para predecir el concepto de etiqueta con precisión.
Las etiquetas extremadamente amplias, como Consulta general o Todo lo demás, pueden no ser útiles si las utilizas para agrupar varios temas diferentes y no hay un patrón claro o elementos comunes entre los ejemplos proporcionados al modelo.
Para que el modelo prediga una etiqueta con precisión, requiere múltiples ejemplos similares de las diversas expresiones de cada concepto capturado por la etiqueta. Por lo tanto, las etiquetas extremadamente amplias necesitan un gran número de ejemplos para predecirse de forma efectiva.
Es una mejor práctica dividir las etiquetas amplias en etiquetas distintas, incluso si tienes Todo lo demás > [Varias etiquetas secundarias].
Si el modelo puede identificar mejor una etiqueta secundaria porque es más específica y claramente identificable, en comparación con una categoría principal muy amplia, también puede mejorar significativamente su capacidad para predecir la etiqueta principal.
La característica Anotación generativa utiliza descripciones de etiquetas y nombres de etiquetas para entrenar automáticamente un modelo especializado. Por lo tanto, es importante añadir descripciones descriptivas, claras e informativas a cada etiqueta para que el modelo pueda generar predicciones precisas.
El modelo de IA generativa utiliza descripciones como entradas para preanotar mensajes en segundo plano. Esto reduce el tiempo y el esfuerzo que dedicas a anotar manualmente los ejemplos.
Puedes añadir descripciones de etiquetas una vez que el proceso Crear conjunto de datos las cree, o puedes añadirlas o editarlas desde la página Taxonomía en Configuración del conjunto de datos.
Una forma eficaz de mantener la coherencia de las etiquetas durante todo el proceso de creación de modelos es añadir descripciones a cada etiqueta. Esto es útil si varios usuarios entrenan tu modelo porque garantiza que todos los usuarios tengan la misma comprensión de una etiqueta determinada y su concepto asociado. Otra ventaja de mantener la coherencia de las etiquetas es que hace que el proceso de entrega sea más eficiente si necesitas transferir el modelo a otro usuario.