- Introducción
- Configuración de su cuenta
- Equilibrio
- Clústeres
- Deriva del concepto
- Cobertura
- Conjuntos de datos
- Campos generales
- Etiquetas (predicciones, niveles de confianza, jerarquía de etiquetas y sentimiento de etiqueta)
- Modelos
- Transmisiones
- Clasificación del modelo
- Proyectos
- Precisión
- Recordar
- Mensajes anotados y no anotados
- Campos extraídos
- Fuentes
- Taxonomías
- Formación
- Predicciones positivas y negativas verdaderas y falsas
- Validación
- Mensajes
- Control y administración de acceso
- Gestionar fuentes y conjuntos de datos
- Comprender la estructura de datos y los permisos
- Crear o eliminar un origen de datos en la GUI
- Cargar un archivo CSV en un origen
- Preparando datos para cargar archivos .CSV
- Crear un conjunto de datos
- Fuentes y conjuntos de datos multilingües
- Habilitar sentimiento en un conjunto de datos
- Modificar la configuración del conjunto de datos
- Eliminar un mensaje
- Eliminar un conjunto de datos
- Exportar un conjunto de datos
- Utilizar integraciones de Exchange
- Entrenamiento y mantenimiento de modelos
- Comprender las etiquetas, los campos generales y los metadatos
- Jerarquía de etiquetas y mejores prácticas
- Comparar casos de uso de análisis y automatización
- Convertir tus objetivos en etiquetas
- Descripción general del proceso de entrenamiento del modelo
- Anotación generativa
- Estado de Dastaset
- Entrenamiento de modelos y mejores prácticas de anotación
- Entrenamiento con análisis de sentimiento de etiqueta habilitado
- Chat de entrenamiento y datos de llamadas
- Comprender los requisitos de datos
- Entrenamiento
- Introducción a Refinar
- Explicación de la precisión y la recuperación
- Precisión y recuperación
- Cómo funciona la validación
- Comprender y mejorar el rendimiento del modelo
- Razones para etiquetar una precisión media baja
- Entrenamiento utilizando la etiqueta Comprobar y la etiqueta Perdida
- Entrenamiento mediante la etiqueta de aprendizaje (refinar)
- Entrenamiento mediante Buscar (Refinar)
- Comprender y aumentar la cobertura
- Mejorar el equilibrio y utilizar Reequilibrar
- Cuándo dejar de entrenar tu modelo
- Uso de campos generales
- Extracción generativa
- Uso de análisis y supervisión
- Automations and Communications Mining™
- Desarrollador
- Uso de la API
- Tutorial de la API
- Fuentes
- Conjuntos de datos
- Comentarios
- Archivos adjuntos
- Predictions
- Crear una transmisión
- Actualizar una transmisión
- Obtener una transmisión por nombre
- Obtener todas las transmisiones
- Eliminar una transmisión
- Obtener resultados de la transmisión
- Obtener comentarios de una transmisión (heredado)
- Avanzar una transmisión
- Restablecer una transmisión
- Etiquetar una excepción
- Desetiquetar una excepción
- Eventos de auditoría
- Obtener todos los usuarios
- Cargar datos
- Descargando datos
- Integración de Exchange con el usuario del servicio de Azure
- Integración de Exchange con la autenticación de aplicaciones de Azure
- Integración de Exchange con Azure Application Authentication y Graph
- Obtener datos para Tableau con Python
- Integración de Elasticsearch
- Extracción de campos general
- Integración de Exchange autohospedado
- Marco de automatización de UiPath®
- Actividades oficiales de UiPath®
- Cómo aprenden las máquinas a entender palabras: una guía para las incrustaciones en PNL
- Aprendizaje basado en solicitudes con Transformers
- Efficient Transformers II: destilación de conocimientos y ajuste
- Transformadores eficientes I: mecanismos de atención
- Modelado de intenciones jerárquico profundo no supervisado: obtener valor sin datos de entrenamiento
- Corregir el sesgo de anotación con Communications Mining™
- Aprendizaje activo: mejores modelos ML en menos tiempo
- Todo está en los números: evaluar el rendimiento del modelo con métricas
- Por qué es importante la validación del modelo
- Comparación de Communications Mining™ y Google AutoML para la inteligencia de datos conversacional
- Licencia
- Preguntas frecuentes y más

Guía del usuario de Communications Mining
Para cumplir tus objetivos empresariales, es importante entender cómo crear tu taxonomía antes de empezar a entrenar tu modelo. Esto incluye cómo nombrar y estructurar tus etiquetas, y en qué deben consistir. Para obtener más información, consulta Crear tu estructura de taxonomía.
La característica de anotación generativa utiliza nombres de etiquetas y descripciones como entrada de entrenamiento. Como resultado, es importante utilizar nombres de etiquetas claros, distintos y descriptivos. Los nombres y descripciones de las etiquetas proporcionan al modelo las mejores entradas de entrenamiento cuando genera predicciones automáticamente.
Puedes cambiar el nombre de las etiquetas y añadir niveles de jerarquía en cualquier momento. Esto te permite refinar las etiquetas y las descripciones de las etiquetas para mejorar las predicciones generadas automáticamente antes de anotar los mensajes con etiquetas.
>
, para capturar cuando un concepto de etiqueta es un subconjunto de un concepto principal más amplio.
Ejemplos de estructura de etiquetas:
- [Etiqueta principal]
- [Etiqueta principal] > [Etiqueta secundaria]
- [Etiqueta principal] > [Etiqueta de rama] > [Etiqueta secundaria]
Puedes añadir más de tres niveles de jerarquía, pero no recomendamos que lo hagas a menudo, ya que resulta complejo entrenar el modelo. Para añadir niveles adicionales de jerarquía, puedes cambiar el nombre de tus etiquetas más adelante en el proceso de entrenamiento del modelo.
>
al especificar el nombre de la etiqueta.
Para entender cómo funcionan las jerarquías, considera la Etiqueta secundaria X del diagrama en la sección Jerarquías de etiquetas .
Cuando el modelo predice que la Etiqueta secundaria X se aplica a un mensaje, también predice la Etiqueta de rama C y la Etiqueta principal 1 al mismo tiempo. Esto se debe a que la Etiqueta secundaria X es un subconjunto de las dos.
Cada nivel de jerarquía añade un nivel creciente de especificidad. Sin embargo, el modelo suele tener más confianza al asignar una etiqueta principal o de rama que una etiqueta secundaria más específica. Esto significa que el modelo puede asignar diferentes probabilidades a diferentes predicciones de etiquetas dentro de la misma jerarquía.
Por ejemplo, para un mensaje en particular, el modelo podría ser:
- 99 % de confianza en que se aplica la etiqueta principal 1.
- 88 % de confianza en que se aplica la etiqueta de rama C.
- 75 % de confianza en que se aplica la etiqueta secundaria X.
El modelo predice cada etiqueta de forma independiente, por lo que es importante que las etiquetas principales representen temas o conceptos genuinos en lugar de abstractos.
Por ejemplo, no es efectivo utilizar Proceso como etiqueta principal si agrupa procesos específicos, ya que es demasiado abstracto para que el modelo lo prediga. En cambio, un nombre de proceso específico del texto del mensaje funciona mejor como etiqueta principal, con etiquetas secundarias y de rama que representan subprocesos relevantes.
A veces, es posible que tengas que tomar decisiones difíciles con respecto a la estructura de tu taxonomía. Por ejemplo, podría ser difícil elegir si una etiqueta debe ser una etiqueta principal o una etiqueta secundaria. Esto puede suceder porque la etiqueta podría servir lógicamente como una categoría principal amplia con sus propias subcategorías, o podría ser una subcategoría específica de otra categoría principal más amplia.
Por ejemplo, imagina un conjunto de datos de reseñas de hoteles. Muchas reseñas pueden incluir el precio de varios aspectos de las vacaciones y del hotel, como el restaurante, el bar, las habitaciones, las actividades, etc.
Puedes considerar las siguientes opciones:
- Podría tener Precios como etiqueta principal, y cada aspecto específico de los precios (es decir, restaurante) como etiquetas secundarias.
- Sin embargo, también podrías tener etiquetas principales relacionadas con aspectos específicos como Restaurantes y Habitaciones, y tener Precios como etiqueta secundaria debajo de cada uno.
Cuando decidas, asegúrate de tener en cuenta lo siguiente:
- ¿Habrá un número significativo de otros conceptos relacionados con este tema más amplio que le gustaría incluir? En caso afirmativo, debería ser una etiqueta principal.
- ¿Qué es lo más importante para realizar un seguimiento desde la perspectiva de la gestión de la información o la generación de informes? Teniendo en cuenta nuestro ejemplo, ¿es útil ver claramente en los análisis de Communications Mining™ exactamente cuántas personas hablan de precios y sus subcategorías, o es más útil ver estadísticas generales sobre los comentarios sobre habitaciones, restaurantes, actividades y etc., siendo el precio solo un aspecto de ellos?
No siempre hay una respuesta clara correcta o incorrecta en estas situaciones y, en última instancia, depende de lo que más te importe a ti y a tu negocio.
Hasta ahora, hemos discutido cómo nombrar etiquetas y estructurarlas en jerarquías. Sin embargo, es posible que aún te preguntes qué debe capturar exactamente una etiqueta.
Es importante recordar que Communications Mining™ es una herramienta de procesamiento de lenguaje natural (NLP). La plataforma lee e interpreta cada mensaje al que se le asigna una etiqueta, y comienza a comprender cómo identificar ese concepto de etiqueta basándose principalmente en el texto que contiene.
A medida que añades ejemplos más variados y coherentes para cada etiqueta, el modelo mejora su comprensión de ese concepto de etiqueta. Una vez que una etiqueta funciona bien, evita añadir más etiquetas, ya que el proceso produciría rendimientos decrecientes. Además, evita aceptar un gran número de predicciones de alta confianza para una etiqueta, ya que esto no proporciona nueva información al modelo.
Dado que Communications Mining utiliza el lenguaje del mensaje para comprender e identificar lo que constituye los conceptos de etiqueta, la etiqueta debe ser claramente identificable a partir del texto de los mensajes a los que se aplica. Para un mensaje de correo electrónico, esto incluye tanto el asunto como el cuerpo del correo electrónico.
Cancellation > Confirmation > Termination
aplicada:
Puedes inferir claramente el nombre de la etiqueta a partir del asunto y el cuerpo del correo electrónico.
Si bien el modelo puede considerar ciertas propiedades de los metadatos, como las puntuaciones de NPS, cuando se entrena en conjuntos de datos de comentarios de los clientes para ayudar a comprender el sentimiento, el texto del mensaje sigue siendo el dato más importante para los modelos de Communication Mining.
Esto significa que cada etiqueta debe ser específica en lo que pretende capturar. De lo contrario, el modelo tendrá dificultades para identificar las tendencias y patrones en el lenguaje necesario para predecir el concepto de etiqueta con precisión.
Las etiquetas extremadamente amplias, como Consulta general o Todo lo demás, pueden no ser útiles si las utilizas para agrupar varios temas diferentes y no hay un patrón claro o elementos comunes entre los ejemplos proporcionados al modelo.
Para que el modelo prediga una etiqueta con precisión, requiere múltiples ejemplos similares de las diversas expresiones de cada concepto capturado por la etiqueta. Por lo tanto, las etiquetas extremadamente amplias necesitan un gran número de ejemplos para predecirse de forma efectiva.
Es una mejor práctica dividir las etiquetas amplias en etiquetas distintas, incluso si tienes Todo lo demás > [Varias etiquetas secundarias].
Si el modelo puede identificar mejor una etiqueta secundaria porque es más específica y claramente identificable, en comparación con una categoría principal muy amplia, también puede mejorar significativamente su capacidad para predecir la etiqueta principal.
La característica Anotación generativa utiliza descripciones de etiquetas y nombres de etiquetas para entrenar automáticamente un modelo especializado. Por lo tanto, es importante añadir descripciones descriptivas, claras e informativas a cada etiqueta para que el modelo pueda generar predicciones precisas.
El modelo de IA generativa utiliza descripciones como entradas para preanotar mensajes en segundo plano. Esto reduce el tiempo y el esfuerzo que dedicas a anotar manualmente los ejemplos.
Puedes añadir descripciones de etiquetas una vez que el proceso Crear conjunto de datos las cree, o puedes añadirlas o editarlas desde la página Taxonomía en Configuración del conjunto de datos.
Una forma eficaz de mantener la coherencia de las etiquetas durante todo el proceso de creación de modelos es añadir descripciones a cada etiqueta. Esto es útil si varios usuarios entrenan tu modelo porque garantiza que todos los usuarios tengan la misma comprensión de una etiqueta determinada y su concepto asociado. Otra ventaja de mantener la coherencia de las etiquetas es que hace que el proceso de entrega sea más eficiente si necesitas transferir el modelo a otro usuario.