- Introducción
- Configuración de su cuenta
- Equilibrio
- Clústeres
- Deriva del concepto
- Cobertura
- Conjuntos de datos
- Campos generales
- Etiquetas (predicciones, niveles de confianza, jerarquía de etiquetas y sentimiento de etiqueta)
- Modelos
- Transmisiones
- Clasificación del modelo
- Proyectos
- Precisión
- Recordar
- Mensajes anotados y no anotados
- Campos extraídos
- Fuentes
- Taxonomías
- Formación
- Predicciones positivas y negativas verdaderas y falsas
- Validación
- Mensajes
- Control y administración de acceso
- Gestionar fuentes y conjuntos de datos
- Comprender la estructura de datos y los permisos
- Crear o eliminar un origen de datos en la GUI
- Cargar un archivo CSV en un origen
- Preparando datos para cargar archivos .CSV
- Crear un conjunto de datos
- Fuentes y conjuntos de datos multilingües
- Habilitar sentimiento en un conjunto de datos
- Modificar la configuración del conjunto de datos
- Eliminar un mensaje
- Eliminar un conjunto de datos
- Exportar un conjunto de datos
- Utilizar integraciones de Exchange
- Entrenamiento y mantenimiento de modelos
- Comprender las etiquetas, los campos generales y los metadatos
- Jerarquía de etiquetas y mejores prácticas
- Mejores prácticas de diseño de taxonomía
- Definición de objetivos de taxonomía
- Crear la estructura de taxonomía
- Importar la taxonomía
- Comparar casos de uso de análisis y automatización
- Convertir tus objetivos en etiquetas
- Descripción general del proceso de entrenamiento del modelo
- Anotación generativa
- Estado de Dastaset
- Entrenamiento de modelos y mejores prácticas de anotación
- Entrenamiento con análisis de sentimiento de etiqueta habilitado
- Comprender los requisitos de datos
- Entrenamiento
- Introducción a Refinar
- Explicación de la precisión y la recuperación
- Precisión y recuperación
- Cómo funciona la validación
- Comprender y mejorar el rendimiento del modelo
- Razones para etiquetar una precisión media baja
- Entrenamiento utilizando la etiqueta Comprobar y la etiqueta Perdida
- Entrenamiento mediante la etiqueta de aprendizaje (refinar)
- Entrenamiento mediante Buscar (Refinar)
- Comprender y aumentar la cobertura
- Mejorar el equilibrio y utilizar Reequilibrar
- Cuándo dejar de entrenar tu modelo
- Uso de campos generales
- Extracción generativa
- Uso de análisis y supervisión
- Automations and Communications Mining™
- Desarrollador
- Uso de la API
- Tutorial de la API
- Fuentes
- Conjuntos de datos
- Comentarios
- Archivos adjuntos
- Predictions
- Crear una transmisión
- Actualizar una transmisión
- Obtener una transmisión por nombre
- Obtener todas las transmisiones
- Eliminar una transmisión
- Obtener resultados de la transmisión
- Obtener comentarios de una transmisión (heredado)
- Avanzar una transmisión
- Restablecer una transmisión
- Etiquetar una excepción
- Desetiquetar una excepción
- Eventos de auditoría
- Obtener todos los usuarios
- Cargar datos
- Descargando datos
- Integración de Exchange con el usuario del servicio de Azure
- Integración de Exchange con la autenticación de aplicaciones de Azure
- Integración de Exchange con Azure Application Authentication y Graph
- Obtener datos para Tableau con Python
- Integración de Elasticsearch
- Extracción de campos general
- Integración de Exchange autohospedado
- Marco de automatización de UiPath®
- Actividades oficiales de UiPath®
- Cómo aprenden las máquinas a entender palabras: una guía para las incrustaciones en PNL
- Aprendizaje basado en solicitudes con Transformers
- Efficient Transformers II: destilación de conocimientos y ajuste
- Transformadores eficientes I: mecanismos de atención
- Modelado de intenciones jerárquico profundo no supervisado: obtener valor sin datos de entrenamiento
- Corregir el sesgo de anotación con Communications Mining™
- Aprendizaje activo: mejores modelos ML en menos tiempo
- Todo está en los números: evaluar el rendimiento del modelo con métricas
- Por qué es importante la validación del modelo
- Comparación de Communications Mining™ y Google AutoML para la inteligencia de datos conversacional
- Licencia
- Preguntas frecuentes y más

Guía del usuario de Communications Mining
Uno de los factores más fundamentales que determinarán el rendimiento de tu modelo, así como lo bien que cumple tus objetivos empresariales, es la estructura de tu taxonomía, incluido lo que captura cada una de las etiquetas que contiene.
Por lo tanto, es importante pensar en la estructura de taxonomía de destino antes del entrenamiento del modelo. Dicho esto, debes tener un grado de flexibilidad para adaptarlo, expandirlo y mejorarlo según sea necesario a medida que avanzas en el entrenamiento. Esto es lo que llamamos el enfoque de entrenamiento basado en datos.
En última instancia, las etiquetas de la taxonomía y los ejemplos de entrenamiento proporcionados para cada etiqueta deben crear una representación precisa y equilibrada del conjunto de datos en su conjunto. Pero cada etiqueta también debe ser valiosa, al representar claramente de alguna manera los mensajes para los que se predice.
Si las etiquetas se utilizan para capturar conceptos muy amplios, vagos o confusos, no solo es más probable que tengan un mal rendimiento, sino que es menos probable que proporcionen valor empresarial. Esto puede ser para proporcionar información útil sobre ese concepto, o para ayudar a que un proceso se automatice total o parcialmente en sentido descendente.
Este es un ejemplo de una taxonomía de alto nivel con etiquetas típicas aplicables en varios casos de uso o industrias. No todos serán aplicables a tu modelo.
Una empresa recibe cada año millones de correos electrónicos en diferentes bandejas de entrada de los clientes sobre una multitud de problemas, consultas, sugerencias, quejas, etc.
Esta empresa decide aumentar su eficiencia operativa, la estandarización de procesos y la visibilidad de lo que sucede en su negocio convirtiendo automáticamente estos correos electrónicos de los clientes en tickets de flujo de trabajo. Estos pueden ser rastreados y accionados, utilizando procesos específicos y dentro de los plazos establecidos.
Para ello, deciden utilizar la plataforma para interpretar estas comunicaciones entrantes no estructuradas y proporcionar una clasificación con respecto al proceso y subproceso con el que se relaciona el correo electrónico. Esta clasificación se utiliza para actualizar el ticket de flujo de trabajo que se creará automáticamente utilizando un servicio de automatización, y garantizar que se enruta al equipo o individuo correcto.
Para garantizar que este caso de uso tenga el mayor éxito posible, y para minimizar el número de excepciones (clasificaciones incorrectas o correos electrónicos que la plataforma no puede clasificar con confianza), cada correo electrónico entrante debe recibir una predicción segura que tenga una etiqueta principal y una etiqueta secundaria, es decir, [Proceso X] > [Subproceso Y].
Dado que el objetivo es clasificar cada correo electrónico entrante con un [Proceso] y un [Subproceso], cada etiqueta de la taxonomía debe ajustarse a este formato:
En este caso de uso, cualquier correo electrónico que no tenga una predicción segura tanto para una etiqueta principal como para una secundaria podría ser una excepción, enviado para revisión manual y creación de tickets. Alternativamente, si tiene una predicción de etiqueta principal de alta confianza, pero no una predicción de etiqueta secundaria segura, esta podría usarse para enrutar parcialmente el correo electrónico o crear un ticket, con algo de trabajo manual adicional para añadir el subproceso relevante.
Si imaginamos que lo primero es cierto, y cada correo electrónico sin una predicción de alta confianza en forma de [Proceso] > [Subproceso] se convierte en una excepción manual, queremos asegurarnos de que todos los ejemplos que proporcionamos para cada etiqueta cuando entrenar el modelo refleja este formato.
Cada etiqueta principal de la taxonomía debe estar relacionada con un proceso amplio relevante para el contenido de los correos electrónicos, por ejemplo, Facturación. Cada etiqueta secundaria debe ser un subproceso más específico que se encuentre bajo una etiqueta principal, por ejemplo, Facturación > Solicitud de estado.
Las etiquetas extremadamente amplias, como Consulta general o Todo lo demás, pueden ser muy poco útiles si se utilizan para agrupar muchos temas distintos y no hay un patrón claro o puntos en común entre los ejemplos anclados.
En este caso de uso, tampoco proporcionarían mucho valor empresarial cuando se creara un ticket de flujo de trabajo y se clasificara como Consulta general o Todo lo demás. Alguien tendría que leerlo atentamente para entender de qué se trata y si era relevante para su equipo antes de poder actuar.
Esto anula cualquier beneficio de ahorro de tiempo y no proporcionaría una MI útil para la empresa sobre el trabajo que los equipos estaban realizando.