- Introducción
- Configuración de su cuenta
- Equilibrio
- Clústeres
- Deriva del concepto
- Cobertura
- Conjuntos de datos
- Campos generales
- Etiquetas (predicciones, niveles de confianza, jerarquía de etiquetas y sentimiento de etiqueta)
- Modelos
- Transmisiones
- Clasificación del modelo
- Proyectos
- Precisión
- Recordar
- Mensajes anotados y no anotados
- Campos extraídos
- Fuentes
- Taxonomías
- Formación
- Predicciones positivas y negativas verdaderas y falsas
- Validación
- Mensajes
- Control de acceso y administración
- Gestionar fuentes y conjuntos de datos
- Comprender la estructura de datos y los permisos
- Crear o eliminar un origen de datos en la GUI
- Cargar un archivo CSV en un origen
- Preparando datos para cargar archivos .CSV
- Crear un conjunto de datos
- Fuentes y conjuntos de datos multilingües
- Habilitar sentimiento en un conjunto de datos
- Modificar la configuración del conjunto de datos
- Eliminar un mensaje
- Eliminar un conjunto de datos
- Exportar un conjunto de datos
- Utilizar integraciones de Exchange
- Entrenamiento y mantenimiento de modelos
- Comprender las etiquetas, los campos generales y los metadatos
- Jerarquía de etiquetas y mejores prácticas
- Comparar casos de uso de análisis y automatización
- Convertir tus objetivos en etiquetas
- Descripción general del proceso de entrenamiento del modelo
- Anotación generativa
- Estado de Dastaset
- Entrenamiento de modelos y mejores prácticas de anotación
- Entrenamiento con análisis de sentimiento de etiqueta habilitado
- Chat de entrenamiento y datos de llamadas
- Comprender los requisitos de datos
- Entrenamiento
- Introducción a Refinar
- Explicación de la precisión y la recuperación
- Precisión y recuperación
- Cómo funciona la validación
- Comprender y mejorar el rendimiento del modelo
- Razones para etiquetar una precisión media baja
- Entrenamiento utilizando la etiqueta Comprobar y la etiqueta Perdida
- Entrenamiento mediante la etiqueta de aprendizaje (refinar)
- Entrenamiento mediante Buscar (Refinar)
- Comprender y aumentar la cobertura
- Mejorar el equilibrio y utilizar Reequilibrar
- Cuándo dejar de entrenar tu modelo
- Uso de campos generales
- Extracción generativa
- Uso de análisis y supervisión
- Automations and Communications Mining™
- Desarrollador
- Introducción
- Uso de la API
- Tutorial de la API
- Resumen
- Fuentes
- Conjuntos de datos
- Comentarios
- Archivos adjuntos
- Predictions
- Crear una transmisión
- Actualizar una transmisión
- Obtener una transmisión por nombre
- Obtener todas las transmisiones
- Eliminar una transmisión
- Obtener resultados de la transmisión
- Obtener comentarios de una transmisión (heredado)
- Avanzar una transmisión
- Restablecer una transmisión
- Etiquetar una excepción
- Desetiquetar una excepción
- Eventos de auditoría
- Obtener todos los usuarios
- Integración de Exchange con el usuario del servicio de Azure
- Integración de Exchange con la autenticación de aplicaciones de Azure
- Integración de Exchange con Azure Application Authentication y Graph
- Obtener datos para Tableau con Python
- Integración de Elasticsearch
- Integración de Exchange autohospedado
- Marco de automatización de UiPath®
- Actividades de UiPath® Marketplace
- Actividades oficiales de UiPath®
- Cómo aprenden las máquinas a entender palabras: una guía para las incrustaciones en PNL
- Aprendizaje basado en solicitudes con Transformers
- Efficient Transformers II: destilación de conocimientos y ajuste
- Transformadores eficientes I: mecanismos de atención
- Modelado de intenciones jerárquico profundo no supervisado: obtener valor sin datos de entrenamiento
- Corregir el sesgo de anotación con Communications Mining™
- Aprendizaje activo: mejores modelos ML en menos tiempo
- Todo está en los números: evaluar el rendimiento del modelo con métricas
- Por qué es importante la validación del modelo
- Comparación de Communications Mining™ y Google AutoML para la inteligencia de datos conversacional
- Licencia
- Preguntas frecuentes y más

Guía del usuario de Communications Mining
Mejorar el equilibrio y utilizar Reequilibrar
linkEquilibrio: introducción e importancia
La calificación de Equilibrio presentada en la Calificación del modelo en Validación es un reflejo de cuán equilibrados están los datos revisados (es decir, los datos de entrenamiento) en un conjunto de datos, en comparación con el conjunto de datos en su conjunto.
Tiene en cuenta una serie de factores contribuyentes, que incluyen:
- La similitud de los datos revisados con los datos no revisados, mostrada como puntuación porcentual.
- La proporción de datos revisados que se han revisado mediante muestreo aleatorio, es decir, modo aleatorio .
- La proporción de datos que se ha revisado utilizando Reequilibrar.
- La proporción de datos que se han revisado mientras se utilizaba la Búsqueda de texto.
Es importante que la proporción de datos revisados mediante muestreo aleatorio sea alta (idealmente más del 20 %) y la proporción de datos revisados anotados mediante búsqueda sea baja.
Sin embargo, la puntuación de equilibrio está muy influenciada por la puntuación de similitud que mide la similitud de los datos no revisados con los datos revisados.
Esta puntuación de similitud se calcula mediante un modelo de sesgo de anotación patentado que compara los datos revisados y no revisados para garantizar que los datos anotados sean representativos de todo el conjunto de datos. Si los datos no son representativos y se han anotado de forma sesgada, las medidas de rendimiento del modelo pueden ser engañosas y potencialmente poco fiables.
El sesgo de anotación en la plataforma suele ser el resultado de un desequilibrio de los modos de entrenamiento utilizados para asignar etiquetas, especialmente si se utiliza demasiada 'búsqueda de texto' y no suficiente modo 'Aleatorio'. Sin embargo, aún puede ocurrir, incluso si se utiliza una alta proporción del modo 'Aleatorio'. El entrenamiento de etiquetas específicas en modos como "Enseñar etiqueta" puede provocar naturalmente un ligero desequilibrio en los datos revisados. La plataforma te ayuda a identificar cuándo sucede esto y te ayuda a abordarlo de una manera rápida y eficaz.
Reequilibrar: introducción y uso
Reequilibrar es un modo de entrenamiento que ayuda a reducir los posibles desequilibrios en la forma en que se ha anotado un modelo, es decir, el sesgo de anotación, lo que significa que los datos revisados no son tan representativos de todo el conjunto de datos como podrían ser.
El modo de entrenamiento Reequilibrar muestra los mensajes que están subrepresentados en el conjunto revisado.
Anotar los mensajes (como lo harías en cualquier otro modo de entrenamiento) presentados en este modo ayudará a abordar los desequilibrios en los datos de entrenamiento y mejorar la puntuación de equilibrio del modelo.
Si descubres que tienes una puntuación de similitud alta pero la calificación de Equilibrio sigue siendo baja, es probable que esto se deba a que no has anotado suficientes datos de entrenamiento en el modo aleatorio . Si este es el caso, la plataforma sugerirá anotar una selección aleatoria de mensajes como acción prioritaria recomendada. El entrenamiento en este modo da a la plataforma la confianza adicional de que el conjunto de datos no ha sido anotado de forma sesgada y de que los datos de entrenamiento son una muestra representativa.
Cuánto Reequilibrar usar
Debes seguir utilizando Reequilibrar de forma iterativa para mejorar la puntuación de similitud de tu modelo, lo que a su vez aumentará tu puntuación de Equilibrio .
Una vez que esto alcance una calificación de Bueno en Validación, depende de usted cuánto más le gustaría aumentar la puntuación de similitud antes de detener el entrenamiento en Reequilibrar.
Puedes intentar optimizar esta calificación tanto como sea posible, pero el entrenamiento continuo siempre será un caso de rendimientos decrecientes. Una calificación Buena generalmente debe considerarse un nivel aceptable de rendimiento para un buen modelo.