- Introducción
- Configuración de su cuenta
- Equilibrio
- Clústeres
- Deriva del concepto
- Cobertura
- Conjuntos de datos
- Campos generales
- Etiquetas (predicciones, niveles de confianza, jerarquía de etiquetas y sentimiento de etiqueta)
- Modelos
- Transmisiones
- Clasificación del modelo
- Proyectos
- Precisión
- Recordar
- Mensajes anotados y no anotados
- Campos extraídos
- Fuentes
- Taxonomías
- Formación
- Predicciones positivas y negativas verdaderas y falsas
- Validación
- Mensajes
- Control y administración de acceso
- Gestionar fuentes y conjuntos de datos
- Comprender la estructura de datos y los permisos
- Crear o eliminar un origen de datos en la GUI
- Cargar un archivo CSV en un origen
- Preparando datos para cargar archivos .CSV
- Crear un conjunto de datos
- Fuentes y conjuntos de datos multilingües
- Habilitar sentimiento en un conjunto de datos
- Modificar la configuración del conjunto de datos
- Eliminar un mensaje
- Eliminar un conjunto de datos
- Exportar un conjunto de datos
- Utilizar integraciones de Exchange
- Entrenamiento y mantenimiento de modelos
- Comprender las etiquetas, los campos generales y los metadatos
- Jerarquía de etiquetas y mejores prácticas
- Comparar casos de uso de análisis y automatización
- Convertir tus objetivos en etiquetas
- Descripción general del proceso de entrenamiento del modelo
- Anotación generativa
- Estado de Dastaset
- Entrenamiento de modelos y mejores prácticas de anotación
- Entrenamiento con análisis de sentimiento de etiqueta habilitado
- Chat de entrenamiento y datos de llamadas
- Comprender los requisitos de datos
- Entrenamiento
- Introducción a Refinar
- Explicación de la precisión y la recuperación
- Precisión y recuperación
- Cómo funciona la validación
- Comprender y mejorar el rendimiento del modelo
- Razones para etiquetar una precisión media baja
- Entrenamiento utilizando la etiqueta Comprobar y la etiqueta Perdida
- Entrenamiento mediante la etiqueta de aprendizaje (refinar)
- Entrenamiento mediante Buscar (Refinar)
- Comprender y aumentar la cobertura
- Mejorar el equilibrio y utilizar Reequilibrar
- Cuándo dejar de entrenar tu modelo
- Uso de campos generales
- Extracción generativa
- Uso de análisis y supervisión
- Automations and Communications Mining™
- Desarrollador
- Uso de la API
- Tutorial de la API
- Fuentes
- Conjuntos de datos
- Comentarios
- Archivos adjuntos
- Predictions
- Crear una transmisión
- Actualizar una transmisión
- Obtener una transmisión por nombre
- Obtener todas las transmisiones
- Eliminar una transmisión
- Obtener resultados de la transmisión
- Obtener comentarios de una transmisión (heredado)
- Avanzar una transmisión
- Restablecer una transmisión
- Etiquetar una excepción
- Desetiquetar una excepción
- Eventos de auditoría
- Obtener todos los usuarios
- Cargar datos
- Descargando datos
- Integración de Exchange con el usuario del servicio de Azure
- Integración de Exchange con la autenticación de aplicaciones de Azure
- Integración de Exchange con Azure Application Authentication y Graph
- Obtener datos para Tableau con Python
- Integración de Elasticsearch
- Extracción de campos general
- Integración de Exchange autohospedado
- Marco de automatización de UiPath®
- Actividades oficiales de UiPath®
- Cómo aprenden las máquinas a entender palabras: una guía para las incrustaciones en PNL
- Aprendizaje basado en solicitudes con Transformers
- Efficient Transformers II: destilación de conocimientos y ajuste
- Transformadores eficientes I: mecanismos de atención
- Modelado de intenciones jerárquico profundo no supervisado: obtener valor sin datos de entrenamiento
- Corregir el sesgo de anotación con Communications Mining™
- Aprendizaje activo: mejores modelos ML en menos tiempo
- Todo está en los números: evaluar el rendimiento del modelo con métricas
- Por qué es importante la validación del modelo
- Comparación de Communications Mining™ y Google AutoML para la inteligencia de datos conversacional
- Licencia
- Preguntas frecuentes y más

Guía del usuario de Communications Mining
-
Actualizar cualquier cosa que no sean las propiedades del usuario hará que se pierdan las anotaciones de campo generales en los conjuntos de datos asociados. Por ejemplo, actualizar los mensajes existentes en un origen, cambiar las propiedades del mensaje, como el texto del mensaje, la marca de tiempo enviado_a y hacia o desde. Asegúrate de anclar la última versión del modelo en los conjuntos de datos asociados antes de hacerlo.
-
Para obtener más información sobre la creación de un origen de datos, consulta Crear o eliminar un origen de datos en la GUI.
- Ve a la página Administrador .
- Selecciona la pestaña Fuentes y localiza la fuente a la que deseas cargar los datos.
- Selecciona el icono de carga en la tarjeta de origen de datos.
- Utiliza Seleccionar archivo para elegir un archivo CSV de tu ordenador.
- Selecciona el archivo CSV que deseas cargar. Asegúrate de que el archivo cumple los siguientes criterios:
- El archivo debe incluir encabezados en la primera línea y estar delimitado por comas o tabulaciones.
- El archivo debe contener un mínimo de tres columnas:
- Mensaje: el texto del mensaje.
- Marca de tiempo: cuando se creó el mensaje.
- ID único: un identificador distinto para cada mensaje.
- Todos los campos de texto deben estar entre comillas dobles en el archivo.
- El archivo debe estar codificado como UTF-8, UTF-16 o UTF-32. La plataforma detecta automáticamente la codificación correcta.
- El archivo debe tener 128 MiB o menos. Para archivos más grandes, divídelos en varios archivos, cada uno de menos de 128 MiB.
- Selecciona las columnas requeridas, donde los menús desplegables contienen los encabezados de columna detectados en el archivo CSV:
- Columna de ID de mensaje : una columna con un ID único que puede identificar el mensaje. Los ID de mensaje solo pueden contener caracteres alfanuméricos ASCII (AZ, az, 0-9) y signos de puntuación, excepto la barra diagonal
/
.Nota: Si hay mensajes existentes en el origen con el mismo ID, se actualizarán para que coincidan con el contenido del nuevo archivo. - Columna de mensaje : la columna que contiene el texto del mensaje que quieres analizar en la plataforma.
- Columna de marca de tiempo : la columna que contiene la fecha y la hora en que se grabó el mensaje. El formato de la marca de tiempo es flexible y la plataforma lo infiere automáticamente. Para obtener más información, consulta Utilizar los formatos correctos.
- Columna de ID de mensaje : una columna con un ID único que puede identificar el mensaje. Los ID de mensaje solo pueden contener caracteres alfanuméricos ASCII (AZ, az, 0-9) y signos de puntuación, excepto la barra diagonal
- Puedes seleccionar las siguientes columnas adicionales, si tienes datos que contienen líneas de asunto, hilos o participantes, que suelen encontrarse en casos o hilos de correo electrónico:
- Columna de asunto : la columna que contiene el asunto del mensaje.
- Columna del remitente : la columna que contiene el remitente.
- Columna A : la columna que contiene uno o más destinatarios. Asegúrate de que los destinatarios múltiples estén separados por un punto y coma
;
. - Columna Cc : la columna que contiene uno o más destinatarios en el campo Cc. Asegúrate de que los destinatarios múltiples estén separados por un punto y coma
;
.- Para obtener más información sobre el uso de los formatos correctos en los campos Remitente, Para y Cc, consulta Uso de los formatos correctos.
- Columna de ID de hilo : la columna que contiene el ID de hilo del mensaje. El ID del hilo vincula diferentes mensajes al mismo hilo.
- Puedes seleccionar las propiedades de usuario adicionales que deseas cargar con los mensajes. Las propiedades de usuario son metadatos contextuales asociados a cada mensaje que puedes filtrar en la plataforma. Los modelos de aprendizaje automático de la plataforma también pueden aprovechar estas propiedades de usuario, que son de los siguientes tipos:
- Las propiedades de usuario de cadena son metadatos categóricos, por ejemplo, ID, países, contrapartes, etc.
- Las propiedades de número de usuario son metadatos numéricos, por ejemplo, NPS, estadísticas de correo electrónico, cantidades, etc.
Nota: Si tu archivo contiene una puntuación NPS como propiedad de usuario, debes incluirla como propiedad numérica, y nombrarla soloNPS
para desencadenar la carga de gráficos NPS nativos en la plataforma. - Una vez que hayas seleccionado todas las propiedades de usuario, selecciona Cargar.
Se te pedirá que inspecciones los mensajes cargados en un conjunto de datos que contenga el origen en el que cargaste los datos. Si el origen no está asociado a ningún conjunto de datos, puedes crear un nuevo conjunto de datos para comprobar que la carga es la esperada.
Nota: Si cometiste un error al seleccionar las propiedades del usuario, puedes cargar el mismo archivo de nuevo. La plataforma utilizará el ID de columna como identificador para sobrescribir los mensajes y propiedades existentes. Esto no afectará a las etiquetas aplicadas a los mensajes existentes.
El formato Remitente/Para/CC
Asegúrese de que:
- El número de destinatarios no supera el máximo de 2048 por hilo.
- El remitente o cualquier destinatario no supera el límite de 512 caracteres.
- Solo hay un punto y coma en una fila. Por ejemplo, lo siguiente tiene un formato incorrecto: john@email.com ; beth@email.com.
- Ejemplo 1: Robert Bog <rob.bog@gmail.com>; John Smith <john.smith@gmail.com>
- Ejemplo 2: rob.bog@gmail.com ;john.smith@gmail.com
- Ejemplo 3: rob.bog@gmail.com ; john.smith@gmail.com
;
.
Antes de cargar tus datos, asegúrate de que los correos electrónicos tengan el formato adecuado.
El formato de la marca de tiempo
01/02/03 10:10
, puedes sugerir la interpretación correcta:
- 2 de enero de 2003: ninguno
- 1 de febrero de 2003: primer día
- 3 de febrero de 2001: primer año
- 2 de marzo de 2001: primero el día + primero el año
RFC 3339
. Por ejemplo, 2020-01-31T12:34:56Z
para UTC o con una zona horaria: 2020-08-031T11:20:60-08:00
.
Esta sección contiene los posibles mensajes de error que pueden producirse durante el proceso de carga y las soluciones a cada uno de ellos.
En los siguientes mensajes de error, {something} se asigna a información contextual sobre dónde se produjo el error. Además, la forma en que nos referimos a una posición en el archivo está estandarizada como:
Cadena | Se expande a: |
---|---|
{posición} | registro {row-number} en la línea {line-number} columna {column-number} (byte {byte-number}) |
El título del mensaje de error se muestra junto con una descripción, como se muestra en la siguiente imagen:
Tipo de error | Mensaje de error | Descripción |
---|---|---|
No hay suficientes columnas | El archivo CSV solo contiene {number-columns} columnas, pero se necesitan al menos 3, es decir, texto, marca de tiempo e ID. | El CSV cargado no contiene al menos 3 columnas, o la plataforma ha detectado mal la codificación del archivo. |
Codificación no válida | El archivo contiene caracteres no válidos, donde la codificación se detecta como {detected-encoding}. | El archivo no está codificado correctamente como UTF-8, UTF-16 o UTF-32. La plataforma detecta automáticamente el formato del archivo. |
Encabezado no válido | string:ti:er' no coincide con '(^delimiter|id|message|timestamp |timestamp_default_utc_offset |timestamp_day_first|timestamp_year_first\\Z)|(^(?P<property_type>number|string):(?P<name>\\w(?:[\\w]{0,30}\\w)?)\\Z)' | Si un encabezado de columna es un nombre no válido para una propiedad de usuario, la plataforma devuelve el mensaje predeterminado para cuando el esquema de una solicitud no es válido. Comprueba que cada encabezado de columna tiene un formato válido para su propósito. La longitud máxima de un encabezado de columna es de 32 caracteres alfanuméricos. |
Longitudes de fila desiguales | El CSV contiene longitudes de fila desiguales. El mensaje {position} tiene {number} campos, pero el registro anterior tiene {number} campos. | El CSV contiene filas con diferentes números de celdas o que son inconsistentes con el número de encabezados. |
Formato de ID | ID de mensaje no válido para {record}. Los ID solo pueden constar de caracteres alfanuméricos ASCII y signos de puntuación, excepto la barra diagonal / . Valor de la celda: {cell-value}.
| Se produce cuando un campo de ID consta de caracteres no válidos como se describe en el mensaje de error. |
Longitud de ID | El ID es demasiado largo para el mensaje {record}. Tiene {number} bytes, se espera un máximo de 1024. | Se produce cuando un campo de ID es más largo que la longitud máxima permitida, 1024 caracteres. |
Formato de marca de tiempo | Marca de tiempo con formato incorrecto en el mensaje {position}: {timestamp-error-message}. Valor de la celda: {cell-value}. | Se produce cuando no se ha podido analizar un campo de marca de tiempo. |
Longitud del mensaje | El mensaje es demasiado largo para el mensaje {position}. Tiene {number} bytes, esperados como máximo 65536. | Se produce cuando un campo de mensaje es más largo que la longitud máxima permitida, 65536 caracteres. |
Formato de propiedad de número | Número con formato incorrecto en el mensaje {position}: {number-error-message}. Valor de la celda: {cell-value}. | Se produce cuando no se ha podido analizar un campo de propiedad de usuario numérico. La plataforma debe permitir cualquier formato que pueda decodificarse razonablemente como un número. |
Longitud de la propiedad | La propiedad es demasiado larga para el mensaje {position}. Tiene {number} bytes, se esperan como máximo 4096. | Se produce cuando un campo de propiedad de usuario es más largo que la longitud máxima permitida, 4096 caracteres. |
Error desconocido | Error de CSV desconocido: {underlying-error-message}. | Si se produce un error desconocido, vuelve a intentar la carga. |