- Primeros pasos
- Equilibrio
- Clústeres
- Deriva del concepto
- Cobertura
- Conjuntos de datos
- Campos generales (anteriormente entidades)
- Etiquetas (predicciones, niveles de confianza, jerarquía, etc.)
- Modelos
- Transmisiones
- Clasificación del modelo
- Proyectos
- Precisión
- Recordar
- Mensajes revisados y no revisados
- Fuentes
- Taxonomías
- Formación
- Predicciones positivas y negativas verdaderas y falsas
- Validación
- Mensajes
- Administración
- Gestionar fuentes y conjuntos de datos
- Comprender la estructura de datos y los permisos
- Crear un origen de datos en la GUI
- Cargar un archivo CSV en un origen
- Crear un nuevo conjunto de datos
- Fuentes y conjuntos de datos multilingües
- Habilitar sentimiento en un conjunto de datos
- Modificar la configuración de un conjunto de datos
- Eliminar mensajes a través de la IU
- Eliminar un conjunto de datos
- Eliminar una fuente
- Exportar un conjunto de datos
- Uso de integraciones de Exchange
- Preparando datos para cargar archivos .CSV
- Entrenamiento y mantenimiento de modelos
- Comprender las etiquetas, los campos generales y los metadatos
- Jerarquía de etiquetas y mejores prácticas
- Definición de los objetivos de taxonomía
- Casos de uso de análisis frente a automatización
- Convertir tus objetivos en etiquetas
- Crear tu estructura de taxonomía
- Mejores prácticas de diseño de taxonomía
- Importar tu taxonomía
- Descripción general del proceso de entrenamiento del modelo
- Anotación generativa (NUEVO)
- Comprender el estado de tu conjunto de datos
- Entrenamiento de modelos y mejores prácticas de anotación
- Entrenamiento con análisis de sentimiento de etiqueta habilitado
- Entrenamiento
- Introducción a Refinar
- Explicación de la precisión y la recuperación
- Precisión y recuperación
- ¿Cómo funciona la validación?
- Comprender y mejorar el rendimiento del modelo
- ¿Por qué una etiqueta puede tener una precisión media baja?
- Entrenamiento utilizando la etiqueta Comprobar y la etiqueta Perdida
- Entrenamiento mediante la etiqueta de aprendizaje (refinar)
- Entrenamiento mediante Buscar (Refinar)
- Comprender y aumentar la cobertura
- Mejorar el equilibrio y utilizar Reequilibrar
- Cuándo dejar de entrenar tu modelo
- Uso de campos generales
- Extracción generativa
- Uso de análisis y supervisión
- Minería de automatizaciones y comunicaciones
- Información de licencia
- Preguntas frecuentes y más
Cargar un archivo CSV en un origen
Permisos de usuario necesarios: 'Administrador de fuentes' Y 'Editar mensajes'.
Para cargar datos desde un archivo CSV a una fuente de datos, dirígete a la página Fuentes (a través de la consola de administración, a la que se accede a través de la rueda dentada de la parte superior derecha de la página) y localiza la fuente en la que deseas cargar los datos.
Haz clic en el icono de carga en la esquina superior derecha de la tarjeta de origen de datos (como se muestra a continuación).
A continuación, haz clic en "Seleccionar archivo" y elige el archivo CSV que deseas cargar.
El archivo seleccionado debe cumplir los siguientes criterios:
- El archivo debe contener encabezados en la primera línea y estar delimitado por comas o tabulaciones
- Se requiere un mínimo de tres columnas: el contenido del texto del mensaje (el mensaje), una marca de tiempo y un ID único que identifique el mensaje
- Todos los campos de texto de tu archivo CSV deben estar entre comillas dobles
- El archivo debe estar codificado como UTF-8, UTF-16 o UTF-32 (la plataforma detecta automáticamente cuál)
- El archivo CSV debe tener 64 MiB o menos. Si tiene un archivo más grande, puede cargarlo dividiéndolo en varios archivos, cada uno de menos de 64 MiB
Si tu archivo cumple los criterios anteriores, puedes configurar y cargar los mensajes en el siguiente paso:
Selecciona las columnas necesarias de cada una de las listas desplegables que contienen los encabezados de columna detectados en el archivo CSV:
- Columna de ID:
- Esta debe ser una columna que contenga un ID único que pueda identificar el mensaje
- Los ID de mensaje solo pueden contener caracteres alfanuméricos ASCII (AZ az 0-9) y signos de puntuación (excepto /)
-
Nota: Si hay mensajes existentes en el origen con el mismo ID, se actualizarán para que coincidan con el contenido del nuevo archivo
- Columna de mensaje:
- Esta es simplemente la columna que contiene el texto del mensaje que desea analizar en la plataforma
- Columna de marca de tiempo:
- Esta es una columna que contiene la fecha y la hora en que se grabó el mensaje
- El formato de la marca de tiempo es flexible y la plataforma lo deducirá automáticamente
Si tienes datos que contienen líneas de asunto, hilos o participantes (normalmente vistos en casos o hilos de correo electrónico), también puedes cargar estas columnas adicionales dentro de tu archivo CSV:
- Columna de asunto
- Elija qué columna contiene el Asunto del mensaje
- Columna del remitente
- Elija qué columna contiene el remitente
- A columna
- Elija qué columna contiene los destinatarios. Los destinatarios múltiples deben estar separados por punto y coma.
- Columna CC
- Elija qué columna contiene los destinatarios en copia. Los destinatarios múltiples deben estar separados por punto y coma
- Columna de ID de hilo
- Elija la columna que contiene el mensaje ID del hilo
- Un ID de hilo es lo que vincula diferentes mensajes al mismo hilo
Remitente/Para/Formato CC:
- Las siguientes condiciones en los campos remitente/a/cc desencadenarán errores:
- Supera el número máximo de destinatarios (máximo 2048 destinatarios por hilo)
- El remitente o el destinatario supera el límite máximo de caracteres (máximo 512 caracteres por destinatario)
- Se encuentran dos o más puntos y coma en una fila (p. ej., lo siguiente tiene un formato incorrecto: john@email.com; beth@email.com)
- Aunque la plataforma eliminará cualquier espacio en blanco antes o después de un destinatario, no realizará ninguna limpieza de datos adicional.
- Ejemplos de formatos en los que puede querer sus datos (no es una lista exhaustiva):
- Ejemplo 1: Robert Bog <rob.bog@gmail.com>; John Smith <john.smith@gmail.com>
- Ejemplo 2: rob.bog@gmail.com ;john.smith@gmail.com
- Ejemplo 3: rob.bog@gmail.com; john.smith@gmail.com
- Ejemplos de formatos en los que puede querer sus datos (no es una lista exhaustiva):
- La plataforma delimitará los diferentes destinatarios mediante el punto y coma (;)
- Antes de cargar sus datos, asegúrese de que los correos electrónicos tengan el formato adecuado
- Ten en cuenta que en un caso de uso típico de subprocesos (por ejemplo, correos electrónicos), solo debe haber 1 remitente en cada celda 'remitente'
Formato de marca de tiempo:
- Si el formato de marca de tiempo elegido es ambiguo para el orden de días/meses/años (p. ej. 02/01/03 10:10), puedes sugerir la interpretación correcta:
- 2 de enero de 2003: ninguno
- 1 de febrero de 2003: primer día
- 3 de febrero de 2001: primer año
- 2 de marzo de 2001: primero el día + primero el año
- Para evitar ambigüedades, se recomienda proporcionar las marcas de tiempo en el formato RFC 3339 si es posible (p. ej. 2020-01-31T12:34:56Z para UTC o con una zona horaria: 2020-08-031T11:20:60-08:00)
A continuación, selecciona las propiedades de usuario adicionales que deseas cargar con los mensajes. Las propiedades de usuario son metadatos contextuales asociados a cada mensaje que se pueden filtrar en la plataforma. Estos también son potencialmente utilizados por los modelos de aprendizaje automático en la plataforma. Hay dos tipos, ya sea de cadena o de número:
- Las propiedades de usuario de String son metadatos categóricos (los ejemplos típicos incluyen ID, países, contrapartes, etc.)
- Las propiedades de número de usuario son metadatos numéricos (los ejemplos típicos incluyen NPS, estadísticas de correo electrónico, cantidades, etc.)
Si tu archivo contiene una puntuación NPS como propiedad de usuario, esta debe incluirse como propiedad numérica y llamarse solo 'NPS', para que los gráficos NPS nativos se carguen en la plataforma.
Una vez que hayas seleccionado todas las propiedades de usuario, haz clic en "Cargar ".
A continuación, se te pedirá que inspecciones los mensajes cargados en un conjunto de datos que contenga la fuente en la que has cargado los datos. Si el origen aún no está asociado a ningún conjunto de datos, puedes crear uno nuevo para comprobar que la carga es la esperada.
Si cometiste un error al seleccionar las propiedades del usuario, puedes volver a cargar el mismo archivo, y la plataforma utilizará el ID de columna como identificador para sobrescribir los mensajes y propiedades existentes (esto no afectará a las etiquetas aplicadas a los mensajes existentes).
Solución de problemas
Esperemos que su carga se ejecute sin problemas, pero es posible que encuentre un problema durante el proceso de carga y vea un mensaje de error. A continuación, describimos algunos de ellos y explicamos por qué se producen, para ayudarte a resolverlos o evitarlos.
En los siguientes mensajes de error, {something} se asigna a información contextual sobre dónde se produjo el error. Además, la forma en que nos referimos a una posición en el archivo está estandarizada como:
Cadena | Se expande a: |
---|---|
{posición} | registro {row-number} en la línea {line-number} columna {column-number} (byte {byte-number}) |
Estos son algunos posibles mensajes de error que los usuarios pueden encontrar al cargar archivos CSV:
Tipo de error | Mensaje de error | Descripción |
---|---|---|
No hay suficientes columnas | El archivo CSV solo contiene {number-columns} columna(s), pero se necesitan al menos 3 (texto, marca de tiempo e ID) | El CSV cargado no contiene al menos 3 columnas o la plataforma ha detectado mal la codificación del archivo. |
Codificación no válida | El archivo contiene caracteres no válidos (codificación detectada como {detected-encoding}) | El archivo no está codificado correctamente como UTF-8/UTF-16/UTF-32 (la plataforma detecta automáticamente el formato del archivo) |
Encabezado no válido | string:ti:er' does not match'(^delimiter|id|message|timestamp |timestamp_default_utc_offset |timestamp_day_first|timestamp_year_first\\Z)|(^(?P<property_type>number|string):(?P<name>\\w(?:[\\w]{0,30}\\w)?)\\Z)' | Si un encabezado de columna es un nombre no válido para una propiedad de usuario, la plataforma devuelve el mensaje predeterminado para cuando el esquema de una solicitud no es válido. Comprueba que cada encabezado de columna tiene un formato válido para su propósito. La longitud máxima de un encabezado de columna es de 32 caracteres alfanuméricos |
Longitudes de fila desiguales | El CSV contiene longitudes de fila desiguales. El mensaje {position} tiene {number} campos, pero el registro anterior tiene {number} campos. | El CSV contiene filas con diferentes números de celdas o que son inconsistentes con el número de encabezados. |
Formato de ID | ID de mensaje no válido para {record}. Los ID solo pueden constar de caracteres alfanuméricos ASCII y signos de puntuación (excepto '/'). Valor de celda: {cell-value} | Este error se produce cuando un campo de ID consta de caracteres no válidos, como se describe en el mensaje de error. |
Longitud de ID | El ID es demasiado largo para el mensaje {record}. Tiene {number} bytes, se espera un máximo de 1024 | Este error se produce cuando un campo de ID es más largo que la longitud máxima permitida (1024 caracteres) |
Formato de marca de tiempo | Marca de tiempo con formato incorrecto en el mensaje {position}: {timestamp-error-message}. Valor de celda: {cell-value} | Este error se produce cuando no se ha podido analizar un campo de marca de tiempo. |
Longitud del mensaje | El mensaje es demasiado largo para el mensaje {position}. Tiene {number} bytes, se espera un máximo de 65536 | Este error se produce cuando un campo de mensaje es más largo que la longitud máxima permitida (65536 caracteres). |
Formato de propiedad de número | Número con formato incorrecto en el mensaje {position}: {number-error-message}. Valor de celda: {cell-value} | Este error se produce cuando no se ha podido analizar un campo de propiedad de usuario numérico. La plataforma debe permitir cualquier formato que pueda decodificarse razonablemente como un número. |
Longitud de la propiedad | La propiedad es demasiado larga para el mensaje {position}. Tiene {number} bytes, se espera un máximo de 4096 | Este error se produce cuando un campo de propiedad de usuario es más largo que la longitud máxima permitida (4096 caracteres). |
Error desconocido | Error de CSV desconocido: {underlying-error-message} | La lista anterior no es completamente exhaustiva: si se produce un error desconocido, vuelva a intentar la carga. |