communications-mining

latest

false

Importante :

Communications Mining forma ahora parte de UiPath IXP. Consulte la Introducción de la Guía del usuario para más información. Este contenido se ha traducido mediante traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Guía de usuario de Communications Mining

Última actualización 25 de mar. de 2025

Cargar un archivo CSV en un origen

Permisos de usuario necesarios: 'Administrador de fuentes' Y 'Editar mensajes'.

Nota: Este artículo muestra cómo cargar datos de un archivo CSV en una fuente de datos existente. Para entender cómo crear primero una fuente de datos a través de la GUI, consulta aquí.

Pasos clave

Nota: Si se actualizan los mensajes existentes en un origen, cambiar las propiedades del mensaje (p. ej. el texto del mensaje, la marca de tiempo enviado a las y 'a' o 'de') que no sean propiedades de usuario, hará que se pierdan las anotaciones de campo generales en los conjuntos de datos asociados. Se recomienda encarecidamente fijar la última versión del modelo en los conjuntos de datos asociados antes de hacerlo.

Para cargar datos desde un archivo CSV a una fuente de datos, dirígete a la página Fuentes (a través de la consola de administración, a la que se accede a través de la rueda dentada de la parte superior derecha de la página) y localiza la fuente en la que deseas cargar los datos.

Selecciona el icono de carga en la esquina superior derecha de la tarjeta de origen de datos (como se muestra a continuación).

A continuación, haz clic en "Seleccionar archivo" y elige el archivo CSV que deseas cargar.

El archivo seleccionado debe cumplir los siguientes criterios:

El archivo debe contener encabezados en la primera línea y estar delimitado por comas o tabulaciones
Se requiere un mínimo de tres columnas: el contenido del texto del mensaje (el mensaje), una marca de tiempo y un ID único que identifique el mensaje
Todos los campos de texto de tu archivo CSV deben estar entre comillas dobles
El archivo debe estar codificado como UTF-8, UTF-16 o UTF-32 (la plataforma detecta automáticamente cuál)
El archivo CSV debe tener 64 MiB o menos. Si tiene un archivo más grande, puede cargarlo dividiéndolo en varios archivos, cada uno de menos de 64 MiB

Si tu archivo cumple los criterios anteriores, puedes configurar y cargar los mensajes en el siguiente paso:

Selecciona las columnas necesarias de cada una de las listas desplegables que contienen los encabezados de columna detectados en el archivo CSV:

Columna de ID:
- Esta debe ser una columna que contenga un ID único que pueda identificar el mensaje
- Los ID de mensaje solo pueden contener caracteres alfanuméricos ASCII (AZ az 0-9) y signos de puntuación (excepto /)
- Nota: Si hay mensajes existentes en el origen con el mismo ID, se actualizarán para que coincidan con el contenido del nuevo archivo
Columna de mensaje:
- Esta es simplemente la columna que contiene el texto del mensaje que desea analizar en la plataforma
Columna de marca de tiempo:
- Esta es una columna que contiene la fecha y la hora en que se grabó el mensaje
- El formato de la marca de tiempo es flexible y la plataforma lo deducirá automáticamente

Si tienes datos que contienen líneas de asunto, hilos o participantes (normalmente vistos en casos o hilos de correo electrónico), también puedes cargar estas columnas adicionales dentro de tu archivo CSV:

Columna de asunto
- Elija qué columna contiene el Asunto del mensaje
Columna del remitente
- Elija qué columna contiene el remitente
A columna
- Elija qué columna contiene los destinatarios. Los destinatarios múltiples deben estar separados por punto y coma.
Columna CC
- Elija qué columna contiene los destinatarios en copia. Los destinatarios múltiples deben estar separados por punto y coma
Columna de ID de hilo
- Elija la columna que contiene el mensaje ID del hilo
- Un ID de hilo es lo que vincula diferentes mensajes al mismo hilo

Remitente/Para/Formato CC:

Las siguientes condiciones en los campos remitente/a/cc desencadenarán errores:
- Supera el número máximo de destinatarios (máximo 2048 destinatarios por hilo)
- El remitente o el destinatario supera el límite máximo de caracteres (máximo 512 caracteres por destinatario)
- Se encuentran dos o más puntos y coma en una fila (p. ej., lo siguiente tiene un formato incorrecto: john@email.com; beth@email.com)
Aunque la plataforma eliminará cualquier espacio en blanco antes o después de un destinatario, no realizará ninguna limpieza de datos adicional.
- Ejemplos de formatos en los que puede querer sus datos (no es una lista exhaustiva):
  - Ejemplo 1: Robert Bog <rob.bog@gmail.com>; John Smith <john.smith@gmail.com>
  - Ejemplo 2: rob.bog@gmail.com ;john.smith@gmail.com
  - Ejemplo 3: rob.bog@gmail.com; john.smith@gmail.com
La plataforma delimitará los diferentes destinatarios mediante el punto y coma (;)
Antes de cargar sus datos, asegúrese de que los correos electrónicos tengan el formato adecuado
Ten en cuenta que en un caso de uso típico de subprocesos (por ejemplo, correos electrónicos), solo debe haber 1 remitente en cada celda 'remitente'

Formato de marca de tiempo:

Si el formato de marca de tiempo elegido es ambiguo para el orden de días/meses/años (p. ej. 02/01/03 10:10), puedes sugerir la interpretación correcta:
- 2 de enero de 2003: ninguno
- 1 de febrero de 2003: primer día
- 3 de febrero de 2001: primer año
- 2 de marzo de 2001: primero el día + primero el año
Para evitar ambigüedades, se recomienda proporcionar las marcas de tiempo en el formato RFC 3339 si es posible (p. ej. 2020-01-31T12:34:56Z para UTC o con una zona horaria: 2020-08-031T11:20:60-08:00)

A continuación, selecciona las propiedades de usuario adicionales que deseas cargar con los mensajes. Las propiedades de usuario son metadatos contextuales asociados a cada mensaje que se pueden filtrar en la plataforma. Estos también son potencialmente utilizados por los modelos de aprendizaje automático en la plataforma. Hay dos tipos, ya sea de cadena o de número:

Las propiedades de usuario de String son metadatos categóricos (los ejemplos típicos incluyen ID, países, contrapartes, etc.)
Las propiedades de número de usuario son metadatos numéricos (los ejemplos típicos incluyen NPS, estadísticas de correo electrónico, cantidades, etc.)

Nota: Si tu archivo contiene una puntuación NPS como propiedad de usuario, esta debe incluirse como propiedad numérica y llamarse solo 'NPS', para que los gráficos NPS nativos se carguen en la plataforma.

Una vez que hayas seleccionado todas las propiedades de usuario, haz clic en "Cargar ".

A continuación, se te pedirá que inspecciones los mensajes cargados en un conjunto de datos que contenga la fuente en la que has cargado los datos. Si el origen aún no está asociado a ningún conjunto de datos, puedes crear uno nuevo para comprobar que la carga es la esperada.

Note: If you made a mistake when selecting the user properties you can re-upload the same file, and the platform will use the column ID as the identifier to overwrite the existing messages and properties (this will not affect any labels applied to existing messages ).

Solución de problemas

Nota: Si tu carga de CSV falla a mitad de la carga, puedes volver a cargar el mismo CSV después de corregir los errores. Si los ID de los mensajes y el texto (asunto y cuerpo) de cualquier mensaje ya cargado permanecen sin cambios, no se le cobrarán unidades de IA adicionales al volver a intentar la carga.

Esperemos que su carga se ejecute sin problemas, pero es posible que encuentre un problema durante el proceso de carga y vea un mensaje de error. A continuación, describimos algunos de ellos y explicamos por qué se producen, para ayudarte a resolverlos o evitarlos.

En los siguientes mensajes de error, {something} se asigna a información contextual sobre dónde se produjo el error. Además, la forma en que nos referimos a una posición en el archivo está estandarizada como:

Cadena	Se expande a:
{posición}	registro {row-number} en la línea {line-number} columna {column-number} (byte {byte-number})

El título del mensaje de error se muestra junto con una descripción, como se muestra a continuación:

Estos son algunos posibles mensajes de error que los usuarios pueden encontrar al cargar archivos CSV:

Tipo de error	Mensaje de error	Descripción
No hay suficientes columnas	El archivo CSV solo contiene {number-columns} columna(s), pero se necesitan al menos 3 (texto, marca de tiempo e ID)	El CSV cargado no contiene al menos 3 columnas o la plataforma ha detectado mal la codificación del archivo.
Codificación no válida	El archivo contiene caracteres no válidos (codificación detectada como {detected-encoding})	El archivo no está codificado correctamente como UTF-8/UTF-16/UTF-32 (la plataforma detecta automáticamente el formato del archivo)
Encabezado no válido	string:ti:er' does not match'(^delimiter\|id\|message\|timestamp \|timestamp_default_utc_offset \|timestamp_day_first\|timestamp_year_first\\Z)\|(^(?P<property_type>number\|string):(?P<name>\\w(?:[\\w]{0,30}\\w)?)\\Z)'	Si un encabezado de columna es un nombre no válido para una propiedad de usuario, la plataforma devuelve el mensaje predeterminado para cuando el esquema de una solicitud no es válido. Comprueba que cada encabezado de columna tiene un formato válido para su propósito. La longitud máxima de un encabezado de columna es de 32 caracteres alfanuméricos
Longitudes de fila desiguales	El CSV contiene longitudes de fila desiguales. El mensaje {position} tiene {number} campos, pero el registro anterior tiene {number} campos.	El CSV contiene filas con diferentes números de celdas o que son inconsistentes con el número de encabezados.
Formato de ID	ID de mensaje no válido para {record}. Los ID solo pueden constar de caracteres alfanuméricos ASCII y signos de puntuación (excepto '/'). Valor de celda: {cell-value}	Este error se produce cuando un campo de ID consta de caracteres no válidos, como se describe en el mensaje de error.
Longitud de ID	El ID es demasiado largo para el mensaje {record}. Tiene {number} bytes, se espera un máximo de 1024	Este error se produce cuando un campo de ID es más largo que la longitud máxima permitida (1024 caracteres)
Formato de marca de tiempo	Marca de tiempo con formato incorrecto en el mensaje {position}: {timestamp-error-message}. Valor de celda: {cell-value}	Este error se produce cuando no se ha podido analizar un campo de marca de tiempo.
Longitud del mensaje	El mensaje es demasiado largo para el mensaje {position}. Tiene {number} bytes, se espera un máximo de 65536	Este error se produce cuando un campo de mensaje es más largo que la longitud máxima permitida (65536 caracteres).
Formato de propiedad de número	Número con formato incorrecto en el mensaje {position}: {number-error-message}. Valor de celda: {cell-value}	Este error se produce cuando no se ha podido analizar un campo de propiedad de usuario numérico. La plataforma debe permitir cualquier formato que pueda decodificarse razonablemente como un número.
Longitud de la propiedad	La propiedad es demasiado larga para el mensaje {position}. Tiene {number} bytes, se espera un máximo de 4096	Este error se produce cuando un campo de propiedad de usuario es más largo que la longitud máxima permitida (4096 caracteres).
Error desconocido	Error de CSV desconocido: {underlying-error-message}	La lista anterior no es completamente exhaustiva: si se produce un error desconocido, vuelva a intentar la carga.