Communications Mining
Más reciente
False
Imagen de fondo del banner
Guía de usuario de Communications Mining
Última actualización 18 de abr. de 2024

Cargar un archivo CSV en un origen

Permisos de usuario necesarios: 'Administrador de fuentes' Y 'Editar mensajes'.

Nota: Este artículo muestra cómo cargar datos de un archivo CSV en una fuente de datos existente. Para entender cómo crear primero una fuente de datos a través de la GUI, consulta aquí.
Pasos clave
Nota: Si se actualizan los mensajes existentes en un origen, cambiar las propiedades del mensaje (p. ej. el texto del mensaje, la marca de tiempo enviado a las y 'a' o 'de') que no sean propiedades de usuario, hará que se pierdan las anotaciones de entidad en los conjuntos de datos asociados. Se recomienda encarecidamente fijar la última versión del modelo en los conjuntos de datos asociados antes de hacerlo.

Para cargar datos desde un archivo CSV a una fuente de datos, dirígete a la página Fuentes (a través de la consola de administración, a la que se accede a través de la rueda dentada de la parte superior derecha de la página) y localiza la fuente en la que deseas cargar los datos.

Haz clic en el icono de carga en la esquina superior derecha de la tarjeta de origen de datos (como se muestra a continuación).

Tarjeta de origen de datos

A continuación, haz clic en "Seleccionar archivo" y elige el archivo CSV que deseas cargar.

El archivo seleccionado debe cumplir los siguientes criterios:

  • El archivo debe contener encabezados en la primera línea y estar delimitado por comas o tabulaciones
  • Se requiere un mínimo de tres columnas: el contenido del texto del mensaje (el mensaje), una marca de tiempo y un ID único que identifique el mensaje
  • Todos los campos de texto de tu archivo CSV deben estar entre comillas dobles
  • El archivo debe estar codificado como UTF-8, UTF-16 o UTF-32 (la plataforma detecta automáticamente cuál)
  • El archivo CSV debe tener 64 MiB o menos. Si tiene un archivo más grande, puede cargarlo dividiéndolo en varios archivos, cada uno de menos de 64 MiB
Página de carga de CSV: paso 1

Si tu archivo cumple los criterios anteriores, puedes configurar y cargar los mensajes en el siguiente paso:

Página de carga de CSV: paso 2

Selecciona las columnas necesarias de cada una de las listas desplegables que contienen los encabezados de columna detectados en el archivo CSV:

  • Columna de ID:
    • Esta debe ser una columna que contenga un ID único que pueda identificar el mensaje
    • Los ID de mensaje solo pueden contener caracteres alfanuméricos ASCII (AZ az 0-9) y signos de puntuación (excepto /)
    • Nota: Si hay mensajes existentes en el origen con el mismo ID, se actualizarán para que coincidan con el contenido del nuevo archivo
  • Columna de mensaje:
    • Esta es simplemente la columna que contiene el texto del mensaje que desea analizar en la plataforma
  • Columna de marca de tiempo:
    • Esta es una columna que contiene la fecha y la hora en que se grabó el mensaje
    • El formato de la marca de tiempo es flexible y la plataforma lo deducirá automáticamente

Si tienes datos que contienen líneas de asunto, hilos o participantes (normalmente vistos en casos o hilos de correo electrónico), también puedes cargar estas columnas adicionales dentro de tu archivo CSV:

  • Columna de asunto
    • Elija qué columna contiene el Asunto del mensaje
  • Columna del remitente
    • Elija qué columna contiene el remitente
  • A columna
    • Elija qué columna contiene los destinatarios. Los destinatarios múltiples deben estar separados por punto y coma.
  • Columna CC
    • Elija qué columna contiene los destinatarios en copia. Los destinatarios múltiples deben estar separados por punto y coma
  • Columna de ID de hilo
    • Elija la columna que contiene el mensaje ID del hilo
    • Un ID de hilo es lo que vincula diferentes mensajes al mismo hilo

Remitente/Para/Formato CC:

  • Las siguientes condiciones en los campos remitente/a/cc desencadenarán errores:
    • Supera el número máximo de destinatarios (máximo 2048 destinatarios por hilo)
    • El remitente o el destinatario supera el límite máximo de caracteres (máximo 512 caracteres por destinatario)
    • Se encuentran dos o más puntos y coma en una fila (p. ej., lo siguiente tiene un formato incorrecto: john@email.com; beth@email.com)
  • Aunque la plataforma eliminará cualquier espacio en blanco antes o después de un destinatario, no realizará ninguna limpieza de datos adicional.
    • Ejemplos de formatos en los que puede querer sus datos (no es una lista exhaustiva):
      • Ejemplo 1: Robert Bog <rob.bog@gmail.com>; John Smith <john.smith@gmail.com>
      • Ejemplo 2: rob.bog@gmail.com ;john.smith@gmail.com
      • Ejemplo 3: rob.bog@gmail.com; john.smith@gmail.com
  • La plataforma delimitará los diferentes destinatarios mediante el punto y coma (;)
  • Antes de cargar sus datos, asegúrese de que los correos electrónicos tengan el formato adecuado
  • Ten en cuenta que en un caso de uso típico de subprocesos (por ejemplo, correos electrónicos), solo debe haber 1 remitente en cada celda 'remitente'

Formato de marca de tiempo:

  • Si el formato de marca de tiempo elegido es ambiguo para el orden de días/meses/años (p. ej. 02/01/03 10:10), puedes sugerir la interpretación correcta:
    • 2 de enero de 2003: ninguno
    • 1 de febrero de 2003: primer día
    • 3 de febrero de 2001: primer año
    • 2 de marzo de 2001: primero el día + primero el año
  • Para evitar ambigüedades, se recomienda proporcionar las marcas de tiempo en el formato RFC 3339 si es posible (p. ej. 2020-01-31T12:34:56Z para UTC o con una zona horaria: 2020-08-031T11:20:60-08:00)

A continuación, selecciona las propiedades de usuario adicionales que deseas cargar con los mensajes. Las propiedades de usuario son metadatos contextuales asociados a cada mensaje que se pueden filtrar en la plataforma. Estos también son potencialmente utilizados por los modelos de aprendizaje automático en la plataforma. Hay dos tipos, ya sea de cadena o de número:

  • Las propiedades de usuario de String son metadatos categóricos (los ejemplos típicos incluyen ID, países, contrapartes, etc.)
  • Las propiedades de número de usuario son metadatos numéricos (los ejemplos típicos incluyen NPS, estadísticas de correo electrónico, cantidades, etc.)
Nota:

Si tu archivo contiene una puntuación NPS como propiedad de usuario, esta debe incluirse como propiedad numérica y llamarse solo 'NPS', para que los gráficos NPS nativos se carguen en la plataforma.

Una vez que hayas seleccionado todas las propiedades de usuario, haz clic en "Cargar ".

A continuación, se te pedirá que inspecciones los mensajes cargados en un conjunto de datos que contenga la fuente en la que has cargado los datos. Si el origen aún no está asociado a ningún conjunto de datos, puedes crear uno nuevo para comprobar que la carga es la esperada.

Nota:

Si cometiste un error al seleccionar las propiedades del usuario, puedes volver a cargar el mismo archivo, y la plataforma utilizará el ID de columna como identificador para sobrescribir los mensajes y propiedades existentes (esto no afectará a las etiquetas aplicadas a los mensajes existentes).

Solución de problemas

Esperemos que su carga se ejecute sin problemas, pero es posible que encuentre un problema durante el proceso de carga y vea un mensaje de error. A continuación, describimos algunos de ellos y explicamos por qué se producen, para ayudarte a resolverlos o evitarlos.

En los siguientes mensajes de error, {something} se asigna a información contextual sobre dónde se produjo el error. Además, la forma en que nos referimos a una posición en el archivo está estandarizada como:

CadenaSe expande a:
{posición}registro {row-number} en la línea {line-number} columna {column-number} (byte {byte-number})
El título del mensaje de error se muestra junto con una descripción, como se muestra a continuación:


Estos son algunos posibles mensajes de error que los usuarios pueden encontrar al cargar archivos CSV:

Tipo de errorMensaje de errorDescripción
No hay suficientes columnasEl archivo CSV solo contiene {number-columns} columna(s), pero se necesitan al menos 3 (texto, marca de tiempo e ID)El CSV cargado no contiene al menos 3 columnas o la plataforma ha detectado mal la codificación del archivo.
Codificación no válidaEl archivo contiene caracteres no válidos (codificación detectada como {detected-encoding})El archivo no está codificado correctamente como UTF-8/UTF-16/UTF-32 (la plataforma detecta automáticamente el formato del archivo)
Encabezado no válidostring:ti:er' does not match'(^delimiter|id|message|timestamp |timestamp_default_utc_offset |timestamp_day_first|timestamp_year_first\\Z)|(^(?P<property_type>number|string):(?P<name>\\w(?:[\\w]{0,30}\\w)?)\\Z)'Si un encabezado de columna es un nombre no válido para una propiedad de usuario, la plataforma devuelve el mensaje predeterminado para cuando el esquema de una solicitud no es válido. Comprueba que cada encabezado de columna tiene un formato válido para su propósito. La longitud máxima de un encabezado de columna es de 32 caracteres alfanuméricos
Longitudes de fila desigualesEl CSV contiene longitudes de fila desiguales. El mensaje {position} tiene {number} campos, pero el registro anterior tiene {number} campos.El CSV contiene filas con diferentes números de celdas o que son inconsistentes con el número de encabezados.
Formato de IDID de mensaje no válido para {record}. Los ID solo pueden constar de caracteres alfanuméricos ASCII y signos de puntuación (excepto '/'). Valor de celda: {cell-value} Este error se produce cuando un campo de ID consta de caracteres no válidos, como se describe en el mensaje de error.
Longitud de IDEl ID es demasiado largo para el mensaje {record}. Tiene {number} bytes, se espera un máximo de 1024Este error se produce cuando un campo de ID es más largo que la longitud máxima permitida (1024 caracteres)
Formato de marca de tiempoMarca de tiempo con formato incorrecto en el mensaje {position}: {timestamp-error-message}. Valor de celda: {cell-value}Este error se produce cuando no se ha podido analizar un campo de marca de tiempo.
Longitud del mensajeEl mensaje es demasiado largo para el mensaje {position}. Tiene {number} bytes, se espera un máximo de 65536Este error se produce cuando un campo de mensaje es más largo que la longitud máxima permitida (65536 caracteres).
Formato de propiedad de númeroNúmero con formato incorrecto en el mensaje {position}: {number-error-message}. Valor de celda: {cell-value}Este error se produce cuando no se ha podido analizar un campo de propiedad de usuario numérico. La plataforma debe permitir cualquier formato que pueda decodificarse razonablemente como un número.
Longitud de la propiedadLa propiedad es demasiado larga para el mensaje {position}. Tiene {number} bytes, se espera un máximo de 4096Este error se produce cuando un campo de propiedad de usuario es más largo que la longitud máxima permitida (4096 caracteres).
Error desconocidoError de CSV desconocido: {underlying-error-message}La lista anterior no es completamente exhaustiva: si se produce un error desconocido, vuelva a intentar la carga.

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.