Communications Mining
Plus récente (Latest)
False
Image de fond de la bannière
Guide de l'utilisateur de Communications Mining
Dernière mise à jour 18 avr. 2024

Téléchargement d’un fichier CSV dans une source

Autorisations utilisateur requises : « Administrateur de sources » ET « Modifier les messages ».

Remarque : cet article montre comment télécharger des données d'un fichier CSV vers une source de données existante. Pour comprendre comment créer d’abord une source de données via l'interface graphique, reportez-vous ici.
Étapes clés
Remarque : Si vous mettez à jour des messages existants dans une source, la modification des propriétés du message (par ex. le texte du message, l'horodatage par l'envoi_à'et l'horodatage 'to' ou 'from') autres que les propriétés utilisateur, entraîneront la perte des annotations d'entité dans les ensembles de données associés. Il est fortement recommandé d'épingler la dernière version du modèle dans les ensembles de données associés avant de le faire.

Pour charger des données d'un fichier CSV vers une source de données, accédez à la page Sources (via la console d'administration, accessible via la roue dentée en haut à droite de votre page) et localisez la source dans laquelle vous souhaitez charger des données.

Cliquez sur l'icône de téléchargement dans le coin supérieur droit de la carte de la source de données (comme indiqué ci-dessous).

Carte de source de données

Cliquez ensuite sur « Sélectionner un fichier » et choisissez le fichier CSV que vous souhaitez télécharger.

Le fichier sélectionné doit répondre aux critères suivants :

  • Le fichier doit contenir des en-têtes sur la première ligne et être délimité par des virgules ou des tabulations
  • Trois colonnes sont requises au minimum : le contenu du texte du message (le message), un horodatage et un ID unique identifiant le message
  • Tous les champs de texte de votre fichier CSV doivent être mis entre guillemets doubles.
  • Le fichier doit être encodé en UTF-8, UTF-16 ou UTF-32 (la plateforme détecte automatiquement le fichier)
  • Le fichier CSV doit être de 64 Mo ou moins. Si vous avez un fichier plus volumineux, vous pouvez toujours le télécharger en le divisant en plusieurs fichiers, chacun contenant moins de 64 Mo
Page de téléchargement CSV - Étape 1

Si votre fichier répond aux critères ci-dessus, vous pouvez alors configurer et télécharger les messages à l'étape suivante :

Page de téléchargement CSV - Étape 2

Sélectionnez les colonnes requises dans chacune des listes déroulantes contenant les en-têtes de colonnes détectés dans le fichier CSV :

  • Colonne ID :
    • Il doit s'agir d'une colonne contenant un ID unique qui peut identifier le message
    • Les ID de message ne peuvent contenir que des caractères alphanumériques ASCII (AZ az 0-9) et des ponctuations (sauf /)
    • Remarque : S'il existe des messages dans la source avec le même ID, ils seront mis à jour de sorte à correspondre au contenu du nouveau fichier
  • Colonne de message :
    • Il s'agit simplement de la colonne qui contient le texte du message que vous souhaitez analyser dans la plate-forme
  • Colonne d'horodatage :
    • Il s'agit d'une colonne contenant la date et l'heure auxquelles le message a été enregistré
    • Le format d'horodatage est flexible et sera déduit automatiquement par la plateforme

Si vous avez des données contenant des objets, des fils de discussion ou des participants (généralement visibles dans les incidents ou les files d'e-mail), vous pouvez également charger ces colonnes supplémentaires dans votre fichier CSV :

  • Colonne Objet
    • Choisissez la colonne qui contient le message Objet
  • Colonne Expéditeur
    • Choisissez la colonne qui contient l'expéditeur
  • Colonne À
    • Choisissez la colonne qui contient le(s) Destinataire(s). Plusieurs destinataires doivent être séparés par des points-virgules.
  • Colonne Cc
    • Choisissez la colonne qui contient le(s) destinataire(s) en Cc. Plusieurs destinataires doivent être séparés par des points-virgules.
  • Colonne ID de fil de discussion
    • Choisissez la colonne qui contient le message ID de fil de discussion (Filter ID)
    • Un ID de fil de discussion est ce qui relie différents messages au même fil de discussion

Format Expéditeur/À/Cc :

  • Les conditions suivantes dans les champs expéditeur/à/cc génèreront des erreurs :
    • Dépasse le nombre maximum de destinataires (2 048 destinations max. par thread)
    • L’expéditeur ou le destinataire dépasse la limite maximale de caractères (512 caractères maximum par destinataire)
    • Deux ou plusieurs points-virgules se trouvent dans une ligne (p. ex. - celui-ci est incorrectement formaté : john@email.com ; beth@email.com)
  • Bien que la plate-forme supprime tout espace blanc avant ou après un destinataire, elle n'effectuera aucun nettoyage supplémentaire des données.
    • Exemples de formats dans lesquels vous voulez vos données (liste non exhaustive) :
      • Exemple 1 : processus de Robert Robot <robot.bog@gmail.com> ; John Smith <john.smith@gmail.com>
      • Exemple 2 : rob.bog@gmail.com ;john.smith@gmail.com
      • Exemple 3 : rob.bog@gmail.com ; john.smith@gmail.com
  • La plateforme délimitera les différents destinataires par le point-virgule (;)
  • Avant de télécharger vos données, veuillez vous assurer que les e-mails sont formatés dans un format approprié
  • Veuillez noter que dans un cas d'utilisation standard file d'attente (par exemple : e-mails), il ne doit y avoir qu'un seul expéditeur dans chaque cellule « expéditeur »

Format d'horodatage :

  • Si le format d'horodatage que vous avez choisi est ambigu pour l'ordre des jours/mois/années (par ex. 01/02/03 10:10), vous pouvez suggérer la bonne interprétation :
    • 2 janvier 2003 - Aucun
    • 1 er février 2003 - Premier jour
    • 3 février 2001 - Première année
    • 2 mars 2001 - Jour en premier + Année en premier
  • Pour éviter toute ambiguïté, il est recommandé de fournir des horodatages au format RFC 3339 si possible (par ex. 2020-01-31T12:34:56Z pour UTC ou avec un fuseau horaire : 2020-08-031T11:20:60-08:00)

Sélectionnez ensuite les propriétés utilisateur supplémentaires que vous souhaitez télécharger avec les messages. Les propriétés utilisateur sont des métadonnées contextuelles associées à chaque message pouvant être filtré dans la plate-forme. Ceux-ci sont également potentiellement utilisés par les modèles d'apprentissage automatique de la plate-forme. Il existe deux types, chaîne ou nombre :

  • Les propriétés utilisateur des chaînes sont des métadonnées catégorielles (les exemples typiques incluent les ID, les pays, les homologues, etc.)
  • Les propriétés utilisateur des nombres sont des métadonnées numériques (les exemples typiques incluent NPS, statistiques des e-mails, montants, etc.)
Remarque :

Si votre fichier contient un score NPS en tant que propriété utilisateur, il doit être inclus en tant que propriété numérique et nommé « NFS » uniquement, afin de déclencher le chargement des graphiques NPS natifs dans la plate-forme.

Une fois que vous avez sélectionné toutes les propriétés utilisateur, cliquez sur «Télécharger ».

Vous serez ensuite invité à inspecter les messages téléchargés dans un ensemble de données qui contient la source dans laquelle vous avez téléchargé des données. Si la source n'est associée à aucun ensemble de données pour le moment, vous pouvez en créer un nouveau pour vérifier que le téléchargement se déroule comme prévu.

Remarque :

Si vous avez fait une erreur lors de la sélection des propriétés utilisateur, vous pouvez télécharger à nouveau le même fichier, et la plate-forme utilisera l'ID de colonne comme identifiant pour écraser les messages et les propriétés existants (cela n'affectera pas les libellés appliqués aux messages existants).

Résolution des problèmes

Nous espérons que votre téléchargement se déroulera correctement, mais il est possible que vous rencontriez un problème pendant le processus de téléchargement et que vous voyiez un message d’erreur. Nous avons décrit certaines d’entre elles ci-dessous et la raison de leur apparition afin de vous aider à les résoudre ou à les éviter.

Dans les messages d'erreur ci-dessous, {something} est mappé aux informations contextuelles indiquant où l'erreur s'est produite. De plus, la manière dont nous faisons référence à une position dans le fichier est normalisée comme suit :

Chaîne de caractères (string)Développe jusqu'à :
{position}enregistrement {row-number} sur la ligne {line-number} colonne {column-number} (octet {byte-number})
Le titre du message d'erreur s'affiche avec une description, comme indiqué ci-dessous :


Voici quelques messages d’erreur que les utilisateurs peuvent rencontrer lors du téléchargement de fichiers CSV :

Type d’erreurMessage d'erreurDescription
Colonnes insuffisantesLe fichier CSV ne contient que {number-columns} colonne(s), mais au moins 3 sont nécessaires (texte, horodatage et id)Le fichier CSV téléchargé ne contient pas au moins 3 colonnes, ou la plate-forme a mal détecté l’encodage du fichier.
Encodage non valideLe fichier contient des caractères non valides (encodage détecté comme {detected-encoding})Le fichier n'est pas correctement encodé en UTF-8 /UTF-16 /UTF-32 (la plateforme détecte automatiquement le format du fichier)
En-tête non validestring:ti:er' does not match'(^delimiter|id|message|timestamp |timestamp_default_utc_offset |timestamp_day_first|timestamp_year_first\\Z)|(^(?P<property_type>number|string):(?P<name>\\w(?:[\\w]{0,30}\\w)?)\\Z)'Si un en-tête de colonne est un nom non valide pour une propriété utilisateur, la plateforme renvoie le message par défaut lorsque le schéma d'une requête n'est pas valide. Vérifiez que le format de chaque en-tête de colonne est valide. La longueur maximale d'un en-tête de colonne est de 32 caractères alphanumériques
Longueurs de ligne inégalesLe fichier CSV contient des longueurs de ligne inégales. Le message {position} contient {number} champs, mais lʹenregistrement précédent contient {number} champs.Le fichier CSV contient des lignes contenant des nombres de cellules différents ou qui sont incohérents avec le nombre d'en-têtes.
Format d'IDID de message non valide pour {record}. Les ID ne peuvent être composés que de caractères alphanumériques et de ponctuation ASCII (sauf '/'). Valeur de la cellule : {cell-value} Cette erreur se produit lorsqu'un champ ID est composé de caractères non valides, comme décrit dans le message d'erreur.
Longueur de l’IDL'ID est trop long pour le message {record}. Il contient {number} octets, au maximum 1024Cette erreur se produit lorsqu’un champ d’identification est plus long que la longueur maximale autorisée (1 024 caractères)
Format d'horodatageHorodatage incorrectement formaté dans le message {position} : {timestamp-error-message}. Valeur de la cellule : {cell-value}Cette erreur se produit lorsqu'un champ d'horodatage n'a pas pu être analysé.
Longueur du messageLe message est trop long pour le message {position}. Il contient {number} octets, avec une valeur maximale de 65 536Cette erreur se produit lorsqu’un champ de message dépasse la longueur maximale autorisée (65 536 caractères).
Format de propriété des nombresNombre incorrectement formaté dans le message {position} : {number-error-message}. Valeur de la cellule : {cell-value}Cette erreur se produit lorsqu’un champ de propriété utilisateur numérique n’a pas pu être analysé. La plate-forme doit autoriser tout format pouvant raisonnablement être décodé sous forme de nombre.
Longueur de propriétéLa propriété est trop longue pour le message {position}. Il contient {number} octets, avec une valeur maximale de 4096Cette erreur se produit lorsqu’un champ de propriété utilisateur est plus long que la longueur maximale autorisée (4 096 caractères).
Erreur inconnueErreur CSV inconnue : {underlying-error-message}La liste ci-dessus n'est pas complètement exhaustive. Si une erreur inconnue se produit, relancez le téléchargement.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Logo Uipath blanc
Confiance et sécurité
© 2005-2024 UiPath. All rights reserved.