communications-mining

latest

false

Important :

Communications Mining est désormais inclus dans UiPath IXP. Consultez l’introduction du manuel utilisateur pour plus de détails. Ce contenu a été traduit à l'aide d'une traduction automatique. La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Guide de l'utilisateur de Communications Mining

Dernière mise à jour 23 mai 2025

Téléchargement d’un fichier CSV dans une source

Remarque : Vous devez disposer de l' administrateur Sources et de l'autorisation Modifier les messages .

Les sections suivantes expliquent comment télécharger des données d'un fichier CSV vers une source de données existante. Pour créer une source de données via l'interface graphique, cochez Créer ou supprimer une source de données.

Étapes clés

Remarque : si vous mettez à jour des messages existants dans une source, la modification des propriétés du message, telles que le texte du message, l'horodatage send_at et « à » ou « de », autres que les propriétés de l'utilisateur, entraînera la perte des annotations de champ général dans les ensembles de données associés. Il est fortement recommandé d' épingler la dernière version du modèle dans les ensembles de données associés avant de le faire.

Pour charger des données d'un fichier CSV vers une source de données, accédez à la page Sources (via la console d'administration, accessible via la roue dentée en haut à droite de votre page) et localisez la source dans laquelle vous souhaitez charger des données.

Sélectionnez l'icône de téléchargement dans le coin supérieur droit de la carte de la source de données (comme indiqué ci-dessous).

Cliquez ensuite sur « Sélectionner un fichier » et choisissez le fichier CSV que vous souhaitez télécharger.

Le fichier sélectionné doit répondre aux critères suivants :

Le fichier doit contenir des en-têtes sur la première ligne et être délimité par des virgules ou des tabulations
Trois colonnes sont requises au minimum : le contenu du texte du message (le message), un horodatage et un ID unique identifiant le message
Tous les champs de texte de votre fichier CSV doivent être mis entre guillemets doubles.
Le fichier doit être encodé en UTF-8, UTF-16 ou UTF-32 (la plateforme détecte automatiquement le fichier)
La taille du fichier CSV doit être 128 Mio ou moins. Si vous avez un fichier plus volumineux, vous pouvez toujours le télécharger en le divisant en plusieurs fichiers, chacun ayant moins de 128 Mo

Si votre fichier répond aux critères ci-dessus, vous pouvez alors configurer et télécharger les messages à l'étape suivante :

Sélectionnez les colonnes requises dans chacune des listes déroulantes contenant les en-têtes de colonnes détectés dans le fichier CSV :

Colonne ID :
- Il doit s'agir d'une colonne contenant un ID unique qui peut identifier le message
- Les ID de message ne peuvent contenir que des caractères alphanumériques ASCII (AZ az 0-9) et des ponctuations (sauf /)
- Remarque : S'il existe des messages dans la source avec le même ID, ils seront mis à jour de sorte à correspondre au contenu du nouveau fichier
Colonne de message :
- Il s'agit simplement de la colonne qui contient le texte du message que vous souhaitez analyser dans la plate-forme
Colonne d'horodatage :
- Il s'agit d'une colonne contenant la date et l'heure auxquelles le message a été enregistré
- Le format d'horodatage est flexible et sera déduit automatiquement par la plateforme

Si vous avez des données contenant des objets, des fils de discussion ou des participants (généralement visibles dans les incidents ou les files d'e-mail), vous pouvez également charger ces colonnes supplémentaires dans votre fichier CSV :

Colonne Objet
- Choisissez la colonne qui contient le message Objet
Colonne Expéditeur
- Choisissez la colonne qui contient l'expéditeur
Colonne À
- Choisissez la colonne qui contient le(s) Destinataire(s). Plusieurs destinataires doivent être séparés par des points-virgules.
Colonne Cc
- Choisissez la colonne qui contient le(s) destinataire(s) en Cc. Plusieurs destinataires doivent être séparés par des points-virgules.
Colonne ID de fil de discussion
- Choisissez la colonne qui contient le message ID de fil de discussion (Filter ID)
- Un ID de fil de discussion est ce qui relie différents messages au même fil de discussion

Format Expéditeur/À/Cc :

Les conditions suivantes dans les champs expéditeur/à/cc génèreront des erreurs :
- Dépasse le nombre maximum de destinataires (2 048 destinations max. par thread)
- L’expéditeur ou le destinataire dépasse la limite maximale de caractères (512 caractères maximum par destinataire)
- Deux ou plusieurs points-virgules se trouvent dans une ligne (p. ex. - celui-ci est incorrectement formaté : john@email.com ; beth@email.com)
Bien que la plate-forme supprime tout espace blanc avant ou après un destinataire, elle n'effectuera aucun nettoyage supplémentaire des données.
- Exemples de formats dans lesquels vous voulez vos données (liste non exhaustive) :
  - Exemple 1 : processus de Robert Robot <robot.bog@gmail.com> ; John Smith <john.smith@gmail.com>
  - Exemple 2 : rob.bog@gmail.com ;john.smith@gmail.com
  - Exemple 3 : rob.bog@gmail.com ; john.smith@gmail.com
La plateforme délimitera les différents destinataires par le point-virgule (;)
Avant de télécharger vos données, veuillez vous assurer que les e-mails sont formatés dans un format approprié
Veuillez noter que dans un cas d'utilisation standard file d'attente (par exemple : e-mails), il ne doit y avoir qu'un seul expéditeur dans chaque cellule « expéditeur »

Format d'horodatage :

Si le format d'horodatage que vous avez choisi est ambigu pour l'ordre des jours/mois/années (par ex. 01/02/03 10:10), vous pouvez suggérer la bonne interprétation :
- 2 janvier 2003 - Aucun
- 1 er février 2003 - Premier jour
- 3 février 2001 - Première année
- 2 mars 2001 - Jour en premier + Année en premier
Pour éviter toute ambiguïté, il est recommandé de fournir des horodatages au format RFC 3339 si possible (par ex. 2020-01-31T12:34:56Z pour UTC ou avec un fuseau horaire : 2020-08-031T11:20:60-08:00)

Sélectionnez ensuite les propriétés utilisateur supplémentaires que vous souhaitez télécharger avec les messages. Les propriétés utilisateur sont des métadonnées contextuelles associées à chaque message pouvant être filtré dans la plate-forme. Ceux-ci sont également potentiellement utilisés par les modèles d'apprentissage automatique de la plate-forme. Il existe deux types, chaîne ou nombre :

Les propriétés utilisateur des chaînes sont des métadonnées catégorielles (les exemples typiques incluent les ID, les pays, les homologues, etc.)
Les propriétés utilisateur des nombres sont des métadonnées numériques (les exemples typiques incluent NPS, statistiques des e-mails, montants, etc.)

Remarque : si votre fichier contient un score NPS en tant que propriété utilisateur, il doit être inclus en tant que propriété de nombre et nommé « NFS » uniquement, afin de déclencher le chargement des graphiques NPS natifs sur la plate-forme.

Une fois que vous avez sélectionné toutes les propriétés utilisateur, cliquez sur «Télécharger ».

Vous serez ensuite invité à inspecter les messages téléchargés dans un ensemble de données qui contient la source dans laquelle vous avez téléchargé des données. Si la source n'est associée à aucun ensemble de données pour le moment, vous pouvez en créer un nouveau pour vérifier que le téléchargement se déroule comme prévu.

Note: If you made a mistake when selecting the user properties you can re-upload the same file, and the platform will use the column ID as the identifier to overwrite the existing messages and properties (this will not affect any labels applied to existing messages ).

Résolution des problèmes

Remarque : si votre téléchargement au format CSV échoue à mi-chargement, vous pouvez charger à nouveau le même fichier CSV après avoir corrigé la ou les erreurs. Si les ID de message et le texte (objet et corps) des messages déjà téléchargés restent inchangés, aucune AI Unit supplémentaire ne vous sera facturée lors de la nouvelle tentative de téléchargement.

Nous espérons que votre téléchargement se déroulera correctement, mais il est possible que vous rencontriez un problème pendant le processus de téléchargement et que vous voyiez un message d’erreur. Nous avons décrit certaines d’entre elles ci-dessous et la raison de leur apparition afin de vous aider à les résoudre ou à les éviter.

Dans les messages d'erreur ci-dessous, {something} est mappé aux informations contextuelles indiquant où l'erreur s'est produite. De plus, la manière dont nous faisons référence à une position dans le fichier est normalisée comme suit :

Chaîne de caractères (string)	Développe jusqu'à :
{position}	enregistrement {row-number} sur la ligne {line-number} colonne {column-number} (octet {byte-number})

Le titre du message d'erreur s'affiche avec une description, comme indiqué ci-dessous :

Voici quelques messages d’erreur que les utilisateurs peuvent rencontrer lors du téléchargement de fichiers CSV :

Type d’erreur	Message d'erreur	Description
Colonnes insuffisantes	Le fichier CSV ne contient que {number-columns} colonne(s), mais au moins 3 sont nécessaires (texte, horodatage et id)	Le fichier CSV téléchargé ne contient pas au moins 3 colonnes, ou la plate-forme a mal détecté l’encodage du fichier.
Encodage non valide	Le fichier contient des caractères non valides (encodage détecté comme {detected-encoding})	Le fichier n'est pas correctement encodé en UTF-8 /UTF-16 /UTF-32 (la plateforme détecte automatiquement le format du fichier)
En-tête non valide	string:ti:er' does not match'(^delimiter\|id\|message\|timestamp \|timestamp_default_utc_offset \|timestamp_day_first\|timestamp_year_first\\Z)\|(^(?P<property_type>number\|string):(?P<name>\\w(?:[\\w]{0,30}\\w)?)\\Z)'	Si un en-tête de colonne est un nom non valide pour une propriété utilisateur, la plateforme renvoie le message par défaut lorsque le schéma d'une requête n'est pas valide. Vérifiez que le format de chaque en-tête de colonne est valide. La longueur maximale d'un en-tête de colonne est de 32 caractères alphanumériques
Longueurs de ligne inégales	Le fichier CSV contient des longueurs de ligne inégales. Le message {position} contient {number} champs, mais lʹenregistrement précédent contient {number} champs.	Le fichier CSV contient des lignes contenant des nombres de cellules différents ou qui sont incohérents avec le nombre d'en-têtes.
Format d'ID	ID de message non valide pour {record}. Les ID ne peuvent être composés que de caractères alphanumériques et de ponctuation ASCII (sauf '/'). Valeur de la cellule : {cell-value}	Cette erreur se produit lorsqu'un champ ID est composé de caractères non valides, comme décrit dans le message d'erreur.
Longueur de l’ID	L'ID est trop long pour le message {record}. Il contient {number} octets, au maximum 1024	Cette erreur se produit lorsqu’un champ d’identification est plus long que la longueur maximale autorisée (1 024 caractères)
Format d'horodatage	Horodatage incorrectement formaté dans le message {position} : {timestamp-error-message}. Valeur de la cellule : {cell-value}	Cette erreur se produit lorsqu'un champ d'horodatage n'a pas pu être analysé.
Longueur du message	Le message est trop long pour le message {position}. Il contient {number} octets, avec une valeur maximale de 65 536	Cette erreur se produit lorsqu’un champ de message dépasse la longueur maximale autorisée (65 536 caractères).
Format de propriété des nombres	Nombre incorrectement formaté dans le message {position} : {number-error-message}. Valeur de la cellule : {cell-value}	Cette erreur se produit lorsqu’un champ de propriété utilisateur numérique n’a pas pu être analysé. La plate-forme doit autoriser tout format pouvant raisonnablement être décodé sous forme de nombre.
Longueur de propriété	La propriété est trop longue pour le message {position}. Il contient {number} octets, avec une valeur maximale de 4096	Cette erreur se produit lorsqu’un champ de propriété utilisateur est plus long que la longueur maximale autorisée (4 096 caractères).
Erreur inconnue	Erreur CSV inconnue : {underlying-error-message}	La liste ci-dessus n'est pas complètement exhaustive. Si une erreur inconnue se produit, relancez le téléchargement.