IXP – Téléchargement d'un fichier CSV vers une source

ixp

latest

false

Guide de l’utilisateur de Communications Mining

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Téléchargement d’un fichier CSV dans une source

Téléchargez les données d’un fichier CSV dans une source de données Communications Mining à l’aide de l’interface utilisateur de la plate-forme.

Remarque :

Vous devez avoir attribué le rôle Administrateur de projet IXP en tant qu'utilisateur Automation Cloud, ou les autorisations Administrateur de sources et Modifier les messages en tant qu'utilisateur hérité pour télécharger des fichiers CSV dans une source.

Pour charger des données d'un fichier CSV vers une source de données, appliquez les étapes suivantes :

Remarque :

Toute mise à jour d’autres éléments que les propriétés utilisateur entraînera la perte des annotations de champ général des ensembles de données associés. Par exemple, la mise à jour des messages existants dans une source, la modification des propriétés du message, telles que le texte du message, l'horodatage envoyé et vers ou depuis. Assurez-vous d’épingler la dernière version du modèle dans les ensembles de données associés avant de le faire.
Pour plus de détails sur la création d’une source de données, consultez Création ou suppression d’une source de données dans l’interface graphique.

Accédez à la page Administrateur .
Sélectionnez l'onglet Sources et localisez la source vers laquelle vous souhaitez télécharger des données.
Sélectionnez l'icône de téléchargement sur la carte de la source de données.
Utilisez Sélectionner le fichier pour choisir un fichier CSV sur votre ordinateur.
Sélectionnez le fichier CSV que vous souhaitez télécharger. Assurez-vous que le fichier répond aux critères suivants :
- Le fichier doit inclure des en-têtes sur la première ligne et être délimité par des virgules ou des tabulations.
- Le fichier doit contenir au moins trois colonnes :
  - Message : le texte du message.
  - Horodatage : date de création du message.
  - ID unique : un identifiant distinct pour chaque message.
- Tous les champs de texte doivent être placés entre guillemets doubles dans le fichier.
- Le fichier doit être encodé en UTF-8, UTF-16 ou UTF-32. La plate-forme détecte automatiquement l'encodage correct.
- La taille du fichier doit être inférieure à 128 Mo. Pour les fichiers plus volumineux, divisez-les en plusieurs fichiers d'une taille inférieure à 128 Mio.
Sélectionnez les colonnes requises, où les menus déroulants contiennent les en-têtes de colonnes détectés dans le fichier CSV :
- Colonne Message : la colonne qui contient le texte du message que vous souhaitez analyser sur la plate-forme. Vous pouvez activer ou désactiver les options suivantes :
  - Le message est en HTML : lorsque cette option est activée, la colonne du corps est interprétée comme HTML. Le contenu du message est extrait du code html que vous avez fourni.
  - Extraire les signatures : lorsque cette option est activée, la plate-forme tente de nettoyer les signatures dans les corps de message, en les déplaçant dans le bloc de signature.
- Colonne ID du message : une colonne avec un ID unique qui peut identifier le message. Les ID de message ne peuvent contenir que des caractères alphanumériques ASCII (AZ, az, 0-9) et des caractères de ponctuations, à l’exception de la barre oblique /.
  
  Remarque :
  Si des messages existent déjà dans la source avec le même ID, ils seront mis à jour pour correspondre au contenu du nouveau fichier.
- Colonne Message : la colonne qui contient le texte du message que vous souhaitez analyser sur la plate-forme.
- Colonne Horodatage : colonne qui contient la date et l'heure auxquelles le message a été enregistré. Le format d’horodatage est flexible et la plate-forme le déduit automatiquement. Pour plus de détails, consultez Utiliser les formats corrects.
Vous pouvez sélectionner les colonnes supplémentaires suivantes si vous avez des données qui contiennent des lignes d'objet, des fils de discussion ou des participants, généralement rencontrés dans des incidents ou des fils de discussion des e-mails :
- Colonne Objet - Colonne qui contient l'objet du message.
- Colonne de l'expéditeur : la colonne qui contient l'expéditeur.
- À la colonne - Colonne qui contient un ou plusieurs destinataires. Assurez-vous que plusieurs destinataires sont séparés par un point-virgule ;.
- Colonne Cc - Colonne qui contient un ou plusieurs destinataires dans le champ Cc. Assurez-vous que plusieurs destinataires sont séparés par un point-virgule ;.
  - Pour plus de détails sur l'utilisation des formats corrects dans les champs Expéditeur, À et Cc, consultez la section Utiliser les formats corrects.
- Colonne ID de fil de discussion : la colonne qui contient l'ID de fil de discussion du message. L'ID de fil de discussion associe différents messages au même fil de discussion.
Vous pouvez sélectionner les propriétés utilisateur supplémentaires que vous souhaitez télécharger avec les messages. Les propriétés utilisateur sont des métadonnées contextuelles associées à chaque message que vous pouvez filtrer dans la plateforme. Les modèles d’apprentissage automatique de la plate-forme peuvent également exploiter ces propriétés utilisateur, qui sont des types suivants :
- Les propriétés utilisateur de chaîne sont des métadonnées catégorielles, par exemple, les identifiants, les pays, les contreparties, etc.
- Les propriétés utilisateur du nombre sont des métadonnées numériques, par exemple, le NPS, les statistiques des e-mails, les montants, etc.
Remarque :
Si votre fichier contient un score NPS en tant que propriété utilisateur, vous devez l’inclure en tant que propriété de nombre et le nommer uniquement NPS afin de déclencher les graphiques NPS natifs à charger sur la plate-forme.
Une fois que vous avez sélectionné toutes les propriétés utilisateur, sélectionnez Télécharger. Vous serez invité à inspecter les messages téléchargés dans un ensemble de données qui contient la source dans laquelle vous avez téléchargé les données. Si la source n'est associée à aucun ensemble de données, vous pouvez créer un nouvel ensemble de données pour vérifier que le téléchargement est comme prévu.
Remarque :
Si vous avez fait une erreur lors de la sélection des propriétés utilisateur, vous pouvez à nouveau télécharger le même fichier. La plate-forme utilisera l'ID de colonne comme identifiant pour écraser les messages et propriétés existants. Cela n'affectera pas les libellés appliqués aux messages existants.

Utilisation des formats appropriés

Le format Expéditeur/À/CC

Assurez-vous que :

Le nombre de destinataires ne dépasse pas le maximum de 2 048 par fil de discussion.
L'expéditeur ou tout destinataire ne dépasse pas la limite de 512 caractères.
Il n'y a qu'un seul point-virgule dans une ligne. Par exemple, le format suivant est incorrect : john@email.com ; beth@email.com.

Bien que la plate-forme supprime tous les espaces blancs avant ou après un destinataire, elle n’effectue aucune nettoyage supplémentaire des données. Voici quelques exemples de format que vous souhaiterez peut-être utiliser pour vos données :

Exemple 1 : Tony Robot robo.bog@gmail.com; John Smith , john.smith@gmail.com
Exemple 2 : robo.bog@gmail.com ;john.smith@gmail.com
Exemple 3 : robo.bog@gmail.com ; john.smith@gmail.com

La plate-forme délimite les différents destinataires par un point-virgule ;.

Avant de télécharger vos données, assurez-vous que les e-mails sont formatés correctement.

Remarque :

Dans un cas d'utilisation standard de fils de discussion, tel que des fils de discussion par e-mail, chaque cellule de l'expéditeur ne doit contenir qu'un seul expéditeur.

Le format d’horodatage

Si le format d'horodatage choisi est ambigu pour l'ordre des jours, des mois et des années, tel que 01/02/03 10:10, vous pouvez proposer l'interprétation correcte :

2 janvier 2003 - Aucun
1 er février 2003 - Premier jour
3 février 2001 - Première année
2 mars 2001 - Jour en premier + Année en premier

Pour éviter toute ambiguïté, il est recommandé de fournir des horodatages au format RFC 3339 . Par exemple, 2020-01-31T12:34:56Z pour UTC ou avec un fuseau horaire : 2020-08-031T11:20:60-08:00.

Résolution des problèmes

Remarque :

Si votre téléchargement CSV échoue à mi-chargement, vous pouvez télécharger le même fichier CSV à nouveau après avoir corrigé l'erreur. Si les ID de message et le texte (objet et corps) des messages déjà téléchargés restent inchangés, des AI Unit ou des Platform Units supplémentaires ne vous seront pas facturées lors de la nouvelle tentative de téléchargement.

Cette section contient les messages d’erreur éventuels qui peuvent survenir pendant le processus de chargement, ainsi que les solutions correspondantes.

Dans les messages d’erreur suivants, {something} correspond à des informations contextuelles sur lesquelles l’erreur s’est produite. De plus, la façon dont nous faisons référence à une position dans le fichier est normalisée comme suit :

Chaîne de caractères (string)	Développe jusqu'à :
{position}	enregistrement {row-number} sur la ligne {line-number} colonne {column-number} (octet {byte-number})

Le titre du message d’erreur s’affiche avec une description, comme illustré dans l’image suivante :

Remarque :

Si vous rencontrez une erreur autre que celles répertoriées dans le tableau, réessayez le téléchargement.

Type d’erreur	Message d'erreur	Description
Colonnes insuffisantes	Le fichier CSV ne contient que {number-columns} colonnes, mais au moins 3 sont nécessaires, à savoir, le texte, l'horodatage et l'id.	Le fichier CSV téléchargé ne contient pas au moins 3 colonnes, ou la plate-forme a détecté par erreur l'encodage du fichier.
Encodage non valide	Le fichier contient des caractères non valides, où l’encodage est détecté comme étant {detected-encoding}.	Le fichier n’est pas correctement encodé en UTF-8, UTF-16 ou UTF-32. La plateforme détecte automatiquement le format du fichier.
En-tête non valide	`string:ti:er'` ne correspond pas à `'(^delimiter	id
Longueurs de ligne inégales	Le fichier CSV contient des longueurs de ligne inégales. Le message {position} contient {number} champs, mais lʹenregistrement précédent contient {number} champs.	Le fichier CSV contient des lignes contenant des nombres de cellules différents ou qui sont incohérents avec le nombre d'en-têtes.
Format d'ID	ID de message non valide pour {record}. Les ID ne peuvent être constitués que de caractères alphanumériques ASCII et de caractères de ponctuations, à l’exception de la barre oblique `/`. Valeur de la cellule : {cell-value}.	Se produit lorsqu’un champ d’ID se compose de caractères non valides, comme décrit dans le message d’erreur.
Longueur de l’ID	L'ID est trop long pour le message {record}. Il contient {number} octets, au maximum 1 024.	Se produit lorsqu'un champ d'ID dépasse la longueur maximale autorisée, c'est-à-dire 1 024 caractères.
Format d'horodatage	Horodatage correctement formaté dans le message {position} : {timestamp-error-message}. Valeur de la cellule : {cell-value}.	Se produit lorsqu’un champ d’horodatage n’a pas pu être analysé.
Longueur du message	Le message est trop long pour le message {position}. Il contient {number} octets, censés être au maximum 65 536.	Se produit lorsqu’un champ de message dépasse la longueur maximale autorisée, c’est-à-dire 65 536 caractères.
Format de propriété des nombres	Nombre mal formaté dans le message {position} : {number-error-message}. Valeur de la cellule : {cell-value}.	Se produit lorsqu’un champ de propriété utilisateur de nombre n’a pas pu être analysé. La plate-forme doit autoriser tout format pouvant être raisonnablement décodé sous forme de nombre.
Longueur de propriété	La propriété est trop longue pour le message {position}. Il contient {number} octets, sur 4096 au maximum.	Se produit lorsqu’un champ de propriété utilisateur dépasse la longueur maximale autorisée de 4 096 caractères.
Erreur inconnue	Erreur inconnue du fichier CSV : {underlying-error-message}.	Si une erreur inconnue se produit, réessayez le téléchargement.

Sommaire de la page

Utilisation des formats appropriés
Le format Expéditeur/À/CC
Le format d’horodatage
Résolution des problèmes

Cette page vous a-t-elle été utile ?

PrécédentPréparation des données en vue du téléchargement du fichier .CSV

SuivantCréation d'un ensemble de données

Utilisation des formats appropriés​

Le format Expéditeur/À/CC​

Le format d’horodatage​

Résolution des problèmes​

Cette page vous a-t-elle été utile ?

Utilisation des formats appropriés

Le format Expéditeur/À/CC

Le format d’horodatage

Résolution des problèmes