- Démarrage
- Équilibre
- Clusters
- Dérive de concept
- Couverture
- Jeux de données
- Champs généraux (anciennement entités)
- Libellés (prédictions, niveaux de confiance, hiérarchie, etc.)
- Modèles
- Flux
- Évaluation du modèle
- Projets
- Précision
- Rappel
- Messages examinés et non examinés
- Sources
- Taxonomies
- Apprentissage
- Prédictions positives et négatives vraies et fausses
- Validation
- Messages
- Administration
- Gérer les sources et les jeux de données
- Comprendre la structure des données et les autorisations
- Create or delete a data source in the GUI
- Téléchargement d’un fichier CSV dans une source
- Préparation des données en vue du téléchargement du fichier .CSV
- Créer un nouveau jeu de données
- Sources et jeux de données multilingues
- Activation des sentiments sur un ensemble de données
- Modifier les paramètres d’un jeu de données
- Supprimer des messages via l'interface utilisateur
- Supprimer un jeu de données
- Exporter un jeu de données
- Utilisation des intégrations Exchange
- Entraînement et maintenance du modèle
- Comprendre les libellés, les champs généraux et les métadonnées
- Hiérarchie des libellés et bonnes pratiques
- Définition de vos objectifs de taxonomie
- Cas d'utilisation d'analyse vs d'automatisation
- Transformer vos objectifs en libellés
- Construire votre structure de taxonomie
- Meilleures pratiques de conception de taxonomie
- Importation de votre taxonomie
- Présentation du processus d'entraînement du modèle
- Annotation générative (New)
- Statut du jeu de données
- Entraînement des modèles et annotation des meilleures pratiques
- Entraînement avec l'analyse des sentiments des libellés activée
- Comprendre les exigences de données
- Entraîner
- Vue d'ensemble (Overview)
- Examen des prédictions de libellé
- Entraînement à l'aide de la classification par glisser-déposer
- Entraînement à l'aide de l'option Enseigner le libellé (Explore)
- Entraînement à l'aide d'une confiance faible
- Entraînement à l'aide de la recherche (Explorer)
- Réduction et réorganisation de votre taxonomie
- Introduction à affiner
- Précision et rappel expliqués
- Précision et rappel
- Comment fonctionne la validation ?
- Comprendre et améliorer les performances du modèle
- Pourquoi un libellé peut-il avoir une précision moyenne faible ?
- Entraînement à l'aide du libellé Vérifier (Check label) et du libellé Manqué (Missed Label)
- Entraînement à l'aide du libellé En savoir plus (Affiner)
- Entraînement à l'aide de la recherche (affiner)
- Comprendre et augmenter la couverture
- Amélioration de l'équilibre et utilisation du rééquilibrage
- Quand arrêter l'entraînement de votre modèle
- Utilisation de champs généraux
- Extraction générative
- Utilisation des analyses et de la surveillance
- Automatisations et Communications Mining
- Informations de licence
- FAQ et plus encore
Guide de l'utilisateur de Communications Mining
Téléchargement d’un fichier CSV dans une source
Autorisations utilisateur requises : « Administrateur de sources » ET « Modifier les messages ».
Pour charger des données d'un fichier CSV vers une source de données, accédez à la page Sources (via la console d'administration, accessible via la roue dentée en haut à droite de votre page) et localisez la source dans laquelle vous souhaitez charger des données.
Cliquez sur l'icône de téléchargement dans le coin supérieur droit de la carte de la source de données (comme indiqué ci-dessous).
Cliquez ensuite sur « Sélectionner un fichier » et choisissez le fichier CSV que vous souhaitez télécharger.
Le fichier sélectionné doit répondre aux critères suivants :
- Le fichier doit contenir des en-têtes sur la première ligne et être délimité par des virgules ou des tabulations
- Trois colonnes sont requises au minimum : le contenu du texte du message (le message), un horodatage et un ID unique identifiant le message
- Tous les champs de texte de votre fichier CSV doivent être mis entre guillemets doubles.
- Le fichier doit être encodé en UTF-8, UTF-16 ou UTF-32 (la plateforme détecte automatiquement le fichier)
- Le fichier CSV doit être de 64 Mo ou moins. Si vous avez un fichier plus volumineux, vous pouvez toujours le télécharger en le divisant en plusieurs fichiers, chacun contenant moins de 64 Mo
Si votre fichier répond aux critères ci-dessus, vous pouvez alors configurer et télécharger les messages à l'étape suivante :
Sélectionnez les colonnes requises dans chacune des listes déroulantes contenant les en-têtes de colonnes détectés dans le fichier CSV :
- Colonne ID :
- Il doit s'agir d'une colonne contenant un ID unique qui peut identifier le message
- Les ID de message ne peuvent contenir que des caractères alphanumériques ASCII (AZ az 0-9) et des ponctuations (sauf /)
-
Remarque : S'il existe des messages dans la source avec le même ID, ils seront mis à jour de sorte à correspondre au contenu du nouveau fichier
- Colonne de message :
- Il s'agit simplement de la colonne qui contient le texte du message que vous souhaitez analyser dans la plate-forme
- Colonne d'horodatage :
- Il s'agit d'une colonne contenant la date et l'heure auxquelles le message a été enregistré
- Le format d'horodatage est flexible et sera déduit automatiquement par la plateforme
Si vous avez des données contenant des objets, des fils de discussion ou des participants (généralement visibles dans les incidents ou les files d'e-mail), vous pouvez également charger ces colonnes supplémentaires dans votre fichier CSV :
- Colonne Objet
- Choisissez la colonne qui contient le message Objet
- Colonne Expéditeur
- Choisissez la colonne qui contient l'expéditeur
- Colonne À
- Choisissez la colonne qui contient le(s) Destinataire(s). Plusieurs destinataires doivent être séparés par des points-virgules.
- Colonne Cc
- Choisissez la colonne qui contient le(s) destinataire(s) en Cc. Plusieurs destinataires doivent être séparés par des points-virgules.
- Colonne ID de fil de discussion
- Choisissez la colonne qui contient le message ID de fil de discussion (Filter ID)
- Un ID de fil de discussion est ce qui relie différents messages au même fil de discussion
Format Expéditeur/À/Cc :
- Les conditions suivantes dans les champs expéditeur/à/cc génèreront des erreurs :
- Dépasse le nombre maximum de destinataires (2 048 destinations max. par thread)
- L’expéditeur ou le destinataire dépasse la limite maximale de caractères (512 caractères maximum par destinataire)
- Deux ou plusieurs points-virgules se trouvent dans une ligne (p. ex. - celui-ci est incorrectement formaté : john@email.com ; beth@email.com)
- Bien que la plate-forme supprime tout espace blanc avant ou après un destinataire, elle n'effectuera aucun nettoyage supplémentaire des données.
- Exemples de formats dans lesquels vous voulez vos données (liste non exhaustive) :
- Exemple 1 : processus de Robert Robot <robot.bog@gmail.com> ; John Smith <john.smith@gmail.com>
- Exemple 2 : rob.bog@gmail.com ;john.smith@gmail.com
- Exemple 3 : rob.bog@gmail.com ; john.smith@gmail.com
- Exemples de formats dans lesquels vous voulez vos données (liste non exhaustive) :
- La plateforme délimitera les différents destinataires par le point-virgule (;)
- Avant de télécharger vos données, veuillez vous assurer que les e-mails sont formatés dans un format approprié
- Veuillez noter que dans un cas d'utilisation standard file d'attente (par exemple : e-mails), il ne doit y avoir qu'un seul expéditeur dans chaque cellule « expéditeur »
Format d'horodatage :
- Si le format d'horodatage que vous avez choisi est ambigu pour l'ordre des jours/mois/années (par ex. 01/02/03 10:10), vous pouvez suggérer la bonne interprétation :
- 2 janvier 2003 - Aucun
- 1 er février 2003 - Premier jour
- 3 février 2001 - Première année
- 2 mars 2001 - Jour en premier + Année en premier
- Pour éviter toute ambiguïté, il est recommandé de fournir des horodatages au format RFC 3339 si possible (par ex. 2020-01-31T12:34:56Z pour UTC ou avec un fuseau horaire : 2020-08-031T11:20:60-08:00)
Sélectionnez ensuite les propriétés utilisateur supplémentaires que vous souhaitez télécharger avec les messages. Les propriétés utilisateur sont des métadonnées contextuelles associées à chaque message pouvant être filtré dans la plate-forme. Ceux-ci sont également potentiellement utilisés par les modèles d'apprentissage automatique de la plate-forme. Il existe deux types, chaîne ou nombre :
- Les propriétés utilisateur des chaînes sont des métadonnées catégorielles (les exemples typiques incluent les ID, les pays, les homologues, etc.)
- Les propriétés utilisateur des nombres sont des métadonnées numériques (les exemples typiques incluent NPS, statistiques des e-mails, montants, etc.)
Une fois que vous avez sélectionné toutes les propriétés utilisateur, cliquez sur «Télécharger ».
Vous serez ensuite invité à inspecter les messages téléchargés dans un ensemble de données qui contient la source dans laquelle vous avez téléchargé des données. Si la source n'est associée à aucun ensemble de données pour le moment, vous pouvez en créer un nouveau pour vérifier que le téléchargement se déroule comme prévu.
Nous espérons que votre téléchargement se déroulera correctement, mais il est possible que vous rencontriez un problème pendant le processus de téléchargement et que vous voyiez un message d’erreur. Nous avons décrit certaines d’entre elles ci-dessous et la raison de leur apparition afin de vous aider à les résoudre ou à les éviter.
Dans les messages d'erreur ci-dessous, {something} est mappé aux informations contextuelles indiquant où l'erreur s'est produite. De plus, la manière dont nous faisons référence à une position dans le fichier est normalisée comme suit :
Chaîne de caractères (string) | Développe jusqu'à : |
---|---|
{position} | enregistrement {row-number} sur la ligne {line-number} colonne {column-number} (octet {byte-number}) |
Voici quelques messages d’erreur que les utilisateurs peuvent rencontrer lors du téléchargement de fichiers CSV :
Type d’erreur | Message d'erreur | Description |
---|---|---|
Colonnes insuffisantes | Le fichier CSV ne contient que {number-columns} colonne(s), mais au moins 3 sont nécessaires (texte, horodatage et id) | Le fichier CSV téléchargé ne contient pas au moins 3 colonnes, ou la plate-forme a mal détecté l’encodage du fichier. |
Encodage non valide | Le fichier contient des caractères non valides (encodage détecté comme {detected-encoding}) | Le fichier n'est pas correctement encodé en UTF-8 /UTF-16 /UTF-32 (la plateforme détecte automatiquement le format du fichier) |
En-tête non valide | string:ti:er' does not match'(^delimiter|id|message|timestamp |timestamp_default_utc_offset |timestamp_day_first|timestamp_year_first\\Z)|(^(?P<property_type>number|string):(?P<name>\\w(?:[\\w]{0,30}\\w)?)\\Z)' | Si un en-tête de colonne est un nom non valide pour une propriété utilisateur, la plateforme renvoie le message par défaut lorsque le schéma d'une requête n'est pas valide. Vérifiez que le format de chaque en-tête de colonne est valide. La longueur maximale d'un en-tête de colonne est de 32 caractères alphanumériques |
Longueurs de ligne inégales | Le fichier CSV contient des longueurs de ligne inégales. Le message {position} contient {number} champs, mais lʹenregistrement précédent contient {number} champs. | Le fichier CSV contient des lignes contenant des nombres de cellules différents ou qui sont incohérents avec le nombre d'en-têtes. |
Format d'ID | ID de message non valide pour {record}. Les ID ne peuvent être composés que de caractères alphanumériques et de ponctuation ASCII (sauf '/'). Valeur de la cellule : {cell-value} | Cette erreur se produit lorsqu'un champ ID est composé de caractères non valides, comme décrit dans le message d'erreur. |
Longueur de l’ID | L'ID est trop long pour le message {record}. Il contient {number} octets, au maximum 1024 | Cette erreur se produit lorsqu’un champ d’identification est plus long que la longueur maximale autorisée (1 024 caractères) |
Format d'horodatage | Horodatage incorrectement formaté dans le message {position} : {timestamp-error-message}. Valeur de la cellule : {cell-value} | Cette erreur se produit lorsqu'un champ d'horodatage n'a pas pu être analysé. |
Longueur du message | Le message est trop long pour le message {position}. Il contient {number} octets, avec une valeur maximale de 65 536 | Cette erreur se produit lorsqu’un champ de message dépasse la longueur maximale autorisée (65 536 caractères). |
Format de propriété des nombres | Nombre incorrectement formaté dans le message {position} : {number-error-message}. Valeur de la cellule : {cell-value} | Cette erreur se produit lorsqu’un champ de propriété utilisateur numérique n’a pas pu être analysé. La plate-forme doit autoriser tout format pouvant raisonnablement être décodé sous forme de nombre. |
Longueur de propriété | La propriété est trop longue pour le message {position}. Il contient {number} octets, avec une valeur maximale de 4096 | Cette erreur se produit lorsqu’un champ de propriété utilisateur est plus long que la longueur maximale autorisée (4 096 caractères). |
Erreur inconnue | Erreur CSV inconnue : {underlying-error-message} | La liste ci-dessus n'est pas complètement exhaustive. Si une erreur inconnue se produit, relancez le téléchargement. |