- Introduction
- Configuration de votre compte
- Équilibre
- Clusters
- Dérive de concept
- Couverture
- Jeux de données
- Champs généraux
- Libellés (prédictions, niveaux de confiance, hiérarchie des libellés et sentiment des libellés)
- Modèles
- Flux
- Évaluation du modèle
- Projets
- Précision
- Rappel
- Messages annotés et non annotés
- Extraction des champs
- Sources
- Taxonomies
- Apprentissage
- Prédictions positives et négatives vraies et fausses
- Validation
- Messages
- Contrôle et administration de l'accès
- Gérer les sources et les jeux de données
- Comprendre la structure des données et les autorisations
- Créer ou supprimer une source de données dans l'interface graphique
- Téléchargement d’un fichier CSV dans une source
- Préparation des données en vue du téléchargement du fichier .CSV
- Création d'un ensemble de données
- Sources et jeux de données multilingues
- Activation des sentiments sur un ensemble de données
- Modification des paramètres du jeu de données
- Supprimer un message
- Supprimer un jeu de données
- Exporter un ensemble de données
- Utilisation d'intégrations Exchange
- Entraînement et maintenance du modèle
- Comprendre les libellés, les champs généraux et les métadonnées
- Hiérarchie de libellés et meilleures pratiques
- Comparer les cas d’utilisation des analyses et des automatisations
- Transformer vos objectifs en libellés
- Présentation du processus d'entraînement du modèle
- Annotation générative
- Statut du jeu de données
- Entraînement des modèles et annotation des meilleures pratiques
- Entraînement avec l'analyse des sentiments des libellés activée
- Entraînement des données de chat et d'appels
- Comprendre les exigences de données
- Entraîner
- Vue d'ensemble (Overview)
- Examen des prédictions de libellé
- Entraînement à l'aide de la classification par glisser-déposer
- Entraînement à l'aide de l'option Enseigner le libellé (Explore)
- Entraînement à l'aide d'une confiance faible
- Entraînement à l'aide de la recherche (Explorer)
- Affiner et réorganiser votre taxonomie
- Introduction à affiner
- Précision et rappel expliqués
- Précision et rappel
- Comment fonctionne la validation
- Comprendre et améliorer les performances du modèle
- Raisons de la faible précision moyenne des libellés
- Entraînement à l'aide du libellé Vérifier (Check label) et du libellé Manqué (Missed Label)
- Entraînement à l'aide du libellé En savoir plus (Affiner)
- Entraînement à l'aide de la recherche (affiner)
- Comprendre et augmenter la couverture
- Amélioration de l'équilibre et utilisation du rééquilibrage
- Quand arrêter l'entraînement de votre modèle
- Utilisation de champs généraux
- Extraction générative
- Vue d'ensemble (Overview)
- Configurer des champs
- Filtrage par type de champ d’extraction
- Génération de vos extractions
- Validation et annotation des extractions générées
- Meilleures pratiques et considérations
- Comprendre la validation des extractions et des performances d'extraction
- Questions fréquemment posées (FAQ)
- Utilisation des analyses et de la surveillance
- Automations et Communications Mining™
- Développeur
- Charger des données
- Téléchargement de données
- Intégration avec l'utilisateur du service Azure
- Intégration avec l'authentification d'application Azure
- Intégration d’Exchange avec l’authentification et le graphique d’application Azure
- Récupérer des données pour Tableau avec Python
- Intégration d'Elasticsearch
- Extraction de champ général
- Intégration avec Exchange auto-hébergée
- Infrastructure d’automatisation UiPath®
- Activités officielles UiPath®
- Comment les machines apprennent à comprendre les mots : guide d'intégration dans NLP
- Apprentissage basé sur des invites avec des Transformers
- Efficient Transformers II : Dilarisation des connaissances et affinement
- Transformateurs efficaces I : mécanismes d'attention
- Modélisation de l'intention hiérarchique profonde non supervisée : obtenir de la valeur sans données d'entraînement
- Correction des biais d’annotation avec Communications Mining™
- Apprentissage actif : de meilleurs modèles d'ML en moins de temps
- Tout est dans les chiffres : évaluer les performances du modèle avec des métriques
- Pourquoi la validation du modèle est importante
- Comparaison de Communications Mining™ et de Google AutoML pour l’information sur des données conversationnelles
- Licences
- FAQ et plus encore

Guide de l’utilisateur de Communications Mining
-
Toute mise à jour d’autres éléments que les propriétés utilisateur entraînera la perte des annotations de champ général des ensembles de données associés. Par exemple, la mise à jour des messages existants dans une source, la modification des propriétés du message, telles que le texte du message, l'horodatage envoyé et vers ou depuis. Assurez-vous d’épingler la dernière version du modèle dans les ensembles de données associés avant de le faire.
-
Pour plus de détails sur la création d’une source de données, consultez Création ou suppression d’une source de données dans l’interface graphique.
- Accédez à la page Administrateur .
- Sélectionnez l'onglet Sources et localisez la source vers laquelle vous souhaitez télécharger des données.
- Sélectionnez l'icône de téléchargement sur la carte de la source de données.
- Utilisez Sélectionner le fichier pour choisir un fichier CSV sur votre ordinateur.
- Sélectionnez le fichier CSV que vous souhaitez télécharger. Assurez-vous que le fichier répond aux critères suivants :
- Le fichier doit inclure des en-têtes sur la première ligne et être délimité par des virgules ou des tabulations.
- Le fichier doit contenir au moins trois colonnes :
- Message : le texte du message.
- Horodatage : date de création du message.
- ID unique : un identifiant distinct pour chaque message.
- Tous les champs de texte doivent être placés entre guillemets doubles dans le fichier.
- Le fichier doit être encodé en UTF-8, UTF-16 ou UTF-32. La plate-forme détecte automatiquement l'encodage correct.
- La taille du fichier doit être inférieure à 128 Mo. Pour les fichiers plus volumineux, divisez-les en plusieurs fichiers d'une taille inférieure à 128 Mio.
- Sélectionnez les colonnes requises, où les menus déroulants contiennent les en-têtes de colonnes détectés dans le fichier CSV :
- Colonne ID du message : une colonne avec un ID unique qui peut identifier le message. Les ID de message ne peuvent contenir que des caractères alphanumériques ASCII (AZ, az, 0-9) et des caractères de ponctuations, à l’exception de la barre oblique
/
.Remarque : si des messages existent dans la source avec le même ID, ils seront mis à jour pour correspondre au contenu du nouveau fichier. - Colonne Message : la colonne qui contient le texte du message que vous souhaitez analyser sur la plate-forme.
- Colonne Horodatage : colonne qui contient la date et l'heure auxquelles le message a été enregistré. Le format d’horodatage est flexible et la plate-forme le déduit automatiquement. Pour plus de détails, consultez Utiliser les formats corrects.
- Colonne ID du message : une colonne avec un ID unique qui peut identifier le message. Les ID de message ne peuvent contenir que des caractères alphanumériques ASCII (AZ, az, 0-9) et des caractères de ponctuations, à l’exception de la barre oblique
- Vous pouvez sélectionner les colonnes supplémentaires suivantes si vous avez des données qui contiennent des lignes d'objet, des fils de discussion ou des participants, généralement rencontrés dans des incidents ou des fils de discussion des e-mails :
- Colonne Objet - Colonne qui contient l'objet du message.
- Colonne de l'expéditeur : la colonne qui contient l'expéditeur.
- À la colonne - Colonne qui contient un ou plusieurs destinataires. Assurez-vous que plusieurs destinataires sont séparés par un point-virgule
;
. - Colonne Cc - Colonne qui contient un ou plusieurs destinataires dans le champ Cc. Assurez-vous que plusieurs destinataires sont séparés par un point-virgule
;
.- Pour plus de détails sur l'utilisation des formats corrects dans les champs Expéditeur, À et Cc, consultez la section Utiliser les formats corrects.
- Colonne ID de fil de discussion : la colonne qui contient l'ID de fil de discussion du message. L'ID de fil de discussion associe différents messages au même fil de discussion.
- Vous pouvez sélectionner les propriétés utilisateur supplémentaires que vous souhaitez télécharger avec les messages. Les propriétés utilisateur sont des métadonnées contextuelles associées à chaque message que vous pouvez filtrer dans la plateforme. Les modèles d’apprentissage automatique de la plate-forme peuvent également exploiter ces propriétés utilisateur, qui sont des types suivants :
- Les propriétés utilisateur de chaîne sont des métadonnées catégorielles, par exemple, les identifiants, les pays, les contreparties, etc.
- Les propriétés utilisateur du nombre sont des métadonnées numériques, par exemple, le NPS, les statistiques des e-mails, les montants, etc.
Remarque : si votre fichier contient un score NPS en tant que propriété utilisateur, vous devez l’inclure en tant que propriété numérique et la nommer uniquementNPS
pour déclencher les graphiques NPS natifs à charger sur la plate-forme. - Une fois que vous avez sélectionné toutes les propriétés utilisateur, sélectionnez Télécharger.
Vous serez invité à inspecter les messages téléchargés dans un ensemble de données qui contient la source dans laquelle vous avez téléchargé les données. Si la source n'est associée à aucun ensemble de données, vous pouvez créer un nouvel ensemble de données pour vérifier que le téléchargement est comme prévu.
Remarque : si vous avez fait une erreur lors de la sélection des propriétés utilisateur, vous pouvez à nouveau télécharger le même fichier. La plate-forme utilisera l'ID de colonne comme identifiant pour écraser les messages et propriétés existants. Cela n'affectera pas les libellés appliqués aux messages existants.
Le format Expéditeur/À/CC
Assurez-vous que :
- Le nombre de destinataires ne dépasse pas le maximum de 2 048 par fil de discussion.
- L'expéditeur ou tout destinataire ne dépasse pas la limite de 512 caractères.
- Il n'y a qu'un seul point-virgule dans une ligne. Par exemple, le format suivant est incorrect : john@email.com ; beth@email.com.
- Exemple 1 : Tony Robot <robo.bog@gmail.com> ; John Smith <john.smith@gmail.com>
- Exemple 2 : robo.bog@gmail.com ;john.smith@gmail.com
- Exemple 3 : robo.bog@gmail.com ; john.smith@gmail.com
;
.
Avant de télécharger vos données, assurez-vous que les e-mails sont formatés correctement.
Le format d’horodatage
01/02/03 10:10
, vous pouvez proposer l'interprétation correcte :
- 2 janvier 2003 - Aucun
- 1 er février 2003 - Premier jour
- 3 février 2001 - Première année
- 2 mars 2001 - Jour en premier + Année en premier
RFC 3339
. Par exemple, 2020-01-31T12:34:56Z
pour UTC ou avec un fuseau horaire : 2020-08-031T11:20:60-08:00
.
Cette section contient les messages d’erreur éventuels qui peuvent survenir pendant le processus de chargement, ainsi que les solutions correspondantes.
Dans les messages d’erreur suivants, {something} correspond à des informations contextuelles sur lesquelles l’erreur s’est produite. De plus, la façon dont nous faisons référence à une position dans le fichier est normalisée comme suit :
Chaîne de caractères (string) | Développe jusqu'à : |
---|---|
{position} | enregistrement {row-number} sur la ligne {line-number} colonne {column-number} (octet {byte-number}) |
Le titre du message d’erreur s’affiche avec une description, comme illustré dans l’image suivante :
Type d’erreur | Message d'erreur | Description |
---|---|---|
Colonnes insuffisantes | Le fichier CSV ne contient que {number-columns} colonnes, mais au moins 3 sont nécessaires, à savoir, le texte, l'horodatage et l'id. | Le fichier CSV téléchargé ne contient pas au moins 3 colonnes, ou la plate-forme a détecté par erreur l'encodage du fichier. |
Encodage non valide | Le fichier contient des caractères non valides, où l’encodage est détecté comme étant {detected-encoding}. | Le fichier n’est pas correctement encodé en UTF-8, UTF-16 ou UTF-32. La plateforme détecte automatiquement le format du fichier. |
En-tête non valide | string:ti:er' ne correspond pas à '(^delimiter|id|message|timestamp |timestamp_default_utc_offset |timestamp_day_first|timestamp_year_first\\Z)|(^(?P<property_type>number|string):(?P<name>\\w(?:[\\w]{0,30}\\w)?)\\Z)' | Si un en-tête de colonne n'est pas un nom non valide pour une propriété utilisateur, la plate-forme renvoie le message par défaut lorsque le schéma d'une requête n'est pas valide. Vérifiez que le format de chaque en-tête de colonne est valide. La longueur maximale d'un en-tête de colonne est de 32 caractères alphanumériques. |
Longueurs de ligne inégales | Le fichier CSV contient des longueurs de ligne inégales. Le message {position} contient {number} champs, mais lʹenregistrement précédent contient {number} champs. | Le fichier CSV contient des lignes contenant des nombres de cellules différents ou qui sont incohérents avec le nombre d'en-têtes. |
Format d'ID | ID de message non valide pour {record}. Les ID ne peuvent être constitués que de caractères alphanumériques ASCII et de caractères de ponctuations, à l’exception de la barre oblique / . Valeur de la cellule : {cell-value}.
| Se produit lorsqu’un champ d’ID se compose de caractères non valides, comme décrit dans le message d’erreur. |
Longueur de l’ID | L'ID est trop long pour le message {record}. Il contient {number} octets, au maximum 1 024. | Se produit lorsqu'un champ d'ID dépasse la longueur maximale autorisée, c'est-à-dire 1 024 caractères. |
Format d'horodatage | Horodatage correctement formaté dans le message {position} : {timestamp-error-message}. Valeur de la cellule : {cell-value}. | Se produit lorsqu’un champ d’horodatage n’a pas pu être analysé. |
Longueur du message | Le message est trop long pour le message {position}. Il contient {number} octets, censés être au maximum 65 536. | Se produit lorsqu’un champ de message dépasse la longueur maximale autorisée, c’est-à-dire 65 536 caractères. |
Format de propriété des nombres | Nombre mal formaté dans le message {position} : {number-error-message}. Valeur de la cellule : {cell-value}. | Se produit lorsqu’un champ de propriété utilisateur de nombre n’a pas pu être analysé. La plate-forme doit autoriser tout format pouvant être raisonnablement décodé sous forme de nombre. |
Longueur de propriété | La propriété est trop longue pour le message {position}. Il contient {number} octets, sur 4096 au maximum. | Se produit lorsqu’un champ de propriété utilisateur dépasse la longueur maximale autorisée de 4 096 caractères. |
Erreur inconnue | Erreur inconnue du fichier CSV : {underlying-error-message}. | Si une erreur inconnue se produit, réessayez le téléchargement. |