- Démarrage
- Équilibre
- Clusters
- Dérive de concept
- Couverture
- Jeux de données
- Champs généraux (anciennement entités)
- Libellés (prédictions, niveaux de confiance, hiérarchie, etc.)
- Modèles
- Flux
- Évaluation du modèle
- Projets
- Précision
- Rappel
- Messages examinés et non examinés
- Sources
- Taxonomies
- Apprentissage
- Prédictions positives et négatives vraies et fausses
- Validation
- Messages
- Administration
- Gérer les sources et les jeux de données
- Comprendre la structure des données et les autorisations
- Créer une source de données dans l'interface graphique
- Téléchargement d’un fichier CSV dans une source
- Créer un nouveau jeu de données
- Sources et jeux de données multilingues
- Activation des sentiments sur un ensemble de données
- Modifier les paramètres d’un jeu de données
- Supprimer des messages via l'interface utilisateur
- Supprimer un jeu de données
- Supprimer une source
- Exporter un jeu de données
- Utilisation des intégrations Exchange
- Préparation des données en vue du téléchargement du fichier .CSV
- Entraînement et maintenance du modèle
- Comprendre les libellés, les champs généraux et les métadonnées
- Hiérarchie des libellés et bonnes pratiques
- Définition de vos objectifs de taxonomie
- Cas d'utilisation d'analyse vs d'automatisation
- Transformer vos objectifs en libellés
- Construire votre structure de taxonomie
- Meilleures pratiques de conception de taxonomie
- Importation de votre taxonomie
- Présentation du processus d'entraînement du modèle
- Annotation générative (New)
- Statut du jeu de données
- Entraînement des modèles et annotation des meilleures pratiques
- Entraînement avec l'analyse des sentiments des libellés activée
- Entraîner
- Vue d'ensemble (Overview)
- Examen des prédictions de libellé
- Entraînement à l'aide de la classification par glisser-déposer
- Entraînement à l'aide de l'option Enseigner le libellé (Explore)
- Entraînement à l'aide d'une confiance faible
- Entraînement à l'aide de la recherche (Explorer)
- Réduction et réorganisation de votre taxonomie
- Introduction à affiner
- Précision et rappel expliqués
- Précision et rappel
- Comment fonctionne la validation ?
- Comprendre et améliorer les performances du modèle
- Pourquoi un libellé peut-il avoir une précision moyenne faible ?
- Entraînement à l'aide du libellé Vérifier (Check label) et du libellé Manqué (Missed Label)
- Entraînement à l'aide du libellé En savoir plus (Affiner)
- Entraînement à l'aide de la recherche (affiner)
- Comprendre et augmenter la couverture
- Amélioration de l'équilibre et utilisation du rééquilibrage
- Quand arrêter l'entraînement de votre modèle
- Utilisation de champs généraux
- Extraction générative
- Utilisation des analyses et de la surveillance
- Automatisations et Communications Mining
- Informations de licence
- FAQ et plus encore
Préparation des données en vue du téléchargement du fichier .CSV
Autorisations utilisateur requises : « Administrateur de sources » ET « Modifier les messages ».
Vous pouvez trouver des instructions sur le téléchargement de données à partir d’un fichier .csv ici, ainsi que les messages d'erreur courants que vous pouvez rencontrer dans la plate-forme.
Avant de télécharger des données dans Communications Mining, il y a quelques facteurs à prendre en compte lors de la préparation des données à ingérer par la plate-forme.
Veuillez vous assurer de télécharger un fichier .csv et non un fichier Excel.
Si vous avez ouvert le fichier .csv dans Excel et que vous y avez apporté des modifications, cela peut entraîner des problèmes de formatage pouvant potentiellement provoquer des problèmes au point de téléchargement. Pour éviter cela, assurez-vous que toutes les mises à jour sont effectuées dans le fichier .csv directement.
En outre, veuillez vérifier les points suivants avant de télécharger votre fichier .csv dans la plate-forme pour éviter de rencontrer des erreurs lors du téléchargement, ou des problèmes de qualité de données qui auront un impact négatif sur la qualité des performances du modèle :
Elément | Description |
Dupliquer les lignes | Avoir les mêmes données répétées plusieurs fois dans l’extraction de données |
En-têtes incompatibles | Avoir les mauvais en-têtes alignés sur les mauvais champs de données |
Suspendre des lignes ou des colonnes | Ne pas disposer de toutes les données contenues dans les lignes séquentielles
Exemple : avoir tous les messages de la ligne 1 à 10 000, mais avoir une ligne avec une cellule contenant des données dans la ligne 19 999. |
Formatage de date incohérent | Lignes différentes avec des formats de date incohérents
Exemple : avoir un certain nombre de messages au format de date américain et un certain nombre de messages au format de date de l'UE, tous dans le même ensemble de données, car cela aura des problèmes de normalisation en aval. |
Phrases incohérentes | Ce sont des phrases qui contiennent un assortiment de mots sans structure syntaxique ou sémantique claire
Exemple : « L’utilisateur demande qu’un nouveau ticket portable 28442 298 soit créaportable » |
Espacement incohérent | Lorsqu'il y a un nombre inattendu d'espaces entre les mots.
Exemple : au lieu de « La politique est configurée pour se renouveler » |
Interrompre les mots | Quand il y a des sauts au milieu d'un mot, alors qu'il ne devrait pas y en avoir.
Exemple : « La politique est définie. à renouveler » au lieu de « La politique est configurée à renouveler » |
Codage de caractères erroné | Lorsque les données texte ne sont pas correctement encodées, ce qui entraîne des caractères illisibles ou illisibles.
Exemple : « ThC åapp is gré`t » au lieu de « L’application est parfaite ». |
Messages vides | Communications sans contenu inclus dans l'objet/corps |
Messages contenant beaucoup de fautes de frappe | Données textuelles contenant de nombreuses erreurs d'orthographe |
En-têtes/Pieds | Lorsque des en-têtes ou des pieds de page sont inclus
Exemple : avertissements de courrier indésirable, avertissements de antivirus, etc. |
Métadonnées incluses dans l'objet/corps au lieu d'être une propriété de métadonnées | Lorsque les métadonnées sont incluses dans l’objet ou le corps
Exemple : « [01/01/2023] Je souhaite renouveler ma politique » comme corps d'un message, au lieu de « Je souhaite renouveler ma politique » comme message avec le 01/01/2023 comme date incluse dans les métadonnées. |
Plusieurs messages combinés en un seul message | Lorsque plusieurs messages auraient dû être répartis en messages distincts dans un fil de discussion, combinés en une seule communication. |