- Introduction
- Configuration de votre compte
- Équilibre
- Clusters
- Dérive de concept
- Couverture
- Jeux de données
- Champs généraux
- Libellés (prédictions, niveaux de confiance, hiérarchie des libellés et sentiment des libellés)
- Modèles
- Flux
- Évaluation du modèle
- Projets
- Précision
- Rappel
- Messages annotés et non annotés
- Extraction des champs
- Sources
- Taxonomies
- Apprentissage
- Prédictions positives et négatives vraies et fausses
- Validation
- Messages
- Contrôle et administration de l'accès
- Gérer les sources et les jeux de données
- Comprendre la structure des données et les autorisations
- Créer ou supprimer une source de données dans l'interface graphique
- Téléchargement d’un fichier CSV dans une source
- Préparation des données en vue du téléchargement du fichier .CSV
- Création d'un ensemble de données
- Sources et jeux de données multilingues
- Activation des sentiments sur un ensemble de données
- Modification des paramètres du jeu de données
- Supprimer un message
- Supprimer un jeu de données
- Exporter un ensemble de données
- Utilisation d'intégrations Exchange
- Entraînement et maintenance du modèle
- Comprendre les libellés, les champs généraux et les métadonnées
- Hiérarchie de libellés et meilleures pratiques
- Comparer les cas d’utilisation des analyses et des automatisations
- Transformer vos objectifs en libellés
- Présentation du processus d'entraînement du modèle
- Annotation générative
- Statut du jeu de données
- Entraînement des modèles et annotation des meilleures pratiques
- Entraînement avec l'analyse des sentiments des libellés activée
- Entraînement des données de chat et d'appels
- Comprendre les exigences de données
- Entraîner
- Vue d'ensemble (Overview)
- Examen des prédictions de libellé
- Entraînement à l'aide de la classification par glisser-déposer
- Entraînement à l'aide de l'option Enseigner le libellé (Explore)
- Entraînement à l'aide d'une confiance faible
- Entraînement à l'aide de la recherche (Explorer)
- Affiner et réorganiser votre taxonomie
- Introduction à affiner
- Précision et rappel expliqués
- Précision et rappel
- Comment fonctionne la validation
- Comprendre et améliorer les performances du modèle
- Raisons de la faible précision moyenne des libellés
- Entraînement à l'aide du libellé Vérifier (Check label) et du libellé Manqué (Missed Label)
- Entraînement à l'aide du libellé En savoir plus (Affiner)
- Entraînement à l'aide de la recherche (affiner)
- Comprendre et augmenter la couverture
- Amélioration de l'équilibre et utilisation du rééquilibrage
- Quand arrêter l'entraînement de votre modèle
- Utilisation de champs généraux
- Extraction générative
- Vue d'ensemble (Overview)
- Configurer des champs
- Filtrage par type de champ d’extraction
- Génération de vos extractions
- Validation et annotation des extractions générées
- Meilleures pratiques et considérations
- Comprendre la validation des extractions et des performances d'extraction
- Questions fréquemment posées (FAQ)
- Utilisation des analyses et de la surveillance
- Automations et Communications Mining™
- Développeur
- Charger des données
- Téléchargement de données
- Intégration avec l'utilisateur du service Azure
- Intégration avec l'authentification d'application Azure
- Intégration d’Exchange avec l’authentification et le graphique d’application Azure
- Récupérer des données pour Tableau avec Python
- Intégration d'Elasticsearch
- Extraction de champ général
- Intégration avec Exchange auto-hébergée
- Infrastructure d’automatisation UiPath®
- Activités officielles UiPath®
- Comment les machines apprennent à comprendre les mots : guide d'intégration dans NLP
- Apprentissage basé sur des invites avec des Transformers
- Efficient Transformers II : Dilarisation des connaissances et affinement
- Transformateurs efficaces I : mécanismes d'attention
- Modélisation de l'intention hiérarchique profonde non supervisée : obtenir de la valeur sans données d'entraînement
- Correction des biais d’annotation avec Communications Mining™
- Apprentissage actif : de meilleurs modèles d'ML en moins de temps
- Tout est dans les chiffres : évaluer les performances du modèle avec des métriques
- Pourquoi la validation du modèle est importante
- Comparaison de Communications Mining™ et de Google AutoML pour l’information sur des données conversationnelles
- Licences
- FAQ et plus encore

Guide de l’utilisateur de Communications Mining
- You must have assigned the IXP Project Admin role as an Automation Cloud™ user, or the Sources admin and Edit messages permissions as a legacy user to upload CSV files into a source.
- Pour plus de détails sur le chargement des données à partir d’un fichier ainsi que les messages d'erreur courants, consultez Téléchargement d'un fichier CSV vers une source.
Avant de télécharger des données dans Communications Mining™, il y a quelques facteurs à prendre en compte lors de la préparation des données à ingérer par la plateforme.
Si vous avez ouvert le fichier .csv dans Excel et apporté des modifications, cela peut entraîner des problèmes de formatage qui peuvent affecter le processus de téléchargement. Pour éviter cela, effectuez les mises à jour directement dans le fichier .csv .msg.
Par ailleurs, vérifiez les éléments répertoriés dans le tableau suivant avant de télécharger votre fichier dans la plate-forme. Cela vous permet d’éviter toute erreur lors du chargement ou tout problème de qualité des données qui pourraient avoir un impact négatif sur la qualité des performances du modèle.
Elément | Description |
Dupliquer les lignes | Avoir les mêmes données répétées plusieurs fois dans l'extraction de données. |
En-têtes incompatibles | Avoir les mauvais en-têtes alignés sur les mauvais champs de données. |
Suspendre des lignes ou des colonnes | Ne pas avoir toutes les données contenues dans des lignes séquentielles. Par exemple, avoir tous les messages de la ligne 1 à 10 000, mais avoir une ligne avec une cellule contenant des données dans la ligne 19 999. |
Formatage de date incohérent | Différentes lignes avec des formats de date incohérents. Par exemple, avoir un certain nombre de messages au format de date américain et un certain nombre de messages au format de date dans l'UE, le tout dans le même ensemble de données, car cela rencontrera des problèmes de normalisation en aval. |
Phrases incohérentes | Il s'agit de phrases qui contiennent un assortiment de mots sans syntaxe ou structure sémantique claire.
Par exemple :
|
Espacement incohérent | Lorsqu'il y a un nombre inattendu d'espaces entre les mots.
Par exemple :
|
Interrompre les mots | Quand il y a des sauts au milieu d’un mot.
Par exemple :
|
Codage de caractères erroné | Lorsque les données texte ne sont pas correctement encodées, ce qui entraîne des caractères illisibles ou illisibles.
Par exemple :
|
Messages vides | Communications sans contenu inclus dans l’objet ou le corps. |
Messages contenant beaucoup de fautes de frappe | Données textuelles contenant de nombreuses erreurs d'orthographe. |
En-têtes/Pieds | Quand des en-têtes ou des pieds de page sont inclus. comme les avertissements de courrier indésirable, les avertissements de scanner de virus, etc. |
Métadonnées incluses dans l'objet/corps au lieu d'être une propriété de métadonnées | Lorsque les métadonnées sont incluses dans l'objet ou le corps. Par exemple :
|
Plusieurs messages combinés en un seul message | Lorsque plusieurs messages qui auraient dû être divisés en messages de fil de discussion distincts sont plutôt combinés en une seule communication. |