ixp
latest
false
- Introduction
- Configuration de votre compte
- Équilibre
- Clusters
- Dérive de concept
- Couverture
- Jeux de données
- Champs généraux
- Libellés (prédictions, niveaux de confiance, hiérarchie des libellés et sentiment des libellés)
- Modèles
- Flux
- Évaluation du modèle
- Projets
- Précision
- Rappel
- Messages annotés et non annotés
- Extraction des champs
- Sources
- Taxonomies
- Apprentissage
- Prédictions positives et négatives vraies et fausses
- Validation
- Messages
- Contrôle et administration de l'accès
- Gérer les sources et les jeux de données
- Comprendre la structure des données et les autorisations
- Créer ou supprimer une source de données dans l'interface graphique
- Téléchargement d’un fichier CSV dans une source
- Préparation des données en vue du téléchargement du fichier .CSV
- Création d'un ensemble de données
- Sources et jeux de données multilingues
- Activation des sentiments sur un ensemble de données
- Modification des paramètres du jeu de données
- Supprimer un message
- Supprimer un jeu de données
- Exporter un ensemble de données
- Utilisation d'intégrations Exchange
- Entraînement et maintenance du modèle
- Comprendre les libellés, les champs généraux et les métadonnées
- Hiérarchie de libellés et meilleures pratiques
- Meilleures pratiques de conception de taxonomie
- Définition des objectifs de taxonomie
- Création de la structure de taxonomie
- Importer la taxonomie
- Comparer les cas d’utilisation des analyses et des automatisations
- Transformer vos objectifs en libellés
- Présentation du processus d'entraînement du modèle
- Annotation générative
- Statut du jeu de données
- Entraînement des modèles et annotation des meilleures pratiques
- Entraînement avec l'analyse des sentiments des libellés activée
- Entraînement des données de chat et d'appels
- Comprendre les exigences de données
- Entraîner
- Vue d'ensemble (Overview)
- Examen des prédictions de libellé
- Entraînement à l'aide de la classification par glisser-déposer
- Entraînement à l'aide de l'option Enseigner le libellé (Explore)
- Entraînement à l'aide d'une confiance faible
- Entraînement à l'aide de la recherche (Explorer)
- Affiner et réorganiser votre taxonomie
- Introduction à affiner
- Précision et rappel expliqués
- Précision et rappel
- Comment fonctionne la validation
- Comprendre et améliorer les performances du modèle
- Raisons de la faible précision moyenne des libellés
- Entraînement à l'aide du libellé Vérifier (Check label) et du libellé Manqué (Missed Label)
- Entraînement à l'aide du libellé En savoir plus (Affiner)
- Entraînement à l'aide de la recherche (affiner)
- Comprendre et augmenter la couverture
- Amélioration de l'équilibre et utilisation du rééquilibrage
- Quand arrêter l'entraînement de votre modèle
- Utilisation de champs généraux
- Extraction générative
- Vue d'ensemble (Overview)
- Configurer des champs
- Filtrage par type de champ d’extraction
- Génération de vos extractions
- Validation et annotation des extractions générées
- Meilleures pratiques et considérations
- Comprendre la validation des extractions et des performances d'extraction
- Questions fréquemment posées (FAQ)
- Utilisation des analyses et de la surveillance
- Automations et Communications Mining™
- Développeur
- Charger des données
- Téléchargement de données
- Intégration avec l'utilisateur du service Azure
- Intégration avec l'authentification d'application Azure
- Intégration d’Exchange avec l’authentification et le graphique d’application Azure
- Récupérer des données pour Tableau avec Python
- Intégration d'Elasticsearch
- Extraction de champ général
- Intégration avec Exchange auto-hébergée
- Infrastructure d’automatisation UiPath®
- Activités officielles UiPath®
- Comment les machines apprennent à comprendre les mots : guide d'intégration dans NLP
- Apprentissage basé sur des invites avec des Transformers
- Efficient Transformers II : Dilarisation des connaissances et affinement
- Transformateurs efficaces I : mécanismes d'attention
- Modélisation de l'intention hiérarchique profonde non supervisée : obtenir de la valeur sans données d'entraînement
- Correction des biais d’annotation avec Communications Mining™
- Apprentissage actif : de meilleurs modèles d'ML en moins de temps
- Tout est dans les chiffres : évaluer les performances du modèle avec des métriques
- Pourquoi la validation du modèle est importante
- Comparaison de Communications Mining™ et de Google AutoML pour l’information sur des données conversationnelles
- Licences
- FAQ et plus encore

Guide de l’utilisateur de Communications Mining
Dernière mise à jour 7 oct. 2025
Éléments de taxonomie clés
-
Nombre de libellés : les ensembles de données typiques ont 50-100 libellés, mais ce nombre peut varier en fonction des objectifs d'un ensemble de données. Un cas d'utilisation efficace peut avoir beaucoup moins de 50 libellés. Le système impose une limite de 200 libellés pour un ensemble de données car au-delà de ce point, la taxonomie devient très difficile à gérer et à entraîner, et cela entraîne une réduction des performances.
- Noms de libellés : les noms de libellés doivent être concis et descriptifs, car la fonctionnalité d' annotation générative les utilise comme entrée d'entraînement pour accélérer et améliorer le processus d'entraînement. Vous pouvez toujours les modifier, mais pour vous assurer qu'ils s'affichent efficacement dans l'interface utilisateur de la plate-forme, une limite de caractères de 64 caractères est définie pour tout libellé donné, y compris ses niveaux de hiérarchie.
- Descriptions des libellés : ajoutez des descriptions en langage naturel à vos libellés car elles sont utilisées comme entrée d'entraînement par la fonctionnalité d' annotation générative pour l'entraînement automatique. Les descriptions permettent également de garantir la cohérence de l'annotation entre les outils d'entraînement des modèles et de fournir un contexte utile aux autres qui consultent l'ensemble de données à des fins d'analyse.
Structurer votre taxonomie
Nous vous recommandons de suivre ces meilleures pratiques pour structurer correctement votre taxonomie et garantir les performances élevées du modèle :
- Aligner avec les objectifs : assurez-vous que chaque libellé sert un objectif commercial spécifique et qu'il est aligné par rapport à vos objectifs définis. Si votre ensemble de données est destiné à l'automatisation, de nombreux libellés doivent correspondre aux requêtes spécifiques nécessaires au traitement en aval. Si votre ensemble de données est destiné à l'analyse (ou les deux), incluez des libellés supplémentaires qui couvrent des concepts tels que les types de problèmes, les causes profondes et les problèmes de qualité de service tels que les messages de cours, les escalades et les litiges.
- être distinct : chaque libellé doit être spécifique et ne pas se chevaucher avec d'autres libellés.
- Soyez spécifique : évitez les concepts généraux, approximatives ou confus, car ils sont plus susceptibles de fonctionner mal et de fournir moins de valeur métier. Fractionnez les libellés étendus en plusieurs libellés distincts si possible. Commencez par des libellés spécifiques, tels que plus de niveaux de hiérarchie, et fusionnez-les ultérieurement si nécessaire, plutôt que de décomposer manuellement les vastes libellés.
- être identifiable : veillez à ce que chaque libellé soit clairement identifiable en fonction du texte des messages auxquels il est appliqué.
- Utiliser des libellés parent : si vous prévoyez d'avoir de nombreux concepts similaires liés à un sujet plus large, utilisez un libellé parent.
- Utiliser des libellés enfants :assurez-vous que chaque libellé imbriqué sous un autre libellé est un sous-ensemble de ce libellé.
- Limiter les niveaux de hiérarchie : essayez de ne pas ajouter plus de quatre niveaux de hiérarchie, car le modèle devient de plus en plus complexe à entraîner.
- Inclure les labellisations non informatives : créez des libellés non ajoutant une valeur, tels que des e-mails de remerciement, afin que vous puissiez indiquer à la plate-forme ce qui est ou n'est pas important d'analyser.