Guide de l’utilisateur de Communications Mining

Dernière mise à jour 10 nov. 2025

Vue d'ensemble (Overview)

Étapes clés

La page Explorer (Explore) propose différents modes d'entraînement, et cette phase se concentre principalement sur trois d'entre eux :

Mélanger : affiche une sélection aléatoire de messages à annoter par les utilisateurs. Assurez-vous de terminer un bloc important d'entraînement dans Mélanger, afin de créer un ensemble d'entraînement d'exemples représentatif de l'ensemble de données plus étendu.
Apprendre : utilisé pour les messages non examinés. Dès que la plate-forme fait des prédictions raisonnables pour un libellé, vous pouvez améliorer la capacité de prédiction du libellé pour des exemples plus variés en examinant les messages en mode d'apprentissage par défaut, qui s'applique aux messages non examinés. Cela vous affichera les messages pour lesquels la plate-forme ne sait pas si le libellé sélectionné s'applique ou non.
Confiance faible : affiche les messages qui ne sont pas bien couverts par les prédictions de libellés informatives. Ces messages n'auront soit aucune prédiction, soit des prédictions très peu fiables pour les libellés que la plate-forme comprend être informatifs.

Cette section couvrira également l'entraînement à l'aide de la fonction Rechercher dans Explorer, similaire à l'entraînement à l'aide de la fonction Rechercher dans Découvrir.

Apprendre à, pour les messages examinés, est un autre mode d'entraînement dans Explore. Pour de plus amples informations, consultez Affiner les modèles et utiliser la validation.

Mise en page

La mise en page de l'image affichée précédemment est expliquée dans le tableau suivant :

1	Ajustez la plage de dates ou la période des messages affichés.
2	Ajoutez d'autres filtres en fonction des métadonnées des messages, par exemple score ou de l’expéditeur.
3	Ajoutez un filtre de champ général.
4	Basculez depuis tous les messages vers les messages examinés ou non examinés et ajustez également le nombre de libellés épinglés par rapport aux nombres de libellés prévus.
5	Ajoutez un filtre de libellé.
6	Recherchez des libellés spécifiques dans votre taxonomie.
7	Ajoutez des libellés supplémentaires.
8	Développez les métadonnées du message.
9	Actualisez la requête actuelle.
10	Basculez entre différents modes d'entraînement tels que récent, Mélanger, Apprendre et Niveau de confiance faible, puis sélectionnez un libellé à trier.
11	Recherchez dans l'ensemble de données des messages contenant des mots ou des phrases spécifiques.
12	Téléchargez tous les messages de cette page ou exportez l’ensemble de données avec les filtres appliqués sous forme de fichier CSV.

La quantité d'entraînement à effectuer pour chaque libellé

Le nombre d'exemples requis pour prédire avec précision chaque libellé peut varier beaucoup en fonction de l'étendue ou de la spécificité d'un concept de libellé.

Il est possible qu'un libellé soit généralement associé à des mots, des phrases ou des intentions très spécifiques et facilement identifiables, et que la plate-forme soit capable de le prédire de manière cohérente avec relativement peu d'exemples d'entraînement. Il est possible qu'une étiquette capture un sujet général avec de nombreuses variations de langue différentes qui lui seraient associées, auquel cas, cela pourrait nécessiter beaucoup plus d'exemples d'entraînement pour permettre à la plate-forme d'identifier systématiquement les instances auxquelles l'étiquette doit s'appliquer.

La plate-forme peut souvent commencer à faire des prédictions pour un libellé avec moins de cinq exemples, bien que afin d’estimer avec précision les performances d’un libellé, c’est-à-dire la capacité de la plate-forme à le prédire, chaque libellé nécessite au moins 25 exemples.

Lors de l'annotation dans Explorer, les petits disques rouges à côté de chaque libellé indiquent si d'autres exemples sont nécessaires afin d'estimer avec précision les performances du libellé. Le dialogue commence à disparaître au fur et à mesure que vous fournissez plus d'exemples de formation et disparaîtra complètement une fois que vous atteignez 25.

Cela ne signifie pas qu'à l'aide de 25 exemples, la plate-forme sera en mesure de prédire avec précision chaque libellé, mais qu'elle sera au moins en mesure de valider la façon dont elle peut prédire chaque libellé et vous avertir si une formation supplémentaire est requise.

Pendant la phase d'exploration, assurez-vous d'avoir fourni au moins 25 exemples pour tous les libellés qui vous intéressent, en utilisant une combinaison des étapes mentionnées précédemment, c'est-à-dire principalement Mélanger et Non révisé.

Pendant la phase d'affinage, il peut être évident qu'un entraînement supplémentaire est nécessaire pour certains libellés afin d'améliorer leurs performances. Pour de plus amples informations, consultez Affiner les modèles et utiliser la validation.

Avertissements relatifs aux performances des libellés

Dans Explorer, une fois que vous atteignez 25 exemples épinglés pour un libellé, vous remarquerez peut-être l'un des indicateurs de performance du libellé suivants à la place du dialogue d'entraînement :

Le gris est un indicateur que la plate-forme calcule les performances de ce libellé. Cela signifie qu'il sera mis à jour pour disparaître ou pour disparaître un cercle ou un cercle rouge une fois calculé.
Amber est un indicateur que le libellé a des performances légèrement inférieures à des performances suffisantes et qui pourrait être amélioré.
Rouge est un indicateur que le libellé fonctionne mal et qu’il nécessite un entraînement ou des mesures correctives supplémentaires pour l’améliorer.
S'il n'y a pas de cercle, le libellé fonctionne à un niveau satisfaisant, bien qu'il puisse encore nécessiter des améliorations en fonction du cas d'utilisation et des niveaux de précision souhaités.
Pour en savoir plus sur les performances des libellés et comment les améliorer, consultez Comprendre et améliorer les performances du modèle.

Nombre de libellés prévu vs nombre de libellés épinglés

Si vous sélectionnez l'icône d'action, comme illustré dans les images suivantes, en haut de la barre de filtre de libellé pour filtrer les messages examinés, vous verrez le nombre de messages examinés auxquels ce libellé est appliqué.

Si vous sélectionnez l'icône d'ordinateur pour filtrer les messages non examinés, le nombre total de prédictions pour ce libellé sera affiché, qui comprend également le nombre d'exemples examinés.

Dans Explorer ( Explore), lorsque ni Révisé (Reviewed) ni Non révisé (Unreviewed) n'est sélectionné, la plate-forme affiche le nombre total de messages épinglés pour un libellé par défaut. Dans Rapports(Reports), la valeur par défaut est d'afficher le total prédit.

Remarque : le nombre prévu est un agrégation de toutes les probabilités que la plate-forme calcule pour ce libellé. Par exemple, deux messages avec un niveau de confiance de 50 % seraient comptabilisés comme un libellé prévu.

Conseils pour utiliser l'exploration

Le modèle peut effectuer des prédictions avec seulement quelques messages annotés, mais pour qu'il puisse faire des prédictions fiables, vous devez annoter au moins 25 messages par libellé. Certains nécessiteront plus que cela, cela dépendra de la complexité des données, du libellé et de la cohérence avec laquelle les libellés ont été appliqués
Dans Explorer, vous devez également essayer et trouver des messages pour lesquels le modèle a prédit un libellé de manière incorrecte. Vous devez supprimer les libellés incorrects et appliquer les bons libellés. Ce processus permet d’éviter que le modèle ne fasse une prédiction incorrecte similaire à l’avenir

Important : pendant cette phase, vous appliquerez de nombreux libellés. Assurez-vous donc de respecter les meilleures pratiques d'annotation des clés en ajoutant tous les libellés qui s'appliquent. Vous pouvez procéder à cela en appliquant les libellés de manière cohérente et en annotant ce que vous pouvez afficher devant vous.

Sommaire de la page