communications-mining

latest

false

Important :

Ce contenu a été traduit à l'aide d'une traduction automatique. La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Guide de l'utilisateur de Communications Mining

Dernière mise à jour 10 févr. 2025

Entraînement à l'aide de la classification par glisser-déposer

Autorisation utilisateur requise : « Afficher les sources » ET « Révision et libellé ».

« Masquer » est la première étape d' Exploration et son objectif est de fournir aux utilisateurs une sélection aléatoire de messages à examiner. En mode aléatoire, la plate-forme vous affichera des messages contenant des prédictions couvrant tous les libellés (et là où il n'y en a pas), de sorte que l'étape Mélanger (Should) diffère des autres dans Explorer (Explore) car elle ne se concentre pas sur un libellé spécifique à entraîner, mais les couvre tous .

Pourquoi l'entraînement en mode « Masquage » est-il si important ?

Il est très important d'utiliser le mode Mélange pour vous assurer que vous fournissez à votre modèle suffisamment d'exemples d'entraînement représentatifs de l'ensemble de données dans son ensemble, et non biaisés en vous concentrant uniquement sur des zones très spécifiques des données.

Globalement, au moins 10 % de l'entraînement que vous effectuez dans votre ensemble de données doit être en mode aléatoire.

L'annotation en mode Mélange permet essentiellement de s'assurer que votre taxonomie couvre bien les données de votre ensemble de données et vous empêche de créer un modèle capable de faire des prédictions avec une grande précision uniquement sur une petite fraction des données de l'ensemble de données.

Regarder à travers les messages en mode Mélange est donc un moyen simple d’avoir une idée de la façon dont se comporte le modèle global, et peut être consulté tout au long du processus d’entraînement. Dans une taxonomie bien entraînée, vous devriez être en mesure de parcourir tous les messages non examinés sur Mélanger (Then) et simplement accepter les prédictions pour entraîner davantage le modèle. Si vous trouvez que beaucoup de prédictions sont incorrectes, vous pouvez voir quels libellés nécessitent plus d'entraînement.

Parcourir plusieurs pages sur Mélanger (Short) plus tard dans le processus de formation est également un bon moyen de vérifier s'il existe des intentions ou des concepts qui n'ont pas été capturés par votre taxonomie et qui auraient dû l'être. Vous pouvez ensuite ajouter des libellés existants le cas échéant, ou en créer de nouveaux si nécessaire.

Étapes clés :

Sélectionnez « Mélanger » dans le menu déroulant pour présenter 20 messages aléatoires
Filtrer sur messages non vérifiés
Examiner chaque message et toutes les prédictions associées
- Si il y a des prédictions, vous devez les confirmer ou les rejeter. Confirmez en cliquant sur celles qui s'appliquent
- N'oubliez pas que vous devez également ajouter tous les autres libellés supplémentaires qui s'appliquent
- Si vous rejetez la ou les prédictions, vous devez appliquer tout le ou les bons libellés (ne laissez pas le message sans libellé appliqué)
Vous pouvez également appuyer sur le bouton Actualiser (Refresh) pour obtenir un nouvel ensemble de messages, ou cliquer sur la page suivante (en bas)

Nous recommandons d'annoter au moins 10 pages de messages dans Mélanger (Short). Dans les ensembles de données volumineux contenant de nombreux exemples d'entraînement, cela pourrait être beaucoup plus important.

Vous devez essayer d'effectuer environ 10 % ou plus de tous les entraînements en mode Mélange.

Sommaire de la page