- Démarrage
- Équilibre
- Clusters
- Dérive de concept
- Couverture
- Jeux de données
- Champs généraux (anciennement entités)
- Libellés (prédictions, niveaux de confiance, hiérarchie, etc.)
- Modèles
- Flux
- Évaluation du modèle
- Projets
- Précision
- Rappel
- Messages examinés et non examinés
- Sources
- Taxonomies
- Apprentissage
- Prédictions positives et négatives vraies et fausses
- Validation
- Messages
- Administration
- Gérer les sources et les jeux de données
- Comprendre la structure des données et les autorisations
- Créer une source de données dans l'interface graphique
- Téléchargement d’un fichier CSV dans une source
- Créer un nouveau jeu de données
- Sources et jeux de données multilingues
- Activation des sentiments sur un ensemble de données
- Modifier les paramètres d’un jeu de données
- Supprimer des messages via l'interface utilisateur
- Supprimer un jeu de données
- Supprimer une source
- Exporter un jeu de données
- Utilisation des intégrations Exchange
- Préparation des données en vue du téléchargement du fichier .CSV
- Entraînement et maintenance du modèle
- Comprendre les libellés, les champs généraux et les métadonnées
- Hiérarchie des libellés et bonnes pratiques
- Définition de vos objectifs de taxonomie
- Cas d'utilisation d'analyse vs d'automatisation
- Transformer vos objectifs en libellés
- Construire votre structure de taxonomie
- Meilleures pratiques de conception de taxonomie
- Importation de votre taxonomie
- Présentation du processus d'entraînement du modèle
- Annotation générative (New)
- Comprendre le statut de votre jeu de données
- Entraînement des modèles et annotation des meilleures pratiques
- Entraînement avec l'analyse des sentiments des libellés activée
- Entraîner
- Vue d'ensemble (Overview)
- Entraînement à l'aide de clusters
- Entraînement à l'aide de la recherche (Discover)
- Vue d'ensemble (Overview)
- Examen des prédictions de libellé
- Entraînement à l'aide de la classification par glisser-déposer
- Entraînement à l'aide de l'option Enseigner le libellé (Explore)
- Entraînement à l'aide d'une confiance faible
- Entraînement à l'aide de la recherche (Explorer)
- Réduction et réorganisation de votre taxonomie
- Introduction à affiner
- Précision et rappel expliqués
- Précision et rappel
- Comment fonctionne la validation ?
- Comprendre et améliorer les performances du modèle
- Pourquoi un libellé peut-il avoir une précision moyenne faible ?
- Entraînement à l'aide du libellé Vérifier (Check label) et du libellé Manqué (Missed Label)
- Entraînement à l'aide du libellé En savoir plus (Affiner)
- Entraînement à l'aide de la recherche (affiner)
- Comprendre et augmenter la couverture
- Amélioration de l'équilibre et utilisation du rééquilibrage
- Quand arrêter l'entraînement de votre modèle
- Utilisation de champs généraux
- Extraction générative
- Utilisation des analyses et de la surveillance
- Automatisations et Communications Mining
- Informations de licence
- FAQ et plus encore
Entraînement à l'aide de clusters
Autorisations utilisateur requises : « Afficher les sources » ET « Réviser et annoter ».
Une fois vos données dans la plate-forme, la plate-forme regroupera et affichera 30 clusters de communications (messages) qui, selon elle, partagent des concepts ou des intentions similaires. Le but de cette partie du processus d'entraînement est de parcourir chacun de ces clusters et d'annoter les données qui y sont présentées.
Ce processus rend l'entraînement du modèle plus facile et rapide au départ, car vous pouvez ajouter des libellés à plusieurs messages similaires à la fois, ainsi qu'ajouter/supprimer des libellés à des messages individuels selon les besoins.
Conseils utiles pour l'annotation des clusters :
- Ne perdez pas trop de temps à penser au nom de l'étiquette. Vous pouvez renommer un libellé à tout moment pendant le processus d'apprentissage.
- Soyez aussi spécifique que possible lorsque vous nommez un libellé et gardez la taxonomie aussi plate que possible au départ (n'ajoutez pas trop de libellés enfants). Il est préférable d'être aussi spécifique que possible avec le nom de votre libellé au début, car vous pouvez toujours modifier et restructurer la hiérarchie ultérieurement. À ce stade, vous devez ajouter autant de libellés que possible à un message, car vous pouvez toujours revenir en arrière et les supprimer ultérieurement, ce qui est plus rapide et plus facile que de développer un libellé existant.
- N'oubliez pas qu'il est souvent plus facile de créer une taxonomie plus spécifique et plus affinée dans la première instance. Si c'est trop détaillé, il sera facile de modifier et de « réduire » votre taxonomie plus tard. Cela signifie qu'il faut ajouter plus de libellés et de sous-libellés plutôt que moins
- Il est bon de commencer par des libellés dans une hiérarchie plate (sans ajouter trop de sous-libellés) – vous pourrez toujours restructurer la taxonomie vers une structure plus hiérarchique plus tard
- Chaque message peut avoir plusieurs libellés attribués - assurez-vous d'appliquer tous les libellés pertinents, sinon vous apprenez au modèle à ne pas l'associer au libellé que vous avez omis
- Il est préférable de prendre le temps d'annoter avec soin maintenant, afin que la machine puisse prédire rapidement et précisément les libellés à l'avenir
- Tous les clusters n'auront visiblement pas les mêmes intentions, et il est normal de passer à autre chose s'ils sont tous différents.
Lorsque vous créez pour la première fois un nouvel ensemble de données, vous pouvez constater que Découvrir est vide, comme indiqué ci-dessous. Ne vous inquiétez pas, c'est simplement parce que les algorithmes de la plate-forme sont occupés à travailler en arrière-plan pour regrouper vos messages en clusters. Selon le nombre de messages dans la source de données, cela peut prendre quelques heures à traiter.
La disposition de Découvrir et un exemple de cluster sont affichés ci-dessous. Dans cet exemple, la plateforme a détecté que ces messages partagent le thème commun du confort des tables d'hôtes :
Mise en page expliquée :
A
- Bouton bascule pour basculer entre les modes « Cluster » et « Recherche ».B
- Menu déroulant qui vous permet de basculer entre différents clustersC
- Bouton permettant d'appliquer un libellé à tous les messages affichés sur la pageD
: l'un des six messages affichés à partir du cluster #7 (chaque cluster contient 12 messages)E
- Bouton pour appliquer un libellé à un message individuelF
- Menu déroulant pour ajuster le nombre de messages affichés sur la page (entre 6 et 12)G
- Boutons pour ajuster et inverser la sélection des messages sur la pageH
- Bouton pour désélectionner un message pour l'exclure des libellés ajoutés en bloc
Comme mis en évidence dans l'image ci-dessous, la fonction Découvrir (Discover) met en surbrillance les parties d'un message qui contribuent le plus à ce que ce message soit inclus dans le cluster, en vous aidant à identifier plus rapidement les thèmes communs :
Découvrez les thèmes communs mis en évidence
- Les lignes plus foncées indiquent des parties plus importantesde l'étendue (cela s'explique lorsque vous pointez dessus)
- Les lignes plus claires indiquent une contribution moyenne et légèrement plus faible au cluster
1. Examiner chaque message dans le cluster
2. Si vous pensez qu'il existe un libellé qui s'applique à tous les messages de la page, sélectionnez « Ajouter un libellé » (Add label).
3.Saisissez le nom du libellé et appuyez sur Entrée ou cliquez sur le bouton représentant une épingle qui apparaît (vous pouvez ajouter plusieurs libellés à la fois de cette façon, saisissez simplement un autre libellé et cliquez à nouveau sur le bouton représentant une épingle).
4. Cliquez sur le boutonAppliquer les libellés (Apply labels) pour attribuer le ou les libellés aux messages. Les libellés attribués apparaîtront désormais sous chaque message de la page.
Vous pouvez également ajouter un libellé aux messages individuels en cliquant sur le bouton ' Ajouter un libellé +' surligné en dessous.
Si vous souhaitez ajouter un libellé à un groupe de messages sur la page, mais que vous souhaitez exclure un ou plusieurs messages, vous pouvez les désélectionner à l'aide du bouton bascule mis en évidence (A). Vous pouvez alors inverser la sélection ou désélectionner/réélectionnertout à l'aide des boutons mis en surbrillance en haut (B).
Vous pouvez afficher différentes pages du même cluster (A) et ajuster le nombre de messages par page (B) à l'aide des boutons mis en évidence. Une fois le cluster annoté, vous pouvez passer à un nouveau cluster à l'aide de la liste déroulante ci-dessous (C).
Le modèle vous présentera 30 clusters et il est important de les parcourir afin de créer une base solide pour la phase d'exploration. Si un cluster n'est pas pertinent pour vous, ignorez-le.
Découvrir commence à réentraîner une fois qu'une quantité importante d'entraînement est terminée. Une fois que 180 messages ont été annotés (la moitié des clusters), Découvrir réentraînera et mettra à jour les clusters. Ne vous inquiétez pas, continuez à les parcourir jusqu'à ce que vous en ayez au moinsexaminé 30.