Communications Mining
Plus récente (Latest)
False
Image de fond de la bannière
Guide de l'utilisateur de Communications Mining
Dernière mise à jour 18 avr. 2024

Entraînement à l'aide d'« Ensemble des libellés » (Explore)

Autorisations utilisateur requises : « Afficher les sources » ET « Révision et libellé ».

Remarque : « Teach Label » est un mode d'entraînement uniquement destiné à labelliser les messages non examinés. Le filtre Révisé est donc désactivé dans ce mode.

Introduction à l'utilisation de « Ensemble des libellés »

« Ensemble » est la deuxième étape de la phase d' exploration et son objectif est d'afficher des prédictions pour un libellé où le modèle est le plus confus, qu'il s'applique ou non. Comme les étapes précédentes, nous devons confirmer si la prédiction est correcte ou incorrecte, et ce faisant, fournissez au modèle des messages d'entraînement puissants. Il s'agit du mode d'entraînement spécifique au libellé le plus important.

Étapes clés



  1. Sélectionnez Apprenez-en davantage dans le menu déroulant en haut à gauche tel qu'indiqué.
  2. Sélectionnez le libellé que vous souhaitez entraîner - la sélection par défaut en mode Apprentissage permet d'afficher les messages non examinés
  3. Une sélection de messages s'affichera où le modèle est le plus confondant, que le libellé sélectionné soit appliqué ou non. Examinez les prédictions et appliquez le libellé si elles sont correctes, ou appliquez d'autres libellés si elles sont incorrectes
    • Les prévisions s'étendront entre environ 50 % pour les données sans sentiment et 66 % pour les données avec sentiment activé
    • N'oubliez pas d'appliquer tous les autres libellés qui s'appliquent ainsi que le libellé spécifique sur lequel vous vous concentrez

Vous devez utiliser ce mode d'entraînement le cas échéant pour augmenter le nombre d'exemples d'entraînement pour chaque libellé à plus de 25, afin que la plate-forme puisse ensuite estimer avec précision les performances du libellé.

Le nombre d'exemples nécessaires pour que chaque libellé fonctionne correctement dépendra d'un certain nombre de facteurs. Dans la phase « Affinage », nous couvrons comment comprendre et améliorer les performances de chaque libellé.

La plate-forme recommande régulièrement l'utilisation de « Teach Label » comme moyen d'améliorer les performances de libellés spécifiques en fournissant des exemples d'entraînement plus divers qu'il peut utiliser pour identifier d'autres instances de votre ensemble de données auxquelles le libellé doit s'appliquer.

Que faire lorsque le nombre d'exemples d'apprentissage (Teach) est insuffisant ?

Nous pouvons constater après Découvrir et Mélanger que certains libellés ont encore très peu d'exemples, et où le mode « Ensemble des libellés » ne présente pas d'exemples d'entraînement utiles. Dans ce cas, nous suggérons d'utiliser les modes d'entraînement suivants pour fournir à la plate-forme plus d'exemples à partir desquels apprendre :

« Teach » ne génère pas suffisamment d'exemples d'apprentissagedocs image

Option 1 : « Rechercher »

La recherche de termes ou de phrases dans Explorer fonctionne de la même manière que dans Découvrir. L’une des deux différences clés est que, dans Explorer, vous devez examiner et étiqueter les résultats de recherche individuellement, plutôt qu’en bloc. Vous pouvez effectuer une recherche dans Parcourir en tapant simplement vos termes de recherche dans le champ de recherche en haut à gauche de la page.

Accéder à « Rechercher » dans Explorer

Cependant, trop de Recherche peut fausser votre modèle, ce que nous voulons éviter. Ajoutez pas plus de 10 exemples par libellé dans ce mode d'entraînement pour éviter les biais de labellisation. Il est également important de laisser le temps à la plate-forme de se réentraîner avant de revenir au mode « Apprentissage ».

Pour plus d'informations sur l'utilisation de la fonction de recherche dans l'exploration, cliquez ici.

Option 2 : « Libellé »

Bien que l'entraînement à l'aide de « Label » ne soit pas l'une des étapes principales décrites dans la phase Explorer (Explore), il peut toujours être utile dans cette phase d'entraînement. En mode Libellé (Label), la plate-forme vous affiche des messages où ce libellé est prédit par ordre décroissant de confiance (c'est-à-dire avec les prédictions les plus fiables en premier et les moins fiables en bas).

Accéder au mode d’entraînement « Libellé » dans Parcourirdocs image

Cependant, il n'est utile que pour examiner les prédictions qui ne sont pas de haute confiance (90 %+). En effet, lorsque le modèle est très fiable (c’est-à-dire supérieure à 90 %), alors en confirmant la prédiction que vous n'indiquez pas de nouvelles informations au modèle, il est déjà sûr que l'étiquette s'applique. Recherchez des exemples moins fiables plus bas sur la page si nécessaire. Bien que, si les prédictions ont des confiances élevées et sont erronées, il est alors important d'appliquer la ou les bonnes étiquettes, rejetant ainsi la ou les prédictions incorrectes.

Conseils utiles

  • S'il existe plusieurs façons de dire la même chose pour un libellé (par ex. A, B ou C), assurez-vous de donner des exemples d'entraînement de la plate-forme pour chaque façon de le dire. Si vous lui donnez 30 exemples de A, et seulement quelques exemples de B et C, le modèle aura du mal à choisir les futurs exemples de B ou C pour cette étiquette.
  • L'ajout d'un nouveau libellé à une taxonomie adulte peut signifier qu'elle n'a pas été appliquée aux messages précédemment examinés. Cela nécessite ensuite de revenir en arrière et d'entraîner le modèle sur de nouveaux libellés, à l'aide de la fonction « Libellé manquant » (Missed label). Voir ici pour savoir comment.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Logo Uipath blanc
Confiance et sécurité
© 2005-2024 UiPath. All rights reserved.