communications-mining
latest
false
Important :
Communications Mining est désormais inclus dans UiPath IXP. Consultez l’introduction du manuel utilisateur pour plus de détails. Ce contenu a été traduit à l'aide d'une traduction automatique. La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.
UiPath logo, featuring letters U and I in white

Guide de l'utilisateur de Communications Mining

Dernière mise à jour 12 mai 2025

Hiérarchie de libellés et meilleures pratiques

Introduction

Pour répondre à vos objectifs métier, il est important de savoir comment créer votre taxonomie avant de commencer à entraîner votre modèle. Cela inclut la façon de nommer et de structurer vos libellés, ainsi que leur contenu. Pour plus de détails, consultez Créer votre structure de taxonomie (Building your taxonomy structure).

Libellés d'affectation de noms

La fonctionnalité d'annotation générative utilise des noms de libellé et des descriptions comme entrée d'entraînement. Par conséquent, il est important d'utiliser des noms de libellés clairs, distincts et descriptifs. Les noms et les descriptions de libellé fournissent au modèle les meilleures entrées d'entraînement lorsqu'il génère automatiquement des prédictions.

Vous pouvez renommer les libellés et ajouter des niveaux de hiérarchie à tout moment. Cela vous permet d'affiner les libellés et les descriptions de libellés afin d'améliorer les prédictions générées automatiquement avant d'annoter les messages avec des libellés.

Hiérarchies de libellés

Lorsque vous nommez des libellés, vous devez également déterminer leur hiérarchie dans votre taxonomie. Ils peuvent avoir plusieurs niveaux de hiérarchie, séparés par un signe supérieur à >, pour capturer lorsqu'un concept de libellé est un sous-ensemble d'un concept parent plus large.

Exemples de structure de libellés :

  • [Libellé du parent]
  • [Libellé du parent] > [Libellé des enfants]
  • [Libellé parent] > [Libellé de la branche] > [Libellé des enfants]

Vous pouvez ajouter plus de trois niveaux de hiérarchie, mais nous vous déconseillons de le faire souvent, car l'entraînement du modèle devient complexe. Pour ajouter des niveaux de hiérarchie supplémentaires, vous pouvez renommer vos libellés ultérieurement dans le processus d'entraînement du modèle.

Conceptuellement, chaque libellé imbriqué sous un autre doit représenter un sous-ensemble du libellé au-dessus. Cette imbrication représente le niveau de hiérarchie et est établie par le symbole supérieur à > lorsque vous spécifiez le nom du libellé.
Exemple de fonctionnement conceptuel des hiérarchies de libellésdocs image

Exemples pratiques de hiérarchies

Pour comprendre le fonctionnement des hiérarchies, tenez compte du Libellé enfant X du diagramme dans la section Hiérarchies de libellés .

Lorsque le modèle prévoit que le libellé enfant X s’applique à un message, il prévoit également le libellé de la branche C et le libellé 1 en même temps. En effet, Label enfant X est un sous-ensemble des deux.

Chaque niveau de hiérarchie ajoute un niveau croissant de spécificité. Cependant, le modèle est souvent plus fiable pour attribuer un libellé parent ou de branche qu'un libellé enfant plus spécifique. Cela signifie que le modèle peut attribuer différentes probabilités à différentes prédictions de libellé au sein de la même hiérarchie.

À titre d'exemple, pour un message particulier, le modèle peut être :

  • Confiance à 99 % que le Libellé parent 1 s'applique.
  • Confiance à 88 % que le libellé de branche C s'applique.
  • Confiance à 75 % que le libellé enfant X s'applique.
Remarque : si le modèle prévoit un libellé enfant pour un message, il doit toujours prédire le libellé parent (et le libellé de la branche, le cas échéant) avec au moins la même confiance que le libellé enfant, voire un niveau supérieur.

Le modèle prévoit chaque libellé indépendamment. Il est donc important que les libellés parents représentent des sujets ou des concepts véritables au lieu de sujets ou de concepts abstraites.

Par exemple, il est inefficace d'utiliser Processus (Process) comme libellé parent s'il regroupe des processus spécifiques, car le modèle est trop abstraite pour pouvoir le prévoir. Au lieu de cela, un nom de processus spécifique du texte du message fonctionne mieux en tant que libellé parent, avec des libellés de branche et d'enfant qui représentent des sous-processus pertinents.

Choisir entre les libellés parents et les libellés enfants

Parfois, vous devrez peut-être faire des choix difficiles concernant la structure de votre taxonomie. Par exemple, il peut être difficile de choisir si un libellé doit être un libellé parent ou un libellé enfant. Cela peut se produire parce que le libellé pourrait logiquement servir de large catégorie parente avec ses propres sous-catégories, ou qu'il pourrait s'agir d'une sous-catégorie spécifique d'une autre catégorie parente plus large.

Par exemple, imaginons un ensemble de données d'avis d'avis d'hôtel. De nombreux avis peuvent inclure la tarification de divers aspects des vacances et de l'hébergement tels que le restaurant, le bar, les salles, les activités, etc.

Choisissez un des choix suivants :

  • Vous pouvez avoir la Tarification (Pricing) comme libellé parent, et chaque aspect spécifique de la tarification (c'est-à-dire restaurant) comme libellés enfants.
  • Cependant, vous pouvez également avoir des libellés parents liés à des aspects spécifiques tels que les restaurations et les salles, et avoir une tarification en tant qu'étiquette enfant sous chacun.

Lorsque vous décidez, assurez-vous de prendre en compte les éléments suivants :

  • Souhaitez-vous inclure un nombre important d’autres concepts liés à ce sujet plus large ? Si oui, il doit s'agir d'un libellé parent.
  • Quel est l’élément le plus important à suivre du point de vue des informations de gestion ou des rapports ? D'après notre exemple, est-il utile de pouvoir afficher clairement dans l'analyse de Communications Mining le nombre exact de personnes qui parlez de tarification et de ses sous-catégories ? Ou est-il plus utile de voir des statistiques globales sur les retours sur les salles, les restaurant, les activités, etc., la tarification ne étant qu’un de ces aspects ?

Il n'y a pas toujours de réponse claire ou erronée dans ces situations - cela dépend en fin de compte de ce qui vous importe le plus et de votre entreprise.

Capture des données avec des libellés

Jusqu'à présent, nous avons expliqué comment nommer les libellés et les structurer en hiérarchies. Cependant, vous vous demandez peut-être ce qu'un libellé doit capturer exactement.

Il est important de se souvenir que Communications Mining est un outil de traitement automatique des langues (NLP). La plate-forme lit et interprète chaque message auquel un libellé est attribué, et commence à comprendre comment identifier ce concept de libellé basé principalement sur le texte qu'il contient.

Au fur et à mesure que vous ajoutez des exemples plus variés et cohérents pour chaque libellé, le modèle améliore sa compréhension de ce concept de libellé. Une fois qu'un libellé fonctionne bien, évitez d'en ajouter d'autres, car le processus entraînerait des résultats décroissants. Évitez également d'accepter un grand nombre de prédictions à haute confiance pour un libellé, car cela ne fournit pas au modèle de nouvelles informations.

Étant donné que Communications Mining utilise la langue du message pour comprendre et identifier ce qui constitue les concepts de libellé, le libellé doit être clairement identifiable à partir du texte des messages auxquels il est appliqué. Dans le cas d'un e-mail, cela inclut à la fois l'objet et le corps de l'e-mail.

L'exemple d'e-mail suivant a le libellé Cancellation > Confirmation > Termination appliqué :
Exemple de message électronique mettant en évidence le texte pris en compte par le modèle lors de ses prédictions

Vous pouvez clairement déduire le nom du libellé à partir de l'objet et du corps de l'e-mail.

Bien que le modèle puisse prendre en compte certaines propriétés de métadonnées, telles que les scores NPS, lorsqu'il s'entraîne sur des ensembles de données de commentaires client pour aider à comprendre le sentiment, le texte du message reste les données les plus importantes pour les modèles Communications Mining.

Remarque : le modèle ne prend pas en compte l'adresse de l'expéditeur ou du destinataire spécifique d'un e-mail. Par conséquent, ces adresses ne doivent pas du tout être utilisées lorsque vous déterminez le libellé à appliquer à un e-mail.

Cela signifie que chaque libellé doit être spécifique dans ce qu'il vise à capturer. Sinon, le modèle aura du mal à identifier les tendances et les modèles dans la langue nécessaire pour prédire avec précision le concept de libellé.

Pourquoi vous devez éviter d'utiliser des libellés très larges

Des libellés extrêmement larges tels que Requête générale (General Query) ou Tout le reste (Everyone) peuvent être peu utiles si vous les utilisez pour regrouper plusieurs sujets différents et qu’il n’y a pas de modèle clair ou de similitude entre les exemples fournis au modèle.

Pour que le modèle puisse prédire avec précision un libellé, il nécessite plusieurs exemples similaires des différentes expressions de chaque concept capturé par le libellé. Par conséquent, des libellés extrêmement larges nécessitent un très grand nombre d'exemples pour être prédits efficacement.

Il est préférable de diviser les libellés étendus en libellés distincts, même si vous avez Tout le reste > [Libellés enfants différents].

Si le modèle peut mieux identifier un libellé enfant parce qu’il est plus spécifique et plus clairement identifiable, par rapport à une catégorie parente très large, il pourra également améliorer considérablement sa capacité à prédire le libellé parent.

Description des libellés

La fonctionnalité d’ annotation générative utilise des descriptions de libellés et des noms de libellés pour entraîner automatiquement un modèle spécialisé. Par conséquent, il est important d'ajouter des descriptions descriptives, claires et informatives à chaque libellé afin que le modèle puisse générer des prédictions précises.

Le modèle d’IA générative utilise des descriptions comme entrées pour pré-annoter les messages en arrière-plan. Cela réduit le temps et les efforts que vous passez à l'annotation manuelle des exemples.

Vous pouvez ajouter des descriptions de libellé une fois que le processus Créer un ensemble de données (Create Dataset) les a créées, ou vous pouvez les ajouter ou les modifier à partir de la page Taxonomy dans Paramètres de l'ensemble de données (Dataset Settings).

Un moyen efficace de maintenir la cohérence des libellés tout au long du processus de création de modèle consiste à ajouter des descriptions à chaque libellé. Cette option est utile si plusieurs utilisateurs entraînent votre modèle, car cela garantit que tous les utilisateurs ont la même compréhension d'un libellé donné et de son concept associé. Un autre avantage du maintien de la cohérence des libellés est qu'il rend le processus de transfert plus efficace si vous devez transférer le modèle à un autre utilisateur.

Exemples de descriptions de libellés dans la page Paramètres du jeu de données (Dataset Settings)

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2025 UiPath Tous droits réservés.