- Démarrage
- Équilibre
- Clusters
- Dérive de concept
- Couverture
- Jeux de données
- Champs généraux (anciennement entités)
- Libellés (prédictions, niveaux de confiance, hiérarchie, etc.)
- Modèles
- Flux
- Évaluation du modèle
- Projets
- Précision
- Rappel
- Messages examinés et non examinés
- Sources
- Taxonomies
- Apprentissage
- Prédictions positives et négatives vraies et fausses
- Validation
- Messages
- Administration
- Gérer les sources et les jeux de données
- Comprendre la structure des données et les autorisations
- Créer une source de données dans l'interface graphique
- Téléchargement d’un fichier CSV dans une source
- Créer un nouveau jeu de données
- Sources et jeux de données multilingues
- Activation des sentiments sur un ensemble de données
- Modifier les paramètres d’un jeu de données
- Supprimer des messages via l'interface utilisateur
- Supprimer un jeu de données
- Supprimer une source
- Exporter un jeu de données
- Utilisation des intégrations Exchange
- Préparation des données en vue du téléchargement du fichier .CSV
- Entraînement et maintenance du modèle
- Comprendre les libellés, les champs généraux et les métadonnées
- Hiérarchie des libellés et bonnes pratiques
- Définition de vos objectifs de taxonomie
- Cas d'utilisation d'analyse vs d'automatisation
- Transformer vos objectifs en libellés
- Construire votre structure de taxonomie
- Meilleures pratiques de conception de taxonomie
- Importation de votre taxonomie
- Présentation du processus d'entraînement du modèle
- Annotation générative (New)
- Statut du jeu de données
- Entraînement des modèles et annotation des meilleures pratiques
- Entraînement avec l'analyse des sentiments des libellés activée
- Entraîner
- Vue d'ensemble (Overview)
- Examen des prédictions de libellé
- Entraînement à l'aide de la classification par glisser-déposer
- Entraînement à l'aide de l'option Enseigner le libellé (Explore)
- Entraînement à l'aide d'une confiance faible
- Entraînement à l'aide de la recherche (Explorer)
- Réduction et réorganisation de votre taxonomie
- Introduction à affiner
- Précision et rappel expliqués
- Précision et rappel
- Comment fonctionne la validation ?
- Comprendre et améliorer les performances du modèle
- Pourquoi un libellé peut-il avoir une précision moyenne faible ?
- Entraînement à l'aide du libellé Vérifier (Check label) et du libellé Manqué (Missed Label)
- Entraînement à l'aide du libellé En savoir plus (Affiner)
- Entraînement à l'aide de la recherche (affiner)
- Comprendre et augmenter la couverture
- Amélioration de l'équilibre et utilisation du rééquilibrage
- Quand arrêter l'entraînement de votre modèle
- Utilisation de champs généraux
- Extraction générative
- Utilisation des analyses et de la surveillance
- Automatisations et Communications Mining
- Informations de licence
- FAQ et plus encore
Construire votre structure de taxonomie
L'un des facteurs les plus fondamentaux qui déterminera les performances de votre modèle, ainsi que sa réponse à vos objectifs métier, est la structure de votre taxonomie, y compris les éléments capturés par chacun des libellés qu'elle contient.
Il est donc important de penser à votre structure de taxonomie cible avant l'entraînement du modèle. Cela dit, vous devriez avoir un certain degré de flexibilité pour l'adapter, le développer et l'améliorer (si nécessaire) au fur et à mesure de votre apprentissage. C'est ce que nous appelons l'approche d'entraînement « basée sur les données ».
En fin de compte, les libellés de la taxonomie et les exemples d'apprentissage fournis pour chaque libellé devraient créer une représentation précise et équilibrée de l'ensemble de données dans son ensemble. Mais chaque libellé doit également être précieux, en représentant clairement d'une certaine manière les messages pour lesquels il est prédit.
Si les libellés sont utilisés pour capturer des concepts très généraux, vastes ou confus, non seulement ils sont plus susceptibles de fonctionner mal, mais ils sont moins susceptibles de fournir une valeur commerciale. Cela peut être pour fournir des informations utiles sur ce concept ou pour aider un processus à être entièrement ou partiellement automatisé en aval.
Il s'agit d'un exemple de taxonomie de haut niveau avec des libellés typiques applicables à divers cas d'utilisation/secteurs d'activité. Tous ne s'appliqueront pas à votre modèle.
Une entreprise reçoit des millions d'e-mails chaque année dans différentes boîtes de réception de la part de clients concernant une multitude de problèmes, de requêtes, de suggestions, de réclamations, etc.
Cette entreprise décide d’augmenter son efficacité opérationnelle, la standardisation des processus et la visibilité de ce qui se passe dans son entreprise en transformant automatiquement ces e-mails des clients en tickets de workflow. Celles-ci peuvent ensuite être suivies et traitées, à l'aide de processus spécifiés et dans des délais définis.
Pour ce faire, il décide d'utiliser la plate-forme pour interpréter ces communications entrantes non structurées et fournir une classification concernant le processus et le sous-processus auxquels l'e-mail se rapporte. Cette classification est utilisée pour mettre à jour le ticket de workflow qui sera automatiquement créé à l'aide d'un service d'automatisation et garantir qu'il est acheminé vers l'équipe ou l'individu approprié.
Pour s'assurer que ce cas d'utilisation est aussi réussi que possible et pour minimiser le nombre d'exceptions (classifications incorrectes ou e-mails que la plate-forme n'est pas en mesure de classer en toute confiance), chaque e-mail entrant doit recevoir une prédiction fiable avec un libellé parent et un libellé enfant, c'est-à-dire [Processus X] > [Sous-Processus Y].
Étant donné que l'objectif est de classer chaque e-mail entrant avec un [Processus] et [Sous-processus], chaque libellé de la taxonomie doit être conforme à ce format :
Dans ce cas d'utilisation, tout e-mail qui n'a pas une prédiction fiable pour un libellé parent et enfant peut être une exception, envoyée pour une révision manuelle et la création de tickets. Alternativement, s’il a une prédiction de libellé parent de confiance élevée, mais pas une prédiction de libellé enfant fiable, cela peut toujours être utilisé pour acheminer partiellement l’e-mail ou créer un ticket, avec un travail manuel supplémentaire pour ajouter le sous-processus pertinent.
Si nous imaginons que le premier est vrai et que chaque e-mail sans prédiction de confiance élevée sous la forme de [Processus] (Process) > [Sous-Processus] ([Process] > [Sub-Process]) devient une exception manuelle, nous voulons nous assurer que tous les exemples que nous fournissons pour chaque libellé lors de l'entraînement du modèle reflète ce format.
Chaque libellé parent dans la taxonomie doit être associé à un processus général relatif au contenu des e-mails, par exemple «Facture ». Chaque libellé enfant doit alors être un sous-processus plus spécifique qui repose sur un libellé parent, par exemple « Facturation > Demande de statut ».
N'oubliez pas qu'il est important que chaque libellé soit spécifique dans ce qu'il tente de capturer. Des libellés extrêmement généraux tels que « Requête générale » ou « Tout le reste » peuvent être très inutiles s’ils sont utilisés pour regrouper de nombreux sujets distincts et qu’il n’y a pas de modèle ou de communauté commune entre les exemples épinglés.
Dans ce cas d'utilisation, ils ne fourniraient pas non plus beaucoup de valeur commerciale lorsqu'un ticket de workflow était créé et classé en tant que « Requête générale » (General Query) ou « Tout le reste » (Everything else). Certains devraient encore le lire attentivement pour comprendre de quoi il s’agit et s’il était pertinent pour leur équipe avant que cela puisse être mis en œuvre.
Cela annulait tout avantage de gain de temps et ne fournissait pas d'IA utile à l'entreprise sur le travail réellement effectué par les équipes.
Remarque : il ne s'agit que d'un exemple de la façon dont vous pouvez structurer une taxonomie pour un cas d'utilisation spécifique. Il ne s'agit pas d'une approche à taille unique. Chaque projet nécessitera une taxonomie unique de libellés, qui dépend fortement de votre cas d'utilisation, de l'ensemble de données et de vos objectifs spécifiques.