- Introduction
- Configuration de votre compte
- Équilibre
- Clusters
- Dérive de concept
- Couverture
- Jeux de données
- Champs généraux
- Libellés (prédictions, niveaux de confiance, hiérarchie des libellés et sentiment des libellés)
- Modèles
- Flux
- Évaluation du modèle
- Projets
- Précision
- Rappel
- Messages annotés et non annotés
- Extraction des champs
- Sources
- Taxonomies
- Apprentissage
- Prédictions positives et négatives vraies et fausses
- Validation
- Messages
- Contrôle et administration de l'accès
- Gérer les sources et les jeux de données
- Comprendre la structure des données et les autorisations
- Créer ou supprimer une source de données dans l'interface graphique
- Téléchargement d’un fichier CSV dans une source
- Préparation des données en vue du téléchargement du fichier .CSV
- Création d'un ensemble de données
- Sources et jeux de données multilingues
- Activation des sentiments sur un ensemble de données
- Modification des paramètres du jeu de données
- Supprimer un message
- Supprimer un jeu de données
- Exporter un ensemble de données
- Utilisation d'intégrations Exchange
- Entraînement et maintenance du modèle
- Comprendre les libellés, les champs généraux et les métadonnées
- Hiérarchie de libellés et meilleures pratiques
- Meilleures pratiques de conception de taxonomie
- Définition des objectifs de taxonomie
- Création de la structure de taxonomie
- Importer la taxonomie
- Comparer les cas d’utilisation des analyses et des automatisations
- Transformer vos objectifs en libellés
- Présentation du processus d'entraînement du modèle
- Annotation générative
- Statut du jeu de données
- Entraînement des modèles et annotation des meilleures pratiques
- Entraînement avec l'analyse des sentiments des libellés activée
- Entraînement des données de chat et d'appels
- Comprendre les exigences de données
- Entraîner
- Vue d'ensemble (Overview)
- Examen des prédictions de libellé
- Entraînement à l'aide de la classification par glisser-déposer
- Entraînement à l'aide de l'option Enseigner le libellé (Explore)
- Entraînement à l'aide d'une confiance faible
- Entraînement à l'aide de la recherche (Explorer)
- Affiner et réorganiser votre taxonomie
- Introduction à affiner
- Précision et rappel expliqués
- Précision et rappel
- Comment fonctionne la validation
- Comprendre et améliorer les performances du modèle
- Raisons de la faible précision moyenne des libellés
- Entraînement à l'aide du libellé Vérifier (Check label) et du libellé Manqué (Missed Label)
- Entraînement à l'aide du libellé En savoir plus (Affiner)
- Entraînement à l'aide de la recherche (affiner)
- Comprendre et augmenter la couverture
- Amélioration de l'équilibre et utilisation du rééquilibrage
- Quand arrêter l'entraînement de votre modèle
- Utilisation de champs généraux
- Extraction générative
- Vue d'ensemble (Overview)
- Configurer des champs
- Filtrage par type de champ d’extraction
- Génération de vos extractions
- Validation et annotation des extractions générées
- Meilleures pratiques et considérations
- Comprendre la validation des extractions et des performances d'extraction
- Questions fréquemment posées (FAQ)
- Utilisation des analyses et de la surveillance
- Automations et Communications Mining™
- Développeur
- Charger des données
- Téléchargement de données
- Intégration avec l'utilisateur du service Azure
- Intégration avec l'authentification d'application Azure
- Intégration d’Exchange avec l’authentification et le graphique d’application Azure
- Récupérer des données pour Tableau avec Python
- Intégration d'Elasticsearch
- Extraction de champ général
- Intégration avec Exchange auto-hébergée
- Infrastructure d’automatisation UiPath®
- Activités officielles UiPath®
- Comment les machines apprennent à comprendre les mots : guide d'intégration dans NLP
- Apprentissage basé sur des invites avec des Transformers
- Efficient Transformers II : Dilarisation des connaissances et affinement
- Transformateurs efficaces I : mécanismes d'attention
- Modélisation de l'intention hiérarchique profonde non supervisée : obtenir de la valeur sans données d'entraînement
- Correction des biais d’annotation avec Communications Mining™
- Apprentissage actif : de meilleurs modèles d'ML en moins de temps
- Tout est dans les chiffres : évaluer les performances du modèle avec des métriques
- Pourquoi la validation du modèle est importante
- Comparaison de Communications Mining™ et de Google AutoML pour l’information sur des données conversationnelles
- Licences
- FAQ et plus encore

Guide de l’utilisateur de Communications Mining
L'un des facteurs les plus fondamentaux qui détermineront les performances de votre modèle, ainsi que la manière dont il répond aux objectifs commerciaux, est la structure de votre taxonomie, y compris ce qui est capturé par chacun des libellés qu'elle contient.
Il est donc important de réfléchir à votre structure de taxonomie cible avant l'entraînement du modèle. Cela dit, vous devriez disposer d’un certain degré de flexibilité pour l’adapter, l’étendre et l’améliorer au fur et à mesure que vous progressez dans l’entraînement. C’est ce que nous appelons l’approche d’entraînement centrée sur les données.
Au final, les libellés de la taxonomie ainsi que les exemples d'entraînement fournis pour chaque libellé devraient créer une représentation précise et équilibrée de l'ensemble de données dans son ensemble. Mais chaque libellé doit également être utile, en représentant clairement d'une certaine manière les messages pour lesquels il est prédit.
Si les libellés sont utilisés pour capturer des concepts très généraux, vastes ou confus, non seulement ils sont plus susceptibles de fonctionner mal, mais ils sont moins susceptibles de fournir une valeur commerciale. Cela peut être pour fournir des informations utiles sur ce concept ou pour aider un processus à être entièrement ou partiellement automatisé en aval.
Il s'agit d'un exemple de taxonomie de haut niveau avec des libellés typiques applicables à divers cas d'utilisation ou à divers secteurs. Chacun d’entre eux ne s’appliquera pas à votre modèle.
Une entreprise reçoit des millions d'e-mails chaque année dans différentes boîtes de réception de la part de clients concernant une multitude de problèmes, de requêtes, de suggestions, de réclamations, etc.
Cette entreprise décide d’augmenter son efficacité opérationnelle, la standardisation des processus et la visibilité de ce qui se passe dans son entreprise en transformant automatiquement ces e-mails des clients en tickets de workflow. Celles-ci peuvent ensuite être suivies et traitées, à l'aide de processus spécifiés et dans des délais définis.
Pour ce faire, il décide d'utiliser la plate-forme pour interpréter ces communications entrantes non structurées et fournir une classification concernant le processus et le sous-processus auxquels l'e-mail se rapporte. Cette classification est utilisée pour mettre à jour le ticket de workflow qui sera automatiquement créé à l'aide d'un service d'automatisation et garantir qu'il est acheminé vers l'équipe ou l'individu approprié.
Pour s'assurer que ce cas d'utilisation est aussi réussi que possible et pour minimiser le nombre d'exceptions (classifications incorrectes ou e-mails que la plate-forme n'est pas en mesure de classer en toute confiance), chaque e-mail entrant doit recevoir une prédiction fiable avec un libellé parent et un libellé enfant, c'est-à-dire [Processus X] > [Sous-Processus Y].
Étant donné que l'objectif est de classer chaque e-mail entrant avec un [Processus] et [Sous-processus], chaque libellé de la taxonomie doit être conforme à ce format :
Dans ce cas d'utilisation, tout e-mail qui n'a pas une prédiction fiable pour un libellé parent et enfant peut être une exception, envoyée pour une révision manuelle et la création de tickets. Alternativement, s’il a une prédiction de libellé parent de confiance élevée, mais pas une prédiction de libellé enfant fiable, cela peut toujours être utilisé pour acheminer partiellement l’e-mail ou créer un ticket, avec un travail manuel supplémentaire pour ajouter le sous-processus pertinent.
Si nous imaginons que le premier est vrai et que chaque e-mail sans prédiction de confiance élevée sous la forme de [Processus] (Process) > [Sous-Processus] ([Process] > [Sub-Process]) devient une exception manuelle, nous voulons nous assurer que tous les exemples que nous fournissons pour chaque libellé lors de l'entraînement du modèle reflète ce format.
Chaque libellé parent dans la taxonomie doit être lié à un processus général pertinent pour le contenu des e-mails, par exemple, Facturation. Chaque libellé enfant doit alors être un sous-processus plus spécifique qui se trouve sous un libellé parent, par exemple, Facturation > Demande de statut.
Des libellés très larges tels que Requête générale ou Tout le reste peuvent être très utiles s'ils sont utilisés pour regrouper de nombreux sujets distincts, et il n'y a pas de modèle clair ou de similitude entre les exemples épinglés.
Dans ce cas d'utilisation, ils ne fournissaient pas non plus beaucoup de valeur commerciale lorsqu'un ticket de workflow était créé et classé comme Requête générale ou Tout autre. Certains devront encore le lire attentivement pour comprendre de quoi il s’agit et si cela était pertinent pour leur équipe avant de pouvoir l’agir.
Cela annulait tout avantage de gain de temps et ne fournissait pas d'IA utile à l'entreprise sur le travail réellement effectué par les équipes.