- Démarrage
- Équilibre
- Clusters
- Dérive de concept
- Couverture
- Jeux de données
- Champs généraux (anciennement entités)
- Libellés (prédictions, niveaux de confiance, hiérarchie, etc.)
- Modèles
- Flux
- Évaluation du modèle
- Projets
- Précision
- Rappel
- Messages examinés et non examinés
- Sources
- Taxonomies
- Apprentissage
- Prédictions positives et négatives vraies et fausses
- Validation
- Messages
- Administration
- Gérer les sources et les jeux de données
- Comprendre la structure des données et les autorisations
- Créer une source de données dans l'interface graphique
- Téléchargement d’un fichier CSV dans une source
- Créer un nouveau jeu de données
- Sources et jeux de données multilingues
- Activation des sentiments sur un ensemble de données
- Modifier les paramètres d’un jeu de données
- Supprimer des messages via l'interface utilisateur
- Supprimer un jeu de données
- Supprimer une source
- Exporter un jeu de données
- Utilisation des intégrations Exchange
- Préparation des données en vue du téléchargement du fichier .CSV
- Entraînement et maintenance du modèle
- Comprendre les libellés, les champs généraux et les métadonnées
- Hiérarchie des libellés et bonnes pratiques
- Définition de vos objectifs de taxonomie
- Cas d'utilisation d'analyse vs d'automatisation
- Transformer vos objectifs en libellés
- Construire votre structure de taxonomie
- Meilleures pratiques de conception de taxonomie
- Importation de votre taxonomie
- Présentation du processus d'entraînement du modèle
- Annotation générative (New)
- Comprendre le statut de votre jeu de données
- Entraînement des modèles et annotation des meilleures pratiques
- Entraînement avec l'analyse des sentiments des libellés activée
- Entraîner
- Vue d'ensemble (Overview)
- Examen des prédictions de libellé
- Entraînement à l'aide de la classification par glisser-déposer
- Entraînement à l'aide de l'option Enseigner le libellé (Explore)
- Entraînement à l'aide d'une confiance faible
- Entraînement à l'aide de la recherche (Explorer)
- Réduction et réorganisation de votre taxonomie
- Introduction à affiner
- Précision et rappel expliqués
- Précision et rappel
- Comment fonctionne la validation ?
- Comprendre et améliorer les performances du modèle
- Pourquoi un libellé peut-il avoir une précision moyenne faible ?
- Entraînement à l'aide du libellé Vérifier (Check label) et du libellé Manqué (Missed Label)
- Entraînement à l'aide du libellé En savoir plus (Affiner)
- Entraînement à l'aide de la recherche (affiner)
- Comprendre et augmenter la couverture
- Amélioration de l'équilibre et utilisation du rééquilibrage
- Quand arrêter l'entraînement de votre modèle
- Utilisation de champs généraux
- Extraction générative
- Utilisation des analyses et de la surveillance
- Automatisations et Communications Mining
- Informations de licence
- FAQ et plus encore
Maintenir un modèle en production
Pourquoi la maintenance du modèle est-elle importante ?
La création d'un modèle adapté à être déployé dans un environnement de production nécessite un investissement de temps qui est rapidement remboursé par la valeur des analyses en cours et des économies d'efficacité grâce à l'automatisation.
Si un modèle n'est pas maintenu efficacement sur le long terme, les avantages fournis par le modèle peuvent être effaces au fil du temps car les performances du modèle peuvent potentiellement diminuer sans une petite quantité d'entraînement supplémentaire.
Cela est dû à la «dérive de concept», qui fait référence à la situation où les concepts qu'un modèle essaie de prédire peuvent changer de manière imprévue au fil du temps, ce qui rend les prédictions de moins en moins précises.
Cela est essentiellement lié à la façon dont, avec le temps, les choses peuvent changer dans une entreprise et à la façon dont elle communique en interne, avec d'autres entreprises et avec ses clients. Si les données d'entraînement de votre modèle ne sont plus représentatives de la façon dont votre entreprise fonctionne actuellement, leurs performances seront plus nulles lors de la tentative d'identification de concepts dans vos données de communication.
Il est donc important pour tout modèle utilisé dans un environnement de production qu'il soit efficacement maintenu pour garantir des performances élevées continues.
Comment maintenir un modèle en production ?
La maintenance d'un modèle de production est un processus simple et nécessitant peu d'efforts. La majorité de l’effort requis a déjà été consacré à la création des données d’entraînement de votre modèle avant son déploiement.
Il existe deux approches principales pour maintenir un modèle, qui garantissent toutes deux que votre modèle dispose d'exemples d'entraînement supplémentaires utiles et représentatifs :
- Exception d'apprentissage
- Utilisation du mode « Rééquilibrer »
1. Entraînement des exceptions
Tout modèle utilisé à des fins d'automatisation doit avoir un processus d'exception en place qui identifie les messages correspondant aux exceptions que la plate-forme n'a pas pu identifier de manière fiable ou correcte (voir ici pour plus de détails).
Ceci est important car cela vous permet essentiellement de trouver et d'annoter rapidement les messages avec lesquels la plate-forme a lutté, ce qui améliore la capacité du modèle à prédire les futurs messages similaires.
En règle générale, un processus d'automatisation sera configuré pour signaler automatiquement les messages avec une propriété utilisateur qui les identifie comme une exception. Vous pouvez ensuite filtrer dans Explorer vers ces messages et les annoter avec les libellés corrects, pour vous assurer que la plate-forme peut identifier en toute confiance et correctement les messages similaires à l'avenir.
Cela doit faire partie d'un processus régulier qui vise à améliorer constamment le modèle. Plus les exceptions sont capturées et annotées, plus un modèle fonctionnera au fil du temps, en minimisant le nombre d'exceptions futures et en maximisant les gains d'efficacité que permet un modèle centré sur l'automatisation.
2. Utilisation du mode Équilibrer et « Rééquilibrer »
La note «Équilibre » de votre modèle fait partie de sa notation de modèle. Cela reflète la similarité, c'est-à-dire la représentation, des données d'entraînement de votre modèle par rapport à l'ensemble de données dans son ensemble.
En bibliothèque, si les données les plus récentes ajoutées à un ensemble de données au fil du temps sont considérablement différentes des données plus anciennes utilisées pour entraîner le modèle, cela entraînerait une baisse du score de similarité qui détermine la note d'équilibre de votre modèle.
Lors de l'entraînement des exceptions, il est important de vérifier si le score de similarité du modèle diminue. Si c'est le cas, cela doit être résolu car cela pourrait être une indication de la dérive du concept et signifiera que les performances de production échoueront.
Le moyen le plus simple de corriger une baisse du score de similarité consiste à effectuer un entraînement en utilisant le mode « Rééquilibrer ».
Pour vous assurer que vous entraînez les données les plus récentes représentatives du type de communications reçues aujourd'hui, vous pouvez également ajouter un filtre d'horodatage lors de l'entraînement dans « Rééquilibrer », les 3 ou 6 derniers mois. Cela garantit que votre modèle ne repose pas uniquement sur des données d'entraînement obsolètes et susceptibles de ne refléter aucun changement dans votre entreprise.