- Démarrage
- Équilibre
- Clusters
- Dérive de concept
- Couverture
- Jeux de données
- Champs généraux (anciennement entités)
- Libellés (prédictions, niveaux de confiance, hiérarchie, etc.)
- Modèles
- Flux
- Évaluation du modèle
- Projets
- Précision
- Rappel
- Messages examinés et non examinés
- Sources
- Taxonomies
- Apprentissage
- Prédictions positives et négatives vraies et fausses
- Validation
- Messages
- Administration
- Gérer les sources et les jeux de données
- Comprendre la structure des données et les autorisations
- Create or delete a data source in the GUI
- Téléchargement d’un fichier CSV dans une source
- Préparation des données en vue du téléchargement du fichier .CSV
- Créer un nouveau jeu de données
- Sources et jeux de données multilingues
- Activation des sentiments sur un ensemble de données
- Modifier les paramètres d’un jeu de données
- Supprimer des messages via l'interface utilisateur
- Supprimer un jeu de données
- Exporter un jeu de données
- Utilisation des intégrations Exchange
- Entraînement et maintenance du modèle
- Comprendre les libellés, les champs généraux et les métadonnées
- Hiérarchie des libellés et bonnes pratiques
- Définition de vos objectifs de taxonomie
- Cas d'utilisation d'analyse vs d'automatisation
- Transformer vos objectifs en libellés
- Construire votre structure de taxonomie
- Meilleures pratiques de conception de taxonomie
- Importation de votre taxonomie
- Présentation du processus d'entraînement du modèle
- Annotation générative (New)
- Statut du jeu de données
- Entraînement des modèles et annotation des meilleures pratiques
- Entraînement avec l'analyse des sentiments des libellés activée
- Comprendre les exigences de données
- Entraîner
- Vue d'ensemble (Overview)
- Examen des prédictions de libellé
- Entraînement à l'aide de la classification par glisser-déposer
- Entraînement à l'aide de l'option Enseigner le libellé (Explore)
- Entraînement à l'aide d'une confiance faible
- Entraînement à l'aide de la recherche (Explorer)
- Réduction et réorganisation de votre taxonomie
- Introduction à affiner
- Précision et rappel expliqués
- Précision et rappel
- Comment fonctionne la validation ?
- Comprendre et améliorer les performances du modèle
- Pourquoi un libellé peut-il avoir une précision moyenne faible ?
- Entraînement à l'aide du libellé Vérifier (Check label) et du libellé Manqué (Missed Label)
- Entraînement à l'aide du libellé En savoir plus (Affiner)
- Entraînement à l'aide de la recherche (affiner)
- Comprendre et augmenter la couverture
- Amélioration de l'équilibre et utilisation du rééquilibrage
- Quand arrêter l'entraînement de votre modèle
- Utilisation de champs généraux
- Extraction générative
- Utilisation des analyses et de la surveillance
- Automatisations et Communications Mining
- Informations de licence
- FAQ et plus encore
Guide de l'utilisateur de Communications Mining
Statut du jeu de données
Chaque fois que vous appliquez des libellés ou que vous examinez des champs généraux dans votre ensemble de données, votre modèle se réentraîne et une nouvelle version de modèle est créée. Pour en savoir plus sur l'utilisation des différentes versions de modèle, consultez ici.
Lorsque le modèle se réentraîne, il prend les dernières informations qui lui ont été fournies et recalcule toutes ses prédictions dans l'ensemble de données. Ce processus commence lorsque vous commencez l'entraînement et souvent lorsque Communications Mining termine d'appliquer les prédictions pour une version de modèle, il recalcule déjà les prédictions pour une version de modèle plus récente. Lorsque vous arrêtez l'entraînement après une période de temps, Communications Mining se saisit et appliquera les prédictions qui reflètent le dernier entraînement effectué dans l'ensemble de données.
Ce processus peut prendre un certain temps, en fonction de la quantité d'entraînement terminée, de la taille de l'ensemble de données et du nombre de libellés dans la taxonomie. Communications Mining dispose d'une fonctionnalité de statut utile pour aider les utilisateurs à comprendre quand leur modèle est à jour ou s'il est en cours de réentraînement et combien de temps cela devrait prendre.
Lorsque vous êtes dans un ensemble de données, l'une de ces deux icônes en haut de la page indiquera son statut actuel :
Cette icône indique que l'ensemble de données est à jour et que les prédictions de la dernière version du modèle ont été appliquées. | |
Cela indique que le modèle est en cours de réentraînement et que les prédictions peuvent ne pas être à jour. |
Si vous pointez sur l'icône avec votre souris, vous verrez plus de détails sur le statut comme indiqué ci-dessous :
- Entraînement de modèle
Ce processus implique de réentraîner la version actuelle du modèle pour en créer une nouvelle, en intégrant les modifications récentes telles que les mises à jour de la taxonomie ou les annotations de données. L'entraînement du modèle est généralement rapide, bien que sa durée puisse varier en fonction de plusieurs facteurs
- Appliquer des prédictions
Ce processus se produit après l'entraînement du modèle, où la plate-forme récupère et applique les prédictions de la version entraînée du modèle à chaque message. L’application des prédictions est généralement plus lente et la durée est principalement influencée par la taille et la complexité de l’ensemble de données.
- Complexité de la taxonomie des libellés et des champs
Impact: plus le nombre de libellés et de champs dans votre ensemble de données est élevé, plus le temps nécessaire pour entraîner le modèle et appliquer les prédictions dans tous les messages.
- Utilisation de l’extraction générative
Impact: l'extraction générative nécessite de comprendre les relations complexes entre les libellés et les champs, ce qui nécessite un modèle plus volumineux et plus performant, ce qui peut ralentir l'entraînement.
- Taille de votre jeu de données (données annotées et non annotées)
Impact: des volumes élevés de messages annotés augmentent les points de données que le modèle doit prendre en compte lors de l’entraînement, ce qui étend le processus. De même, des volumes élevés de messages non annotés peuvent prolonger le temps nécessaire à l’application des prédictions.
Remarque : les prédictions sont réaffichées dès qu'elles sont disponibles, vous n'avez donc pas besoin d'attendre qu'elles soient terminées lors de l'annotation. La plate-forme passera à l'application des prédictions de la dernière version du modèle entraîné si elle s'entraîne avant que les prédictions de la version précédente ne soient terminées. - Nombre d'ensembles de données entraînés simultanément
Impact: si plusieurs modèles s'entraînent simultanément dans votre environnement Communications Mining, cela peut provoquer des ralentissements temporaires, car la plate-forme équilibre la charge des services requis.
- Quand contacter le support
- Entraînement: si aucune des raisons ci-dessus n'explique l'entraînement lent et qu'il est en cours depuis plus de 4 heures, contactez l'assistance.
- Application des prédictions: pour les ensembles de données volumineux et complexes, attendez-vous à ce que l'application des prédictions prenne beaucoup de temps. Contactez l'assistance uniquement si ce processus est en cours depuis plus de 24 heures pour une seule version de modèle.
Remarque : cela ne doit pas bloquer l'annotation des données, car vous bénéficierez toujours de nouvelles prédictions dès qu'elles seront disponibles
Si votre modèle ne démarre pas l'entraînement dans l'heure suivant laquelle il a terminé une action qui devrait déclencher l'entraînement (comme l'annotation des messages avec des libellés ou des champs), veuillez contacter l'assistance.
Vérification du statut de l'entraînement: vous pouvez vérifier si votre modèle est en cours d'entraînement en vérifiant le statut de l'ensemble de données dans le coin supérieur droit de n'importe quelle page d'un ensemble de données