- Introduction
- Configuration de votre compte
- Équilibre
- Clusters
- Dérive de concept
- Couverture
- Jeux de données
- Champs généraux
- Libellés (prédictions, niveaux de confiance, hiérarchie des libellés et sentiment des libellés)
- Modèles
- Flux
- Évaluation du modèle
- Projets
- Précision
- Rappel
- Messages annotés et non annotés
- Extraction des champs
- Sources
- Taxonomies
- Apprentissage
- Prédictions positives et négatives vraies et fausses
- Validation
- Messages
- Contrôle et administration de l'accès
- Gérer les sources et les jeux de données
- Comprendre la structure des données et les autorisations
- Créer ou supprimer une source de données dans l'interface graphique
- Téléchargement d’un fichier CSV dans une source
- Préparation des données en vue du téléchargement du fichier .CSV
- Création d'un ensemble de données
- Sources et jeux de données multilingues
- Activation des sentiments sur un ensemble de données
- Modification des paramètres du jeu de données
- Supprimer un message
- Supprimer un jeu de données
- Exporter un ensemble de données
- Utilisation d'intégrations Exchange
- Entraînement et maintenance du modèle
- Comprendre les libellés, les champs généraux et les métadonnées
- Hiérarchie de libellés et meilleures pratiques
- Comparer les cas d’utilisation des analyses et des automatisations
- Transformer vos objectifs en libellés
- Présentation du processus d'entraînement du modèle
- Annotation générative
- Statut du jeu de données
- Entraînement des modèles et annotation des meilleures pratiques
- Entraînement avec l'analyse des sentiments des libellés activée
- Comprendre les exigences de données
- Entraîner
- Vue d'ensemble (Overview)
- Examen des prédictions de libellé
- Entraînement à l'aide de la classification par glisser-déposer
- Entraînement à l'aide de l'option Enseigner le libellé (Explore)
- Entraînement à l'aide d'une confiance faible
- Entraînement à l'aide de la recherche (Explorer)
- Affiner et réorganiser votre taxonomie
- Introduction à affiner
- Précision et rappel expliqués
- Précision et rappel
- Comment fonctionne la validation
- Comprendre et améliorer les performances du modèle
- Raisons de la faible précision moyenne des libellés
- Entraînement à l'aide du libellé Vérifier (Check label) et du libellé Manqué (Missed Label)
- Entraînement à l'aide du libellé En savoir plus (Affiner)
- Entraînement à l'aide de la recherche (affiner)
- Comprendre et augmenter la couverture
- Amélioration de l'équilibre et utilisation du rééquilibrage
- Quand arrêter l'entraînement de votre modèle
- Utilisation de champs généraux
- Extraction générative
- Vue d'ensemble (Overview)
- Configurer des champs
- Filtrage par type de champ d’extraction
- Génération de vos extractions
- Validation et annotation des extractions générées
- Meilleures pratiques et considérations
- Comprendre la validation des extractions et des performances d'extraction
- Questions fréquemment posées (FAQ)
- Utilisation des analyses et de la surveillance
- Automations et Communications Mining™
- Développeur
- Charger des données
- Téléchargement de données
- Intégration avec l'utilisateur du service Azure
- Intégration avec l'authentification d'application Azure
- Intégration d’Exchange avec l’authentification et le graphique d’application Azure
- Récupérer des données pour Tableau avec Python
- Intégration d'Elasticsearch
- Extraction de champ général
- Intégration avec Exchange auto-hébergée
- Infrastructure d’automatisation UiPath®
- Activités officielles UiPath®
- Comment les machines apprennent à comprendre les mots : guide d'intégration dans NLP
- Apprentissage basé sur des invites avec des Transformers
- Efficient Transformers II : Dilarisation des connaissances et affinement
- Transformateurs efficaces I : mécanismes d'attention
- Modélisation de l'intention hiérarchique profonde non supervisée : obtenir de la valeur sans données d'entraînement
- Correction des biais d’annotation avec Communications Mining™
- Apprentissage actif : de meilleurs modèles d'ML en moins de temps
- Tout est dans les chiffres : évaluer les performances du modèle avec des métriques
- Pourquoi la validation du modèle est importante
- Comparaison de Communications Mining™ et de Google AutoML pour l’information sur des données conversationnelles
- Licences
- FAQ et plus encore

Guide de l’utilisateur de Communications Mining
- Libellés
- Champs généraux
Les libellés décrivent le message complet, par exemple, Annulation, Échec commercial ou Urgent. Les champs généraux font référence à des parties spécifiques du message, par exemple, le Nom de la contrepartie, l’ID client ou la Date d’annulation.
Dans un processus en aval, les libellés sont utilisés pour trier, hiérarchiser et décider quel type d'action doit être entreprendre. Les champs généraux sont utilisés pour remplir les champs de demande. Par exemple, un processus en aval peut filtrer les messages en fonction de ceux comportant le libellé Annulation, puis utiliser les champs généraux ID client et Date d'annulation extraits pour appeler une API afin de traiter automatiquement l'annulation.
Communications Mining est livré avec un certain nombre de champs généraux intégrés pour les concepts courants, tels que Organisation, Code de devise ou Date. Vous pouvez personnaliser les champs généraux intégrés de Communications Mining afin qu’ils soient adaptés à votre cas d’utilisation spécifique. Par exemple, Communications Mining dispose d’un champ général Date prédéfini et hautement entraîné que vous pouvez utiliser comme point de départ pour créer un champ général plus personnalisé tel que Date de renouvellement ou Date d’annulation. Vous pouvez également partir de zéro et apprendre à Communications Mining à reconnaître quelque chose de complètement nouveau.
Cette boîte aux lettres reçoit les demandes de renouvellement, d’annulation et d’administrateur qui sont parfois Urgents. Communications Mining™ a été entraîné de manière à reconnaître chacun de ces concepts, et les prédictions Communications Mining peuvent être utilisées afin de trier les e-mails à l’équipe appropriée en créant des tickets d’assistance.
Étant donné que le format du numéro de police est spécifique à cet assureur particulier, nous configurons le champ général pour qu'il puisse être entraîné à partir de zéro. D’autre part, l’organisation assurée est un type d’organisation, nous la configurons donc pour qu’elle puisse être entraînée en fonction du champ général Organisation (Organization) intégré. Enfin, nous remarquons que les courtiers n'inscrivent pas toujours leur nom dans l'e-mail. Nous décidons donc d'utiliser l'adresse e-mail du courtier (disponible à partir des métadonnées de commentaire) pour rechercher le nom correspondant dans une base de données interne, plutôt que de l'extraire comme champ général.
Le tableau suivant résume ces approches.
| Configuration | Quand l'utiliser | Exemples |
|---|---|---|
| Champ général pouvant être entraîné sans champ général de base | Le plus souvent utilisé pour différents types d'ID internes, ou lorsqu'il n'y a pas de champ général de base approprié dans Communications Mining. | Numéro de police, ID client |
| Champ général pouvant être entraîné avec champ général de base | Utilisé pour personnaliser un champ général préconstruit existant dans Communications Mining. | Date d'annulation (basée sur la date), organisation assurée (basée sur l'organisation) |
| Champs généraux pré-construits (ne peuvent pas être entraînés) | Utilisé pour les champs généraux qui doivent correspondre exactement tels que définis, où l'entraînement inviterait des erreurs. | est dans |
| Utilisation de métadonnées de commentaire au lieu de champs généraux | Utilisé lorsque les informations requises sont déjà présentes sous forme structurée dans les métadonnées de commentaire. | Adresse de l’expéditeur, domaine de l’expéditeur |
Communications Mining™ propose plusieurs façons de récupérer les prédictions, y compris les champs généraux prévus. Veuillez consulter la vue d’ensemble du téléchargement de données pour comprendre la méthode la mieux adaptée à votre cas d’utilisation.
Quelle que soit la méthode que vous choisissez, vous devez connaître les cas particuliers suivants et les gérer dans votre application :
- Tous les champs généraux attendus ne sont pas présents dans la réponse
- La réponse contient plusieurs correspondances pour un ou plusieurs champs généraux
- Tous les champs généraux présents dans la réponse ne sont pas corrects
Dans cette section, nous allons examiner chacun de ces cas limites plus en détail.
Tous les champs généraux ne sont pas présents dans la réponse
La réponse contient plusieurs correspondances pour un ou plusieurs champs généraux
Notez que vous pouvez utiliser les métadonnées dans la réponse lorsque vous gérez de tels cas. Par exemple, nous pouvons choisir de choisir de préférence les numéros de police qui apparaissent dans l'objet de l'e-mail plutôt que ceux qui apparaissent dans le corps de l'e-mail. L'exemple suivant montre la réponse que l'API renverra pour notre exemple d'e-mail.
{
"predictions": [
{
"uid": "aa05ba2250de48e3.7588b85f68f81c3b",
"labels": [...],
"entities": [
{
"id": "6a1d11118b60868e",
"name": "policy-number",
"span": {
"content_part": "body",
"message_index": 0,
"utf16_byte_start": 200,
"utf16_byte_end": 222,
"char_start": 100,
"char_end": 111
},
"kind": "policy-number",
"formatted_value": "GHI-0204963"
},
{
"id": "6a1d11118b60868e",
"name": "policy-number",
"span": {
"content_part": "subject",
"message_index": 0,
"utf16_byte_start": 0,
"utf16_byte_end": 22,
"char_start": 0,
"char_end": 11
},
"kind": "policy-number",
"formatted_value": "GHI-0068448"
},
{...},
{...},
{...}
]
}
],
"model": {
"version": 31,
"time": "2021-07-14T15:00:57.608000Z"
},
"status": "ok"
}{
"predictions": [
{
"uid": "aa05ba2250de48e3.7588b85f68f81c3b",
"labels": [...],
"entities": [
{
"id": "6a1d11118b60868e",
"name": "policy-number",
"span": {
"content_part": "body",
"message_index": 0,
"utf16_byte_start": 200,
"utf16_byte_end": 222,
"char_start": 100,
"char_end": 111
},
"kind": "policy-number",
"formatted_value": "GHI-0204963"
},
{
"id": "6a1d11118b60868e",
"name": "policy-number",
"span": {
"content_part": "subject",
"message_index": 0,
"utf16_byte_start": 0,
"utf16_byte_end": 22,
"char_start": 0,
"char_end": 11
},
"kind": "policy-number",
"formatted_value": "GHI-0068448"
},
{...},
{...},
{...}
]
}
],
"model": {
"version": 31,
"time": "2021-07-14T15:00:57.608000Z"
},
"status": "ok"
}