communications-mining
latest
false
- Documents d’API
- CLI
- Guides d'intégration
- Intégration avec l'utilisateur du service Azure
- Intégration avec l'authentification d'application Azure
- Automatisation en temps réel
- Récupérer des données pour Tableau avec Python
- Intégration d'Elasticsearch
- Intégration EWS auto-hébergée
- Infrastructure d'automatisation UiPath
- Activités UiPath Marketplace
- Activités officielles UiPath
- Blog
- Comment les machines apprennent à comprendre les mots : guide d'intégration dans NLP
- Apprentissage basé sur des invites avec des Transformers
- Efficient Transformers II : Dilarisation des connaissances et affinement
- Transformateurs efficaces I : mécanismes d'attention
- Modélisation de l'intention hiérarchique profonde non supervisée : obtenir de la valeur sans données d'entraînement
- Correction du biais d'annotation avec Communications Mining
- Apprentissage actif : de meilleurs modèles d'ML en moins de temps
- Tout est dans les chiffres : évaluer les performances du modèle avec des métriques
- Pourquoi la validation du modèle est importante
- Comparaison de Communications Mining et de Google AutoML pour l'intelligence des données conversationnelles
Vue d'ensemble (Overview)
Important :
Ce contenu a été traduit à l'aide d'une traduction automatique.
Guide du développeur Communications Mining
Dernière mise à jour 20 déc. 2024
Vue d'ensemble (Overview)
Cette section donne un aperçu des concepts de plate-forme de base.
Pour en savoir plus sur la plate-forme du point de vue de l'utilisateur final, consultez notre Guide de l'utilisateur de Communications Mining.
Concept | DESCRIPTION | Exemple |
---|---|---|
Source | Dans Communications Mining, les données sont organisées en sources de données ou en sources. Généralement, une source correspond à un canal. Une boîte aux lettres, les résultats d'une enquête ou un ensemble d'avis de clients sont tous des exemples de données pouvant être chargées sur Communications Mining en tant que source de données. Plusieurs sources peuvent être combinées pour créer un modèle. Il est donc préférable de rester du côté de plusieurs sources plutôt que d'une seule source monobloc. | Le diagramme présente les données des e-mails (Source A qui contient des e-mails individuels) et les données des avis des clients (Sources B et C qui contiennent des avis de clients individuels). Les données des avis des clients sont divisées en deux sources selon l'origine des données, mais seront combinées en un seul ensemble de données dans le but de créer un modèle commun. |
Commentaire (Comment) | Dans les sources, chaque élément de communication textuelle est représenté par un commentaire. Un commentaire aura toujours un ID, un horodatage, un corps de texte et des champs supplémentaires selon le type de données qu'il représente. Par exemple, les e-mails comporteront les champs d'e-mail attendus tels que « de », « à », « cc », etc. | Le diagramme montre comment les champs de commentaires disponibles sont utilisés par les différents types de commentaires. Par exemple, dans un commentaire d'e-mail, le champ « De » contient l'adresse de l'expéditeur, tandis que dans un commentaire d'avis de client, il contient l'auteur de l'avis. Les champs de métadonnées (affichés en bas de chaque commentaire) sont définis par l'utilisateur. Notez comment nous utilisons le même ensemble de champs pour les deux sources d'avis clients : puisque nous voulons les combiner en un seul ensemble de données, les données doivent être cohérentes afin d'assurer de bonnes performances du modèle. |
Jeu de données | Un jeu de données vous permet d'annoter une ou plusieurs sources afin de construire un modèle. Une source peut être incluse dans plusieurs jeux de données. L'ensemble de tous les libellés dans un ensemble de données est appelé taxonomie. | Le diagramme présente deux ensembles de données reposant sur les données de la boîte aux lettres d'assistance, et un ensemble de données combinant les données d'avis des clients. Notez que même si Dataset 1 et Dataset 2 sont basés sur les mêmes données, leur taxonomie de libellé est différente, car leurs cas d'utilisation (analyses et automatisation) nécessitent des ensembles de libellés différents. |
Modèle | Le modèle est continuellement mis à jour à mesure que les utilisateurs annotent davantage de données. Pour recevoir des prédictions cohérentes, un numéro de version de modèle doit être spécifié lors de l'interrogation du modèle. | |
Label | Les libellés sont appliqués lors de l'entraînement d'un modèle et sont renvoyés lors de l'interrogation du modèle pour les prédictions. Lorsque les libellés sont renvoyés en tant que prédictions, ils ont un score de confiance associé qui indique la probabilité pour que le modèle suppose que la prédiction s'applique. Pour convertir la prédiction en une réponse « Oui/Non », le score de confiance doit être vérifié par rapport à un seuil, qui est choisi pour représenter un compromis précision/rappel approprié. | Les libellés sont attribués par les utilisateurs de Communications Mining lors de l'entraînement du modèle. L'interface utilisateur de Communications Mining aide l'utilisateur à annoter les commentaires les plus pertinents, à s'assurer que les libellés sont appliqués de manière cohérente et qu'un nombre suffisant de commentaires sont annotés pour produire un modèle performant. |