- Introduction
- Configuration de votre compte
- Équilibre
- Clusters
- Dérive de concept
- Couverture
- Jeux de données
- Champs généraux
- Libellés (prédictions, niveaux de confiance, hiérarchie des libellés et sentiment des libellés)
- Modèles
- Flux
- Évaluation du modèle
- Projets
- Précision
- Rappel
- Messages annotés et non annotés
- Extraction des champs
- Sources
- Taxonomies
- Apprentissage
- Prédictions positives et négatives vraies et fausses
- Validation
- Messages
- Contrôle et administration de l'accès
- Gérer les sources et les jeux de données
- Comprendre la structure des données et les autorisations
- Créer ou supprimer une source de données dans l'interface graphique
- Téléchargement d’un fichier CSV dans une source
- Préparation des données en vue du téléchargement du fichier .CSV
- Création d'un ensemble de données
- Sources et jeux de données multilingues
- Activation des sentiments sur un ensemble de données
- Modification des paramètres du jeu de données
- Supprimer un message
- Supprimer un jeu de données
- Exporter un ensemble de données
- Utilisation d'intégrations Exchange
- Entraînement et maintenance du modèle
- Comprendre les libellés, les champs généraux et les métadonnées
- Hiérarchie de libellés et meilleures pratiques
- Comparer les cas d’utilisation des analyses et des automatisations
- Transformer vos objectifs en libellés
- Présentation du processus d'entraînement du modèle
- Annotation générative
- Statut du jeu de données
- Entraînement des modèles et annotation des meilleures pratiques
- Entraînement avec l'analyse des sentiments des libellés activée
- Entraînement des données de chat et d'appels
- Comprendre les exigences de données
- Entraîner
- Vue d'ensemble (Overview)
- Examen des prédictions de libellé
- Entraînement à l'aide de la classification par glisser-déposer
- Entraînement à l'aide de l'option Enseigner le libellé (Explore)
- Entraînement à l'aide d'une confiance faible
- Entraînement à l'aide de la recherche (Explorer)
- Affiner et réorganiser votre taxonomie
- Introduction à affiner
- Précision et rappel expliqués
- Précision et rappel
- Comment fonctionne la validation
- Comprendre et améliorer les performances du modèle
- Raisons de la faible précision moyenne des libellés
- Entraînement à l'aide du libellé Vérifier (Check label) et du libellé Manqué (Missed Label)
- Entraînement à l'aide du libellé En savoir plus (Affiner)
- Entraînement à l'aide de la recherche (affiner)
- Comprendre et augmenter la couverture
- Amélioration de l'équilibre et utilisation du rééquilibrage
- Quand arrêter l'entraînement de votre modèle
- Utilisation de champs généraux
- Extraction générative
- Vue d'ensemble (Overview)
- Configurer des champs
- Filtrage par type de champ d’extraction
- Génération de vos extractions
- Validation et annotation des extractions générées
- Meilleures pratiques et considérations
- Comprendre la validation des extractions et des performances d'extraction
- Questions fréquemment posées (FAQ)
- Utilisation des analyses et de la surveillance
- Automations et Communications Mining™
- Développeur
- Charger des données
- Téléchargement de données
- Intégration avec l'utilisateur du service Azure
- Intégration avec l'authentification d'application Azure
- Intégration d’Exchange avec l’authentification et le graphique d’application Azure
- Récupérer des données pour Tableau avec Python
- Intégration d'Elasticsearch
- Extraction de champ général
- Intégration avec Exchange auto-hébergée
- Infrastructure d’automatisation UiPath®
- Activités officielles UiPath®
- Comment les machines apprennent à comprendre les mots : guide d'intégration dans NLP
- Apprentissage basé sur des invites avec des Transformers
- Efficient Transformers II : Dilarisation des connaissances et affinement
- Transformateurs efficaces I : mécanismes d'attention
- Modélisation de l'intention hiérarchique profonde non supervisée : obtenir de la valeur sans données d'entraînement
- Correction des biais d’annotation avec Communications Mining™
- Apprentissage actif : de meilleurs modèles d'ML en moins de temps
- Tout est dans les chiffres : évaluer les performances du modèle avec des métriques
- Pourquoi la validation du modèle est importante
- Comparaison de Communications Mining™ et de Google AutoML pour l’information sur des données conversationnelles
- Licences
- FAQ et plus encore

Guide de l’utilisateur de Communications Mining
comments
, tandis que le guide de l'utilisateur et l'interface utilisateur de Communications Mining font principalement référence à messages
.
comments
pour les préparer avant leur chargement et comment comprendre les données extraites de Communications Mining.
La section Aperçu décrit la structure globale d'un objet de commentaire. Si vous souhaitez télécharger des données vers Communications Mining™ via l’API ou savoir comment traiter les données téléchargées vers Communications Mining via l’API, consultez la section Commentaires créés via l’API . Vous pouvez trouver des descriptions détaillées pour chacun des types de commentaires les plus utilisés (e-mails ou tickets d'assistance). Si vous souhaitez mieux comprendre comment traiter les données téléchargées dans Communications Mining via une intégration, consultez la section Commentaires créés par les intégrations . Enfin, pour obtenir la liste complète des champs d’objet de commentaires disponibles, consultez la section Référence .
Communications Mining™ fonctionne avec différents types de données textuelles tels que les e-mails, les réponses aux enquêtes, les tickets d’assistance ou les avis des clients. Ces types de données ont en commun le fait qu’ils se composent tous d’unités de communication (un e-mail, une réponse à une enquête, un ticket d’assistance, un avis d’un client). Dans Communications Mining, un seul message est représenté par un commentaire, par exemple.
Quel que soit le type d'unité de communication symbole par un commentaire, il conserve systématiquement cette structure fondamentales :
{
"id": <UNIQUE ID>,
"timestamp": <TIMESTAMP>,
"messages": [
{
"body": { "text": <TEXT> },
...
}
],
"user_properties": { ... },
}
{
"id": <UNIQUE ID>,
"timestamp": <TIMESTAMP>,
"messages": [
{
"body": { "text": <TEXT> },
...
}
],
"user_properties": { ... },
}
As shown in the previous code snippet, in addition to the actual piece of text, a comment always has an ID and a timestamp. The ID needs to be unique within the containing the message. The timestamp is used in the platform UI to filter and sort by date, and to generate date-based analytics.
En plus de ces champs obligatoires, d’autres champs doivent être définis en fonction du type de commentaire. Si vos données ont été téléchargées vers Communications Mining™ via une intégration, Communications Mining remplit automatiquement tous les champs nécessaires. Consultez les sections suivantes pour une description plus détaillée.
Emails
sync-raw-emails
pour les e-mails bruts et le point de terminaison sync
pour les e-mails traités.
Lors de la synchronisation des e-mails bruts, fournissez les en-têtes d'e-mail MIME extraits et le corps de l'e-mail tel quel (consultez la référence pour obtenir une description du format d'e-mail brut). Communications Mining analyse les en-têtes et nettoyage le corps de l'e-mail.
Comment Communications Mining traite-t-il les e-mails bruts ?
- Définit les champs spécifiques aux e-mails dans l'objet de message
messages[0]
- Définit le champ
thread_id
et l'objetthread_properties
- Nettoyer le corps de l'e-mail en supprimant les e-mails entre guillemets et en plaçant la signature dans un champ
signature
séparé - Remplit l'objet
user_properties
avec des métadonnées extraites des en-têtes d'e-mail.
BCC:
.
Si vous enrichissez les e-mails avec d'autres données avant le téléchargement dans Communications Mining, vous pouvez indiquer ces données supplémentaires dans les propriétés utilisateur du commentaire.
{
"raw_email": {
"body": {
"plain": "Hi Bob,\n\nCould you send me the figures for today?\n\nThanks,\nAlice"
},
"headers": {
"raw": "From: Alice Smith <alice@example.com>\nDate: Tue, 3 Aug 2021 10:57:42 +0100\nMessage-ID: <e7784b5b@mail.example.com>\nSubject: Figures for today\nTo: Bob <bob@company.com>\nCc: Joe <joe@company.com>"
}
},
"user_properties": {
"string:Team": "Team XYZ"
}
}
{
"raw_email": {
"body": {
"plain": "Hi Bob,\n\nCould you send me the figures for today?\n\nThanks,\nAlice"
},
"headers": {
"raw": "From: Alice Smith <alice@example.com>\nDate: Tue, 3 Aug 2021 10:57:42 +0100\nMessage-ID: <e7784b5b@mail.example.com>\nSubject: Figures for today\nTo: Bob <bob@company.com>\nCc: Joe <joe@company.com>"
}
},
"user_properties": {
"string:Team": "Team XYZ"
}
}
{
"comment": {
"id": "3c6537373834623562406d61696c2e6578616d706c652e636f6d3e",
"timestamp": "2021-08-03T09:57:42Z",
"user_properties": {
"string:Has Signature": "Yes",
"string:Sender": "alice@example.com",
"string:Thread": "<e7784b5b@mail.example.com>",
"string:Message ID": "<e7784b5b@mail.example.com>",
"number:Recipient Count": 2,
"number:Participant Count": 3,
"number:Position in Thread": 1,
"string:Sender Domain": "example.com",
"string:Team": "Team XYZ"
},
"messages": [
{
"body": {
"text": "Hi Bob,\n\nCould you send me the figures for today?"
},
"signature": {
"text": "Thanks,\nAlice"
},
"subject": {
"text": "Figures for today"
},
"to": ["\"Bob\" <bob@company.com>"],
"cc": ["\"Joe\" <joe@company.com>"],
"sent_at": "2021-08-03T09:57:42Z",
"from": "\"Alice Smith\" <alice@example.com>"
}
],
"thread_id": "3c6537373834623562406d61696c2e6578616d706c652e636f6d3e"
},
"thread_properties": {
"duration": null,
"response_time": null,
"num_messages": 1,
"num_participants": 3,
"first_sender": "alice@example.com",
"thread_position": 0
}
}
{
"comment": {
"id": "3c6537373834623562406d61696c2e6578616d706c652e636f6d3e",
"timestamp": "2021-08-03T09:57:42Z",
"user_properties": {
"string:Has Signature": "Yes",
"string:Sender": "alice@example.com",
"string:Thread": "<e7784b5b@mail.example.com>",
"string:Message ID": "<e7784b5b@mail.example.com>",
"number:Recipient Count": 2,
"number:Participant Count": 3,
"number:Position in Thread": 1,
"string:Sender Domain": "example.com",
"string:Team": "Team XYZ"
},
"messages": [
{
"body": {
"text": "Hi Bob,\n\nCould you send me the figures for today?"
},
"signature": {
"text": "Thanks,\nAlice"
},
"subject": {
"text": "Figures for today"
},
"to": ["\"Bob\" <bob@company.com>"],
"cc": ["\"Joe\" <joe@company.com>"],
"sent_at": "2021-08-03T09:57:42Z",
"from": "\"Alice Smith\" <alice@example.com>"
}
],
"thread_id": "3c6537373834623562406d61696c2e6578616d706c652e636f6d3e"
},
"thread_properties": {
"duration": null,
"response_time": null,
"num_messages": 1,
"num_participants": 3,
"first_sender": "alice@example.com",
"thread_position": 0
}
}
Propriétés du thread
Les propriétés de thread suivantes sont disponibles.
Nom | DESCRIPTION |
---|---|
thread_position | Position du commentaire dans le fil de discussion, calculée en triant le commentaire par timestamp . Commence à 0 .
|
num_messages | Nombre de commentaires dans le fil de discussion. |
num_participants | Nombre total de participants uniques (De (From), À (To), Cc, Cci) dans le fil de discussion. |
first_sender | Expéditeur du premier commentaire du fil de discussion. |
duration | Différence (en secondes) entre le timestamps du premier et dernier commentaire du fil de discussion. Sera défini sur null si num_messages est de 1 (c'est-à-dire le fil de discussion ne contient qu'un seul commentaire). Remarque : le
timestamp d'un commentaire correspond au champ sent_at de l'e-mail brut correspondant.
|
response_time | Différence (en secondes) entre le premier commentaire du fil de discussion et la première réponse du fil de discussion. La première réponse du fil de discussion est le commentaire le plus ancien dont l'expéditeur n'est pas first_sender . Sera défini sur null s'il n'y a pas de réponses dans le fil de discussion (c'est-à-dire si tous les e-mails du fil de discussion proviennent du même expéditeur).
|
Chaque fois qu'un nouveau commentaire est ajouté à la plate-forme, les propriétés de fil de discussion du fil de discussion correspondant sont mises à jour.
thread_position
, toutes les propriétés sont les mêmes pour chaque commentaire du fil de discussion.
En plus du texte principal, un ticket d'assistance standard soumis via un formulaire peut comporter un objet, des informations sur l'expéditeur (telles que le nom ou l'adresse e-mail) et des données structurées supplémentaires (telles que la rubrique du ticket) qui peuvent être téléchargées dans le cadre des propriétés utilisateur du commentaire.
{
"id": "dbcb03ad",
"timestamp": "2020-02-26T16:09:00Z",
"messages": [
{
"body": {
"text": "Hi Support Team\n\nPlease could you look into my broadband service network status. I don't have any signal."
},
"subject": {
"text": "Network Outage for over 24 hours - Customer account number 1234567"
},
"from": "alice.smith@example.com"
}
],
"user_properties": {
"string:Customer Name": "Alice Smith",
"string:Source": "Support Form",
"string:Topic": "Broadband"
}
}
{
"id": "dbcb03ad",
"timestamp": "2020-02-26T16:09:00Z",
"messages": [
{
"body": {
"text": "Hi Support Team\n\nPlease could you look into my broadband service network status. I don't have any signal."
},
"subject": {
"text": "Network Outage for over 24 hours - Customer account number 1234567"
},
"from": "alice.smith@example.com"
}
],
"user_properties": {
"string:Customer Name": "Alice Smith",
"string:Source": "Support Form",
"string:Topic": "Broadband"
}
}
E-mails (Microsoft Exchange)
Les e-mails Microsoft Exchange ingérés dans Communications Mining via l' intégration Exchange sont automatiquement convertis en objets de commentaire de la même manière que les e- mails bruts.
attachments
contient des métadonnées à leur sujet :```json
{
"id": "3c484531505230324d423",
"attachments": [
{
"name": "account-statement.pdf",
"size": 49078,
"content_type": "application/pdf",
}
],
// other comment fields omitted
...
},
```
```json
{
"id": "3c484531505230324d423",
"attachments": [
{
"name": "account-statement.pdf",
"size": 49078,
"content_type": "application/pdf",
}
],
// other comment fields omitted
...
},
```
attachment_reference
:
```json
{
"id": "3c484531505230324d423",
"attachments": [
{
"name": "account-statement.pdf",
"size": 49078,
"content_type": "application/pdf",
"attachment_reference": "CjQSEIExTHEqtdntoxz2WtbZDNEiIIVqcP1Sfx2L4epyRQDasa1RSODvheQ3bvLhj3L-_81G"
}
],
// other comment fields omitted
...
},
```
```json
{
"id": "3c484531505230324d423",
"attachments": [
{
"name": "account-statement.pdf",
"size": 49078,
"content_type": "application/pdf",
"attachment_reference": "CjQSEIExTHEqtdntoxz2WtbZDNEiIIVqcP1Sfx2L4epyRQDasa1RSODvheQ3bvLhj3L-_81G"
}
],
// other comment fields omitted
...
},
```
attachment_reference
pour récupérer le contenu du fichier binaire à partir de [l'API de pièces jointes](#fixME). Pour l’exemple précédent, vous récupérez l’URL suivante : https://cloud.uipath.com/<organisation>/<tenant>/reinfer_/api/v1/attachments/CjQSE plusxQTdantxxxz2WtbZDformeIVqcP1Sfx2L4epyrigXDAS1RSODvheQ3bvLhj3L-_81G.
Consultez le [Référence d'API](#Fixme) pour plus de détails sur ce type de requête.
attachment_reference
, vous ne pouvez pas télécharger le contenu de la pièce jointe. Cela peut être dû à la raison suivante :
- Communications Mining™ n’a pas reçu le contenu de la pièce jointe.
- Le contenu de la pièce jointe dépassait la limite de taille pour le téléchargement vers Communications Mining.
- Communications Mining a traité la pièce jointe avant de prendre en charge le contenu des fichiers.
En savoir plus sur le contenu de la pièce jointe sur la page Pièce jointe (Attachment).
Commentaires
Consultez le tableau suivant pour découvrir une liste des champs de commentaires disponibles. Si vous n’êtes pas familiarisé avec les objets de commentaire de Communications Mining™, consultez la section Vue d’ensemble.
Nom | Saisie de texte | Requis | DESCRIPTION |
---|---|---|---|
id | string | oui | Identifie un commentaire de manière unique dans une source. Toute chaîne hexadécimale ne dépassant pas 1024 caractères est valide (est conforme à /[0-9a-f]{1,1024}/). |
timestamp | string | oui | Un horodatage ISO-8601 indiquant quand le commentaire a été créé. Si l'horodatage ne spécifie pas de fuseau horaire, UTC sera utilisé. L'horodatage doit être compris entre 1950-01-01T00:00:00Z et 2049-12-31T23:59:59Z inclus. |
messages | array<Message> | oui | Tableau de zéro ou un message. |
user_properties | map<string, string | number> | non | Toutes les métadonnées définies par l'utilisateur qui s'appliquent au commentaire. Il existe deux types possibles : string et number . La clé d'une propriété utilisateur a le format « type:name », par ex. : "string:Domain Name" ou "number:Star Rating". Le nom de la propriété utilisateur peut être composé de lettres, de chiffres, d'espaces et de traits de soulignement, et peut contenir jusqu'à 32 caractères (est conforme à /\w([\w ]{0,30}\w)?/). La valeur doit être une chaîne ou un nombre selon le type de propriété utilisateur.
|
thread_id | string | non | Un ID identifiant de manière unique un fil de discussion. Toute chaîne hexadécimale ne dépassant pas 1024 caractères est valide (est conforme à /[0-9a-f]{1,1024}/). |
uid | string | défini par Communications Mining™ | Une source et un ID de commentaire combinés sous la forme de source_id.comment_id . Vous ne devez pas définir ce champ directement car il est automatiquement généré par Communications Mining pour les commentaires téléchargés.
|
created_at | string | défini par Communications Mining | Un horodatage ISO-8601 avec les mêmes contraintes que le champ timestamp . Vous ne devez pas définir ce champ directement car il est automatiquement généré par Communications Mining lors de la création du commentaire.
|
updated_at | string | défini par Communications Mining | Un horodatage ISO-8601 avec les mêmes contraintes que le champ timestamp . Vous ne devez pas définir ce champ directement car il est automatiquement généré par Communications Mining lorsque le commentaire est mis à jour.
|
attachments | array<Attachment> | non | Tableau de zéro ou plusieurs pièces jointes. Une pièce jointe représente un fichier joint à un commentaire. |
Nom | Saisie de texte | Requis | DESCRIPTION |
---|---|---|---|
name | string | oui | Nom de fichier de la pièce jointe. |
size | Numérique | oui | La tailler du contenu du fichier de la pièce jointe en octets. |
content_type | string | oui | Le [type de média](https://en.wikipedia.org/wiki/API_type) de la pièce jointe. Pour obtenir une liste des valeurs possibles, consultez la liste [Types de médias IANA](https://www.ina.org/assignments/media-types/media-types.xhtml). |
attachment_reference | string | non | Utilisé pour récupérer le contenu du fichier binaire depuis [l'API de pièces jointes](#FixME) |
Message
a le format suivant :
Nom | Saisie de texte | Requis | DESCRIPTION |
---|---|---|---|
body | Contenu (Content) | oui | Objet contenant le corps du texte principal du message. |
subject | Contenu (Content) | non | Objet contenant l'objet du message. |
signature | Contenu (Content) | non | Objet contenant la signature du message. |
from | string | non | L'expéditeur du message. |
to | array<string> | non | Tableau des destinataires principaux. |
cc | array<string> | non | Un tableau de destinataires en copie carbone. |
bcc | array<string> | non | Tableau de destinataires en copie carbone invisible. |
sent_at | string | non | Un horodatage ISO-8601 indiquant quand le message a été créé. Si l'horodatage ne spécifie pas de fuseau horaire, UTC sera utilisé. |
language | string | non | La langue d'origine du message. Dans ce cas, text et translated_from doivent être fournis pour les champs Contenu (Content) .
|
Content
a le format suivant :
Nom | Saisie de texte | Requis | DESCRIPTION |
---|---|---|---|
text | string | oui | Si language (autre que le language de la source) a été fourni, il doit s'agir du texte traduit du contenu. Sinon, elle doit être dans la langue originale où elle a été collectée. il sera traduit s'il n'est pas dans le language de la source et la source a should_translate défini sur true . 65 536 caractères maximum.
|
translated_from | string | non | Si language (autre que le language de la source) a été fourni, cela doit être par le texte original du contenu. Enregistrer ce champ sans avoir fourni de language entraînera une erreur. 65 536 caractères maximum.
|
E-mails bruts
Consultez le tableau suivant pour obtenir une liste des champs d’e-mail bruts disponibles.
Nom | Saisie de texte | Requis | DESCRIPTION |
---|---|---|---|
headers | En-têtes | oui | Objet contenant les en-têtes de l'e-mail. |
body | Corps | oui | Objet contenant le corps principal de l'e-mail. |
Headers
a le format suivant :
Nom | Saisie de texte | Requis | DESCRIPTION |
---|---|---|---|
raw | string | non | L'un des raw et parsed est requis. Les en-têtes d'e-mail bruts, fournis sous la forme d'une chaîne unique, avec chaque en-tête sur sa propre ligne.
|
parsed | map<string, string |<string>tableau<chaîne>> | non |
L'un des
raw et parsed est requis. Les en-têtes d’e-mail analysés, donnés en tant qu’objet avec des clés de chaîne et des valeurs de chaîne ou de tableau<string> .
Chaque clé doit être ASCII et représenter un en-tête d'e-mail. Les chaînes de valeur peuvent être n'importe quel UTF-8 valide. Les listes de valeurs seront concaténées avec
, avant d'être définies comme une valeur d'en-tête unique. Si vous avez besoin de clés d'en-tête en double, veuillez utiliser raw à la place.
|
Body
a le format suivant :
Nom | Saisie de texte | Requis | DESCRIPTION |
---|---|---|---|
plain | string | non | Au moins une des plain et html est requise. Le contenu en texte brut de l'e-mail. 65 536 caractères maximum.
|
html | string | non | Au moins une des plain et html est requise. Le contenu HTML de l'e-mail.
|