- Documents d’API
- CLI
- Guides d'intégration
- Intégration avec l'utilisateur du service Azure
- Intégration avec l'authentification d'application Azure
- Automatisation en temps réel
- Récupérer des données pour Tableau avec Python
- Intégration d'Elasticsearch
- Intégration EWS auto-hébergée
- Infrastructure d'automatisation UiPath
- Activités UiPath Marketplace
- Activités officielles UiPath
- Blog
- Comment les machines apprennent à comprendre les mots : guide d'intégration dans NLP
- Apprentissage basé sur des invites avec des Transformers
- Efficient Transformers II : Dilarisation des connaissances et affinement
- Transformateurs efficaces I : mécanismes d'attention
- Modélisation de l'intention hiérarchique profonde non supervisée : obtenir de la valeur sans données d'entraînement
- Correction du biais d'annotation avec Communications Mining
- Apprentissage actif : de meilleurs modèles d'ML en moins de temps
- Tout est dans les chiffres : évaluer les performances du modèle avec des métriques
- Pourquoi la validation du modèle est importante
- Comparaison de Communications Mining et de Google AutoML pour l'intelligence des données conversationnelles
Commentaires
comments
, tandis que le guide de l'utilisateur et l'interface utilisateur de Communications Mining font principalement référence à messages
.
comments
pour les préparer avant leur chargement et comment comprendre les données extraites de Communications Mining.
La section Vue d'ensemble (Overview) décrit la structure globale d'un objet de commentaire. Si vous souhaitez charger des données vers Communications Mining via l'API ou pour comprendre comment traiter les données téléchargées vers Communications Mining via l'API, consultez la section Commentaires créés via l'API (Comments created via the API ). Vous pouvez trouver des descriptions détaillées pour chacun des types de commentaires couramment utilisés (e-mails ou tickets d’assistance). Si vous voulez mieux comprendre comment traiter les données téléchargées à Communications Mining via une intégration, consultez la section Commentaires créés par les intégrations . Enfin, pour obtenir la liste complète des champs d'objet commentaire disponibles, consultez la section Référence .
Communications Mining fonctionne avec différents types de données textuelles tels que les e-mails, les réponses aux enquêtes, les tickets d’assistance ou les avis des clients. Ce point de terminaison a en commun le fait que ces types de données constituent des unités de communication (un e-mail, une réponse à une enquête, un ticket d’assistance, un avis client). Dans Communications Mining, un seul message est représenté par un commentaire, par exemple.
Quel que soit le type d'unité de communication symbole par un commentaire, il conserve systématiquement cette structure fondamentales :
{
"id": <UNIQUE ID>,
"timestamp": <TIMESTAMP>,
"messages": [
{
"body": { "text": <TEXT> },
...
}
],
"user_properties": { ... },
}
{
"id": <UNIQUE ID>,
"timestamp": <TIMESTAMP>,
"messages": [
{
"body": { "text": <TEXT> },
...
}
],
"user_properties": { ... },
}
Comme indiqué dans l'extrait de code ci-dessus, en plus du texte réel, un commentaire possède toujours un ID et un horodatage. L'ID doit être unique dans la source contenant le message. L'horodatage est utilisé dans l'interface utilisateur de la plate-forme pour filtrer et trier par date, et pour générer des analyses basées sur la date.
En plus de ces champs obligatoires, d'autres champs doivent être définis en fonction du type de commentaire. Si vos données ont été téléchargées dans Communications Mining via une intégration, Communications Mining remplit automatiquement tous les champs nécessaires. Consultez les sections suivantes pour une description plus détaillée.
Emails
sync-raw-emails
pour les e-mails bruts et le point de terminaison sync
pour les e-mails traités.
Lors de la synchronisation des e-mails bruts, fournissez les en-têtes d'e-mail MIME extraits et le corps de l'e-mail tel quel (consultez la référence pour obtenir une description du format d'e-mail brut). Communications Mining analyse les en-têtes et nettoyage le corps de l'e-mail.
Comment Communications Mining traite-t-il les e-mails bruts ?
- Définit les champs spécifiques aux e-mails dans l'objet de message
messages[0]
- Définit le champ
thread_id
et l'objetthread_properties
- Nettoyer le corps de l'e-mail en supprimant les e-mails entre guillemets et en plaçant la signature dans un champ
signature
séparé - Remplit l'objet
user_properties
avec des métadonnées extraites des en-têtes d'e-mail.
BCC:
.
Si vous enrichissez les e-mails avec d'autres données avant le téléchargement dans Communications Mining, vous pouvez indiquer ces données supplémentaires dans les propriétés utilisateur du commentaire.
{
"raw_email": {
"body": {
"plain": "Hi Bob,\n\nCould you send me the figures for today?\n\nThanks,\nAlice"
},
"headers": {
"raw": "From: Alice Smith <alice@example.com>\nDate: Tue, 3 Aug 2021 10:57:42 +0100\nMessage-ID: <e7784b5b@mail.example.com>\nSubject: Figures for today\nTo: Bob <bob@company.com>\nCc: Joe <joe@company.com>"
}
},
"user_properties": {
"string:Team": "Team XYZ"
}
}
{
"raw_email": {
"body": {
"plain": "Hi Bob,\n\nCould you send me the figures for today?\n\nThanks,\nAlice"
},
"headers": {
"raw": "From: Alice Smith <alice@example.com>\nDate: Tue, 3 Aug 2021 10:57:42 +0100\nMessage-ID: <e7784b5b@mail.example.com>\nSubject: Figures for today\nTo: Bob <bob@company.com>\nCc: Joe <joe@company.com>"
}
},
"user_properties": {
"string:Team": "Team XYZ"
}
}
{
"comment": {
"id": "3c6537373834623562406d61696c2e6578616d706c652e636f6d3e",
"timestamp": "2021-08-03T09:57:42Z",
"user_properties": {
"string:Has Signature": "Yes",
"string:Sender": "alice@example.com",
"string:Thread": "<e7784b5b@mail.example.com>",
"string:Message ID": "<e7784b5b@mail.example.com>",
"number:Recipient Count": 2,
"number:Participant Count": 3,
"number:Position in Thread": 1,
"string:Sender Domain": "example.com",
"string:Team": "Team XYZ"
},
"messages": [
{
"body": {
"text": "Hi Bob,\n\nCould you send me the figures for today?"
},
"signature": {
"text": "Thanks,\nAlice"
},
"subject": {
"text": "Figures for today"
},
"to": ["\"Bob\" <bob@company.com>"],
"cc": ["\"Joe\" <joe@company.com>"],
"sent_at": "2021-08-03T09:57:42Z",
"from": "\"Alice Smith\" <alice@example.com>"
}
],
"thread_id": "3c6537373834623562406d61696c2e6578616d706c652e636f6d3e"
},
"thread_properties": {
"duration": null,
"response_time": null,
"num_messages": 1,
"num_participants": 3,
"first_sender": "alice@example.com",
"thread_position": 0
}
}
{
"comment": {
"id": "3c6537373834623562406d61696c2e6578616d706c652e636f6d3e",
"timestamp": "2021-08-03T09:57:42Z",
"user_properties": {
"string:Has Signature": "Yes",
"string:Sender": "alice@example.com",
"string:Thread": "<e7784b5b@mail.example.com>",
"string:Message ID": "<e7784b5b@mail.example.com>",
"number:Recipient Count": 2,
"number:Participant Count": 3,
"number:Position in Thread": 1,
"string:Sender Domain": "example.com",
"string:Team": "Team XYZ"
},
"messages": [
{
"body": {
"text": "Hi Bob,\n\nCould you send me the figures for today?"
},
"signature": {
"text": "Thanks,\nAlice"
},
"subject": {
"text": "Figures for today"
},
"to": ["\"Bob\" <bob@company.com>"],
"cc": ["\"Joe\" <joe@company.com>"],
"sent_at": "2021-08-03T09:57:42Z",
"from": "\"Alice Smith\" <alice@example.com>"
}
],
"thread_id": "3c6537373834623562406d61696c2e6578616d706c652e636f6d3e"
},
"thread_properties": {
"duration": null,
"response_time": null,
"num_messages": 1,
"num_participants": 3,
"first_sender": "alice@example.com",
"thread_position": 0
}
}
Propriétés du thread
Les propriétés de thread suivantes sont disponibles.
Nom | DESCRIPTION |
---|---|
thread_position | Position du commentaire dans le fil de discussion, calculée en triant le commentaire par timestamp . Commence à 0 .
|
num_messages | Nombre de commentaires dans le fil de discussion. |
num_participants | Nombre total de participants uniques (De (From), À (To), Cc, Cci) dans le fil de discussion. |
first_sender | Expéditeur du premier commentaire du fil de discussion. |
duration | Différence (en secondes) entre le timestamps du premier et dernier commentaire du fil de discussion. Sera défini sur null si num_messages est de 1 (c'est-à-dire le fil de discussion ne contient qu'un seul commentaire). Remarque : le
timestamp d'un commentaire correspond au champ sent_at de l'e-mail brut correspondant.
|
response_time | Différence (en secondes) entre le premier commentaire du fil de discussion et la première réponse du fil de discussion. La première réponse du fil de discussion est le commentaire le plus ancien dont l'expéditeur n'est pas first_sender . Sera défini sur null s'il n'y a pas de réponses dans le fil de discussion (c'est-à-dire si tous les e-mails du fil de discussion proviennent du même expéditeur).
|
Chaque fois qu'un nouveau commentaire est ajouté à la plate-forme, les propriétés de fil de discussion du fil de discussion correspondant sont mises à jour.
thread_position
, toutes les propriétés sont les mêmes pour chaque commentaire du fil de discussion.
En plus du texte principal, un ticket d'assistance standard soumis via un formulaire peut comporter un objet, des informations sur l'expéditeur (telles que le nom ou l'adresse e-mail) et des données structurées supplémentaires (telles que la rubrique du ticket) qui peuvent être téléchargées dans le cadre des propriétés utilisateur du commentaire.
{
"id": "dbcb03ad",
"timestamp": "2020-02-26T16:09:00Z",
"messages": [
{
"body": {
"text": "Hi Support Team\n\nPlease could you look into my broadband service network status. I don't have any signal."
},
"subject": {
"text": "Network Outage for over 24 hours - Customer account number 1234567"
},
"from": "alice.smith@example.com"
}
],
"user_properties": {
"string:Customer Name": "Alice Smith",
"string:Source": "Support Form",
"string:Topic": "Broadband"
}
}
{
"id": "dbcb03ad",
"timestamp": "2020-02-26T16:09:00Z",
"messages": [
{
"body": {
"text": "Hi Support Team\n\nPlease could you look into my broadband service network status. I don't have any signal."
},
"subject": {
"text": "Network Outage for over 24 hours - Customer account number 1234567"
},
"from": "alice.smith@example.com"
}
],
"user_properties": {
"string:Customer Name": "Alice Smith",
"string:Source": "Support Form",
"string:Topic": "Broadband"
}
}
E-mails (Microsoft Exchange)
Les e-mails Microsoft Exchange ingérés dans Communications Mining via l' intégration Exchange sont automatiquement convertis en objets de commentaire de la même manière que les e- mails bruts.
attachments
contient des métadonnées à leur sujet :```json
{
"id": "3c484531505230324d423",
"attachments": [
{
"name": "account-statement.pdf",
"size": 49078,
"content_type": "application/pdf",
}
],
// other comment fields omitted
...
},
```
```json
{
"id": "3c484531505230324d423",
"attachments": [
{
"name": "account-statement.pdf",
"size": 49078,
"content_type": "application/pdf",
}
],
// other comment fields omitted
...
},
```
attachment_reference
:
```json
{
"id": "3c484531505230324d423",
"attachments": [
{
"name": "account-statement.pdf",
"size": 49078,
"content_type": "application/pdf",
"attachment_reference": "CjQSEIExTHEqtdntoxz2WtbZDNEiIIVqcP1Sfx2L4epyRQDasa1RSODvheQ3bvLhj3L-_81G"
}
],
// other comment fields omitted
...
},
```
```json
{
"id": "3c484531505230324d423",
"attachments": [
{
"name": "account-statement.pdf",
"size": 49078,
"content_type": "application/pdf",
"attachment_reference": "CjQSEIExTHEqtdntoxz2WtbZDNEiIIVqcP1Sfx2L4epyRQDasa1RSODvheQ3bvLhj3L-_81G"
}
],
// other comment fields omitted
...
},
```
attachment_reference
pour récupérer le contenu du fichier binaire depuis [l'API des pièces jointes](#FixME). Pour l’exemple ci-dessus, vous récupérez l’URL suivante : https://cloud.uipath.com/<organisation>/<tenant>/reinfer_/api/v1/attachments/CjQSEIExTHEqtdntboxz2WtbZDNEiIIVqcP1Sfx2L4epyQDas1RSODvheQ3bvLhj3L-_81G.
Consultez le [Référence d'API](#Fixme) pour plus de détails sur ce type de requête.
attachment_reference
, vous ne pouvez pas télécharger le contenu de la pièce jointe. Cela peut être dû à la raison suivante :
- Communications Mining n'a pas reçu le contenu de la pièce jointe.
- Le contenu de la pièce jointe dépassait la limite de taille pour le téléchargement vers Communications Mining.
- Communications Mining a traité la pièce jointe avant de prendre en charge le contenu des fichiers.
En savoir plus sur le contenu de la pièce jointe sur la page Pièce jointe (Attachment).
Commentaires
Consultez le tableau ci-dessous pour découvrir une liste des champs de commentaires disponibles. Si vous n'êtes pas familiarisé avec les objets de commentaire de Communications Mining, consultez la Vue d'ensemble ( Overview).
Nom | Saisie de texte | Requis | DESCRIPTION |
---|---|---|---|
id | string | oui | Identifie un commentaire de manière unique dans une source. Toute chaîne hexadécimale ne dépassant pas 1024 caractères est valide (est conforme à /[0-9a-f]{1,1024}/). |
timestamp | string | oui | Un horodatage ISO-8601 indiquant quand le commentaire a été créé. Si l'horodatage ne spécifie pas de fuseau horaire, UTC sera utilisé. L'horodatage doit être compris entre 1950-01-01T00:00:00Z et 2049-12-31T23:59:59Z inclus. |
messages | array<Message> | oui | Tableau de zéro ou un message. |
user_properties | map<string, string | number> | non | Toutes les métadonnées définies par l'utilisateur qui s'appliquent au commentaire. Il existe deux types possibles : string et number . La clé d'une propriété utilisateur a le format « type:name », par ex. : "string:Domain Name" ou "number:Star Rating". Le nom de la propriété utilisateur peut être composé de lettres, de chiffres, d'espaces et de traits de soulignement, et peut contenir jusqu'à 32 caractères (est conforme à /\w([\w ]{0,30}\w)?/). La valeur doit être une chaîne ou un nombre selon le type de propriété utilisateur.
|
thread_id | string | non | Un ID identifiant de manière unique un fil de discussion. Toute chaîne hexadécimale ne dépassant pas 1024 caractères est valide (est conforme à /[0-9a-f]{1,1024}/). |
uid | string | défini par Communications Mining | Une source et un ID de commentaire combinés sous la forme de source_id.comment_id . Vous ne devez pas définir ce champ directement car il est automatiquement généré par Communications Mining pour les commentaires téléchargés.
|
created_at | string | défini par Communications Mining | Un horodatage ISO-8601 avec les mêmes contraintes que le champ timestamp . Vous ne devez pas définir ce champ directement car il est automatiquement généré par Communications Mining lors de la création du commentaire.
|
updated_at | string | défini par Communications Mining | Un horodatage ISO-8601 avec les mêmes contraintes que le champ timestamp . Vous ne devez pas définir ce champ directement car il est automatiquement généré par Communications Mining lorsque le commentaire est mis à jour.
|
attachments | array<Attachment> | non | Tableau de zéro ou plusieurs pièces jointes. Une pièce jointe représente un fichier joint à un commentaire. |
Nom | Saisie de texte | Requis | DESCRIPTION |
---|---|---|---|
name | string | oui | Nom de fichier de la pièce jointe. |
size | Numérique | oui | La tailler du contenu du fichier de la pièce jointe en octets. |
content_type | string | oui | Le [Type de média](https://en.wikipedia.org/wiki/Media_type) de la pièce jointe. Pour obtenir une liste des valeurs possibles, consultez la liste des [Types de médias IANA](https://www.ana.org/assignments/media-types/media-types.xhtml). |
attachment_reference | string | non | Utilisé pour récupérer le contenu du fichier binaire depuis [l'API de pièces jointes](#FixME) |
Message
a le format suivant :
Nom | Saisie de texte | Requis | DESCRIPTION |
---|---|---|---|
body | Contenu (Content) | oui | Objet contenant le corps du texte principal du message. |
subject | Contenu (Content) | non | Objet contenant l'objet du message. |
signature | Contenu (Content) | non | Objet contenant la signature du message. |
from | string | non | L'expéditeur du message. |
to | array<string> | non | Tableau des destinataires principaux. |
cc | array<string> | non | Un tableau de destinataires en copie carbone. |
bcc | array<string> | non | Tableau de destinataires en copie carbone invisible. |
sent_at | string | non | Un horodatage ISO-8601 indiquant quand le message a été créé. Si l'horodatage ne spécifie pas de fuseau horaire, UTC sera utilisé. |
language | string | non | La langue d'origine du message. Dans ce cas, text et translated_from doivent être fournis pour les champs Contenu (Content) .
|
Content
a le format suivant :
Nom | Saisie de texte | Requis | DESCRIPTION |
---|---|---|---|
text | string | oui | Si language (autre que le language de la source) a été fourni, il doit s'agir du texte traduit du contenu. Sinon, elle doit être dans la langue originale où elle a été collectée. il sera traduit s'il n'est pas dans le language de la source et la source a should_translate défini sur true . 65 536 caractères maximum.
|
translated_from | string | non | Si language (autre que le language de la source) a été fourni, cela doit être par le texte original du contenu. Enregistrer ce champ sans avoir fourni de language entraînera une erreur. 65 536 caractères maximum.
|
E-mails bruts
Voir le tableau ci-dessous pour une liste des champs d'e-mail bruts disponibles.
Nom | Saisie de texte | Requis | DESCRIPTION |
---|---|---|---|
headers | En-têtes | oui | Objet contenant les en-têtes de l'e-mail. |
body | Corps | oui | Objet contenant le corps principal de l'e-mail. |
Headers
a le format suivant :
Nom | Saisie de texte | Requis | DESCRIPTION |
---|---|---|---|
raw | string | non | L'un des raw et parsed est requis. Les en-têtes d'e-mail bruts, fournis sous la forme d'une chaîne unique, avec chaque en-tête sur sa propre ligne.
|
parsed | map<string, string |<string>tableau<chaîne>> | non |
L'un des
raw et parsed est requis. Les en-têtes d’e-mail analysés, donnés en tant qu’objet avec des clés de chaîne et des valeurs de chaîne ou de tableau<string> .
Chaque clé doit être ASCII et représenter un en-tête d'e-mail. Les chaînes de valeur peuvent être n'importe quel UTF-8 valide. Les listes de valeurs seront concaténées avec
, avant d'être définies comme une valeur d'en-tête unique. Si vous avez besoin de clés d'en-tête en double, veuillez utiliser raw à la place.
|
Body
a le format suivant :
Nom | Saisie de texte | Requis | DESCRIPTION |
---|---|---|---|
plain | string | non | Au moins une des plain et html est requise. Le contenu en texte brut de l'e-mail. 65 536 caractères maximum.
|
html | string | non | Au moins une des plain et html est requise. Le contenu HTML de l'e-mail.
|