- Einleitung
- Einrichten Ihres Kontos
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Allgemeine Felder
- Beschriftungen (Vorhersagen, Konfidenzniveaus, Beschriftungshierarchie und Beschriftungsstimmung)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Nachrichten mit und ohne Anmerkungen
- Extraktionsfelder
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Zugriffssteuerung und Administration
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Erstellen oder Löschen einer Datenquelle in der GUI
- Hochladen einer CSV-Datei in eine Quelle
- Vorbereiten von Daten für den CSV-Upload
- Ein Dataset wird erstellt
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern der Dataset-Einstellungen
- Löschen einer Nachricht
- Löschen eines Datasets
- Exportieren eines Datasets
- Verwenden von Exchange-Integrationen
- Modelltraining und -wartung
- Grundlegendes zu Beschriftungen, allgemeinen Feldern und Metadaten
- Beschriftungshierarchie und Best Practices
- Vergleichen von Anwendungsfällen für Analyse und Automatisierung
- Konvertieren Ihrer Ziele in Bezeichnungen
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung
- Der Status des Datasets
- Best Practice für Modelltraining und Anmerkungen
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Grundlegendes zu Datenanforderungen
- Trainieren
- Einführung in Verfeinerung
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- So funktioniert die Validierung
- Verstehen und Verbessern der Modellleistung
- Gründe für die geringe durchschnittliche Beschriftungsgenauigkeit
- Training mit Beschriftung „Überprüfen“ und Beschriftung „Verpasst“.
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Abgleichs und Verwendung des Abgleichs
- Wann das Training Ihres Modells beendet werden soll
- Verwenden von allgemeinen Feldern
- Generative Extraktion
- Verwenden von Analyse und Überwachung
- Automations and Communications Mining™
- Entwickler (Developer)
- Verwenden der API
- API-Tutorial
- Quellen
- Datasets
- Anmerkungen
- Anhänge (Attachments)
- Vorhersagen
- Erstellen Sie einen Stream
- Aktualisieren Sie einen Stream
- Rufen Sie einen Stream nach Namen ab
- Rufen Sie alle Streams ab
- Löschen Sie einen Stream
- Ergebnisse aus Stream abrufen
- Kommentare aus einem Stream abrufen (Legacy)
- Bringen Sie einen Stream vor
- Einen Stream zurücksetzen
- Kennzeichnen Sie eine Ausnahme
- Entfernen Sie das Tag einer Ausnahme
- Prüfungsereignisse
- Alle Benutzer abrufen
- Hochladen von Daten
- Herunterladen von Daten
- Exchange Integration mit einem Azure-Dienstbenutzer
- Exchange-Integration mit der Azure-Anwendungsauthentifizierung
- Exchange-Integration mit Azure Application Authentication und Graph
- Abrufen von Daten für Tableau mit Python
- Elasticsearch-Integration
- Allgemeine Feldextraktion
- Selbst gehostete Exchange-Integration
- UiPath® Automatisierungs-Framework
- Offizielle UiPath®-Aktivitäten
- Wie Maschinen lernen, Wörter zu verstehen: eine Anleitung zu Einbettungen in NLP
- Eingabeaufforderungsbasiertes Lernen mit Transformers
- Ef Robots II: Wissensdegesterration und Feinabstimmung
- Effiziente Transformer I: Warnmechanismen
- Tief hierarchische, nicht überwachte Absichtsmodellierung: Nutzen ohne Trainingsdaten
- Beheben von Anmerkungsverzerrungen mit Communications Mining™
- Aktives Lernen: Bessere ML-Modelle in weniger Zeit
- Auf Zahlen kommt es an – Bewertung der Modellleistung mit Metriken
- Darum ist Modellvalidierung wichtig
- Vergleich von Communications Mining™ und Google AutoML für Conversation Data Intelligence
- Lizenzierung
- Häufige Fragen und mehr

Communications Mining-Benutzerhandbuch
comments, während sich das Benutzerhandbuch und die Communications Mining-Benutzeroberfläche hauptsächlich auf messages beziehen.
comments modellieren, um sie für den Upload vorzubereiten, und wie die von Communications Mining abgerufenen Daten zu verstehen sind.
Im Abschnitt Übersicht wird die allgemeine Struktur eines Kommentarobjekts beschrieben. Wenn Sie Daten über die API in Communications Mining™ hochladen möchten oder erfahren möchten, wie Daten verarbeitet werden, die über die API in Communications Mining hochgeladen werden, lesen Sie den Abschnitt Kommentare, die über die API erstellt wurden . Sie können detaillierte Beschreibungen für jeden der häufig verwendeten Kommentartypen (E-Mails oder Support-Tickets) finden. Wenn Sie besser verstehen möchten, wie Daten verarbeitet werden, die über eine Integration in Communications Mining hochgeladen werden, sehen Sie sich den Abschnitt Kommentare an, die von Integrationen erstellt wurden . Eine vollständige Liste der verfügbaren Kommentarobjektfelder finden Sie im Abschnitt Referenz .
Communications Mining™ arbeitet mit verschiedenen Arten von Textdaten wie E-Mails, Umfrageantworten, Support-Tickets oder Kundenrezensionen. Gemeinsam ist diesen Datentypen, dass sie alle aus Kommunikationseinheiten bestehen (aus einer E-Mail, einer Umfrageantwort, einem Support-Ticket, einer Kundenrezension). In Communications Mining wird eine einzelne Nachricht z. B. als Kommentar dargestellt.
Unabhängig davon, welche Art von Kommunikationseinheit ein Kommentar symbolisiert, behält er diese grundlegende Struktur durchgängig bei:
{
"id": <UNIQUE ID>,
"timestamp": <TIMESTAMP>,
"messages": [
{
"body": { "text": <TEXT> },
...
}
],
"user_properties": { ... },
}{
"id": <UNIQUE ID>,
"timestamp": <TIMESTAMP>,
"messages": [
{
"body": { "text": <TEXT> },
...
}
],
"user_properties": { ... },
}Wie im vorherigen Code-Snippet gezeigt, hat ein Kommentar zusätzlich zum eigentlichen Textteil immer eine ID und einen Zeitstempel. Die ID muss innerhalb der Datei, die die Nachricht enthält, eindeutig sein. Der Zeitstempel wird in der Benutzeroberfläche der Plattform verwendet, um nach Datum zu filtern und zu sortieren und datumsbasierte Analysen zu generieren.
Zusätzlich zu diesen Pflichtfeldern sollten je nach Typ des Kommentars weitere Felder festgelegt werden. Wenn Ihre Daten über eine Integration in Communications Mining™ hochgeladen wurden, füllt Communications Mining automatisch alle erforderlichen Felder aus. Eine detailliertere Beschreibung finden Sie in den folgenden Abschnitten.
Emails
sync-raw-emails -Endpunkt für unformatierte E-Mails und den sync -Endpunkt für verarbeitete E-Mails.
Geben Sie beim Synchronisieren von unformatierten E-Mails die extrahierten MIME-E-Mail-Header und den E-Mail-Text so an, wie sie sind (eine Beschreibung des unformatierten E-Mail-Formats finden Sie in der Referenz ). Communications Mining analysiert die Header und bereinigt den E-Mail-Text.
Wie verarbeitet Communications Mining unformatierte E-Mails?
- Legt die E-Mail-spezifischen Felder im Nachrichtenobjekt
messages[0] - Legt das Feld
thread_idund das Objektthread_propertiesfest - Bereinigung des E-Mail-Textkörpers durch Entfernen von E-Mails mit Anführungszeichen und Einfügen der Signatur in ein separates
signature-Feld - Füllt das
user_properties-Objekt mit Metadaten aus, die aus E-Mail-Headern extrahiert wurden.
BCC: -Feld.
Wenn Sie E-Mails vor dem Hochladen in Communications Mining mit anderen Daten anreichern, können Sie diese zusätzlichen Daten in den Benutzereigenschaften des Kommentars angeben.
{
"raw_email": {
"body": {
"plain": "Hi Bob,\n\nCould you send me the figures for today?\n\nThanks,\nAlice"
},
"headers": {
"raw": "From: Alice Smith <alice@example.com>\nDate: Tue, 3 Aug 2021 10:57:42 +0100\nMessage-ID: <e7784b5b@mail.example.com>\nSubject: Figures for today\nTo: Bob <bob@company.com>\nCc: Joe <joe@company.com>"
}
},
"user_properties": {
"string:Team": "Team XYZ"
}
}{
"raw_email": {
"body": {
"plain": "Hi Bob,\n\nCould you send me the figures for today?\n\nThanks,\nAlice"
},
"headers": {
"raw": "From: Alice Smith <alice@example.com>\nDate: Tue, 3 Aug 2021 10:57:42 +0100\nMessage-ID: <e7784b5b@mail.example.com>\nSubject: Figures for today\nTo: Bob <bob@company.com>\nCc: Joe <joe@company.com>"
}
},
"user_properties": {
"string:Team": "Team XYZ"
}
}{
"comment": {
"id": "3c6537373834623562406d61696c2e6578616d706c652e636f6d3e",
"timestamp": "2021-08-03T09:57:42Z",
"user_properties": {
"string:Has Signature": "Yes",
"string:Sender": "alice@example.com",
"string:Thread": "<e7784b5b@mail.example.com>",
"string:Message ID": "<e7784b5b@mail.example.com>",
"number:Recipient Count": 2,
"number:Participant Count": 3,
"number:Position in Thread": 1,
"string:Sender Domain": "example.com",
"string:Team": "Team XYZ"
},
"messages": [
{
"body": {
"text": "Hi Bob,\n\nCould you send me the figures for today?"
},
"signature": {
"text": "Thanks,\nAlice"
},
"subject": {
"text": "Figures for today"
},
"to": ["\"Bob\" <bob@company.com>"],
"cc": ["\"Joe\" <joe@company.com>"],
"sent_at": "2021-08-03T09:57:42Z",
"from": "\"Alice Smith\" <alice@example.com>"
}
],
"thread_id": "3c6537373834623562406d61696c2e6578616d706c652e636f6d3e"
},
"thread_properties": {
"duration": null,
"response_time": null,
"num_messages": 1,
"num_participants": 3,
"first_sender": "alice@example.com",
"thread_position": 0
}
}{
"comment": {
"id": "3c6537373834623562406d61696c2e6578616d706c652e636f6d3e",
"timestamp": "2021-08-03T09:57:42Z",
"user_properties": {
"string:Has Signature": "Yes",
"string:Sender": "alice@example.com",
"string:Thread": "<e7784b5b@mail.example.com>",
"string:Message ID": "<e7784b5b@mail.example.com>",
"number:Recipient Count": 2,
"number:Participant Count": 3,
"number:Position in Thread": 1,
"string:Sender Domain": "example.com",
"string:Team": "Team XYZ"
},
"messages": [
{
"body": {
"text": "Hi Bob,\n\nCould you send me the figures for today?"
},
"signature": {
"text": "Thanks,\nAlice"
},
"subject": {
"text": "Figures for today"
},
"to": ["\"Bob\" <bob@company.com>"],
"cc": ["\"Joe\" <joe@company.com>"],
"sent_at": "2021-08-03T09:57:42Z",
"from": "\"Alice Smith\" <alice@example.com>"
}
],
"thread_id": "3c6537373834623562406d61696c2e6578616d706c652e636f6d3e"
},
"thread_properties": {
"duration": null,
"response_time": null,
"num_messages": 1,
"num_participants": 3,
"first_sender": "alice@example.com",
"thread_position": 0
}
}Thread-Eigenschaften
Die folgenden Thread-Eigenschaften sind verfügbar.
| Name | BESCHREIBUNG |
|---|---|
thread_position | Position des Kommentars im Thread, berechnet durch Sortieren des Kommentars nach timestamp. Beginnt um 0.
|
num_messages | Anzahl der Kommentare im Thread. |
num_participants | Gesamtanzahl der eindeutigen Teilnehmer (Von, An, CC, BCC) im Thread. |
first_sender | Absender des ersten Kommentars im Thread. |
duration | Differenz (in Sekunden) zwischen dem timestamps des ersten und letzten Kommentars im Thread. Wird auf null festgelegt, wenn num_messagesist 1 (d. h Thread enthält nur 1 Kommentar). Hinweis: Das
timestamp eines Kommentars entspricht dem Feld sent_at der entsprechenden unformatierten E-Mail.
|
response_time | Unterschied (in Sekunden) zwischen dem ersten Kommentar im Thread und der ersten Antwort im Thread. Die erste Antwort im Thread ist der älteste Kommentar, bei dem der Absender nicht first_sender ist. Wird auf null festgelegt, wenn keine Antworten im Thread vorhanden sind (d. h. wenn alle E-Mails im Thread vom gleichen Absender stammen).
|
Jedes Mal, wenn der Plattform ein neuer Kommentar hinzugefügt wird, werden die Thread-Eigenschaften des entsprechenden Threads aktualisiert.
thread_position sind alle Eigenschaften bei jedem Kommentar im Thread gleich.
Zusätzlich zum Haupttext kann ein typisches Support-Ticket, das über ein Formular eingereicht wird, einen Betreff, Informationen über den Absender (z. B. Name oder E-Mail-Adresse) und zusätzliche strukturierte Daten (z. B. das Thema des Tickets) enthalten, die hochgeladen werden können als Teil der Benutzereigenschaften des Kommentars.
{
"id": "dbcb03ad",
"timestamp": "2020-02-26T16:09:00Z",
"messages": [
{
"body": {
"text": "Hi Support Team\n\nPlease could you look into my broadband service network status. I don't have any signal."
},
"subject": {
"text": "Network Outage for over 24 hours - Customer account number 1234567"
},
"from": "alice.smith@example.com"
}
],
"user_properties": {
"string:Customer Name": "Alice Smith",
"string:Source": "Support Form",
"string:Topic": "Broadband"
}
}{
"id": "dbcb03ad",
"timestamp": "2020-02-26T16:09:00Z",
"messages": [
{
"body": {
"text": "Hi Support Team\n\nPlease could you look into my broadband service network status. I don't have any signal."
},
"subject": {
"text": "Network Outage for over 24 hours - Customer account number 1234567"
},
"from": "alice.smith@example.com"
}
],
"user_properties": {
"string:Customer Name": "Alice Smith",
"string:Source": "Support Form",
"string:Topic": "Broadband"
}
}E-Mails (Microsoft Exchange)
Microsoft Exchange-E-Mails, die über die Exchange-Integration in Communications Mining aufgenommen werden, werden automatisch auf die gleiche Weise wie unformatierte E-Mails in Kommentarobjekte konvertiert.
attachments Metadaten darüber:```json
{
"id": "3c484531505230324d423",
"attachments": [
{
"name": "account-statement.pdf",
"size": 49078,
"content_type": "application/pdf",
}
],
// other comment fields omitted
...
},
``````json
{
"id": "3c484531505230324d423",
"attachments": [
{
"name": "account-statement.pdf",
"size": 49078,
"content_type": "application/pdf",
}
],
// other comment fields omitted
...
},
```attachment_reference zurückgegeben:
```json
{
"id": "3c484531505230324d423",
"attachments": [
{
"name": "account-statement.pdf",
"size": 49078,
"content_type": "application/pdf",
"attachment_reference": "CjQSEIExTHEqtdntoxz2WtbZDNEiIIVqcP1Sfx2L4epyRQDasa1RSODvheQ3bvLhj3L-_81G"
}
],
// other comment fields omitted
...
},
``````json
{
"id": "3c484531505230324d423",
"attachments": [
{
"name": "account-statement.pdf",
"size": 49078,
"content_type": "application/pdf",
"attachment_reference": "CjQSEIExTHEqtdntoxz2WtbZDNEiIIVqcP1Sfx2L4epyRQDasa1RSODvheQ3bvLhj3L-_81G"
}
],
// other comment fields omitted
...
},
```attachment_reference , um den Binärdateiinhalt von [der Anlagen-API](#FIXME) abzurufen. Für das vorherige Beispiel rufen Sie die folgende URL ab: https://cloud.uipath.com/<organisation>/<tenant>/reinfer_/api/v1/attachments/CjQSIEIExTHEqtdnoxz2WtbZDDETEiIIVqcP1Sfx2L4epyRQDasa1RSODvheQ3bvLhj3L-_81G.
Weitere Details zu diesem Anforderungstyp finden Sie in der [API-Referenz](#Fixme).
attachment_reference -Eigenschaft hat, können Sie den Inhalt des Anhangs nicht herunterladen. Dies kann folgende Ursachen haben:
- Communications Mining™ hat den Inhalt des Anhangs nicht empfangen.
- Der Inhalt des Anhangs hat die Größenbegrenzung für das Hochladen in Communications Mining überschritten.
- Communications Mining hat den Anhang verarbeitet, bevor er die Dateiinhalte unterstützt.
Weitere Informationen zu den Inhalten von Anhängen finden Sie auf der Seite Anhang.
Anmerkungen
Eine Liste der verfügbaren Kommentarfelder finden Sie in der folgenden Tabelle. Wenn Sie mit Communications Mining™-Kommentarobjekten nicht vertraut sind, überprüfen Sie die Übersicht.
| Name | Typ | Erforderlich | BESCHREIBUNG |
|---|---|---|---|
id | string | ja | Identifiziert einen Kommentar innerhalb einer Quelle eindeutig. Jede hexadezimale Zeichenfolge mit bis zu 1024 Zeichen ist gültig (entspricht /[0-9a-f]{1,1024}/). |
timestamp | string | ja | Ein ISO-8601-Zeitstempel, der angibt, wann der Kommentar erstellt wurde. Wenn der Zeitstempel keine Zeitzone angibt, wird UTC angenommen. Der Zeitstempel muss im Bereich von 1950-01-01T00:00:00Z bis 2049-12-31T23:59:59Z einschließlich liegen. |
messages | array<Message> | ja | Ein Array mit null oder einer Nachricht. |
user_properties | map<string, string | number> | nein | Alle benutzerdefinierten Metadaten, die für den Kommentar gelten. Es gibt zwei mögliche Typen: string und number. Der Schlüssel einer Benutzereigenschaft hat das Format „Typ:Name“, z. B. „string:Domain Name“ oder „number:Sternbewertung“. Der Name der Benutzereigenschaft kann aus Buchstaben, Ziffern, Leerzeichen und Unterstrichen bestehen und bis zu 32 Zeichen enthalten (entspricht /\w([\w ]{0,30}\w)?/). Der Wert muss je nach Typ der Benutzereigenschaft eine Zeichenfolge oder eine Zahl sein.
|
thread_id | string | nein | Eine ID, die einen E-Mail-Thread eindeutig identifiziert. Jede hexadezimale Zeichenfolge mit bis zu 1024 Zeichen ist gültig (entspricht /[0-9a-f]{1,1024}/). |
uid | string | von Communications Mining™ festgelegt | Eine kombinierte Quellen- und Kommentar-ID im Format source_id.comment_id. Sie sollten dieses Feld nicht direkt festlegen, da es automatisch von Communications Mining für hochgeladene Kommentare generiert wird.
|
created_at | string | von Communications Mining festgelegt | Ein ISO-8601-Zeitstempel mit den gleichen Einschränkungen wie das Feld timestamp . Sie sollten dieses Feld nicht direkt festlegen, da es automatisch von Communications Mining generiert wird, wenn der Kommentar erstellt wird.
|
updated_at | string | von Communications Mining festgelegt | Ein ISO-8601-Zeitstempel mit den gleichen Einschränkungen wie das Feld timestamp . Sie sollten dieses Feld nicht direkt festlegen, da es automatisch von Communications Mining generiert wird, wenn der Kommentar aktualisiert wird.
|
attachments | array<Attachment> | nein | Ein Array von null oder mehr Anhängen. Ein Anhang stellt eine Datei dar, die an einen Kommentar angehängt ist. |
| Name | Typ | Erforderlich | BESCHREIBUNG |
|---|---|---|---|
name | string | ja | Der Dateiname des Anhangs. |
size | Nummer | ja | Die Größe des Dateiinhalts des Anhangs in Bytes. |
content_type | string | ja | Der [Medientyp](https://en.wikipedia.org/wiki/Media_type) des Anhangs. Eine Liste möglicher Werte finden Sie in der Liste [IANA-Medientypen](https://www.iana.org/assignments/medien-types/medien-types.xhtml). |
attachment_reference | string | nein | Wird verwendet, um den Binärdateiinhalt von [der Anhangs-API](#Fixme) abzurufen |
Message das folgende Format:
| Name | Typ | Erforderlich | BESCHREIBUNG |
|---|---|---|---|
body | Inhalt | ja | Ein Objekt, das den Haupttexttext der Nachricht enthält. |
subject | Inhalt | nein | Ein Objekt, das den Betreff der Nachricht enthält. |
signature | Inhalt | nein | Ein Objekt, das die Signatur der Nachricht enthält. |
from | string | nein | Der Absender der Nachricht. |
to | array<string> | nein | Ein Array primärer Empfänger. |
cc | array<string> | nein | Ein Array von CC-Empfängern. |
bcc | array<string> | nein | Eine Reihe von BCC-Empfängern. |
sent_at | string | nein | Ein ISO-8601-Zeitstempel, der angibt, wann die Nachricht erstellt wurde. Wenn der Zeitstempel keine Zeitzone angibt, wird UTC angenommen. |
language | string | nein | Die Originalsprache der Nachricht. Wenn dies angegeben ist, müssen sowohl text als auch translated_from für die Inhaltsfelder angegeben werden.
|
Content das folgende Format:
| Name | Typ | Erforderlich | BESCHREIBUNG |
|---|---|---|---|
text | string | ja | Wenn ein language (außer language der Quelle) angegeben wurde, sollte dies der übersetzte Text des Inhalts sein. Andernfalls muss es in der Originalsprache vorliegen, in der es gesammelt wurde. wenn nicht, wird er übersetzt, und zwar im language der Quelle, und für die Quelle ist should_translate auf true festgelegt. Maximal 65536 Zeichen.
|
translated_from | string | nein | Wenn ein language (außer language der Quelle) angegeben wurde, sollte dies der ursprüngliche Text des Inhalts sein. Wenn Sie dieses Feld ausfüllen, ohne ein language angegeben zu haben, tritt ein Fehler auf. Höchstens 65536 Zeichen.
|
Unformatierte E-Mails
In der folgenden Tabelle finden Sie eine Liste der verfügbaren unformatierten E-Mail-Felder.
| Name | Typ | Erforderlich | BESCHREIBUNG |
|---|---|---|---|
headers | Header | ja | Ein Objekt, das die Header der E-Mail enthält. |
body | Text | ja | Ein Objekt, das den Haupttext der E-Mail enthält. |
Headers das folgende Format:
| Name | Typ | Erforderlich | BESCHREIBUNG |
|---|---|---|---|
raw | string | nein | Entweder raw oder parsed ist erforderlich. Die unformatierten E-Mail-Header, die als einzelne Zeichenfolge angegeben werden, wobei jeder Header in einer eigenen Zeile steht.
|
parsed | <string, string | Array<string>> | nein |
Entweder
raw oder parsed ist erforderlich. Die geparsten E-Mail-Header, angegeben als Objekt mit Zeichenfolgenschlüsseln und Zeichenfolgen- oder Array<string> -Werten.
Jeder Schlüssel muss ASCII sein und stellt einen E-Mail-Header dar. Wertzeichenfolgen können alle gültigen UTF-8-Zeichen sein. Wertelisten werden mit
, verkettet, bevor sie als einzelner Headerwert festgelegt werden. Wenn Sie doppelte Headerschlüssel benötigen, verwenden Sie stattdessen raw .
|
Body das folgende Format:
| Name | Typ | Erforderlich | BESCHREIBUNG |
|---|---|---|---|
plain | string | nein | Mindestens einer von plain und html ist erforderlich. Der Klartext-Inhalt der E-Mail. Höchstens 65536 Zeichen.
|
html | string | nein | Mindestens einer von plain und html ist erforderlich. Der HTML-Inhalt der E-Mail.
|