- Einleitung
- Einrichten Ihres Kontos
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Allgemeine Felder
- Beschriftungen (Vorhersagen, Konfidenzniveaus, Beschriftungshierarchie und Beschriftungsstimmung)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Nachrichten mit und ohne Anmerkungen
- Extraktionsfelder
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Zugriffskontrolle und Verwaltung
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Erstellen oder Löschen einer Datenquelle in der GUI
- Hochladen einer CSV-Datei in eine Quelle
- Vorbereiten von Daten für den CSV-Upload
- Ein Dataset wird erstellt
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern der Dataset-Einstellungen
- Löschen einer Nachricht
- Löschen eines Datasets
- Exportieren eines Datasets
- Verwenden von Exchange-Integrationen
- Modelltraining und -wartung
- Grundlegendes zu Beschriftungen, allgemeinen Feldern und Metadaten
- Beschriftungshierarchie und Best Practices
- Vergleichen von Anwendungsfällen für Analyse und Automatisierung
- Konvertieren Ihrer Ziele in Bezeichnungen
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung
- Der Status des Datasets
- Best Practice für Modelltraining und Anmerkungen
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Training von Chat- und Anrufdaten
- Grundlegendes zu Datenanforderungen
- Trainieren
- Einführung in Verfeinerung
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- So funktioniert die Validierung
- Verstehen und Verbessern der Modellleistung
- Gründe für die geringe durchschnittliche Beschriftungsgenauigkeit
- Training mit Beschriftung „Überprüfen“ und Beschriftung „Verpasst“.
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Abgleichs und Verwendung des Abgleichs
- Wann das Training Ihres Modells beendet werden soll
- Verwenden von allgemeinen Feldern
- Generative Extraktion
- Verwenden von Analyse und Überwachung
- Automations and Communications Mining™
- Entwickler (Developer)
- Einleitung
- Verwenden der API
- API-Tutorial
- Zusammenfassung
- Quellen
- Datasets
- Anmerkungen
- Anhänge (Attachments)
- Vorhersagen
- Erstellen Sie einen Stream
- Aktualisieren Sie einen Stream
- Rufen Sie einen Stream nach Namen ab
- Rufen Sie alle Streams ab
- Löschen Sie einen Stream
- Ergebnisse aus Stream abrufen
- Kommentare aus einem Stream abrufen (Legacy)
- Bringen Sie einen Stream vor
- Einen Stream zurücksetzen
- Kennzeichnen Sie eine Ausnahme
- Entfernen Sie das Tag einer Ausnahme
- Prüfungsereignisse
- Alle Benutzer abrufen
- Exchange Integration mit einem Azure-Dienstbenutzer
- Exchange-Integration mit der Azure-Anwendungsauthentifizierung
- Exchange-Integration mit Azure Application Authentication und Graph
- Abrufen von Daten für Tableau mit Python
- Elasticsearch-Integration
- Selbst gehostete Exchange-Integration
- UiPath® Automatisierungs-Framework
- UiPath® Marketplace-Aktivitäten
- Offizielle UiPath®-Aktivitäten
- Wie Maschinen lernen, Wörter zu verstehen: eine Anleitung zu Einbettungen in NLP
- Eingabeaufforderungsbasiertes Lernen mit Transformers
- Ef Robots II: Wissensdegesterration und Feinabstimmung
- Effiziente Transformer I: Warnmechanismen
- Tief hierarchische, nicht überwachte Absichtsmodellierung: Nutzen ohne Trainingsdaten
- Beheben von Anmerkungsverzerrungen mit Communications Mining™
- Aktives Lernen: Bessere ML-Modelle in weniger Zeit
- Auf Zahlen kommt es an – Bewertung der Modellleistung mit Metriken
- Darum ist Modellvalidierung wichtig
- Vergleich von Communications Mining™ und Google AutoML für Conversation Data Intelligence
- Lizenzierung
- Häufige Fragen und mehr

Communications Mining-Benutzerhandbuch
Hochladen einer CSV-Datei in eine Quelle
link-
Das Aktualisieren von etwas anderem als Benutzereigenschaften führt dazu, dass allgemeine Feldanmerkungen in zugehörigen Datasets verloren gehen. Zum Beispiel das Aktualisieren vorhandener Nachrichten in einer Quelle, das Ändern von Nachrichteneigenschaften wie Nachrichtentext, gesendet_at Zeitstempel und an oder von. Stellen Sie sicher, dass Sie die aktuelle Modellversion in den zugehörigen Datasets anheften, bevor Sie dies tun.
-
For details on creating a data source, check Creating or deleting a data source in the GUI.
- Navigieren Sie zur Seite Administrator .
- Wählen Sie die Registerkarte Quellen aus und suchen Sie die Quelle, in die Sie Daten hochladen möchten.
- Wählen Sie das Hochladesymbol auf der Datenquellenkarte aus.
- Verwenden Sie Datei auswählen , um eine CSV-Datei von Ihrem Computer auszuwählen.
- Wählen Sie die CSV-Datei aus, die Sie hochladen möchten. Stellen Sie sicher, dass die Datei die folgenden Kriterien erfüllt:
- Die Datei muss Header in der ersten Zeile enthalten und durch Komma oder Tabstopp getrennt sein.
- Die Datei muss mindestens drei Spalten enthalten:
- Nachricht: Der Nachrichtentext.
- Zeitstempel: Wann die Nachricht erstellt wurde.
- Eindeutige ID: Ein eindeutiger Bezeichner für jede Nachricht.
- Alle Textfelder müssen in doppelte Anführungszeichen in der Datei enthalten sein.
- Die Datei muss als UTF-8, UTF-16 oder UTF-32 codiert sein. Die Plattform erkennt automatisch die richtige Codierung.
- Die Datei muss höchstens 128 MiB haben. Teilen Sie größere Dateien in mehrere Dateien mit jeweils weniger als 128 MiB auf.
- Wählen Sie die erforderlichen Spalten aus, in denen die Dropdown-Menüs die in der CSV-Datei erkannten Spaltenheader enthalten:
- NachrichtenID-Spalte – Eine Spalte mit einer eindeutigen ID, die die Nachricht identifizieren kann. Die Nachrichten-IDs dürfen nur alphanumerische ASCII-Zeichen (AZ, az, 0-9) und Satzzeichen enthalten, mit Ausnahme von Schrägstrichen
/
.Hinweis: Wenn in der Quelle vorhandene Nachrichten mit derselben ID vorhanden sind, werden diese entsprechend dem Inhalt der neuen Datei aktualisiert. - Nachrichtenspalte – Die Spalte, die den Nachrichtentext enthält, den Sie in der Plattform analysieren möchten.
- Timestamp Column - The column that contains the date and time when the message was recorded. The timestamp format is flexible, and the platform infers it automatically. For more details, check Using the correct formats.
- NachrichtenID-Spalte – Eine Spalte mit einer eindeutigen ID, die die Nachricht identifizieren kann. Die Nachrichten-IDs dürfen nur alphanumerische ASCII-Zeichen (AZ, az, 0-9) und Satzzeichen enthalten, mit Ausnahme von Schrägstrichen
- Sie können die folgenden zusätzlichen Spalten auswählen, wenn Sie Daten haben, die Betreffzeilen, Threads oder Teilnehmer enthalten, die in der Regel in Fällen oder E-Mail-Threads auftreten:
- Betreffspalte – Die Spalte, die den Betreff der Nachricht enthält.
- Absenderspalte – Die Spalte, die den Absender enthält.
- Spalte „An“ – Die Spalte, die einen oder mehrere Empfänger enthält. Stellen Sie sicher, dass mehrere Empfänger durch ein Semikolon
;
getrennt sind. - Cc-Spalte – Die Spalte, die einen oder mehrere Empfänger im Cc-Feld enthält. Stellen Sie sicher, dass mehrere Empfänger durch ein Semikolon
;
getrennt sind.- For more details on using the correct formats in the Sender, To, and Cc fields, check Using the correct formats.
- Spalte „Thread-ID“ – Die Spalte, die die Thread-ID der Nachricht enthält. Die Thread-ID verknüpft verschiedene Nachrichten mit demselben Thread.
- Sie können die zusätzlichen Benutzereigenschaften auswählen, die Sie mit den Nachrichten hochladen möchten. Benutzereigenschaften sind kontextbezogene Metadaten, die jeder Nachricht zugeordnet sind, die Sie in der Plattform filtern können. Die Machine-Learning-Modelle in der Plattform können auch diese Benutzereigenschaften nutzen, die von folgenden Typen sind:
- String-Benutzereigenschaften sind kategorische Metadaten, z. B. IDs, Länder, Gegenparteien usw.
- Zahlen-Benutzereigenschaften sind numerische Metadaten, z. B. NPS, E-Mail-Statistiken, Beträge usw.
Hinweis: Wenn Ihre Datei eine NPS-Punktzahl als Benutzereigenschaft enthält, müssen Sie dies als Zahleneigenschaft einschließen und dürfen sie nurNPS
nennen, um native NPS-Diagramme auszulösen, die in die Plattform geladen werden. - Nachdem Sie alle Benutzereigenschaften ausgewählt haben, wählen Sie Hochladen aus.
Sie werden aufgefordert, die hochgeladenen Nachrichten in einem Dataset zu überprüfen, das die Quelle enthält, in die Sie Daten hochgeladen haben. Wenn die Quelle keinen Datasets zugeordnet ist, können Sie ein neues Dataset erstellen, um zu überprüfen, ob der Upload wie erwartet ist.
Hinweis: Wenn Sie bei der Auswahl der Benutzereigenschaften einen Fehler gemacht haben, können Sie dieselbe Datei erneut hochladen. Die Plattform verwendet die Spalten-ID als Bezeichner, um die vorhandenen Nachrichten und Eigenschaften zu überschreiben. Dies wirkt sich nicht auf Beschriftungen aus, die auf vorhandene Nachrichten angewendet werden.
Verwenden der richtigen Formate
linkDas Format Absender/An/CC
Stellen Sie sicher, dass:
- Die Anzahl der Empfänger überschreitet nicht die maximale Anzahl von 2.048 pro Thread.
- Der Absender oder Empfänger darf das Limit von 512 Zeichen nicht überschreiten.
- Es gibt nur ein Semikolon in einer Zeile. Zum Beispiel ist Folgendes falsch formatiert: john@email.com ; beth@email.com.
- Beispiel 1: zuerst:bild vgen Seiteruf <ruft.bog@gmail.com>; John Smith <john.smith@gmail.com>
- Beispiel 2: roboter.bog@gmail.com ;john.smith@gmail.com
- Beispiel 3: robot.bog@gmail.com ; john.smith@gmail.com
;
.
Stellen Sie vor dem Hochladen Ihrer Daten sicher, dass die E-Mails entsprechend formatiert sind.
Das Zeitstempelformat
01/02/03 10:10
, können Sie die richtige Interpretation vorschlagen:
- 2. Januar 2003 - Keine
- 1. Februar 2003 – Tag zuerst
- 3. Februar 2001 – Jahr zuerst
- 2. März 2001 – Tag zuerst + Jahr zuerst
RFC 3339
anzugeben. Zum Beispiel 2020-01-31T12:34:56Z
für UTC oder mit einer Zeitzone: 2020-08-031T11:20:60-08:00
.
Fehlersuche und ‑behebung
linkDieser Abschnitt enthält die möglichen Fehlermeldungen, die während des Upload-Vorgangs auftreten können, und die Lösungen für jede von ihnen.
In den folgenden Fehlermeldungen wird {something} kontextbezogenen Informationen darüber zugeordnet, wo der Fehler aufgetreten ist. Darüber hinaus ist die Art und Weise, wie wir auf eine Position in der Datei verweisen, standardisiert:
String | Erweitert auf: |
---|---|
{Position} | Datensatz {row-number} in Zeile {line-number} Spalte {column-number} (Byte {byte-number}) |
Der Titel der Fehlermeldung wird zusammen mit einer Beschreibung angezeigt, wie in der folgenden Abbildung zu sehen ist:
Fehlerart | Fehlermeldung | Beschreibung |
---|---|---|
Nicht genügend Spalten | Die CSV-Datei enthält nur {number-columns} Spalten, aber mindestens 3 sind erforderlich, d. h. text, timestamp und id. | Die hochgeladene CSV-Datei enthält nicht mindestens 3 Spalten, oder die Plattform hat die Codierung der Datei falsch erkannt. |
Ungültige Codierung | Die Datei enthält ungültige Zeichen, bei denen die Codierung als {detected-encoding} erkannt wird. | Die Datei ist nicht korrekt als UTF-8, UTF-16 oder UTF-32 codiert. Die Plattform erkennt das Format der Datei automatisch. |
Ungültiger Header | string:ti:er' stimmt nicht mit '(^delimiter|id|message|timestamp |timestamp_default_utc_offset |timestamp_day_first|timestamp_year_first\\Z)|(^(?P<property_type>number|string):(?P<name>\\w(?:[\\w]{0,30}\\w)?)\\Z)' überein | Wenn ein Spalten-Header ein ungültiger Name für eine Benutzereigenschaft ist, gibt die Plattform die Standardmeldung zurück, wenn das Schema einer Anforderung ungültig ist. Vergewissern Sie sich, dass jeder Spaltenheader ein gültiges Format für seinen Zweck hat. Die maximale Länge für einen Spalten-Header beträgt 32 alphanumerische Zeichen. |
Ungleiche Zeilenlängen | Die CSV-Datei enthält ungleiche Zeilenlängen. Nachricht {position} hat {number} Felder, aber der vorherige Datensatz hat {number} Felder. | Die CSV-Datei enthält Zeilen mit unterschiedlicher Anzahl von Zellen oder die nicht mit der Anzahl der Header übereinstimmen. |
ID-Format | Ungültige Nachrichten-ID für {record}. IDs dürfen nur aus alphanumerischen ASCII-Zeichen und Satzzeichen bestehen, mit Ausnahme des Schrägstrichs / . Zellenwert: { Cell-value}.
| Tritt auf, wenn ein ID-Feld aus ungültigen Zeichen besteht, wie in der Fehlermeldung beschrieben. |
ID-Länge | Die ID ist zu lang für Nachricht {record}. Sie hat {number} Bytes, die höchstens 1024 erwartet werden. | Tritt auf, wenn ein ID-Feld länger als die maximal zulässige Länge von 1024 Zeichen ist. |
Zeitstempelformat | Falsch formatierter Zeitstempel in Nachricht {position}: {timestamp-error-message}. Zellenwert: { Cell-value}. | Tritt auf, wenn ein Zeitstempelfeld nicht geparst werden konnte. |
Nachrichtenlänge | Nachricht ist zu lang für Nachricht {position}. Sie hat {number} Bytes, die höchstens 65536 erwartet werden. | Tritt auf, wenn ein Nachrichtenfeld länger als die maximal zulässige Länge von 65536 Zeichen ist. |
Format der Zahleneigenschaft | Falsch formatierte Zahl in Meldung {position}: {number-error-message}. Zellenwert: { Cell-value}. | Tritt auf, wenn ein Zahlenbenutzereigenschaftsfeld nicht geparst werden konnte. Die Plattform sollte jedes Format zulassen, das sinnvollerweise als Zahl dekodiert werden kann. |
Eigenschaftslänge | Eigenschaft ist zu lang für Nachricht {position}. Sie hat {number} Bytes, die höchstens 4096 erwartet werden. | Tritt auf, wenn ein Benutzereigenschaftsfeld länger als die maximal zulässige Länge von 4096 Zeichen ist. |
Unbekannter Fehler | Unbekannter CSV-Fehler: {underlying-error-message}. | Wenn ein unbekannter Fehler auftritt, wiederholen Sie den Upload. |