- Erste Schritte
- Ausgewogenheit
- Cluster
- Konzeptabweichung
- Abdeckung
- Datasets
- Allgemeine Felder (früher Entitäten)
- Bezeichnungen (Vorhersagen, Konfidenzniveaus, Hierarchie usw.)
- Modelle
- Streams
- Modellbewertung
- Projekte
- Präzision
- Rückruf
- Überprüfte und nicht überprüfte Nachrichten
- Quellen
- Taxonomien
- Training
- „True“ und „false“ positive und negative Vorhersagen
- Validierung
- Messages
- Verwaltung
- Verwalten Sie Quellen und Datasets
- Verstehen der Datenstruktur und -berechtigungen
- Create or delete a data source in the GUI
- Hochladen einer CSV-Datei in eine Quelle
- Vorbereiten von Daten für den CSV-Upload
- Ein neues Dataset erstellen
- Mehrsprachige Quellen und Datasets
- Aktivieren der Stimmung für ein Dataset
- Ändern Sie die Einstellungen eines Datasets
- Löschen Sie Nachrichten über die Benutzeroberfläche
- Löschen Sie ein Dataset
- Exportieren Sie ein Dataset
- Verwenden von Exchange-Integrationen
- Modelltraining und -wartung
- Verstehen von Beschriftungen, allgemeinen Feldern und Metadaten
- Bezeichnungshierarchie und bewährte Methode
- Definieren Ihrer Taxonomieziele
- Analyse- vs. Automatisierungsanwendungsfälle
- Konvertieren Ihrer Ziele in Bezeichnungen
- Erstellen Ihrer Taxonomiestruktur
- Best Practices für den Taxonomieentwurf
- Ihre Taxonomie wird importiert
- Übersicht über den Modelltrainingsprozess
- Generative Anmerkung (NEU)
- Der Status des Datasets
- Best Practice für Modelltraining und Anmerkungen
- Training mit aktivierter Beschriftungs-Stimmungsanalyse
- Grundlegendes zu Datenanforderungen
- Trainieren
- Einführung in Verfeinerung
- Erläuterungen zu Präzision und Rückruf
- Präzision und Rückruf
- Wie funktioniert die Validierung?
- Verstehen und Verbessern der Modellleistung
- Warum kann eine Bezeichnung eine geringe durchschnittliche Genauigkeit haben?
- Training mit Beschriftung „Überprüfen“ und Beschriftung „Verpasst“.
- Training mit der Bezeichnung „Teach“ (Verfeinern)
- Training mit der Suche (verfeinern)
- Verstehen und Erhöhen der Abdeckung
- Verbesserung des Abgleichs und Verwendung des Abgleichs
- Wann das Training Ihres Modells beendet werden soll
- Verwenden von allgemeinen Feldern
- Generative Extraktion
- Verwenden von Analyse und Überwachung
- Automatisierungs- und Communications Mining
- Lizenzierungsinformationen
- Häufige Fragen und mehr
Communications Mining-Benutzerhandbuch
Hochladen einer CSV-Datei in eine Quelle
Benutzerberechtigungen erforderlich: „Sources admin“ UND „Nachrichten bearbeiten“.
Um Daten aus einer CSV-Datei in eine Datenquelle hochzuladen, navigieren Sie zur Seite Quellen (über die Administratorkonsole, Zugriff über das Zahnrad oben rechts auf Ihrer Seite) und suchen Sie die Quelle, in die Sie Daten hochladen möchten.
Klicken Sie auf das Upload-Symbol in der oberen rechten Ecke der Datenquellenkarte (wie unten gezeigt).
Klicken Sie dann auf „Datei auswählen“ und wählen Sie die CSV-Datei aus, die Sie hochladen möchten.
Die ausgewählte Datei muss die folgenden Kriterien erfüllen:
- Die Datei muss Header in der ersten Zeile enthalten und durch Kommas oder Tabstopps getrennt sein
- Mindestens drei Spalten sind erforderlich: der Nachrichtentextinhalt (die Nachricht), ein Zeitstempel und eine eindeutige ID, die die Nachricht identifiziert
- Alle Textfelder in Ihrer CSV-Datei müssen von doppelten Anführungszeichen umgeben sein
- Die Datei muss entweder als UTF-8, UTF-16 oder UTF-32 codiert sein (die Plattform erkennt automatisch welche).
- Die CSV-Datei darf höchstens 64 MiB haben. Wenn Sie eine größere Datei haben, können Sie sie dennoch hochladen, indem Sie sie in mehrere Dateien mit jeweils weniger als 64 MiB aufteilen
Wenn Ihre Datei die obigen Kriterien erfüllt, können Sie die Meldungen im nächsten Schritt konfigurieren und hochladen:
Wählen Sie die erforderlichen Spalten aus jeder der Dropdownlisten aus, die die in der CSV-Datei erkannten Spaltenheader enthalten:
- Spalte „ID“:
- Dies muss eine Spalte sein, die eine eindeutige ID enthält, die die Nachricht identifizieren kann
- Die Nachrichten-IDs dürfen nur alphanumerische ASCII-Zeichen (AZ az 0-9) und Interpunktion (außer /) enthalten.
-
Hinweis: Wenn in der Quelle Nachrichten mit derselben ID vorhanden sind, werden sie aktualisiert, um dem Inhalt der neuen Datei zu entsprechen
- Nachrichtenspalte:
- Dies ist einfach die Spalte, die den Nachrichtentext enthält, den Sie in der Plattform analysieren möchten
- Zeitstempel-Spalte:
- Diese Spalte enthält das Datum und die Uhrzeit, zu der die Nachricht aufgezeichnet wurde
- Das Zeitstempelformat ist flexibel und wird automatisch von der Plattform abgeleitet
Wenn Sie Daten haben, die Betreffzeilen, Threads oder Teilnehmer enthalten (normalerweise in Fällen oder E-Mail-Threads zu sehen), können Sie auch diese zusätzlichen Spalten in Ihrer CSV-Datei hochladen:
- Spalte „Betreff“
- Wählen Sie aus, welche Spalte den Betreff der Nachricht enthält
- Spalte „Absender“
- Wählen Sie aus, welche Spalte den Absender enthält
- Spalte „Ab“
- Wählen Sie aus, welche Spalte die Empfänger enthält. Mehrere Empfänger müssen durch Semikolon getrennt werden.
- Spalte „Cc“
- Wählen Sie aus, welche Spalte die Cc-Empfänger enthält. Mehrere Empfänger müssen durch Semikolon getrennt werden
- Spalte „Thread-ID“
- Wählen Sie die Spalte aus, die die Meldung Thread-ID enthält
- Eine Thread-ID verknüpft verschiedene Nachrichten mit demselben Thread
Absender-/An-/CC-Format:
- Die folgenden Bedingungen in den Feldern „Absender/An/CC“ lösen Fehler aus:
- Überschreitet die maximale Anzahl von Empfängern (max. 2048 Empfänger pro Thread)
- Absender oder Empfänger überschreitet das maximale Zeichenlimit (max. 512 Zeichen pro Empfänger).
- Zwei oder mehr Semikolons befinden sich in einer Zeile (z. B. ist Folgendes falsch formatiert: john@email.com ; beth@email.com).
- Die Plattform entfernt zwar alle Leerzeichen vor oder nach einem Empfänger, führt jedoch keine zusätzliche Datenbereinigung durch.
- Beispielformate, in denen Sie Ihre Daten haben möchten (keine vollständige Liste):
- Beispiel 1 –Roboter REG <rob.bog@gmail.com>; John Smith <john.smith@gmail.com>
- Beispiel 2 – rob.bog@gmail.com ;john.smith@gmail.com
- Beispiel 3 – rob.bog@gmail.com ; john.smith@gmail.com
- Beispielformate, in denen Sie Ihre Daten haben möchten (keine vollständige Liste):
- Die Plattform trennt die verschiedenen Empfänger durch ein Semikolon (;)
- Stellen Sie vor dem Hochladen Ihrer Daten sicher, dass die E-Mails in einem geeigneten Format formatiert sind
- Beachten Sie, dass bei einem typischen Anwendungsfall mit Threads (z. B. E-Mails) in jeder Zelle vom Typ „Absender“ nur ein Absender vorhanden sein darf
Zeitstempelformat:
- Wenn das gewählte Zeitstempelformat für die Reihenfolge der Tage/Monate/Jahre nicht eindeutig ist (z. B 01/02/03 10:10) können Sie die richtige Interpretation vorschlagen:
- 2. Januar 2003 - Keine
- 1. Februar 2003 – Tag zuerst
- 3. Februar 2001 – Jahr zuerst
- 2. März 2001 – Tag zuerst + Jahr zuerst
- Um Mehrdeutigkeiten zu vermeiden, wird empfohlen, Zeitstempel nach Möglichkeit im RFC 3339-Format anzugeben (z. B 2020-01-31T12:34:56Z für UTC oder mit einer Zeitzone: 2020-08-031T11:20:60-08:00)
Wählen Sie dann die zusätzlichen Benutzereigenschaften aus, die Sie mit den Nachrichten hochladen möchten. Benutzereigenschaften sind kontextbezogene Metadaten, die jeder Nachricht zugeordnet sind und auf der Plattform filterbar sind. Diese werden potenziell auch von den Machine-Learning-Modellen in der Plattform verwendet. Es gibt zwei Typen, entweder Zeichenfolge oder Zahl:
- String-Benutzereigenschaften sind kategorische Metadaten (typische Beispiele sind IDs, Länder, Kontrahenten usw.)
- Nummernbenutzereigenschaften sind numerische Metadaten (typ. Beispiele sind NPS, E-Mail-Statistiken, Beträge usw.)
Nachdem Sie alle Benutzereigenschaften ausgewählt haben, klicken Sie auf „ Hochladen“.
Sie werden dann aufgefordert, die hochgeladenen Nachrichten in einem Dataset zu überprüfen, der die Quelle enthält, in die Sie Daten hochgeladen haben. Wenn die Quelle noch keinen Datasets zugeordnet ist, können Sie ein neues erstellen, um zu überprüfen, ob der Upload wie erwartet ist.
Wir hoffen, dass Ihr Upload reibungslos funktioniert, aber es ist möglich, dass während des Upload-Vorgangs ein Problem auftritt und eine Fehlermeldung angezeigt wird. Im Folgenden finden Sie einige davon und warum sie auftreten, damit Sie sie lösen oder vermeiden können.
In den folgenden Fehlermeldungen wird {something} kontextbezogenen Informationen darüber zugeordnet, wo der Fehler aufgetreten ist. Darüber hinaus wird die Art und Weise, wie auf eine Position in der Datei verwiesen wird, standardisiert:
String | Erweitert auf: |
---|---|
{Position} | Datensatz {row-number} in Zeile {line-number} Spalte {column-number} (Byte {byte-number}) |
Hier sind einige mögliche Fehlermeldungen, die beim Hochladen von CSV-Dateien auftreten können:
Fehlerart | Fehlermeldung | Beschreibung |
---|---|---|
Nicht genügend Spalten | Die CSV-Datei enthält nur {number-columns} Spalte(n), aber mindestens 3 sind erforderlich (Text, Zeitstempel und ID). | Die hochgeladene CSV-Datei enthält nicht mindestens drei Spalten, oder die Plattform hat die Codierung der Datei falsch erkannt. |
Ungültige Codierung | Die Datei enthält ungültige Zeichen (Codierung erkannt als {detected-encoding}) | Die Datei ist nicht korrekt als UTF-8/UTF-16/UTF-32 codiert (die Plattform erkennt das Format der Datei automatisch). |
Ungültiger Header | string:ti:er' does not match'(^delimiter|id|message|timestamp |timestamp_default_utc_offset |timestamp_day_first|timestamp_year_first\\Z)|(^(?P<property_type>number|string):(?P<name>\\w(?:[\\w]{0,30}\\w)?)\\Z)' | Wenn ein Spaltenheader ein ungültiger Name für eine Benutzereigenschaft ist, gibt die Plattform die Standardmeldung für den Fall zurück, dass das Schema einer Anforderung ungültig ist. Stellen Sie sicher, dass jeder Spaltenheader ein gültiges Format für seinen Zweck hat. Die maximale Länge für einen Spaltenheader beträgt 32 alphanumerische Zeichen |
Ungleiche Zeilenlängen | Die CSV-Datei enthält ungleiche Zeilenlängen. Nachricht {position} hat {number} Felder, aber der vorherige Datensatz hat {number} Felder. | Die CSV-Datei enthält Zeilen mit unterschiedlicher Anzahl von Zellen oder die nicht mit der Anzahl der Header übereinstimmen. |
ID-Format | Ungültige Nachrichten-ID für {record}. IDs dürfen nur aus alphanumerischen ASCII-Zeichen und Interpunktion bestehen (außer „/“). Zellenwert: {cell-value} | Dieser Fehler tritt auf, wenn ein ID-Feld aus ungültigen Zeichen besteht, wie in der Fehlermeldung beschrieben. |
ID-Länge | ID ist zu lang für Nachricht {record}. Sie weist {number} Bytes auf, höchstens 1024 erwartet | Dieser Fehler tritt auf, wenn ein ID-Feld länger als die maximal zulässige Länge (1024 Zeichen) ist. |
Zeitstempelformat | Falsch formatierter Zeitstempel in Nachricht {position}: {timestamp-error-message}. Zellenwert: {cell-value} | Dieser Fehler tritt auf, wenn ein Zeitstempelfeld nicht geparst werden konnte. |
Nachrichtenlänge | Nachricht ist zu lang für Nachricht {position}. Sie hat {number} Bytes, höchstens 65536 erwartet | Dieser Fehler tritt auf, wenn ein Nachrichtenfeld länger als die maximal zulässige Länge (65536 Zeichen) ist. |
Format der Zahleneigenschaft | Falsch formatierte Zahl in Nachricht {position}: {number-error-message}. Zellenwert: {cell-value} | Dieser Fehler tritt auf, wenn ein Benutzereigenschaftsfeld einer Zahl nicht geparst werden konnte. Die Plattform sollte jedes Format zulassen, das sinnvoll als Zahl decodiert werden kann. |
Eigenschaftslänge | Eigenschaft ist zu lang für Nachricht {position}. Sie hat {number} Bytes, höchstens 4096 erwartet | Dieser Fehler tritt auf, wenn ein Benutzereigenschaftsfeld länger als die maximal zulässige Länge (4096 Zeichen) ist. |
Unbekannter Fehler | Unbekannter CSV-Fehler: {underlying-error-message} | Die obige Liste ist nicht vollständig – wenn ein unbekannter Fehler auftritt, wiederholen Sie den Upload. |