communications-mining

latest

false

Wichtig :

Communications Mining ist jetzt Teil von UiPath IXP. Weitere Informationen finden Sie in der Einführung im Benutzerleitfaden. Dieser Inhalt wurde maschinell übersetzt. Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Communications Mining-Benutzerhandbuch

Letzte Aktualisierung 25. März 2025

Hochladen einer CSV-Datei in eine Quelle

Benutzerberechtigungen erforderlich: „Sources admin“ UND „Nachrichten bearbeiten“.

Hinweis: In diesem Artikel wird veranschaulicht, wie Daten aus einer CSV-Datei in eine vorhandene Datenquelle hochgeladen werden. Informationen zum Erstellen einer Datenquelle über die GUI finden Sie hier.

Wichtige Schritte

Hinweis: Wenn vorhandene Nachrichten in einer Quelle aktualisiert werden, muss das Ändern von Nachrichteneigenschaften (z. B Nachrichtentext, gesendet_um Zeitstempel und „to“ oder „from“), die nicht Benutzereigenschaften sind, dazu führen, dass allgemeine Feldanmerkungen in zugeordneten Datasets verloren gehen. Es wird dringend empfohlen, vorher die neueste Modellversion in den zugehörigen Datasets anzuheften.

Um Daten aus einer CSV-Datei in eine Datenquelle hochzuladen, navigieren Sie zur Seite Quellen (über die Administratorkonsole, Zugriff über das Zahnrad oben rechts auf Ihrer Seite) und suchen Sie die Quelle, in die Sie Daten hochladen möchten.

Wählen Sie das Uploadsymbol in der oberen rechten Ecke der Datenquellenkarte aus (wie unten gezeigt).

Klicken Sie dann auf „Datei auswählen“ und wählen Sie die CSV-Datei aus, die Sie hochladen möchten.

Die ausgewählte Datei muss die folgenden Kriterien erfüllen:

Die Datei muss Header in der ersten Zeile enthalten und durch Kommas oder Tabstopps getrennt sein
Mindestens drei Spalten sind erforderlich: der Nachrichtentextinhalt (die Nachricht), ein Zeitstempel und eine eindeutige ID, die die Nachricht identifiziert
Alle Textfelder in Ihrer CSV-Datei müssen von doppelten Anführungszeichen umgeben sein
Die Datei muss entweder als UTF-8, UTF-16 oder UTF-32 codiert sein (die Plattform erkennt automatisch welche).
Die CSV-Datei darf höchstens 64 MiB haben. Wenn Sie eine größere Datei haben, können Sie sie dennoch hochladen, indem Sie sie in mehrere Dateien mit jeweils weniger als 64 MiB aufteilen

Wenn Ihre Datei die obigen Kriterien erfüllt, können Sie die Meldungen im nächsten Schritt konfigurieren und hochladen:

Wählen Sie die erforderlichen Spalten aus jeder der Dropdownlisten aus, die die in der CSV-Datei erkannten Spaltenheader enthalten:

Spalte „ID“:
- Dies muss eine Spalte sein, die eine eindeutige ID enthält, die die Nachricht identifizieren kann
- Die Nachrichten-IDs dürfen nur alphanumerische ASCII-Zeichen (AZ az 0-9) und Interpunktion (außer /) enthalten.
- Hinweis: Wenn in der Quelle Nachrichten mit derselben ID vorhanden sind, werden sie aktualisiert, um dem Inhalt der neuen Datei zu entsprechen
Nachrichtenspalte:
- Dies ist einfach die Spalte, die den Nachrichtentext enthält, den Sie in der Plattform analysieren möchten
Zeitstempel-Spalte:
- Diese Spalte enthält das Datum und die Uhrzeit, zu der die Nachricht aufgezeichnet wurde
- Das Zeitstempelformat ist flexibel und wird automatisch von der Plattform abgeleitet

Wenn Sie Daten haben, die Betreffzeilen, Threads oder Teilnehmer enthalten (normalerweise in Fällen oder E-Mail-Threads zu sehen), können Sie auch diese zusätzlichen Spalten in Ihrer CSV-Datei hochladen:

Spalte „Betreff“
- Wählen Sie aus, welche Spalte den Betreff der Nachricht enthält
Spalte „Absender“
- Wählen Sie aus, welche Spalte den Absender enthält
Spalte „Ab“
- Wählen Sie aus, welche Spalte die Empfänger enthält. Mehrere Empfänger müssen durch Semikolon getrennt werden.
Spalte „Cc“
- Wählen Sie aus, welche Spalte die Cc-Empfänger enthält. Mehrere Empfänger müssen durch Semikolon getrennt werden
Spalte „Thread-ID“
- Wählen Sie die Spalte aus, die die Meldung Thread-ID enthält
- Eine Thread-ID verknüpft verschiedene Nachrichten mit demselben Thread

Absender-/An-/CC-Format:

Die folgenden Bedingungen in den Feldern „Absender/An/CC“ lösen Fehler aus:
- Überschreitet die maximale Anzahl von Empfängern (max. 2048 Empfänger pro Thread)
- Absender oder Empfänger überschreitet das maximale Zeichenlimit (max. 512 Zeichen pro Empfänger).
- Zwei oder mehr Semikolons befinden sich in einer Zeile (z. B. ist Folgendes falsch formatiert: john@email.com ; beth@email.com).
Die Plattform entfernt zwar alle Leerzeichen vor oder nach einem Empfänger, führt jedoch keine zusätzliche Datenbereinigung durch.
- Beispielformate, in denen Sie Ihre Daten haben möchten (keine vollständige Liste):
  - Beispiel 1 –Roboter REG <rob.bog@gmail.com>; John Smith <john.smith@gmail.com>
  - Beispiel 2 – rob.bog@gmail.com ;john.smith@gmail.com
  - Beispiel 3 – rob.bog@gmail.com ; john.smith@gmail.com
Die Plattform trennt die verschiedenen Empfänger durch ein Semikolon (;)
Stellen Sie vor dem Hochladen Ihrer Daten sicher, dass die E-Mails in einem geeigneten Format formatiert sind
Beachten Sie, dass bei einem typischen Anwendungsfall mit Threads (z. B. E-Mails) in jeder Zelle vom Typ „Absender“ nur ein Absender vorhanden sein darf

Zeitstempelformat:

Wenn das gewählte Zeitstempelformat für die Reihenfolge der Tage/Monate/Jahre nicht eindeutig ist (z. B 01/02/03 10:10) können Sie die richtige Interpretation vorschlagen:
- 2. Januar 2003 - Keine
- 1. Februar 2003 – Tag zuerst
- 3. Februar 2001 – Jahr zuerst
- 2. März 2001 – Tag zuerst + Jahr zuerst
Um Mehrdeutigkeiten zu vermeiden, wird empfohlen, Zeitstempel nach Möglichkeit im RFC 3339-Format anzugeben (z. B 2020-01-31T12:34:56Z für UTC oder mit einer Zeitzone: 2020-08-031T11:20:60-08:00)

Wählen Sie dann die zusätzlichen Benutzereigenschaften aus, die Sie mit den Nachrichten hochladen möchten. Benutzereigenschaften sind kontextbezogene Metadaten, die jeder Nachricht zugeordnet sind und auf der Plattform filterbar sind. Diese werden potenziell auch von den Machine-Learning-Modellen in der Plattform verwendet. Es gibt zwei Typen, entweder Zeichenfolge oder Zahl:

String-Benutzereigenschaften sind kategorische Metadaten (typische Beispiele sind IDs, Länder, Kontrahenten usw.)
Nummernbenutzereigenschaften sind numerische Metadaten (typ. Beispiele sind NPS, E-Mail-Statistiken, Beträge usw.)

Hinweis: Wenn Ihre Datei eine NPS-Punktzahl als Benutzereigenschaft enthält, muss diese als Zahleneigenschaft enthalten sein und nur den Namen „NPS“ haben, damit native NPS-Diagramme in die Plattform geladen werden.

Nachdem Sie alle Benutzereigenschaften ausgewählt haben, klicken Sie auf „ Hochladen“.

Sie werden dann aufgefordert, die hochgeladenen Nachrichten in einem Dataset zu überprüfen, der die Quelle enthält, in die Sie Daten hochgeladen haben. Wenn die Quelle noch keinen Datasets zugeordnet ist, können Sie ein neues erstellen, um zu überprüfen, ob der Upload wie erwartet ist.

Note: If you made a mistake when selecting the user properties you can re-upload the same file, and the platform will use the column ID as the identifier to overwrite the existing messages and properties (this will not affect any labels applied to existing messages ).

Fehlersuche und ‑behebung

Hinweis: Wenn Ihr CSV-Upload während des Uploads fehlschlägt, können Sie dieselbe CSV-Datei erneut hochladen, nachdem Sie den/die Fehler behoben haben. Wenn die Nachrichten-IDs und der Text (Betreff und Text) bereits hochgeladener Nachrichten unverändert bleiben, werden Ihnen beim Wiederholen des Uploads keine zusätzlichen AI Units in Rechnung gestellt.

Wir hoffen, dass Ihr Upload reibungslos funktioniert, aber es ist möglich, dass während des Upload-Vorgangs ein Problem auftritt und eine Fehlermeldung angezeigt wird. Im Folgenden finden Sie einige davon und warum sie auftreten, damit Sie sie lösen oder vermeiden können.

In den folgenden Fehlermeldungen wird {something} kontextbezogenen Informationen darüber zugeordnet, wo der Fehler aufgetreten ist. Darüber hinaus wird die Art und Weise, wie auf eine Position in der Datei verwiesen wird, standardisiert:

String	Erweitert auf:
{Position}	Datensatz {row-number} in Zeile {line-number} Spalte {column-number} (Byte {byte-number})

Der Titel der Fehlermeldung wird zusammen mit einer Beschreibung angezeigt, wie unten gezeigt:

Hier sind einige mögliche Fehlermeldungen, die beim Hochladen von CSV-Dateien auftreten können:

Fehlerart	Fehlermeldung	Beschreibung
Nicht genügend Spalten	Die CSV-Datei enthält nur {number-columns} Spalte(n), aber mindestens 3 sind erforderlich (Text, Zeitstempel und ID).	Die hochgeladene CSV-Datei enthält nicht mindestens drei Spalten, oder die Plattform hat die Codierung der Datei falsch erkannt.
Ungültige Codierung	Die Datei enthält ungültige Zeichen (Codierung erkannt als {detected-encoding})	Die Datei ist nicht korrekt als UTF-8/UTF-16/UTF-32 codiert (die Plattform erkennt das Format der Datei automatisch).
Ungültiger Header	string:ti:er' does not match'(^delimiter\|id\|message\|timestamp \|timestamp_default_utc_offset \|timestamp_day_first\|timestamp_year_first\\Z)\|(^(?P<property_type>number\|string):(?P<name>\\w(?:[\\w]{0,30}\\w)?)\\Z)'	Wenn ein Spaltenheader ein ungültiger Name für eine Benutzereigenschaft ist, gibt die Plattform die Standardmeldung für den Fall zurück, dass das Schema einer Anforderung ungültig ist. Stellen Sie sicher, dass jeder Spaltenheader ein gültiges Format für seinen Zweck hat. Die maximale Länge für einen Spaltenheader beträgt 32 alphanumerische Zeichen
Ungleiche Zeilenlängen	Die CSV-Datei enthält ungleiche Zeilenlängen. Nachricht {position} hat {number} Felder, aber der vorherige Datensatz hat {number} Felder.	Die CSV-Datei enthält Zeilen mit unterschiedlicher Anzahl von Zellen oder die nicht mit der Anzahl der Header übereinstimmen.
ID-Format	Ungültige Nachrichten-ID für {record}. IDs dürfen nur aus alphanumerischen ASCII-Zeichen und Interpunktion bestehen (außer „/“). Zellenwert: {cell-value}	Dieser Fehler tritt auf, wenn ein ID-Feld aus ungültigen Zeichen besteht, wie in der Fehlermeldung beschrieben.
ID-Länge	ID ist zu lang für Nachricht {record}. Sie weist {number} Bytes auf, höchstens 1024 erwartet	Dieser Fehler tritt auf, wenn ein ID-Feld länger als die maximal zulässige Länge (1024 Zeichen) ist.
Zeitstempelformat	Falsch formatierter Zeitstempel in Nachricht {position}: {timestamp-error-message}. Zellenwert: {cell-value}	Dieser Fehler tritt auf, wenn ein Zeitstempelfeld nicht geparst werden konnte.
Nachrichtenlänge	Nachricht ist zu lang für Nachricht {position}. Sie hat {number} Bytes, höchstens 65536 erwartet	Dieser Fehler tritt auf, wenn ein Nachrichtenfeld länger als die maximal zulässige Länge (65536 Zeichen) ist.
Format der Zahleneigenschaft	Falsch formatierte Zahl in Nachricht {position}: {number-error-message}. Zellenwert: {cell-value}	Dieser Fehler tritt auf, wenn ein Benutzereigenschaftsfeld einer Zahl nicht geparst werden konnte. Die Plattform sollte jedes Format zulassen, das sinnvoll als Zahl decodiert werden kann.
Eigenschaftslänge	Eigenschaft ist zu lang für Nachricht {position}. Sie hat {number} Bytes, höchstens 4096 erwartet	Dieser Fehler tritt auf, wenn ein Benutzereigenschaftsfeld länger als die maximal zulässige Länge (4096 Zeichen) ist.
Unbekannter Fehler	Unbekannter CSV-Fehler: {underlying-error-message}	Die obige Liste ist nicht vollständig – wenn ein unbekannter Fehler auftritt, wiederholen Sie den Upload.