Communications Mining
Neuestes
False
Bannerhintergrundbild
Communications Mining-Benutzerhandbuch
Letzte Aktualisierung 18. Apr. 2024

Hochladen einer CSV-Datei in eine Quelle

Benutzerberechtigungen erforderlich: „Sources admin“ UND „Nachrichten bearbeiten“.

Hinweis: In diesem Artikel wird veranschaulicht, wie Daten aus einer CSV-Datei in eine vorhandene Datenquelle hochgeladen werden. Informationen zum Erstellen einer Datenquelle über die GUI finden Sie hier.
Wichtige Schritte
Hinweis: Wenn vorhandene Nachrichten in einer Quelle aktualisiert werden, muss das Ändern von Nachrichteneigenschaften (z. B Nachrichtentext, gesendet_um Zeitstempel und „to“ oder „from“), die nicht Benutzereigenschaften sind, dazu führen, dass Entitätsanmerkungen in zugeordneten Datasets verloren gehen. Es wird dringend empfohlen, vorher die neueste Modellversion in den zugehörigen Datasets anzuheften.

Um Daten aus einer CSV-Datei in eine Datenquelle hochzuladen, navigieren Sie zur Seite Quellen (über die Administratorkonsole, Zugriff über das Zahnrad oben rechts auf Ihrer Seite) und suchen Sie die Quelle, in die Sie Daten hochladen möchten.

Klicken Sie auf das Upload-Symbol in der oberen rechten Ecke der Datenquellenkarte (wie unten gezeigt).

Datenquellenkarte

Klicken Sie dann auf „Datei auswählen“ und wählen Sie die CSV-Datei aus, die Sie hochladen möchten.

Die ausgewählte Datei muss die folgenden Kriterien erfüllen:

  • Die Datei muss Header in der ersten Zeile enthalten und durch Kommas oder Tabstopps getrennt sein
  • Mindestens drei Spalten sind erforderlich: der Nachrichtentextinhalt (die Nachricht), ein Zeitstempel und eine eindeutige ID, die die Nachricht identifiziert
  • Alle Textfelder in Ihrer CSV-Datei müssen von doppelten Anführungszeichen umgeben sein
  • Die Datei muss entweder als UTF-8, UTF-16 oder UTF-32 codiert sein (die Plattform erkennt automatisch welche).
  • Die CSV-Datei darf höchstens 64 MiB haben. Wenn Sie eine größere Datei haben, können Sie sie dennoch hochladen, indem Sie sie in mehrere Dateien mit jeweils weniger als 64 MiB aufteilen
CSV-Uploadseite – Schritt 1

Wenn Ihre Datei die obigen Kriterien erfüllt, können Sie die Meldungen im nächsten Schritt konfigurieren und hochladen:

CSV-Uploadseite – Schritt 2

Wählen Sie die erforderlichen Spalten aus jeder der Dropdownlisten aus, die die in der CSV-Datei erkannten Spaltenheader enthalten:

  • Spalte „ID“:
    • Dies muss eine Spalte sein, die eine eindeutige ID enthält, die die Nachricht identifizieren kann
    • Die Nachrichten-IDs dürfen nur alphanumerische ASCII-Zeichen (AZ az 0-9) und Interpunktion (außer /) enthalten.
    • Hinweis: Wenn in der Quelle Nachrichten mit derselben ID vorhanden sind, werden sie aktualisiert, um dem Inhalt der neuen Datei zu entsprechen
  • Nachrichtenspalte:
    • Dies ist einfach die Spalte, die den Nachrichtentext enthält, den Sie in der Plattform analysieren möchten
  • Zeitstempel-Spalte:
    • Diese Spalte enthält das Datum und die Uhrzeit, zu der die Nachricht aufgezeichnet wurde
    • Das Zeitstempelformat ist flexibel und wird automatisch von der Plattform abgeleitet

Wenn Sie Daten haben, die Betreffzeilen, Threads oder Teilnehmer enthalten (normalerweise in Fällen oder E-Mail-Threads zu sehen), können Sie auch diese zusätzlichen Spalten in Ihrer CSV-Datei hochladen:

  • Spalte „Betreff“
    • Wählen Sie aus, welche Spalte den Betreff der Nachricht enthält
  • Spalte „Absender“
    • Wählen Sie aus, welche Spalte den Absender enthält
  • Spalte „Ab“
    • Wählen Sie aus, welche Spalte die Empfänger enthält. Mehrere Empfänger müssen durch Semikolon getrennt werden.
  • Spalte „Cc“
    • Wählen Sie aus, welche Spalte die Cc-Empfänger enthält. Mehrere Empfänger müssen durch Semikolon getrennt werden
  • Spalte „Thread-ID“
    • Wählen Sie die Spalte aus, die die Meldung Thread-ID enthält
    • Eine Thread-ID verknüpft verschiedene Nachrichten mit demselben Thread

Absender-/An-/CC-Format:

  • Die folgenden Bedingungen in den Feldern „Absender/An/CC“ lösen Fehler aus:
    • Überschreitet die maximale Anzahl von Empfängern (max. 2048 Empfänger pro Thread)
    • Absender oder Empfänger überschreitet das maximale Zeichenlimit (max. 512 Zeichen pro Empfänger).
    • Zwei oder mehr Semikolons befinden sich in einer Zeile (z. B. ist Folgendes falsch formatiert: john@email.com ; beth@email.com).
  • Die Plattform entfernt zwar alle Leerzeichen vor oder nach einem Empfänger, führt jedoch keine zusätzliche Datenbereinigung durch.
    • Beispielformate, in denen Sie Ihre Daten haben möchten (keine vollständige Liste):
      • Beispiel 1 –Roboter REG <rob.bog@gmail.com>; John Smith <john.smith@gmail.com>
      • Beispiel 2 – rob.bog@gmail.com ;john.smith@gmail.com
      • Beispiel 3 – rob.bog@gmail.com ; john.smith@gmail.com
  • Die Plattform trennt die verschiedenen Empfänger durch ein Semikolon (;)
  • Stellen Sie vor dem Hochladen Ihrer Daten sicher, dass die E-Mails in einem geeigneten Format formatiert sind
  • Beachten Sie, dass bei einem typischen Anwendungsfall mit Threads (z. B. E-Mails) in jeder Zelle vom Typ „Absender“ nur ein Absender vorhanden sein darf

Zeitstempelformat:

  • Wenn das gewählte Zeitstempelformat für die Reihenfolge der Tage/Monate/Jahre nicht eindeutig ist (z. B 01/02/03 10:10) können Sie die richtige Interpretation vorschlagen:
    • 2. Januar 2003 - Keine
    • 1. Februar 2003 – Tag zuerst
    • 3. Februar 2001 – Jahr zuerst
    • 2. März 2001 – Tag zuerst + Jahr zuerst
  • Um Mehrdeutigkeiten zu vermeiden, wird empfohlen, Zeitstempel nach Möglichkeit im RFC 3339-Format anzugeben (z. B 2020-01-31T12:34:56Z für UTC oder mit einer Zeitzone: 2020-08-031T11:20:60-08:00)

Wählen Sie dann die zusätzlichen Benutzereigenschaften aus, die Sie mit den Nachrichten hochladen möchten. Benutzereigenschaften sind kontextbezogene Metadaten, die jeder Nachricht zugeordnet sind und auf der Plattform filterbar sind. Diese werden potenziell auch von den Machine-Learning-Modellen in der Plattform verwendet. Es gibt zwei Typen, entweder Zeichenfolge oder Zahl:

  • String-Benutzereigenschaften sind kategorische Metadaten (typische Beispiele sind IDs, Länder, Kontrahenten usw.)
  • Nummernbenutzereigenschaften sind numerische Metadaten (typ. Beispiele sind NPS, E-Mail-Statistiken, Beträge usw.)
Hinweis:

Wenn Ihre Datei eine NPS-Punktzahl als Benutzereigenschaft enthält, muss diese als Zahleneigenschaft aufgenommen werden und darf nur „NPS“ heißen, damit native NPS-Diagramme in der Plattform geladen werden.

Nachdem Sie alle Benutzereigenschaften ausgewählt haben, klicken Sie auf „ Hochladen“.

Sie werden dann aufgefordert, die hochgeladenen Nachrichten in einem Dataset zu überprüfen, der die Quelle enthält, in die Sie Daten hochgeladen haben. Wenn die Quelle noch keinen Datasets zugeordnet ist, können Sie ein neues erstellen, um zu überprüfen, ob der Upload wie erwartet ist.

Hinweis:

Wenn Sie bei der Auswahl der Benutzereigenschaften einen Fehler gemacht haben, können Sie dieselbe Datei erneut hochladen und die Plattform verwendet dann die Spalten-ID als Bezeichner, um die vorhandenen Nachrichten und Eigenschaften zu überschreiben (dies hat keine Auswirkungen auf Beschriftungen vorhandener Nachrichten).

Fehlersuche und ‑behebung

Wir hoffen, dass Ihr Upload reibungslos funktioniert, aber es ist möglich, dass während des Upload-Vorgangs ein Problem auftritt und eine Fehlermeldung angezeigt wird. Im Folgenden finden Sie einige davon und warum sie auftreten, damit Sie sie lösen oder vermeiden können.

In den folgenden Fehlermeldungen wird {something} kontextbezogenen Informationen darüber zugeordnet, wo der Fehler aufgetreten ist. Darüber hinaus wird die Art und Weise, wie auf eine Position in der Datei verwiesen wird, standardisiert:

StringErweitert auf:
{Position}Datensatz {row-number} in Zeile {line-number} Spalte {column-number} (Byte {byte-number})
Der Titel der Fehlermeldung wird zusammen mit einer Beschreibung angezeigt, wie unten gezeigt:


Hier sind einige mögliche Fehlermeldungen, die beim Hochladen von CSV-Dateien auftreten können:

FehlerartFehlermeldungBeschreibung
Nicht genügend SpaltenDie CSV-Datei enthält nur {number-columns} Spalte(n), aber mindestens 3 sind erforderlich (Text, Zeitstempel und ID).Die hochgeladene CSV-Datei enthält nicht mindestens drei Spalten, oder die Plattform hat die Codierung der Datei falsch erkannt.
Ungültige CodierungDie Datei enthält ungültige Zeichen (Codierung erkannt als {detected-encoding})Die Datei ist nicht korrekt als UTF-8/UTF-16/UTF-32 codiert (die Plattform erkennt das Format der Datei automatisch).
Ungültiger Headerstring:ti:er' does not match'(^delimiter|id|message|timestamp |timestamp_default_utc_offset |timestamp_day_first|timestamp_year_first\\Z)|(^(?P<property_type>number|string):(?P<name>\\w(?:[\\w]{0,30}\\w)?)\\Z)'Wenn ein Spaltenheader ein ungültiger Name für eine Benutzereigenschaft ist, gibt die Plattform die Standardmeldung für den Fall zurück, dass das Schema einer Anforderung ungültig ist. Stellen Sie sicher, dass jeder Spaltenheader ein gültiges Format für seinen Zweck hat. Die maximale Länge für einen Spaltenheader beträgt 32 alphanumerische Zeichen
Ungleiche ZeilenlängenDie CSV-Datei enthält ungleiche Zeilenlängen. Nachricht {position} hat {number} Felder, aber der vorherige Datensatz hat {number} Felder.Die CSV-Datei enthält Zeilen mit unterschiedlicher Anzahl von Zellen oder die nicht mit der Anzahl der Header übereinstimmen.
ID-FormatUngültige Nachrichten-ID für {record}. IDs dürfen nur aus alphanumerischen ASCII-Zeichen und Interpunktion bestehen (außer „/“). Zellenwert: {cell-value} Dieser Fehler tritt auf, wenn ein ID-Feld aus ungültigen Zeichen besteht, wie in der Fehlermeldung beschrieben.
ID-LängeID ist zu lang für Nachricht {record}. Sie weist {number} Bytes auf, höchstens 1024 erwartetDieser Fehler tritt auf, wenn ein ID-Feld länger als die maximal zulässige Länge (1024 Zeichen) ist.
ZeitstempelformatFalsch formatierter Zeitstempel in Nachricht {position}: {timestamp-error-message}. Zellenwert: {cell-value}Dieser Fehler tritt auf, wenn ein Zeitstempelfeld nicht geparst werden konnte.
NachrichtenlängeNachricht ist zu lang für Nachricht {position}. Sie hat {number} Bytes, höchstens 65536 erwartetDieser Fehler tritt auf, wenn ein Nachrichtenfeld länger als die maximal zulässige Länge (65536 Zeichen) ist.
Format der ZahleneigenschaftFalsch formatierte Zahl in Nachricht {position}: {number-error-message}. Zellenwert: {cell-value}Dieser Fehler tritt auf, wenn ein Benutzereigenschaftsfeld einer Zahl nicht geparst werden konnte. Die Plattform sollte jedes Format zulassen, das sinnvoll als Zahl decodiert werden kann.
EigenschaftslängeEigenschaft ist zu lang für Nachricht {position}. Sie hat {number} Bytes, höchstens 4096 erwartetDieser Fehler tritt auf, wenn ein Benutzereigenschaftsfeld länger als die maximal zulässige Länge (4096 Zeichen) ist.
Unbekannter FehlerUnbekannter CSV-Fehler: {underlying-error-message}Die obige Liste ist nicht vollständig – wenn ein unbekannter Fehler auftritt, wiederholen Sie den Upload.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
UiPath Logo weiß
Vertrauen und Sicherheit
© 2005-2024 UiPath. All rights reserved.