Communications Mining
Neuestes
False
Bannerhintergrundbild
Communications Mining-Benutzerhandbuch
Letzte Aktualisierung 18. Apr. 2024

Grundlegendes zu Entitäten

Was sind Entitäten?

Entitäten sind zusätzliche Elemente strukturierter Daten, die aus den Nachrichten in Ihrem Dataset extrahiert werden können. Zu den Entitäten gehören Datenpunkte wie Geldmengen, Datumsangaben, Währungscodes, E-Mail-Adressen, URLs sowie viele andere branchenspezifische Kategorien (ein Beispiel finden Sie unten).

Beispiel für eine E-Mail-Nachricht mit Adresszeile, Stadtname und vorhergesagten Richtliniennummernentitäten

Im Gegensatz zu Labels kann die Plattform die meisten Entitäten (mit Ausnahme der von Grund auf trainierten) vorhersagen, sobald sie aktiviert sind, da sie basierend auf ihrem typischen oder in einigen Fällen sehr spezifischen Format und einem Trainingssatz ähnlicher Entitäten identifiziert werden kann .

Wie bei Beschriftungen können Benutzer Entitäten akzeptieren oder ablehnen, die korrekt oder falsch vorhergesagt wurden, wodurch die Fähigkeit des Modells verbessert wird, sie in Zukunft zu identifizieren.

Entitätstypen

Derzeit gibt es zwei Haupttypen von Entitäten:

  • Vortrainierte Entitäten , die in der Regel auf einem Satz von Standard- oder benutzerdefinierten Regeln basieren – z. B Monetäre Menge, URL und Datum
  • Entitäten, die von einem Benutzer von Grund auf trainiert wurden (wie sie Beschriftungen trainieren würden), die auf Machine Learning basieren

Trainierbare und nicht trainierbare Entitäten

Alle Entitäten sind entweder von vornherein „trainierbar“(Entitäten, die von Grund auf trainiert wurden) oder können „trainierbar“ gemacht werden, wenn sie aktiviert sind (alle anderen Entitätsarten).

„Trainierbare“ Entitäten sind solche, die basierend auf den von den Benutzern bereitgestellten Trainings live in der Plattform aktualisiert werden. Weitere Informationen zu Trainingsentitäten finden Sie hier.

Wenn Sie das Training für eine vortrainierte Entität aktivieren , die in der Regel auf einem Satz von Standard- oder benutzerdefinierten Regeln basiert, können Sie das Verständnis der Plattform für diese Entität innerhalb der Parameter dieser Regeln verfeinern. Im Wesentlichen werden weitere Trainings zu diesen Optionen den Umfang der Informationen, die die Plattform als diese Entität betrachten kann, reduzieren, aber nicht erweitern.

Dies liegt daran, dass viele dieser Entitäten, wie Datumsangaben (z. B 'Morgen') und Geldmengen (z. B 20 Pfund) in ein strukturiertes Datenformat für nachgelagerte Systeme normalisiert werden müssen. Auch für Entitäten wie ISINs oder CUSIPs müssen diese ein festgelegtes Format haben. Die Plattform sollte also nicht trainiert werden, um etwas vorherzusagen, das nicht ihren definierten Formaten entspricht.

Wenn trainierbare Entitäten zugewiesen werden, betrachtet die Plattform sowohl den Text der Entität als auch den Kontext der Entität innerhalb der restlichen Kommunikation, d. h. was vor und nach dem Entitätswert geschieht (im selben Absatz und das oben und unten). Es lernt, die Entität basierend auf den Werten selbst besser vorherzusagen sowie darauf, wie der Wert im Kontext der Kommunikation erscheint.

Wenn eine vortrainierte Entität nicht als trainierbar festgelegt ist (siehe Details zum Aktivieren von Entitäten in einem Dataset hier), können Benutzer die Entitätsvorhersagen, die sie in ihrem Dataset sehen, dennoch akzeptieren oder ablehnen. Sie werden offline mit diesem plattforminternen Feedback der Benutzer aktualisiert und verfeinert. Daher ist es für Benutzer weiterhin hilfreich, diese Entitäten beim Überprüfen von Nachrichten zu akzeptieren oder abzulehnen.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
UiPath Logo weiß
Vertrauen und Sicherheit
© 2005-2024 UiPath. All rights reserved.