document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white
Document Understanding-Benutzerhandbuch.
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 15. Nov. 2024

Intelligenter Schlüsselwortklassifizierer

Zweck des Intelligent Keyword Classifier

Der Intelligent Keyword Classifier ist ein Klassifizierer, der den Wortvektor verwendet, den er von Dateien bestimmter Dokumenttypen lernt, um die Dokumentklassifizierung durchzuführen.

Der Algorithmus basiert auf dem Konzept der Wiederholung von Inhalten für den gleichen Dokumenttyp und beginnt mit der Annahme, dass Dokumenttypen eine Reihe von Wörtern haben, die normalerweise in diesen Dokumenttypen vorkommen, wodurch eine Vektorähnlichkeitsberechnung möglich ist.

Beim Klassifizieren einer Datei in einen Dokumenttyp führt der Intelligent Keyword Classifier folgende Aktionen aus:

  • Er findet den nächsten Wortvektor, dem eine Datei ähnlicher ist,
  • Er meldet den Dokumenttyp mit der höchsten Bewertung für die zugrundeliegenden übereinstimmenden Hauptwörter.

Der Intelligent Keyword Classifier verfügt auch über Funktionen zur Aufteilung von Dateien, was bedeutet, dass er mehr als eine Klasse für eine bestimmte Datei bei separaten Seitenbereichen melden kann.

Hinweis: Im Gegensatz zum schlüsselwortbasierten Klassifizierer müssen Sie beim Training des intelligenten Schlüsselwortklassifizierers keine Verweise im Dokument manuell auswählen und alle derartigen Verweise, die zum Trainingszeitpunkt bereitgestellt werden, werden ignoriert.

Einsatzbereich

Dieser Klassifizierer eignet sich, wenn:

  • Ihre Dateien einen oder mehrere Dokumenttypen in einer einzelnen Datei enthalten.
  • Ihre Dokumenttypen sich relativ einfach durch den Inhalt unterscheiden lassen.
Hinweis: Ab Version 6.9.0 wurde die Aufteilungsleistung für die Aktivität Intelligent Keyword Classifier verbessert. Für eine optimierte Aufteilungsleistung verwenden Sie Version 6.9.0 oder höher.

Spezielle Anforderungen

Sie müssen Ihren Automation CloudTM Document UnderstandingTM -API-Schlüssel verwenden oder Ihre eigene Instanz des Intelligent Keyword Classifier im lokalen AI Center hosten, um diesen Klassifizierer zu verwenden.

Wie trainiert wird

Platzieren Sie die Aktivität Intelligent Keyword Classifier Trainer in einen Train Classifiers Scope und konfigurieren Sie sie entsprechend.

Wir können die Konsistenz der Trainingsdatei über parallele Trainings auf Aktivitätsebene hinweg nicht erzwingen. Zwei mögliche Lösungen für dieses Problem bietet der Document Understanding-Prozess. Beide bestehen aus der Steuerung des Datenverkehrs:

  1. Dateien sperren (standardmäßig im Prozess implementiert): Geben Sie der Datei die Dateierweiterung .lock, ändern und speichern Sie die Datei und benennen Sie die Datei dann erneut um, indem Sie die Erweiterung .lock wieder entfernen.
  2. Eine spezielle Warteschlange manuell einrichten: Erstellen Sie eine leere Warteschlange im Orchestrator und integrieren Sie Ihre beiden Aktivitäten aus dem Projekt.

Weitere Informationen zum Trainieren eines Klassifizierers finden Sie auf dieser Seite, auf der die Verwendung des Assistenten zum Verwalten der Lernfunktion beschrieben wird.

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten