- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Zahlungsbelege – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Unterstützte Sprachen
- Deep Learning
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)

Document Understanding-Benutzerhandbuch.
Intelligenter Schlüsselwortklassifizierer
Zweck des Intelligent Keyword Classifier
The Intelligent Keyword Classifier is a classifier that uses the word vector it learns from files of certain document types to perform document classification.
Der Algorithmus basiert auf dem Konzept der Wiederholung von Inhalten für den gleichen Dokumenttyp und beginnt mit der Annahme, dass Dokumenttypen eine Reihe von Wörtern haben, die normalerweise in diesen Dokumenttypen vorkommen, wodurch eine Vektorähnlichkeitsberechnung möglich ist.
Beim Klassifizieren einer Datei in einen Dokumenttyp führt der Intelligent Keyword Classifier folgende Aktionen aus:
- Er findet den nächsten Wortvektor, dem eine Datei ähnlicher ist,
- Er meldet den Dokumenttyp mit der höchsten Bewertung für die zugrundeliegenden übereinstimmenden Hauptwörter.
Der Intelligent Keyword Classifier verfügt auch über Funktionen zur Aufteilung von Dateien, was bedeutet, dass er mehr als eine Klasse für eine bestimmte Datei bei separaten Seitenbereichen melden kann.
Unlike the Keyword Based Classifier, you do not need to manually select references in the document when training the Intelligent Keyword Classifier and any such references provided at training time will be ignored.
Einsatzbereich
Dieser Klassifizierer eignet sich, wenn:
- Ihre Dateien einen oder mehrere Dokumenttypen in einer einzelnen Datei enthalten.
- Ihre Dokumenttypen sich relativ einfach durch den Inhalt unterscheiden lassen.
Starting with version 6.9.0, the splitting performance for the Intelligent Keyword Classifier activity has been improved. For optimized splitting performance, use version 6.9.0 or higher.
Spezielle Anforderungen
You need to use your Automation CloudTM Document UnderstandingTM API Key, or host your own instance of the Intelligent Keyword Classifier in AI Center on-prem, to use this classifier.
Wie trainiert wird
Place the Intelligent Keyword Classifier Trainer activity in a Train Classifiers Scope, and configure it accordingly.
Wir können die Konsistenz der Trainingsdatei über parallele Trainings auf Aktivitätsebene hinweg nicht erzwingen. Zwei mögliche Lösungen für dieses Problem bietet der Document Understanding-Prozess. Beide bestehen aus der Steuerung des Datenverkehrs:
- Dateien sperren (standardmäßig im Prozess implementiert): Geben Sie der Datei die Dateierweiterung
.lock, ändern und speichern Sie die Datei und benennen Sie die Datei dann erneut um, indem Sie die Erweiterung.lockwieder entfernen. - Eine spezielle Warteschlange manuell einrichten: Erstellen Sie eine leere Warteschlange im Orchestrator und integrieren Sie Ihre beiden Aktivitäten aus dem Projekt.
For more information on how to train a Classifier, check this page that describes the process of using the Manage Learning wizard.