- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Zahlungsbelege – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Unterstützte Sprachen
- Deep Learning
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)

Document Understanding user guide
Importieren von Dokumenten
Mit dem Dialogfeld Daten importieren können Sie einfach neue Dokumente importieren, die beschriftet oder überarbeitet werden sollen.
Select the Import button
from the management bar.
Das Dialogfeld enthält die folgenden Steuerelemente:
-
Textfeld Batchname – es ist obligatorisch, einen Namen für den Export einzugeben. Andernfalls ist der Abschnitt Dateien durchsuchen oder ablegen deaktiviert. Ein gültiger Name darf bis zu 24 Zeichen lang sein und darf keine Sonderzeichen enthalten.
-
Make this an evaluation set checkbox - if selected, the dataset is used for evaluation purposes.
-
Browse or drop files section - select Browse files to upload to navigate through your directory or simply drag and drop the files inside the frame.
-
Status section - select (load previous import log) to check to check the status of the latest import; when uploading data, in the Status section you receive an overview of your files and you are prompted to proceed with the import by selecting YES or abort the import by selecting CANCEL.

Importtypen
Der Document Manager unterstützt 4 Import-Arten:
- Schemaimport
- Raw documents import (max 2000 pages and 4000 MiB per import)
- Document Manager dataset import (4000 MiB per import)
- Validation Station dataset import (max 2000 pages and 4000 MiB per import)
Schemaimport
Wenn Sie eine neue Document Manager-Sitzung mit dem gleichen Schema wie in einer vorhandenen Sitzung starten möchten, können Sie die folgenden Schritte ausführen:
- Select the Export button from the management bar.
- Aktivieren Sie im Dialogfeld Dateien exportieren die Option Schema.
- Select the Export button inside the dialog box. A
.zipfile is exported. - Select the Import button from the management bar.
- Upload or drag & drop the
.zipfile directly into the new Document Manager session (do not unzip). In this step, you can also upload a predefined schema. - Select YES in the Status section to proceed with the import. The schema is imported.
Der Schemaimport kann auch auf Felder mit mehreren Werten angewendet werden.
Bitte beachten Sie, dass Felder mit mehreren Werten nur mit Modellen kompatibel sind, die über die Version 2022.10 oder höher verfügen.
Importieren von unformatierten Dokumenten
Die Dokumenttypen, die zur Beschriftung importiert werden können, sind: .pdf, .tiff, .png, .jpg.
.zip-Dateien werden für den Import von unformatierten Dokumenten nicht unterstützt.
OCR-Einstellungen müssen vor dem Import konfiguriert werden.
- Select the Import button
. The Import data dialog box is displayed. - Geben Sie im Feld Batchname einen Namen für das Batch an. Auf diese Weise können Sie diese Dokumente später einfach mit dem Suchen-Dropdownmenü filtern.
- Wenn Sie diesen Dokumenten-Batch zum Training eines ML-Modells verwenden möchten, lassen Sie das Kontrollkästchen Zu einem Auswertungssatz machen deaktiviert.
- Wenn Sie diesen Dokumenten-Batch zur Auswertung eines ML-Modells verwenden möchten (d. h. zum Messen seiner Leistung), aktivieren Sie das Kontrollkästchen Zu einem Auswertungssatz machen. Dadurch wird sichergestellt, dass die Daten von den Trainingspipelines ignoriert werden.
- Laden Sie eine Datei oder einen Satz von Dateien hoch oder ziehen Sie sie in den Abschnitt Dateien durchsuchen oder ablegen.
- Select YES. The file or set of files are imported.
Document Manager-Dataset-Import
Sie müssen die .zip-Datei abrufen, die ursprünglich exportiert wurde, und sie direkt in die neue Document Manager-Instanz importieren, um ein Dataset zu importieren, das zuvor auf einer anderen Sitzung des Document Managers beschriftet wurde.
Wenn Ihre neue Document Manager-Instanz vollkommen leer ist (d. h. es sind keine Daten und keine Felder definiert), werden sowohl die Dokumente mit Beschriftungen als auch das Schema importiert.
Wenn in Ihrer neuen Document Manager-Instanz bereits Felder definiert sind, muss das neu importierte Dataset die gleichen Felder oder eine Teilmenge dieser Felder haben. Andernfalls wird der Import abgelehnt.
Falls Sie eine Datenbank aus einer Automation Cloud™-Umgebung exportieren und sie dann in eine lokale Bereitstellung importieren, müssen Sie die folgenden Schritte ausführen:
- Entpacken Sie die Dataset-Datei.
- Bearbeiten Sie die
scheman.json-Datei aus dem Archiv. - Entfernen Sie alle
display_name-Eigenschaften aus der Dateijsonund speichern Sie sie dann. - Komprimieren Sie das Dataset und importieren Sie es in die lokale Sitzung.
Aufteilen von großen Datensätzen
To import Document Manager datasets larger than 1GB or that have more than 1500 files, we recommend you to use this script which splits the .zip files into multiple .zip files that are smaller than 1GB and that have less than 1500 files.
Validation Station-Dataset-Import
As your RPA workflow processes documents using an existing ML model, some documents may require human validation using the Validation Station activity (available on attended bots or in the browser using Orchestrator Action Center).
The validated data generated in Validation Station can be exported using Machine Learning Extractor Trainer activity and can be used to train ML models.
Für den Validation Station-Dataset-Import muss ein Schema definiert sein.
- Konfigurieren Sie den Machine Learning Extractor Trainer so, dass Daten in einen Ordner mit dem Pfad
<Trainer/Output/Folder>ausgegeben werden (verwenden Sie einen beliebigen leeren Ordnerpfad). - Führen Sie einen RPA-Workflow aus, einschließlich Validation Station und Machine Learning Extractor Trainer.
- Machine Learning Extractor Trainer erstellt drei Unterordner: Dokumente, Metadaten und Vorhersagen im Ausgabeordner.
- Zippen Sie die
<Trainer/Output/Folder>, um eine.zip-Datei zu erhalten, z. B TrainerOutputFolder.zip. - Importieren Sie die
.zip-Datei in den Document Manager, der erkennt, dass der Import Daten enthält, die von Machine Learning Extractor Trainer erzeugt wurden, und die Daten entsprechend importiert.
Fehlen die für das Dataset erforderlichen Felder, wird im Import-Dialogfenster eine Fehlermeldung angezeigt.
