document-understanding

2024.10

true

Wichtig :

Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Document Understanding-Benutzerhandbuch.

BEREITSTELLUNG:

Letzte Aktualisierung 11. Nov. 2025

Importieren von Dokumenten

Mit dem Dialogfeld Daten importieren können Sie einfach neue Dokumente importieren, die beschriftet oder überarbeitet werden sollen.

Wählen Sie die in der Verwaltungsleiste die Taste Importieren Importsymbol .

Das Dialogfeld enthält die folgenden Steuerelemente:

Textfeld Batchname – es ist obligatorisch, einen Namen für den Export einzugeben. Andernfalls ist der Abschnitt Dateien durchsuchen oder ablegen deaktiviert. Ein gültiger Name darf bis zu 24 Zeichen lang sein und darf keine Sonderzeichen enthalten.
Kontrollkästchen Zu einem Auswertungssatz machen – Wenn diese Option aktiviert ist, wird das Dataset zu Auswertungszwecken verwendet.
Abschnitt Dateien durchsuchen oder ablegen – Wählen Sie Dateien durchsuchen, um sie hochzuladen, oder ziehen Sie die Dateien einfach per Drag & Drop in den Bereich.
Abschnitt Status – Wählen Sie (vorheriges Importprotokoll laden), um den Status des letzten Imports zu überprüfen. Beim Hochladen von Daten erhalten Sie im Abschnitt Status eine Übersicht Ihrer Dateien und werden dazu aufgefordert, mit dem Import fortzufahren, indem Sie JA wählen, oder den Import abzubrechen, indem Sie ABBRECHEN wählen.

Importtypen

Der Document Manager unterstützt 4 Import-Arten:

Schemaimport
Importieren von unformatierten Dokumenten (max. 2000 Seiten und 4000 MiB pro Import)
Document Manager Dataset-Import (4.000 MiB pro Import)
Validation Station Dataset-Import (max. 2.000 Seiten und 4.000 MiB pro Import)

Schemaimport

Wenn Sie eine neue Document Manager-Sitzung mit dem gleichen Schema wie in einer vorhandenen Sitzung starten möchten, können Sie die folgenden Schritte ausführen:

Wählen Sie in der Verwaltungsleiste die Taste Exportieren.
Aktivieren Sie im Dialogfeld Dateien exportieren die Option Schema.
Wählen Sie im Dialogfeld die Taste Exportieren.Eine .zip Datei wird exportiert.
Wählen Sie in der Verwaltungsleiste die Taste Importieren.
Laden Sie die Datei vom Typ .zip hoch oder legen Sie sie direkt in der neuen Document Manager-Sitzung ab (nicht entpacken). In diesem Schritt können Sie auch ein vordefiniertes Schema hochladen.
Wählen Sie JA im Abschnitt Status, um mit dem Import fortzufahren. Das Schema wird importiert.

Der Schemaimport kann auch auf Felder mit mehreren Werten angewendet werden.

Wichtig: Bitte beachten Sie, dass Felder mit mehreren Werten nur mit Modellen von Version 2022.10 oder höher kompatibel sind.

Importieren von unformatierten Dokumenten

Die Dokumenttypen, die zur Beschriftung importiert werden können, sind: .pdf, .tiff, .png, .jpg.

.zip-Dateien werden für den Import von unformatierten Dokumenten nicht unterstützt.

OCR-Einstellungen müssen vor dem Import konfiguriert werden.

Wählen Sie die Taste Importieren.Das Dialogfeld Daten importieren wird angezeigt.
Geben Sie im Feld Batchname einen Namen für das Batch an. Auf diese Weise können Sie diese Dokumente später einfach mit dem Suchen-Dropdownmenü filtern.
- Wenn Sie diesen Dokumenten-Batch zum Training eines ML-Modells verwenden möchten, lassen Sie das Kontrollkästchen Zu einem Auswertungssatz machen deaktiviert.
- Wenn Sie diesen Dokumenten-Batch zur Auswertung eines ML-Modells verwenden möchten (d. h. zum Messen seiner Leistung), aktivieren Sie das Kontrollkästchen Zu einem Auswertungssatz machen. Dadurch wird sichergestellt, dass die Daten von den Trainingspipelines ignoriert werden.
Laden Sie eine Datei oder einen Satz von Dateien hoch oder ziehen Sie sie in den Abschnitt Dateien durchsuchen oder ablegen.
Wählen Sie Ja aus. Die Datei bzw. der Satz von Dateien wird importiert.

Document Manager-Dataset-Import

Sie müssen die .zip-Datei abrufen, die ursprünglich exportiert wurde, und sie direkt in die neue Document Manager-Instanz importieren, um ein Dataset zu importieren, das zuvor auf einer anderen Sitzung des Document Managers beschriftet wurde.

Wenn Ihre neue Document Manager-Instanz vollkommen leer ist (d. h. es sind keine Daten und keine Felder definiert), werden sowohl die Dokumente mit Beschriftungen als auch das Schema importiert.

Wenn in Ihrer neuen Document Manager-Instanz bereits Felder definiert sind, muss das neu importierte Dataset die gleichen Felder oder eine Teilmenge dieser Felder haben. Andernfalls wird der Import abgelehnt.

Falls Sie eine Datenbank aus einer Automation Cloud™-Umgebung exportieren und sie dann in eine lokale Bereitstellung importieren, müssen Sie die folgenden Schritte ausführen:

Entpacken Sie die Dataset-Datei.
Bearbeiten Sie die scheman.json-Datei aus dem Archiv.
Entfernen Sie alle display_name-Eigenschaften aus der Datei json und speichern Sie sie dann.
Komprimieren Sie das Dataset und importieren Sie es in die lokale Sitzung.

Aufteilen von großen Datensätzen

Um Document Manager-Datensätze zu importieren, die größer als 1 GB sind oder mehr als 1500 Dateien haben, empfehlen wir Ihnen, dieses Skript zu verwenden, das die .zip-Dateien in mehrere .zip-Dateien aufteilt, die kleiner als 1 GB sind und die weniger als 1500 Dateien haben.

Validation Station-Dataset-Import

Da Ihre RPA Workflow Dokumente mit einem vorhandenen ML-Modell verarbeitet, können einige Dokumente eine menschliche Validierung mithilfe der Aktivität Validation Station erfordern (verfügbar für „Attended Bots“ oder im Browser mithilfe von Orchestrator Action Center).

Die in Validation Station generierten validierten Daten können mithilfe der Aktivität Machine Learning Extractor Trainer exportiert und zum Trainieren von ML-Modellen verwendet werden.

Hinweis: Für den Validation Station-Dataset-Import muss ein Schema definiert sein.

Konfigurieren Sie den Machine Learning Extractor Trainer so, dass Daten in einen Ordner mit dem Pfad <Trainer/Output/Folder> ausgegeben werden (verwenden Sie einen beliebigen leeren Ordnerpfad).
Führen Sie einen RPA-Workflow aus, einschließlich Validation Station und Machine Learning Extractor Trainer.
Machine Learning Extractor Trainer erstellt drei Unterordner: Dokumente, Metadaten und Vorhersagen im Ausgabeordner.
Zippen Sie die <Trainer/Output/Folder>, um eine .zip-Datei zu erhalten, z. B TrainerOutputFolder.zip.
Importieren Sie die .zip-Datei in den Document Manager, der erkennt, dass der Import Daten enthält, die von Machine Learning Extractor Trainer erzeugt wurden, und die Daten entsprechend importiert.