- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Deep Learning
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Document Understanding-Benutzerhandbuch.
Importieren von Dokumenten
Mit dem Dialogfeld Daten importieren können Sie einfach neue Dokumente importieren, die beschriftet oder überarbeitet werden sollen.
Klicken Sie in der Verwaltungsleiste auf die Schaltfläche Importieren .
Das Dialogfeld enthält die folgenden Steuerelemente:
- Textfeld Batchname – es ist obligatorisch, einen Namen für den Export einzugeben. Andernfalls ist der Abschnitt Dateien durchsuchen oder ablegen deaktiviert. Ein gültiger Name darf bis zu 24 Zeichen lang sein und darf keine Sonderzeichen enthalten.
- Kontrollkästchen Zu einem Auswertungssatz machen – Wenn diese Option aktiviert ist, wird das Dataset zu Auswertungszwecken verwendet.
- Abschnitt Dateien durchsuchen oder ablegen – Klicken Sie auf Dateien zum Hochladen durchsuchen, um das Verzeichnis zu suchen. Alternativ ziehen Sie einfach die Dateien durch Ziehen und Ablegen in den Rahmen.
-
Statusabschnitt – Klicken Sie auf (Vorheriges Importprotokoll laden), um den Status des letzten Imports zu überprüfen. Beim Hochladen von Daten erhalten Sie im Abschnitt Status eine Übersicht über Ihre Dateien und Sie werden aufgefordert, mit dem Import fortzufahren, indem Sie auf JA klicken oder den Import abbrechen, indem Sie auf ABBRECHEN klicken.
Der Document Manager unterstützt 4 Import-Arten:
- Schemaimport
- Importieren von unformatierten Dokumenten (max. 2000 Seiten und 4000 MiB pro Import)
- Document Manager Dataset-Import (4.000 MiB pro Import)
- Validation Station Dataset-Import (max. 2.000 Seiten und 4.000 MiB pro Import)
Wenn Sie eine neue Document Manager-Sitzung mit dem gleichen Schema wie in einer vorhandenen Sitzung starten möchten, können Sie die folgenden Schritte ausführen:
- Klicken Sie in der Verwaltungsleiste auf die Schaltfläche Exportieren.
- Aktivieren Sie im Dialogfeld Dateien exportieren die Option Schema.
- Klicken Sie auf die Schaltfläche Exportieren innerhalb des Dialogfelds. Eine
.zip
-Datei wird exportiert. - Klicken Sie in der Verwaltungsleiste auf die Schaltfläche Importieren.
- Laden Sie die Datei vom Typ
.zip
hoch oder legen Sie sie direkt in der neuen Document Manager-Sitzung ab (nicht entpacken). In diesem Schritt können Sie auch ein vordefiniertes Schema hochladen. - Klicken Sie im Abschnitt Status auf JA, um mit dem Import fortzufahren. Das Schema wird importiert.
Der Schemaimport kann auch auf Felder mit mehreren Werten angewendet werden.
.pdf
, .tiff
, .png
, .jpg
.
.zip
-Dateien werden für den Import von unformatierten Dokumenten nicht unterstützt.
OCR-Einstellungen müssen vor dem Import konfiguriert werden.
Führen Sie die folgenden Schritte aus:
.zip
-Datei abrufen, die ursprünglich exportiert wurde, und sie direkt in die neue Document Manager-Instanz importieren, um ein Dataset zu importieren, das zuvor auf einer anderen Sitzung des Document Managers beschriftet wurde.
Wenn Ihre neue Document Manager-Instanz vollkommen leer ist (d. h. es sind keine Daten und keine Felder definiert), werden sowohl die Dokumente mit Beschriftungen als auch das Schema importiert.
Wenn in Ihrer neuen Document Manager-Instanz bereits Felder definiert sind, muss das neu importierte Dataset die gleichen Felder oder eine Teilmenge dieser Felder haben. Andernfalls wird der Import abgelehnt.
- Entpacken Sie die Dataset-Datei.
- Bearbeiten Sie die
scheman.json
-Datei aus dem Archiv. - Entfernen Sie alle
display_name
-Eigenschaften aus der Dateijson
und speichern Sie sie dann. - Komprimieren Sie das Dataset und importieren Sie es in die lokale Sitzung.
Aufteilen von großen Datensätzen
.zip
-Dateien in mehrere .zip
-Dateien aufteilt, die kleiner als 1 GB sind und die weniger als 1500 Dateien haben.
Da Ihre RPA Workflow Dokumente mit einem vorhandenen ML-Modell verarbeitet, können einige Dokumente eine menschliche Validierung mithilfe der Aktivität Validation Station erfordern (verfügbar für „Attended Bots“ oder im Browser mithilfe von Orchestrator Action Center).
Die in der Validation Station generierten validierten Daten können mit der Aktivität Machine Learning Extractor Trainer exportiert und zum Trainieren von ML-Modellen anhand der unten beschriebenen Funktion verwendet werden.
Führen Sie die folgenden Schritte aus:
- Konfigurieren Sie den Machine Learning Extractor Trainer so, dass Daten in einen Ordner mit dem Pfad
<Trainer/Output/Folder>
ausgegeben werden (verwenden Sie einen beliebigen leeren Ordnerpfad). - Führen Sie einen RPA-Workflow aus, einschließlich Validation Station und Machine Learning Extractor Trainer.
- Machine Learning Extractor Trainer erstellt drei Unterordner: Dokumente, Metadaten und Vorhersagen im Ausgabeordner.
- Zippen Sie die
<Trainer/Output/Folder>
, um eine.zip
-Datei zu erhalten, z. B TrainerOutputFolder.zip. - Importieren Sie die
.zip
-Datei in den Document Manager, der erkennt, dass der Import Daten enthält, die von Machine Learning Extractor Trainer erzeugt wurden, und die Daten entsprechend importiert.
Fehlen die für das Dataset erforderlichen Felder, wird im Import-Dialogfenster eine Fehlermeldung angezeigt.