- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- FlexiCapture Classifier
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Dokumentklassifizierung – verwandte Aktivitäten
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 4506T – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesAustralia – ML-Paket
- InvoicesChina – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Zahlungsbelege – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Deep Learning
- Document Understanding – in der Automation Suite bereitgestellt
- Installieren und verwenden
- First Run Experience
- UiPathDocumentOCR bereitstellen
- Ein out-of-the-box ML-Paket bereitstellen
- Offline bundles 2023.10.11
- Offline-Bundles 2023.10.10
- Offline-Bundles 2023.10.9
- Offlinepakete 2023.10.8
- Offlinepakete 2023.10.7+patch1
- Offlinepakete 2023.10.7
- Offlinepakete 2023.10.6
- Offlinepakete 2023.10.5
- Offlinepakete 2023.10.4
- Offlinepakete 2023.10.3
- Offlinepakete 2023.10.2
- Offlinepakete 2023.10.1
- Offlinepakete 2023.10.0
- Verwenden von Document Manager
- Framework verwenden
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)

Document Understanding-Benutzerhandbuch.
Das Ausführen der Document UnderstandingTM-ML-Pakete auf einer GPU umfasst eine Optimierung, die den Trainingsprozess beschleunigen soll.
Infolgedessen ist das Training mit der GPU fünfmal schneller als mit der CPU (zuvor war es 10–20-mal schneller). Dadurch können auch Modelle mit der CPU mit bis zu 5000 Seiten trainiert werden (bisher waren es maximal 500).
Bitte beachten Sie, dass die GPU zum Trainieren von Document Understanding-Modellen mindestens 11 GB Video-RAM erfordert, um erfolgreich ausgeführt zu werden.
Mithilfe folgender Tabelle können Sie die Kompatibilität zwischen den ML-Paketen, der CUDA-Version und der GPU-Treiberversion überprüfen.
ML-Paketversion |
CUDA-Version |
cudDNN-Version |
NVIDIA-Treiber (niedrigste kompatible Version) |
Hardware-Generation |
---|---|---|---|---|
2023.10 |
CUDA 11.8 oder aktuell |
cuDNN 8.2.0 oder aktuell |
R450.80.04 |
Ampere, Turing, Volta, Pascal, Maxwell, Kepler |
CUDA ist abwärtskompatibel, d. h. vorhandene CUDA-Anwendungen können weiterhin mit neueren CUDA-Versionen verwendet werden.
Weitere Informationen zur Kompatibilität finden Sie hier.
Sie können das Document Understanding-Framework verwenden, um Text mit einem OCR-Modul zu lesen, die Dokumente zu klassifizieren und Informationen aus den Dokumenten zu extrahieren. Während Klassifizierungs- und Extraktionsaufgaben auf der CPU ausgeführt werden, wird empfohlen, die OCR auf der GPU auszuführen (für den Fall, dass keine GPU zur Verfügung steht, wird auch eine CPU-Version angeboten).
Die lokale Bereitstellung erfolgt mithilfe der Automation Suite und deren Hardwareanforderungen.
Sie können denselben VM-Typ sowohl für Extraktoren als auch für Klassifizierer verwenden, der einzige Unterschied besteht in der Infrastrukturgröße. Wir empfehlen die Verwendung des OCR-Moduls mit einer GPU-VM. Die Kompatibilität zwischen den ML-Paketen, der CUDA-Version und der GPU-Treiberversion wird im Abschnitt „Kompatibilitätsmatrix“ beschrieben.
Zum besseren Verständnis der Hardwareanforderungen betrachten wir ein konkretes Beispiel.
ML-Paket | Hardwareanforderungen | Funktion |
---|---|---|
Extraktorpakete (Invoices, Receipts, PurchaseOrders usw.) | Verwenden Sie eine VM mit mindestens 2 CPU-Kernen und 8 GB RAM. | Kann 25.000 Seiten/Tag oder 5 Millionen Seiten/Jahr verarbeiten, unter der Annahme eines vollkommen konstanten Datenverkehrs (keine Spitzen). |
Klassifiziererpakete (DocumentClassifier) | Verwenden Sie eine VM mit mindestens 2 CPU-Kernen und 8 GB RAM. | Kann 40.000 Dokumente/Tag oder 8 Millionen Dokumente/Jahr verarbeiten, unter der Annahme eines vollkommen konstanten Datenverkehrs (keine Spitzen). |
OCR | Erfordert mindestens 8 GB RAM bei Ausführung auf CPU. Keine Anforderung bei Ausführung auf GPU. | Kann 50.000 Seiten/Tag verarbeiten. |
OCR_CPU | Erfordert mindestens 4 GB RAM. | Kann 25.000 Seiten pro Tag verarbeiten. |
Beispiel: Wenn Sie 10 Millionen Seiten pro Jahr verarbeiten, benötigen Sie eine VM mit 4 CPU-Kernen, 16 GB RAM für den Extraktor, eine weitere für den Klassifizierer und eine dritte VM mit einem Nvidia GPU-Kern für das OCR-Modul.
Sie können auch nur eine VM für den Extraktor und Klassifizierer verwenden, d. h. Sie benötigen eine einzelne VM mit 8 CPU-Kernen und 32 GB RAM.