- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Zahlungsbelege – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Unterstützte Sprachen
- Deep Learning
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Lizenzierung
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)

Document Understanding-Benutzerhandbuch.
Hardwareanforderungen
Running the Document UnderstandingTM ML Packages on a GPU includes an optimization meant to accelerate the training process.
Kompatibilitätsmatrix
Infolgedessen ist das Training mit der GPU fünfmal schneller als mit der CPU (zuvor war es 10–20-mal schneller). Dadurch können auch Modelle mit der CPU mit bis zu 5000 Seiten trainiert werden (bisher waren es maximal 500).
Please be aware that training Document Understanding models on GPU requires a GPU with at least 11GB of video RAM to run successfully.
Mithilfe folgender Tabelle können Sie die Kompatibilität zwischen den ML-Paketen, der CUDA-Version und der GPU-Treiberversion überprüfen.
| ML-Paketversion | CUDA-Version | cudDNN-Version | NVIDIA-Treiber (niedrigste kompatible Version) | Hardware-Generation |
|---|---|---|---|---|
| 2024.10.7 | CUDA 12.8 oder aktuell | cuDNN 9.8.0 oder aktuell | R525.60.13 | Hopper, Ada Lovelace, Ampere, Turing, Volta, Pascal, Maxwell |
| 2024.10.6 oder älter | CUDA 11.8 oder aktuell | cuDNN 8.2.0 oder aktuell | R450.80.04 | Ampere, Turing, Volta, Pascal, Maxwell, Kepler |
CUDA ist abwärtskompatibel, d. h. vorhandene CUDA-Anwendungen können weiterhin mit neueren CUDA-Versionen verwendet werden.
More information about compatibility can be found here.
CPU- und GPU-Auslastung
Sie können das Document Understanding-Framework verwenden, um Text mithilfe einer OCR-Engine zu lesen, die Dokumente zu klassifizieren und Informationen aus den Dokumenten zu extrahieren. Während Klassifizierungs- und Extraktionsaufgaben auf der CPU ausgeführt werden, wird empfohlen, die OCR auf der GPU auszuführen (obwohl eine CPU-Version auch bereitgestellt wird, falls keine GPU vorhanden ist).
The On-premises deployment is done using Automation Suite and its hardware requirements.
Sie können denselben VM-Typ sowohl für Extraktoren als auch für Klassifizierer verwenden, der einzige Unterschied besteht in der Infrastrukturgröße. Wir empfehlen die Verwendung des OCR-Moduls mit einer GPU-VM. Die Kompatibilität zwischen den ML-Paketen, der CUDA-Version und der GPU-Treiberversion wird im Abschnitt „Kompatibilitätsmatrix“ beschrieben.
Zum besseren Verständnis der Hardwareanforderungen betrachten wir ein konkretes Beispiel.
| ML-Paket | Hardwareanforderungen | Funktion |
|---|---|---|
| Extractor packages (Invoices, Receipts, PurchaseOrders, etc.) | Verwenden Sie eine VM mit mindestens 2 CPU-Kernen und 8 GB RAM. | Can process 25,000 pages/day or 5 million pages/year, assuming perfectly constant traffic (no spikes). |
| Classifier packages (DocumentClassifier) | Verwenden Sie eine VM mit mindestens 2 CPU-Kernen und 8 GB RAM. | Can process 40,000 documents/day or 8 million documents/year, assuming perfectly constant traffic (no spikes). |
| OCR | Erfordert mindestens 8 GB RAM bei Ausführung auf CPU. Keine Anforderung bei Ausführung auf GPU. | Can process 50,000 pages/day. |
| OCR_CPU | Erfordert mindestens 4 GB RAM. | Can process 25,000 pages/day. |
Example: If you process 10 million pages/year, then you need a VM with 4 CPU cores, 16 GB RAM for the extractor, another one for the classifier, and a third VM with an NVidia GPU core for the OCR engine.
Sie können auch nur eine VM für den Extraktor und Klassifizierer verwenden, d. h. Sie benötigen eine einzelne VM mit 8 CPU-Kernen und 32 GB RAM.
You can always use more more powerful CPU/GPU VMs for increasing the number of processed documents/day.