document-understanding

2024.10

false

Wichtig :

Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Document Understanding-Benutzerhandbuch.

BEREITSTELLUNG:

Letzte Aktualisierung 6. Apr. 2026

Hardwareanforderungen

Running the Document Understanding^TM ML Packages on a GPU includes an optimization meant to accelerate the training process.

Kompatibilitätsmatrix

Infolgedessen ist das Training mit der GPU fünfmal schneller als mit der CPU (zuvor war es 10–20-mal schneller). Dadurch können auch Modelle mit der CPU mit bis zu 5000 Seiten trainiert werden (bisher waren es maximal 500).

Please be aware that training Document Understanding models on GPU requires a GPU with at least 11GB of video RAM to run successfully.

Mithilfe folgender Tabelle können Sie die Kompatibilität zwischen den ML-Paketen, der CUDA-Version und der GPU-Treiberversion überprüfen.

ML-Paketversion	CUDA-Version	cudDNN-Version	NVIDIA-Treiber (niedrigste kompatible Version)	Hardware-Generation
2024.10.7	CUDA 12.8 oder aktuell	cuDNN 9.8.0 oder aktuell	R525.60.13	Hopper, Ada Lovelace, Ampere, Turing, Volta, Pascal, Maxwell
2024.10.6 oder älter	CUDA 11.8 oder aktuell	cuDNN 8.2.0 oder aktuell	R450.80.04	Ampere, Turing, Volta, Pascal, Maxwell, Kepler

CUDA ist abwärtskompatibel, d. h. vorhandene CUDA-Anwendungen können weiterhin mit neueren CUDA-Versionen verwendet werden.

More information about compatibility can be found here.

CPU- und GPU-Auslastung

Sie können das Document Understanding-Framework verwenden, um Text mithilfe einer OCR-Engine zu lesen, die Dokumente zu klassifizieren und Informationen aus den Dokumenten zu extrahieren. Während Klassifizierungs- und Extraktionsaufgaben auf der CPU ausgeführt werden, wird empfohlen, die OCR auf der GPU auszuführen (obwohl eine CPU-Version auch bereitgestellt wird, falls keine GPU vorhanden ist).

The On-premises deployment is done using Automation Suite and its hardware requirements.

Sie können denselben VM-Typ sowohl für Extraktoren als auch für Klassifizierer verwenden, der einzige Unterschied besteht in der Infrastrukturgröße. Wir empfehlen die Verwendung des OCR-Moduls mit einer GPU-VM. Die Kompatibilität zwischen den ML-Paketen, der CUDA-Version und der GPU-Treiberversion wird im Abschnitt „Kompatibilitätsmatrix“ beschrieben.

Zum besseren Verständnis der Hardwareanforderungen betrachten wir ein konkretes Beispiel.

ML-Paket	Hardwareanforderungen	Funktion
Extractor packages (Invoices, Receipts, PurchaseOrders, etc.)	Verwenden Sie eine VM mit mindestens 2 CPU-Kernen und 8 GB RAM.	Can process 25,000 pages/day or 5 million pages/year, assuming perfectly constant traffic (no spikes).
Classifier packages (DocumentClassifier)	Verwenden Sie eine VM mit mindestens 2 CPU-Kernen und 8 GB RAM.	Can process 40,000 documents/day or 8 million documents/year, assuming perfectly constant traffic (no spikes).
OCR	Erfordert mindestens 8 GB RAM bei Ausführung auf CPU. Keine Anforderung bei Ausführung auf GPU.	Can process 50,000 pages/day.
OCR_CPU	Erfordert mindestens 4 GB RAM.	Can process 25,000 pages/day.

Example: If you process 10 million pages/year, then you need a VM with 4 CPU cores, 16 GB RAM for the extractor, another one for the classifier, and a third VM with an NVidia GPU core for the OCR engine.

Sie können auch nur eine VM für den Extraktor und Klassifizierer verwenden, d. h. Sie benötigen eine einzelne VM mit 8 CPU-Kernen und 32 GB RAM.

Hinweis:

You can always use more more powerful CPU/GPU VMs for increasing the number of processed documents/day.

Auf dieser Seite

Kompatibilitätsmatrix
CPU- und GPU-Auslastung

War diese Seite hilfreich?

Vorherige (previous)Öffentliche Endpunkte

WeiterÜber Pipelines

Document Understanding-Benutzerhandbuch.

Kompatibilitätsmatrix​

CPU- und GPU-Auslastung​

War diese Seite hilfreich?

Kompatibilitätsmatrix

CPU- und GPU-Auslastung