document-understanding

2023.10

false

Wichtig :

Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Document Understanding-Benutzerhandbuch.

BEREITSTELLUNG:

Letzte Aktualisierung 4. Dez. 2025

Hardwareanforderungen

Das Ausführen der Document Understanding^TM-ML-Pakete auf einer GPU umfasst eine Optimierung, die den Trainingsprozess beschleunigen soll.

Kompatibilitätsmatrix

Infolgedessen ist das Training mit der GPU fünfmal schneller als mit der CPU (zuvor war es 10–20-mal schneller). Dadurch können auch Modelle mit der CPU mit bis zu 5000 Seiten trainiert werden (bisher waren es maximal 500).

Bitte beachten Sie, dass die GPU zum Trainieren von Document Understanding-Modellen mindestens 11 GB Video-RAM erfordert, um erfolgreich ausgeführt zu werden.

Mithilfe folgender Tabelle können Sie die Kompatibilität zwischen den ML-Paketen, der CUDA-Version und der GPU-Treiberversion überprüfen.

ML-Paketversion	CUDA-Version	cudDNN-Version	NVIDIA-Treiber (niedrigste kompatible Version)	Hardware-Generation
2023.10	CUDA 11.8 oder aktuell	cuDNN 8.2.0 oder aktuell	R450.80.04	Ampere, Turing, Volta, Pascal, Maxwell, Kepler

CUDA ist abwärtskompatibel, d. h. vorhandene CUDA-Anwendungen können weiterhin mit neueren CUDA-Versionen verwendet werden.

Weitere Informationen zur Kompatibilität finden Sie hier.

CPU- und GPU-Auslastung

Sie können das Document Understanding-Framework verwenden, um Text mithilfe einer OCR-Engine zu lesen, die Dokumente zu klassifizieren und Informationen aus den Dokumenten zu extrahieren. Während Klassifizierungs- und Extraktionsaufgaben auf der CPU ausgeführt werden, wird empfohlen, die OCR auf der GPU auszuführen (obwohl eine CPU-Version auch bereitgestellt wird, falls keine GPU vorhanden ist).

Die lokale Bereitstellung erfolgt mithilfe der Automation Suite und deren Hardwareanforderungen.

Sie können denselben VM-Typ sowohl für Extraktoren als auch für Klassifizierer verwenden, der einzige Unterschied besteht in der Infrastrukturgröße. Wir empfehlen die Verwendung des OCR-Moduls mit einer GPU-VM. Die Kompatibilität zwischen den ML-Paketen, der CUDA-Version und der GPU-Treiberversion wird im Abschnitt „Kompatibilitätsmatrix“ beschrieben.

Zum besseren Verständnis der Hardwareanforderungen betrachten wir ein konkretes Beispiel.

ML-Paket	Hardwareanforderungen	Funktion
Extraktorpakete (Invoices, Receipts, PurchaseOrders usw.)	Verwenden Sie eine VM mit mindestens 2 CPU-Kernen und 8 GB RAM.	Kann 25.000 Seiten/Tag oder 5 Millionen Seiten/Jahr verarbeiten, unter der Annahme eines vollkommen konstanten Datenverkehrs (keine Spitzen).
Klassifiziererpakete (DocumentClassifier)	Verwenden Sie eine VM mit mindestens 2 CPU-Kernen und 8 GB RAM.	Kann 40.000 Dokumente/Tag oder 8 Millionen Dokumente/Jahr verarbeiten, unter der Annahme eines vollkommen konstanten Datenverkehrs (keine Spitzen).
OCR	Erfordert mindestens 8 GB RAM bei Ausführung auf CPU. Keine Anforderung bei Ausführung auf GPU.	Kann 50.000 Seiten/Tag verarbeiten.
OCR_CPU	Erfordert mindestens 4 GB RAM.	Kann 25.000 Seiten pro Tag verarbeiten.

Beispiel: Wenn Sie 10 Millionen Seiten pro Jahr verarbeiten, benötigen Sie eine VM mit 4 CPU-Kernen, 16 GB RAM für den Extraktor, eine weitere für den Klassifizierer und eine dritte VM mit einem Nvidia GPU-Kern für das OCR-Modul.

Sie können auch nur eine VM für den Extraktor und Klassifizierer verwenden, d. h. Sie benötigen eine einzelne VM mit 8 CPU-Kernen und 32 GB RAM.

Hinweis: Sie können jederzeit leistungsstärkere CPU/GPU-VMs verwenden, um die Anzahl der verarbeiteten Dokumente/Tag zu erhöhen.

Auf dieser Seite