- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Intelligenter Schlüsselwortklassifizierer
- FlexiCapture Classifier
- Machine Learning Classifier
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- ML-Pakete
- Über ML-Pakete
- OCR-Konfiguration
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Deep Learning
- Lizenzierung
- Referenzen
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Hardwareanforderungen
Das Ausführen der Document Understanding ML-Pakete auf einer GPU umfasst eine Optimierung, die den Trainingsprozess beschleunigen soll.
Infolgedessen ist das Training mit der GPU fünfmal schneller als mit der CPU (zuvor war es 10–20-mal schneller). Dadurch können auch Modelle mit der CPU mit bis zu 5000 Seiten trainiert werden (bisher waren es maximal 500).
Bitte beachten Sie, dass die GPU zum Trainieren von Document Understanding-Modellen mindestens 11 GB Video-RAM erfordert, um erfolgreich ausgeführt zu werden.
Verwenden Sie die folgende Tabelle, um die Kompatibilität zwischen den ML-Paketen, der CUDA-Version und der GPU-Treiberversion zu überprüfen.
ML-Paketversion |
CUDA-Version |
NVIDIA-Treiber (niedrigste kompatible Version) |
Hardware-Generation |
---|---|---|---|
2022.10 | CIDA 11.3 | R450.80.03 | Ampere, Turing, Volta, Pascal, Maxwell, Kepler |
2022.4 | CUDA 11.3 | R450.36.06 | Ampere, Turing, Volta, Pascal, Maxwell, Kepler |
CUDA ist abwärtskompatibel, d. h. vorhandene CUDA-Anwendungen können weiterhin mit neueren CUDA-Versionen verwendet werden.
Weitere Informationen zur Kompatibilität finden Sie hier.
Sie können das Document Understanding-Framework verwenden, um Text mit einem OCR-Modul zu lesen, die Dokumente zu klassifizieren und Informationen aus den Dokumenten zu extrahieren. Während Klassifizierungs- und Extraktionsaufgaben auf der CPU ausgeführt werden, wird empfohlen, die OCR auf der GPU auszuführen (für den Fall, dass keine GPU zur Verfügung steht, wird auch eine CPU-Version angeboten).
Die lokale Bereitstellung erfolgt mithilfe der Automation Suite und deren Hardwareanforderungen.
Sie können denselben VM-Typ sowohl für Extraktoren als auch für Klassifizierer verwenden, der einzige Unterschied besteht in der Infrastrukturgröße. Wir empfehlen die Verwendung des OCR-Moduls mit einer GPU-VM. Die Kompatibilität zwischen den ML-Paketen, der CUDA-Version und der GPU-Treiberversion wird im Abschnitt Kompatibilitätsmatrix beschrieben.
Zum besseren Verständnis der Hardwareanforderungen betrachten wir ein konkretes Beispiel.
Dienst |
Hardwareanforderungen |
Funktion |
---|---|---|
Extraktor |
Verwenden Sie eine VM mit mindestens 2 CPU-Kernen und 8 GB RAM. |
Kann 25.000 Seiten/Tag oder 5 Millionen Seiten/Jahr verarbeiten, unter der Annahme eines vollkommen konstanten Datenverkehrs (keine Spitzen). |
Klassifizierer |
Verwenden Sie eine VM mit mindestens 2 CPU-Kernen und 8 GB RAM. |
Kann 40.000 Dokumente/Tag oder 8 Millionen Dokumente/Jahr verarbeiten, unter der Annahme eines vollkommen konstanten Datenverkehrs (keine Spitzen). |
OCR |
Empfohlen für die Verwendung mit GPU-VM. |
Kann 50.000 Seiten/Tag verarbeiten. |
Beispiel: Wenn Sie 10 Millionen Seiten pro Jahr verarbeiten, benötigen Sie eine VM mit 4 CPU-Kernen, 16 GB RAM für den Extraktor, eine weitere für den Klassifizierer und eine dritte VM mit einem Nvidia GPU-Kern für das OCR-Modul.
Sie können auch nur eine VM für den Extraktor und Klassifizierer verwenden, d. h. Sie benötigen eine einzelne VM mit 8 CPU-Kernen und 32 GB RAM.