- Überblick
- Document Understanding-Prozess
- Schnellstart-Tutorials
- Framework-Komponenten
- Überblick
- Document Understanding-Aktivitäten
- Übersicht zur Dokumentklassifizierung
- „Klassifizierer konfigurieren“-Assistent von Classify Document Scope
- Intelligenter Schlüsselwortklassifizierer
- Schlüsselwortbasierte Classifier (Keyword Based Classifier)
- Machine Learning Classifier
- Generativer Klassifizierer
- Dokumentklassifizierung – verwandte Aktivitäten
- Datenverbrauch
- API-Aufrufe
- ML-Pakete
- Überblick
- Document Understanding – ML-Paket
- DocumentClassifier – ML-Paket
- ML-Pakete mit OCR-Funktionen
- 1040 – ML-Paket
- 1040 Anlage C – ML-Paket
- 1040 Anlage D – ML-Paket
- 1040 Anlage E – ML-Paket
- 1040x – ML-Paket
- 3949a – ML-Paket
- 4506T – ML-Paket
- 709 – ML-Paket
- 941x – ML-Paket
- 9465 – ML-Paket
- 990 – ML-Paket – Vorschau
- ACORD125 – ML-Paket
- ACORD126 – ML-Paket
- ACORD131 – ML-Paket
- ACORD140 – ML-Paket
- ACORD25 – ML-Paket
- Bank Statements – ML-Paket
- BillsOfLading – ML-Paket
- Certificate of Incorporation – ML-Paket
- Certificates of Origin – ML-Paket
- Checks – ML-Paket
- Children Product Certificate – ML-Paket
- CMS1500 – ML-Paket
- EU Declaration of Conformity – ML-Paket
- Financial Statements – ML-Paket
- FM1003 – ML-Paket
- I9 – ML-Paket
- ID Cards – ML-Paket
- Invoices – ML-Paket
- InvoicesChina – ML-Paket
- Rechnungen Hebräisch – ML-Paket
- InvoicesIndia – ML-Paket
- InvoicesJapan – ML-Paket
- Invoices Shipping – ML-Paket
- Packing Lists – ML-Paket
- Passports – ML-Paket
- Gehaltsabrechnungen (Pay slips) – ML-Paket
- Purchase Orders – ML-Paket
- Receipts – ML-Paket
- RemittanceAdvices – ML-Paket
- UB04 – ML-Paket
- Utility Bills – ML-Paket
- Vehicle Titles – ML-Paket
- W2 – ML-Paket
- W9 – ML-Paket
- Andere out-of-the-box ML-Pakete
- Öffentliche Endpunkte
- Hardwareanforderungen
- Pipelines
- Dokumentmanager
- OCR-Dienste
- Deep Learning
- Insights-Dashboards
- Document Understanding – in der Automation Suite bereitgestellt
- Document Understanding – im eigenständigen AI Center bereitgestellt
- Aktivitäten
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Aktivitäten (UiPath.IntelligentOCR.Activities)
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.Omnipage.Activities
- UiPath.PDF.Aktivitäten (UiPath.PDF.Activities)
Hardwareanforderungen
Das Ausführen der Document UnderstandingTM -ML-Pakete auf einer GPU umfasst eine Optimierung, die den Trainingsprozess beschleunigen soll.
Infolgedessen ist das Training mit der GPU fünfmal schneller als mit der CPU (zuvor war es 10–20-mal schneller). Dadurch können auch Modelle mit der CPU mit bis zu 5000 Seiten trainiert werden (bisher waren es maximal 500).
Bitte beachten Sie, dass die GPU zum Trainieren von Document Understanding-Modellen mindestens 11 GB Video-RAM erfordert, um erfolgreich ausgeführt zu werden.
Verwenden Sie die folgende Tabelle, um die Kompatibilität zwischen den ML-Paketen, der CUDA-Version und der GPU-Treiberversion zu überprüfen.
ML-Paketversion |
CUDA-Version |
cudDNN-Version |
NVIDIA-Treiber (niedrigste kompatible Version) |
Hardware-Generation |
---|---|---|---|---|
2023.10 |
CUDA 11.8 oder aktuell |
cuDNN 8.2.0 oder aktuell |
R450.80.04 |
Ampere, Turing, Volta, Pascal, Maxwell, Kepler |
CUDA ist abwärtskompatibel, d. h. vorhandene CUDA-Anwendungen können weiterhin mit neueren CUDA-Versionen verwendet werden.
Weitere Informationen zur Kompatibilität finden Sie hier.
Sie können das Document Understanding-Framework verwenden, um Text mit einem OCR-Modul zu lesen, die Dokumente zu klassifizieren und Informationen aus den Dokumenten zu extrahieren. Während Klassifizierungs- und Extraktionsaufgaben auf der CPU ausgeführt werden, wird empfohlen, die OCR auf der GPU auszuführen (für den Fall, dass keine GPU zur Verfügung steht, wird auch eine CPU-Version angeboten).
Die lokale Bereitstellung erfolgt mithilfe der Automation Suite und deren Hardwareanforderungen.
Sie können denselben VM-Typ sowohl für Extraktoren als auch für Klassifizierer verwenden, der einzige Unterschied besteht in der Infrastrukturgröße. Wir empfehlen die Verwendung des OCR-Moduls mit einer GPU-VM. Die Kompatibilität zwischen den ML-Paketen, der CUDA-Version und der GPU-Treiberversion wird im Abschnitt „Kompatibilitätsmatrix“ beschrieben.
Zum besseren Verständnis der Hardwareanforderungen betrachten wir ein konkretes Beispiel.
ML-Paket | Hardwareanforderungen | Funktion |
---|---|---|
Extraktorpakete (Invoices, Receipts, PurchaseOrders usw.) | Verwenden Sie eine VM mit mindestens 2 CPU-Kernen und 8 GB RAM. | Kann 25.000 Seiten/Tag oder 5 Millionen Seiten/Jahr verarbeiten, unter der Annahme eines vollkommen konstanten Datenverkehrs (keine Spitzen). |
Klassifiziererpakete (DocumentClassifier) | Verwenden Sie eine VM mit mindestens 2 CPU-Kernen und 8 GB RAM. | Kann 40.000 Dokumente/Tag oder 8 Millionen Dokumente/Jahr verarbeiten, unter der Annahme eines vollkommen konstanten Datenverkehrs (keine Spitzen). |
OCR | Erfordert mindestens 8 GB RAM bei Ausführung auf CPU. Keine Anforderung bei Ausführung auf GPU. | Kann 50.000 Seiten/Tag verarbeiten. |
OCR_CPU | Erfordert mindestens 4 GB RAM. | Kann 50.000 Seiten/Tag verarbeiten. |
Beispiel: Wenn Sie 10 Millionen Seiten pro Jahr verarbeiten, benötigen Sie eine VM mit 4 CPU-Kernen, 16 GB RAM für den Extraktor, eine weitere für den Klassifizierer und eine dritte VM mit einem Nvidia GPU-Kern für das OCR-Modul.
Sie können auch nur eine VM für den Extraktor und Klassifizierer verwenden, d. h. Sie benötigen eine einzelne VM mit 8 CPU-Kernen und 32 GB RAM.