UiPath Documentation
document-understanding
2023.10
false
Important :
La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.
UiPath logo, featuring letters U and I in white

Guide de l'utilisateur de Document Understanding

Dernière mise à jour 6 avr. 2026

Prérequis matériels

Running the Document UnderstandingTM ML Packages on a GPU includes an optimization meant to accelerate the training process.

Matrice de compatibilité

En conséquence, l'entraînement sur GPU n'est que 5 fois plus rapide que sur CPU (auparavant, il était 10 à 20 fois plus rapide). Cela permet également de former des modèles sur CPU avec jusqu'à 5 000 pages (auparavant, 500 maximum).

Please be aware that training Document Understanding models on GPU requires a GPU with at least 11GB of video RAM to run successfully.

Utilisez le tableau suivant pour vérifier la compatibilité entre les packages ML, la version CUDA et la version du pilote GPU.

Version du paquet MLVersion CUDAversion cudDNNPilote NVIDIA (version compatible la plus ancienne)Génération de matériel
2023.10CUDA 11.8 ou la version la plus récentecuDNN 8.2.0 ou la version la plus récenteR450.80.04Ampère, Turing, Volta, Pascal, Maxwell, Kepler

CUDA est rétrocompatible, ce qui signifie que les applications CUDA existantes peuvent continuer à être utilisées avec les versions plus récentes de CUDA.

More information about compatibility can be found here.

Utilisation du processeur et du processeur graphique

Vous pouvez utiliser le framework Document Understanding pour lire du texte à l'aide d'un moteur OCR, classifier les documents et extraire des informations des documents. Alors que les tâches de classification et d'extraction sont exécutées sur le CPU, il est recommandé d'exécuter l'OCR sur le GPU (bien qu'une version CPU soit également fournie au cas où aucun GPU ne sserait disponible).

The On-premises deployment is done using Automation Suite and its hardware requirements.

Vous pouvez utiliser le même type de machine virtuelle pour les extracteurs et les classifieurs, la seule différence étant la taille de l’infrastructure. Nous vous recommandons d’utiliser le moteur OCR avec une machine virtuelle GPU. La compatibilité entre les paquets ML, la version CUDA et la version du pilote GPU est décrite dans la section Matrice de compatibilité.

Prenons un exemple concret pour mieux comprendre la configuration matérielle requise.

Paquet MLPrérequis matérielsCapacité
Extractor packages (Invoices, Receipts, PurchaseOrders, etc.)Utiliser une VM avec au moins 2 cœurs de CPU et 8 Go de RAMCan process 25,000 pages/day or 5 million pages/year, assuming perfectly constant traffic (no spikes).
Classifier packages (DocumentClassifier)Utiliser une VM avec au moins 2 cœurs de CPU et 8 Go de RAMCan process 40,000 documents/day or 8 million documents/year, assuming perfectly constant traffic (no spikes).
OCRNécessite au moins 8 Go de RAM en cas d'exécution sur CPU. Aucune exigence si vous exécutez en cas d'exécution sur GPU.Can process 50,000 pages/day.
OCR_CPUNécessite au moins 4 Go de RAM.Can process 25,000 pages/day.

Example: If you process 10 million pages/year, then you need a VM with 4 CPU cores, 16 GB RAM for the extractor, another one for the classifier, and a third VM with an NVidia GPU core for the OCR engine.

Vous pouvez également choisir de n’utiliser qu’une seule machine virtuelle pour l’extracteur et le classifieur, ce qui signifie que vous avez besoin d’une seule machine virtuelle avec 8 cœurs de processeur et 32 Go de RAM.

Remarque :

You can always use more more powerful CPU/GPU VMs for increasing the number of processed documents/day.

  • Matrice de compatibilité
  • Utilisation du processeur et du processeur graphique

Cette page vous a-t-elle été utile ?

Connecter

Besoin d'aide ? Assistance

Vous souhaitez apprendre ? UiPath Academy

Vous avez des questions ? UiPath Forum

Rester à jour