document-understanding

2023.10

false

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Guide de l'utilisateur de Document Understanding

PRODUIT :

Dernière mise à jour 6 nov. 2025

Prérequis matériels

L’exécution des paquets ML de Document Understanding^TM sur un GPU inclut une optimisation destinée à accélérer le processus d’entraînement.

Matrice de compatibilité

En conséquence, l'entraînement sur GPU n'est que 5 fois plus rapide que sur CPU (auparavant, il était 10 à 20 fois plus rapide). Cela permet également de former des modèles sur CPU avec jusqu'à 5 000 pages (auparavant, 500 maximum).

Veuillez noter que l'entraînement de modèles de Document Understanding sur GPU nécessite un GPU avec au moins 11 Go de RAM vidéo pour fonctionner correctement.

Utilisez le tableau suivant pour vérifier la compatibilité entre les packages ML, la version CUDA et la version du pilote GPU.

Version du paquet ML	Version CUDA	version cudDNN	Pilote NVIDIA (version compatible la plus ancienne)	Génération de matériel
2023.10	CUDA 11.8 ou la version la plus récente	cuDNN 8.2.0 ou la version la plus récente	R450.80.04	Ampère, Turing, Volta, Pascal, Maxwell, Kepler

CUDA est rétrocompatible, ce qui signifie que les applications CUDA existantes peuvent continuer à être utilisées avec les versions plus récentes de CUDA.

Vous trouverez plus d’informations sur la compatibilité ici

Utilisation du processeur et du processeur graphique

Vous pouvez utiliser le framework Document Understanding pour lire du texte à l'aide d'un moteur OCR, classifier les documents et extraire des informations des documents. Alors que les tâches de classification et d'extraction sont exécutées sur le CPU, il est recommandé d'exécuter l'OCR sur le GPU (bien qu'une version CPU soit également fournie au cas où aucun GPU ne sserait disponible).

Le déploiement local est effectué à l’aide d'Automation Suite et de sa configuration matérielle requise.

Vous pouvez utiliser le même type de machine virtuelle pour les extracteurs et les classifieurs, la seule différence étant la taille de l’infrastructure. Nous vous recommandons d’utiliser le moteur OCR avec une machine virtuelle GPU. La compatibilité entre les paquets ML, la version CUDA et la version du pilote GPU est décrite dans la section Matrice de compatibilité.

Prenons un exemple concret pour mieux comprendre la configuration matérielle requise.

Paquet ML	Prérequis matériels	Capacité
Packages d'extraction (factures, reçus, bons de commande, etc.)	Utiliser une VM avec au moins 2 cœurs de CPU et 8 Go de RAM	Peut traiter 40 000 documents/jour ou 8 millions de pages/an, en supposant un trafic parfaitement constant (pas de pics).
Packages de classification (DocumentClassifier)	Utiliser une VM avec au moins 2 cœurs de CPU et 8 Go de RAM	Peut traiter 40 000 documents/jour ou 8 millions de documents/an, en supposant un trafic parfaitement constant (pas de pics).
OCR	Nécessite au moins 8 Go de RAM en cas d'exécution sur CPU. Aucune exigence si vous exécutez en cas d'exécution sur GPU.	Peut traiter 50 000 pages/jour.
OCR_CPU	Nécessite au moins 4 Go de RAM.	Peut traiter 25 000 pages/jour.

Exemple : si vous traitez 10 millions de pages/an, vous avez besoin d’une machine virtuelle avec 4 cœurs de processeur, 16 Go de RAM pour l’extracteur, une autre pour le classifieur et une troisième machine virtuelle avec un cœur GPU NVidia pour le moteur OCR.

Vous pouvez également choisir de n’utiliser qu’une seule machine virtuelle pour l’extracteur et le classifieur, ce qui signifie que vous avez besoin d’une seule machine virtuelle avec 8 cœurs de processeur et 32 Go de RAM.

Remarque : vous pouvez toujours utiliser des machines virtuelles CPU/GPU plus puissantes pour augmenter le nombre de documents traités par jour.

Sommaire de la page