- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- 990 - Paquet ML - Aperçu
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Passeports - Paquet ML
- Fiches de paie - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Prérequis matériels
- Pipelines
- Document Manager
- Services OCR
- Apprentissage profond
- Tableaux de bord Insights.
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Licences
- Activités (Activities)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guide de l'utilisateur de Document Understanding
Prérequis matériels
Running the Document UnderstandingTM ML Packages on a GPU includes an optimization meant to accelerate the training process.
En conséquence, l'entraînement sur GPU n'est que 5 fois plus rapide que sur CPU (auparavant, il était 10 à 20 fois plus rapide). Cela permet également de former des modèles sur CPU avec jusqu'à 5 000 pages (auparavant, 500 maximum).
Veuillez noter que l'entraînement de modèles de Document Understanding sur GPU nécessite un GPU avec au moins 11 Go de RAM vidéo pour fonctionner correctement.
Utilisez la table ci-dessous pour vérifier la compatibilité entre les paquets ML, la version CUDA et la version du pilote GPU.
Version du paquet ML |
Version CUDA |
version cudDNN |
Pilote NVIDIA (version compatible la plus ancienne) |
Génération de matériel |
---|---|---|---|---|
2023.10 |
CUDA 11.8 ou la version la plus récente |
cuDNN 8.2.0 ou la version la plus récente |
R450.80.04 |
Ampère, Turing, Volta, Pascal, Maxwell, Kepler |
CUDA est rétrocompatible, ce qui signifie que les applications CUDA existantes peuvent continuer à être utilisées avec les versions plus récentes de CUDA.
Vous trouverez plus d’informations sur la compatibilité ici
Vous pouvez utiliser l’infrastructure Document Understanding pour lire du texte à l’aide d’un moteur OCR, classer les documents et extraire des informations des documents. Bien que les tâches de classification et d’extraction soient exécutées sur le processeur, il est recommandé d’exécuter l’OCR sur le processeur graphique (une version du processeur est également fournie au cas où un processeur graphique ne serait pas disponible).
Le déploiement local est effectué à l’aide d'Automation Suite et de sa configuration matérielle requise.
Vous pouvez utiliser le même type de machine virtuelle pour les extracteurs et les classifieurs, la seule différence étant la taille de l’infrastructure. Nous vous recommandons d’utiliser le moteur OCR avec une machine virtuelle GPU. La compatibilité entre les paquets ML, la version CUDA et la version du pilote GPU est décrite dans la section Matrice de compatibilité.
Prenons un exemple concret pour mieux comprendre la configuration matérielle requise.
Paquet ML | Prérequis matériels | Capacité |
---|---|---|
Packages d'extraction (factures, reçus, bons de commande, etc.) | Utiliser une VM avec au moins 2 cœurs de CPU et 8 Go de RAM | Peut traiter 40 000 documents/jour ou 8 millions de pages/an, en supposant un trafic parfaitement constant (pas de pics). |
Packages de classification (DocumentClassifier) | Utiliser une VM avec au moins 2 cœurs de CPU et 8 Go de RAM | Peut traiter 40 000 documents/jour ou 8 millions de documents/an, en supposant un trafic parfaitement constant (pas de pics). |
OCR | Nécessite au moins 8 Go de RAM en cas d'exécution sur CPU. Aucune exigence si vous exécutez en cas d'exécution sur GPU. | Peut traiter 50 000 pages/jour. |
OCR_CPU | Nécessite au moins 4 Go de RAM. | Peut traiter 50 000 pages/jour. |
Exemple : si vous traitez 10 millions de pages/an, vous avez besoin d’une machine virtuelle avec 4 cœurs de processeur, 16 Go de RAM pour l’extracteur, une autre pour le classifieur et une troisième machine virtuelle avec un cœur GPU NVidia pour le moteur OCR.
Vous pouvez également choisir de n’utiliser qu’une seule machine virtuelle pour l’extracteur et le classifieur, ce qui signifie que vous avez besoin d’une seule machine virtuelle avec 8 cœurs de processeur et 32 Go de RAM.