- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- FlexiCapture Classifier
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- FlexiCapture Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- 4506T - Paquet ML
- 990 - Paquet ML - Aperçu
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Certificat de constitution (Certificate of Incorporation) - Paquet ML
- Certificat d'origine - Paquet ML
- Chèques - Paquet ML
- Certificat de produit pour enfants - Paquet ML
- CMS 1500 - Paquet ML
- Déclaration de conformité UE - Paquet ML
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- Invoices Australia - ML package
- Invoices China - ML package
- Invoices India - ML package
- Invoices Japan - ML package
- Expédition des factures - Paquet ML
- Listes de colisage - Paquet ML
- Passeports - Paquet ML
- Fiches de paie - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Prérequis matériels
- Pipelines
- Document Manager
- Services OCR
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Licences
- Activités (Activities)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
- Apprentissage profond
- Entraînement de modèles hautement performants
- Déploiement de modèles hautement performants
Déploiement de modèles hautement performants
À mesure que les modèles d’apprentissage automatique (ML) s’améliorent avec le temps, leurs besoins en ressources changent également. Pour de meilleures performances, il est important que lors du déploiement de modèles ML via AI Center™, les compétences soient correctement dimensionnées par rapport au trafic qu’elles doivent gérer. Dans la plupart des cas, l’infrastructure est dimensionnée par rapport au nombre de pages par unité de temps (minute ou heure). Un document peut comporter une ou plusieurs pages.
Pour déployer une infrastructure via AI Center, il y a quelques aspects importants à garder à l’esprit pour des performances optimales.
Un seul type d’infrastructure GPU est disponible. Ceci est mis en évidence par la case à cocher pour activer le GPU. Chaque compétence s’exécute sur une seule machine virtuelle (MV) ou un seul nœud disposant d’un GPU. Dans ce cas, le processeur et la mémoire ne sont pas pertinents, car la compétence peut utiliser toutes les ressources de processeur et de mémoire disponibles sur ces nœuds. Outre le débit, le GPU est beaucoup plus rapide. Pour cette raison, si la latence est critique, il est recommandé d’utiliser le GPU.
Le processeur et la mémoire peuvent être fractionnés, ce qui signifie que plusieurs compétences ML peuvent s’exécuter sur le même nœud. Pour éviter toute perturbation d’une compétence voisine, chaque compétence ML est limitée à la quantité de mémoire et de processeur qu’elle peut consommer, selon le niveau sélectionné. Un processeur plus élevé entraîne un traitement plus rapide (pour une page), tandis qu’une mémoire plus élevée entraîne un plus grand nombre de documents pouvant être traités.
Le nombre de répliques détermine le nombre de conteneurs utilisés pour répondre aux requêtes du modèle ML. Un nombre plus élevé entraîne une plus grande quantité de documents pouvant être traités en parallèle, sous réserve des limites de ce niveau particulier. Le nombre de répliques est directement lié au type d’infrastructure (nombre de processeurs par réplique, ou si vous utilisez un GPU), au sens où les répliques et la taille de l’infrastructure peuvent affecter directement le débit (pages/minute).
Le nombre de robots a un impact sur le débit. Pour obtenir un débit efficace, le nombre de robots doit être dimensionné de manière à ne pas surcharger les compétences ML. Cela dépend de l’automatisation elle-même et doit être testé. En règle générale, vous pouvez utiliser un à trois robots comme point de départ pour chaque réplique que possède la compétence ML. Selon le temps de processus global (hors extracteur ML), le nombre de robots (ou le nombre de répliques) peut être supérieur ou inférieur.
Si l’infrastructure n’est pas dimensionnée correctement, les modèles peuvent être soumis à une charge très élevée. Dans certains cas, cela peut entraîner un retour de demandes, un long délai de traitement, voire des échecs lors du traitement des documents.
Une mémoire insuffisante est le plus souvent rencontrée dans les niveaux de processeur inférieurs (0,5 processeur ou 1 processeur). Si vous devez traiter une très grande charge utile (un ou plusieurs documents volumineux), cela peut entraîner une exception de mémoire insuffisante. Cela est lié à la taille du document en termes de pages et de densité de texte (quantité de texte par page). Étant donné que les exigences sont très spécifiques à chaque cas d’utilisation, il n’est pas possible de fournir des nombres exacts. Vous pouvez consulter les directives de la section Dimensionner correctement l’infrastructure (Sizing the infrastructure correctement) pour des informations plus détaillées. Si vous rencontrez une situation de mémoire insuffisante, il est recommandé de passer au niveau suivant.
520
et 499
), être renvoyées, ou même provoquer le plantage du modèle (codes de statut 503
et 500
). Si vous rencontrez une situation de calcul insuffisante, nous vous recommandons de passer au niveau suivant, voire au niveau GPU.
Cette section fournit des directives générales sur les performances des modèles selon chaque taille de compétence.
Niveau | Nombre maximum de pages/document | Débit prévu (pages/heure) | AI Units/heure |
---|---|---|---|
0,5 processeur/2 Go de mémoire | 25 | 300-600 | 1 |
1 processeur/4 Go de mémoire | 50 | 400-800 | 2 |
2 processeurs/8 Go de mémoire | 100 | 600-1000 | 4 |
4 processeurs/16 Go de mémoire | 100 | 800-1200 | 8 |
6 processeurs/24 Go de mémoire | 100 | 900-1300 | 12 |
GPU | 200-250 | 1350-1600 | 20 |
Niveau | Nombre maximum de pages/document | Débit prévu (pages/heure) | AI Units/heure |
---|---|---|---|
0,5 processeur/2 Go de mémoire | 25 | 40-100 | 1 |
1 processeur/4 Go de mémoire | 50 | 70-140 | 2 |
2 processeurs/8 Go de mémoire | 75 | 120-220 | 4 |
4 processeurs/16 Go de mémoire | 100 | 200-300 | 8 |
6 processeurs/24 Go de mémoire | 100 | 250-400 | 12 |
GPU | 200-250 | 1400-2200 | 20 |
Niveau | Nombre maximum de pages/document | Débit prévu (pages/heure) | AI Units/heure |
---|---|---|---|
0,5 processeur/2 Go de mémoire | 25 | 60-200 | 1 |
1 processeur/4 Go de mémoire | 50 | 120-240 | 2 |
2 processeurs/8 Go de mémoire | 75 | 200-280 | 4 |
4 processeurs/16 Go de mémoire | 100 | 250-400 | 8 |
6 processeurs/24 Go de mémoire | 100 | 350-500 | 12 |
GPU | 200-250 | 1000-2000 | 20 |
Le débit attendu est exprimé pour chaque réplique, en page/heure, et un débit minimum et maximum attendu, en fonction du document lui-même. La compétence ML doit être dimensionnée pour le débit le plus élevé attendu (pic), et non pour le débit moyen sur une journée, une semaine ou un mois.
Exemple 1
- Documents contenant un maximum de cinq pages.
- Un pic maximum de 300 pages par heure.
Étant donné que le débit est inférieur et que la taille du document est petite, un GPU n’est pas nécessaire dans cet exemple. Deux à quatre répliques du niveau 0,5 CPU ou 1 CPU sont suffisantes.
Exemple 2
- Documents contenant 80 pages maximum.
- Un pic maximum de 900 pages par heure.
Pour cet exemple, trois répliques du niveau 4 du processeur ou un seul niveau du GPU sont suffisants.
Exemple 3
- Documents contenant 50 pages maximum.
- Un pic maximum de 3 000 pages par heure.
- Utiliser 3 répliques de GPU.
- Utilisez 12 à 15 répliques du niveau 4 ou 6 processeurs.
Les deux options ont une haute disponibilité car il y a plus de deux répliques pour la compétence ML.