- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Keyword Based Classifier
- Intelligent Keyword Classifier
- FlexiCapture Classifier
- Machine Learning Classifier
- Activités liées à la classification des documents
- Vue d’ensemble de l'entraînement de la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Machine Learning Classifier Trainer
- Activités liées à l'entraînement de la classification des documents
- Vue d’ensemble de l’extraction des données
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- FlexiCapture Extractor
- Activités liées à l'extraction de données
- Consommation de données
- Paquets ML
- Pipelines
- Document Manager
- Services OCR
- Document Understanding déployé dans Automation Suite
- Installer et utiliser
- Première expérience d'exécution
- Déployer UiPathDocumentOCR
- Déployer un paquet ML prêt à l'emploi
- Offres groupées hors ligne 2022.10.0
- Offres groupées hors ligne 2022.10.2
- Bundles 2022.10.4 hors ligne
- Bundles hors ligne 2022.10.6
- Bundles 2022.10.9 hors ligne
- Bundles 2022.10.10 hors ligne
- Bundles 2022.10.11 hors ligne
- Bundles 2022.10.12 hors ligne
- Bundles 2022.10.13 hors ligne
- Bundles 2022.10.14 hors ligne
- Utiliser le gestionnaire de documents
- Utiliser l'infrastructure
- Document Understanding déployé dans une version AI Center autonome
- Apprentissage profond
- Licences
- Référence (Reference)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guide de l'utilisateur de Document Understanding
Déployer UiPathDocumentOCR
Créez un paquet ML UiPathDocumentOCR dans AI Center.
Pour une installation en ligne, le modèle UiPathDocumentOCR est déjà inclus dans la section Packages prêts à l'emploi (Out of the box packages). Accédez à Paquets ML (ML Packages) > Packages prêts à l'emploi (Out of the box packages) > UiPath Document Understanding > UiPathDocumentOCR, puis cliquez sur Soumettre (Submit).
Pour une installation hors ligne, accédez à l'onglet Paquets ML (ML Packages) dans la barre latérale gauche d'AI Center et créez un nouveau package. Nommez le package et téléchargez le package que vous avez téléchargé à partir de cette page. Choisissez le type d'entrée JSON et le langage Python correspondant. Créez un paquet.
Accédez à Compétences ML (ML Skills) et créez une nouvelle compétence ML pour le package UiPathDocumentOCR que vous avez créé.
Veuillez utiliser Paramètres d’infrastructure avancés (Advanced Infra Settings) pour mettre à jour le déploiement afin de mettre à jour la réplique (idéalement, le nombre de répliques doit être égal au nombre de nœuds) et maximiser les requêtes CPU (au moins 4) et RAM si vous n'utilisez pas de machines GPU, ou le traitement UiPathDocumentOCR sera lent et pourra échouer.
Le moteur OCR a besoin d'un GPU pour des performances optimales, et il est recommandé pour les charges de travail de production. Cependant, si le GPU n'est pas disponible, il peut toujours fonctionner sur le CPU, mais il nécessite des ressources plus élevées que la valeur par défaut. Les paramètres d'infrastructure avancés doivent être ajustés comme tels :
Réplicas (Replicas) : augmentez s'il y a une utilisation simultanée de UiPathDocumentOCR. Si vous utilisez UiPathDocumentOCR pour effectuer des importations sur une seule session de labellisation de données à la fois et que UiPathDocumentOCR n'est pas utilisé dans d'autres workflows UiPath, 1 réplique suffit. Sinon, le nombre de répliques doit être augmenté. Il n'y a pas de nombre « magique » ici, vous avez besoin de faire des essais et de commettre des erreurs. N'utilisez pas plus de 2 répliques sur une installation à nœud unique. Idéalement, le nombre de répliques doit être égal au nombre de nœuds dans le cluster (1 réplique/nœud). Si plus de parallélisme est nécessaire, vous pouvez augmenter le CPU
CPU : il doit être au moins de 4 (pour chaque réplica). Assurez-vous d'avoir les ressources appropriées. Il n'y a pas de nombre « magique », mais un CPU élevé signifie un temps de traitement plus rapide. Vous devez faire des tests dans vos scénarios spécifiques pour déterminer le nombre suffisant.
Cela peut prendre jusqu'à 30 minutes pour que la compétence ML soit prête. Vous devrez peut-être actualiser la page AI Center pour voir le changement de statut.
Félicitations ! Vous avez déployé avec succès UiPathDocumentOCR sur AI Center.
Vous pouvez sélectionner directement la compétence ML en tant que compétence privée dans le workflow Studio. Ou, si vous avez installé la version en ligne autonome d'AI Center et que vous souhaitez utiliser la compétence ML publique, veuillez suivre les instructions ci-dessous pour obtenir le point de terminaison public de la compétence ML (facultatif).
Une fois la compétence ML disponible, double-cliquez sur la compétence ML et accédez à Modifier le déploiement actuel (Modify current deployment).
Activez la bascule pour rendre la compétence ML publique. Vous devrez peut-être attendre quelques minutes et actualiser la page.
Double-cliquez sur la compétence ML et copiez l'URL, qui est le point de terminaison de UiPathDocumentOCR pour une utilisation ultérieure.