- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- FlexiCapture Classifier
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- FlexiCapture Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- 4506T - Paquet ML
- 990 - Paquet ML - Aperçu
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Certificat de constitution (Certificate of Incorporation) - Paquet ML
- Certificat d'origine - Paquet ML
- Chèques - Paquet ML
- Certificat de produit pour enfants - Paquet ML
- CMS 1500 - Paquet ML
- Déclaration de conformité UE - Paquet ML
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- Invoices Australia - ML package
- Invoices China - ML package
- Invoices India - ML package
- Invoices Japan - ML package
- Expédition des factures - Paquet ML
- Listes de colisage - Paquet ML
- Passeports - Paquet ML
- Fiches de paie - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Prérequis matériels
- Pipelines
- Document Manager
- Services OCR
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Licences
- Activités (Activities)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
- Apprentissage profond
Installer et utiliser
Cette page explique comment déployer et configurer Document Understanding, ainsi que des instructions spéciales sur l'utilisation de Document Understanding déployé sur Automation Suite.
Document Understanding dépend d'AI Center, ce qui signifie qu'AI Center doit toujours être installé si Document Understanding est installé.
De plus, Orchestrator doit être activé avant d'utiliser Document Understanding.
Avant de commencer l'installation de Document Understanding, assurez-vous de vérifier et de satisfaire à toutes les exigences pour les installations Automation Suite à nœud unique et multi-nœuds décrites ici.
Un GPU est fortement recommandé pour Document Understanding dans l'un des scénarios suivants :
-
Si vous réentraînez les modèles Document Understanding (DocumentUnderstanding - le modèle général, Invoices, Receipts, etc.) sur AI Center.
L'entraînement sur processeur est 5 à 7 fois plus lent et les performances du modèle se dégradent par rapport à l'entraînement sur GPU.
-
Si vous exécutez UiPathDocumentOCR (version non-edge) sur AI Center pour traiter plus de 2 millions de pages par an.
Si vous n'utilisez pas de GPU, le ralentissement des performances peut avoir un impact sur l'expérience du produit.
Pour plus d'informations sur l'enregistrement d'un GPU, consultez l'article Ajout d'un nœud d'agent dédié avec prise en charge du GPU.
Document Understanding exige que la fonctionnalité FullTextSearch soit activée sur le serveur SQL. Sinon, l'installation échouera sans afficher de message d'erreur explicite.
Pour plus d'informations sur l'installation de Document Understanding dans un environnement en ligne, consultez les guides suivants :
Le processus est essentiellement le même que pour l'installation d'autres services, et la seule exigence est de s'assurer que AI Center et Document Understanding sont activés.
- Si vous utilisez le programme d'installation interactif, assurez-vous de sélectionner les deux produits en suivant les étapes.
-
Si vous n'utilisez pas le programme d'installation interactif, veuillez activer AI Center et Document Understanding dans le fichier de configuration avant l'installation, ou dans ArgoCD après l'installation.
Un exemple de fichier de configuration est inclus dans la page du fichier de configuration de Document Understanding.
Pour plus d'informations sur l'installation de Document Understanding dans un environnement hors ligne, consultez les guides suivants :
Les modifications ci-dessous sont requises pour une installation réussie de Document Understanding dans un environnement hors ligne :
-
Assurez-vous que AI Center et Document Understanding sont activés dans le fichier de configuration avant l'installation ou dans ArgoCD après l'installation. Veuillez vous assurer que l'écriture manuscrite est également activée dans le fichier de configuration si vous souhaitez utiliser la fonctionnalité.
Un exemple de fichier de configuration est inclus dans la page du fichier de configuration de Document Understanding.
-
Assurez-vous que le bundle Document Understanding est téléchargé et installé.
Pour plus d'informations sur le téléchargement et l'installation du bundle Document Understanding, consultez la page Installation hors ligne des paquets ML.
Vérifiez le fichier de configuration Document Understanding ici.
Veuillez accéder à l' Extracteur de formulaires ( Form Extractor) et au Classifieur de mots clés intelligents (Intelligent Keyword Classifier) avec l'URL publique ci-dessous :
<FQDN>/du_/svc/formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
par les informations d'environnement réelles. Par exemple, <FQDN>/du_/svc/formextractor
devient https://servicefabricserver.domain.com/du_/svc/formextractor
lorsque cet élément est utilisé dans un workflow.
En tant qu’opération post-installation, vous pouvez activer ou désactiver Document Understanding. Plus de détails peuvent être trouvés ici.
Si vous souhaitez utiliser l’OCR pour le point de terminaison chinois, japonais et coréen dans un environnement hors ligne, vous devez installer le bundle hors ligne en suivant ces instructions, et une fois le bundle installé, vous devez activer l’OCR dans ArgoCD.
- Lorsque la reconnaissance optique des caractères (OCR) pour le chinois, le japonais et le coréen est utilisée dans Document Understanding, veillez à bien avoir configuré l'activité avec le point de terminaison public de l'OCR et la clé API de Document Understanding.
- L’OCR pour le chinois, le japonais et le coréen est uniquement pris en charge dans le cadre de Document Understanding déployé dans Automation Suite. Il n’est pas pris en charge dans le cadre de Document Understanding déployé dans AI Center et connecté à un Orchestrator externe.
Voici les étapes à suivre pour activer l’OCR dans ArgoCD :
- Accédez à ArgoCD.
- Ouvrez l’infrastructure Document Understanding.
- Cliquez sur l’onglet Paramètres (Parameters) et accédez à
du-cjk-ocr.enabled
. - Cliquez sur le bouton Modifier(Edit), définissez la valeur sur
TRUE
et cliquez sur le bouton Enregistrer (Save).
{Cluster_FQDN}/du_/cjk-ocr/
.
Consultez les problèmes liés à Document Understanding ici.
- Dépendances
- Prérequis matériels
- Configuration requise pour SQL Server
- Installation en ligne
- Installation hors ligne
- Ressources
- Fichier de configuration
- Accéder aux modèles
- Activer ou désactiver Document Understanding
- Activer ou désactiver l’OCR pour le chinois, le japonais et le coréen
- Résolution des problèmes