document-understanding

2022.10

false

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Guide de l'utilisateur de Document Understanding

PRODUIT :

Dernière mise à jour 5 mars 2025

Installer et utiliser

Cette page explique comment déployer et configurer Document Understanding^TM, ainsi que des instructions spéciales sur l’utilisation de Document Understanding^TM déployé sur Automation Suite.

Dépendances

Document Understanding dépend d'AI Center, ce qui signifie qu'AI Center doit toujours être installé si Document Understanding est installé.

De plus, Orchestrator doit être activé avant d'utiliser Document Understanding.

Prérequis matériels

Avant de commencer l'installation de Document Understanding, assurez-vous de vérifier et de satisfaire à toutes les exigences pour les installations Automation Suite à nœud unique et multi-nœuds décrites ici.

Un GPU est fortement recommandé pour Document Understanding dans l'un des scénarios suivants :

Si vous réentraînez les modèles Document Understanding (DocumentUnderstanding - le modèle général, Invoices, Receipts, etc.) sur AI Center.

L'entraînement sur processeur est 5 à 7 fois plus lent et les performances du modèle se dégradent par rapport à l'entraînement sur GPU.
Si vous exécutez UiPathDocumentOCR (version non-edge) sur AI Center pour traiter plus de 2 millions de pages par an.

Si vous n'utilisez pas de GPU, le ralentissement des performances peut avoir un impact sur l'expérience du produit.

Pour plus d'informations sur l'enregistrement d'un GPU, consultez l'article Ajout d'un nœud d'agent dédié avec prise en charge du GPU.

Configuration requise pour SQL Server

Document Understanding exige que la fonctionnalité FullTextSearch soit activée sur le serveur SQL. Sinon, l'installation échouera sans afficher de message d'erreur explicite.

Ressources

Fichier de configuration

Vérifiez le fichier de configuration Document Understanding ici.

Accéder aux modèles

Accédez à l’extracteur de formulaires et au Classifieur de mots clés intelligents via l’URL publique suivante :

<FQDN>/du_/svc/formextractor
<FQDN>/du_/svc/intelligentkeywords

Remarque : Lorsque vous utilisez une URL publique, remplacez l'espace réservé <FQDN> par les informations d'environnement réelles. Par exemple,

<FQDN>/du_/svc/formextractordevient https://servicefabricserver.domain.com/du_/svc/formextractorlorsqu'il est utilisé dans un workflow.


               
               
                  Activer ou désactiver Document Understanding
link
                  En tant qu'opération post-installation, vous pouvez activer ou désactiver Document Understanding. Plus de détails peuvent être trouvés ici.
                  
                  
               
               
               
                  Activer ou désactiver l’OCR pour le chinois, le japonais et le coréen
link
                  Si vous souhaitez utiliser l’OCR pour le point de terminaison chinois, japonais et coréen dans un environnement hors ligne, vous devez installer le bundle hors ligne en suivant ces instructions, et une fois le bundle installé, vous devez activer l’OCR dans ArgoCD.
                  
                  
                  
Remarque : 
                     
                        Lorsque la reconnaissance optique des caractères (OCR) pour le chinois, le japonais et le coréen est utilisée dans Document Understanding, veillez à bien avoir configuré l'activité avec le point de terminaison public de l'OCR et la clé API de Document Understanding.
                        
                        
                        L’OCR pour le chinois, le japonais et le coréen est uniquement pris en charge dans le cadre de Document Understanding déployé dans Automation Suite. Il n’est pas pris en charge dans le cadre de Document Understanding déployé dans AI Center et connecté à un Orchestrator externe.
                        
                        
                     
                     
                  
                  
                  Voici les étapes à suivre pour activer l’OCR dans ArgoCD :
                  
                  
                     Accédez à ArgoCD. 
                     
                     Ouvrez l’infrastructure Document Understanding. 
                     
                     Cliquez sur l’onglet Paramètres (Parameters) et accédez à du-cjk-ocr.enabled. 
                     
                     
                     Cliquez sur le bouton Modifier(Edit), définissez la valeur sur TRUE et cliquez sur le bouton Enregistrer (Save). 
                     
                     
                  
                  
                  
Remarque : le point de terminaison de l’OCR pour le chinois, le japonais et le coréen dans une installation Automation Suite est construit en tant que {Cluster_FQDN}/du_/cjk-ocr/.
                  
                  
               
               
               
                  Résolution des problèmes
link
                  Consultez les problèmes liés à Document Understanding ici.