- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- 990 - Paquet ML - Aperçu
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Passeports - Paquet ML
- Fiches de paie - Paquet ML
- Bons de commande - Paquet ML
- Reçus – Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Prérequis matériels
- Pipelines
- Document Manager
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Tableaux de bord Insights.
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Licences
- Activités
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guide de l'utilisateur de Document Understanding
Démarrage
Selon les modèles que vous souhaitez utiliser, vous avez besoin des éléments suivants :
- Pour les modèles 2022.10 et ultérieurs :
- Téléchargez les bundlesTM Document Understanding nécessaires. Voici les liens vers tous les bundles disponibles. Le bundle du contient des informations sur tous les modèles inclus dans une version spécifique. Par exemple, le
dusemistructured-2024.10.0.tar.gzcontient des informations sur tous les paquets ML pré-entraînés prêts à l’emploi inclus dans la version 2024.10.0.
- Téléchargez les bundlesTM Document Understanding nécessaires. Voici les liens vers tous les bundles disponibles. Le bundle du contient des informations sur tous les modèles inclus dans une version spécifique. Par exemple, le
- Pour les modèles 2022.4 et antérieurs (
python37duv3etpython37duv4) :- Tous les paquets ML sont fournis sous forme de fichier
.zipimporté directement en tant que package personnalisé dans AI Center. Pour télécharger les modèles, contactez votre responsable de compte, CSM ou l'assistance pour recevoir un lien de téléchargement par package. - Téléchargez les bundles Document Understanding nécessaires. Voici les liens vers tous les bundles disponibles.
- Tous les paquets ML sont fournis sous forme de fichier
Les versions mises à jour des bundles dulv ne sont plus publiées. La dernière version des bundles dulv est la version 2023.10.4.
Installer le bundle hors ligne
Les installations hors ligne nécessitent que le bundle DU téléchargé soit renommé dans la ligne de commande en du-ondemand.tar.gz. Par exemple, si vous avez téléchargé le bundle DU nommé dusemistructured-2024.10.0.tar.gz, vous devez le renommer du-ondemand.tar.gz au moment de l’installation.
-
Pour les machines Windows, téléchargez directement via le lien du bundle et renommez le fichier en
du-ondemand.tar.gz -
Pour les machines Linux, depuis une machine connectée à Internet, téléchargez le bundle nécessaire à l'aide de la commande suivante :
wget -O ~/<bundle-name.tar.gz> 'bundle-link'wget -O ~/<bundle-name.tar.gz> 'bundle-link'Voici un exemple de téléchargement du bundle nécessaire pour Linux :
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2024.10.0/dusemistructured-2024.10.0.tar.gz'wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2024.10.0/dusemistructured-2024.10.0.tar.gz' -
Copiez le bundle suivant dans le dossier
/uipath/tmpsur la machine principale du cluster (où l'installation a eu lieu) :scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/ -
Connectez-vous à la machine principale et chargez le bundle :
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
Importer le modèle dans AI Center
Après avoir téléchargé et installé les modèles, suivez les étapes décrites sur la page Installation hors ligne des paquets ML du Guide de l’utilisateur d’AI Center pour les charger vers AI Center. Le paquet ML zip et les fichiers de métadonnées json sont nécessaires pour effectuer cette procédure.
Extracteur de formulaires intelligents et classifieur de mots clés intelligents
Accédez à Extracteur de formulaires et Classificateur de mots-clés intelligent à l'aide de l'URL publique suivante :
<FQDN>/du_/svc/formextractor<FQDN>/du_/svc/intelligentkeywords
Lorsque vous utilisez une URL publique, remplacez l'espace réservé <FQDN> par les informations d'environnement réelles. Par exemple, <FQDN>/du_/svc/formextractor devient https://servicefabricserver.domain.com/du_/svc/formextractor lorsque cet élément est utilisé dans un workflow.
Télécharger le bundle Document Understanding™ vers un registre Docker externe
Suivez ces étapes pour télécharger un bundle Document Understanding dans votre registre Docker externe :
- Extrayez l’image DU souhaitée du registre UiPath® hébergé sur registry.uipath.com.
- Renommez l'hôte de l'image selon votre nom de registre Docker.
- Transmettez l'image vers le registre docker externe
Extraire les images Document Understanding souhaitées
Extrayez les images du registre UiPath® en exécutant ces commandes :
docker pull <uipath_registry_server>/<image_name>
docker pull <uipath_registry_server>/<image_name>
Voici un exemple d'extraction de l'image du bundle UiPathDocumentOCR à partir d'un registre appelé registry.uipath.com :
docker pull registry.uipath.com/aicenter/du-doc-ocr:v24.10-10.3-rc02
docker pull registry.uipath.com/aicenter/du-doc-ocr:v24.10-10.3-rc02
Renommer l'hôte de l'image
Renommez l'hôte de l'image en exécutant la commande suivante :
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
Voici un exemple de renommage de l'image du bundle UiPathDocumentOCR d'un registre appelé registry.uipath.com vers un registre appelé registory.mycompany.com :
docker tag registry.uipath.com/aicenter/du-doc-ocr:v24.10-10.3-rc02 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker tag registry.uipath.com/aicenter/du-doc-ocr:v24.10-10.3-rc02 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
Transmettez l'image vers le registre docker externe
Transmettez l'image à votre registre docker externe en exécutant la commande suivante :
docker push <your_registry_server>/<image_name>
docker push <your_registry_server>/<image_name>
Voici un exemple de transmission de l'image du bundle UiPathDocumentOCR vers un registre docker externe :
docker push registory.mycompany.com/aicenter/du-doc-ocr:v24.10.0
docker push registory.mycompany.com/aicenter/du-doc-ocr:v24.10.0
Images pour chaque bundle Document Understanding
2024.10.8
| Bundle Document Understanding | Image |
|---|---|
| UiPath Document OCR | aicenter/du-doc-ocr:v24.10-2.24-rc07 |
| UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v24.10-2.24-rc07 |
| Extended Languages OCR | du/du-extended-ocr-proxy:v24.10-3.10-rc03 du/uipath-ocr-extended:v24.10-3.10-rc03 du/du-extended-ocr-reporting:v24.10-3.10-rc03 |
| Classifieur de documents | aicenter/du-ml-document-type-text-classifier:v24.10-2.24-rc07 |
| Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v24.10-2.24-rc07 |
2024.10.7
| Bundle Document Understanding | Image |
|---|---|
| UiPath Document OCR | aicenter/du-doc-ocr:v24.10-11.18-rc02 |
| UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v24.10-11.18-rc02 |
| Extended Languages OCR | du/du-extended-ocr-proxy:v24.10-12.10-rc02 du/uipath-ocr-extended:v24.10-12.10-rc02 du/du-extended-ocr-reporting:v24.10-12.10-rc02 |
| Classifieur de documents | aicenter/du-ml-document-type-text-classifier:v24.10-11.18-rc02 |
| Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v24.10-11.18-rc02 |
2024.10.6
| Bundle Document Understanding | Image |
|---|---|
| Extended Languages OCR | du/du-extended-ocr-proxy:v24.10-10.31-rc02 du/uipath-ocr-extended:v24.10-10.31-rc02 du/du-extended-ocr-reporting:v24.10-10.31-rc02 |
2024.10.5
| Bundle Document Understanding | Image |
|---|---|
| UiPath Document OCR | aicenter/du-doc-ocr:v24.10-8.25-rc02 |
| UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v24.10-8.25-rc02 |
| Extended Languages OCR | du/du-extended-ocr-proxy:v24.10-9.11-rc02 du/uipath-ocr-extended:v24.10-9.11-rc02 du/du-extended-ocr-reporting:v24.10-9.11-rc02 |
| Classifieur de documents | aicenter/du-ml-document-type-text-classifier:v24.10-8.25-rc02 |
| Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v24.10-8.25-rc02 |
2024.10.4
| Bundle Document Understanding | Image |
|---|---|
| UiPath Document OCR | aicenter/du-doc-ocr:v24.10-5.15-rc03 |
| UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v24.10-5.15-rc03 |
| Extended Languages OCR | du/du-extended-ocr-proxy:v24.10-6.05-rc02 du/uipath-ocr-extended:v24.10-6.05-rc02 du/du-extended-ocr-reporting:v24.10-6.05-rc02 |
| Classifieur de documents | aicenter/du-ml-document-type-text-classifier:v24.10-5.15-rc03 |
| Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v24.10-5.15-rc03 |
2024.10.3
| Bundle Document Understanding | Image |
|---|---|
| UiPath Document OCR | aicenter/du-doc-ocr:v24.10-3.11-rc01 |
| UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v24.10-3.11-rc01 |
| Extended Languages OCR | du/du-extended-ocr-proxy:v24.10-4.20-rc02 du/uipath-ocr-extended:v24.10-4.20-rc02 du/du-extended-ocr-reporting:v24.10-4.20-rc02 |
| Classifieur de documents | aicenter/du-ml-document-type-text-classifier:v24.10-3.11-rc01 |
| Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v24.10-3.11-rc01 |
2024.10.2
| Bundle Document Understanding | Image |
|---|---|
| UiPath Document OCR | aicenter/du-doc-ocr:v24.10-1.27-rc02 |
| UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v24.10-1.27-rc02 |
| Extended Languages OCR | du/du-extended-ocr-proxy:v24.10-2.10-rc01 du/uipath-ocr-extended:v24.10-2.10-rc01 du/du-extended-ocr-reporting:v24.10-2.10-rc01 |
| Classifieur de documents | aicenter/du-ml-document-type-text-classifier:v24.10-1.27-rc02 |
| Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v24.10-1.27-rc02 |
2024.10.1
| Bundle Document Understanding | Image |
|---|---|
| UiPath Document OCR | aicenter/du-doc-ocr:v24.10-11.21-rc12 |
| UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v24.10-11.21-rc12 |
| Extended Languages OCR | du/du-extended-ocr-proxy:v24.10-12.03-rc04 du/uipath-ocr-extended:v24.10-12.03-rc04 du/du-extended-ocr-reporting:v24.10-12.03-rc04 |
| Classifieur de documents | aicenter/du-ml-document-type-text-classifier:v24.10-11.21-rc12 |
| Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v24.10-11.21-rc12 |
2024.10.0
| Bundle Document Understanding | Image |
|---|---|
| UiPath Document OCR | aicenter/du-doc-ocr:v24.10-10.03-rc02 |
| UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v24.10-10.03-rc02 |
| Extended Languages OCR | du/du-extended-ocr-proxy:v24.10-10.26-rc01 du/uipath-ocr-extended:v24.10-10.26-rc01 du/du-extended-ocr-reporting:v24.10-10.26-rc01 |
| Classifieur de documents | aicenter/du-ml-document-type-text-classifier:v24.10-10.03-rc02 |
| Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v24.10-10.17-rc02 |
- Démarrage
- Installer le bundle hors ligne
- Importer le modèle dans AI Center
- Extracteur de formulaires intelligents et classifieur de mots clés intelligents
- Télécharger le bundle Document Understanding™ vers un registre Docker externe
- Extraire les images Document Understanding souhaitées
- Renommer l'hôte de l'image
- Transmettez l'image vers le registre docker externe
- Images pour chaque bundle Document Understanding
- 2024.10.8
- 2024.10.7
- 2024.10.6
- 2024.10.5
- 2024.10.4
- 2024.10.3
- 2024.10.2
- 2024.10.1
- 2024.10.0