- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- 990 - Paquet ML - Aperçu
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Passeports - Paquet ML
- Fiches de paie - Paquet ML
- Bons de commande - Paquet ML
- Reçus – Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Prérequis matériels
- Pipelines
- Document Manager
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Tableaux de bord Insights.
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Licences
- Activités
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding user guide
Importer des documents
La boîte de dialogue Importer des données (Import data) vous permet d'importer facilement de nouveaux documents à labelliser ou à réviser.
Select the Import button
from the management bar.
La boîte de dialogue contient les contrôles suivants :
-
Champ de texte du nom du lot (batch name) - il est obligatoire d'entrer un nom pour votre exportation, sinon la section Parcourir ou déposer des fichiers (Browse or drop files) est désactivée ; un nom valide peut comporter jusqu'à 24 caractères et ne doit pas contenir de caractères spéciaux.
-
Make this an evaluation set checkbox - if selected, the dataset is used for evaluation purposes.
-
Browse or drop files section - select Browse files to upload to navigate through your directory or simply drag and drop the files inside the frame.
-
Status section - select (load previous import log) to check to check the status of the latest import; when uploading data, in the Status section you receive an overview of your files and you are prompted to proceed with the import by selecting YES or abort the import by selecting CANCEL.

Types d'importation
Il existe 4 types d'importation pris en charge dans Document Manager :
- Importation de schémas
- Raw documents import (max 2000 pages and 4000 MiB per import)
- Document Manager dataset import (4000 MiB per import)
- Validation Station dataset import (max 2000 pages and 4000 MiB per import)
Importation de schémas
Si vous souhaitez lancer une nouvelle session Document Manager en utilisant le même schéma que dans une session existante, vous pouvez suivre ces étapes :
- Select the Export button from the management bar.
- Dans la boîte de dialogue Exporter les fichiers (Export Files), cochez l'option Schéma.
- Select the Export button inside the dialog box. A
.zipfile is exported. - Select the Import button from the management bar.
- Upload or drag & drop the
.zipfile directly into the new Document Manager session (do not unzip). In this step, you can also upload a predefined schema. - Select YES in the Status section to proceed with the import. The schema is imported.
L’importation de schémas peut désormais être appliquée aux champs à plusieurs valeurs.
Sachez que les champs à plusieurs valeurs ne sont compatibles qu’avec les modèles dotés de la version 2022.10 ou d’une version ultérieure.
Importation de documents bruts
Les types de documents pouvant être importés pour la labellisation sont : .pdf, .tiff, .png, .jpg.
Les fichiers .zip ne sont pas pris en charge pour l'importation de documents bruts.
Les paramètres OCR doivent être configurés avant l'importation.
- Select the Import button
. The Import data dialog box is displayed. - Indiquez un nom de lot dans le champ Nom du lot (Batch name). Cela vous permet de filtrer et de retrouver ultérieurement facilement ces documents à l'aide de la liste déroulante Rechercher (Search).
- Si vous souhaitez utiliser ce lot de documents pour entraîner un modèle ML, laissez décochée la case En faire un ensemble d'évaluation (Make this an evaluation set).
- Si vous souhaitez utiliser ce lot de documents pour évaluer un modèle ML (c'est-à-dire pour mesurer ses performances), cochez la case En faire un ensemble d'évaluation (Make this an evaluation set). Cela garantit que les données sont ignorées par les pipelines d'entraînement.
- Téléchargez ou glissez-déposez un fichier ou un ensemble de fichiers dans la section Parcourir ou déposer des fichiers (Browse or drop files).
- Select YES. The file or set of files are imported.
Importation d’un ensemble de données de Document Manager
Pour importer un ensemble de données qui a été labellisé précédemment sur une autre session de Document Manager, vous devez obtenir le fichier .zip qui a été exporté à l'origine et l'importer directement dans la nouvelle instance de Document Manager.
Si votre nouvelle instance de Document Manager est complètement vide (aucune donnée et aucun champ définis), les documents avec labels et le schéma sont importés.
Si votre nouvelle instance de Document Manager a déjà des champs définis, l'ensemble de données nouvellement importé doit avoir les mêmes champs, ou un sous-ensemble de ces champs. Dans le cas contraire, l'importation est rejetée.
Si vous exportez une base de données à partir d'un environnement Automation Cloud™, puis l'importez dans un déploiement local, vous devez suivre ces étapes :
- Décompressez le fichier de l'ensemble de données.
- Modifiez le fichier
scheman.jsonà partir de l'archive. - Supprimez toutes les propriétés
display_namedu fichierjson, puis enregistrez-le. - Compressez le jeu de données et importez-le dans la session locale.
Fractionner de grands ensembles de données
To import Document Manager datasets larger than 1GB or that have more than 1500 files, we recommend you to use this script which splits the .zip files into multiple .zip files that are smaller than 1GB and that have less than 1500 files.
Importation d'ensembles de données de la Station de validation
As your RPA workflow processes documents using an existing ML model, some documents may require human validation using the Validation Station activity (available on attended bots or in the browser using Orchestrator Action Center).
The validated data generated in Validation Station can be exported using Machine Learning Extractor Trainer activity and can be used to train ML models.
Pour l'importation d'un ensemble de données de la station de validation, il est obligatoire d'avoir défini un schéma.
- Configurez le Machine Learning Extractor Trainer pour générer des données dans un dossier avec le chemin d'accès
<Trainer/Output/Folder>(utilisez n'importe quel chemin d'accès au dossier vide). - Exécutez le workflow RPA, y compris la station de validation (Validation Station) et le Machine Learning Extractor Trainer.
- Le Machine Learning Extractor Trainer crée trois sous-dossiers : documents, métadonnées et prédictions à l'intérieur du dossier de sortie.
- Compressez le
<Trainer/Output/Folder>pour obtenir un fichier.zip, par exemple TrainerOutputFolder.zip. - Importez le fichier
.zipdans Document Manager qui détecte que l'importation contient des données produites par Machine Learning Extractor Trainer et importe les données en conséquence.
S'il manque des champs requis par l'ensemble de données, un message d'erreur s'affiche dans la boîte de dialogue d'importation.
