UiPath Documentation
document-understanding
2.2510
true
Important :
La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.
UiPath logo, featuring letters U and I in white

Document Understanding user guide

Dernière mise à jour 6 avr. 2026

Importer des documents

La boîte de dialogue Importer des données (Import data) vous permet d'importer facilement de nouveaux documents à labelliser ou à réviser.

Select the Import button Icône d'importation from the management bar.

La boîte de dialogue contient les contrôles suivants :

  • Champ de texte du nom du lot (batch name) - il est obligatoire d'entrer un nom pour votre exportation, sinon la section Parcourir ou déposer des fichiers (Browse or drop files) est désactivée ; un nom valide peut comporter jusqu'à 24 caractères et ne doit pas contenir de caractères spéciaux.

  • Make this an evaluation set checkbox - if selected, the dataset is used for evaluation purposes.

  • Browse or drop files section - select Browse files to upload to navigate through your directory or simply drag and drop the files inside the frame.

  • Status section - select (load previous import log) to check to check the status of the latest import; when uploading data, in the Status section you receive an overview of your files and you are prompted to proceed with the import by selecting YES or abort the import by selecting CANCEL.

    Capture d'écran de l'interface Importer des données.

Types d'importation

Il existe 4 types d'importation pris en charge dans Document Manager :

  • Importation de schémas
  • Raw documents import (max 2000 pages and 4000 MiB per import)
  • Document Manager dataset import (4000 MiB per import)
  • Validation Station dataset import (max 2000 pages and 4000 MiB per import)

Importation de schémas

Si vous souhaitez lancer une nouvelle session Document Manager en utilisant le même schéma que dans une session existante, vous pouvez suivre ces étapes :

  1. Select the Export button from the management bar.
  2. Dans la boîte de dialogue Exporter les fichiers (Export Files), cochez l'option Schéma.
  3. Select the Export button inside the dialog box. A .zip file is exported.
  4. Select the Import button from the management bar.
  5. Upload or drag & drop the .zip file directly into the new Document Manager session (do not unzip). In this step, you can also upload a predefined schema.
  6. Select YES in the Status section to proceed with the import. The schema is imported.

L’importation de schémas peut désormais être appliquée aux champs à plusieurs valeurs.

Important :

Sachez que les champs à plusieurs valeurs ne sont compatibles qu’avec les modèles dotés de la version 2022.10 ou d’une version ultérieure.

Importation de documents bruts

Les types de documents pouvant être importés pour la labellisation sont : .pdf, .tiff, .png, .jpg.

Les fichiers .zip ne sont pas pris en charge pour l'importation de documents bruts.

Les paramètres OCR doivent être configurés avant l'importation.

  1. Select the Import button Icône d'importation. The Import data dialog box is displayed.
  2. Indiquez un nom de lot dans le champ Nom du lot (Batch name). Cela vous permet de filtrer et de retrouver ultérieurement facilement ces documents à l'aide de la liste déroulante Rechercher (Search).
    • Si vous souhaitez utiliser ce lot de documents pour entraîner un modèle ML, laissez décochée la case En faire un ensemble d'évaluation (Make this an evaluation set).
    • Si vous souhaitez utiliser ce lot de documents pour évaluer un modèle ML (c'est-à-dire pour mesurer ses performances), cochez la case En faire un ensemble d'évaluation (Make this an evaluation set). Cela garantit que les données sont ignorées par les pipelines d'entraînement.
  3. Téléchargez ou glissez-déposez un fichier ou un ensemble de fichiers dans la section Parcourir ou déposer des fichiers (Browse or drop files).
  4. Select YES. The file or set of files are imported.

Importation d’un ensemble de données de Document Manager

Pour importer un ensemble de données qui a été labellisé précédemment sur une autre session de Document Manager, vous devez obtenir le fichier .zip qui a été exporté à l'origine et l'importer directement dans la nouvelle instance de Document Manager.

Si votre nouvelle instance de Document Manager est complètement vide (aucune donnée et aucun champ définis), les documents avec labels et le schéma sont importés.

Si votre nouvelle instance de Document Manager a déjà des champs définis, l'ensemble de données nouvellement importé doit avoir les mêmes champs, ou un sous-ensemble de ces champs. Dans le cas contraire, l'importation est rejetée.

Si vous exportez une base de données à partir d'un environnement Automation Cloud™, puis l'importez dans un déploiement local, vous devez suivre ces étapes :

  1. Décompressez le fichier de l'ensemble de données.
  2. Modifiez le fichier scheman.json à partir de l'archive.
  3. Supprimez toutes les propriétés display_name du fichier json, puis enregistrez-le.
  4. Compressez le jeu de données et importez-le dans la session locale.
Fractionner de grands ensembles de données

To import Document Manager datasets larger than 1GB or that have more than 1500 files, we recommend you to use this script which splits the .zip files into multiple .zip files that are smaller than 1GB and that have less than 1500 files.

Importation d'ensembles de données de la Station de validation

As your RPA workflow processes documents using an existing ML model, some documents may require human validation using the Validation Station activity (available on attended bots or in the browser using Orchestrator Action Center).

The validated data generated in Validation Station can be exported using Machine Learning Extractor Trainer activity and can be used to train ML models.

Remarque :

Pour l'importation d'un ensemble de données de la station de validation, il est obligatoire d'avoir défini un schéma.

  1. Configurez le Machine Learning Extractor Trainer pour générer des données dans un dossier avec le chemin d'accès <Trainer/Output/Folder> (utilisez n'importe quel chemin d'accès au dossier vide).
  2. Exécutez le workflow RPA, y compris la station de validation (Validation Station) et le Machine Learning Extractor Trainer.
  3. Le Machine Learning Extractor Trainer crée trois sous-dossiers : documents, métadonnées et prédictions à l'intérieur du dossier de sortie.
  4. Compressez le <Trainer/Output/Folder> pour obtenir un fichier .zip, par exemple TrainerOutputFolder.zip.
  5. Importez le fichier .zip dans Document Manager qui détecte que l'importation contient des données produites par Machine Learning Extractor Trainer et importe les données en conséquence.

S'il manque des champs requis par l'ensemble de données, un message d'erreur s'affiche dans la boîte de dialogue d'importation.

Capture d'écran de l'interface Importer des données.

Cette page vous a-t-elle été utile ?

Connecter

Besoin d'aide ? Assistance

Vous souhaitez apprendre ? UiPath Academy

Vous avez des questions ? UiPath Forum

Rester à jour