document-understanding

latest

false

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Guide de l'utilisateur de Document Understanding

PRODUIT :

Dernière mise à jour 18 sept. 2025

Types de documents (Document Manager)

Les types de documents vous permettent de préparer, de réviser et d'apporter des corrections aux ensembles de données requis pour l'entraînement et l'évaluation des modèles d'apprentissage automatique de Document Understanding^TM. Ils permettent à plusieurs utilisateurs d'effectuer diverses opérations :

Définir et configurer les champs à extraire par un modèle ML.
Importer des documents à des fins de labellisation
Pré-labelliser des documents à l'aide d'un modèle ML préexistant, tel que les modèles Extraction de factures (Invoice Extraction) ou Extraction de reçus (Receipt Extraction) fournis par UiPath prêts à l'emploi, ou à l'aide d'un modèle entraîné à l'aide d'AI Center.
Labelliser des documents
Exporter des documents au format attendu par les pipelines d'entraînement AI Center.

Créer des types de document

Une fois qu'un projet est créé et ouvert, vous pouvez créer un nouveau type de document en sélectionnant le bouton Nouveau et l'option Utiliser une IA semi-structurée. Une nouvelle fenêtre s'ouvre et demande des informations supplémentaires.

Voici les options disponibles lors de la création d’une nouvelle session Type de document. En renseignant ces valeurs, vous obtenez une estimation de la taille recommandée de l’ensemble de données à utiliser comme point de départ.

De plus, en sélectionnant le type de document Prêt à l’emploi, votre schéma est automatiquement renseigné et configuré pour vous permettre de bénéficier des modèles pré-entraînés disponibles dans AI Center. Cela élimine le besoin d'importer manuellement des schémas prédéfinis, accélère votre travail et réduit les potentielles erreurs coûteuses.

En outre, le point de terminaison de pré-étiquetage est automatiquement renseigné avec le point de terminaison approprié, ce qui facilite l’utilisation de la pré-labellisation immédiatement après l’ouverture du nouveau type de document.

Option	Description
Nom (obligatoire)	Attribuez un nom au nouveau type de document.
Type de document prêt à l’emploi (obligatoire)	Sélectionnez l’un des types de documents pré-entraînés prêts à l’emploi disponibles dans la liste déroulante.
Champs réguliers prêts à l’emploi (facultatif)	Sélectionnez les champs de classification prédéfinis que vous souhaitez extraire de vos documents.
Champs de colonne prêts à l' emploi (facultatif)	Sélectionnez les champs de classification prédéfinis que vous souhaitez extraire de vos documents.
Champs de classification prêts à l’emploi (facultatif)	Sélectionnez les champs de classification prédéfinis que vous souhaitez extraire de vos documents.
Champs de colonne personnalisés (facultatif)	Saisissez le nombre de champs de colonnes supplémentaires que vous souhaitez extraire de vos documents.
Champs de colonne personnalisés (facultatif)	Saisissez le nombre de champs de colonnes supplémentaires que vous souhaitez extraire de vos documents.
Nombre de langues (facultatif)	Saisissez le nombre de langues pour les documents que vous devez extraire.
Nombre de mises en page (facultatif)	Saisissez le nombre de mises en page pour les documents que vous devez extraire.

Remarque : la sélection d’un type de document génère un nombre recommandé de pages qui doivent être utilisées pour l’ensemble de données.

Interface utilisateur

L'interface de Document Manager contient les panneaux suivants :

Barre de gestion
Champs de colonnes
Champs réguliers
Champs de classification
Affichage du document

Management bar

Affiché en haut de la page dans Document Manager.

Vous permet d'effectuer plusieurs opérations : naviguer entre les documents, supprimer/restaurer un document, rechercher/filtrer des documents, exécuter des prédictions de modèle d'IA, importer et exporter des documents.

Voici les éléments disponibles dans la barre de gestion :

Elément	Icon	Description
Navigation		Naviguez entre les documents qui correspondent au filtre actif. Entre les deux flèches, un compteur s'affiche. Il représente le numéro du document actuel sur le nombre total de documents qui correspondent au filtre ou à la recherche active.
Rechercher		Il existe deux fonctionnalités de recherche : Filtres intégrés : filtre les documents en fonction des options disponibles dans le menu déroulant. Utilisation de mots-clés : filtre les documents en fonction d'une entrée de texte.
Supprimer / Restaurer		Supprime ou restaure un document. Les documents supprimés peuvent être trouvés sous le filtre supprimé (deleted).
Importer (Import)		Ouvrez la boîte de dialogue Importer des données (Import data).
Exporter (Export)		Ouvrez la boîte de dialogue Exporter les fichiers (Export files).
Nom et type de document	s/o	Le nom et le type du document actuellement actif. Il existe trois types de documents : Document de formation Document de validation Document d’évaluation Les documents d’entraînement et de validation font partie des ensembles de données d’entraînement utilisés par les Pipelines d'entraînement (Training Pipelines). Les documents d’évaluation sont ignorés par les Pipelines d’entraînement et sont destinés à être utilisés uniquement pour les Pipelines d’évaluation dans AI Center. Ces documents sont ceux qui ont été marqués comme évaluation en cochant la case Marquer cet ensemble d’évaluation dans la boîte de dialogue Importer des données.
Télécharger		L'option est disponible dans le menu déroulant à côté du nom du document. Sélectionnez l'icône pour télécharger un fichier Zip contenant le document d'origine. Outre le document d'origine, toutes les pages converties en images en interne par Document Manager sont également `.jpeg`téléchargées.
Permanently delete		L'option est disponible dans le menu déroulant à côté du nom du document. Supprime définitivement les fichiers individuels. Le `.pdf` et toutes ses images `.jpeg` sont supprimés de l'ensemble de données AI Center et toutes les métadonnées sont supprimées de la base de données. Lorsque vous sélectionnez le bouton, une fenêtre contextuelle s'affiche vous demandant si vous voulez vraiment supprimer définitivement le document. Choisissez OK pour continuer ou Annuler pour retourner à l'écran précédent.
Nom du lot	s/o	Le nom du lot actuel.
Nom de la session	s/o	Le nom de la session en cours.
Prévoir (Predict) Remarque : la fonctionnalité Prévoir (Predict) repose sur UiPath DocPath, mais uniquement pour les locataires basés dans la région Europe. Si votre locataire est situé dans une région hors de l’Europe, cette fonctionnalité utilise l’architecture de modèle de la génération précédente.		Exécutez les prédictions du modèle d'IA et affichez les résultats. Après avoir configuré le préétiquetage, le bouton est activé dans la barre de gestion. Sélectionnez-le pour préétiqueter le document en cours. Le bouton a trois options : Prévoir (Predict) : fusionne les résultats du point de terminaison de prébalisage (configuré dans les paramètres de prébalisage) et la prédiction générative. Si aucun point de terminaison de prébalisage n’est configuré, tous les champs sont prédits à l’aide de la prédiction générative uniquement. Prédiction générative (Generative Predict) : prévoit tous les champs à l’aide de la capacité de prédiction générative. Prédiction du modèle (Model Predict) : les champs sont prédits à l’aide du modèle de point de terminaison de prébalisage configuré dans les paramètres de prébalisage. La fonctionnalité d'annotation générative (prébalisage) supprime toutes les valeurs de champ modifiées manuellement pour tous les types de champ et supprime toutes les balises du document. Pour le moment, l'utilisation de l'option Prévoir (Predict) avec les prébalisages Points de terminaison publics (Public Endpoints) ne prébalise que les 10 premières pages d'un document. Il s'agit d'un problème connu et un correctif est en préparation. Cependant, utiliser l'option Prévoir (Predict) avec des compétences ML dans AI Center n'impose pas une telle limitation. Le prébalisage génératif ne consomme pas d’AI Units lorsque sont utilisés des points de terminaison publics ou des compétences déployées dans Automation Cloud™ à partir de sessions Document Manager hébergées sur Automation Cloud. Le prébalisage génératif consomme des AI Units lorsqu’un point de terminaison public est appelé à partir d’une session hébergée sur Automation Suite, ou bien lorsqu’une compétence déployée dans Automation Suite est appelée à partir d’une session Document Manager hébergée sur Automation Cloud.
Paramètres		Configurez les paramètres d'OCR et de pré-labellisation, ou accédez au panneau Comment... (How to...).

Options Supprimer (Delete) et Supprimer définitivement (Permanently Delete)

Allons un peu plus loin pour comprendre la différence entre les options Supprimer (Delete) et Supprimer définitivement (Permanently Delete).

L’option Supprimer (Delete) supprime les fichiers, mais ne les supprime pas entièrement de votre projet. Les fichiers supprimés peuvent toujours être trouvés sous le filtre supprimé de la barre de recherche et restaurés à l’aide de l’option Restaurer.
L’option Supprimer définitivement (Permanently Delete) supprime les fichiers sélectionnés sans aucune possibilité de les restaurer.

Options de recherche

Trois options de recherche sont disponibles au total, deux sont présentes dans la barre de gestion en haut de la page, et une utilise l'icône Icône de recherche

en bas à gauche de la page.

Remarque : veuillez noter que pour Forms AI, seuls les filtres intégrés suivants sont disponibles : supprimé, labellisé, non labellisé.

La fonctionnalité de recherche exposée comprend deux parties :

Rechercher à l'aide des filtres intégrés : filtre les documents en fonction des options de lot/catégorie disponibles dans le menu déroulant.

Attention :

La sélection de plus d'options rend la recherche plus restrictive. Par exemple, sélectionner Batch import1 et Supprimé (Deleted) affiche uniquement les documents importés dans Batch import1 qui sont supprimés.

Prenez note des combinaisons qui renverront toujours une liste vide : la sélection de Batch import1 et Batch import2 ne renverra jamais un document, car la sélection est restrictive et aucun document ne peut faire partie de deux lots à la fois.

Rechercher dans les documents par mots-clés : cette barre de recherche filtre les informations en fonction de la saisie de texte. Vous devez saisir le ou les mots clés sous forme de texte libre dans la barre de recherche. La recherche porte sur le ou les mots clés dans le contenu d'un document ou le nom du document. La recherche par mots multiples renvoie des résultats lorsque les mots sont adjacents, en excluant toute ponctuation entre eux.

Remarque : Outre les deux barres de recherche, il existe également une recherche à l'intérieur du document, identifiable par ce symbole docs image

La recherche au sein d'un document vous permet de rechercher des instances de texte uniquement dans le document actuel. La barre de recherche se trouve en bas à gauche de l'écran.

Menu Paramètres

Le bouton Paramètres a deux options disponibles :

Paramètres (Settings) où vous pouvez configurer le service OCR ou le prébalisage (Prelabelling)
Comment... qui sert de menu d'aide

OCR

Pour importer des documents dans Document Manager, il est obligatoire de configurer un service OCR.

Méthode OCR

Ce paramètre est disponible uniquement pour les types de documents (sessions Data Manager) créés dans AI Center. Lorsqu’il est créé dans Document Understanding^TM, ce paramètre est hérité des paramètres du projet. Si vous souhaitez modifier ces paramètres dans Document Understanding^TM, revenez à la vue Projet et ouvrez les paramètres du projet en bas à gauche.

Les options basées sur le cloud sont :

UiPath® Document OCR : https://du.uipath.com/ocr ;
OCR pour le chinois, japonais, coréen
Google Cloud Vision OCR qui offre la meilleure couverture linguistique ;
Google Cloud Vision OCR for Japanese, optimal pour la lecture de documents japonais ;
Microsoft Read OCR.

URL OCR

La configuration de la reconnaissance optique de caractères nécessite que le service OCR ait une URL. Voici les URL que vous pouvez utiliser :

URL publiques telles que https://du.uipath.com/ocr ou URL tierces de reconnaissance optique de caractères Google Vision ou Microsoft Read

Clé OCR

La clé API (API Key) correspondante pour le moteur OCR sélectionné. Par exemple, pour UiPath Document OCR, vous devez utiliser la clé API (API Key) Document Understanding. Obligatoire pour Document Manager Cloud et la version locale de Document Manager en ligne (On-Prem Online). Elle n'est pas requise pour la version locale physiquement isolée de Document Manager (On-Prem Air-gapped).

Pour plus d’informations, consultez la page Utilisation cloud et locale.

Appliquer l'OCR aux PDF

Détermine si le processus OCR doit être appliqué ou non aux documents PDF. S’il est défini sur Vrai, l’OCR est appliqué à toutes les pages PDF du document. S’il est défini sur Faux, seul le texte saisi numériquement est extrait. Lorsqu’il est défini sur Auto, il évalue si le document nécessite l’application de l’algorithme OCR en fonction du document d’entrée. La valeur par défaut est Auto.

Prédire/Prébalisage

Remarque : la fonctionnalité Prévoir (Predict) repose sur UiPath DocPath, mais uniquement pour les locataires basés dans la région Europe. Si votre locataire est situé dans une région hors de l’Europe, cette fonctionnalité utilise l’architecture de modèle de la génération précédente.

Si vous disposez déjà d’un modèle capable d’extraire certains des champs nécessitant d’être libellés et que seuls quelques champs supplémentaires nécessitent un libellé manuel, vous pouvez gagner du temps en utilisant la fonctionnalité de prébalisage de Document Manager.

Le prébalisage permet de fusionner les résultats du point de terminaison de prébalisage que vous avez configuré dans les paramètres de prébalisage, ainsi que la prédiction générative.

Si aucun point de terminaison de prébalisage n’est configuré, tous les champs sont prédits à l’aide de la prédiction générative uniquement.

Les options suivantes sont disponibles :

URL de prébalisage

Le prébalisage nécessite que le modèle ML dispose d’une URL. Vous pouvez utiliser les URL suivantes :

URL publiques telles que https://du.uipath.com/ie/invoices or https://du.uipath.com/ie/purchase_orders.
Visitez la page Points de terminaison publics pour consulter la liste complète des points de terminaison.
URL des compétences ML rendues publiques dans AI Center local ou AI Center cloud.

Clé de prébalisage

La clé API de Document Understanding/AI Units. La clé de prébalisage est la clé API Document Understanding de l’organisation où réside la compétence.

La clé est obligatoire pour la version cloud de Document Manager ainsi que la version locale en ligne. La clé est facultative pour la version locale physiquement isolée de Document Manager.

Comment...

L’option Comment... permet d’ouvrir le menu d’aide de Document Manager.

Vous trouverez les informations suivantes dans le menu d’aide :

La version de Document Manager.
Le lien Documentation menant à cette page de documentation.
La section Contrôles de libellés (Labeling Controls) qui affiche les contrôles à utiliser lors de la gestion des données.
La section Raccourcis du document (Document Shortcuts) qui affiche les raccourcis utilisés pour effectuer diverses opérations telles que la navigation et la mise à l'échelle de l'interface utilisateur.
La section Configuration qui affiche des détails sur la configuration de l'instance telle qu'elle a été effectuée lors de l'installation.

Commandes de balisage

Commande	Description
Clic gauche	Coche les cases S’il est utilisé avec le raccourci clavier du champ, il affecte les informations sélectionnées au champ.
Retour arrière/Supprimer	Supprime la valeur balisée d’un champ.
Cliquer-droit	Affiche le texte OCR et le libellé actuel.
Entrée ou barre oblique inverse	Regroupe des lignes de tableau couvrant plusieurs lignes de texte

Raccourcis pour les documents

Raccourci	Description
Alt + Flèche gauche/Flèche droite	naviguer entre les documents
Alt + Suppr	Supprime ou récupère un document.
Ctrl + Défilement	Ctrl + Défilement - Modifie la mise à l’échelle du document en effectuant un zoom avant ou arrière.

Champs de colonnes

Les champs de colonne ont les options suivantes :

Créer un nouveau champ de colonne
Modifier le champ
Développer/réduire les valeurs des champs de la colonne

Pour plus de détails sur les champs de colonne, consultez cette section.

Champs réguliers

Les champs réguliers ont les options suivantes :

Créer un nouveau champ régulier
Modifier le champ

Pour plus de détails sur les champs réguliers, consultez cette section.

Champs de classification

Les champs de classification ont les options suivantes :

Créer un nouveau champ de classification
Modifier le champ

Pour plus de détails sur les champs de classification, consultez cette section.

Affichage du document

Pour les documents de plusieurs pages, vous pouvez faire défiler naturellement les pages comme dans n'importe quelle visionneuse PDF. Pour effectuer un zoom avant ou arrière, utilisez Ctrl + molette de la souris.

Vous pouvez labelliser les documents en sélectionnant les zones de mots et en les affectant à un champ en appuyant sur une touche. Vous pouvez également cliquer avec le bouton droit sur la zone de mot et vérifier les informations extraites.

Pour plus de détails sur la labellisation des documents, visitez cette page.

Lorsque vous ouvrez une nouvelle session Document Manager ou lorsque vous avez un filtre vide, certaines directives s'affichent dans la vue du document :