document-understanding
latest
false
Important :
La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.
UiPath logo, featuring letters U and I in white

Guide de l'utilisateur de Document Understanding

Dernière mise à jour 21 août 2025

Labelliser des documents

Pour connaître les volumes de documents nécessaires, consultez la page Pipelines .

Pour plus de détails sur la façon d'assembler un ensemble de données de haute qualité, consultez la page Entraîner des modèles hautement performants .

Champs qui apparaissent plusieurs fois sur le même document

Il existe de nombreuses situations où un champ apparaît à plusieurs endroits dans le même document, voire sur la même page. Ceux-ci doivent tous être labellisés du moment qu'ils ont la même signification.

Par exemple, le montant total des factures de services publics. Il apparaît souvent en haut, dans une liste d'éléments au milieu, ou dans une fiche de paie, en bas, dans une zone qui peut être détachée et envoyée par la poste avec le chèque. Dans cette situation, les trois occurrences devront être labellisées. Ceci est utile car, dans certains cas, s'il y a une erreur d'OCR ou si la mise en page est différente et qu'un champ ne peut pas être identifié, le modèle peut toujours identifier les autres occurrences.

Remarque : ce qui compte, c'est le sens de la valeur, pas la valeur elle-même. Par exemple, sur certaines factures non imposables, le montant net et le montant total ont la même valeur. Mais ce sont clairement des concepts différents. Par conséquent, ils ne doivent pas être labellisés à la fois comme montant total, mais uniquement comme celui dont l'objectif est de représenter le montant total.

Labellisation de plusieurs utilisateurs en parallèle

Vous pouvez demander à plusieurs utilisateurs d'utiliser la même instance pour pouvoir labelliser en même temps, même sur le même document.

Si des modifications sont apportées simultanément au schéma d'un utilisateur, la modification est effectuée et pour les autres utilisateurs, un message d'avertissement s'affiche indiquant qu'aucune modification n'a été apportée. Les autres utilisateurs doivent immédiatement actualiser leur navigateur pour vérifier les modifications.

Labellisation pour l'entraînement

Lorsque vous importez un ensemble de données sans cocher la case En faire un ensemble de tests (Make this an Evaluation set) dans la boîte de dialogue Importer des données (Import Data), cet ensemble de données sera utilisé pour l’entraînement et vous n’aurez qu’à vous concentrer sur la labellisation du modèle ainsi que du libellé et de la valeur (mots sélectionnables, boîtes grises) sur le document.

Si de temps en temps, le texte qui est rempli dans les champs de la barre latérale n'est pas correct, ce n'est pas un problème car le modèle ML apprend toujours. Dans certains cas, vous devrez peut-être ajuster la configuration des champs, par exemple, en cochant la case Multi-ligne (Multi-line). Mais, en général, l'accent est mis sur la labellisation des mots sur la page.

Labellisation pour évaluation

Lorsque vous importez un ensemble de données et que vous cochez la case En faire un ensemble de tests (Make this an Evaluation set) dans la boîte de dialogue Importer des données (Import Data), cet ensemble de données ne sera pas utilisé par les pipelines d'entraînement (Training Pipelines) dans AI Center, mais uniquement par les pipelines d'évaluation (Evaluation Pipelines).

Document Manager prend en charge la labellisation des documents de plusieurs pages. Par conséquent, les champs de la barre latérale ont une valeur unique pour l'ensemble du document. Cela reflète étroitement le comportement au moment de l'exécution dans le workflow RPA et permet aux pipelines d'évaluation dans AI Center de produire des scores réalistes reflétant les performances d'exécution réelles des modèles ML.

Cependant, gardez à l'esprit qu'il s'agit d'un changement majeur par rapport aux versions précédentes où chaque page était labellisée séparément. La labellisation et l'exportation de documents de plusieurs pages supposent que chaque document représente un seul document logique. Par exemple, un document de six pages peut contenir une seule facture de six pages, mais il ne doit pas contenir trois factures différentes de deux pages chacune. Ceci est particulièrement important pour les ensembles d'évaluation.

Actions de labellisation

Un champ donné peut être labellisé à plusieurs endroits sur la même page.

Labelliser un champ

Pour sélectionner plusieurs mots, sélectionnez le premier mot puis Ctrl/Maj + cliquez sur le reste des mots souhaités ou sélectionnez une zone entière en faisant glisser la souris (cadre de sélection) dessus.

Pour désélectionner certaines zones de texte de votre sélection, pendant que vous maintenez les touches Ctrl/Maj enfoncées, sélectionnez à nouveau les zones de texte indésirables.

Lorsque votre sélection est précise, appuyez sur la touche de raccourci pour labelliser le champ.

Label a multivalued field

Assurez-vous que l’option à plusieurs valeurs du champ est sélectionnée.

Sélectionnez le premier lot d’informations et appuyez sur la touche de raccourci pour étiqueter le champ.

Répétez les étapes précédentes jusqu'à ce que toutes les valeurs du champ à plusieurs valeurs soient étiquetées.

Remarque : un champ à plusieurs valeurs affiche deux valeurs lorsqu'il est réduit et toutes les valeurs lorsqu'il est développé. Sélectionnez la flèche d'expansion du champ à plusieurs valeurs pour développer et afficher la liste de toutes les valeurs marquées.

Supprimer un libellé

Sélectionnez des mots, puis appuyez sur la touche Suppr ou Retour Arrière de votre clavier.

Grouper une ligne de tableau

Une fois que vous avez labellisé certains champs Colonnes, et uniquement si certaines lignes s’étendent sur plusieurs lignes de texte, vous pouvez les regrouper en appuyant sur la touche / pour indiquer qu’ils font partie de la même ligne de table. Une boîte verte s’affiche autour du groupe pour montrer visuellement que la ligne a été groupée.

Lorsqu’une ligne de tableau se compose d’une seule ligne de texte, ce regroupement est facultatif, mais vous devez toujours vous assurer que les valeurs qui s’affichent dans l’aperçu du tableau en haut de l’écran contiennent les valeurs des Colonnes telles que vous souhaitez qu’elles soient extraites. Si ce n’est pas le cas, vous devez regrouper explicitement chaque ligne à l’aide de la touche /, même si chaque ligne comporte une seule ligne de texte.

Dissocier une ligne de tableau

Sélectionnez le groupe et appuyez à nouveau sur la touche /.

Autres options

Sélectionner un libellé

Utilisez les boutons gauche ou droit de la souris pour sélectionner une case ou pour obtenir plus d’informations à son sujet.

  • Clic gauche - sélectionne la case
  • Clic droit - Sélectionne la case et affiche des informations sur le texte OCR et le libellé actuel.
Navigation dans le document
  • Alt + Flèche gauche/Flèche droite : permet de naviguer entre les documents.
Mise à l’échelle du document
  • Ctrl + Défilement - Modifie la mise à l’échelle du document en effectuant un zoom avant ou arrière.
Supprime ou récupère un document.
  • Alt + Supprimer - Supprime un document.
  • Alt + Supprimer - Récupère un document supprimé.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo
Confiance et sécurité
© 2005-2025 UiPath Tous droits réservés.