document-understanding
latest
false
UiPath logo, featuring letters U and I in white

Guide de l’utilisateur de Document Understanding pour Automation Cloud

Dernière mise à jour 26 août 2025

Annoter des documents

Une fois que vous avez créé votre projet et chargé vos documents vers un type de document spécifique, ceux-ci sont automatiquement pré-annotés. Cela est réalisé à l’aide de modèles spécialisés basés sur le schéma du type de document. Le schéma permet de définir clairement les champs que vous souhaitez extraire d’un type de document particulier. Pour trouver le schéma du type de document, rendez-vous sur la page Annotation et consultez la section Champs.



Les prédictions sont indiquées par des soulignements dans le texte du document et ne peuvent pas être supprimées. S’ils sont incorrects et ne peuvent pas être associés à un champ particulier, vous pouvez les ignorer. Au cours du processus de formation, seuls les champs confirmés sont utilisés pour la formation, tandis que les soulignements ne sont pas pris en compte.

À mesure que vous ajoutez des annotations, les soulignements des prédictions devraient s’aligner progressivement sur votre entrée. Il peut y avoir quelques incohérences entre les champs soulignés et ceux annotés par l’utilisateur au début. Toutefois, à mesure que vous effectuez davantage d’annotations et que le modèle s’améliore, les soulignements devraient s’aligner plus précisément sur les données fournies par l’utilisateur.

Dans l’image suivante, la prédiction de l’adresse de livraison est incorrecte dans l’inclusion du nom de la personne.



Pour résoudre ce problème, il vous suffit de confirmer l’adresse de livraison. Il n’est pas nécessaire de supprimer le texte souligné associé au nom. Au fur et à mesure que vous annotez et que vous corrigez ces erreurs, les cas où le texte souligné ne s’aligne pas sur le champ confirmé devraient diminuer.

Remarque : pour déclencher l’entraînement du modèle, un minimum de 40 opérations est nécessaire. Par exemple, si vous avez 20 documents, vous auriez besoin d’annoter au moins 2 champs par document, pour un total de 40 opérations.
Astuce : afin d’optimiser les performances du modèle, suivez les suggestions de la section Recommandations. Ces suggestions ont été conçues pour améliorer les performances globales de votre modèle.


Vue des extractions

Modifiez le mode d’affichage des extractions à l’aide du menu Affichage des extractions. Pour y accéder, sélectionnez l’icône à trois points située à droite du nom du type de document, puis sélectionnez Affichage des extractions.

Les valeurs filtrées sont constituées de prédictions, qui sont en lecture seule, et d’annotations, qui peuvent être modifiées par l’utilisateur.



Depuis la liste, vous pouvez choisir les affichages d’extraction suivantes dans la liste :
  • Fusionner par colonne : les prédictions des modèles s’affichent en colonnes dépourvues d’annotation. Choisissez cette option pour les tables plus petites où vous pouvez afficher et valider toute la colonne.
  • Fusionner par liste : les prédictions des modèles s’affichent en lignes dépourvues d’annotation. Choisissez cette option lorsque vous avez des tables plus grandes et que vous souhaitez valider ligne par ligne.
  • Uniquement confirmées : seules les valeurs extraites des annotations confirmées par l’utilisateur sont affichées.
  • Uniquement prédites : seules les prédictions des modèles sont affichées. Mis à jour automatiquement lorsque le modèle est réentraîné et non modifiable.
  • Afficher le panneau latéral : affiche le panneau sur le côté gauche avec les champs d’annotation.
  • Afficher la table : affiche le panneau d’annotation de la table.

Validation des documents prédits

Une fois tous les documents téléchargés et prédits, votre objectif est de valider ou de modifier les champs pré-annotés. Pour un document dont tous les champs sont prédits avec précision, sélectionnez Confirmer pour approuver tous les champs à la fois. Un document, une fois confirmé, sera signalé par un symbole de bouclier vert dans la liste des documents.



Si un document n’est que partiellement confirmé, il sera indiqué par un symbole de bouclier vide dans la liste des documents. Cela indique que le processus d’annotation de ce document est en cours. Votre objectif final doit être de veiller à ce que tous les documents aient été confirmés.

Vous pouvez rencontrer les scénarios suivants au moment de la validation :
  • La prédiction est correcte et doit être validée.
  • La prédiction n’est pas correcte et le champ est présent sur le document.
  • La prédiction n’est pas correcte et le champ est absent du document.
  • Il n’y a aucune prédiction.

La prédiction est correcte et doit être validée

Si la prédiction est exacte, vous pouvez la confirmer en sélectionnant le texte souligné et en choisissant Confirmer, ou en cochant la case de confirmation du champ. Toutefois, la méthode optimale consiste à appuyer sur la touche de raccourci affectée au champ (dans ce scénario, la touche « N »).


La prédiction est incorrecte et le champ est présent dans le document

Si la prédiction est incorrecte, sélectionnez le texte correct dans le document et le champ approprié dans la liste déroulante, puis sélectionnez Confirmer.

Lorsque vous travaillez avec des tables, vous pouvez choisir d’ignorer les valeurs prédites de manière incorrecte. Ces valeurs ne seront pas utilisées pour l’entraînement du modèle. Le modèle réentraîné apprendra à éviter de les prédire dans les itérations futures.

La prédiction est incorrecte et le champ est absent du document

Si la prédiction est incorrecte et que le champ est absent du document, sélectionnez l’icône à trois points en regard du nom du champ et sélectionnez Marquer comme manquant.
Attention : vous pouvez également marquer des champs incorrects comme manquants. Par exemple, si vous ne disposez pas de l’adresse du fournisseur dans votre document, mais qu’un champ différent a été pré-labellisé comme adresse du fournisseur lors du traitement, vous pouvez simplement le marquer comme manquant lors de la validation.


Aucune prédiction

Les champs qui ne contiennent aucune prédiction s’affichent sous forme de cellules vides. Vous pouvez marquer ces cellules comme manquantes une par une ou en bloc en sélectionnant le bouton Confirmer.

Paramètres du type de document

Vous pouvez modifier les paramètres du type de document à partir de la vue Annoter (Annotate).

Pour ce faire, sélectionnez l’icône à trois points située à droite du nom du type de document, puis Paramètres.



Vous pouvez modifier les paramètres suivants :
  • Modèle de base : les estimations de la taille de l’ensemble de données utilisées dans les actions recommandées dépendent du modèle de base utilisé pour l’entraînement. L’utilisation du modèle de base le plus similaire à votre type de document permettra de réduire la quantité de travail d’annotation requise.
  • Nombre de langues : l’estimation de la taille de l’ensemble de données utilisée dans les actions recommandées dépend du nombre de langues dans l’ensemble de données. Un plus grand nombre de langues nécessite généralement d’annoter plus de données.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo
Confiance et sécurité
© 2005-2025 UiPath Tous droits réservés.