document-understanding
latest
false
Guide de l'utilisateur de Document Understanding
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 21 oct. 2024

Annoter des documents

Une fois que vous avez créé votre projet et chargé vos documents vers un type de document spécifique, ceux-ci sont automatiquement pré-annotés. Cela est réalisé à l’aide de modèles spécialisés basés sur le schéma du type de document. Le schéma permet de définir clairement les champs que vous souhaitez extraire d’un type de document particulier. Pour trouver le schéma du type de document, rendez-vous sur la page Annotation et consultez la section Champs.



Les pré-annotations sont indiquées par des soulignements sur le texte du document et ne peuvent pas être supprimées. Si elles sont incorrectes et ne peuvent pas être mises en correspondance avec un champ particulier, vous pouvez les ignorer. Au cours du processus d’entraînement, seuls les champs confirmés seront utilisés pour l’entraînement, tandis que les champs soulignés ne seront pas pris en compte.

Au fur et à mesure que vous ajoutez des annotations, les soulignements pré-annotés s’alignent progressivement sur votre entrée. Il est possible qu’il y ait au début des incohérences entre les soulignements et les champs annotés par l’utilisateur. Cependant, à mesure que vous effectuez d’autres annotations et que le modèle s’améliore, les soulignements devraient s’aligner plus précisément sur les données fournies par l’utilisateur.

Dans l’image suivante, l’adresse de livraison a été pré-annotée de façon incorrecte pour inclure le nom de la personne.



Pour résoudre ce problème, il vous suffit de confirmer l’adresse de livraison. Il n’est pas nécessaire de supprimer le texte souligné associé au nom. Au fur et à mesure que vous annotez et que vous corrigez ces erreurs, les cas où le texte souligné ne s’aligne pas sur le champ confirmé devraient diminuer.

Remarque :
  • Les types de documents personnalisés ne sont pas automatiquement annotés. Les documents appartenant à un type de document personnalisé doivent être pré-annotés manuellement.
  • Pour déclencher l’entraînement du modèle, un minimum de 40 opérations sont nécessaires. Par exemple, si vous avez 20 documents, vous devrez annoter au moins 2 champs par document, ce qui conduit à un total de 40 opérations.
Astuce : afin d’optimiser les performances du modèle, suivez les suggestions de la section Recommandations. Ces suggestions ont été conçues pour améliorer les performances globales de votre modèle.


Valider des documents pré-annotés

Une fois tous les documents téléchargés et pré-annotés, votre objectif sera de valider ou de modifier les champs pré-annotés. Pour un document où tous les champs ont été pré-annotés avec précision, sélectionnez Confirmer afin d’approuver tous les champs en même temps. Un document confirmé sera indiqué par un symbole de bouclier vert dans la liste des documents.



Si un document n’est que partiellement confirmé, il sera indiqué par un symbole de bouclier vide dans la liste des documents. Cela indique que le processus d’annotation de ce document est en cours. Votre objectif final doit être de veiller à ce que tous les documents aient été confirmés.

Vous pouvez rencontrer les scénarios suivants au moment de la validation :
  • La pré-annotation est correcte et doit être validée.
  • La pré-annotation est incorrecte et le champ est présent dans le document.
  • La pré-annotation n’est pas correcte et le champ est manquant dans le document.
  • Il n’y a pas de pré-annotation.

La pré-annotation est correcte et doit être validée

Si la pré-annotation est correcte, vous pouvez la confirmer en sélectionnant le texte souligné, puis en sélectionnant Confirmer ou en cochant la case de confirmation du champ. La méthode optimale consiste cependant à appuyer sur le raccourci clavier attribué au champ (« N », dans ce scénario).


La pré-annotation est incorrecte et le champ est présent dans le document

Si la pré-annotation est incorrecte, choisissez le texte et le champ appropriés, puis sélectionnez Confirmer.

La pré-annotation est incorrecte et le champ est absent du document

Si la pré-annotation est incorrecte et que le champ est manquant dans le document, sélectionnez l’icône à trois points à côté du nom du champ, puis sélectionnez Marquer comme manquant.
Attention : vous pouvez également marquer des champs incorrects comme manquants. Par exemple, si vous ne disposez pas de l’adresse du fournisseur dans votre document, mais qu’un champ différent a été pré-labellisé comme adresse du fournisseur lors du traitement, vous pouvez simplement le marquer comme manquant lors de la validation.


Absence de pré-annotation

Les champs dépourvus de pré-annotation s’affichent en tant que cellules vides. Vous pouvez marquer ces cellules comme manquantes une par une ou en bloc, en sélectionnant le bouton Confirmer.

Paramètres du type de document

Vous pouvez modifier les paramètres du type de document à partir de la vue Annoter (Annotate).

Pour cela, cliquez sur l’icône à trois points à droite du nom du type de document, puis sélectionnez Paramètres.



Vous pouvez modifier les paramètres suivants :
  • Modèle de base : les estimations de la taille de l’ensemble de données utilisées dans les actions recommandées dépendent du modèle de base utilisé pour l’entraînement. L’utilisation du modèle de base le plus similaire à votre type de document permettra de réduire la quantité de travail d’annotation requise.
  • Nombre de langues : l’estimation de la taille de l’ensemble de données utilisée dans les actions recommandées dépend du nombre de langues dans l’ensemble de données. Un plus grand nombre de langues nécessite généralement d’annoter plus de données.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.