document-understanding
latest
false
Guide de l’utilisateur de Document Understanding pour Modern Experience
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 17 sept. 2024

Annoter des documents

Note: The prelabeling feature relies on UiPath DocPath, but only for tenants based in the Europe region. If your tenant is located in a region outside of Europe, this functionality uses the previous-generation model architecture.

After successfully creating your project and uploading your documents to a specific document type, they are automatically pre-annotated. This is done using a combination of generative and specialized models, based on the document type's schema. The schema clearly defines the fields you want to extract from a particular document type. To find the document type's schema, go to the Annotation page and check the Fields section.



Les pré-annotations sont indiquées par des soulignements sur le texte du document et ne peuvent pas être supprimées. Si elles sont incorrectes et ne peuvent pas être mises en correspondance avec un champ particulier, vous pouvez les ignorer. Au cours du processus d’entraînement, seuls les champs confirmés seront utilisés pour l’entraînement, tandis que les champs soulignés ne seront pas pris en compte.

As you continue to add more annotations, the pre-annotated underlines should progressively align with your input. There may be a few inconsistencies between underlines and user-annotated fields at the beginning. However, as you make more annotations and the model improves, the underlines should line up more precisely with the user-supplied data.

Dans l’image suivante, l’adresse de livraison a été pré-annotée de façon incorrecte pour inclure le nom de la personne.



Pour résoudre ce problème, il vous suffit de confirmer l’adresse de livraison. Il n’est pas nécessaire de supprimer le texte souligné associé au nom. Au fur et à mesure que vous annotez et que vous corrigez ces erreurs, les cas où le texte souligné ne s’aligne pas sur le champ confirmé devraient diminuer.

Remarque :
  • Les types de documents personnalisés ne sont pas automatiquement annotés. Les documents appartenant à un type de document personnalisé doivent être pré-annotés manuellement.
  • Pour déclencher l’entraînement du modèle, un minimum de 40 opérations sont nécessaires. Par exemple, si vous avez 20 documents, vous devrez annoter au moins 2 champs par document, ce qui conduit à un total de 40 opérations.
Astuce : afin d’optimiser les performances du modèle, suivez les suggestions de la section Recommandations. Ces suggestions ont été conçues pour améliorer les performances globales de votre modèle.


Valider des documents pré-annotés

Une fois tous les documents téléchargés et pré-annotés, votre objectif sera de valider ou de modifier les champs pré-annotés. Pour un document où tous les champs ont été pré-annotés avec précision, sélectionnez Confirmer afin d’approuver tous les champs en même temps. Un document confirmé sera indiqué par un symbole de bouclier vert dans la liste des documents.



Si un document n’est que partiellement confirmé, il sera indiqué par un symbole de bouclier vide dans la liste des documents. Cela indique que le processus d’annotation de ce document est en cours. Votre objectif final doit être de veiller à ce que tous les documents aient été confirmés.

Vous pouvez rencontrer les scénarios suivants au moment de la validation :
  • La pré-annotation est correcte et doit être validée.
  • La pré-annotation est incorrecte et le champ est présent dans le document.
  • La pré-annotation n’est pas correcte et le champ est manquant dans le document.
  • Il n’y a pas de pré-annotation.

La pré-annotation est correcte et doit être validée

Si la pré-annotation est correcte, vous pouvez la confirmer en sélectionnant le texte souligné, puis en sélectionnant Confirmer ou en cochant la case de confirmation du champ. La méthode optimale consiste cependant à appuyer sur le raccourci clavier attribué au champ (« N », dans ce scénario).


La pré-annotation est incorrecte et le champ est présent dans le document

Si la pré-annotation est incorrecte, choisissez le texte et le champ appropriés, puis sélectionnez Confirmer.

La pré-annotation est incorrecte et le champ est absent du document

Si la pré-annotation est incorrecte et que le champ est manquant dans le document, sélectionnez l’icône à trois points à côté du nom du champ, puis sélectionnez Marquer comme manquant.
Attention : vous pouvez également marquer des champs incorrects comme manquants. Par exemple, si vous ne disposez pas de l’adresse du fournisseur dans votre document, mais qu’un champ différent a été pré-labellisé comme adresse du fournisseur lors du traitement, vous pouvez simplement le marquer comme manquant lors de la validation.


Absence de pré-annotation

Les champs dépourvus de pré-annotation s’affichent en tant que cellules vides. Vous pouvez marquer ces cellules comme manquantes une par une ou en bloc, en sélectionnant le bouton Confirmer.

Paramètres du type de document

Vous pouvez modifier les paramètres du type de document à partir de la vue Annoter (Annotate).

Pour cela, cliquez sur l’icône à trois points à droite du nom du type de document, puis sélectionnez Paramètres.



Vous pouvez modifier les paramètres suivants :
  • Modèle de base : les estimations de la taille de l’ensemble de données utilisées dans les actions recommandées dépendent du modèle de base utilisé pour l’entraînement. L’utilisation du modèle de base le plus similaire à votre type de document permettra de réduire la quantité de travail d’annotation requise.
  • Nombre de langues : l’estimation de la taille de l’ensemble de données utilisée dans les actions recommandées dépend du nombre de langues dans l’ensemble de données. Un plus grand nombre de langues nécessite généralement d’annoter plus de données.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.