document-understanding
2021.10
false
UiPath logo, featuring letters U and I in white
Non pris en charge par l'assistance

Guide de l'utilisateur de Document Understanding

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Dernière mise à jour 11 nov. 2024

Créer et configurer des champs

Les champs ne peuvent pas être renommés, alors réfléchissez bien avant de nommer un champ. Si, toutefois, vous décidez par la suite de ne pas utiliser certains champs pour l'entraînement d'un modèle ML, vous pouvez toujours les masquer à l'aide de la case à cocher Caché (Hidden) dans la fenêtre Modifier le champ (Edit Field).

Remarque : un maximum de 300 champs peut être créé.

Champs de colonnes

Les éléments de ligne Description ou Prix unitaire (Unit Price) d'un article sur une facture seraient des exemples de champs de colonne.

Créer un nouveau champ de colonne

  1. Cliquez sur docs image dans la section Table en haut de la page pour ajouter un nouveau champ Colonne (Column). La fenêtre Créer un champ de colonne (Create Column Field) s'affiche.
  2. Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas _ et des tirets -.
  3. Cliquez sur Créer (Create). La fenêtre Modifier un champ (Edit Field) s'affiche.
  4. Dans la liste déroulante Type de contenu (Content Type), sélectionnez le type de contenu.
  5. Dans la liste déroulante Évaluation (Scoring), sélectionnez la mesure utilisée pour déterminer la précision lors de l'exécution des évaluations des prédictions du modèle.
  6. Cliquez sur le champ Raccourci clavier (Hotkey) et appuyez sur une touche de votre clavier pour le remplir automatiquement.
  7. Remplissez le code hexadécimal de la couleur de champ souhaitée dans le champ Couleur (Color).
  8. Cochez la case Fractionner les éléments (Split items) si vous souhaitez que ce champ soit utilisé comme délimiteur entre les éléments de ligne ou les lignes d'un tableau. Toute ligne sur laquelle ce champ apparaît est considérée comme un nouvel élément ou une nouvelle ligne dans le tableau. Le plus souvent, cette fonction est utilisée dans les champs Lignes de montant (Line Amount) de facture.
  9. Cochez la case Masqué (Hidden) si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.
  10. Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.

Modifier un champ de colonne

Cliquez sur le bouton Modifier le champ (Edit field). Les options disponibles pour les champs de colonne se trouvent dans le tableau ci-dessous.

Option

Description

Type de contenu

Le type de contenu d'un champ :

  • chaîne (string) : approprié pour les noms ou adresses des sociétés, ainsi que les conditions de paiement, ou pour tout autre domaine où le RPA Developer préfère créer la logique d’analyse ou de formatage manuellement, dans le workflow RPA.
  • number : utilisé pour les montants ou les quantités, avec une analyse intelligente des séparateurs décimaux/milliers.
  • date : le modèle analyse, formate et unifie la sortie au format aaaa-mm-jj.
  • ** phone** : approprié pour les numéros de téléphone. Le formatage supprime les lettres et les parenthèses, et remplace les espaces par des tirets.
  • id-no : approprié pour les codes alphanumériques, les nombres d'identifiants, il est similaire au type de contenu de string, mais inclut la suppression de tous les caractères précédant un deux-points :. Si le numéro d'identification que vous devez extraire peut contenir des caractères deux-points :, veuillez utiliser chaîne (string) comme type de contenu à la place, afin d'éviter la perte de données.

Raccourci

Touche de raccourci pour ce champ. Une ou deux clés autorisées.

Couleur

La couleur du champ au format hexadécimal. Si la valeur n'est pas valide, une nouvelle est générée.

Évaluation

La mesure utilisée pour déterminer la précision lors de l’évaluation des prédictions du modèle. Il ne peut être configuré que pour le type de contenu de string. Tous les autres types de contenu utilisent une stratégie de notation de correspondance exacte (Exact Match). Options :

  • exact match : une prédiction n'est considérée comme correcte (note de 1) que si elle correspond exactement à la valeur réelle. Si elle diffère ne serait-ce que d’un seul caractère, elle est considérée comme incorrecte (note de 0).
  • levenshtein : une prédiction est considérée comme partiellement correcte en fonction de la distance de Levenshtein entre la prédiction et la valeur réelle. Si une valeur de 10 lettres est prédite correctement sauf pour les 2 derniers caractères, alors la note de cette prédiction sera de 0,8.

Fractionner les éléments

Cochez cette case si vous souhaitez que ce champ soit utilisé comme délimiteur entre les éléments de ligne ou les lignes d'un tableau. Toute ligne sur laquelle ce champ apparaît est considérée comme un nouvel élément ou une nouvelle ligne dans le tableau. Le plus souvent, cette fonction est utilisée dans les champs Lignes de montant (Line Amount) des éléments de ligne de la facture.

Masqué

Cochez cette case si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.

Supprimer un champ de colonne

Pour supprimer un champ de colonne, procédez comme suit :

  1. Cliquez sur le bouton Modifier le champ (Edit field) docs image correspondant au champ de colonne que vous souhaitez supprimer.
  2. Cliquez sur le bouton Supprimer (Delete).
  3. Tapez le nom exact du champ.


  4. Cliquez sur OK.
  5. Le champ de colonne et ses données labellisées associées sont supprimés.

Champs réguliers

Il s'agit de champs qui n'apparaissent qu'une seule fois sur un document donné. Une ligne d'élément Numéro de facture (Invoice Number) ou Montant total (Total Amount) sur un document de facture peuvent être des exemples de champs de colonne.

Créer un nouveau champ régulier

  1. Cliquez sur docs image dans le volet de droite dans la section Champs réguliers (Regular Fields). La fenêtre Créer un champ régulier (Create Regular Field) s'affiche.
  2. Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas _ et des tirets -.
  3. Cliquez sur Créer (Create). La fenêtre Modifier un champ (Edit Field) s'affiche.
  4. Sélectionnez le type de contenu dans la liste déroulante Type de contenu (Content Type).
  5. Sélectionnez le mécanisme de post-traitement au cas où le modèle prédit plusieurs instances d'un champ sur une page donnée dans la liste déroulante Traitement ultérieur (Post processing).
  6. Cliquez sur le champ Raccourci clavier (Hotkey) et appuyez sur une touche de votre clavier pour le remplir automatiquement.
  7. Dans le champ Couleur (Color), remplissez le code hexadécimal de la couleur de champ souhaitée o
  8. Dans la liste déroulante Multipage, sélectionnez la stratégie de récupération des données. Cette option est utilisée dans le cas où les champs apparaissent sur des pages différentes d'un document de plusieurs pages. Cette option définit quelle page le modèle décide de renvoyer.
  9. Dans la liste déroulante Évaluation (Scoring), sélectionnez la mesure utilisée pour déterminer la précision lors de l'exécution des évaluations des prédictions du modèle.
  10. Cochez la case Multiligne (Multi line) si le champ à vérifier peut s'étendre sur plusieurs lignes de texte, telles que des adresses ou des descriptions. Si cette option n'est pas sélectionnée, seule la première ligne est renvoyée.
  11. Cochez la case Masqué (Hidden) si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.
  12. Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.

Modifier un champ régulier

Cliquez sur le bouton Modifier le champ (Edit field). Les options disponibles pour les champs de colonne se trouvent dans le tableau ci-dessous.

Option

Description

Type de contenu

Le type de contenu d'un champ :

  • chaîne (string) : approprié pour les noms ou adresses des sociétés, ainsi que les conditions de paiement, ou pour tout autre domaine où le RPA Developer préfère créer la logique d’analyse ou de formatage manuellement, dans le workflow RPA.
  • number : utilisé pour les montants ou les quantités, avec une analyse intelligente des séparateurs décimaux/milliers.
  • date : le modèle analyse, formate et unifie la sortie au format aaaa-mm-jj.
  • ** phone** : approprié pour les numéros de téléphone. Le formatage supprime les lettres et les parenthèses, et remplace les espaces par des tirets.
  • id-no : approprié pour les codes alphanumériques, les nombres d'identifiants, il est similaire au type de contenu de string, mais inclut la suppression de tous les caractères précédant un deux-points :. Si le numéro d'identification que vous devez extraire peut contenir des caractères deux-points :, veuillez utiliser chaîne (string) comme type de contenu à la place, afin d'éviter la perte de données.

Traitement ultérieur

Le mécanisme de post-traitement. Si le modèle prévoit plus d’une instance d’un champ sur une page donnée, le modèle renvoie :

  • highest_confidence : la valeur avec la confiance la plus élevée.
  • first_span : la première valeur.
  • largest_value : la plus grande valeur numérique. Cette option ne s'affiche que pour le contenu de type nombre (number) et convient aux champs Montant total (Total Amount).
  • longest_value : la valeur constituée du plus grand nombre de caractères.

Raccourci

Touche de raccourci pour ce champ. Une ou deux clés autorisées.

Couleur

La couleur du champ au format hexadécimal. Si la valeur n'est pas valide, une nouvelle est générée.

Multipage

La stratégie de renvoi de données dans le cas où un champ apparaît sur différentes pages d'un document multipage.

  • highest_confidence - le choix par défaut pour les types de contenu string, téléphone (phone) et nombre (number).
  • first_occurrence - le choix par défaut pour les types de contenu id-no et date.
  • last_occurrence

    -longest_string

  • shortest_string
  • highest_num_value - affiché uniquement pour le type de contenu nombre (number).
  • lowest_num_value - affiché uniquement pour le type de contenu number.

Évaluation

La mesure utilisée pour déterminer la précision lors de l’évaluation des prédictions du modèle. Il ne peut être configuré que pour le type de contenu de string. Tous les autres types de contenu utilisent une stratégie de notation de correspondance exacte (Exact Match). Options :

  • exact match : une prédiction n'est considérée comme correcte (note de 1) que si elle correspond exactement à la valeur réelle. Si elle diffère ne serait-ce que d’un seul caractère, elle est considérée comme incorrecte (note de 0).
  • levenshtein : une prédiction est considérée comme partiellement correcte en fonction de la distance de Levenshtein entre la prédiction et la valeur réelle. Si une valeur de 10 lettres est prédite correctement sauf pour les 2 derniers caractères, alors la note de cette prédiction sera de 0,8.

Multiligne

Cochez cette case pour les champs qui peuvent s'étendre sur plusieurs lignes de texte (adresses ou descriptions), sinon, seule la première ligne sera renvoyée.

Masqué

Cochez cette case si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.

Supprimer un champ régulier

Pour supprimer un champ normal, procédez comme suit :

  1. Cliquez sur le bouton Modifier le champ (Edit field) docs image correspondant au champ normal que vous souhaitez supprimer.
  2. Cliquez sur le bouton Supprimer (Delete).
  3. Tapez le nom exact du champ.


  4. Cliquez sur OK.
  5. Le champ normal et ses données labellisées associées sont supprimés.

Champs de classification

Points de données qui se réfèrent à un document dans son ensemble. Par exemple, le type de dépense d'un reçu (nourriture, hôtel, compagnie aérienne, transport) ou la devise d'une facture (USD, EUR, JPY) seraient des exemples de champs de classification.

Créer un nouveau champ de classification

  1. Cliquez sur docs image dans le volet droit de la section Champs de classification (Classification Fields). La fenêtre Créer un champ de classification (Create Classification Field) s'affiche.
  2. Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas _ et des tirets -.
  3. Cliquez sur Créer (Create). La fenêtre Modifier un champ (Edit Field) s'affiche.
  4. Dans la zone de texte, remplissez la liste des classes et saisissez les noms sous forme de liste séparée par des virgules.
  5. Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.

Modifier un champ de classification

Cliquez sur le bouton Modifier le champ (Edit field). Définir une liste des valeurs possibles. Les virgules doivent séparer les valeurs. Une description facultative de la valeur peut être incluse après le symbole deux points : (option 1 : description 1).


Supprimer un champ de classification

Pour supprimer un champ de classification, procédez comme suit :

  1. Cliquez sur le bouton Modifier le champ (Edit field) docs imagecorrespondant au champ de colonne que vous souhaitez supprimer.
  2. Cliquez sur le bouton Supprimer (Delete).
  3. Tapez le nom exact du champ.


  4. Cliquez sur OK.
  5. Le champ de colonne et ses données étiquetées labellisées sont supprimés.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.