document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white

Guide de l'utilisateur de Document Understanding

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Dernière mise à jour 18 déc. 2024

Créer et configurer des champs

Les champs peuvent désormais être renommés. Cliquez simplement sur le Modifier le champ et modifiez simplement le nom du champ en haut de la fenêtre.

Si, toutefois, vous décidez par la suite de ne pas utiliser certains champs pour l'entraînement d'un modèle ML, vous pouvez toujours les masquer à l'aide de la case à cocher Caché (Hidden) dans la fenêtre Modifier le champ (Edit Field).

Remarque : un maximum de 300 champs peut être créé.

Champs de colonnes

Les éléments de ligne Description ou Prix unitaire (Unit Price) d'un article sur une facture seraient des exemples de champs de colonne.

Créer un nouveau champ de colonne

  • Cliquez sur docs image dans la section Table en haut de la page pour ajouter un nouveau champ Colonne (Column). La fenêtre Créer un champ de colonne (Create Column Field) s'affiche.
  • Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas _ et des tirets -.
  • Cliquez sur OK. La fenêtre Modifier le champ (Edit Field) s’affiche avec l’onglet Général (General) ouvert.

    docs image
  • Dans la liste déroulante Type de contenu (Content Type), sélectionnez le type de contenu.
  • Cliquez sur le champ Raccourci clavier (Hotkey) et appuyez sur une touche de votre clavier pour le remplir automatiquement.
  • Cochez la case Fractionner les éléments (Split items) si vous souhaitez que ce champ soit utilisé comme délimiteur entre les éléments de ligne ou les lignes d'un tableau. Toute ligne sur laquelle ce champ apparaît est considérée comme un nouvel élément ou une nouvelle ligne dans le tableau. Le plus souvent, cette fonction est utilisée dans les champs Lignes de montant (Line Amount) de facture.

  • Cochez la case Masqué (Hidden) si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.
  • Cliquez sur l’onglet Avancé (Advanced).
  • Dans la liste déroulante Évaluation (Scoring), sélectionnez la mesure utilisée pour déterminer la précision lors de l'exécution des évaluations des prédictions du modèle.
  • Remplissez le code hexadécimal de la couleur de champ souhaitée dans le champ Couleur (Color).
  • Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.

Modifier un champ de colonne

Cliquez sur le bouton Modifier le champ (Edit field). Les options disponibles pour les champs de colonne se trouvent dans le tableau ci-dessous.

Option

tabulation

Description

Nom du champ

s/o

Nom unique du champ.

Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, et le tiret bas _ et des tirets -.

Type de contenu

Général

Le type de contenu d'un champ :

  • chaîne (string) : approprié pour les noms ou adresses des sociétés, ainsi que les conditions de paiement, ou pour tout autre domaine où le RPA Developer préfère créer la logique d’analyse ou de formatage manuellement, dans le workflow RPA.
  • number : utilisé pour les montants ou les quantités, avec une analyse intelligente des séparateurs décimaux/milliers.
  • date : le modèle analyse, formate et unifie la sortie au format aaaa-mm-jj. Vous pouvez indiquer comment les dates ambiguës doivent être analysées et renvoyées. Pour cela, choisissez entre Style non américain (Non-US style) (aaaa-mm-jj) et Style américain (US style) (aaaa-jj-mm) pour l’option Format de date (Date format).
  • phone : approprié pour les numéros de téléphone. Le formatage supprime les lettres et les parenthèses, et remplace les espaces par des tirets.
  • id-no : approprié pour les codes alphanumériques, les nombres d'identifiants, il est similaire au type de contenu de string, mais inclut la suppression de tous les caractères précédant un deux-points :. Si le numéro d'identification que vous devez extraire peut contenir des caractères deux-points :, veuillez utiliser chaîne (string) comme type de contenu à la place, afin d'éviter la perte de données.

Raccourci

Général

Touche de raccourci pour ce champ. Une ou deux clés autorisées.

Fractionner les éléments

Général

Cochez cette case si vous souhaitez que ce champ soit utilisé comme délimiteur entre les éléments de ligne ou les lignes d'un tableau. Toute ligne sur laquelle ce champ apparaît est considérée comme un nouvel élément ou une nouvelle ligne dans le tableau. Le plus souvent, cette fonction est utilisée dans les champs Lignes de montant (Line Amount) des éléments de ligne de la facture.

Masqué

Général

Cochez cette case si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.

Couleur

Avancé

La couleur du champ au format hexadécimal. Si la valeur n'est pas valide, une nouvelle est générée.

Évaluation

Avancé

La mesure utilisée pour déterminer la précision lors de l’évaluation des prédictions du modèle. Il ne peut être configuré que pour le type de contenu de string. Tous les autres types de contenu utilisent une stratégie de notation de correspondance exacte (Exact Match). Options :

  • exact match : une prédiction n'est considérée comme correcte (note de 1) que si elle correspond exactement à la valeur réelle. Si elle diffère ne serait-ce que d’un seul caractère, elle est considérée comme incorrecte (note de 0).
  • levenshtein : une prédiction est considérée comme partiellement correcte en fonction de la distance de Levenshtein entre la prédiction et la valeur réelle. Si une valeur de 10 lettres est prédite correctement sauf pour les 2 derniers caractères, alors la note de cette prédiction sera de 0,8.

Supprimer un champ de colonne

Pour supprimer un champ de colonne, procédez comme suit :

  1. Cliquez sur le bouton Modifier le champ docs image correspondant au champ de colonne que vous souhaitez supprimer.
  2. Cliquez sur le bouton Supprimer (Delete).
  3. Tapez le nom exact du champ.


  4. Cliquez sur OK.
  5. Le champ de colonne et ses données labellisées associées sont supprimés.

Champs réguliers

Il s'agit de champs qui n'apparaissent qu'une seule fois sur un document donné. Une ligne d'élément Numéro de facture (Invoice Number) ou Montant total (Total Amount) sur un document de facture peuvent être des exemples de champs de colonne.

Créer un nouveau champ régulier

  • Cliquez sur docs image dans le volet de droite dans la section Champs réguliers (Regular Fields). La fenêtre Créer un champ régulier (Create Regular Field) s'affiche.
  • Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas _ et des tirets -.
  • Cliquez sur OK. La fenêtre Modifier le champ (Edit Field) s’affiche avec l’onglet Général (General) ouvert.
  • Sélectionnez le type de contenu dans la liste déroulante Type de contenu (Content Type).
  • Cliquez sur le champ Raccourci clavier (Shortcut) et appuyez sur une touche de votre clavier pour le remplir automatiquement.
  • Cochez la case Multiligne (Multi line) si le champ à vérifier peut s'étendre sur plusieurs lignes de texte, telles que des adresses ou des descriptions. Si cette option n'est pas sélectionnée, seule la première ligne est renvoyée.
  • Cochez la case Valeurs multiples (Multi-value) pour toutes les valeurs détectées dans le document à afficher sous forme de liste. Vous pouvez cocher la case Lignes multiples (Multi-line) ou Valeurs multiples (Multi-value).
  • Cochez la case Masqué (Hidden) si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.
  • Cliquez sur l’onglet Avancé (Advanced).
  • Sélectionnez le mécanisme de post-traitement au cas où le modèle prédit plusieurs instances d'un champ sur une page donnée dans la liste déroulante Traitement ultérieur (Post processing).
  • Dans la liste déroulante Évaluation (Scoring), sélectionnez la mesure utilisée pour déterminer la précision lors de l'exécution des évaluations des prédictions du modèle.
  • Dans le champ Couleur (Color), remplissez le code hexadécimal de la couleur de champ souhaitée.
  • Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.

Modifier un champ régulier

Cliquez sur le bouton Modifier le champ (Edit field). Les options disponibles pour les champs de colonne se trouvent dans le tableau ci-dessous.

Option

tabulation

Description

Nom du champ

s/o

Nom unique du champ.

Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, et le tiret bas _ et des tirets -.

Type de contenu

Général

Le type de contenu d'un champ :

  • chaîne (string) : approprié pour les noms ou adresses des sociétés, ainsi que les conditions de paiement, ou pour tout autre domaine où le RPA Developer préfère créer la logique d’analyse ou de formatage manuellement, dans le workflow RPA.
  • number : utilisé pour les montants ou les quantités, avec une analyse intelligente des séparateurs décimaux/milliers.
  • date : le modèle analyse, formate et unifie la sortie au format aaaa-mm-jj. Vous pouvez indiquer comment les dates ambiguës doivent être analysées et renvoyées. Pour cela, choisissez entre Style non américain (Non-US style) (aaaa-mm-jj) et Style américain (US style) (aaaa-jj-mm) pour l’option Format de date (Date format). Cette option n’a aucun impact lorsque la date n’est pas ambiguë et qu’elle est prise en charge uniquement par les paquets ML version 22.10.2 ou ultérieure.
  • phone : approprié pour les numéros de téléphone. Le formatage supprime les lettres et les parenthèses, et remplace les espaces par des tirets.
  • id-no : approprié pour les codes alphanumériques, les nombres d'identifiants, il est similaire au type de contenu de string, mais inclut la suppression de tous les caractères précédant un deux-points :. Si le numéro d'identification que vous devez extraire peut contenir des caractères deux-points :, veuillez utiliser chaîne (string) comme type de contenu à la place, afin d'éviter la perte de données.

Traitement ultérieur

Avancé

Le mécanisme de post-traitement. Si le modèle prévoit plus d’une instance d’un champ sur une page donnée, le modèle renvoie :

  • highest_confidence : la valeur avec la confiance la plus élevée.
  • first_span : la première valeur.
  • largest_value : la plus grande valeur numérique. Cette option ne s'affiche que pour le contenu de type nombre (number) et convient aux champs Montant total (Total Amount).
  • longest_value : la valeur constituée du plus grand nombre de caractères.

Raccourci

Général

Touche de raccourci pour ce champ. Une ou deux clés autorisées.

Multiligne

Général

Cochez cette case pour les champs qui peuvent s'étendre sur plusieurs lignes de texte (adresses ou descriptions), sinon, seule la première ligne sera renvoyée.

Valeurs multiples

GénéralCochez cette case pour que toutes les valeurs détectées dans le document s'affichent sous forme de liste. Vous pouvez cocher la case Lignes multiples (Multi-line) ou Valeurs multiples (Multi-value).

Masqué

Général

Cochez cette case si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.

Évaluation

Avancé

La mesure utilisée pour déterminer la précision lors de l’évaluation des prédictions du modèle. Il ne peut être configuré que pour le type de contenu de string. Tous les autres types de contenu utilisent une stratégie de notation de correspondance exacte (Exact Match). Options :

  • exact match : une prédiction n'est considérée comme correcte (note de 1) que si elle correspond exactement à la valeur réelle. Si elle diffère ne serait-ce que d’un seul caractère, elle est considérée comme incorrecte (note de 0).
  • levenshtein : une prédiction est considérée comme partiellement correcte en fonction de la distance de Levenshtein entre la prédiction et la valeur réelle. Si une valeur de 10 lettres est prédite correctement sauf pour les 2 derniers caractères, alors la note de cette prédiction sera de 0,8.

Couleur

Avancé

La couleur du champ au format hexadécimal. Si la valeur n'est pas valide, une nouvelle est générée.

Supprimer un champ régulier

Pour supprimer un champ normal, procédez comme suit :

  1. Cliquez sur le bouton Modifier le champ docs image correspondant au champ normal que vous souhaitez supprimer.
  2. Cliquez sur le bouton Supprimer (Delete).
  3. Tapez le nom exact du champ.


  4. Cliquez sur OK.
  5. Le champ normal et ses données labellisées associées sont supprimés.

Champs de classification

Points de données qui se réfèrent à un document dans son ensemble. Par exemple, le type de dépense d'un reçu (nourriture, hôtel, compagnie aérienne, transport) ou la devise d'une facture (USD, EUR, JPY) seraient des exemples de champs de classification.

Créer un nouveau champ de classification

  1. Cliquez sur docs image dans le volet droit de la section Champs de classification (Classification Fields). La fenêtre Créer un champ de classification (Create Classification Field) s'affiche.
  2. Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas _ et des tirets -.
  3. Cliquez sur OK. La fenêtre Modifier un champ (Edit Field) s'affiche.
  4. Dans la zone de texte, remplissez la liste des classes et saisissez les noms sous forme de liste séparée par des virgules.
  5. Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.

Modifier un champ de classification

Cliquez sur le bouton Modifier le champ (Edit field)docs image. Définir une liste des valeurs possibles. Les virgules doivent séparer les valeurs. Une description facultative de la valeur peut être incluse après le symbole deux points : (option 1 : description 1).


Supprimer un champ de classification

Pour supprimer un champ de classification, procédez comme suit :

  1. Cliquez sur le bouton Modifier le champ docs image correspondant au champ de colonne que vous souhaitez supprimer.
  2. Cliquez sur le bouton Supprimer (Delete).
  3. Tapez le nom exact du champ.


  4. Cliquez sur OK.
  5. Le champ de colonne et ses données étiquetées labellisées sont supprimés.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.