document-understanding

latest

false

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Guide de l'utilisateur de Document Understanding

PRODUIT :

Dernière mise à jour 15 oct. 2025

Créer et configurer des champs

Les champs peuvent être renommés. Il suffit de sélectionner le bouton Modifier le champ Modifier l’icône et de modifier le nom du champ en haut de la fenêtre.

Si, toutefois, vous décidez par la suite de ne pas utiliser certains champs pour l'entraînement d'un modèle ML, vous pouvez toujours les masquer à l'aide de la case à cocher Caché (Hidden) dans la fenêtre Modifier le champ (Edit Field).

Remarque : un maximum de 300 champs peut être créé.

Champs de colonnes

Les éléments de ligne Description ou Prix unitaire (Unit Price) d'un article sur une facture seraient des exemples de champs de colonne.

Créer un nouveau champ de colonne

Sélectionnez dans la section du tableau en haut de la page pour ajouter un nouveau champ Colonne. La fenêtre Créer un champ de colonne s'affiche.
Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas _ et des tirets -.
Sélectionnez OK. La fenêtre Modifier le champ (Edit Field) s’affiche avec l’onglet Général (General) ouvert.
Dans la liste déroulante Type de contenu (Content Type), sélectionnez le type de contenu.
Sélectionnez le champ Raccourci et appuyez sur une touche de votre clavier pour le remplir automatiquement.
Cochez la case Séparer les éléments si vous souhaitez que ce champ soit utilisé comme délimiteur entre les éléments de ligne ou les lignes d’une table. Toute ligne dans laquelle ce champ apparaît est considérée comme un nouvel élément de ligne ou une nouvelle ligne dans la table. Le plus souvent, cette fonction est utilisée dans les champs Montant de la ligne des éléments de ligne d’une Facture. Les éléments séparés sont disponibles uniquement pour les colonnes de type de document FormsAI.
Cochez la case Masqué (Hidden) si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.
Sélectionnez l'onglet Avancé.
Dans la liste déroulante Évaluation (Scoring), sélectionnez la mesure utilisée pour déterminer la précision lors de l'exécution des évaluations des prédictions du modèle.
Remplissez le code hexadécimal de la couleur de champ souhaitée dans le champ Couleur (Color).
Sélectionnez Enregistrer pour enregistrer vos paramètres.

Modifier un champ de colonne

Sélectionnez le bouton Modifier le champ Modifier l’icône . Les options disponibles pour les champs de colonne se trouvent dans le tableau suivant.

Option	tabulation	Description
Nom du champ	s/o	Nom unique du champ. Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, et le tiret bas `_` et des tirets `-`.
Type de contenu	Général	Le type de contenu d'un champ : chaîne (string) : approprié pour les noms ou adresses des sociétés, ainsi que les conditions de paiement, ou pour tout autre domaine où le RPA Developer préfère créer la logique d’analyse ou de formatage manuellement, dans le workflow RPA. number : utilisé pour les montants ou les quantités, avec une analyse intelligente des séparateurs décimaux/milliers. date : le modèle analyse, formate et unifie la sortie au format aaaa-mm-jj. Vous pouvez indiquer comment les dates ambiguës doivent être analysées et renvoyées. Pour cela, choisissez entre Style non américain (Non-US style) (aaaa-mm-jj) et Style américain (US style) (aaaa-jj-mm) pour l'option Format de date (Date format). phone : approprié pour les numéros de téléphone. Le formatage supprime les lettres et les parenthèses, et remplace les espaces par des tirets. id-no : approprié pour les codes alphanumériques, les nombres d'identifiants, il est similaire au type de contenu de string, mais inclut la suppression de tous les caractères précédant un deux-points `:`. Si le numéro d'identification que vous devez extraire peut contenir des caractères deux-points `:`, veuillez utiliser chaîne (string) comme type de contenu à la place, afin d'éviter la perte de données.
Raccourci	Général	Touche de raccourci pour ce champ. Une ou deux clés autorisées.
Fractionner les éléments	Général	Cochez cette case si vous souhaitez que ce champ soit utilisé comme délimiteur entre les éléments de ligne ou les lignes d'un tableau. Toute ligne sur laquelle ce champ apparaît est considérée comme un nouvel élément ou une nouvelle ligne dans le tableau. Le plus souvent, cette fonction est utilisée dans les champs Lignes de montant (Line Amount) des éléments de ligne de la facture.
Masqué	Général	Cochez cette case si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.
Couleur	Avancé	La couleur du champ au format hexadécimal. Si la valeur n'est pas valide, une nouvelle est générée.
Évaluation	Avancé	La mesure utilisée pour déterminer la précision lors de l’évaluation des prédictions du modèle. Il ne peut être configuré que pour le type de contenu de string. Tous les autres types de contenu utilisent une stratégie de notation de correspondance exacte (Exact Match). Options : exact match : une prédiction n'est considérée comme correcte (note de 1) que si elle correspond exactement à la valeur réelle. Si elle diffère ne serait-ce que d’un seul caractère, elle est considérée comme incorrecte (note de 0). levenshtein : une prédiction est considérée comme partiellement correcte en fonction de la distance de Levenshtein entre la prédiction et la valeur réelle. Si une valeur de 10 lettres est prédite correctement sauf pour les 2 derniers caractères, alors la note de cette prédiction sera de 0,8.

Supprimer un champ de colonne

Pour supprimer un champ de colonne, procédez comme suit :

Sélectionnez le bouton Modifier le champ correspondant au champ de colonne que vous souhaitez supprimer.
Sélectionnez le bouton Supprimer.
Tapez le nom exact du champ.
Sélectionnez OK.
Le champ de colonne et ses données labellisées associées sont supprimés.

Champs réguliers

Il s'agit de champs qui n'apparaissent qu'une seule fois sur un document donné. Une ligne d'élément Numéro de facture (Invoice Number) ou Montant total (Total Amount) sur un document de facture peuvent être des exemples de champs de colonne.

Créer un nouveau champ régulier

Sélectionnez dans le volet droit de la section Champs réguliers. La fenêtre Créer un champ régulier s'affiche.
Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas _ et des tirets -.
Sélectionnez OK. La fenêtre Modifier le champ (Edit Field) s’affiche avec l’onglet Général (General) ouvert.
Sélectionnez le type de contenu dans la liste déroulante Type de contenu (Content Type).
Sélectionnez le champ Raccourci et appuyez sur une touche de votre clavier pour le remplir automatiquement.
Cochez la case Multiligne (Multi line) si le champ à vérifier peut s'étendre sur plusieurs lignes de texte, telles que des adresses ou des descriptions. Si cette option n'est pas sélectionnée, seule la première ligne est renvoyée.
Cochez la case Valeurs multiples (Multi-value) pour toutes les valeurs détectées dans le document à afficher sous forme de liste. Vous pouvez cocher la case Lignes multiples (Multi-line) ou Valeurs multiples (Multi-value).
Cochez la case Masqué (Hidden) si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.
Sélectionnez l'onglet Avancé.
Sélectionnez le mécanisme de post-traitement au cas où le modèle prédit plusieurs instances d'un champ sur une page donnée dans la liste déroulante Traitement ultérieur (Post processing).
Dans la liste déroulante Évaluation (Scoring), sélectionnez la mesure utilisée pour déterminer la précision lors de l'exécution des évaluations des prédictions du modèle.
Dans le champ Couleur (Color), remplissez le code hexadécimal de la couleur de champ souhaitée.
Sélectionnez Enregistrer pour enregistrer vos paramètres.

Modifier un champ régulier

Sélectionnez le bouton Modifier le champ Modifier l’icône . Les options disponibles pour les champs réguliers se trouvent dans le tableau suivant.

Option	tabulation	Description
Nom du champ	s/o	Nom unique du champ. Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, et le tiret bas `_` et des tirets `-`.
Type de contenu	Général	Le type de contenu d'un champ : chaîne (string) : approprié pour les noms ou adresses des sociétés, ainsi que les conditions de paiement, ou pour tout autre domaine où le RPA Developer préfère créer la logique d’analyse ou de formatage manuellement, dans le workflow RPA. number : utilisé pour les montants ou les quantités, avec une analyse intelligente des séparateurs décimaux/milliers. date : le modèle analyse, formate et unifie la sortie au format aaaa-mm-jj. Vous pouvez indiquer comment les dates ambiguës doivent être analysées et renvoyées. Pour cela, choisissez entre Style non américain (Non-US style) (aaaa-mm-jj) et Style américain (US style) (aaaa-jj-mm) pour l'option Format de date (Date format). Cette option n'a aucun impact lorsque la date n'est pas ambiguë et qu'elle est prise en charge uniquement par les paquets ML version 22.10.2 ou ultérieure. phone : approprié pour les numéros de téléphone. Le formatage supprime les lettres et les parenthèses, et remplace les espaces par des tirets. id-no : approprié pour les codes alphanumériques, les nombres d'identifiants, il est similaire au type de contenu de string, mais inclut la suppression de tous les caractères précédant un deux-points `:`. Si le numéro d'identification que vous devez extraire peut contenir des caractères deux-points `:`, veuillez utiliser chaîne (string) comme type de contenu à la place, afin d'éviter la perte de données.
Traitement ultérieur	Avancé	Le mécanisme de post-traitement. Si le modèle prévoit plus d’une instance d’un champ sur une page donnée, le modèle renvoie : highest_confidence : la valeur avec la confiance la plus élevée. first_span : la première valeur. largest_value : la plus grande valeur numérique. Cette option ne s'affiche que pour le contenu de type nombre (number) et convient aux champs Montant total (Total Amount). longest_value : la valeur constituée du plus grand nombre de caractères.
Raccourci	Général	Touche de raccourci pour ce champ. Une ou deux clés autorisées.
Multiligne	Général	Cochez cette case pour les champs qui peuvent s'étendre sur plusieurs lignes de texte (adresses ou descriptions), sinon, seule la première ligne sera renvoyée.
Valeurs multiples	Général	Cochez cette case pour que toutes les valeurs détectées dans le document s'affichent sous forme de liste. Vous pouvez cocher la case Lignes multiples (Multi-line) ou Valeurs multiples (Multi-value).
Masqué	Général	Cochez cette case si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.
Évaluation	Avancé	La mesure utilisée pour déterminer la précision lors de l’évaluation des prédictions du modèle. Il ne peut être configuré que pour le type de contenu de string. Tous les autres types de contenu utilisent une stratégie de notation de correspondance exacte (Exact Match). Options : exact match : une prédiction n'est considérée comme correcte (note de 1) que si elle correspond exactement à la valeur réelle. Si elle diffère ne serait-ce que d’un seul caractère, elle est considérée comme incorrecte (note de 0). levenshtein : une prédiction est considérée comme partiellement correcte en fonction de la distance de Levenshtein entre la prédiction et la valeur réelle. Si une valeur de 10 lettres est prédite correctement sauf pour les 2 derniers caractères, alors la note de cette prédiction sera de 0,8.
Couleur	Avancé	La couleur du champ au format hexadécimal. Si la valeur n'est pas valide, une nouvelle est générée.

Supprimer un champ régulier

Pour supprimer un champ normal, procédez comme suit :

Sélectionnez le bouton Modifier le champ correspondant au champ normal que vous souhaitez supprimer.
Sélectionnez le bouton Supprimer.
Tapez le nom exact du champ.
Sélectionnez OK.
Le champ normal et ses données labellisées associées sont supprimés.

Champs de classification

Points de données qui se réfèrent à un document dans son ensemble. Par exemple, le type de dépense d'un reçu (nourriture, hôtel, compagnie aérienne, transport) ou la devise d'une facture (USD, EUR, JPY) seraient des exemples de champs de classification.

Créer un nouveau champ de classification

Sélectionnez dans le volet droit de la section Champs de classification. La fenêtre Créer un champ de classification s'affiche.
Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas _ et des tirets -.
Sélectionnez OK. La fenêtre Modifier un champ (Edit Field) s'affiche.
Dans la zone de texte, remplissez la liste des classes et saisissez les noms sous forme de liste séparée par des virgules.
Sélectionnez Enregistrer pour enregistrer vos paramètres.

Modifier un champ de classification

Sélectionnez le bouton Modifier le champ Modifier l’icône

. Définissez la liste des valeurs possibles. Les valeurs doivent être séparées par des virgules. Une description facultative de la valeur peut être incluse après les deux-points : (option 1 : description 1).

Supprimer un champ de classification

Pour supprimer un champ de classification, procédez comme suit :

Sélectionnez le bouton Modifier le champ correspondant au champ de classification que vous souhaitez supprimer.
Sélectionnez le bouton Supprimer.
Tapez le nom exact du champ.
Sélectionnez OK.
Le champ de colonne et ses données étiquetées labellisées sont supprimés.