document-understanding

2020.10

false

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Obsolète

Guide de l'utilisateur de Document Understanding

PRODUIT :

Dernière mise à jour 4 févr. 2025

Créer et configurer des champs

Ajout de champs

Les champs ne peuvent pas être supprimés ou renommés, alors réfléchissez bien avant d'ajouter de nouveaux champs. Si, toutefois, vous décidez par la suite de ne pas utiliser certains champs pour l'apprentissage d'un modèle ML, vous pouvez toujours les masquer à l'aide de la case à cocher Caché (Hidden) dans la fenêtre Modifier le champ (Edit Field).

Cliquez ici pour plus de détails sur les champs, leur signification et quand les utiliser.

Remarque : un maximum de 40 champs peut être créé.

Champs de colonnes

Les éléments de ligne Description ou Prix unitaire (Unit Price) d'un article sur une facture seraient des exemples de champs de colonne.

Cliquez sur + dans la section Table en haut de la page pour ajouter un nouveau champ Colonne (Column). La fenêtre Créer un champ de colonne (Create Column Field) s'affiche.
Dans le champ Saisir un nom de champ unique (Enter Unique Field Name), nommez champ de façon appropriée. Les majuscules ne sont pas acceptées.
Cliquez sur Créer (Create). La fenêtre Modifier un champ (Edit Field) s'affiche.
Dans la liste déroulante Type de contenu (Content Type), sélectionnez le type de contenu.
Dans la liste déroulante Évaluation (Scoring), sélectionnez la mesure utilisée pour déterminer la précision lors de l'exécution des évaluations des prédictions du modèle.
Cliquez sur le champ Raccourci clavier (Hotkey) et appuyez sur une touche de votre clavier pour le remplir automatiquement.
Remplissez le code hexadécimal de la couleur de champ souhaitée dans le champ Couleur (Color).
Cochez la case Multiligne (Multi line) si le champ à vérifier peut s'étendre sur plusieurs lignes de texte, telles que des adresses ou des descriptions. Si cette option n'est pas sélectionnée, seule la première ligne est renvoyée.
Cochez la case Fractionner les éléments (Split items) si vous souhaitez que ce champ soit utilisé comme délimiteur entre les éléments de ligne ou les lignes d'un tableau. Toute ligne sur laquelle ce champ apparaît est considérée comme un nouvel élément ou une nouvelle ligne dans le tableau. Le plus souvent, cette fonction est utilisée dans les champs Lignes de montant (Line Amount) des éléments de ligne de la facture.
Cochez la case Masqué (Hidden) si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.
Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.

Champs réguliers

Il s'agit de champs qui n'apparaissent qu'une seule fois sur un document donné. Une ligne d'élément Numéro de facture (Invoice Number) ou Montant total (Total Amount) sur un document de facture peuvent être des exemples de champs de colonne.

Cliquez sur + dans le volet de droite dans la section Champs réguliers (Regular Fields). La fenêtre Créer un champ régulier (Create Regular Field) s'affiche.
Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter Unique Field Name). Les majuscules ne sont pas acceptées.
Cliquez sur Créer (Create). La fenêtre Modifier un champ (Edit Field) s'affiche.
Sélectionnez le type de contenu dans la liste déroulante Type de contenu (Content Type).
Sélectionnez le mécanisme de post-traitement au cas où le modèle prédit plusieurs instances d'un champ sur une page donnée dans la liste déroulante Traitement ultérieur (Post processing).
Cliquez sur le champ Raccourci clavier (Hotkey) et appuyez sur une touche de votre clavier pour le remplir automatiquement.
Dans le champ Couleur (Color), remplissez le code hexadécimal de la couleur de champ souhaitée o
Dans la liste déroulante Multipage, sélectionnez la stratégie de récupération des données. Celle-ci est utilisée dans le cas où les champs apparaissent sur des pages différentes d'un document de plusieurs pages. Cette option définit quelle page le modèle décide de renvoyer.
Dans la liste déroulante Évaluation (Scoring), sélectionnez la mesure utilisée pour déterminer la précision lors de l'exécution des évaluations des prédictions du modèle.
Cochez la case Multiligne (Multi line) si le champ à vérifier peut s'étendre sur plusieurs lignes de texte, telles que des adresses ou des descriptions. Si cette option n'est pas sélectionnée, seule la première ligne est renvoyée.
Cochez la case Masqué (Hidden) si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.
Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.

Champs de classification

Points de données qui se réfèrent à un document dans son ensemble. Par exemple, le type de dépense d'un reçu (nourriture, hôtel, compagnie aérienne, transport) ou la devise d'une facture (USD, EUR, JPY) seraient des exemples de champs de classification.

Cliquez sur + dans le volet droit de la section Champs de classification (Classification Fields). La fenêtre Créer un champ de classification (Create Classification Field) s'affiche.
Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter Unique Field Name). Les majuscules ne sont pas acceptées.
Cliquez sur Créer (Create). La fenêtre Modifier un champ (Edit Field) s'affiche.
Dans la zone de texte, remplissez la liste des classes et saisissez les noms sous forme de liste séparée par des virgules.
Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.
Attention : contrairement aux champs réguliers (Regular) et de colonne (Column), les champs Classification ne sont pas ré-entraînés. Par exemple, pour le champ Devise (Currency), si vous recyclez le modèle Factures (Invoices) sur un ensemble de données contenant uniquement des factures en USD et INR, le modèle résultant ne pourra reconnaître que ces deux devises.

Description des champs

Barre de gestion

Affiché en haut de la page dans le Data Manager. Vous permet d'effectuer plusieurs opérations : naviguer entre les documents, supprimer un document, filtrer des documents, exécuter des prédictions de modèle d'IA, importer et exporter des documents.

Champ	Description
→	Naviguez entre les documents qui correspondent au filtre actif. Entre les deux flèches, un compteur s'affiche. Il représente le numéro du document actuel sur le nombre total de documents qui correspondent au filtre actif.
Supprimer (Delete) / Récupérer (Recover)	Supprime ou récupère un document.
Liste déroulante des filtres (Filter)	Filtre les documents. Ce filtre s'applique également aux données exportées. Les options suivantes sont disponibles : train-validate-set -ensemble de tests -supprimé -labellisé -non labellisé -<batch_name>
Prévoir (Predict)	Exécutez les prédictions du modèle d'IA et affichez les résultats.
Importer (Import)	Importe un nouveau document à labelliser.
Exporter (Export)	Exporte les données labellisées. Le filtre actif s'applique aux données exportées.
[DocumentName]	Le nom du document actuellement actif.
[UserName]	Le nom de l'utilisateur actuel.
Se déconnecter	Se déconnecte du Data Manager. La déconnexion efface également les cookies.
Aide	Affiche le menu d'aide du Data Manager.

Fenêtre Créer un champ (Create Field)

Permet de configurer le nom du champ à ajouter.

Champ	Description
Saisir un nom de champ unique	Le nom du champ. Ne peut contenir que des lettres minuscules, des chiffres, des tirets bas "_" et des tirets "-".

Fenêtre Modifier le champ (Edit Field)

Permet de configurer le champ régulier et de colonne.

Champ	Description
Type de contenu	Le type de contenu d'un champ. Les options suivantes sont disponibles : chaîne (string) – approprié pour les noms ou adresses des sociétés, ainsi que les conditions de paiement, ou pour tout autre domaine où le RPA Developer préfère créer la logique d’analyse ou de formatage manuellement, dans le workflow RPA. number - utilisé pour les montants ou les quantités, avec une analyse intelligente des séparateurs décimaux/milliers. date – le modèle analyse, formate et unifie la sortie au format aaaa-mm-jj. phone - approprié pour les numéros de téléphone. id-no - approprié pour les codes alphanumériques, les nombres d'identifiants, il est similaire au type de contenu string, mais inclut la suppression de tous les caractères précédant un ":". Si le numéro d'identification que vous devez extraire peut contenir des caractères " :", veuillez utiliser string comme type de contenu à la place, pour éviter la perte de données.
Traitement ultérieur	Seulement affiché pour les champs réguliers. Le mécanisme de post-traitement. Les options suivantes sont disponibles : first span – Si le modèle prévoit plus d’une instance d’un champ sur une page donnée, le modèle renverra la première. largest value – Si le modèle prévoit plus d’une instance d’un champ sur une page donnée, le modèle renvoie la plus grande valeur numérique. Cette option ne s'affiche que pour le contenu de type number et convient aux champs Montant total (Total Amount). longest value – Si le modèle prévoit plus d’une instance d’un champ sur une page donnée, faites en sorte que le modèle renvoie la valeur composée de la plus grande string de caractères.
Raccourci clavier	Touche de raccourci pour ce champ.
Couleur	La couleur du champ.
Multipage	La stratégie de renvoi des données dans le cas où un champ apparaît sur plusieurs pages d'un document. Les options suivantes sont disponibles : highest_confidence - le choix par défaut pour les types de contenu string, téléphone (phone) et nombre (number). first_occurrence - le choix par défaut pour les types de contenu id-no et date. Dernière occurrence - longest string - affichée uniquement pour le contenu de type string. - shortest string - affichée uniquement pour le contenu de type string. - highest numeric value - affichée uniquement pour le contenu de type number. - lowest numeric value - affichée uniquement pour le contenu de type number.
Évaluation	Ne peut être configuré que pour le contenu de type chaîne. Tous les autres types de contenu utilisent une stratégie de notation de correspondance exacte (Exact Match). La mesure utilisée pour déterminer la précision lors de l’évaluation des prédictions du modèle. exact match – Une prédiction n'est considérée comme correcte (note de 1) que si elle correspond exactement à la valeur réelle. Si elle diffère ne serait-ce que d’un seul caractère, elle est considérée comme incorrecte (note de 0). levenshtein - une prédiction est considérée comme partiellement correcte en fonction de la distance de Levenshtein entre la prédiction et la valeur réelle. Si une valeur de 10 lettres est prédite correctement sauf pour les 2 derniers caractères, alors la note de cette prédiction sera de 0,8.
Multiligne	Cochez cette case pour les champs qui peuvent s'étendre sur plusieurs lignes, comme les adresses ou les descriptions. Sinon, seule la première ligne sera renvoyée.
Fractionner les éléments	Seulement affiché pour les champs de colonne. Cochez cette case si vous souhaitez que ce champ soit utilisé comme délimiteur entre les éléments de ligne ou les lignes d'un tableau. Toute ligne sur laquelle ce champ apparaît est considérée comme un nouvel élément ou une nouvelle ligne dans le tableau. Le plus souvent, cette fonction est utilisée dans les champs Lignes de montant (Line Amount) des lignes de montant de facture.
Masqué	Cochez cette case si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.

Menu d'aide de Data Manager

La section Contrôles de libellés (Labeling Controls) affiche les contrôles à utiliser lors de la gestion des données.

La section Raccourcis du document (Document Shortcuts) affiche les raccourcis utilisés pour effectuer diverses opérations telles que la navigation et la mise à l'échelle de l'interface utilisateur.

La section Configuration affiche des détails sur la configuration de l'instance telle qu'elle a été effectuée lors de l'installation.

La section Rapport d'erreurs (Error Reporting) vous permet d'afficher les journaux récemment générés.

Sommaire de la page