- Démarrage
- Composants de l'infrastructure
- Vue d’ensemble de l’extraction des données
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- FlexiCapture Extractor
- Activités liées à l'extraction de données
- Document Understanding dans AI Center
- Pipelines
- Paquets ML
- Data Manager
- Services OCR
- Licences
- Référence (Reference)
Guide de l'utilisateur de Document Understanding
Créer et configurer des champs
Les champs ne peuvent pas être supprimés ou renommés, alors réfléchissez bien avant d'ajouter de nouveaux champs. Si, toutefois, vous décidez par la suite de ne pas utiliser certains champs pour l'apprentissage d'un modèle ML, vous pouvez toujours les masquer à l'aide de la case à cocher Caché (Hidden) dans la fenêtre Modifier le champ (Edit Field).
Cliquez ici pour plus de détails sur les champs, leur signification et quand les utiliser.
Les éléments de ligne Description ou Prix unitaire (Unit Price) d'un article sur une facture seraient des exemples de champs de colonne.
- Cliquez sur + dans la section Table en haut de la page pour ajouter un nouveau champ Colonne (Column). La fenêtre Créer un champ de colonne (Create Column Field) s'affiche.
- Dans le champ Saisir un nom de champ unique (Enter Unique Field Name), nommez champ de façon appropriée. Les majuscules ne sont pas acceptées.
- Cliquez sur Créer (Create). La fenêtre Modifier un champ (Edit Field) s'affiche.
- Dans la liste déroulante Type de contenu (Content Type), sélectionnez le type de contenu.
- Dans la liste déroulante Évaluation (Scoring), sélectionnez la mesure utilisée pour déterminer la précision lors de l'exécution des évaluations des prédictions du modèle.
- Cliquez sur le champ Raccourci clavier (Hotkey) et appuyez sur une touche de votre clavier pour le remplir automatiquement.
- Remplissez le code hexadécimal de la couleur de champ souhaitée dans le champ Couleur (Color).
- Cochez la case Multiligne (Multi line) si le champ à vérifier peut s'étendre sur plusieurs lignes de texte, telles que des adresses ou des descriptions. Si cette option n'est pas sélectionnée, seule la première ligne est renvoyée.
- Cochez la case Fractionner les éléments (Split items) si vous souhaitez que ce champ soit utilisé comme délimiteur entre les éléments de ligne ou les lignes d'un tableau. Toute ligne sur laquelle ce champ apparaît est considérée comme un nouvel élément ou une nouvelle ligne dans le tableau. Le plus souvent, cette fonction est utilisée dans les champs Lignes de montant (Line Amount) des éléments de ligne de la facture.
- Cochez la case Masqué (Hidden) si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.
- Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.
Il s'agit de champs qui n'apparaissent qu'une seule fois sur un document donné. Une ligne d'élément Numéro de facture (Invoice Number) ou Montant total (Total Amount) sur un document de facture peuvent être des exemples de champs de colonne.
- Cliquez sur + dans le volet de droite dans la section Champs réguliers (Regular Fields). La fenêtre Créer un champ régulier (Create Regular Field) s'affiche.
- Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter Unique Field Name). Les majuscules ne sont pas acceptées.
- Cliquez sur Créer (Create). La fenêtre Modifier un champ (Edit Field) s'affiche.
- Sélectionnez le type de contenu dans la liste déroulante Type de contenu (Content Type).
- Sélectionnez le mécanisme de post-traitement au cas où le modèle prédit plusieurs instances d'un champ sur une page donnée dans la liste déroulante Traitement ultérieur (Post processing).
- Cliquez sur le champ Raccourci clavier (Hotkey) et appuyez sur une touche de votre clavier pour le remplir automatiquement.
- Dans le champ Couleur (Color), remplissez le code hexadécimal de la couleur de champ souhaitée o
- Dans la liste déroulante Multipage, sélectionnez la stratégie de récupération des données. Celle-ci est utilisée dans le cas où les champs apparaissent sur des pages différentes d'un document de plusieurs pages. Cette option définit quelle page le modèle décide de renvoyer.
- Dans la liste déroulante Évaluation (Scoring), sélectionnez la mesure utilisée pour déterminer la précision lors de l'exécution des évaluations des prédictions du modèle.
- Cochez la case Multiligne (Multi line) si le champ à vérifier peut s'étendre sur plusieurs lignes de texte, telles que des adresses ou des descriptions. Si cette option n'est pas sélectionnée, seule la première ligne est renvoyée.
- Cochez la case Masqué (Hidden) si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.
- Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.
Points de données qui se réfèrent à un document dans son ensemble. Par exemple, le type de dépense d'un reçu (nourriture, hôtel, compagnie aérienne, transport) ou la devise d'une facture (USD, EUR, JPY) seraient des exemples de champs de classification.
- Cliquez sur + dans le volet droit de la section Champs de classification (Classification Fields). La fenêtre Créer un champ de classification (Create Classification Field) s'affiche.
- Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter Unique Field Name). Les majuscules ne sont pas acceptées.
- Cliquez sur Créer (Create). La fenêtre Modifier un champ (Edit Field) s'affiche.
- Dans la zone de texte, remplissez la liste des classes et saisissez les noms sous forme de liste séparée par des virgules.
- Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.
Attention : contrairement aux champs réguliers (Regular) et de colonne (Column), les champs Classification ne sont pas ré-entraînés. Par exemple, pour le champ Devise (Currency), si vous recyclez le modèle Factures (Invoices) sur un ensemble de données contenant uniquement des factures en USD et INR, le modèle résultant ne pourra reconnaître que ces deux devises.
Affiché en haut de la page dans le Data Manager. Vous permet d'effectuer plusieurs opérations : naviguer entre les documents, supprimer un document, filtrer des documents, exécuter des prédictions de modèle d'IA, importer et exporter des documents.
Champ |
Description |
---|---|
→ |
Naviguez entre les documents qui correspondent au filtre actif. Entre les deux flèches, un compteur s'affiche. Il représente le numéro du document actuel sur le nombre total de documents qui correspondent au filtre actif. |
Supprimer (Delete) / Récupérer (Recover) |
Supprime ou récupère un document. |
Liste déroulante des filtres (Filter) |
Filtre les documents. Ce filtre s'applique également aux données exportées. Les options suivantes sont disponibles :
|
Prévoir (Predict) |
Exécutez les prédictions du modèle d'IA et affichez les résultats. |
Importer (Import) |
Importe un nouveau document à labelliser. |
Exporter (Export) |
Exporte les données labellisées. Le filtre actif s'applique aux données exportées. |
[DocumentName] |
Le nom du document actuellement actif. |
[UserName] |
Le nom de l'utilisateur actuel. |
Se déconnecter |
Se déconnecte du Data Manager. La déconnexion efface également les cookies. |
Help |
Affiche le menu d'aide du Data Manager. |
Permet de configurer le nom du champ à ajouter.
Champ |
Description |
---|---|
Saisir un nom de champ unique |
Le nom du champ. Ne peut contenir que des lettres minuscules, des chiffres, des tirets bas "_" et des tirets "-". |
Permet de configurer le champ régulier et de colonne.
Champ |
Description |
---|---|
Type de contenu |
Le type de contenu d'un champ. Les options suivantes sont disponibles :
|
Traitement ultérieur |
Seulement affiché pour les champs réguliers. Le mécanisme de post-traitement. Les options suivantes sont disponibles :
|
Raccourci clavier |
Touche de raccourci pour ce champ. |
Couleur |
La couleur du champ. |
Multipage |
La stratégie de renvoi des données dans le cas où un champ apparaît sur plusieurs pages d'un document. Les options suivantes sont disponibles :
|
Évaluation |
Ne peut être configuré que pour le contenu de type chaîne. Tous les autres types de contenu utilisent une stratégie de notation de correspondance exacte (Exact Match). La mesure utilisée pour déterminer la précision lors de l’évaluation des prédictions du modèle.
|
Multiligne |
Cochez cette case pour les champs qui peuvent s'étendre sur plusieurs lignes, comme les adresses ou les descriptions. Sinon, seule la première ligne sera renvoyée. |
Fractionner les éléments |
Seulement affiché pour les champs de colonne. Cochez cette case si vous souhaitez que ce champ soit utilisé comme délimiteur entre les éléments de ligne ou les lignes d'un tableau. Toute ligne sur laquelle ce champ apparaît est considérée comme un nouvel élément ou une nouvelle ligne dans le tableau. Le plus souvent, cette fonction est utilisée dans les champs Lignes de montant (Line Amount) des lignes de montant de facture. |
Masqué |
Cochez cette case si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés. |
La section Contrôles de libellés (Labeling Controls) affiche les contrôles à utiliser lors de la gestion des données.
La section Raccourcis du document (Document Shortcuts) affiche les raccourcis utilisés pour effectuer diverses opérations telles que la navigation et la mise à l'échelle de l'interface utilisateur.
La section Configuration affiche des détails sur la configuration de l'instance telle qu'elle a été effectuée lors de l'installation.
La section Rapport d'erreurs (Error Reporting) vous permet d'afficher les journaux récemment générés.