- Démarrage
- Composants de l'infrastructure
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Keyword Based Classifier
- Intelligent Keyword Classifier
- FlexiCapture Classifier
- Machine Learning Classifier
- Activités liées à la classification des documents
- Vue d’ensemble de l'entraînement de la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Machine Learning Classifier Trainer
- Activités liées à l'entraînement de la classification des documents
- Vue d’ensemble de l’extraction des données
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Regex Based Extractor
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- FlexiCapture Extractor
- Activités liées à l'extraction de données
- Paquets ML
- Pipelines
- Data Manager
- Services OCR
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Apprentissage profond
- Licences
- Référence (Reference)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guide de l'utilisateur de Document Understanding
Créer et configurer des champs
Les champs ne peuvent pas être renommés, alors réfléchissez bien avant de nommer un champ. Si, toutefois, vous décidez par la suite de ne pas utiliser certains champs pour l'entraînement d'un modèle ML, vous pouvez toujours les masquer à l'aide de la case à cocher Caché (Hidden) dans la fenêtre Modifier le champ (Edit Field).
Les éléments de ligne Description ou Prix unitaire (Unit Price) d'un article sur une facture seraient des exemples de champs de colonne.
- Cliquez sur dans la section Table en haut de la page pour ajouter un nouveau champ Colonne (Column). La fenêtre Créer un champ de colonne (Create Column Field) s'affiche.
- Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas
_
et des tirets-
. - Cliquez sur Créer (Create). La fenêtre Modifier un champ (Edit Field) s'affiche.
- Dans la liste déroulante Type de contenu (Content Type), sélectionnez le type de contenu.
- Dans la liste déroulante Évaluation (Scoring), sélectionnez la mesure utilisée pour déterminer la précision lors de l'exécution des évaluations des prédictions du modèle.
- Cliquez sur le champ Raccourci clavier (Hotkey) et appuyez sur une touche de votre clavier pour le remplir automatiquement.
- Remplissez le code hexadécimal de la couleur de champ souhaitée dans le champ Couleur (Color).
- Cochez la case Fractionner les éléments (Split items) si vous souhaitez que ce champ soit utilisé comme délimiteur entre les éléments de ligne ou les lignes d'un tableau. Toute ligne sur laquelle ce champ apparaît est considérée comme un nouvel élément ou une nouvelle ligne dans le tableau. Le plus souvent, cette fonction est utilisée dans les champs Lignes de montant (Line Amount) de facture.
- Cochez la case Masqué (Hidden) si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.
- Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.
Cliquez sur le bouton Modifier le champ (Edit field). Les options disponibles pour les champs de colonne se trouvent dans le tableau ci-dessous.
Option |
Description |
---|---|
Type de contenu |
Le type de contenu d'un champ :
|
Raccourci |
Touche de raccourci pour ce champ. Une ou deux clés autorisées. |
Couleur |
La couleur du champ au format hexadécimal. Si la valeur n'est pas valide, une nouvelle est générée. |
Évaluation |
La mesure utilisée pour déterminer la précision lors de l’évaluation des prédictions du modèle. Il ne peut être configuré que pour le type de contenu de string. Tous les autres types de contenu utilisent une stratégie de notation de correspondance exacte (Exact Match). Options :
|
Fractionner les éléments |
Cochez cette case si vous souhaitez que ce champ soit utilisé comme délimiteur entre les éléments de ligne ou les lignes d'un tableau. Toute ligne sur laquelle ce champ apparaît est considérée comme un nouvel élément ou une nouvelle ligne dans le tableau. Le plus souvent, cette fonction est utilisée dans les champs Lignes de montant (Line Amount) des éléments de ligne de la facture. |
Masqué |
Cochez cette case si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés. |
Pour supprimer un champ de colonne, procédez comme suit :
- Cliquez sur le bouton Modifier le champ (Edit field) correspondant au champ de colonne que vous souhaitez supprimer.
- Cliquez sur le bouton Supprimer (Delete).
- Tapez le nom exact du champ.
- Cliquez sur OK.
- Le champ de colonne et ses données labellisées associées sont supprimés.
Il s'agit de champs qui n'apparaissent qu'une seule fois sur un document donné. Une ligne d'élément Numéro de facture (Invoice Number) ou Montant total (Total Amount) sur un document de facture peuvent être des exemples de champs de colonne.
- Cliquez sur dans le volet de droite dans la section Champs réguliers (Regular Fields). La fenêtre Créer un champ régulier (Create Regular Field) s'affiche.
- Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas
_
et des tirets-
. - Cliquez sur Créer (Create). La fenêtre Modifier un champ (Edit Field) s'affiche.
- Sélectionnez le type de contenu dans la liste déroulante Type de contenu (Content Type).
- Sélectionnez le mécanisme de post-traitement au cas où le modèle prédit plusieurs instances d'un champ sur une page donnée dans la liste déroulante Traitement ultérieur (Post processing).
- Cliquez sur le champ Raccourci clavier (Hotkey) et appuyez sur une touche de votre clavier pour le remplir automatiquement.
- Dans le champ Couleur (Color), remplissez le code hexadécimal de la couleur de champ souhaitée o
- Dans la liste déroulante Multipage, sélectionnez la stratégie de récupération des données. Cette option est utilisée dans le cas où les champs apparaissent sur des pages différentes d'un document de plusieurs pages. Cette option définit quelle page le modèle décide de renvoyer.
- Dans la liste déroulante Évaluation (Scoring), sélectionnez la mesure utilisée pour déterminer la précision lors de l'exécution des évaluations des prédictions du modèle.
- Cochez la case Multiligne (Multi line) si le champ à vérifier peut s'étendre sur plusieurs lignes de texte, telles que des adresses ou des descriptions. Si cette option n'est pas sélectionnée, seule la première ligne est renvoyée.
- Cochez la case Masqué (Hidden) si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés.
- Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.
Cliquez sur le bouton Modifier le champ (Edit field). Les options disponibles pour les champs de colonne se trouvent dans le tableau ci-dessous.
Option |
Description |
---|---|
Type de contenu |
Le type de contenu d'un champ :
|
Traitement ultérieur |
Le mécanisme de post-traitement. Si le modèle prévoit plus d’une instance d’un champ sur une page donnée, le modèle renvoie :
|
Raccourci |
Touche de raccourci pour ce champ. Une ou deux clés autorisées. |
Couleur |
La couleur du champ au format hexadécimal. Si la valeur n'est pas valide, une nouvelle est générée. |
Multipage |
La stratégie de renvoi de données dans le cas où un champ apparaît sur différentes pages d'un document multipage.
|
Évaluation |
La mesure utilisée pour déterminer la précision lors de l’évaluation des prédictions du modèle. Il ne peut être configuré que pour le type de contenu de string. Tous les autres types de contenu utilisent une stratégie de notation de correspondance exacte (Exact Match). Options :
|
Multiligne |
Cochez cette case pour les champs qui peuvent s'étendre sur plusieurs lignes de texte (adresses ou descriptions), sinon, seule la première ligne sera renvoyée. |
Masqué |
Cochez cette case si vous ne voulez pas que ce champ fasse partie des ensembles de données exportés. |
Pour supprimer un champ normal, procédez comme suit :
- Cliquez sur le bouton Modifier le champ (Edit field) correspondant au champ normal que vous souhaitez supprimer.
- Cliquez sur le bouton Supprimer (Delete).
- Tapez le nom exact du champ.
- Cliquez sur OK.
- Le champ normal et ses données labellisées associées sont supprimés.
Points de données qui se réfèrent à un document dans son ensemble. Par exemple, le type de dépense d'un reçu (nourriture, hôtel, compagnie aérienne, transport) ou la devise d'une facture (USD, EUR, JPY) seraient des exemples de champs de classification.
- Cliquez sur dans le volet droit de la section Champs de classification (Classification Fields). La fenêtre Créer un champ de classification (Create Classification Field) s'affiche.
- Saisissez un nom unique dans le champ Saisir un nom de champ unique (Enter unique field name). Les majuscules ne sont pas acceptées. Ne peut contenir que des lettres minuscules, des chiffres, le tiret bas
_
et des tirets-
. - Cliquez sur Créer (Create). La fenêtre Modifier un champ (Edit Field) s'affiche.
- Dans la zone de texte, remplissez la liste des classes et saisissez les noms sous forme de liste séparée par des virgules.
- Cliquez sur Enregistrer (Save) pour enregistrer tous vos paramètres.
:
(option 1 : description 1).
Pour supprimer un champ de classification, procédez comme suit :
- Cliquez sur le bouton Modifier le champ (Edit field) correspondant au champ de colonne que vous souhaitez supprimer.
- Cliquez sur le bouton Supprimer (Delete).
- Tapez le nom exact du champ.
- Cliquez sur OK.
- Le champ de colonne et ses données étiquetées labellisées sont supprimés.
- Champs de colonnes
- Créer un nouveau champ de colonne
- Modifier un champ de colonne
- Supprimer un champ de colonne
- Champs réguliers
- Créer un nouveau champ régulier
- Modifier un champ régulier
- Supprimer un champ régulier
- Champs de classification
- Créer un nouveau champ de classification
- Modifier un champ de classification
- Supprimer un champ de classification