- Vue d'ensemble (Overview)
- Démarrage
- Activités (Activities)
- Tableaux de bord Insights.
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Présentation de la taxonomie
- Gestionnaire de taxonomie
- Activités liées à la taxonomie
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus – Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Limitations du trafic
- Configuration OCR
- Pipelines
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Données et sécurité
- Licences

Guide de l'utilisateur de Document Understanding
Le Taxonomy Manager peut être utilisé pour créer et modifier un fichier de taxonomie spécifique à votre projet d'automatisation actuel. Ce fichier de taxonomie contient des types de documents définis par l'utilisateur, organisés en Groupes et Catégories.
Vous pouvez utiliser ultérieurement le fichier Taxonomy en le convertissant en type de données .NET avec l'activité Charger la taxonomie (Load Taxonomy), puis en le passant comme entrée pour les activités telles que :
- Classify Document Scope
- Tester l'étendue des classifieurs
- Tester l'étendue des extracteurs
- Present Validation Station
Taxonomy Manager n'est accessible qu'après avoir installé un package UiPath.IntelligentOCR.Activities supérieur ou égal à v1.6.0 en tant que dépendance de votre projet. Une fois le package installé, un bouton Taxonomy Manager apparaît sur le ruban dans la section Assistants (Wizards).
La fenêtre Gestionnaire de taxonomie (Taxonomy Manager) vous permet de créer des types de documents, organisés par groupes et catégories. Lorsqu'il est ouvert pour la première fois dans un projet, aucun groupe, catégorie ou type de document n'est défini.
La première étape consiste à créer un groupe ou un type de document. La différence entre les deux est qu'un groupe implique une structure hiérarchique alors qu'un type de document peut être créé en tant que fichier unique. Un projet complexe implique la création de groupes, de catégories et de types de documents, tandis qu'un projet simple ne peut nécessiter qu'un ou deux types de documents.
Création d'un groupe
Lorsqu'un groupe est créé, une catégorie est également nécessaire pour le type de document que vous souhaitez créer à l'intérieur du groupe. Cela se fait en utilisant le bouton Groupe (Group). Une fois que vous avez choisi un nom pour votre groupe, vous pouvez l'enregistrer en utilisant le bouton Enregistrer (Save) ou en utilisant la touche Entrée.
Création d'une catégorie
Une fois qu'un groupe est défini et sélectionné, vous pouvez créer une catégorie (Category) et/ou un Type de document (Document Type) au sein du groupe, en utilisant leurs boutons définis. Sélectionnez Enregistrer (Save) ou utilisez la touche Entrée pour enregistrer la configuration.
Création d'un type de document
Un type de document peut être créé soit comme faisant partie d'un groupe, soit comme un document unique. Une fois créé dans un groupe, assurez-vous que le groupe est sélectionné, puis sélectionnez Type de document (Document Type).
Si le type de document est créé en tant que fichier unique, assurez-vous qu'aucun groupe n'est sélectionné et sélectionnez Type de document. Après avoir sélectionné Type de document, saisissez un nom pour le fichier et sélectionnez Enregistrer.
La sélection d'un type de document déjà créé vous permet de modifier son nom, de copier son identifiant unique dans le presse-papiers ou de le réaffecter à un autre groupe ou catégorie. Vous pouvez également saisir un code pour le type de document.
Group.Category.Document et peut être copié dans le presse-papiers. Le code d' identification du type de document est une fonctionnalité facultative et il peut être utilisé pour rechercher vos documents ou mapper vos documents aux types de documents que vous définissez dans la taxonomie.
Configuration des paramètres d'affichage pour le type de document
- Seuil de confiance OCR: définissez un seuil de confiance minimum au niveau du type de document.
Lorsque le document est affiché dans la station de validation, le niveau de confiance OCR et le niveau de confiance d'extraction pour un champ doivent être supérieurs au seuil que vous configurez dans Taxonomy Manager.
La valeur par défaut du seuil de confiance OCR est de 90 %.
- Format d'affichage de la date: le format de date affiché pour le type de document.
La valeur par défaut est
YYYY-MM-DD. - Séparateur décimal de nombre: le séparateur décimal de nombre que vous souhaitez utiliser pour le type de document.
- Séparateur de milliers de nombres: le séparateur de milliers de nombres que vous souhaitez utiliser pour le type de document.
Créer des champs
Lorsque le Type de document est sélectionné, le bouton Champ (Field) devient disponible pour créer un nouveau champ. Une fois le bouton Champ (Field) sélectionné, vous pouvez lui donner un nom et sélectionner son type dans la liste déroulante.
La catégorie Champ (Field) a deux onglets : Détails (Details) et Règles (Rules). L'onglet Détails (Details) fournit des informations sur le champ sélectionné, tel que le Nom du champ (Field Name), le raccourci clavier attribué ou le type de champ, tandis que l'onglet Règles (Rules) vous permet de créer des règles que le résultat d'extraction doit remplir pour le champ.
Les types de champs suivants sont disponibles :
- Texte
- Numérique
- Date : le choix de ce type permet de spécifier un format prévu, qui est facultatif.
Remarque :
Si vous souhaitez ajouter un format attendu, utilisez un format compatible MSDN (Microsoft Developer Network).
This format may be used by extractors and is used by the Data Extraction Scope activity when trying to parse a Date into its constituent Day, Month, and Year parts.
- Nom
- Address
- Set (Ensemble) : le choix de ce type permet d’ajouter plusieurs valeurs au champ à partir d’une liste pré-établie.
- Booléen
- Table : le choix de ce type permet de modifier la structure de la table, car vous pouvez ajouter des colonnes et modifier leur nom et leur type.
Onglet Détails
Une fois le nouveau champ créé, sélectionnez-le pour afficher plus d’informations. Par défaut, l’onglet Détails (Details) s’affiche lorsque vous ouvrez un champ, vous permettant de modifier le nom, la couleur ou le raccourci clavier du champ. Vous pouvez également spécifier s’il est à plusieurs valeurs (Est à plusieurs valeurs (Is multi-value)) ou s’il autorise le traitement des valeurs sans preuve dans le document (Nécessite une référence (Requires reference)). L’option à plusieurs valeurs permet à un champ d’avoir plusieurs valeurs, sans se limiter à une liste spécifique.
- Est à valeurs multiples (Is Multi-Value) : si un champ est défini comme étant à valeurs multiples, plusieurs valeurs peuvent être spécifiées pour ce champ. Par exemple, vous souhaitez extraire une « Liste des administrateurs », laquelle peut contenir un nombre variable d'entrées. Représentez-vous un champ à valeurs multiples comme un tableau à une seule colonne.
- Requiert une référence : lorsqu'un champ requiert une référence, vous ne pouvez y ajouter une valeur que si vous sélectionnez quelque chose dans le document affiché dans la Station de validation. Pour certains champs spéciaux dans lesquels vous souhaitez capturer des valeurs pouvant ne pas être visibles dans le document, vous pouvez désactiver (off) l'option Requiert une référence. L'utilisateur pourra ainsi ajouter une valeur sans spécifier l'emplacement d'où proviennent ces valeurs dans le document.
Vous pouvez également sélectionner le Type de champ dans la liste déroulante, ou ajouter une Valeur par défaut (Default value). Utilisez le champ Valeur par défaut (Default value) pour définir les valeurs à remplir dans le Résultat de l’extraction (Extraction Result), au cas où aucune valeur pour le champ n’est identifiée dans le document.
Paramètres de validation
Sous Paramètres de validation (Validation settings), vous avez la possibilité de définir un seuil de confiance d'extraction. Ce seuil est pris en compte lors de la validation du champ dans la station de validation. Pour définir un seuil de confiance d'extraction, accédez à Seuil de confiance d'extraction (Extraction confidence seuil) et saisissez une valeur comprise entre 0 et 100.
- Lecture seule: si cette option est activée, le validateur humain peut afficher toutes les notes du validateur définies dans le champ RésultatExtraction ( ExtractionResult ) de la Station de validation, sous la forme d'un message. S'il est désactivé (état par défaut), le validateur humain peut également modifier cette note dans la station de validation et ainsi communiquer au robot des informations sur la décision prise.
- Texte: si l' option Texte est sélectionnée, la note du validateur s'affiche sous forme de message texte (ou de texte modifiable lorsque la modification est activée) dans la station de validation. Le validateur humain peut afficher, modifier ou ajouter un message de 200 caractères maximum dans la station de validation.
- Options: si vous sélectionnez Options(Options), vous pouvez configurer une série de boutons radio que le validateur humain peut afficher et, s'ils ne sont pas en lecture seule, les sélectionner dans la station de validation (Validation Station). Vous pouvez ajouter un maximum de 10 options.
GetFieldValidatorNotes(<fieldId>) and SetFieldValidatorNotes(<fieldId>, <validatorNote>).
Les champs créés peuvent être supprimés à l'aide du bouton de suppression qui apparaît à côté d'eux ou réorganisés à l'aide de la fonction glisser-déposer.
Un champ peut également être supprimé à partir de la fenêtre Détails (Details), en sélectionnant Supprimer (Delete).
En revenant en arrière, vous pouvez créer plusieurs groupes, catégories et types de documents, que vous pouvez filtrer à l'aide du champ Rechercher (Search).
Onglet Règles
Les règles de champ vous aident à optimiser les résultats de l’extraction et à les valider automatiquement lors de l’exécution de votre workflow. Leur rôle consiste à augmenter l’efficacité de l’extraction et à vous aider à valider facilement les champs qui nécessitent une attention dans la station de validation en les mettant en surbrillance. Vous pouvez créer plusieurs règles qui s’appliquent à un seul champ.
Vous définissez une règle en définissant le type d' évaluateur et le niveau de criticité.
Type d'évaluateur
Utilisez le type d'évaluateur pour spécifier comment les règles définies doivent être évaluées. Vous avez le choix entre deux types d'évaluateurs : AND, OR.
|
Type d'évaluateur |
Description |
Exemple |
|---|---|---|
|
AND |
Utilisez ce type d'évaluateur lorsque toutes les règles doivent être exécutées. |
Règle : le numéro de facture commence par A et se termine par X.
|
|
OU |
Une seule des règles doit être exécutée. |
Règle : Le numéro de facture commence par A OU est 123.
|
Niveau critique
Indique le caractère critique de toutes les règles définies pour un champ. Vous ne pouvez pas définir un niveau MUST si la règle est enfreinte dans la session Station de validation. Vous avez le choix entre deux niveaux de criticité : MUST, SHOULD.
La règle créée est déclenchée une fois le niveau de criticité défini identifié.
Lorsque vous souhaitez soumettre une règle, une règle MUST nécessite une réussite de 100 %, sinon l'opération de soumission échoue. Une règle DEVRAIT (SHOULD) vous permet de la soumettre même si la règle est enfreinte.
You can always check if a rule is broken by using the helper method from the ExtractionResult Class class, that resides in the UiPath.DocumentProcessing.Contracts activity package.
|
Description | |
|---|---|
|
MUST |
Utilisez ce niveau de criticité lorsque la règle créée doit impérativement être incluse dans le processus des résultats d'extraction. |
|
SHOULD |
Utilisez ce niveau de criticité lorsque la règle créée est facultative. |
Une fois que vous avez sélectionné le Type d'évaluateur et le Niveau de criticité, vous devez définir un type applicable à la règle que vous venez de créer. Vous avez le choix entre plusieurs options. Voici une liste complète de tous ceux disponibles :
- N'est pas vide
- Valeurs possibles
- Commence par
- Se termine par
- Contient
- Longueur fixe
- Est un e-mail
- RegExRemarque : le type de champ pour lequel vous avez créé une règle détermine le nombre de types de règles sélectionnables. Par exemple, un champ de type Texte (Text) affiche tous les types de règles possibles, tandis qu’un champ de type Date affiche uniquement deux types de règles, N’est pas vide (Is not empty) et Valeurs possibles (Possible values).
Type de règles
| Description | Type de champ | Niveau critique | Type d'évaluateur | |
|---|---|---|---|---|
| N'est pas vide | La valeur extraite ne peut pas être vide, ce qui signifie que le champ est obligatoire. Si la valeur est manquante, elle nécessite une validation/saisie manuelle. | Applicable aux champs des types suivants :
|
MUST SHOULD | AND
OU |
| Valeurs possibles | L’utilisateur définit toutes les valeurs possibles et les données extraites sont l’une des valeurs ajoutées en tant qu’entrée lors de la création de la règle (par exemple, le type d’employé est « full-time », « part-time » ou « internship »). | Applicable aux champs des types suivants :
|
MUST SHOULD | AND
OU |
| Expression | Définissez des expressions mathématiques qui servent de règle pour extraire des données. | Applicable aux champs de type nombre.
Une condition est requise lors de la configuration de la règle. Choisissez l’une des options suivantes :
Une expression mathématique est requise. Utilisez les opérateurs prédéfinis pour définir votre expression. Consultez les exemples suivants :
|
MUST SHOULD | AND
OU |
| Commence par | Il s'agit d'une règle fixe, ce qui signifie que la valeur extraite doit commencer par l'une des valeurs ajoutées par l'utilisateur. | Applicable aux champs des types suivants :
|
MUST SHOULD | AND
OU |
| Se termine par | Il s'agit d'une règle fixe qui signifie que la valeur extraite doit se terminer par l'une des valeurs ajoutées par l'utilisateur. | Applicable aux champs des types suivants :
|
MUST SHOULD | AND
OU |
| Contient | Il s'agit d'une règle fixe qui signifie que la valeur extraite doit contenir l'une des valeurs ajoutées par l'utilisateur. | Applicable aux champs des types suivants :
|
MUST SHOULD | AND
OU |
| Longueur fixe | Il s'agit d'une règle fixe, ce qui signifie que la valeur extraite doit avoir une certaine longueur fixe. | Applicable aux champs des types suivants :
|
MUST SHOULD | AND
OU |
| Est un e-mail | Il s'agit d'une règle fixe qui signifie que la valeur extraite doit être écrite dans un format e-mail. | Applicable aux champs des types suivants :
|
MUST SHOULD | AND
OU |
| RegEx | Il s'agit d'une règle fixe, ce qui signifie que la valeur extraite doit contenir une expression régulière similaire à l'une des valeurs ajoutées par l'utilisateur. | Applicable aux champs des types suivants :
|
MUST SHOULD | AND
OU |
Utilisation des règles
- Sélectionnez un champ dans le panneau Taxonomie (Taxonomy).
- Accédez à l'onglet Règles (Rules).
- Sélectionnez Ajouter nouveau (Add new) pour ajouter une nouvelle règle.
- Saisissez la règle
full address, pour laquelle le Type est Contient (Contains) et l’Expression estst, str, street. - Choisissez le Type d’évaluateur (Evaluator type).
Dans cet exemple, sélectionnez OU (OR).
- Choisissez le Niveau critique (Criticality level).
Dans cet exemple, sélectionnez DOIT (MUST).
- Sélectionnez Ajouter nouveau (Add new).
- Saisissez la règle
phone number, pour laquelle le Type est N’est pas vide (Is not empty). - Sélectionnez Ajouter nouveau (Add new).
- Saisissez la règle
city or state, pour laquelle le Type est Contient (Contains) et l’Expression estcity, state.
L’image interactive suivante montre les étapes décrites précédemment.
Autres options
Modification
Vous pouvez modifier (Edit) le nom de n'importe quel groupe, catégorie ou type de document que vous avez créé. Cela peut être fait en sélectionnant l'un des trois niveaux de configuration et en modifiant le champ Nom (Name).
Suppression
Les groupes, les catégories et les types de documents peuvent également être supprimés. Deux options sont disponibles :
- Sélectionner Supprimer (Delete)
au niveau de l’élément parent de l’objet que vous souhaitez supprimer.
- Sélectionner Supprimer (Delete)
tout en sélectionnant l’objet que vous souhaitez supprimer.
Dans les deux cas, une fenêtre contextuelle s'affiche vous demandant de confirmer l'action de suppression. Cliquez sur Supprimer (Delete) pour approuver l'action.
Personnalisation et accessibilité
Un raccourci clavier et une couleur sont automatiquement attribués au champ nouvellement créé. Vous pouvez les utiliser pour améliorer la visibilité et profiter d'une navigation plus rapide dans votre taxonomie. Personnalisez-les en cliquant sur le champ du raccourci clavier ou sur du code couleur.
A customized field with color and hotkey can instruct the Validation Station and the Template Manager to use the assigned color when displaying the field and to use the assigned hotkey as a shortcut for providing values to fields. See the Validation Station page for more information about how to use the field shortcuts to assign values to a field.
Pour attribuer une couleur et un raccourci clavier à un champ, sélectionnez le champ et choisissez un certain code couleur dans le champ Couleur (Color), puis sélectionnez un raccourci clavier spécifique dans le menu Raccourci clavier (Hotkey).
Naviguez dans le gestionnaire de taxonomie à l’aide des raccourcis clavier. Sélectionnez Afficher les raccourcis clavier disponibles (Show available clavier raccourcis) et activez l’option Activer/Désactiver les raccourcis clavier (Toggle Keyboard Shortcuts) pour éviter le déclenchement accidentel des raccourcis clavier. Les nœuds peuvent également être réduits.
taxonomy.json spécifique à votre projet.