- Vue d'ensemble (Overview)
- Processus Document Understanding
- Didacticiels de démarrage rapide
- Composants de l'infrastructure
- Vue d'ensemble (Overview)
- Activités Document Understanding
- Vue d’ensemble de classification de document
- Assistant de configuration des classifieurs de l'activité Classer l'étendue du document (Classify Document Scope)
- Intelligent Keyword Classifier
- Keyword Based Classifier
- Machine Learning Classifier
- Classifieur génératif
- Activités liées à la classification des documents
- Assistant de configuration des classifieurs (Configure Classifiers Wizard) de l'activité Tester l'étendue des classifieurs (Train Classifier Scope)
- Vue d’ensemble de l'entraînement de la classification des documents
- Activités liées à l'entraînement de la classification des documents
- Machine Learning Classifier Trainer
- Assistant de configuration des extracteurs (Configure Extractors Wizard) de l'activité Étendue de l'extraction de données (Data Extraction Scope)
- Vue d’ensemble de l’extraction des données
- Activités liées à l'extraction de données
- Form Extractor
- Extracteur de formulaires intelligents
- Extracteur d'apprentissage automatique
- Regex Based Extractor
- Consommation de données
- Appels API
- Paquets ML
- Vue d'ensemble (Overview)
- Paquets ML - Document Understanding
- Classifieur de documents - Paquet ML
- Paquets ML avec capacités OCR
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 709
- Paquet ML 941x
- Paquet ML 9465
- 990 - Paquet ML - Aperçu
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Passeports - Paquet ML
- Fiches de paie - Paquet ML
- Bons de commande - Paquet ML
- Reçus – Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Autres paquets ML prêts à l’emploi
- Points de terminaison publics
- Prérequis matériels
- Pipelines
- Document Manager
- Services OCR
- Langues prises en charge
- Apprentissage profond
- Tableaux de bord Insights.
- Document Understanding déployé dans Automation Suite
- Document Understanding déployé dans une version AI Center autonome
- Licences
- Activités
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding user guide
Labelliser des documents
Pour obtenir les volumes de documents nécessaires, consultez la page.
For more details about how to assemble a high-quality dataset, check the Training High Performing Models page.
Champs qui apparaissent plusieurs fois sur le même document
Il existe de nombreuses situations où un champ apparaît à plusieurs endroits dans le même document, voire sur la même page. Ceux-ci doivent tous être labellisés du moment qu'ils ont la même signification.
Par exemple, le montant total des factures de services publics. Il apparaît souvent en haut, dans une liste d'éléments au milieu, ou dans une fiche de paie, en bas, dans une zone qui peut être détachée et envoyée par la poste avec le chèque. Dans cette situation, les trois occurrences devront être labellisées. Ceci est utile car, dans certains cas, s'il y a une erreur d'OCR ou si la mise en page est différente et qu'un champ ne peut pas être identifié, le modèle peut toujours identifier les autres occurrences.
What counts is the meaning of the value, not the value itself. For instance, on some invoices which carry no tax, the net amount and the total amount have the same value. But they are clearly different concepts. Consequently, they should not be labelled both as total amount but only the one whose meaning is to represent the total amount.
Labellisation de plusieurs utilisateurs en parallèle
Vous pouvez demander à plusieurs utilisateurs d'utiliser la même instance pour pouvoir labelliser en même temps, même sur le même document.
Si des modifications sont apportées simultanément au schéma d'un utilisateur, la modification est effectuée et pour les autres utilisateurs, un message d'avertissement s'affiche indiquant qu'aucune modification n'a été apportée. Les autres utilisateurs doivent immédiatement actualiser leur navigateur pour vérifier les modifications.
Labellisation pour l'entraînement
When you import a dataset without checking the Make this an Evaluation set checkbox on the Import Data dialog box, then that dataset is used for training and you only need to focus on the labeling of the model and both label and value (selectable words, grey boxes) on the document.
Si de temps en temps, le texte qui est rempli dans les champs de la barre latérale n'est pas correct, ce n'est pas un problème car le modèle ML apprend toujours. Dans certains cas, vous devrez peut-être ajuster la configuration des champs, par exemple, en cochant la case Multi-ligne (Multi-line). Mais, en général, l'accent est mis sur la labellisation des mots sur la page.
Labellisation pour évaluation
Lorsque vous importez un ensemble de données et que vous cochez la case En faire un ensemble de tests (Make this an Evaluation set) dans la boîte de dialogue Importer des données (Import Data), cet ensemble de données ne sera pas utilisé par les pipelines d'entraînement (Training Pipelines) dans AI Center, mais uniquement par les pipelines d'évaluation (Evaluation Pipelines).
Il est important que le texte correct soit rempli dans les champs de la barre latérale (ou la barre supérieure pour les champs de colonne). Cela prend beaucoup plus de temps à vérifier pour chaque champ, mais c'est le seul moyen d'obtenir une mesure fiable de la précision du modèle de ML que vous construisez.
Document Manager prend en charge la labellisation des documents de plusieurs pages. Par conséquent, les champs de la barre latérale ont une valeur unique pour l'ensemble du document. Cela reflète étroitement le comportement au moment de l'exécution dans le workflow RPA et permet aux pipelines d'évaluation dans AI Center de produire des scores réalistes reflétant les performances d'exécution réelles des modèles ML.
Cependant, gardez à l'esprit qu'il s'agit d'un changement majeur par rapport aux versions précédentes où chaque page était labellisée séparément. La labellisation et l'exportation de documents de plusieurs pages supposent que chaque document représente un seul document logique. Par exemple, un document de six pages peut contenir une seule facture de six pages, mais il ne doit pas contenir trois factures différentes de deux pages chacune. Ceci est particulièrement important pour les ensembles d'évaluation.
Actions de labellisation
Un champ donné peut être labellisé à plusieurs endroits sur la même page.
Labelliser un champ
To select multiple words, select the first word and then Ctrl/Shift+click the rest of the desired words or select an entire area by dragging the mouse (the rubber banding) over it.
To unselect certain text boxes from your selection, while Ctrl/Shift is pressed, select or rubber band the unwanted text boxes again.
Lorsque votre sélection est précise, appuyez sur la touche de raccourci pour labelliser le champ.
Label a multivalued field
Assurez-vous que l’option à plusieurs valeurs du champ est sélectionnée.
Sélectionnez le premier lot d’informations et appuyez sur la touche de raccourci pour étiqueter le champ.
Répétez les étapes précédentes jusqu'à ce que toutes les valeurs du champ à plusieurs valeurs soient étiquetées.
A multivalued field displays two values in its collapsed state and all values it its expanded state. Select the expand arrow from the multivalued field to expand and visualize the list of all tagged values.
Supprimer un libellé
Select text boxes, then press the Delete or the Backspace key on your keyboard.
Grouper une ligne de tableau
After you have labelled some Column fields, and only if some rows span multiple lines of text, then you may group them together by pressing the / key to indicate that they are part of the same table row. A green box appears around the group.
Lorsqu’un champ de colonne labellisé est regroupé, la table est analysée et affichée en haut, mettant en surbrillance les données extraites.
Dissocier une ligne de tableau
Select the group and press the / key again.
Autres options
Sélectionner un libellé
Utilisez les boutons gauche ou droit de la souris pour sélectionner une case ou pour obtenir plus d’informations à son sujet.
- Clic gauche - sélectionne la case
- Clic droit - Sélectionne la case et affiche des informations sur le texte OCR et le libellé actuel.
Navigation dans le document
- Alt + Flèche gauche/Flèche droite : permet de naviguer entre les documents.
Mise à l’échelle du document
- Ctrl + Défilement - Modifie la mise à l’échelle du document en effectuant un zoom avant ou arrière.
Supprime ou récupère un document.
- Alt + Supprimer - Supprime un document.
- Alt + Supprimer - Récupère un document supprimé.
- Champs qui apparaissent plusieurs fois sur le même document
- Labellisation de plusieurs utilisateurs en parallèle
- Labellisation pour l'entraînement
- Labellisation pour évaluation
- Actions de labellisation
- Labelliser un champ
- Label a multivalued field
- Supprimer un libellé
- Grouper une ligne de tableau
- Dissocier une ligne de tableau
- Autres options