- Vue d'ensemble (Overview)
- Démarrage
- Créer des modèles
- Utiliser des modèles
- Détails du modèle
- Points de terminaison publics
- 1040 – Type de document
- 1040 Annexe C – Type de document
- 1040 Annexe D – Type de document
- 1040 Annexe E – Type de document
- 1040x – Type de document
- 3949a - Type de document
- 4506T – Type de document
- 709 – Type de document
- 941x – Type de document
- 9465 – Type de document
- ACORD125 – Type de document
- ACORD126 – Type de document
- ACORD131 – Type de document
- ACORD140 – Type de document
- ACORD25 – Type de document
- Relevés bancaires – Type de document
- Connaissements - Type de document
- Certificat d’incorporation – Type de document
- Certificat d’origine – Type de document
- Vérifications – Type de document
- Certificat de produit pour enfants - Type de document
- CMS 1500 – Type de document
- Déclaration de Conformité UE – Type de document
- Comptes annuels – Type de document
- FM1003 – Type de document
- I9 – Type de document
- Cartes d’identité – Type de document
- Factures – Type de document
- Factures2 : type de document
- Factures Australie – Type de document
- Factures Chine – Type de document
- Factures hébraïques – Type de document
- Factures Inde – Type de document
- Factures Japon – Type de document
- Envoi de factures – Type de document
- Liste de colisage – Type de document
- Bulletins de paie – Type de document
- Passeports – Type de document
- Bons de commande – Type de document
- Reçus – Type de document
- Reçus2 : type de document
- Reçus Japon – Type de document
- Avis de versement – Type de document
- UB04 – Type de document
- Déclaration de clôture de prêt hypothécaire aux États-Unis◊ : type de document
- Factures de services publics – Type de document
- Cartes grises – Type de document
- W2 – Type de document
- W9 – Type de document
- Langues prises en charge
- Tableaux de bord Insights.
- Document Understanding déployé dans Automation Suite
- Journalisation
- Logique d’attribution de licences et de charge
- Comment
- Résolution des problèmes

Document Understanding modern projects user guide
Construire
Cette section propose les expériences suivantes :
- Charger des documents et les classer automatiquement.
- Charger des documents directement dans des types de documents.
- Gérer les fichiers à partir du projet (ajouter, supprimer des fichiers).
- Annoter des documents.
- Ajouter ou supprimer des champs.
- Bénéficier d’une expérience guidée concernant l’entraînement des modèles de classification et d’extraction à l’aide des recommandations.
Annoter des documents
After successfully creating your project and uploading your documents to a specific document type, they are automatically pre-annotated. This is done using specialized models, based on the document type's schema. The schema clearly defines the fields you want to extract from a particular document type. To find the document type's schema, go to the Annotation page and check the Fields section.

For more in-depth information on how to annotate your documents, check the Annotate documents how-to page.
Exceptions pour révision
Vous pouvez utiliser des documents qui ont été validés dans la Station de validation pour améliorer encore les performances de vos modèles.
If there are any changes after the validation step, the Exceptions for review button is displayed for the impacted document type.
Figure 1. Exceptions for review button

For more in-depth information on how to retrain your models, check the Retrain extractors how-to page.
Modifier les paramètres des champs
You can edit the settings for multiple fields from Document type manager.
To get to there, select the three-dot icon ⋮ next to the document type you want to edit and select Document type manager from the menu.
Figure 2. Select Document type manager

Modifier et ajouter de nouveaux champs
To add a new field, select Add field and fill in the needed information. You can add or edit the following options for each field:
-
Field name: the unique name for the field.
-
Content type: the content type of the field:
- String: used for company names or addresses, as well as payment terms, or for any other field where you want to build the parsing or formatting logic manually, in the RPA workflow.
- Number: used for amounts or quantities, with intelligent parsing of the decimal/thousands separators.
- Date: parse, format and unify the output using the YYYY-MM-DD format.
- Phone: use for phone number. Formatting removes letters and parentheses, and replaces spaces with dashes.
- ID Number: used for alphanumeric codes, numbers of IDs. It's similar to the string content type, but removes any characters coming before the
:character. If the Id number you need to extract can contain:characters, usestringcontent type instead to avoid data loss.
-
Shortcut: the shortcut key for the field. One key or a combination of two keys is allowed.
-
Advanced settings: the available options differ depending on the Content type of the selected field. Select the Advanced settings button for the desired field to edit: Figure 3. Document type advanced settings

- Field ID: the unique id for the field.
- Post processing:
- first_span: if the model predicts more than one instance of a field in a document, make it return the first one.
- longest_value: if the model predicts more than one instance of a field in a document, make it return the value consisting of the largest number of characters.
- highest_confidence: if the model predicts more than one instance of a field in a document, make it return the value with the highest confidence.Scoring: the measure used to determine the accuracy when running evaluations of model predictions is only available for fields with content type String:
- exact_match: prediction will only be deemed to be correct (score of 1) if it exactly matches the true value. If it differs by even a single character, then it is deemed to be incorrect (score of 0). This is the default setting for all fields except for String fields.
- levenshtein: prediction will be deemed to be partially correct according to the Levenshtein distance between the prediction and the true value. For example, if a 10 letter value is predicted correctly except for the last 2 characters, then the score of that prediction is be 0.8.
- Date format: this field is only available for fields with content type Date and it indicates how ambiguous dates are parsed and returned:
- Auto
- US style: YYYY-DD-MM
- Non-US style: YYYY-MM-DD
- Multi-line: fields which span multiple text lines (addresses or descriptions) need to have this checked, otherwise only the first line is returned.
- Multi-value: field returns a list with all the values detected in the document.
Les modifications apportées aux paramètres de type de document ne seront pas reflétées dans la nouvelle version du projet lorsque vous publiez une nouvelle version du projet avant qu’un nouvel entraînement soit déclenché.
Workaround: To avoid this, retrain the document type after making modifications to the document type fields. You can do this by tagging or confirming additional documents for that type before publishing a new version.
Paramètres du modèle
You can change the document type settings from the Model settings view. To do so, select Model settings.
Figure 4. Model settings

Vous pouvez modifier les paramètres suivants :
- Base model: Dataset size estimations used in the Recommended Actions depend on the base model used to train. Using the most similar base model to your Document Type will reduce the amount of annotation work required.
- Number of languages: Dataset size estimation used in the Recommended Actions depend on the number of languages in the dataset. More languages generally require annotating more data.
Rechercher des noms de champ
You can search through the available field names. To do so, use the search bar from the top left corner of the Document type manager interface. For a more efficient search, use the Filter feature to filter by Content type.
Figure 5. Search field names

Supprimer les champs
Select the Delete next to the field you want to delete.
Figure 6. Delete a field

You can also select several (or all) fields and delete them at once. To do so, select the check mark next to the fields you want to delete and then click Delete.
Figure 7. Delete several fields at once

Champs de classification
Les champs de classification sont des points de données qui font référence à un document dans son ensemble. Par exemple, le type de dépense d’un reçu (nourriture, hôtel, billet d’avion ou transport) ou la devise d’une facture (USD, EUR, JPY) sont des champs de classification.
Les limitations suivantes s’appliquent actuellement à la fonctionnalité Champs de classification :
- Lorsque vous utilisez l’activité Extraire les données du document, les champs de classification sont pris en charge pour les extracteurs de projets modernes et les modèles prêts à l’emploi, mais pas pour les extracteurs de projets classiques.
- Les champs de classification sont extraits des types de documents personnalisés uniquement après une formation réussie.
Modifier ou ajouter des champs de classification
To add a new classification field, select Add field and type in a name for the new field.
Cette vue vous permet également de réorganiser les champs.
To check the classification field ID, select Advanced settings next to the needed classification field.
Modifier ou ajouter des classes
To add a new class for a classification field, select Add class and type in a class name and an optional description.
Each classification field must contain at least two classes.
Vous pouvez modifier le nom et la description de chaque classe.
Vous pouvez également réorganiser les classes à partir de cette vue.
To remove a class, select Delete next to the class you want to remove.
Rechercher des documents
You can search uploaded documents by document name. To do so, use the search bar from the left corner of the Build section. For a more efficient search, use the Filter feature to filter by:
- Type de document : choisissez le type de document souhaité dans la liste déroulante.
- Date de chargement : choisissez un intervalle de dates de chargement du document.
- Statut : choisissez le statut du document.
- Balise : choisissez les balises que vous souhaitez filtrer.
Figure 8. Filter documents

Score du projet et du modèle
You can check your project's overall score from the top right corner. This score factors in the classifier and extractor scores for all document types. Select Project score to display the Measure section. You can check more in-depth performance measurements in that section.
Vous pouvez vérifier le score de chaque type de document séparément à partir de la section Type de document. Ce score prend en compte les performances globales du modèle, ainsi que la taille et la qualité de l’ensemble de données.
You need to upload at least 10 documents to get a project score. For a document type score, you need at least 10 documents under the same document type.

Vous pouvez vérifier la notation de modèle pour vos modèles si vous sélectionnez la balise de score. La notation de modèle est une fonctionnalité destinée à vous aider à visualiser les performances d’un modèle de classification. Elle est exprimée sous la forme d’un score de modèle compris entre 0 et 100 :
- Faible (0-49)
- Moyen (50-69)
- Bon (70-89)
- Excellent (90-100)
Select Detailed model scores to go to the Measure section for detailed information.
