- Vue d'ensemble (Overview)
- Démarrage
- Créer des modèles
- Utiliser des modèles
- Détails du modèle
- Public endpoints for Automation Cloud and Test Cloud
- Public endpoints for Automation Cloud and Test Cloud Public Sector
- 1040 – Type de document
- 1040 Annexe C – Type de document
- 1040 Annexe D – Type de document
- 1040 Annexe E – Type de document
- 1040x – Type de document
- 3949a - Type de document
- 4506T – Type de document
- 709 – Type de document
- 941x – Type de document
- 9465 – Type de document
- ACORD125 – Type de document
- ACORD126 – Type de document
- ACORD131 – Type de document
- ACORD140 – Type de document
- ACORD25 – Type de document
- Relevés bancaires – Type de document
- Connaissements - Type de document
- Certificat d’incorporation – Type de document
- Certificat d’origine – Type de document
- Vérifications – Type de document
- Certificat de produit pour enfants - Type de document
- CMS 1500 – Type de document
- Déclaration de Conformité UE – Type de document
- Comptes annuels – Type de document
- FM1003 – Type de document
- I9 – Type de document
- Cartes d’identité – Type de document
- Factures – Type de document
- Factures2 : type de document
- Factures Australie – Type de document
- Factures Chine – Type de document
- Factures hébraïques – Type de document
- Factures Inde – Type de document
- Factures Japon – Type de document
- Envoi de factures – Type de document
- Liste de colisage – Type de document
- Bulletins de paie – Type de document
- Passeports – Type de document
- Bons de commande – Type de document
- Reçus – Type de document
- Reçus2 : type de document
- Reçus Japon – Type de document
- Avis de versement – Type de document
- UB04 – Type de document
- Déclaration de clôture de prêt hypothécaire aux États-Unis◊ : type de document
- Factures de services publics – Type de document
- Cartes grises – Type de document
- W2 – Type de document
- W9 – Type de document
- Langues prises en charge
- Tableaux de bord Insights.
- Données et sécurité
- Journalisation
- Licences
- Comment
- Résolution des problèmes

Guide de l'utilisateur de Document Understanding
Migrer des projets classiques
Suivez les instructions détaillées sur cette page afin de migrer un projet classique ou un projet basé sur AI Center. La migration d’un projet comporte deux étapes principales :
- Exportez l’ensemble de données du projet classique ou du projet basé sur AI Center.
- Importez le jeu de données dans le projet moderne.
Limites actuelles
- Currently, importing datasets larger than 5000pages is not supported. Only the initial 5000 pages will be successfully imported, with any additional pages failing to do so. For example, if your dataset consists of 4999 pages and you try to import a document of 4 pages, the process will not succeed.
- Les noms de lot et les résultats de lot correspondants ne sont pas disponibles actuellement. Si vos données sont organisées en lots, ces informations ne s’afficheront pas pour le moment, mais elles seront enregistrées.
- Les exportations depuis AI Center ne sont pas prises en charge. Seules les exportations depuis Document Manager sont prises en charge.
Exporter un jeu de données à partir d’un projet classique
- Accédez au projet classique que vous souhaitez migrer et ouvrez-le.
- Go to the document type you want to export and select Open document type.
Figure 1. Open document type

- From the Filter documents drop-down list, select Training and validation set.
Figure 2. Training and validation set

- Sélectionnez Exporter (Export).
- Leave Current search results selected and fill in a name for your export job.
- Select Download.
Figure 3. Download export

Exporter un jeu de données à partir d’un projet basé sur AI Center
-
Open AI Center and navigate to the Data Labeling page.
-
Select the Data Labeling Session you want to migrate.

-
Once Document Manager is open, from the Filter documents drop-down list, select Training and validation set.
Figure 4. Training and validation set

- Sélectionnez Exporter (Export).
- Leave Current search results selected and fill in a name for your export job.
- Select Download.
Figure 5. Download export

Importer un jeu de données
- Accédez au projet dans lequel vous souhaitez importer des données et ouvrez celui-ci.
- Select Add document type and create a new custom document type.
Figure 6. Add document type

- On the new custom document type, select Upload and choose the zip file of the classic project you exported. Wait for the upload to finish.
Remarque :
Les exportations depuis AI Center ne sont pas prises en charge. Seules les exportations depuis Document Manager sont prises en charge.
Figure 7. Upload processing

Une fois le chargement terminé, les documents sont disponibles pour l’entraînement.
Entraînement de modèle
Once the dataset is imported, the model training starts. After the training is complete, the model score is displayed. To check detailed model scores, select the score, and then Detailed model scores.

This action takes you to the Measure page where you can access detailed model metrics.
Lorsque le même ensemble de données est utilisé pour entraîner deux fois un apprentissage automatique, il est possible que les mesures du modèle soient légèrement différentes. Cela peut se produire pour plusieurs raisons :
- Initialization: Machine learning uses optimization methods that need initial guesses to trigger the optimization algorithms. Different initial guesses during each training could lead to various outcomes due to the unpredictable nature of these algorithms.
- Random state: Some algorithms use randomness in their operations. For instance, when training a neural network, procedures like stochastic gradient descent and mini-batch gradient descent introduce randomness. Therefore, even with identical initial model parameters and datasets, the performance of models may vary in different runs.
- Regularization: Certain algorithms include a penalty term that encourages the model to maintain smaller weights. Due to the randomness involved, the model could operate with a different weight set each time.
Cependant, il est essentiel de noter que ces différences mineures n’impliquent pas nécessairement qu’un modèle soit supérieur ou inférieur à un autre. Même avec des mesures légèrement différentes, la capacité des modèles à identifier les données reste plus ou moins la même, à condition que ces différences ne soient pas radicales. Par ailleurs, le fait de répéter ce processus plusieurs fois et de se fonder sur une moyenne devrait conduire à des indicateurs de performances similaires.
Modifier le modèle de base dans le gestionnaire de type de document
S'il existe une différence importante entre les résultats du modèle de votre projet classique et ceux du projet moderne, il est possible que le modèle de base soit différent. Pour modifier le modèle de base, procédez comme suit :
-
Select the three-dot menu from your custom document type and choose Document type manager.

-
Navigate to the Settings tab.
-
Select the desired model from the Base model drop-down list.

-
After making your selection, select Save. To exit, select Back.
Types d’exportation
For classic projects, there are various methods for exporting data. Not all types of exported data are compatible for importing into modern projects. To compare the model results across both project types,filter documents by Training and validation set and select Choose search results to export the dataset. For more information on each option, check the following table.
| Type d’exportation | Données exportées | Comment sont utilisées les données importées |
|---|---|---|
| Résultats de la recherche actuelle | Exports the current filtered dataset. Use it together with the Training and validation set filter. | Documents tagged as training are used to train the model. Documents tagged as validation are used to measure the model performance. Tip: To compare model results between two project types, always export and import the dataset as Train and validation . |
| Tous les éléments étiquetés | Exporte tous les documents annotés du jeu de données :
|
|
| Schéma | Exporte la liste de champs ainsi que leurs paramètres respectifs. | Un schéma sera importé lorsqu’aucun schéma n’est présent. Si un schéma a été déjà défini, l’importation échouera. |
| Tout (All) | Exporte tous les documents annotés et non annotés. |
|
Importer des schémas
Vous pouvez importer des schémas ainsi que des jeux de données dans les projets modernes. Suivez ces étapes afin d’importer un schéma :
- Create a custom document type in the Build section.
- Importez le fichier zip qui contient le schéma.
Remarque :
- Les importations de schémas sont limitées aux types de documents personnalisés dépourvus de schéma préexistant.
- Si vous importez un schéma dans un type de document qui en contient déjà un, l’importation échouera.
Migrate the automation workflow
Migrating from a classic DU project to a modern one in your RPA automation requires a single change: replace the ML Extractor Activity inside the Data Extraction Scope with a Document Understanding Project Extractor. No other activities need to change — digitization, validation, and training activities remain the same.
If your workflow uses document classification, also replace the existing classifier with a Document Understanding Project Classifier. See Migrate classification below.
Replace the ML Extractor Activity
- In your Studio project, open the Data Extraction Scope activity.
- Remove the existing ML Extractor Activity.
- Add a Document Understanding Project Extractor inside the Data Extraction Scope.
- Select Get or refresh extractor capabilities to open the configuration wizard.
- Under Design time credentials, enter your App Id, App Secret, and Tenant Url.
- Select Get Projects to load the list of available modern projects.
- For Project, select your desired modern project from the dropdown list.
- For Version, select a deployed version of the project. Alternatively, select a Tag linked to a specific version. Version and Tag are mutually exclusive.
- Select Get Capabilities.
- Make sure Update Activity Arguments is checked.
If you connect to a project in a different tenant, configure the Authentication properties of the activity — Runtime Credentials Asset and Runtime Tenant Url — to match the credentials used in the wizard.
For full configuration details, see Document Understanding Project Extractor.
Migrate classification
If your automation uses document classification, replace the existing classifier with a Document Understanding Project Classifier inside the Classify Document Scope. The configuration steps mirror those of the extractor: open the Configure Classifiers Wizard, enter your design time credentials, select your project and version or tag, then select Get Capabilities.
For full configuration details, see Document Understanding Project Classifier.
- Limites actuelles
- Exporter un jeu de données à partir d’un projet classique
- Exporter un jeu de données à partir d’un projet basé sur AI Center
- Importer un jeu de données
- Entraînement de modèle
- Modifier le modèle de base dans le gestionnaire de type de document
- Types d’exportation
- Importer des schémas
- Migrate the automation workflow
- Replace the ML Extractor Activity
- Migrate classification