- Vue d'ensemble (Overview)
- Démarrage
- Créer des modèles
- Utiliser des modèles
- Détails du modèle
- Points de terminaison publics
- 1040 – Type de document
- 1040 Annexe C – Type de document
- 1040 Annexe D – Type de document
- 1040 Annexe E – Type de document
- 1040x – Type de document
- 3949a - Type de document
- 4506T – Type de document
- 709 – Type de document
- 941x – Type de document
- 9465 – Type de document
- ACORD125 – Type de document
- ACORD126 – Type de document
- ACORD131 – Type de document
- ACORD140 – Type de document
- ACORD25 – Type de document
- Relevés bancaires – Type de document
- Connaissements - Type de document
- Certificat d’incorporation – Type de document
- Certificat d’origine – Type de document
- Vérifications – Type de document
- Certificat de produit pour enfants - Type de document
- CMS 1500 – Type de document
- Déclaration de Conformité UE – Type de document
- Comptes annuels – Type de document
- FM1003 – Type de document
- I9 – Type de document
- Cartes d’identité – Type de document
- Factures – Type de document
- Factures2 : type de document
- Factures Australie – Type de document
- Factures Chine – Type de document
- Factures hébraïques – Type de document
- Factures Inde – Type de document
- Factures Japon – Type de document
- Envoi de factures – Type de document
- Liste de colisage – Type de document
- Bulletins de paie – Type de document
- Passeports – Type de document
- Bons de commande – Type de document
- Reçus – Type de document
- Reçus2 : type de document
- Reçus Japon – Type de document
- Avis de versement – Type de document
- UB04 – Type de document
- Déclaration de clôture de prêt hypothécaire aux États-Unis◊ : type de document
- Factures de services publics – Type de document
- Cartes grises – Type de document
- W2 – Type de document
- W9 – Type de document
- Langues prises en charge
- Tableaux de bord Insights.
- Document Understanding déployé dans Automation Suite
- Journalisation
- Logique d’attribution de licences et de charge
- Comment
- Résolution des problèmes

Document Understanding modern projects user guide
Migrer des projets classiques
Suivez les instructions détaillées sur cette page pour migrer un projet basé sur AI Center. La migration d’un projet contient deux étapes principales :
- Exportez l’ensemble de données du projet basé sur AI Center.
- Importez le jeu de données dans le projet moderne.
Limites actuelles
- Il n’est actuellement pas possible d’importer des ensembles de données de plus de 3000 pages. Seules les 3000 pages initiales seront importées avec succès, tandis que les pages supplémentaires échoueront. Par exemple, si votre ensemble de données se compose de 2999 pages et que vous essayez d’importer un document de 4 pages, le processus échouera.
- Les noms de lot et les résultats de lot correspondants ne sont pas disponibles actuellement. Si vos données sont organisées en lots, ces informations ne s’afficheront pas pour le moment, mais elles seront enregistrées.
- Les exportations depuis AI Center ne sont pas prises en charge. Seules les exportations depuis Document Manager sont prises en charge.
Exporter un jeu de données à partir d’un projet basé sur AI Center
-
Open AI Center and navigate to the Data Labeling page.
-
Select the Data Labeling Session you want to migrate.

-
Once Document Manager is open, from the Filter documents drop-down list, select Training and validation set.
Figure 1. Training and validation set

-
Sélectionnez Exporter (Export).
-
Leave Current search results selected and fill in a name for your export job.
-
Select Download.
Figure 2. Download export

Importer un jeu de données
-
Accédez au projet dans lequel vous souhaitez importer des données et ouvrez celui-ci.
-
Select Add document type and create a new custom document type.
Figure 3. Add document type

-
On the new custom document type, select Upload and choose the zip file of the classic project you exported. Wait for the upload to finish.
Remarque :Les exportations depuis AI Center ne sont pas prises en charge. Seules les exportations depuis Document Manager sont prises en charge.
Figure 4. Upload processing

Une fois le chargement terminé, les documents sont disponibles pour l’entraînement.
Entraînement de modèle
Once the dataset is imported, the model training starts. After the training is complete, the model score is displayed. To check detailed model scores, select the score, and then Detailed model scores.

This action takes you to the Measure page where you can access detailed model metrics.
Lorsque le même ensemble de données est utilisé pour entraîner deux fois un apprentissage automatique, il est possible que les mesures du modèle soient légèrement différentes. Cela peut se produire pour plusieurs raisons :
- Initialization: Machine learning uses optimization methods that need initial guesses to trigger the optimization algorithms. Different initial guesses during each training could lead to various outcomes due to the unpredictable nature of these algorithms.
- Random state: Some algorithms use randomness in their operations. For instance, when training a neural network, procedures like stochastic gradient descent and mini-batch gradient descent introduce randomness. Therefore, even with identical initial model parameters and datasets, the performance of models may vary in different runs.
- Regularization: Certain algorithms include a penalty term that encourages the model to maintain smaller weights. Due to the randomness involved, the model could operate with a different weight set each time.
Cependant, il est essentiel de noter que ces différences mineures n’impliquent pas nécessairement qu’un modèle soit supérieur ou inférieur à un autre. Même avec des mesures légèrement différentes, la capacité des modèles à identifier les données reste plus ou moins la même, à condition que ces différences ne soient pas radicales. Par ailleurs, le fait de répéter ce processus plusieurs fois et de se fonder sur une moyenne devrait conduire à des indicateurs de performances similaires.
Modifier le modèle de base dans le gestionnaire de type de document
S'il existe une différence importante entre les résultats du modèle de votre projet classique et ceux du projet moderne, il est possible que le modèle de base soit différent. Pour modifier le modèle de base, procédez comme suit :
-
Select the three-dot menu from your custom document type and choose Document type manager.

-
Navigate to the Settings tab.
-
Select the desired model from the Base model drop-down list.

-
After making your selection, select Save. To exit, select Back.
Types d’exportation
For classic projects, there are various methods for exporting data. Not all types of exported data are compatible for importing into modern projects. To compare the model results across both project types,filter documents by Training and validation set and select Choose search results to export the dataset. For more information on each option, check the following table.
| Type d’exportation | Données exportées | Comment sont utilisées les données importées |
|---|---|---|
| Résultats de la recherche actuelle | Exports the current filtered dataset. Use it together with the Training and validation set filter. | Documents tagged as training are used to train the model. Documents tagged as validation are used to measure the model performance. Tip: To compare model results between two project types, always export and import the dataset as Train and validation . |
| Tous les éléments étiquetés | Exporte tous les documents annotés du jeu de données :
|
|
| Schéma | Exporte la liste de champs ainsi que leurs paramètres respectifs. | Un schéma sera importé lorsqu’aucun schéma n’est présent. Si un schéma a été déjà défini, l’importation échouera. |
| Tout (All) | Exporte tous les documents annotés et non annotés. |
|
Importer des schémas
Vous pouvez importer des schémas ainsi que des jeux de données dans les projets modernes. Suivez ces étapes afin d’importer un schéma :
- Create a custom document type in the Build section.
- Importez le fichier zip qui contient le schéma.
- Les importations de schémas sont limitées aux types de documents personnalisés dépourvus de schéma préexistant.
- Si vous importez un schéma dans un type de document qui en contient déjà un, l’importation échouera.