- Vue d'ensemble (Overview)
- Démarrage
- Créer des modèles
- Utiliser des modèles
- Détails du modèle
- Points de terminaison publics
- 1040 – Type de document
- 1040 Annexe C – Type de document
- 1040 Annexe D – Type de document
- 1040 Annexe E – Type de document
- 1040x – Type de document
- 3949a - Type de document
- 4506T – Type de document
- 709 – Type de document
- 941x – Type de document
- 9465 – Type de document
- ACORD125 – Type de document
- ACORD126 – Type de document
- ACORD131 – Type de document
- ACORD140 – Type de document
- ACORD25 – Type de document
- Relevés bancaires – Type de document
- Connaissements - Type de document
- Certificat d’incorporation – Type de document
- Certificat d’origine – Type de document
- Vérifications – Type de document
- Certificat de produit pour enfants - Type de document
- CMS 1500 – Type de document
- Déclaration de Conformité UE – Type de document
- Comptes annuels – Type de document
- FM1003 – Type de document
- I9 – Type de document
- Cartes d’identité – Type de document
- Factures – Type de document
- Factures2 : type de document
- Factures Australie – Type de document
- Factures Chine – Type de document
- Factures hébraïques – Type de document
- Factures Inde – Type de document
- Factures Japon – Type de document
- Envoi de factures – Type de document
- Liste de colisage – Type de document
- Bulletins de paie – Type de document
- Passeports – Type de document
- Bons de commande – Type de document
- Reçus – Type de document
- Reçus2 : type de document
- Reçus Japon – Type de document
- Avis de versement – Type de document
- UB04 – Type de document
- Déclaration de clôture de prêt hypothécaire aux États-Unis◊ : type de document
- Factures de services publics – Type de document
- Cartes grises – Type de document
- W2 – Type de document
- W9 – Type de document
- Langues prises en charge
- Tableaux de bord Insights.
- Document Understanding déployé dans Automation Suite
- Journalisation
- Logique d’attribution de licences et de charge
- Comment
- Résolution des problèmes

Document Understanding modern projects user guide
Migrer des projets classiques
Suivez les instructions détaillées sur cette page pour migrer un projet basé sur AI Center. La migration d’un projet contient deux étapes principales :
- Exportez l’ensemble de données du projet basé sur AI Center.
- Importez le jeu de données dans le projet moderne.
Limites actuelles
- Il n’est actuellement pas possible d’importer des ensembles de données de plus de 3000 pages. Seules les 3000 pages initiales seront importées avec succès, tandis que les pages supplémentaires échoueront. Par exemple, si votre ensemble de données se compose de 2999 pages et que vous essayez d’importer un document de 4 pages, le processus échouera.
- Les noms de lot et les résultats de lot correspondants ne sont pas disponibles actuellement. Si vos données sont organisées en lots, ces informations ne s’afficheront pas pour le moment, mais elles seront enregistrées.
- Les exportations depuis AI Center ne sont pas prises en charge. Seules les exportations depuis Document Manager sont prises en charge.
Exporter un jeu de données à partir d’un projet basé sur AI Center
-
Ouvrez AI Center et accédez à la page Labellisation des données.
-
Select the Data Labeling Session you want to migrate.

-
Une fois Document Manager ouvert, dans la liste déroulante Filtrer les documents, sélectionnez Ensemble d’entraînement et de validation.
Graphique 1. Ensemble d’entraînement et de validation

-
Sélectionnez Exporter (Export).
-
Laissez sélectionnés les Résultats de la recherche actuelle et saisissez le nom de votre tâche d’exportation.
-
Select Download.
Image 2. Exportation des téléchargements

Importer un jeu de données
-
Accédez au projet dans lequel vous souhaitez importer des données et ouvrez celui-ci.
-
Sélectionnez Ajouter un type de document et créez un nouveau type de document personnalisé.
Image 3. Ajout d’un type de document

-
Dans le nouveau type de document personnalisé, sélectionnez Charger et choisissez le fichier zip du projet classique que vous avez exporté. Attendez la fin du téléchargement.
Remarque :Les exportations depuis AI Center ne sont pas prises en charge. Seules les exportations depuis Document Manager sont prises en charge.
Image 4. Traitement des chargements

Une fois le chargement terminé, les documents sont disponibles pour l’entraînement.
Entraînement de modèle
Une fois le jeu de données importé, l’entraînement du modèle démarre. Une fois l’entraînement terminé, le score du modèle s’affiche. Pour vérifier les scores de modèle détaillés, sélectionnez le score, puis Scores de modèle détaillés.

Cette action vous mène à la page Mesure, sur laquelle vous pouvez accéder aux métriques détaillées du modèle.
Lorsque le même ensemble de données est utilisé pour entraîner deux fois un apprentissage automatique, il est possible que les mesures du modèle soient légèrement différentes. Cela peut se produire pour plusieurs raisons :
- Initialisation : l’apprentissage automatique utilise des méthodes d’optimisation ayant besoin d’hypothèses initiales pour déclencher les algorithmes d’optimisation. Des hypothèses initiales différentes lors de chaque entraînement peuvent conduire à des résultats différents en raison de la nature imprévisible de ces algorithmes.
- État aléatoire : certains algorithmes utilisent des éléments aléatoires dans leurs opérations. Par exemple, lors de l’entraînement d’un réseau neuronal, des procédures telles que l’algorithme du gradient stochastique et al descente de gradient stochastique par mini-lots intègrent des éléments aléatoires. Par conséquent, même avec des paramètres de modèle initiaux et des ensembles de données identiques, les performances des modèles peuvent varier d’une exécution à l’autre.
- Régularisation : certains algorithmes incluent un condition de pénalité qui encourage le modèle à conserver des pondérations plus faibles. En raison du caractère aléatoire que cela implique, le modèle peut s’exécuter avec un ensemble de pondérations différent à chaque fois.
Cependant, il est essentiel de noter que ces différences mineures n’impliquent pas nécessairement qu’un modèle soit supérieur ou inférieur à un autre. Même avec des mesures légèrement différentes, la capacité des modèles à identifier les données reste plus ou moins la même, à condition que ces différences ne soient pas radicales. Par ailleurs, le fait de répéter ce processus plusieurs fois et de se fonder sur une moyenne devrait conduire à des indicateurs de performances similaires.
Modifier le modèle de base dans le gestionnaire de type de document
S'il existe une différence importante entre les résultats du modèle de votre projet classique et ceux du projet moderne, il est possible que le modèle de base soit différent. Pour modifier le modèle de base, procédez comme suit :
-
Sélectionnez le menu à trois points dans votre type de document personnalisé et sélectionnez Gestionnaire de type de document (Document type manager).

-
Accédez à l’onglet Paramètres (Settings).
-
Sélectionnez le modèle souhaité dans la liste déroulante Modèle de base (Base model).

-
Après avoir fait votre sélection, cliquez sur Enregistrer (Save). Pour quitter, sélectionnez Retour (Back).
Types d’exportation
Pour les projets classiques, il existe différentes méthodes afin d’exporter les données. Tous les types de données exportées ne sont pas compatibles pour une importation dans des projets modernes. Pour comparer les résultats du modèle entre les deux types de projets, filtrez les documents par Ensemble d’entraînement et de validation et sélectionnez Choisir les résultats de recherche pour exporter le jeu de données. Pour plus d’informations sur chaque modèle, consultez le tableau suivant :
| Type d’exportation | Données exportées | Comment sont utilisées les données importées |
|---|---|---|
| Résultats de la recherche actuelle | Exporte le jeu de données filtré actuel. Utilisez-le conjointement à un filtre Ensemble d’entraînement et de validation. | Documents tagged as training are used to train the model. Documents tagged as validation are used to measure the model performance. Tip: To compare model results between two project types, always export and import the dataset as Train and validation . |
| Tous les éléments étiquetés | Exporte tous les documents annotés du jeu de données :
|
|
| Schéma | Exporte la liste de champs ainsi que leurs paramètres respectifs. | Un schéma sera importé lorsqu’aucun schéma n’est présent. Si un schéma a été déjà défini, l’importation échouera. |
| Tout (All) | Exporte tous les documents annotés et non annotés. |
|
Importer des schémas
Vous pouvez importer des schémas ainsi que des jeux de données dans les projets modernes. Suivez ces étapes afin d’importer un schéma :
- Créez un type de document personnalisé dans la section Construire (Build).
- Importez le fichier zip qui contient le schéma.
- Les importations de schémas sont limitées aux types de documents personnalisés dépourvus de schéma préexistant.
- Si vous importez un schéma dans un type de document qui en contient déjà un, l’importation échouera.