- Vue d'ensemble (Overview)
- Démarrage
- Créer des modèles
- Utiliser des modèles
- Détails du modèle
- Points de terminaison publics pour Automation Cloud et Test Cloud
- Points de terminaison publics pour Automation Cloud et Test Cloud pour le secteur public
- 1040 – Type de document
- 1040 Annexe C – Type de document
- 1040 Annexe D – Type de document
- 1040 Annexe E – Type de document
- 1040x – Type de document
- 3949a - Type de document
- 4506T – Type de document
- 709 – Type de document
- 941x – Type de document
- 9465 – Type de document
- ACORD125 – Type de document
- ACORD126 – Type de document
- ACORD131 – Type de document
- ACORD140 – Type de document
- ACORD25 – Type de document
- Relevés bancaires – Type de document
- Connaissements - Type de document
- Certificat d’incorporation – Type de document
- Certificat d’origine – Type de document
- Vérifications – Type de document
- Certificat de produit pour enfants - Type de document
- CMS 1500 – Type de document
- Déclaration de Conformité UE – Type de document
- Comptes annuels – Type de document
- FM1003 – Type de document
- I9 – Type de document
- Cartes d’identité – Type de document
- Factures – Type de document
- Factures2 : type de document
- Factures Australie – Type de document
- Factures Chine – Type de document
- Factures hébraïques – Type de document
- Factures Inde – Type de document
- Factures Japon – Type de document
- Envoi de factures – Type de document
- Liste de colisage – Type de document
- Bulletins de paie – Type de document
- Passeports – Type de document
- Bons de commande – Type de document
- Reçus – Type de document
- Reçus2 : type de document
- Reçus Japon – Type de document
- Avis de versement – Type de document
- UB04 – Type de document
- Déclaration de clôture de prêt hypothécaire aux États-Unis◊ : type de document
- Factures de services publics – Type de document
- Cartes grises – Type de document
- W2 – Type de document
- W9 – Type de document
- Langues prises en charge
- Tableaux de bord Insights.
- Données et sécurité
- Journalisation
- Licences
- Comment
- Résolution des problèmes

Guide de l'utilisateur de Document Understanding
Migrer des projets classiques
Suivez les instructions détaillées sur cette page afin de migrer un projet classique ou un projet basé sur AI Center. La migration d’un projet comporte deux étapes principales :
- Exportez l’ensemble de données du projet classique ou du projet basé sur AI Center.
- Importez le jeu de données dans le projet moderne.
Limites actuelles
- Actuellement, l’importation d’ensembles de données de plus de 5 000 pages n’est pas prise en charge. Seules les 5 000 pages initiales seront importées avec succès tandis que les pages supplémentaires échoueront.Par exemple, si votre ensemble de données se compose de 4 999 pages et que vous essayez d'importer un document de 4 pages, le processus échouera.
- Les noms de lot et les résultats de lot correspondants ne sont pas disponibles actuellement. Si vos données sont organisées en lots, ces informations ne s’afficheront pas pour le moment, mais elles seront enregistrées.
- Les exportations depuis AI Center ne sont pas prises en charge. Seules les exportations depuis Document Manager sont prises en charge.
Exporter un jeu de données à partir d’un projet classique
- Accédez au projet classique que vous souhaitez migrer et ouvrez-le.
- Accédez au type de document que vous souhaitez exporter et sélectionnez Ouvrir le type de document.
Graphique 1. Ouvrir le type de document

- Dans la liste déroulante Filtrer les documents, sélectionnez Ensemble d’entraînement et de validation.
Figure 2. Ensemble d’entraînement et de validation.

- Sélectionnez Exporter (Export).
- Laissez sélectionnés les Résultats de la recherche actuelle et saisissez le nom de votre tâche d’exportation.
- Select Download.
Image 3. Exportation des téléchargements

Exporter un jeu de données à partir d’un projet basé sur AI Center
-
Ouvrez AI Center et accédez à la page Labellisation des données.
-
Sélectionnez la session de labellisation des données que vous souhaitez migrer.

-
Une fois Document Manager ouvert, dans la liste déroulante Filtrer les documents, sélectionnez Ensemble d’entraînement et de validation.
Image 4. Ensemble d’entraînement et de validation

- Sélectionnez Exporter (Export).
- Laissez sélectionnés les Résultats de la recherche actuelle et saisissez le nom de votre tâche d’exportation.
- Select Download.
Image 5. Télécharger l’exportation

Importer un jeu de données
- Accédez au projet dans lequel vous souhaitez importer des données et ouvrez celui-ci.
- Sélectionnez Ajouter un type de document et créez un nouveau type de document personnalisé.
Image 6. Ajouter un type de document

- Dans le nouveau type de document personnalisé, sélectionnez Charger et choisissez le fichier zip du projet classique que vous avez exporté. Attendez la fin du téléchargement.
Remarque :
Les exportations depuis AI Center ne sont pas prises en charge. Seules les exportations depuis Document Manager sont prises en charge.
Image 7. Traitement des chargements

Une fois le chargement terminé, les documents sont disponibles pour l’entraînement.
Entraînement de modèle
Une fois le jeu de données importé, l’entraînement du modèle démarre. Une fois l’entraînement terminé, le score du modèle s’affiche. Pour vérifier les scores de modèle détaillés, sélectionnez le score, puis Scores de modèle détaillés.

Cette action vous mène à la page Mesure, sur laquelle vous pouvez accéder aux métriques détaillées du modèle.
Lorsque le même ensemble de données est utilisé pour entraîner deux fois un apprentissage automatique, il est possible que les mesures du modèle soient légèrement différentes. Cela peut se produire pour plusieurs raisons :
- Initialisation : l’apprentissage automatique utilise des méthodes d’optimisation ayant besoin d’hypothèses initiales pour déclencher les algorithmes d’optimisation. Des hypothèses initiales différentes lors de chaque entraînement peuvent conduire à des résultats différents en raison de la nature imprévisible de ces algorithmes.
- État aléatoire : certains algorithmes utilisent des éléments aléatoires dans leurs opérations. Par exemple, lors de l’entraînement d’un réseau neuronal, des procédures telles que l’algorithme du gradient stochastique et al descente de gradient stochastique par mini-lots intègrent des éléments aléatoires. Par conséquent, même avec des paramètres de modèle initiaux et des ensembles de données identiques, les performances des modèles peuvent varier d’une exécution à l’autre.
- Régularisation : certains algorithmes incluent un condition de pénalité qui encourage le modèle à conserver des pondérations plus faibles. En raison du caractère aléatoire que cela implique, le modèle peut s’exécuter avec un ensemble de pondérations différent à chaque fois.
Cependant, il est essentiel de noter que ces différences mineures n’impliquent pas nécessairement qu’un modèle soit supérieur ou inférieur à un autre. Même avec des mesures légèrement différentes, la capacité des modèles à identifier les données reste plus ou moins la même, à condition que ces différences ne soient pas radicales. Par ailleurs, le fait de répéter ce processus plusieurs fois et de se fonder sur une moyenne devrait conduire à des indicateurs de performances similaires.
Modifier le modèle de base dans le gestionnaire de type de document
S'il existe une différence importante entre les résultats du modèle de votre projet classique et ceux du projet moderne, il est possible que le modèle de base soit différent. Pour modifier le modèle de base, procédez comme suit :
-
Sélectionnez le menu à trois points dans votre type de document personnalisé et sélectionnez Gestionnaire de type de document (Document type manager).

-
Accédez à l’onglet Paramètres (Settings).
-
Sélectionnez le modèle souhaité dans la liste déroulante Modèle de base (Base model).

-
Après avoir fait votre sélection, cliquez sur Enregistrer (Save). Pour quitter, sélectionnez Retour (Back).
Types d’exportation
Pour les projets classiques, il existe différentes méthodes afin d’exporter les données. Tous les types de données exportées ne sont pas compatibles pour une importation dans des projets modernes. Pour comparer les résultats du modèle entre les deux types de projets, filtrez les documents par Ensemble d’entraînement et de validation et sélectionnez Choisir les résultats de recherche pour exporter le jeu de données. Pour plus d’informations sur chaque modèle, consultez le tableau suivant :
| Type d’exportation | Données exportées | Comment sont utilisées les données importées |
|---|---|---|
| Résultats de la recherche actuelle | Exporte le jeu de données filtré actuel. Utilisez-le conjointement à un filtre Ensemble d’entraînement et de validation. | Les documents auxquels la balise entraînement est associée sont utilisés afin d’entraîner le modèle. Les documents auxquels la balise validation est associée, quant à eux, sont utilisés afin de mesurer les performances du modèle. Astuce : pour comparer les résultats du modèle d’un type de projet à un autre, exportez et importez toujours le jeu de données en tant qu ’ entraînement et validation . |
| Tous les éléments étiquetés | Exporte tous les documents annotés du jeu de données :
|
|
| Schéma | Exporte la liste de champs ainsi que leurs paramètres respectifs. | Un schéma sera importé lorsqu’aucun schéma n’est présent. Si un schéma a été déjà défini, l’importation échouera. |
| Tout (All) | Exporte tous les documents annotés et non annotés. |
|
Importer des schémas
Vous pouvez importer des schémas ainsi que des jeux de données dans les projets modernes. Suivez ces étapes afin d’importer un schéma :
- Créez un type de document personnalisé dans la section Construire (Build).
- Importez le fichier zip qui contient le schéma.
Remarque :
- Les importations de schémas sont limitées aux types de documents personnalisés dépourvus de schéma préexistant.
- Si vous importez un schéma dans un type de document qui en contient déjà un, l’importation échouera.
Migrer le workflow d'automatisation
La migration d’un projet DU classique vers un projet moderne dans votre automatisation RPA nécessite une seule modification : remplacez l’ activité Extracteur ML dans l’ activité Étendue de l’extraction de données par un extracteur de projet Document Understanding. Aucune autre activité ne doit changer : les activités de numérisation, de validation et d’entraînement restent les mêmes.
Si votre workflow utilise la classification de documents, remplacez également le classifieur existant par un classifieur de projet Document Understanding. Voir Migrer la classification ci-dessous.
Remplacer l'activité d'extraction ML
- Dans votre projet Studio, ouvrez l'activité Étendue de l'extraction de données .
- Supprimer l' activité d'extracteur ML existante.
- Ajoutez un extracteur de projet Document Understanding à l’intérieur de l’ activité Étendue de l’extraction de données.
- Sélectionnez Obtenir ou actualiser les capacités de l’extracteur pour ouvrir l’assistant de configuration.
- Sous Informations d’identification de la phase de conception, saisissez votre ID d'application, la clé secrète de l'application, et l' URL du locataire.
- Sélectionnez Obtenir les projets pour charger la liste des projets modernes disponibles.
- Pour Projet, sélectionnez le projet moderne de votre choix dans la liste déroulante.
- Pour Version, sélectionnez une version déployée du projet. Vous pouvez également sélectionner une balise liée à une version spécifique. La version et la balise s’excluent mutuellement.
- Sélectionnez Obtenir des capacités.
- Assurez-vous que l'option Mettre à jour les arguments d'activité est cochée.
Si vous vous connectez à un projet dans un autre locataire, configurez les propriétés d ' authentification de l'activité afin qu'elles correspondent aux informations d'identification utilisées dans l'assistant.
Pour plus de détails sur la configuration, consultez Extracteur de projet Document Understanding.
Migrer la classification
Si votre automatisation utilise la classification de documents, remplacez le classifieur existant par un classifieur de projet Document Understanding à l'intérieur de l' activité Classer l'étendue du document. Les étapes de configuration reflètent celles de l'extracteur : ouvrez l' assistant de configuration des classifieurs, saisissez vos informations d'identification pour la phase de conception, sélectionnez votre projet et votre version ou balise, puis sélectionnez Obtenir des capacités.
Pour plus de détails sur la configuration, consultez Classifieur de projet Document Understanding.
- Limites actuelles
- Exporter un jeu de données à partir d’un projet classique
- Exporter un jeu de données à partir d’un projet basé sur AI Center
- Importer un jeu de données
- Entraînement de modèle
- Modifier le modèle de base dans le gestionnaire de type de document
- Types d’exportation
- Importer des schémas
- Migrer le workflow d'automatisation
- Remplacer l'activité d'extraction ML
- Migrer la classification