document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white
Document Understanding Modern Projects User Guide
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 11 nov. 2024

Migrer des projets classiques

Use the instructions from this page to migrate a a project based on AI Center. There are two main steps in migrating a project:
  1. Export the dataset from the project based on AI Center.
  2. Importez le jeu de données dans le projet moderne.

Limites actuelles

  • Il n’est actuellement pas possible d’importer des ensembles de données de plus de 3000 pages. Seules les 3000 pages initiales seront importées avec succès, tandis que les pages supplémentaires échoueront. Par exemple, si votre ensemble de données se compose de 2999 pages et que vous essayez d’importer un document de 4 pages, le processus échouera.
  • Les noms de lot et les résultats de lot correspondants ne sont pas disponibles actuellement. Si vos données sont organisées en lots, ces informations ne s’afficheront pas pour le moment, mais elles seront enregistrées.

Exporter un jeu de données à partir d’un projet basé sur AI Center

  1. Ouvrez AI Center et accédez à la page Labellisation des données.
  2. Sélectionnez la session de labellisation de données que vous souhaitez migrer.


  3. Une fois Document Manager ouvert, dans la liste déroulante Filtrer les documents, sélectionnez Ensemble d’entraînement et de validation.
    Figure 1. Training and validation set

  4. Sélectionnez Exporter(Export) .
  5. Laissez sélectionnés les Résultats de la recherche actuelle et saisissez le nom de votre tâche d’exportation.
  6. Sélectionnez Télécharger.
    Figure 2. Download export

Importer un jeu de données

  1. Accédez au projet dans lequel vous souhaitez importer des données et ouvrez celui-ci.
  2. Sélectionnez Ajouter un type de document et créez un nouveau type de document personnalisé.
    Figure 3. Add document type

  3. Dans le nouveau type de document personnalisé, sélectionnez Charger et choisissez le fichier zip du projet classique que vous avez exporté. Attendez que le chargement se termine.
    Figure 4. Upload processing

Une fois le chargement terminé, les documents sont disponibles pour l’entraînement.

Entraînement de modèle

Une fois le jeu de données importé, l’entraînement du modèle démarre. Une fois l’entraînement terminé, le score du modèle s’affiche. Pour vérifier les scores de modèle détaillés, sélectionnez le score, puis Scores de modèle détaillés.



Cette action vous mène à la page Mesure, sur laquelle vous pouvez accéder aux métriques détaillées du modèle.

Lorsque le même ensemble de données est utilisé pour entraîner deux fois un apprentissage automatique, il est possible que les mesures du modèle soient légèrement différentes. Cela peut se produire pour plusieurs raisons :

  • Initialisation : l’apprentissage automatique utilise des méthodes d’optimisation ayant besoin d’hypothèses initiales pour déclencher les algorithmes d’optimisation. Des hypothèses initiales différentes lors de chaque entraînement peuvent conduire à des résultats différents en raison de la nature imprévisible de ces algorithmes.
  • État aléatoire : certains algorithmes utilisent des éléments aléatoires dans leurs opérations. Par exemple, lors de l’entraînement d’un réseau neuronal, des procédures telles que l’algorithme du gradient stochastique et al descente de gradient stochastique par mini-lots intègrent des éléments aléatoires. Par conséquent, même avec des paramètres de modèle initiaux et des ensembles de données identiques, les performances des modèles peuvent varier d’une exécution à l’autre.
  • Régularisation : certains algorithmes incluent un condition de pénalité qui encourage le modèle à conserver des pondérations plus faibles. En raison du caractère aléatoire que cela implique, le modèle peut s’exécuter avec un ensemble de pondérations différent à chaque fois.

Cependant, il est essentiel de noter que ces différences mineures n’impliquent pas nécessairement qu’un modèle soit supérieur ou inférieur à un autre. Même avec des mesures légèrement différentes, la capacité des modèles à identifier les données reste plus ou moins la même, à condition que ces différences ne soient pas radicales. Par ailleurs, le fait de répéter ce processus plusieurs fois et de se fonder sur une moyenne devrait conduire à des indicateurs de performances similaires.

Modifier le modèle de base dans le gestionnaire de type de document

S’il existe une différence significative entre les résultats du modèle de votre projet classique et le modèle moderne, cela peut être dû à un modèle de base différent. Pour modifier le modèle de base, suivez les étapes ci-dessous.
  1. Sélectionnez le menu à trois points dans votre type de document personnalisé et sélectionnez Gestionnaire de type de document (Document type manager).


  2. Accédez à l’onglet Paramètres (Settings).
  3. Sélectionnez le modèle souhaité dans la liste déroulante Modèle de base (Base model).


  4. Après avoir fait votre sélection, cliquez sur Enregistrer (Save). Pour quitter, sélectionnez Retour (Back).

Types d’exportation

Pour les projets classiques, il existe différentes méthodes afin d’exporter les données. Tous les types de données exportées ne sont pas compatibles pour une importation dans des projets modernes. Pour comparer les résultats du modèle entre les deux types de projets, filtrez les documents par Ensemble d’entraînement et de validation et sélectionnez Choisir les résultats de recherche pour exporter le jeu de données. Pour plus d’informations sur chaque modèle, consultez le tableau suivant :

Tableau 1. Types d’exportation
Type d’exportationDonnées exportéesComment sont utilisées les données importées
Résultats de la recherche actuelleExporte le jeu de données filtré actuel. Utilisez-le conjointement à un filtre Ensemble d’entraînement et de validation. Les documents auxquels la balise entraînement est associée sont utilisés afin d’entraîner le modèle. Les documents auxquels la balise validation est associée, quant à eux, sont utilisés afin de mesurer les performances du modèle.
Astuce : pour comparer les résultats du modèle d’un type de projet à un autre, exportez et importez toujours le jeu de données en tant qu’entraînement et validation.
Tous les éléments étiquetésExporte tous les documents annotés du jeu de données :
  • Ensemble d’entraînement
  • Ensemble de validation
  • Ensemble d'évaluation
  • Les documents auxquels la balise entraînement est associée sont utilisés afin d’entraîner le modèle.
  • Les documents auxquels la balise validation est associée, quant à eux, sont utilisés afin de mesurer les performances du modèle.
  • Les documents auxquels la balise évaluation est associée sont ignorés.
SchémaExporte la liste de champs ainsi que leurs paramètres respectifs.Un schéma sera importé lorsqu’aucun schéma n’est présent. Si un schéma a été déjà défini, l’importation échouera.
Tout (All)Exporte tous les documents annotés et non annotés.
  • Les documents auxquels la balise entraînement est associée sont utilisés afin d’entraîner le modèle.
  • Les documents auxquels la balise validation est associée, quant à eux, sont utilisés afin de mesurer les performances du modèle.
  • Les documents auxquels la balise évaluation est associée sont ignorés.
  • Les documents non annotés sont pré-annotés et traités comme non confirmés.

Importer des schémas

Vous pouvez importer des schémas ainsi que des jeux de données dans les projets modernes. Suivez ces étapes afin d’importer un schéma :
  1. Créez un type de document personnalisé dans la section Construire (Build).
  2. Importez le fichier zip qui contient le schéma.
Remarque :
  • Les importations de schémas sont limitées aux types de documents personnalisés dépourvus de schéma préexistant.
  • Si vous importez un schéma dans un type de document qui en contient déjà un, l’importation échouera.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.