document-understanding

2024.10

true

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Guide de l'utilisateur pour les projets modernes Document Understanding

PRODUIT :

Dernière mise à jour 27 mars 2025

Migrer des projets classiques

Suivez les instructions détaillées sur cette page pour migrer un projet basé sur AI Center. La migration d’un projet contient deux étapes principales :

Exportez l’ensemble de données du projet basé sur AI Center.
Importez le jeu de données dans le projet moderne.

Limites actuelles

Il n’est actuellement pas possible d’importer des ensembles de données de plus de 3000 pages. Seules les 3000 pages initiales seront importées avec succès, tandis que les pages supplémentaires échoueront. Par exemple, si votre ensemble de données se compose de 2999 pages et que vous essayez d’importer un document de 4 pages, le processus échouera.
Les noms de lot et les résultats de lot correspondants ne sont pas disponibles actuellement. Si vos données sont organisées en lots, ces informations ne s’afficheront pas pour le moment, mais elles seront enregistrées.

Exporter un jeu de données à partir d’un projet basé sur AI Center

Ouvrez AI Center et accédez à la page Labellisation des données.
Sélectionnez la session de labellisation de données que vous souhaitez migrer.
Une fois Document Manager ouvert, dans la liste déroulante Filtrer les documents, sélectionnez Ensemble d’entraînement et de validation.

Image 1. Ensemble d’entraînement et de validation
Sélectionnez Exporter(Export) .
Laissez sélectionnés les Résultats de la recherche actuelle et saisissez le nom de votre tâche d’exportation.
Sélectionnez Télécharger.

Image 2. Exportation des téléchargements

Importer un jeu de données

Accédez au projet dans lequel vous souhaitez importer des données et ouvrez celui-ci.
Sélectionnez Ajouter un type de document et créez un nouveau type de document personnalisé.

Image 3. Ajout d’un type de document
Dans le nouveau type de document personnalisé, sélectionnez Charger et choisissez le fichier zip du projet classique que vous avez exporté. Attendez que le chargement se termine.

Image 4. Traitement des chargements

Une fois le chargement terminé, les documents sont disponibles pour l’entraînement.

Entraînement de modèle

Une fois le jeu de données importé, l’entraînement du modèle démarre. Une fois l’entraînement terminé, le score du modèle s’affiche. Pour vérifier les scores de modèle détaillés, sélectionnez le score, puis Scores de modèle détaillés.

Cette action vous mène à la page Mesure, sur laquelle vous pouvez accéder aux métriques détaillées du modèle.

Lorsque le même ensemble de données est utilisé pour entraîner deux fois un apprentissage automatique, il est possible que les mesures du modèle soient légèrement différentes. Cela peut se produire pour plusieurs raisons :

Initialisation : l’apprentissage automatique utilise des méthodes d’optimisation ayant besoin d’hypothèses initiales pour déclencher les algorithmes d’optimisation. Des hypothèses initiales différentes lors de chaque entraînement peuvent conduire à des résultats différents en raison de la nature imprévisible de ces algorithmes.
État aléatoire : certains algorithmes utilisent des éléments aléatoires dans leurs opérations. Par exemple, lors de l’entraînement d’un réseau neuronal, des procédures telles que l’algorithme du gradient stochastique et al descente de gradient stochastique par mini-lots intègrent des éléments aléatoires. Par conséquent, même avec des paramètres de modèle initiaux et des ensembles de données identiques, les performances des modèles peuvent varier d’une exécution à l’autre.
Régularisation : certains algorithmes incluent un condition de pénalité qui encourage le modèle à conserver des pondérations plus faibles. En raison du caractère aléatoire que cela implique, le modèle peut s’exécuter avec un ensemble de pondérations différent à chaque fois.

Cependant, il est essentiel de noter que ces différences mineures n’impliquent pas nécessairement qu’un modèle soit supérieur ou inférieur à un autre. Même avec des mesures légèrement différentes, la capacité des modèles à identifier les données reste plus ou moins la même, à condition que ces différences ne soient pas radicales. Par ailleurs, le fait de répéter ce processus plusieurs fois et de se fonder sur une moyenne devrait conduire à des indicateurs de performances similaires.

Modifier le modèle de base dans le gestionnaire de type de document

S’il existe une différence significative entre les résultats du modèle de votre projet classique et le modèle moderne, cela peut être dû à un modèle de base différent. Pour modifier le modèle de base, suivez les étapes ci-dessous.

Sélectionnez le menu à trois points dans votre type de document personnalisé et sélectionnez Gestionnaire de type de document (Document type manager).
Accédez à l’onglet Paramètres (Settings).
Sélectionnez le modèle souhaité dans la liste déroulante Modèle de base (Base model).
Après avoir fait votre sélection, cliquez sur Enregistrer (Save). Pour quitter, sélectionnez Retour (Back).

Types d’exportation

Pour les projets classiques, il existe différentes méthodes afin d’exporter les données. Tous les types de données exportées ne sont pas compatibles pour une importation dans des projets modernes. Pour comparer les résultats du modèle entre les deux types de projets, filtrez les documents par Ensemble d’entraînement et de validation et sélectionnez Choisir les résultats de recherche pour exporter le jeu de données. Pour plus d’informations sur chaque modèle, consultez le tableau suivant :

Tableau 1. Types d’exportation
Type d’exportation	Données exportées	Comment sont utilisées les données importées
Résultats de la recherche actuelle	Exporte le jeu de données filtré actuel. Utilisez-le conjointement à un filtre Ensemble d’entraînement et de validation.	Les documents auxquels la balise entraînement est associée sont utilisés afin d’entraîner le modèle. Les documents auxquels la balise validation est associée, quant à eux, sont utilisés afin de mesurer les performances du modèle. Astuce : pour comparer les résultats du modèle d’un type de projet à un autre, exportez et importez toujours le jeu de données en tant qu’entraînement et validation.
Tous les éléments étiquetés	Exporte tous les documents annotés du jeu de données : Ensemble d’entraînement Ensemble de validation Ensemble d'évaluation	Les documents auxquels la balise entraînement est associée sont utilisés afin d’entraîner le modèle. Les documents auxquels la balise validation est associée, quant à eux, sont utilisés afin de mesurer les performances du modèle. Les documents auxquels la balise évaluation est associée sont ignorés.
Schéma	Exporte la liste de champs ainsi que leurs paramètres respectifs.	Un schéma sera importé lorsqu’aucun schéma n’est présent. Si un schéma a été déjà défini, l’importation échouera.
Tout (All)	Exporte tous les documents annotés et non annotés.	Les documents auxquels la balise entraînement est associée sont utilisés afin d’entraîner le modèle. Les documents auxquels la balise validation est associée, quant à eux, sont utilisés afin de mesurer les performances du modèle. Les documents auxquels la balise évaluation est associée sont ignorés. Les documents non annotés sont pré-annotés et traités comme non confirmés.

Importer des schémas

Vous pouvez importer des schémas ainsi que des jeux de données dans les projets modernes. Suivez ces étapes afin d’importer un schéma :

Créez un type de document personnalisé dans la section Construire (Build).
Importez le fichier zip qui contient le schéma.

Remarque :

Les importations de schémas sont limitées aux types de documents personnalisés dépourvus de schéma préexistant.
Si vous importez un schéma dans un type de document qui en contient déjà un, l’importation échouera.

Sommaire de la page

Limites actuelles
Exporter un jeu de données à partir d’un projet basé sur AI Center
Importer un jeu de données
Entraînement de modèle
Modifier le modèle de base dans le gestionnaire de type de document
Types d’exportation
Importer des schémas

Cette page vous a-t-elle été utile ?

PrécédentContrôle des accès basé sur les rôles

SuivantChoisir le type d’automatisation

Support et Services

Obtenez l'aide dont vous avez besoin

UiPath Academy

Formation RPA - Cours d'automatisation

UiPath Forum

Forum de la communauté UiPath

Confiance et sécurité

Conditions d’utilisation

Politique de confidentialité

Politique de cookies