- Vue d'ensemble (Overview)
- Démarrage
- Créer des modèles
- Utiliser des modèles
- Paquets ML
- 1040 - Paquet ML
- Annexe C du formulaire 1040 Planification C - Paquet ML
- 1040 Planification D - Paquet ML
- Annexe E du formulaire 1040 - Paquet ML
- Paquet ML - 1040x
- Paquet ML 3949a
- 4506T - Paquet ML
- Paquet ML 941x
- Paquet ML 9465
- ACORD125 - Paquet ML
- ACORD126 - Paquet ML
- ACORD131 - Paquet ML
- ACORD140 - Paquet ML
- ACORD25 - Paquet ML
- États financiers - Paquet ML
- Connaissement - Paquet ML
- Paquet ML - Certificat de constitution
- Paquet ML - Certificat d'origine
- Chèques - Paquet ML
- Paquet ML - Certificat de produit pour enfants
- CMS1500 - Paquet ML
- Paquet ML - Déclaration de conformité de l’UE
- États financiers - Paquet ML
- FM1003 - Paquet ML
- I9 - Paquet ML
- Cartes d’identité - Paquet ML
- Factures - Paquet ML
- FacturesAustralie - Paquet ML
- FacturesChine - Paquet ML
- Paquet ML - Factures hébreu
- FacturesInde - Paquet ML
- FacturesJapon - Paquet ML
- Paquet ML - Livraison des factures
- Listes de colisage - Paquet ML
- Fiches de paie - Paquet ML
- Passeports - Paquet ML
- Bons de commande - Paquet ML
- Reçus - Paquet ML
- Reçus Japon - Paquet ML
- RemittanceAdvices - Paquet ML
- Formulaire UB04 - Paquet ML
- Factures de services publics - Paquet ML
- Titres de véhicule - Paquet ML
- W2 - Paquet ML
- W9 - Paquet ML
- Points de terminaison publics
- Langues prises en charge
- Tableaux de bord Insights.
- Données et sécurité
- Licences
- Comment
Guide de l'utilisateur pour les projets modernes Document Understanding
Migrer des projets classiques
- Exportez l’ensemble de données du projet classique ou du projet basé sur AI Center.
- Importez le jeu de données dans le projet moderne.
- Il n’est actuellement pas possible d’importer des ensembles de données de plus de 3000 pages. Seules les 3000 pages initiales seront importées avec succès, tandis que les pages supplémentaires échoueront. Par exemple, si votre ensemble de données se compose de 2999 pages et que vous essayez d’importer un document de 4 pages, le processus échouera.
- Les noms de lot et les résultats de lot correspondants ne sont pas disponibles actuellement. Si vos données sont organisées en lots, ces informations ne s’afficheront pas pour le moment, mais elles seront enregistrées.
Une fois le jeu de données importé, l’entraînement du modèle démarre. Une fois l’entraînement terminé, le score du modèle s’affiche. Pour vérifier les scores de modèle détaillés, sélectionnez le score, puis Scores de modèle détaillés.
Cette action vous mène à la page Mesure, sur laquelle vous pouvez accéder aux métriques détaillées du modèle.
Lorsque le même ensemble de données est utilisé pour entraîner deux fois un apprentissage automatique, il est possible que les mesures du modèle soient légèrement différentes. Cela peut se produire pour plusieurs raisons :
- Initialisation : l’apprentissage automatique utilise des méthodes d’optimisation ayant besoin d’hypothèses initiales pour déclencher les algorithmes d’optimisation. Des hypothèses initiales différentes lors de chaque entraînement peuvent conduire à des résultats différents en raison de la nature imprévisible de ces algorithmes.
- État aléatoire : certains algorithmes utilisent des éléments aléatoires dans leurs opérations. Par exemple, lors de l’entraînement d’un réseau neuronal, des procédures telles que l’algorithme du gradient stochastique et al descente de gradient stochastique par mini-lots intègrent des éléments aléatoires. Par conséquent, même avec des paramètres de modèle initiaux et des ensembles de données identiques, les performances des modèles peuvent varier d’une exécution à l’autre.
- Régularisation : certains algorithmes incluent un condition de pénalité qui encourage le modèle à conserver des pondérations plus faibles. En raison du caractère aléatoire que cela implique, le modèle peut s’exécuter avec un ensemble de pondérations différent à chaque fois.
Cependant, il est essentiel de noter que ces différences mineures n’impliquent pas nécessairement qu’un modèle soit supérieur ou inférieur à un autre. Même avec des mesures légèrement différentes, la capacité des modèles à identifier les données reste plus ou moins la même, à condition que ces différences ne soient pas radicales. Par ailleurs, le fait de répéter ce processus plusieurs fois et de se fonder sur une moyenne devrait conduire à des indicateurs de performances similaires.
Pour les projets classiques, il existe différentes méthodes afin d’exporter les données. Tous les types de données exportées ne sont pas compatibles pour une importation dans des projets modernes. Pour comparer les résultats du modèle entre les deux types de projets, filtrez les documents par Ensemble d’entraînement et de validation et sélectionnez Choisir les résultats de recherche pour exporter le jeu de données. Pour plus d’informations sur chaque modèle, consultez le tableau suivant :
Type d’exportation | Données exportées | Comment sont utilisées les données importées |
---|---|---|
Résultats de la recherche actuelle | Exporte le jeu de données filtré actuel. Utilisez-le conjointement à un filtre Ensemble d’entraînement et de validation. | Les documents auxquels la balise entraînement est associée sont utilisés afin d’entraîner le modèle. Les documents auxquels la balise validation est associée, quant à eux, sont utilisés afin de mesurer les performances du modèle.
Astuce : pour comparer les résultats du modèle d’un type de projet à un autre, exportez et importez toujours le jeu de données en tant qu’entraînement et validation.
|
Tous les éléments étiquetés | Exporte tous les documents annotés du jeu de données :
|
|
Schéma | Exporte la liste de champs ainsi que leurs paramètres respectifs. | Un schéma sera importé lorsqu’aucun schéma n’est présent. Si un schéma a été déjà défini, l’importation échouera. |
Tout (All) | Exporte tous les documents annotés et non annotés. |
|
- Créez un type de document personnalisé dans la section Construire (Build).
- Importez le fichier zip qui contient le schéma.
- Les importations de schémas sont limitées aux types de documents personnalisés dépourvus de schéma préexistant.
- Si vous importez un schéma dans un type de document qui en contient déjà un, l’importation échouera.