- Notes de publication
avril 2023
Nouvelles fonctionnalités et améliorations
Vous disposez maintenant d’un Nom de champ (Field Name) et d’un ID de champ (Field ID) pour les champs de colonne et réguliers créés dans un projet Document Understanding. Le Nom de champ (Field Name) représente le nom d'affichage du champ, ce qui signifie que vous pouvez utiliser des majuscules, des espaces et tout type de caractères. L' ID de champ (Field ID) est généré automatiquement en fonction du Nom de champ (Field Name). Le nom de champ est destiné à faciliter votre travail, tandis que l'ID de champ est utilisé pour l'entraînement avec des modèles pré-entraînés.
Une nouvelle option est désormais disponible dans l'onglet Calculatrice (Calculator) dans le menu Diagnostic du jeu de données (Dataset Diagnostic). Utilisez l'onglet Calculatrice (Calculator) pour modifier les informations sur le type de document créé. Vous pouvez mettre à jour l'un des champs suivants : Type de document prêt à l'emploi (Out-of-the-box document type), Nombre de langues (Number of languages) ou Nombre de mises en page (Number of layouts). Les modifications apportées à l'onglet Calculatrice (Calculator) influencent la taille et la précision du jeu de données dans son ensemble, ce qui signifie que davantage de données d'entraînement labellisées peuvent être nécessaires.
Les options de recherche disponibles dans une session Document Manager ont été repensées, avec un nouveau look et une méthode plus propre de recherche/filtrage des documents.
Les paquets ML avec la version v23.4 ou une version ultérieure peuvent désormais s'entraîner à l'aide de Frozen Backbone. Cette nouvelle approche s’entraîne plus rapidement et donne de meilleurs résultats pour les ensembles d’entraînement de petite taille ou à faible diversité inférieurs à 400 pages. Vous pouvez remplacer ce comportement en utilisant les nouvelles variables d'environnement du pipeline d'entraînement documentées dans la documentation officielle.
Released in Endpoints + DocumentClassifier ML packages | v23.4.0
Nous avons ajouté de nouveaux types de documents au paquet ML DocumentClassifier, apporté des améliorations générales et corrigé quelques petits bogues.
Released in Endpoints + DocumentUnderstanding + Data Extraction ML packages | v23.4.0
Une liste de sept nouveaux paquets ML pré-entraînés prêts à l’emploi est désormais disponible pour un usage général. Voici la liste des sept nouveaux modèles :
- Certificat de constitution/conformité
- Certificat d'origine
- Certificat de produit pour enfants
- CMS1500
- Déclaration de conformité UE
- Factures Expédition
- Fiches de paie