Notes de publication de Document Understanding
2023.4.0
Tenez-vous au courant de toutes les dernières nouvelles concernant les paquet ML en parcourant la présente liste de modifications qui ont eu lieu depuis la dernière version LTS jusqu'à maintenant.
Une liste de sept nouveaux paquets ML pré-entraînés prêts à l'emploi est désormais disponible pour un usage général. Voici la liste des sept nouveaux modèles mentionnés :
- Certificat de constitution/conformité
- Certif d'origine
- Certificat de produit pour enfants
- CMS1500
- Déclaration de conformité UE
- Factures Expédition
- Fiches de paie
A new version of the Out-of-the-box Pre-trained ML Packages (23.1.0) and their public endpoints has been released, now using cutting edge LayoutLM Transformers based architecture, which is more powerful and increases accuracy overall, especially on column fields (tables).
Nous avons ajouté de nouveaux champs extraits au modèle Factures (Invoices) où figure désormais la date d'expédition, l'adresse e-mail du fournisseur, le nom de la banque, le numéro de compte bancaire, l'IBAN, le code SWIFT, l'adresse bancaire, le numéro d'acheminement bancaire et le taux de taxe.
Le score principal affiché par les pipelines d'entraînement/d'évaluation/complet dans AI Center n'est plus le score F1, mais précision. Celui-ci est défini comme le pourcentage de prédictions correctes. En général, la valeur numérique de précision est supérieure à F1, mais elle est plus facile à comprendre et à interpréter. En outre, vous disposez désormais des scores détaillés pour chaque champ de colonne individuel, alors que sur les anciennes versions, seul un score unique pour tous les champs de colonne pris ensemble était disponible. Les scores F1 sont toujours disponibles dans le dossier artefacts/eval_metrics de chaque pipeline par souci de continuité avec les versions précédentes.
La fonctionnalité Exportation de la planification (aperçu) (Schedule (Preview) Export) a été mise à jour avec une nouvelle récurrence minimale de sept jours. Toutes ces exportations planifiées existantes seront mises à jour pour refléter la nouvelle périodicité minimale de sept jours.
Le point de terminaison public UiPath Document OCR a été mis à jour et fournit désormais une prise en charge des langues d’écriture manuscrite pour l’allemand et le français, et une prise en charge des langues d’impression pour le danois, le finnois, le norvégien et le suédois.
Nous avons augmenté la précision des données exportées en modifiant l’exigence selon laquelle les données doivent être labellisées à 10 endroits (qui auraient pu être sur la même page) sur 10 pages différentes.
For all situations where latency is critical (e.g.: attended scenarios) we recommend deploying the models as ML Skills using a GPU.
Nous avons supprimé la limitation de la page d'importation pour les importations de type Document Manager, mais il existe une limite de taille de 4 000 Mo par importation.
L'importation du projet depuis AI Center est actuellement désactivée. Nous y travaillons activement et prévoyons sa réactivation bientôt.
Nous vous recommandons de vérifier régulièrement le calendrier d'obsolescence pour toute mise à jour concernant les fonctionnalités qui seront obsolètes et supprimées.