Document Understanding - Octobre 2021

document-understanding

latest

false

Notes de publication de Document Understanding

Document Understanding pour Automation Cloud et Test Cloud
Document Understanding pour Automation Cloud et Test Cloud pour le secteur public
- 2025
- 2024
Document Understanding pour Automation Cloud et Test Cloud dédié
- 2025
Packages ML et points de terminaison publics
- Mises à jour générales des paquets ML et des points de terminaison publics
- Historique des versions des paquets ML et des points de terminaison publics

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Octobre 2021

Notes de publication d’octobre 2021 pour Document Understanding dans Automation Cloud.

General Release Notes - Document Understanding

19 octobre 2021

Améliorations

Les champs avec moins de 10 documents libellés peuvent être supprimés sans confirmation.

Résolution de bogues

Correction d'un bug qui affectait les fichiers importés avec le même nom.
Correction d'un bug dans Google OCR qui générait une erreur sur les documents avec des pages vides.
Correction d'un bug qui affichait mal le nombre de fichiers dans la boîte de dialogue Importer des données (Import data) pour les importations d'ensembles de données Validation Station ou Data Manager.

Problèmes connus

L'exportation par défaut (au niveau document) ne fonctionne qu'avec les paquets ML version 21.10 ou ultérieure dans AI Center. La version apparaît dans la colonne Journal des modifications (Change log) de la vue Paquets ML (ML Packages) d'AI Center. Pour les versions plus anciennes, veuillez utiliser la case à cocher Exportation rétrocompatible (Backwards-compatible export) dans la boîte de dialogue Exporter les fichiers (Export files).

1 octobre 2021

Prise en charge de documents multi-pages

Data Manager prend désormais en charge les documents multi-pages. Il s'agit d'une mise à jour majeure ayant un impact sur tous les aspects d'un flux d'apprentissage automatique :

Import: you can upload documents up to 150 pages; to bypass this limit, at the risk of an unstable labeling experience, select the Enable large documents checkbox from the Import data dialog box.

Prelabeling: the document is prelabeled as a whole, producing the same results as running in RPA workflow, but it takes more time in case of larger documents. See also Known Issues below.

Labeling: more convenient labeling due to natural scrolling through document pages.

Export: done by default at document level. Should you want to export the documents at page level, select the Backwards-compatible export checkbox from the Export files dialog box; this is also recommended if the model accuracy produced by the default export is below expectations.

Training: on most scenarios, the models trained with the new document level exported datasets should have the same performance with the page level Backwards-compatible export. However, if the models perform below expectations, we recommend that you retry the training using a Backwards-compatible export as well, in case it might produce better results.

Evaluation: this is the main motivation for the multi-page document support feature, since Evaluations scores will more accurately reflect run time performance. Please note that this assumes that each multi-page document contains a single logical document. For instance, if you import 20 page file packets containing 10 invoices of 2 pages each, then this should not be used as part of Evaluation sets. However, they can be used as part of Training sets but only if you export using the Backwards-compatible option enabled.

Améliorations

Prise en charge du schéma d'exportation à l'aide du bouton radio dans la boîte de dialogue Exporter les fichiers (Export files).

Taille d'importation maximale augmentée à 2 Go ou 2 000 pages.

Ensemble de test renommé Ensemble d'évaluation pour plus de cohérence avec les pipelines d'évaluation d'AI Center.

Le bouton Prévoir (Predict) apparaît par défaut dans la barre de gestion, mais les paramètres de prébalisage doivent être configurés pour que le bouton soit activé.

Suppression de toutes les restrictions sur le nombre d'échantillons par champ des exports des Ensembles d'évaluation.

Ajout du nom de session Data Manager à côté du nom de fichier dans la barre de gestion pour identifier plus facilement la session sur laquelle vous travaillez au cas où plusieurs onglets Data Manager sont ouverts en même temps.

Documents en chinois pris en charge.

Améliorations de l'accessibilité.

Localisation pour le Portugais-Portugal, Russe et Turc.

Problèmes connus

Le modèle Factures Chine ne met pas en forme les dates chinoises au format standard aaaa-mm-jj. Cela sera amélioré dans les prochaines versions.
L'analyse des dates de Data Manager est incohérent avec l'analyse effectuée par les modèles ML au moment de l'exécution. Si vous remarquez que les dates ne sont pas analysées correctement dans Data Manager, elles seront probablement analysées correctement dans la prédiction du modèle au moment de l'exécution. C'est un problème connu qui sera résolu dans un prochain correctif.
Pour le moment, l'utilisation de l'option Prévoir (Predict) avec les prébalisages Points de terminaison publics (Public Endpoints) ne prébalise que les 10 premières pages d'un document. Il s'agit d'un problème connu et une amélioration sera incluse dans un futur correctif. Cependant, utiliser l'option Prévoir (Predict) avec des compétences ML dans AI Center n'impose pas une telle limitation.

Sommaire de la page

General Release Notes - Document Understanding
19 octobre 2021
1 octobre 2021

Cette page vous a-t-elle été utile ?

PrécédentNovembre 2021

SuivantAoût 2021

General Release Notes - Document Understanding​

19 octobre 2021​

Améliorations​

Résolution de bogues​

Problèmes connus​

1 octobre 2021​

Prise en charge de documents multi-pages​

Améliorations​

Problèmes connus​

Cette page vous a-t-elle été utile ?

General Release Notes - Document Understanding

19 octobre 2021

Améliorations

Résolution de bogues

Problèmes connus

1 octobre 2021

Prise en charge de documents multi-pages

Améliorations

Problèmes connus