- Document Understanding pour Automation Cloud et Test Cloud
- Document Understanding pour Automation Cloud et Test Cloud pour le secteur public
- Document Understanding pour Automation Cloud et Test Cloud dédiés
- Paquets ML et points de terminaison publics
Notes de publication de Document Understanding
General Release Notes - Document Understanding
19 octobre 2021
Améliorations
Les champs avec moins de 10 documents libellés peuvent être supprimés sans confirmation.
Résolution de bogues
- Correction d'un bug qui affectait les fichiers importés avec le même nom.
- Correction d'un bug dans Google OCR qui générait une erreur sur les documents avec des pages vides.
- Correction d'un bug qui affichait mal le nombre de fichiers dans la boîte de dialogue Importer des données (Import data) pour les importations d'ensembles de données Validation Station ou Data Manager.
Problèmes connus
- L'exportation par défaut (au niveau document) ne fonctionne qu'avec les paquets ML version 21.10 ou ultérieure dans AI Center. La version apparaît dans la colonne Journal des modifications (Change log) de la vue Paquets ML (ML Packages) d'AI Center. Pour les versions plus anciennes, veuillez utiliser la case à cocher Exportation rétrocompatible (Backwards-compatible export) dans la boîte de dialogue Exporter les fichiers (Export files).
1 octobre 2021
Prise en charge de documents multi-pages
Data Manager prend désormais en charge les documents multi-pages. Il s'agit d'une mise à jour majeure ayant un impact sur tous les aspects d'un flux d'apprentissage automatique :
Import: you can upload documents up to 150 pages; to bypass this limit, at the risk of an unstable labeling experience, select the Enable large documents checkbox from the Import data dialog box.
Prelabeling: the document is prelabeled as a whole, producing the same results as running in RPA workflow, but it takes more time in case of larger documents. See also Known Issues below.
Labeling: more convenient labeling due to natural scrolling through document pages.
Export: done by default at document level. Should you want to export the documents at page level, select the Backwards-compatible export checkbox from the Export files dialog box; this is also recommended if the model accuracy produced by the default export is below expectations.
Training: on most scenarios, the models trained with the new document level exported datasets should have the same performance with the page level Backwards-compatible export. However, if the models perform below expectations, we recommend that you retry the training using a Backwards-compatible export as well, in case it might produce better results.
Evaluation: this is the main motivation for the multi-page document support feature, since Evaluations scores will more accurately reflect run time performance. Please note that this assumes that each multi-page document contains a single logical document. For instance, if you import 20 page file packets containing 10 invoices of 2 pages each, then this should not be used as part of Evaluation sets. However, they can be used as part of Training sets but only if you export using the Backwards-compatible option enabled.
Améliorations
Prise en charge du schéma d'exportation à l'aide du bouton radio dans la boîte de dialogue Exporter les fichiers (Export files).
Taille d'importation maximale augmentée à 2 Go ou 2 000 pages.
Ensemble de test renommé Ensemble d'évaluation pour plus de cohérence avec les pipelines d'évaluation d'AI Center.
Le bouton Prévoir (Predict) apparaît par défaut dans la barre de gestion, mais les paramètres de prébalisage doivent être configurés pour que le bouton soit activé.
Suppression de toutes les restrictions sur le nombre d'échantillons par champ des exports des Ensembles d'évaluation.
Ajout du nom de session Data Manager à côté du nom de fichier dans la barre de gestion pour identifier plus facilement la session sur laquelle vous travaillez au cas où plusieurs onglets Data Manager sont ouverts en même temps.
Documents en chinois pris en charge.
Améliorations de l'accessibilité.
Localisation pour le Portugais-Portugal, Russe et Turc.
Problèmes connus
- Le modèle Factures Chine ne met pas en forme les dates chinoises au format standard aaaa-mm-jj. Cela sera amélioré dans les prochaines versions.
- L'analyse des dates de Data Manager est incohérent avec l'analyse effectuée par les modèles ML au moment de l'exécution. Si vous remarquez que les dates ne sont pas analysées correctement dans Data Manager, elles seront probablement analysées correctement dans la prédiction du modèle au moment de l'exécution. C'est un problème connu qui sera résolu dans un prochain correctif.
- Pour le moment, l'utilisation de l'option Prévoir (Predict) avec les prébalisages Points de terminaison publics (Public Endpoints) ne prébalise que les 10 premières pages d'un document. Il s'agit d'un problème connu et une amélioration sera incluse dans un futur correctif. Cependant, utiliser l'option Prévoir (Predict) avec des compétences ML dans AI Center n'impose pas une telle limitation.