- Notes de publication
mars 2022
DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages released in AI Center Cloud, package version 22.1.6
Résolution de bogues
- Correction d'un bogue qui entraînait l'échec d'un pipeline d'entraînement ou d'un pipeline complet dans AI Center en raison d'un problème de paquet ML dans le prétraitement des données pour une ligne vide.
UiPathDocumentOCR : publié dans AI Center Cloud, version du package 22.2.3
Capacité supérieure
HandwritingRecognitionOCR intégré dans UiPathDocumentOCR. Dans de nombreux cas, il y a un mélange de champs. En intégrant la capacité de lecture de l'écriture manuscrite, nous sommes en mesure d'appliquer la reconnaissance correcte à chaque champ : la reconnaissance d'impression pour imprimer du texte et la reconnaissance de l'écriture manuscrite pour du texte manuscrit.
Bien que HandwritingRecognitionOCR puisse détecter n'importe quelle écriture manuscrite, sachez qu'elle est entraînée et optimisée uniquement pour l'anglais.
Améliorations
Augmentation de la limite du nombre de mots de 1 600 à 10 000 par page.
μ
, ≤
, ≥
, <
, >
.
DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages released in AI Center Cloud, package version 22.1.4
Nouveautés
Les paquets ML Factures de services publics (Utility Bills) ML sont désormais disponibles pour tous.
Améliorations
Amélioration globale des performances et de l'évolutivité.
Améliorations significatives des scores lors de l'entraînement sur la nouvelle version du paquet ML DocumentUnderstanding par rapport aux versions précédentes.
Les dates dans les champs de colonne sont désormais analysées correctement.
L'analyse de la date reconnaît désormais les noms de mois turcs.
Modifications
Modification du comportement des pipelines d'entraînement et des pipelines complets lors de l'entraînement sur GPU par rapport au processeur. Le 21.10.x les modèles entraînés sur des processeurs étaient plus petits, ils s'entraînaient donc plus rapidement que les versions précédentes, tout en ayant une précision légèrement inférieure à celle d'avant.
Ce comportement a été inversé avec cette version, de sorte que le modèle entraîné sur GPU et sur processeur est exactement le même modèle, et la vitesse d'entraînement est revenue à ce qu'elle était avant 2021.10, ce qui signifie que l'entraînement sur processeur est à nouveau 10 à 20 fois plus lent que sur GPU.
Améliorations
Ajout d'info-bulles plus descriptives sur les types de documents d'entraînement, de validation et d'évaluation.
Résolution de bogues
- Correction d'un problème connu qui provoquait l'échec de la recherche ou du téléchargement d'un document contenant des caractères nécessitant un encodage d'URL (
&
,,
,+
,#
,'
) dans son nom de fichier avec requête invalide. - Correction d'un bogue qui entraînait l'échec de la fonctionnalité Prévoir (Predict) sur les documents contenant du texte très dense.
Améliorations
Ctrl
+ Shift
+ F
.
Lors de l'utilisation de la fonctionnalité Prévoir (Predict), les données labellisées manuellement sont supprimées et le document est remplacé par les nouvelles valeurs du modèle.
split.csv
n'est plus utilisé lors de l'importation d'un ensemble de données dans une autre session de Document Manager ou lors de l'exécution d'un Pipeline d'entraînement (Training Pipeline). Les données du fichier sont maintenant intégrées dans les fichiers JSON du dernier dossier de l'ensemble de données, plus exactement dans le champ sous-ensemble. Ainsi, si vous modifiez manuellement le fichier ou le supprimez complètement de l'ensemble de données, cela n'a pas d'impact sur l'entraînement du modèle. Sachez cependant que le fichier est toujours conservé pour l'exportation au niveau du document dans le cas des paquets ML version 21.10 ou antérieure.
Ajout de l'option pour supprimer définitivement des fichiers individuels. Celle-ci se trouve dans le menu déroulant à côté du nom du document, à côté de l'option de téléchargement.