Document Understanding
Plus récente (Latest)
False
  • Notes de publication
Image de fond de la bannière
Notes de publication de Document Understanding
Dernière mise à jour 17 mai 2024

mars 2022

Notes de publication générales - Paquets ML

14 mars 2022 | V22.1.6

DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages released in AI Center Cloud, package version 22.1.6

Résolution de bogues

  • Correction d'un bogue qui entraînait l'échec d'un pipeline d'entraînement ou d'un pipeline complet dans AI Center en raison d'un problème de paquet ML dans le prétraitement des données pour une ligne vide.

7 mars 2022 | V22.2.3

UiPathDocumentOCR : publié dans AI Center Cloud, version du package 22.2.3

Capacité supérieure

HandwritingRecognitionOCR intégré dans UiPathDocumentOCR. Dans de nombreux cas, il y a un mélange de champs. En intégrant la capacité de lecture de l'écriture manuscrite, nous sommes en mesure d'appliquer la reconnaissance correcte à chaque champ : la reconnaissance d'impression pour imprimer du texte et la reconnaissance de l'écriture manuscrite pour du texte manuscrit.

Bien que HandwritingRecognitionOCR puisse détecter n'importe quelle écriture manuscrite, sachez qu'elle est entraînée et optimisée uniquement pour l'anglais.

Améliorations

Augmentation de la limite du nombre de mots de 1 600 à 10 000 par page.

Ajout des symboles scientifiques suivants : μ, , , <, >.

2 mars 2022 | V22.1.4

DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages released in AI Center Cloud, package version 22.1.4

Nouveautés

Les paquets ML Factures de services publics (Utility Bills) ML sont désormais disponibles pour tous.

Améliorations

Amélioration globale des performances et de l'évolutivité.

Améliorations significatives des scores lors de l'entraînement sur la nouvelle version du paquet ML DocumentUnderstanding par rapport aux versions précédentes.

Les dates dans les champs de colonne sont désormais analysées correctement.

L'analyse de la date reconnaît désormais les noms de mois turcs.

Modifications

Modification du comportement des pipelines d'entraînement et des pipelines complets lors de l'entraînement sur GPU par rapport au processeur. Le 21.10.x les modèles entraînés sur des processeurs étaient plus petits, ils s'entraînaient donc plus rapidement que les versions précédentes, tout en ayant une précision légèrement inférieure à celle d'avant.

Ce comportement a été inversé avec cette version, de sorte que le modèle entraîné sur GPU et sur processeur est exactement le même modèle, et la vitesse d'entraînement est revenue à ce qu'elle était avant 2021.10, ce qui signifie que l'entraînement sur processeur est à nouveau 10 à 20 fois plus lent que sur GPU.

General Release Notes - Document Understanding

29 mars 2022

Améliorations

Ajout d'info-bulles plus descriptives sur les types de documents d'entraînement, de validation et d'évaluation.

Résolution de bogues

  • Correction d'un problème connu qui provoquait l'échec de la recherche ou du téléchargement d'un document contenant des caractères nécessitant un encodage d'URL (&, ,, +, #, ') dans son nom de fichier avec requête invalide.
  • Correction d'un bogue qui entraînait l'échec de la fonctionnalité Prévoir (Predict) sur les documents contenant du texte très dense.

7 mars 2022

Améliorations

La recherche de documents internes vous permet de rechercher des instances de texte uniquement dans votre document actuel. Ceci est particulièrement utile pour les documents comportant de nombreuses pages. La barre de recherche se trouve en bas à gauche de l'écran et est également accessible à l'aide du raccourci Ctrl + Shift + F.

Lors de l'utilisation de la fonctionnalité Prévoir (Predict), les données labellisées manuellement sont supprimées et le document est remplacé par les nouvelles valeurs du modèle.

Le split.csv n'est plus utilisé lors de l'importation d'un ensemble de données dans une autre session de Document Manager ou lors de l'exécution d'un Pipeline d'entraînement (Training Pipeline). Les données du fichier sont maintenant intégrées dans les fichiers JSON du dernier dossier de l'ensemble de données, plus exactement dans le champ sous-ensemble. Ainsi, si vous modifiez manuellement le fichier ou le supprimez complètement de l'ensemble de données, cela n'a pas d'impact sur l'entraînement du modèle. Sachez cependant que le fichier est toujours conservé pour l'exportation au niveau du document dans le cas des paquets ML version 21.10 ou antérieure.

Ajout de l'option pour supprimer définitivement des fichiers individuels. Celle-ci se trouve dans le menu déroulant à côté du nom du document, à côté de l'option de téléchargement.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Logo Uipath blanc
Confiance et sécurité
© 2005-2024 UiPath. All rights reserved.