document-understanding

2024.10

false

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Notes de publication de Document Understanding

PRODUIT :

Dernière mise à jour 21 nov. 2025

2024.10.0

Date de publication : 11 novembre 2024

Document Understanding™ 2024.10, version LTS

Nouveautés

UiPath Extended Languages OCR

Nous avons le plaisir d’annoncer que notre dernier moteur OCR, UiPath Extended Languages OCR, est désormais disponible pour tous. Ce nouvel OCR est capable de numériser les documents sur plus de 200 langues, ce qui représente une amélioration significative par rapport à son prédécesseur, en particulier en ce qui concerne le chinois, le japonais et le coréen. Il est par ailleurs capable de traiter des documents en thaï, en vietnamien, dans toutes les principales langues de l’Inde, ainsi que dans des langues utilisant l’alphabet cyrillique et le grec.

Paquets ML Extraction de données

Les nouveaux paquets ML suivants sont disponibles :

Améliorations

Paquets ML Extraction de données

Nous avons apporté des améliorations considérables à notre processus de numérisation des documents. Désormais, lorsque vous utilisez l’outil de reconnaissance optique de caractères UiPath Extended Languages OCR, la sortie sera constituée de zones de mots réguliers au lieu de caractères individuels.

UiPath Document Understanding OCR

Cette version apporte des améliorations de la précision et des performances pour la reconnaissance de l'écriture manuscrite.
La reconnaissance et la détection de Reconnaissance des caractères à l’encre magnétique (MIRC) ont été améliorées, ce qui permet une précision améliorée, en particulier pour les chèques.
Auparavant, les nombres n’étaient pas reconnus dans certaines instances lorsqu’une espace était utilisée comme séparateur. Les nombres sont désormais reconnus lorsque l’espace est utilisé comme séparateur.
Le score de confiance de l’outil de reconnaissance optique de caractères UiPath Document Understanding est amélioré, notamment lorsqu’il est utilisé sur des images de faible qualité. Dans les workflows où le score de confiance est utilisé pour décider si les documents nécessitent une validation humaine dans Action Center, cela peut entraîner une augmentation du nombre de documents en cours de validation.

Résolution de bogues

UiPath Document Understanding OCR

Nous avons résolu un problème où les zones d'annotation étaient renvoyées horizontalement, même si certains documents étaient légèrement de travers, ce qui provoquait un problème d'alignement de l'annotation.

Paquets ML Extraction de données

Nous avons résolu un problème lié au texte japonais lors de l’utilisation d’Extended Languages OCR. Ce problème provoquait l’apparition de plusieurs espaces supplémentaires dans certaines situations en raison de zones de caractères individuelles.

Sommaire de la page