
Notes de publication de Document Understanding
2024.10.0
Date de publication : 11 novembre 2024
Document Understanding™ 2024.10, version LTS
Nous avons le plaisir d’annoncer que notre dernier moteur OCR, UiPath Extended Languages OCR, est désormais disponible pour tous. Ce nouvel OCR est capable de numériser les documents sur plus de 200 langues, ce qui représente une amélioration significative par rapport à son prédécesseur, en particulier en ce qui concerne le chinois, le japonais et le coréen. Il est par ailleurs capable de traiter des documents en thaï, en vietnamien, dans toutes les principales langues de l’Inde, ainsi que dans des langues utilisant l’alphabet cyrillique et le grec.
Nous avons apporté des améliorations considérables à notre processus de numérisation des documents. Désormais, lorsque vous utilisez l’outil de reconnaissance optique de caractères UiPath Extended Languages OCR, la sortie sera constituée de zones de mots réguliers au lieu de caractères individuels.
- Cette version apporte des améliorations de la précision et des performances pour la reconnaissance de l'écriture manuscrite.
- La reconnaissance et la détection de Reconnaissance des caractères à l’encre magnétique (MIRC) ont été améliorées, ce qui permet une précision améliorée, en particulier pour les chèques.
- Auparavant, les nombres n’étaient pas reconnus dans certaines instances lorsqu’une espace était utilisée comme séparateur. Les nombres sont désormais reconnus lorsque l’espace est utilisé comme séparateur.
- Le score de confiance de l’outil de reconnaissance optique de caractères UiPath Document Understanding est amélioré, notamment lorsqu’il est utilisé sur des images de faible qualité. Dans les workflows où le score de confiance est utilisé pour décider si les documents nécessitent une validation humaine dans Action Center, cela peut entraîner une augmentation du nombre de documents en cours de validation.
Nous avons résolu un problème où les zones d'annotation étaient renvoyées horizontalement, même si certains documents étaient légèrement de travers, ce qui provoquait un problème d'alignement de l'annotation.