
Notes de publication de Document Understanding
2024.10.0
linkDate de publication : 11 novembre 2024
Document Understanding™ 2024.10, version LTS
Nouveautés
linkUiPath Extended Languages OCR
Nous avons le plaisir d’annoncer que notre dernier moteur OCR, UiPath Extended Languages OCR, est désormais disponible pour tous. Ce nouvel OCR est capable de numériser les documents sur plus de 200 langues, ce qui représente une amélioration significative par rapport à son prédécesseur, en particulier en ce qui concerne le chinois, le japonais et le coréen. Il est par ailleurs capable de traiter des documents en thaï, en vietnamien, dans toutes les principales langues de l’Inde, ainsi que dans des langues utilisant l’alphabet cyrillique et le grec.
Améliorations
linkPaquets ML Extraction de données
Nous avons apporté des améliorations considérables à notre processus de numérisation des documents. Désormais, lorsque vous utilisez l’outil de reconnaissance optique de caractères UiPath Extended Languages OCR, la sortie sera constituée de zones de mots réguliers au lieu de caractères individuels.
UiPath Document Understanding OCR
- Cette version apporte des améliorations de la précision et des performances pour la reconnaissance de l'écriture manuscrite.
- La reconnaissance et la détection de Reconnaissance des caractères à l’encre magnétique (MIRC) ont été améliorées, ce qui permet une précision améliorée, en particulier pour les chèques.
- Auparavant, les nombres n’étaient pas reconnus dans certaines instances lorsqu’une espace était utilisée comme séparateur. Les nombres sont désormais reconnus lorsque l’espace est utilisé comme séparateur.
- Le score de confiance de l’outil de reconnaissance optique de caractères UiPath Document Understanding est amélioré, notamment lorsqu’il est utilisé sur des images de faible qualité. Dans les workflows où le score de confiance est utilisé pour décider si les documents nécessitent une validation humaine dans Action Center, cela peut entraîner une augmentation du nombre de documents en cours de validation.
Résolution de bogues
linkUiPath Document Understanding OCR
Nous avons résolu un problème où les zones d'annotation étaient renvoyées horizontalement, même si certains documents étaient légèrement de travers, ce qui provoquait un problème d'alignement de l'annotation.
Paquets ML Extraction de données
Nous avons résolu un problème lié au texte japonais lors de l’utilisation d’Extended Languages OCR. Ce problème provoquait l’apparition de plusieurs espaces supplémentaires dans certaines situations en raison de zones de caractères individuelles.