document-understanding
2024.10
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。

Document Understanding 发行说明
上次更新日期 2026年4月6日
2024.10.0
发布日期:2024 年 11 月 11 日
Document Understanding™ 2024.10 LTS 版本
新增功能
UiPath 扩展语言 OCR
We are excited to announce that our latest OCR engine, UiPath Extended Languages OCR, is now in general availability. The new OCR is capable of digitizing documents in over 200 languages, bringing a significant improvement over its predecessor, especially in regards to Chinese, Japanese, and Korean. Additionally, it can process documents in Thai, Vietnamese, all major languages from India, and languages using the Cyrilic alphabet, and Greek.
数据提取 ML 包
有以下新的 ML 包可用:
改进
数据提取 ML 包
我们对文档数字化流程进行了重大改进。现在,当使用 UiPath 扩展语言 OCR 时,输出将是常规单词框,而不是单个字符。
UiPath Document Understanding OCR
- 此版本提高了手写识别的准确性,并提高了性能。
- 磁墨字符识别 (MIRC) 的识别和检测得到了改进,从而提高了准确性,尤其是支票的准确性。
- 以前,当使用空格作为分隔符时,在某些情况下无法识别数字。现在,当使用空格作为分隔符时,系统可以识别数字。
- UiPath Document Understanding OCR 的置信度分数得到了提高,尤其是在处理质量较低的图像时。在使用置信度分数来决定文档是否需要在 Action Center 中进行人工验证的工作流中,这可能会导致接受验证的文档数量增加。
错误修复
UiPath Document Understanding OCR
我们修复了以下问题:即使某些文档稍微倾斜,注释框仍会水平返回,从而导致注释未对齐。
数据提取 ML 包
我们修复了使用扩展语言 OCR 时与日语文本相关的问题。此问题导致在某些情况下因单独字符框而出现几个额外的空格。