发布日期:2024 年 11 月 11 日
Document Understanding™ 2024.10 LTS 版本
我们很高兴宣布,UiPath 最新的 OCR 引擎UiPath 扩展语言 OCR现已正式发布。新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显著改进,尤其是在中文、日语和韩语方面。此外,它可以处理泰语、越南语、印度的所有主要语言、使用西里尔字母的语言和希腊语的文档。
我们对文档数字化流程进行了重大改进。现在,当使用 UiPath 扩展语言 OCR 时,输出将是常规单词框,而不是单个字符。
我们修复了以下问题:即使某些文档稍微倾斜,注释框仍会水平返回,从而导致注释未对齐。
我们修复了使用扩展语言 OCR 时与日语文本相关的问题。此问题导致在某些情况下因单独字符框而出现几个额外的空格。