document-understanding
latest
false
  • Document Understanding 发行说明
  • ML 包和公共端点发行说明
    • 常规 ML 包和公共端点更新
    • ML 包和公共端点版本历史记录
Document Understanding 发行说明
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 2024年10月31日

常规 ML 包和公共端点更新

Invoices Japan public endpoints release

发布日期:2024 年 10 月 29 日

在日本发票端点中发布

改进

We've made significant improvements to our document digitization process. Now, when using the UiPath Extended Languages OCR or the Chinese, Korean, Japanese OCR, the output will be regular word boxes instead of individual characters.

发布新的日本发票公共端点

发布日期:2024 年 10 月 15 日

在日本发票端点中发布

改进

  • 提高了日本发票 ML 包的准确性。
  • 当中文、日语或韩语字符在文档中与拉丁字符、标点符号和数字混合使用时,我们增强了间距和单词解析。
  • 我们修复了一个问题,该问题导致 AI Center 训练管道不正确地为ID NumberPhone Number字段类型报告高分。 这可确保报告的分数与实际分数相符。

UiPath 扩展语言 OCR 正式发布

发布日期:2024 年 10 月 3 日

我们很高兴地宣布,我们最新的 OCR 引擎UiPath 扩展语言 OCR现已正式发布。 新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显着改进,尤其是在中文、日语和韩语方面。 此外,它可以处理泰语、越南语、印度的所有主要语言以及使用西里尔字母的语言和希腊语的文档。

UiPath 扩展语言 OCR 当前仅可用作公共端点。

New public endpoints based on UiPath® DocPath

发布日期:2024 年 9 月 17 日

UiPath DocPath 上改进的性能和加入的新模型端点

此版本提高了基于 UiPath DocPath(新的 UiPath LLM)的模型的准确性和性能。此外,以下模型现在也基于 UiPath DocPath:

  • 709
  • 941x
  • 1040x
  • 3949
  • 3949a

模型端点重定向到旧一代

由于性能问题,系统已将财务报表模型端点重定向到旧一代。

预览模型已删除

已从公共端点和数据提取 ML 包中删除 990(预览版)模型。

弃用 UiPath 中文、日语、韩语 OCR

发行日期:2024 年 7 月 8 日

自 2025 年 1 月起,我们将弃用 UiPath 中文、日语、韩语 OCR。我们建议改用 UiPath 扩展语言 OCR

查看“弃用时间线”页面,详细了解即将弃用和删除的内容。

Public endpoints for Invoices and Receipts based on UiPath® DocPath

发布日期:2024 年 6 月 12 日

我们很高兴宣布发布改进的发票收据端点。基于新的 UiPath LLM,即 UiPath DocPath 的新生成功能提高了准确性和性能。

我们将逐步将模型替换为更新一代的模型。目前,所有公共端点都基于 DocPath,但以下端点除外
  • 709
  • 941x
  • 1040x
  • 3949a
  • 9465
  • 中国发票
  • 希伯来语发票
  • 日本发票

查看发行说明,以了解未来的公告。

基于 DocPath 的公共端点

发行日期:2024 年 5 月 29 日

We are excited to announce the release of improved endpoints for our pre-trained, out-of-the-box ML packages. This new generation, based on UiPath DocPath, the new UiPath® LLM, brings enhanced accuracy and performance.

我们将逐步将模型替换为更新一代的模型。目前,所有公共端点都基于 DocPath,但以下端点除外
  • 709
  • 941x
  • 1040x
  • 3949a
  • 9465
  • 发票
  • 中国发票
  • 希伯来语发票
  • 日本发票
  • 收据

查看发行说明,以了解未来的公告。

UiPath 扩展语言 OCR(公共预览版)

发行日期:2024 年 3 月 28 日

我们很高兴宣布,UiPath 最新 OCR 引擎 UiPath 扩展语言 OCR 现已推出公开预览版。新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显著改进,尤其是在中文、日语和韩语方面。此外,它可以处理泰语、越南语、印度的所有主要语言以及使用西里尔字母的语言和希腊语的文档。

UiPath 扩展语言 OCR 当前仅可用作公共端点。

冻结的主干训练

发行日期:2023 年 4 月 27 日

ML 包版本 v23.4 及更高版本现在拥有使用冻结主干进行训练的选项。对于 400 页以下的小型或低多样性训练集,这种新方法的训练速度更快,并且效果更好。您可以使用官方文档中记录的新训练管道环境变量覆盖此行为。

已弃用澳大利亚发票

发布日期:2022 年 11 月 29 日

我们宣布即将弃用澳大利亚发票预训练 ML 包。我们建议改用发票 ML 包。您可以在此处找到更多相关详细信息。

ML 分类端点公开预览

发行日期:2022 年 6 月 27 日

在端点中发布

ML 分类端点现已在公开预览中提供。

UiPath 中文、日语、韩语 OCR 版本

端点

发行日期:2022 年 6 月 20 日

在端点中发布

UiPath 中文、日语、韩语 OCR 公共端点已正式发布。

数据提取 ML 包

发行日期:2022 年 6 月 6 日

在 AI Center Cloud 中发布,适用于数据提取 ML 包

新的 OCR 方法,即 UiPath 中文、日语、韩语 OCR,现在可用,并且只能应用于 Document Understanding (Cloud) 中的新项目或已创建的项目。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。