document-understanding
latest
false
  • Document Understanding 发行说明
  • ML 包和公共端点发行说明
    • 常规 ML 包和公共端点更新
    • ML 包和公共端点版本历史记录
UiPath logo, featuring letters U and I in white

Document Understanding 发行说明

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
上次更新日期 2024年12月12日

常规 ML 包和公共端点更新

UiPath DocPath 公共端点版本

发布日期:2024 年 11 月 28 日

新的文档类型

此版本引入了一种新的文档类型日本收据。 这个新的公共端点可以从各种文档类型中提取关键详细信息,例如常规收银机收据、餐厅收据、旅馆收据、火车收据、停车收据以及其他类型的日语收据。

基于 UiPath DocPath 的中国发票和日本发票的公共端点

我们很高兴地宣布发布改进的中国发票和日本发票端点。 基于新的 UiPath LLM UiPath DocPath的新一代端点提高了准确性和性能。

日本发票改进

我们对日本发票公共端点进行了重大改进,添加了新字段,例如:
  • 常规字段:
    • 净减少量
    • 已降税
    • 未减少净额
    • 非减税
    • 预扣税额
    • 存款
  • 列字段:
    • 项目税率
    • 项目注册税
    • 项目费用

发布日本发票公共端点

发布日期:2024 年 10 月 29 日

在日本发票端点中发布

改进

我们对文档数字化流程进行了重大改进。 现在,当使用 UiPath 扩展语言 OCR 或中文、韩语、日语 OCR 时,输出将是常规单词框,而不是单个字符。

发布新的日本发票公共端点

发布日期:2024 年 10 月 15 日

在日本发票端点中发布

改进

  • 提高了日本发票 ML 包的准确性。
  • 当中文、日语或韩语字符在文档中与拉丁字符、标点符号和数字混合使用时,我们增强了间距和单词解析。
  • 我们修复了一个问题,该问题导致 AI Center 训练管道不正确地为ID NumberPhone Number字段类型报告高分。 这可确保报告的分数与实际分数相符。

UiPath 扩展语言 OCR 正式发布

发布日期:2024 年 10 月 3 日

我们很高兴地宣布,我们最新的 OCR 引擎UiPath 扩展语言 OCR现已正式发布。 新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显着改进,尤其是在中文、日语和韩语方面。 此外,它可以处理泰语、越南语、印度的所有主要语言以及使用西里尔字母的语言和希腊语的文档。

UiPath 扩展语言 OCR 当前仅可用作公共端点。

New public endpoints based on UiPath® DocPath

发布日期:2024 年 9 月 17 日

UiPath DocPath 上改进的性能和加入的新模型端点

此版本提高了基于 UiPath DocPath(新的 UiPath LLM)的模型的准确性和性能。此外,以下模型现在也基于 UiPath DocPath:

  • 709
  • 941x
  • 1040x
  • 3949
  • 3949a

模型端点重定向到旧一代

由于性能问题,系统已将财务报表模型端点重定向到旧一代。

预览模型已删除

已从公共端点和数据提取 ML 包中删除 990(预览版)模型。

弃用 UiPath 中文、日语、韩语 OCR

发行日期:2024 年 7 月 8 日

自 2025 年 1 月起,我们将弃用 UiPath 中文、日语、韩语 OCR。我们建议改用 UiPath 扩展语言 OCR

查看“弃用时间线”页面,详细了解即将弃用和删除的内容。

Public endpoints for Invoices and Receipts based on UiPath® DocPath

发布日期:2024 年 6 月 12 日

我们很高兴宣布发布改进的发票收据端点。基于新的 UiPath LLM,即 UiPath DocPath 的新生成功能提高了准确性和性能。

我们将逐步将模型替换为更新一代的模型。目前,所有公共端点都基于 DocPath,但以下端点除外
  • 709
  • 941x
  • 1040x
  • 3949a
  • 9465
  • 中国发票
  • 希伯来语发票
  • 日本发票

查看发行说明,以了解未来的公告。

基于 DocPath 的公共端点

发行日期:2024 年 5 月 29 日

We are excited to announce the release of improved endpoints for our pre-trained, out-of-the-box ML packages. This new generation, based on UiPath DocPath, the new UiPath® LLM, brings enhanced accuracy and performance.

我们将逐步将模型替换为更新一代的模型。目前,所有公共端点都基于 DocPath,但以下端点除外
  • 709
  • 941x
  • 1040x
  • 3949a
  • 9465
  • 发票
  • 中国发票
  • 希伯来语发票
  • 日本发票
  • 收据

查看发行说明,以了解未来的公告。

UiPath 扩展语言 OCR(公共预览版)

发行日期:2024 年 3 月 28 日

我们很高兴宣布,UiPath 最新 OCR 引擎 UiPath 扩展语言 OCR 现已推出公开预览版。新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显著改进,尤其是在中文、日语和韩语方面。此外,它可以处理泰语、越南语、印度的所有主要语言以及使用西里尔字母的语言和希腊语的文档。

UiPath 扩展语言 OCR 当前仅可用作公共端点。

冻结的主干训练

发行日期:2023 年 4 月 27 日

ML 包版本 v23.4 及更高版本现在拥有使用冻结主干进行训练的选项。对于 400 页以下的小型或低多样性训练集,这种新方法的训练速度更快,并且效果更好。您可以使用官方文档中记录的新训练管道环境变量覆盖此行为。

已弃用澳大利亚发票

发布日期:2022 年 11 月 29 日

我们宣布即将弃用澳大利亚发票预训练 ML 包。我们建议改用发票 ML 包。您可以在此处找到更多相关详细信息。

ML 分类端点公开预览

发行日期:2022 年 6 月 27 日

在端点中发布

ML 分类端点现已在公开预览中提供。

UiPath 中文、日语、韩语 OCR 版本

端点

发行日期:2022 年 6 月 20 日

在端点中发布

UiPath 中文、日语、韩语 OCR 公共端点已正式发布。

数据提取 ML 包

发行日期:2022 年 6 月 6 日

在 AI Center Cloud 中发布,适用于数据提取 ML 包

新的 OCR 方法,即 UiPath 中文、日语、韩语 OCR,现在可用,并且只能应用于 Document Understanding (Cloud) 中的新项目或已创建的项目。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。