UiPath Documentation
document-understanding
latest
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 发行说明

上次更新日期 2026年4月27日

常规 ML 包和公共端点更新

UiPath Document OCR 公共端点发布版本

发布日期:2026 年 1 月 20 日

改进

  • 在 Document Understanding 中的 OCR 期间,改进了对显示为徽标或样式化文本的公司名称的处理。
  • 增强了对包含阿拉伯数字的阿拉伯语 ID 编号的 OCR 处理。此更新改进了受支持的阿拉伯语 ID 格式的数字识别,有助于减少在提取期间字符丢失或错误识别的情况。

UiPath Document OCR 公共端点发布版本

发布日期:2025 年 12 月 4 日

改进

新增了对夏威夷语变音符号的支持,以提高包含夏威夷语文本的文档的识别准确性。

UiPath Helix 提取程序公共端点改进

发布日期:2025 年 11 月 7 日

新增功能

  • 美国提取模型的公共端点(财务报表除外)现在基于 Helix 提取程序。
  • Public endpoints for the United States now include Receipts2, Invoices2, Receipts Japan, and US Mortgage Closing Disclosures. For more information, go to the Public endpoints documentation and expand the table for a full, scrollable list. We recommend you make sure your activity is connected to the correct endpoint according to each server region.

Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.

UiPath Helix 提取程序公共端点改进

新增功能

  • 日本提取模型的公共端点(财务报表除外)现在基于 Helix 提取程序。
  • Public endpoints for Japan now include Receipts2, Invoices2, and US Mortgage Closing Disclosures. For more information, go to the Public endpoints documentation and expand the table for a full, scrollable list. We recommend you make sure your activity is connected to the correct endpoint according to each server region.

Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.

UiPath Helix 提取程序公共端点改进

发布日期:2025 年 8 月 14 日

新增功能

我们很高兴地宣布,欧洲地区基于 UiPath Helix 提取程序,针对公共端点发布了提高准确性的版本。

在此版本中,以下模型现在也基于欧洲地区的 UiPath Helix 提取程序:

  • 9465
  • 中国发票
  • 希伯来语发票
  • 日本发票
  • 日本收据

With this addition, all models are now based on the UiPath Helix Extractor in Europe region, except for Financial Statements.

新的文档类型

此版本引入了以下新的文档类型:

  • Invoices2: this document type is trained to extract key data points from a wide variety of invoice types, including standard invoices, credit notes, Indian invoices, and shipping invoices. The enhanced schema consists of 55 regular fields, two structured tables—one for line items (13 columns) and one for bank payment details (9 columns)—and a currency classifier.
  • Receipts2: this document type is trained to extract key data points from a wide range of receipt types, including but not limited to parking receipts, train tickets, hotel bills, airport purchases, meals, pharmacy receipts, electronic receipts, and more. The enhanced schema consists of 60 regular fields and a structured table of items with 6 columns.
  • US Mortgage Closing Disclosures: this document type is trained to extract key data points from standard US closing disclosure forms. The schema includes 20 regular fields capturing borrower details, property information, loan terms, transaction summaries, and cash to close figures.

Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.

增强的字符识别功能

发布说明:2025 年 6 月 23 日

此更新对我们的光学字符识别 (OCR) 引擎进行了一系列改进,旨在提高更广泛输入样式的准确性和可靠性:

  • 增强了手写检测功能。
  • 增强等宽字体中“O”和“0”的区分度。
  • 改进了对点矩阵打印文本的识别。

这些改进提高了各种文档类型的可靠性。

通过 API 和活动可用的日本收据文档类型

发布说明:2025 年 5 月 19 日

您现在可以通过 API、IntelligentOCR 以及 Document Understanding 活动使用日本收据 (Receipts Japan) 文档类型。这适用于日本地区的所有租户。

移除版本低于 2023.4 的开箱即用模型

发布日期:2025 年 4 月 11 日

移除版本低于 2023.4 的开箱即用模型

随着新型替代方案和升级解决方案的发布,我们移除了对开箱即用模型的支持,包括 UiPath Document Understanding OCR 与 OCR_CPU、数据提取 ML 包以及文档分类器。

下表详细说明了移除计划。

特性或功能移除公布日期移除日期:注意
早于 2023.4 的开箱即用 ML 包2025 年 4 月2025 年 4 月我们建议使用最新版本的开箱即用 ML 包。

For more information on deprecations, check the Deprecation timeline in the Overview guide.

UiPath Document OCR 公共端点发布版本

发布日期:2025 年 3 月 19 日

改进

  • 整体复选框、手写和打印文本检测得到改进。
  • 手写识别准确性得到了提升。
  • 针对日本印章的印章检测功能得到改进。
  • 边界框的大小和定位准确性得到了改进。

UiPath Helix 提取程序公共端点发布

发布日期:2024 年 11 月 28 日

新的文档类型

此版本引入了一种新的文档类型:日本收据 (Receipts Japan)。这个新的公共端点可以从各种文档类型中提取关键详细信息,例如常规收银机收据、餐厅收据、旅馆收据、火车收据、停车收据以及其他类型的日语收据等。

基于 UiPath Helix 提取程序的中国发票和日本发票的公共端点

我们很高兴宣布发布改进的中国发票日本发票端点。该新一代端点基于新的 UiPath LLM UiPath Helix 提取程序,可提高准确性和性能。

日本发票改进

We have made significant improvements to the Invoices Japan public endpoint, adding new fields, such as:

  • 常规字段:
    • 净减少额
    • 已扣税额
    • 未减少净额
    • 未扣税额
    • 预扣税额
    • 存款
  • 列字段:
    • 项目税率
    • 项目注册税
    • 项目费用

Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.

发布日本发票公共端点

发布日期:2024 年 10 月 29 日

在“日本发票”端点中发布

改进

我们对文档数字化流程进行了重大改进。现在,当使用 UiPath 扩展语言 OCR 或中文、韩语、日语 OCR 时,输出将是常规字词框,而不是单个字符。

发布新的日本发票公共端点

发布日期:2024 年 10 月 15 日

在“日本发票”端点中发布

改进

  • 提高了日本发票 ML 包的准确性。
  • 当中文、日语或韩语字符在文档中与拉丁字符、标点符号和数字混合使用时,我们增强了间距和字词分析。
  • 我们修复了一个问题,该问题导致 AI Center 训练管道不正确地为 ID NumberPhone Number 字段类型报告高分。这可确保报告的分数与实际分数相符。

UiPath 扩展语言 OCR 正式发布

发布日期:2024 年 10 月 3 日

我们很高兴宣布,UiPath 最新的 OCR 引擎UiPath 扩展语言 OCR现已正式发布。新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显著改进,尤其是在中文、日语和韩语方面。此外,它可以处理泰语、越南语、印度的所有主要语言以及使用西里尔字母的语言和希腊语的文档。

UiPath 扩展语言 OCR 当前仅可用作公共端点。

基于 UiPath™ Helix 提取程序的新公共端点

发布日期:2024 年 9 月 17 日

UiPath Helix 提取程序上改进的性能和加入的新模型端点

This release brings enhanced accuracy and performance for models based on the UiPath Helix Extractor, the new UiPath LLM. Furthermore, the following models are now based on the UiPath Helix Extractor as well:

  • 709
  • 941x
  • 1040x
  • 3949
  • 3949a

模型端点重定向到旧一代

由于性能问题,系统已将财务报表模型端点重定向到旧一代。

预览模型已删除

已从公共端点和数据提取 ML 包中删除 990(预览版)模型。

Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.

弃用 UiPath 中文、日语、韩语 OCR

发行日期:2024 年 7 月 8 日

自 2025 年 1 月起,我们将弃用 UiPath 中文、日语、韩语 OCR。我们建议改用 UiPath 扩展语言 OCR

查看“弃用时间线”页面,详细了解即将弃用和删除的内容。

基于 UiPath™ Helix 提取程序的发票和收据公共端点

发布日期:2024 年 6 月 12 日

我们很高兴宣布发布改进的发票收据端点。该新一代端点基于新的 UiPath LLM UiPath Helix 提取程序,可提高准确性和性能。

We are gradually replacing our models with a new generation. For now, all public endpoints are based on the Helix Extractor, except for the following endpoints:

  • 709
  • 941x
  • 1040x
  • 3949a
  • 9465
  • 中国发票
  • 希伯来语发票
  • 日本发票

查看发行说明,以了解未来的公告。

Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.

基于 Helix 提取程序的公共端点

发行日期:2024 年 5 月 29 日

We are excited to announce the release of improved endpoints for our pre-trained, out-of-the-box ML packages. This new generation, based on the UiPath Helix Extractor, the new UiPath® LLM, brings enhanced accuracy and performance.

We are gradually replacing our models with a new generation. For now, all public endpoints are based on the Helix Extractor, except for the following endpoints:

  • 709
  • 941x
  • 1040x
  • 3949a
  • 9465
  • 发票
  • 中国发票
  • 希伯来语发票
  • 日本发票
  • 收据

查看发行说明,以了解未来的公告。

Erratum - added January 16, 2025: As part of our ongoing product evolution and portfolio alignment, we have updated the product name to UiPath Helix Extractor. All references in this document reflect this change.

UiPath 扩展语言 OCR(公共预览版)

发行日期:2024 年 3 月 28 日

我们很高兴宣布,UiPath 最新 OCR 引擎 UiPath 扩展语言 OCR 现已推出公开预览版。新版 OCR 能够将 200 多个语言的文档数字化,与前身相比有显著改进,尤其是在中文、日语和韩语方面。此外,它可以处理泰语、越南语、印度的所有主要语言以及使用西里尔字母的语言和希腊语的文档。

UiPath 扩展语言 OCR 当前仅可用作公共端点。

冻结的主干训练

发行日期:2023 年 4 月 27 日

ML 包版本 v23.4 及更高版本现在拥有使用冻结主干进行训练的选项。对于 400 页以下的小型或低多样性训练集,这种新方法的训练速度更快,并且效果更好。您可以使用官方文档中记录的新训练管道环境变量覆盖此行为。

已弃用澳大利亚发票

发布日期:2022 年 11 月 29 日

我们宣布即将弃用澳大利亚发票预训练 ML 包。我们建议改用发票 ML 包。您可以在此处找到更多相关详细信息。

ML 分类端点公开预览

发行日期:2022 年 6 月 27 日

在端点中发布

ML 分类端点现已在公开预览中提供。

UiPath 中文、日语、韩语 OCR 版本

端点

发行日期:2022 年 6 月 20 日

在端点中发布

UiPath 中文、日语、韩语 OCR 公共端点已正式发布。

数据提取 ML 包

发行日期:2022 年 6 月 6 日

在 AI Center Cloud 中发布,适用于数据提取 ML 包

新的 OCR 方法,即 UiPath 中文、日语、韩语 OCR,现在可用,并且只能应用于 Document Understanding (Cloud) 中的新项目或已创建的项目。

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新