activities
latest
false
重要 :
请注意,此内容已使用机器翻译进行了部分本地化。 新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 活动

上次更新日期 2026年3月16日

发行说明

3.0.0 - preview

发布日期:2026 年 2 月 25 日

重大变更

  • Support for Windows-Legacy projects has been removed. Starting with this version, the package is compatible only with Windows projects.
  • Starting with this version, upgrading the package requires verifying that any downstream processing using the output of the Extract Document Data activity is still functioning correctly. The structure of the data returned by IXP projects has changed significantly. Therefore, it is strongly recommended to validate that any post-processing logic remains compatible.

    What has changed:

    • Results are now reported as Field Groups instead of Tables.
    • Values now correctly reflect the field type defined in your Unstructured Documents IXP project.
    • Monetary Quantity is now returned as a dedicated field type.
    • Document Validation tasks automatically display results as Field Groups instead of Tables.
    • Data manipulation logic must be updated to handle Field Group values accordingly.

新增功能

To provide extraction capabilities tailored to a specific non-Latin document layout, you can now use a dedicated modern project type called Predefined Non-Latin Languages in the Extract Document Data activity. This project type offers the following extractors:
  • Invoices Japan – Recommended for Japanse invoice documents. The extractor can handle common Japanese invoice layouts, and can identify and extract key invoice fields such as supplier information, invoice number, and currency.
  • Invoices China - Recommended for Chinese invoice documents. The extractor can handle common Chinese invoice layouts, and can identify and extract key invoice fields such as supplier information, invoice number, and currency.
  • Receipts Japan - Recommended for Japanese receipt documents. You can use the extractor to identify and extract fields such as merchant name, transaction date, total amount, tax, and currency from Japanese-language receipts.
有关更多信息,请访问提取文档数据

2.17.4

Release date: March 16, 2026

错误修复

Fixed an issue where the Classify Document and Extract Document Data activities returned a resource not found error after migrating a DU project. Even when you configured the activities to use a tag, they internally used version numbers to locate classifiers and extractors. Because version numbers reset during migration, the activities could not find the correct resources. The activities now use the configured tag to locate resources. As part of this fix, the ProjectVersionName property is no longer visible in Studio for these activities.

已知问题

After upgrading to UiPath.DocumentUnderstanding.Activities version 2.17.0 or 2.17.4, if Generate Data Type is enabled in Studio Desktop, the Extract Document Data activity may throw the following error: <type> is ambiguous in the namespace <namespace>.

This issue will be resolved in an upcoming Studio Desktop release.

2.17.0(最新版本)

发布日期:2025 年 10 月 28 日

新增功能

在分类期间对文档中的页面重新排序

为了获得更大的灵活性,使用分类站点时,您现在可以在文档中对页面进行重新排序。要启用此功能,请使用“创建分类验证任务”“创建分类验证任务并等待”活动中的EnablePageReordering属性。

验证站点精简模式

“验证站点”现可配合新界面一起使用:“紧凑显示模式”。这提供了更多的字段空间,更容易高亮显示需要注意的字段、集中的业务检查部分以及许多其他以验证人为中心的功能。要启用“紧凑模式”,请转到“创建验证任务”“创建验证任务并等待”活动,然后将“显示模式” 输入参数设置为“紧凑”。

错误修复

  • 修复了在“提取文档数据”活动中选择资产会导致设计时错误的问题
  • 修复了与通过分类站点处理文件以及对子文档进行后续数据提取操作相关的许多问题。

已知问题

After upgrading to UiPath.DocumentUnderstanding.Activities version 2.17.0 or 2.17.4, if Generate Data Type is enabled in Studio Desktop, the Extract Document Data activity may throw the following error: <type> is ambiguous in the namespace <namespace>.

This issue will be resolved in an upcoming Studio Desktop release.

Erratum April 16, 2026: Due to a mishap on our side, this known issue was not made available on the original announcement day.

2.16.1

发布日期:2025 年 9 月 11 日

错误修复

修复了导致 Action Center 中的某些操作无效的错误。仅当使用生成式提取程序或外部应用程序配置了提取文档数据活动时,才会发生此问题。

2.16.0

发布日期:2025 年 9 月 11 日

错误修复

我们修复了以下问题:在使用外部应用程序配置在 Document Understanding 新式项目中配置活动时,Studio 显示与租户相关的错误。

已知问题

当使用生成式提取程序或外部应用程序配置“提取文档数据”活动时,Action Center 中的操作将无效。此问题已在版本 2.16.1 中修复

v2.14.0

发行日期:2025 年 4 月 16 日

按分类的文档类型提取文档数据:根据分类操作的结果使用提取程序

在您的传统项目和新式项目中,您现在可以使用“提取 文档数据”活动中“分类 文档”活动的输出。这样,您就可以通过识别可以处理为DocumentData.DataType提供的文档类型的提取程序来自动选择要处理的适当提取程序。在提取程序列表中,为建议的提取程序选择“使用分类结果” 。有关使用分类结果选择提取程序的更多信息,请访问提取文档数据

新增功能

使用新的提取程序增强了提取功能

为了提供针对文档类别量身定制的提取功能,您现在可以使用名为“生成式预定义”的专用新式项目类型。此项目类型提供以下提取程序:

  • 长文档简单布局– 这是现有的生成式提取程序。
  • 长文档复杂布局(预览版)– 针对包含图像、手写内容、表单元素或其他复杂布局(例如浮动标注框)的长文档进行了优化。适合此提取程序的文档示例: 保险单或其他类似的具有复杂布局的长格式文档。
  • 短文档复杂布局(预览版)– 针对包含图像、手写内容、表单元素或其他复杂布局(如浮动标注框)的短文档进行了优化。例如:身份证或布局复杂的医疗保健登记表。

有关更多信息,请访问提取文档数据

使用标签和版本引用 Document Understanding 新式项目

要使用模型的快照,活动和 API 现在允许您在分类和提取期间使用项目的某些版本。“标签”“版本”属性为使用已发布模型的版本提供了精细控制。有关使用 DocumentUnderstanding.Activities 版本的更多信息,请访问分类文档提取文档数据。有关在项目中公开版本的信息,请访问文档详细信息。有关用于使用标签和版本的新可用 API 的信息,请访问发现 API数字化 API

支持本地部署设置中的活动

现在,即使机器人已连接到本地 Orchestrator,您也可以使用“分类文档”“提取文档数据”活动。在设计时,您可以使用来自不同组织或租户的 Document Understanding 资源。同样,连接到 Studio 中的本地 Orchestrator 时,您也可以在运行时执行这些活动。

新的设计时外部连接运行时外部连接属性允许您直接使用外部应用程序凭据或存储在 Orchestrator 中的凭据,以在设计时或运行时访问 Document Understanding 资源。

注意:确保为所选租户启用了 Document Understanding。如果您创建运行时外部连接,请确保您同时将 AI Unit 分配给了选定的租户。

改进

  • 对于生成式预定义项目,现有的生成式提取程序现在称为长文档简单版式提取程序
  • 为生成式项目类型选择提取程序时,分类文档和提取文档数据活动中的以前的提示集合已重命名为文档类型详细信息,它更准确地描述了集合的目的。
    • 在更新后的“文档类型”详细信息集合中,先前的“生成式提示”列现在为“指令”“说明”字段表示您要提供的有关应从特定字段名称提取的信息的说明。

    有关更新的详细信息,请查看“分类文档”“提取文档数据”活动。

  • 文档处理工作流的数字化部分现在可以识别并返回包含带引号圈出的值、带下划线的值或划掉的值的文档中的数据。

v2.12.1

发布日期:2024 年 11 月 19 日

错误修复

由于默认超时,长时间运行的分类和提取流程失败。我们现在考虑将活动中设置的所有超时的总和作为所有后台操作的全局超时。此外,我们改进了错误消息,以便在此特定情况下更好地明确失败原因。

v2.4.5

发布日期:2024 年 10 月 21 日

错误修复

此版本解决了“AI Unit 使用概述”仪表板中因数据缺失而显示“未知”部分的问题。

v2.9.6

发布日期:2024 年 10 月 14 日

错误修复

此版本解决了“AI Unit 使用概述”仪表板中因数据缺失而显示“未知”部分的问题。

v2.12.0

发布日期:2024 年 10 月 3 日

新增功能

禁用按需生成文档数据,以增强高级实施的灵活性

现在,您可以使用新的“生成数据类型”属性更改“提取文档数据”活动的输出类型。当您将此属性设置为 False 时,输出类型会从 IDocumentData<ExtractorType> 更改为IDocumentData<DictionaryData>。将“生成数据类型”设为 Flase 可简化检索和更改字段值的过程,并可让您更改“验证站点”中的文档类型。

访问“提取文档数据”“文档数据”页面,查看如何使用“生成数据类型”属性以及可以使用什么方法来访问提取结果。

改进

您现在可以设置 Orchestrator 存储桶,以便与“创建分类验证任务”“创建分类验证任务并等待”活动的“其他选项”一起使用。如果未创建特定存储桶,则可以创建一个默认存储桶。

错误修复

  • 在 Mac 机器人上运行 Studio Web 工作流失败,出现以下异常:“无法加载文件或程序集‘UiPath.DocumentUnderstanding.Common.SDK’”。
  • 手动更正文档中的某些数字或日期时,负责创建 Action Center 任务的活动发生崩溃。
  • 修复了恢复工作流时 Studio Web 中发生的错误。以前,在首次验证文档分类后会发生此错误,其中涉及从 Microsoft OneDrive 检索文件并在 Action Center 中对其进行验证。

v2.2.6

发布日期:2024 年 10 月 3 日

我们通过将常见依赖项更新为最新版本来提高产品稳定性。 此升级是自动的,不需要您执行任何操作。

v2.9.5

发行日期:2024 年 7 月 31 日

错误修复

尝试加载附加到UiPath™ Apps 中实体的文档时,Studio Web 中使用提取文档数据活动的工作流不再导致“System.InvalidOperationException”错误。

v2.9.4

发行日期:2024 年 7 月 12 日

错误修复

修复了导致文档分类失败并显示“提供了无效的请求 URI”错误的问题。

v2.9.3

发行日期:2024 年 6 月 20 日

错误修复

手动更正文档中的某些数字或日期时,负责创建 Action Center 任务的活动发生崩溃。

v2.4.3

发行日期:2024 年 6 月 5 日

我们通过将常见依赖项更新为最新版本来提高产品稳定性。 此升级是自动的,不需要您执行任何操作。

v2.9.2

发行日期:2024 年 6 月 5 日

我们通过修改某些依赖项提高了产品稳定性。

v2.9.1

发行日期:2024 年 5 月 27 日

改进

  • 提示大小从每个问题 500 个字符增加到 1000 个字符,以提高说明的清晰度。 此外,如果达到每个问题 1000 个字符的提示大小限制,您将收到“超出限制”错误。
  • 增强了“提取文档数据”活动的错误消息,使其清晰度更高,调试更容易。

错误修复

  • 使用“生成提取程序”和“生成分类器”活动后,或手动分配文档类型后,“验证站点”中的文档类型仍为“未知”。

v2.9.0

发布日期:2024 年 4 月 29 日

这些发行说明包含 2023 年 11 月至 2024 年 3 月之间进行的所有更新。

注意:如果从低于 v.2.4.1 的版本升级,请确保在升级版本后重新打开工作流

UiPath.DocumentUnderstanding.Activities package.

新增功能

提高提取文档数据的提取置信度

我们改进了“提取文档数据”活动,以提高分数准确性并减少验证时间。 此增强功能使用“自动验证”和“置信度阈值”属性,可根据生成模型对特定模型的提取结果进行交叉验证。

请访问提取文档数据,了解如何提高提取的置信度级别。

分类验证任务

我们很高兴地宣布,您现在可以参加以下活动:

改进

  • 现在,您可以将 Orchestrator 存储桶设置为与“ 创建验证任务” 以及“等待 创建验证任务” 活动的“ 其他选项 ” 一起使用。如果未创建特定存储桶,则可以创建一个默认存储桶。
  • 可选的“超时”属性现在可用于“提取文档数据”“分类文档”活动。 此参数配置活动的超时时间。
  • 现在,在提取文档数据活动中选择的提取程序将覆盖文档类型。 不适用于生成式模型。
  • 对于多值字段,系统将在“提取文档数据”活动的“文档数据”下返回所有值。这些值可在 DocumentData.Data.FieldName.MultiValues[] 中找到。
  • 此版本对文档数据对象进行了以下更新:
    • 文档类型 ”属性中的“ 名称 ”属性将替换为以下内容:
      • 定义模型的显示名称
      • 开箱即用模型的ID
    • 添加了两个新属性,并根据 Document Understanding 框架的结果填充:
      • ID
      • 显示名称

已知限制

当前处于预览阶段的现有 Document Understanding Insights 仪表板不再显示跨平台 DocumentUnderstanding.Activities 包中的数据。 现在,它们仅报告来自 IntelligentOCR.Activities 工作流的数据。

来自跨平台 DocumentUnderstanding.Activities 的数据现在在单独的新 Insights 仪表板中报告。

错误修复

  • 创建分类验证任务 活动的 分类 结果输出属性已重命名为 文档 数据。
    注意:
    如果CreatedClassificationValidationTask.ClassificationResults属性在当前工作流中,则在升级后将无法使用该属性。
  • 创建验证任务 活动的输出属性 提取 结果已重命名为 文档 数据。
    注意:
    如果您的工作流使用CreatedDocumentValidationTask.ExtractionResults属性,则在升级后将无法使用此属性。
  • 修复了“等待验证任务然后继续”活动无法识别3.1342,7格式的数字,从而导致“输入字符串的格式不正确”错误的问题。 现在完全支持所有数字格式。

v2.4.2

发行日期:2024 年 4 月 10 日

错误修复

解决了“提取文档数据”活动打开时出错,无法查看的错误,因为该活动未展开。

v2.4.1

发布日期:2023 年 11 月 1 日

生成式功能正式发布

我们很高兴地宣布,UiPath.DocumentUnderstanding.Activities 生成式功能现已正式发布。其中包括以下各项:
  • “分类文档”活动
  • 提取文档数据活动

新特性和改进功能

macOS 系统现在支持 UiPath.DocumentUnderstanding.Activities 包。

为以下活动添加了新属性“提取的字段验证置信度 (%)”:
  • 创建验证任务并等待
  • 等待文档验证任务然后继续

v2.4.0

发布日期:2023 年 10 月 11 日

Document Understanding 活动正式发布

我们很高兴地宣布,UiPath.DocumentUnderstanding.Activities 包现已正式发布。
注意:生成式功能仍处于公开预览阶段。

v2.2.4

发布日期:2023 年 9 月 28 日

新特性和改进功能

macOS 系统现在支持 UiPath.DocumentUnderstanding.Activities 包。

v2.2.3

发行日期:2023 年 5 月 11 日

错误修复

  • 我们修复了在使用模板时导致“提取文档数据”活动停止加载的错误。
  • 我们修复了 ActionCatalog 字段不适用于“创建文档验证操作”和“创建验证任务和等待”活动的错误。
  • 我们修复了在工作流中使用“分类文档”活动时导致错误的问题。

v2.2.2

发行日期:2023 年 5 月 11 日

错误修复

我们修复了一个错误,即用户在尝试使用通过“提取文档数据”活动提取的字段的值并且该值不存在时会收到错误。

已知问题

macOS 系统不支持 UiPath.DocumentUnderstanding.Activities 包。

v2.2.1

发行日期:2023 年 5 月 5 日

新特性和改进功能

提取 PDF 文本 活动是该包中的最新功能,可用于提取指定 PDF 文件中的所有字符,并将其存储在字符串变量中。 启用“应用 OCR” 选项时,它将使用 OCR 提取信息,禁用时,它将提取原生内容。

已更新两个活动的名称,并已更新一个活动的字段:

  • “创建文档验证任务” 变为“ 创建验证任务”。
  • “等待文档验证任务然后继续” 变为 “等待验证任务然后继续”。
  • “设置 PDF 密码”现在提供更详细的字段名称,例如:
    • 新的管理密码
    • 新的打开密码
    • 当前管理密码
    • 当前打开密码

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新