- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- BasicDataPoint Class - preview
- ExtractionResultHandler Class - preview
- Document Understanding ML
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式

Document Understanding 活动
发布日期:2026 年 2 月 25 日
重大变更
- Support for Windows-Legacy projects has been removed. Starting with this version, the package is compatible only with Windows projects.
-
Starting with this version, upgrading the package requires verifying that any downstream processing using the output of the Extract Document Data activity is still functioning correctly. The structure of the data returned by IXP projects has changed significantly. Therefore, it is strongly recommended to validate that any post-processing logic remains compatible.
What has changed:
- Results are now reported as Field Groups instead of Tables.
- Values now correctly reflect the field type defined in your Unstructured Documents IXP project.
- Monetary Quantity is now returned as a dedicated field type.
- Document Validation tasks automatically display results as Field Groups instead of Tables.
- Data manipulation logic must be updated to handle Field Group values accordingly.
新增功能
To provide extraction capabilities tailored to a specific non-Latin document layout, you can now use a dedicated modern project type called Predefined Non-Latin Languages in the Extract Document Data activity. This project type offers the following extractors:- Invoices Japan – Recommended for Japanse invoice documents. The extractor can handle common Japanese invoice layouts, and can identify and extract key invoice fields such as supplier information, invoice number, and currency.
- Invoices China - Recommended for Chinese invoice documents. The extractor can handle common Chinese invoice layouts, and can identify and extract key invoice fields such as supplier information, invoice number, and currency.
- Receipts Japan - Recommended for Japanese receipt documents. You can use the extractor to identify and extract fields such as merchant name, transaction date, total amount, tax, and currency from Japanese-language receipts.
Release date: March 16, 2026
错误修复
Fixed an issue where the Classify Document and Extract Document Data activities returned a resource not found error after migrating a DU project. Even when you configured the activities to use a tag, they internally used version numbers to locate classifiers and extractors. Because version numbers reset during migration, the activities could not find the correct resources. The activities now use the configured tag to locate resources. As part of this fix, the ProjectVersionName property is no longer visible in Studio for these activities.已知问题
<type> is ambiguous in the namespace <namespace>.
This issue will be resolved in an upcoming Studio Desktop release.
发布日期:2025 年 10 月 28 日
新增功能
在分类期间对文档中的页面重新排序
EnablePageReordering属性。
验证站点精简模式
“验证站点”现可配合新界面一起使用:“紧凑显示模式”。这提供了更多的字段空间,更容易高亮显示需要注意的字段、集中的业务检查部分以及许多其他以验证人为中心的功能。要启用“紧凑模式”,请转到“创建验证任务”或“创建验证任务并等待”活动,然后将“显示模式” 输入参数设置为“紧凑”。
错误修复
- 修复了在“提取文档数据”活动中选择资产会导致设计时错误的问题
- 修复了与通过分类站点处理文件以及对子文档进行后续数据提取操作相关的许多问题。
已知问题
<type> is ambiguous in the namespace <namespace>.
This issue will be resolved in an upcoming Studio Desktop release.
Erratum April 16, 2026: Due to a mishap on our side, this known issue was not made available on the original announcement day.
发布日期:2025 年 9 月 11 日
错误修复
修复了导致 Action Center 中的某些操作无效的错误。仅当使用生成式提取程序或外部应用程序配置了提取文档数据活动时,才会发生此问题。
发布日期:2025 年 9 月 11 日
错误修复
我们修复了以下问题:在使用外部应用程序配置在 Document Understanding 新式项目中配置活动时,Studio 显示与租户相关的错误。
已知问题
当使用生成式提取程序或外部应用程序配置“提取文档数据”活动时,Action Center 中的操作将无效。此问题已在版本 2.16.1 中修复。
发行日期:2025 年 4 月 16 日
按分类的文档类型提取文档数据:根据分类操作的结果使用提取程序
DocumentData.DataType提供的文档类型的提取程序来自动选择要处理的适当提取程序。在提取程序列表中,为建议的提取程序选择“使用分类结果” 。有关使用分类结果选择提取程序的更多信息,请访问提取文档数据。
新增功能
使用新的提取程序增强了提取功能
为了提供针对文档类别量身定制的提取功能,您现在可以使用名为“生成式预定义”的专用新式项目类型。此项目类型提供以下提取程序:
- 长文档简单布局– 这是现有的生成式提取程序。
- 长文档复杂布局(预览版)– 针对包含图像、手写内容、表单元素或其他复杂布局(例如浮动标注框)的长文档进行了优化。适合此提取程序的文档示例: 保险单或其他类似的具有复杂布局的长格式文档。
- 短文档复杂布局(预览版)– 针对包含图像、手写内容、表单元素或其他复杂布局(如浮动标注框)的短文档进行了优化。例如:身份证或布局复杂的医疗保健登记表。
有关更多信息,请访问提取文档数据。
使用标签和版本引用 Document Understanding 新式项目
支持本地部署设置中的活动
现在,即使机器人已连接到本地 Orchestrator,您也可以使用“分类文档”和“提取文档数据”活动。在设计时,您可以使用来自不同组织或租户的 Document Understanding 资源。同样,连接到 Studio 中的本地 Orchestrator 时,您也可以在运行时执行这些活动。
新的设计时外部连接和运行时外部连接属性允许您直接使用外部应用程序凭据或存储在 Orchestrator 中的凭据,以在设计时或运行时访问 Document Understanding 资源。
发布日期:2024 年 11 月 19 日
错误修复
由于默认超时,长时间运行的分类和提取流程失败。我们现在考虑将活动中设置的所有超时的总和作为所有后台操作的全局超时。此外,我们改进了错误消息,以便在此特定情况下更好地明确失败原因。
发布日期:2024 年 10 月 3 日
新增功能
禁用按需生成文档数据,以增强高级实施的灵活性
False 时,输出类型会从 IDocumentData<ExtractorType> 更改为IDocumentData<DictionaryData>。将“生成数据类型”设为 Flase 可简化检索和更改字段值的过程,并可让您更改“验证站点”中的文档类型。
改进
您现在可以设置 Orchestrator 存储桶,以便与“创建分类验证任务”和“创建分类验证任务并等待”活动的“其他选项”一起使用。如果未创建特定存储桶,则可以创建一个默认存储桶。
错误修复
- 在 Mac 机器人上运行 Studio Web 工作流失败,出现以下异常:“无法加载文件或程序集‘UiPath.DocumentUnderstanding.Common.SDK’”。
- 手动更正文档中的某些数字或日期时,负责创建 Action Center 任务的活动发生崩溃。
- 修复了恢复工作流时 Studio Web 中发生的错误。以前,在首次验证文档分类后会发生此错误,其中涉及从 Microsoft OneDrive 检索文件并在 Action Center 中对其进行验证。
发行日期:2024 年 7 月 31 日
错误修复
尝试加载附加到UiPath™ Apps 中实体的文档时,Studio Web 中使用提取文档数据活动的工作流不再导致“System.InvalidOperationException”错误。发行日期:2024 年 5 月 27 日
改进
- 提示大小从每个问题 500 个字符增加到 1000 个字符,以提高说明的清晰度。 此外,如果达到每个问题 1000 个字符的提示大小限制,您将收到“超出限制”错误。
- 增强了“提取文档数据”活动的错误消息,使其清晰度更高,调试更容易。
错误修复
- 使用“生成提取程序”和“生成分类器”活动后,或手动分配文档类型后,“验证站点”中的文档类型仍为“未知”。
发布日期:2024 年 4 月 29 日
这些发行说明包含 2023 年 11 月至 2024 年 3 月之间进行的所有更新。
UiPath.DocumentUnderstanding.Activities package.
新增功能
提高提取文档数据的提取置信度
我们改进了“提取文档数据”活动,以提高分数准确性并减少验证时间。 此增强功能使用“自动验证”和“置信度阈值”属性,可根据生成模型对特定模型的提取结果进行交叉验证。
请访问提取文档数据,了解如何提高提取的置信度级别。
分类验证任务
我们很高兴地宣布,您现在可以参加以下活动:
- 创建分类验证任务:允许您在 Action Center 中创建验证任务。
- 创建分类验证任务并等待: 允许您在 Action Center 中创建验证任务并暂停工作流,直到完成。
- 等待分类验证任务然后继续:允许您暂停当前工作流的执行,直到指定的文档验证操作完成为止。
改进
- 现在,您可以将 Orchestrator 存储桶设置为与“ 创建验证任务” 以及“等待 并 创建验证任务” 活动的“ 其他选项 ” 一起使用。如果未创建特定存储桶,则可以创建一个默认存储桶。
- 可选的“超时”属性现在可用于“提取文档数据”和“分类文档”活动。 此参数配置活动的超时时间。
- 现在,在提取文档数据活动中选择的提取程序将覆盖文档类型。 不适用于生成式模型。
- 对于多值字段,系统将在“提取文档数据”活动的“文档数据”下返回所有值。这些值可在
DocumentData.Data.FieldName.MultiValues[]中找到。 - 此版本对文档数据对象进行了以下更新:
- “ 文档类型 ”属性中的“ 名称 ”属性将替换为以下内容:
- 自定义模型的显示名称
- 开箱即用模型的ID
- 添加了两个新属性,并根据 Document Understanding 框架的结果填充:
- ID
- 显示名称
- “ 文档类型 ”属性中的“ 名称 ”属性将替换为以下内容:
已知限制
当前处于预览阶段的现有 Document Understanding Insights 仪表板不再显示跨平台 DocumentUnderstanding.Activities 包中的数据。 现在,它们仅报告来自 IntelligentOCR.Activities 工作流的数据。
来自跨平台 DocumentUnderstanding.Activities 的数据现在在单独的新 Insights 仪表板中报告。
错误修复
- 创建分类验证任务 活动的 分类 结果输出属性已重命名为 文档 数据。
注意:如果
CreatedClassificationValidationTask.ClassificationResults属性在当前工作流中,则在升级后将无法使用该属性。 - 创建验证任务 活动的输出属性 提取 结果已重命名为 文档 数据。
注意:如果您的工作流使用
CreatedDocumentValidationTask.ExtractionResults属性,则在升级后将无法使用此属性。 - 修复了“等待验证任务然后继续”活动无法识别
3.1342,7格式的数字,从而导致“输入字符串的格式不正确”错误的问题。 现在完全支持所有数字格式。
发布日期:2023 年 11 月 1 日
生成式功能正式发布
- “分类文档”活动
- 提取文档数据活动
新特性和改进功能
macOS 系统现在支持 UiPath.DocumentUnderstanding.Activities 包。
- 创建验证任务并等待
- 等待文档验证任务然后继续
发布日期:2023 年 10 月 11 日
Document Understanding 活动正式发布
发行日期:2023 年 5 月 11 日
错误修复
- 我们修复了在使用模板时导致“提取文档数据”活动停止加载的错误。
- 我们修复了
ActionCatalog字段不适用于“创建文档验证操作”和“创建验证任务和等待”活动的错误。 - 我们修复了在工作流中使用“分类文档”活动时导致错误的问题。
发行日期:2023 年 5 月 11 日
错误修复
我们修复了一个错误,即用户在尝试使用通过“提取文档数据”活动提取的字段的值并且该值不存在时会收到错误。
已知问题
macOS 系统不支持 UiPath.DocumentUnderstanding.Activities 包。
- 3.0.0 - preview
- 重大变更
- 新增功能
- 2.17.4
- 错误修复
- 已知问题
- 2.17.0(最新版本)
- 新增功能
- 错误修复
- 已知问题
- 2.16.1
- 错误修复
- 2.16.0
- 错误修复
- 已知问题
- v2.14.0
- 按分类的文档类型提取文档数据:根据分类操作的结果使用提取程序
- 新增功能
- 使用新的提取程序增强了提取功能
- 使用标签和版本引用 Document Understanding 新式项目
- 支持本地部署设置中的活动
- 改进
- v2.12.1
- 错误修复
- v2.4.5
- 错误修复
- v2.9.6
- 错误修复
- v2.12.0
- 新增功能
- 禁用按需生成文档数据,以增强高级实施的 灵活性
- 改进
- 错误修复
- v2.2.6
- v2.9.5
- 错误修复
- v2.9.4
- 错误修复
- v2.9.3
- 错误修复
- v2.4.3
- v2.9.2
- v2.9.1
- 改进
- 错误修复
- v2.9.0
- 新增功能
- 改进
- 已知限制
- 错误修复
- v2.4.2
- 错误修复
- v2.4.1
- 生成式功能正式发布
- 新特性和改进功能
- v2.4.0
- Document Understanding 活动正式发布
- v2.2.4
- 新特性和改进功能
- v2.2.3
- 错误修复
- v2.2.2
- 错误修复
- 已知问题
- v2.2.1
- 新特性和改进功能