- 概述
- 文档处理合同
- 发行说明
- 关于文档处理合同
- Box 类
- IPersistedActivity 接口
- PrettyBoxConverter 类
- IClassifierActivity 接口
- IClassifierCapabilitiesProvider 接口
- 分类器文档类型类
- 分类器结果类
- 分类器代码活动类
- 分类器原生活动类
- 分类器异步代码活动类
- 分类器文档类型功能类
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- 提取程序异步代码活动类
- 提取程序代码活动类
- 提取程序文档类型类
- 提取程序文档类型功能类
- 提取程序字段功能类
- 提取程序原生活动类
- 提取程序结果类
- FieldValue Class
- FieldValueResult Class
- ICapabilitiesProvider 接口
- IExtractorActivity 接口
- 提取程序有效负载类
- 文档操作优先级枚举
- 文档操作数据类
- 文档操作状态枚举
- 文档操作类型枚举
- 文档分类操作数据类
- 文档验证操作数据类
- 用户数据类
- 文档类
- 文档拆分结果类
- DomExtensions 类
- 页类
- 页面分区类
- 多边形类
- 多边形转换器类
- 元数据类
- 词组类
- 词类
- 处理源枚举
- 结果表格单元类
- 结果表值类
- 结果表列信息类
- 结果表类
- 旋转枚举
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- 分区类型枚举
- 词组类型枚举
- IDocumentTextProjection 接口
- 分类结果类
- 提取结果类
- 结果文档类
- 结果文档范围类
- 结果数据点类
- 结果值类
- 结果内容引用类
- 结果值令牌类
- 结果派生字段类
- 结果数据源枚举
- 结果常量类
- 简单字段值类
- 表字段值类
- 文档组类
- 文档分类类
- 文档类型类
- 字段类
- 字段类型枚举
- FieldValueDetails Class
- 语言信息类
- 元数据输入类
- 文本类型枚举
- 类型字段类
- ITrackingActivity 接口
- ITrainableActivity 接口
- ITrainableClassifierActivity 接口
- ITrainableExtractorActivity 接口
- 可训练的分类器异步代码活动类
- 可训练的分类器代码活动类
- 可训练的分类器原生活动类
- 可训练的提取程序异步代码活动类
- 可训练的提取程序代码活动类
- 可训练的提取程序原生活动类
- 基本数据点类 - 预览
- 提取结果处理程序类 - 预览
- Document Understanding ML
- 发行说明
- Document Understanding OCR 本地服务器
- Document Understanding
- 智能 OCR
- 发行说明
- 关于“智能 OCR”活动包
- 项目兼容性
- 加载分类
- 将文档数字化
- 分类文档作用域
- 基于关键词的分类器
- Document Understanding 项目分类器
- 智能关键词分类器
- 创建文档分类操作
- 创建文档验证工件
- 检索文档验证工件
- 等待文档分类操作然后继续
- 训练分类器范围
- 基于关键词的分类训练器
- 智能关键词分类训练器
- 数据提取作用域
- Document Understanding 项目提取程序
- Document Understanding 项目提取程序训练器
- 基于正则表达式的提取程序
- 表单提取程序
- 智能表单提取程序
- 文档脱敏
- 创建文档验证操作
- 等待文档验证操作然后继续
- 训练提取程序范围
- 导出提取结果
- 机器学习提取程序
- 机器学习提取程序训练器
- 机器学习分类器
- 机器学习分类训练器
- 生成分类器
- 生成式提取程序
- 配置身份验证
- ML 服务
- OCR
- OCR 合同
- OmniPage
- PDF
- [未公开] Abbyy
- [未列出] Abbyy 嵌入式

Document Understanding 活动
发行说明
附录:添加于 2026 年 2 月 3 日
The UiPath.DocumentUnderstanding.ML.Activities package is automatically installed with the UiPath.IntelligentOCR.Activities package to perform ML-based classification and extraction.
Starting 2026, the release notes for the Document Understanding ML activity package will be provided in the Intelligent OCR activities section.
Do not install UiPath.DocumentUnderstanding.ML.Activities package as a separate package in you automation as the correct version will be automatically installed when you install the UiPath.IntelligentOCR.Activities package.
v1.36.3
发布日期:2026 年 3 月 16 日
改进
提高了 PDF 处理性能,减少了大型文件的数字化时间。
v1.36.2
发布日期:2025 年 12 月 16 日
新增功能
支持 Maestro 中基于名称的绑定和可重新映射的 IXP 项目资源
我们增加了对在 Maestro 中按名称引用 IXP 项目的支持,并引入了在部署期间将项目重新映射为资源的功能。
v1.33.0
发行日期:2025 年 4 月 16 日
新增功能
使用新的生成式提取程序增强提取功能
为了增强具有复杂布局的短文档和长文档的生成式提取功能,您现在可以在为文档字段配置提取程序时选择以下生成式提取程序:
- Short Documents Simple Layout – This is the existent Generative Extractor.
- Long Documents Complex Layout (Preview) – Optimized for long form documents that include images, handwriting, form elements or other complex layouts, such as floating callout boxes. Examples of documents that are suitable for this extractor: insurance policies, or other similar long form documents with complex layouts.
- Short Document Complex Layout (Preview) – Optimized for short documents that include images, handwriting, form elements or other complex layouts like floating callout boxes. For example: identity cards, or healthcare intake forms with complex layouts.
改进
- When using the Generative Extractor inside a Data Extraction Scope, the Manage Prompt button has been renamed to Manage Field Details. Additionally, inside the Generative Extractor Prompt wizard, the Prompt value has been renamed to Field details. These changes accurately describe purpose of the instructions given to the generative extractors for a specific field.
- When using the Generative Classifier inside a Classify Document Scope, the Manage Prompt button has been renamed to Manage Document Types. Additionally, inside the Generative Classifier Prompt wizard, the Prompt value has been renamed to Document Type details. These changes accurately describe the purpose of the instructions given to the generative classifier for a specific document type.
v1.31.2
发布日期:2024 年 11 月 26 日
错误修复
In the Configure Extractors menu, selecting Get or refresh extractor capabilities for an extractor trainer under the Train Extractors Scope activity did not open as expected.
v1.24.1
发布日期:2024 年 10 月 21 日
错误修复
This version resolves the Unknown sections in the AI Units consumption overview dashboard that were caused by missing data.
v1.28.8
发布日期:2024 年 10 月 14 日
错误修复
This version resolves the Unknown sections in the AI Units consumption overview dashboard that were caused by missing data.
v1.31.1
发布日期:2024 年 10 月 3 日
This package version is compatible with UIAutomation.Activities versions that are 24.10.0 or later.
新增功能
支持本地部署设置中的活动
You can now use the Generative Classifier and Generative Extractor activities within a Classify Document Scope and Data Extraction Scope, even if the robot is connected to a local Orchestrator.
We've added the RuntimeTenantURL and RuntimeCredentialsAsset properties to the Generative Classifier and Extractor activities. With these properties, you can now directly use credentials from external applications, stored in Orchestrator, to access Document Understanding resources at runtime. To achieve this, ensure that your selected tenant has Document Understanding enabled and AI Units allocated.
改进
提示大小从每个问题 500 个字符增加到 1000 个字符,以提高说明的清晰度。
错误修复
ML 提取程序返回了空值,从而导致验证任务由于 null 值属性而失败。
v1.28.7
发行日期:2024 年 8 月 13 日
我们升级了一些内部依赖项以提高性能。
v1.28.6
发行日期:2024 年 7 月 31 日
错误修复
使用生成分类器和生成提取程序活动时,输入以空格开头或结尾的提示会导致“KeyNotFoundException”错误,并显示“字典中没有给定的键”消息。
v1.28.5
发行日期:2024 年 7 月 12 日
错误修复
修复了导致文档分类失败并显示“提供了无效的请求 URI”错误的问题。
v1.28.4
发行日期:2024 年 6 月 20 日
我们一直在不断努力改善您的 UiPath Document Understanding 体验。 即使此发行版没有进行重大的主要更改,我们也要确保对产品进行次要改进和辅助功能修复。
v1.28.3
发行日期:2024 年 6 月 5 日
我们通过修改某些依赖项提高了产品稳定性。
v1.28.2
发行日期:2024 年 5 月 27 日
改进
提示大小从每个问题 500 个字符增加到 1000 个字符,以提高说明的清晰度。 此外,如果达到每个问题 1000 个字符的提示大小限制,您将收到“超出限制”错误。
错误修复
ML 提取程序返回了空值,从而导致验证任务由于 null 值属性而失败。
已知问题
如果生成式提取程序或分类器触发Content Filtered异常,则该活动不会生成任何结果,就像内容缺失一样。 机器人日志中将显示以下警告消息: GPT refused to handle the request because of content filtering policy. Returning empty result.从 Studio 启动自动化时,Studio 中也会显示此消息。
v1.28.1
发布日期:2024 年 4 月 29 日
新功能
机器学习提取程序现在可以提取垂直文本,从而显着增强提取功能。
v1.24.0
发布日期:2023 年 11 月 1 日
生成式功能正式发布
We are excited to announce that the UiPath.DocumentUnderstanding.ML.Activities generative features are now in general availability. This includes the following:
- 生成式分类器活动
- 生成式提取程序活动
You can use the new generative features with the UiPath.IntelligentOCR.Activities framework.
新特性和改进功能
- A new property, Output Folder, is available for the Machine Learning Classifier Trainer activity. This property allows you to save files locally.
- 现已提供对多页字段的支持。例如,当地址需要一页包含街道,而下一页包含州和邮政编码时,此功能非常有用。由于一个已知问题,表格行当前在此示例中无效。请关注我们的发行说明,以获取日后的更新。
v1.21.2
发行日期:2023 年 6 月 7 日
我们一直在不断努力改善您的 UiPath Document Understanding 体验。 即使此发行版没有进行重大的主要更改,我们也要确保对产品进行次要改进和辅助功能修复。
v1.21.1
发行日期:2023 年 4 月 26 日
弃用时间表
我们建议您定期查看弃用时间表,以获取有关针对即将弃用和删除功能的任何更新。
v1.17.1
发行日期:2023 年 3 月 27 日
新特性和改进功能
我们一直在不断努力改进 UiPath.DocumentUnderstanding.ML.Activities 包。 即使此补丁版本没有进行重大的主要更改,我们也要确保对产品进行次要改进和辅助功能修复。
v1.18.0
发行日期:2022 年 12 月 15 日
新特性和改进功能
- UiPath Studio 用户界面现已提供繁体中文版本。
- You can now benefit from the API Key field being pre-populated for the following activities included in the UiPath.DocumentUnderstanding.ML.Activities package: Machine Learning Classifier and Machine Learning Extractor.
v1.17.0
发行日期:2022 年 10 月 24 日
新特性和改进功能
- The Machine Learning Extractor Trainer activity can now support multivalued fields.
- The UseServerSideOCR option is scheduled to be deprecated on December 2022. We recommend using the default behavior. More details about the deprecation can be found here.
- The Document Understanding Process Studio template has been upgraded to a new version. The UiPath.DocumentUnderstanding.ML.Activities package is a dependency for this template.
错误修复
- 通过升级 PDF 库并使用混合 OCR 功能,修复了在使用数字化器时导致提取错误的错误。
- 修复了一个错误,该错误会导致在同时需要图像和 DOM 时将不一致的输入发送到 ML 提取程序。
- 从机器学习提取程序收到的
GetCapabilities调用中未使用代理设置。此错误现已修复,代理设置可按预期使用。
v1.13.2
发行日期:2022 年 5 月 9 日
改进
- The UiPath.DocumentUnderstanding.ML.Activities package has been upgraded to .NET5 portable, allowing you to run them on Linux robots.
- The Machine Learning Extractor Trainer and the Machine Learning Classifier Trainer activities have received new parameters grouped under the name of Public Datasets, allowing you to use public datasets instead of private ones.
- The Machine Learning Extractor activity has been updated and now the extraction algorithm can also be used from Forms AI, not only from the ML Models list.
- The Machine Learning Extractor activity can now be used with a public endpoint in airgapped scenarios.
错误修复
Fixed a bug occurring on the Machine Learning Extractor Trainer activity that was exporting values even if the field was not mapped in the Configure Trainer wizard. Now, everything works as expected.
v1.9.2
发布日期:2023 年 8 月 3 日
错误修复
在 Document Understanding ML 活动包中,部分必填字段未进行相应标记。现在,所有必填字段都按预期进行了可视标记。
v1.9.1
发布日期:2021 年 10 月 5 日
新特性和改进功能
- 此版本将遥测客户端更新到版本 1.5.3,作为改进。
- The UiPath.DocumentUnderstanding.ML.Activities package has been upgraded to .NET5. While both .NET versions continue to be supported, the .NET5 projects can only work on 64-bit architectures.
- Added the Dataset and Project parameters to the Machine Learning Extractor Trainer activity which allow you to select where to upload your training data in your AI Center tenant. As a result, the Endpoint and MLSkill parameters were removed from the activity.
- Added the Endpoint parameter to the Machine Learning Classifier activity which provides the ability to use the activity with public ML Skills.
- The Machine Learning Extractor can now be integrated with Forms AI. The only requirement for this to happen is to make sure that the UseServerSideOCR option is disabled.
v1.7.0
发布日期:2021 年 3 月 29 日
新特性和改进功能
- Released the Machine Learning Classifier and Machine Learning Classifier Trainer activities as part of the Machine Learning Document Classification functionality which helps you classify documents using a custom trained ML model. Machine Learning Classifier could prove to be very useful particularly in scenarios with high diversity in document sets. To train the classifier and improve its results with time with the aid of human validation, you can use the sister activity, Machine Learning Classifier Trainer.
- 改进了对 PDF 文件的处理。
v1.5.2
发行日期:2020 年 11 月 11 日
错误修复
- 如果从 AI Fabric 请求“ML 技能”列表时出现故障响应,则现在也可以对 5XX HTTP 状态代码进行自动重试。
- 如果出现网络故障而不是阻止重试操作,机器学习提取程序现在将会重试以连接到 AI Fabric。
v1.5.1
发行日期:2020 年 10 月 20 日
改进
机器学习提取程序的更详细的错误记录。
错误修复
- 为“ML 技能”请求添加了重试机制。
- 修复了机器学习提取程序活动无法使用所有 ML 技能的问题。
v1.5.0
发行日期:2020 年 10 月 5 日
新特性和改进功能
- 发布了新的机器学习提取程序训练器活动,可以根据人工验证结果为重新训练 ML 模型准备数据。
- 在机器学习提取程序训练器中添加了“获取或刷新提取程序功能”功能,该功能可轻松将分类字段与可用的提取程序字段进行映射。
- 机器学习提取程序活动中包含一个名为“超时(毫秒)”的新参数。该参数可用于指定在引发错误之前等待服务器响应的时间。
- Changed the tooltip text on UseServerSideOCR property for Machine Learning Extractor to indicate it is incompatible with Machine Learning Extractor Trainer.
v1.2.2
发行日期:2020 年 8 月 24 日
错误修复
- 修复了在某些情况下为 Kerberos 或 NTLM 身份验证请求返回
407ProxyAuthenticationRequired错误消息的问题。这适用于机器学习提取程序。 - 修复了提供某个端点导致机器学习提取程序的“获取功能”功能不起作用的问题。
- 修复了未连接机器人的情况下导致机器学习提取程序引发错误的问题。
v1.2.1
发行日期:2020 年 6 月 5 日
新特性和改进功能
此版本带来了适用于机器学习提取程序活动的新选项(名为“ML 技能”),可让您使用 AI Fabric 中存储的模型。
v1.1.0
发行日期:2020 年 5 月 4 日
新特性和改进功能
已向机器学习提取程序添加了名为 UseServerSideOCR 的新选项。此选项使您可以使用从数字化接收的 OCR 结果。
机器学习提取程序现在声明了内部分类法,使您可以在数据提取范围的“配置提取程序”向导中轻松地将其可以提取的字段映射到您在分类法中定义的字段。
v1.0.0
发行日期:2020 年 2 月 11 日
新特性和改进功能
UiPath.DocumentUnderstanding.ML.Activities 包可在使用 AI 方法时,实现从收据和发票中提取信息的自动化。
- 附录:添加于 2026 年 2 月 3 日
- v1.36.3
- 改进
- v1.36.2
- 新增功能
- v1.33.0
- 新增功能
- 使用新的生成式提取程序增强提取功能
- 改进
- v1.31.2
- 错误修复
- v1.24.1
- 错误修复
- v1.28.8
- 错误修复
- v1.31.1
- 新增功能
- 支持本地部署设置中的活动
- 改进
- 错误修复
- v1.28.7
- v1.28.6
- 错误修复
- v1.28.5
- 错误修复
- v1.28.4
- v1.28.3
- v1.28.2
- 改进
- 错误修复
- 已知问题
- v1.28.1
- 新功能
- v1.24.0
- 生成式功能正式发布
- 新特性和改进功能
- v1.21.2
- v1.21.1
- 弃用时间表
- v1.17.1
- 新特性和改进功能
- v1.18.0
- 新特性和改进功能
- v1.17.0
- 新特性和改进功能
- 错误修复
- v1.13.2
- 改进
- 错误修复
- v1.9.2
- 错误修复
- v1.9.1
- 新特性和改进功能
- v1.7.0
- 新特性和改进功能
- v1.5.2
- 错误修复
- v1.5.1
- 改进
- 错误修复
- v1.5.0
- 新特性和改进功能
- v1.2.2
- 错误修复
- v1.2.1
- 新特性和改进功能
- v1.1.0
- 新特性和改进功能
- v1.0.0
- 新特性和改进功能