
Document Understanding 发行说明
发布日期:2025 年 11 月 11 日
Document Understanding™ 2.2510 长期支持版本
新角色和权限
此版本引入了一个新角色,即 Document Understanding 数据注释者。拥有此角色的用户专为文档注释而设计,无法删除文档,这样可以维护安全的数据管理流程。
我们还启用了一个新权限 Documents.Delete。获得此权限的用户可以删除文档。拥有此权限的角色包括:
- Document Understanding 管理员
- Document Understanding 开发者
- Document Understanding Model Trainer
有关角色和权限的更多信息,请查看“基于角色的访问控制”页面。
持续支持 API 密钥
尽管 Automation Cloud™ 服务的 API 密钥身份验证将被移除,但 Document Understanding™ 是例外。在安全性方面,Document Understanding 中的 API 密钥身份验证与个人访问令牌 (PAT) 一样安全。因此,您可以继续使用 API 密钥访问模型端点,同时保证您的 UiPath 资源的安全。
有关删除 API 密钥和过渡到 PAT 的更多信息,请访问Automation Cloud 即将删除的内容和从 API 密钥迁移到个人访问令牌 (PAT) 。
统一定价,一种创新的许可模式
Unified Pricing 带来了新的许可计划、用户许可证和整合消耗单元。我们还高兴地宣布,Document Understanding 现在通过 Unified Pricing 提供,其许可证消耗量按 Platform Units 来衡量。
有关此新许可模型的更多信息,请访问“Unified Pricing:许可计划框架”页面。有关许可概述信息,请参阅《Automation Cloud 管理员指南》和《Overview 指南》。
比较模型
您现在可以对两个不同分类模型与提取模型版本的性能指标进行比较,从而深入评估其效能表现并及时获取版本迭代的优化细节。
该新功能通过提供直观的比较视图,简化了用户跟踪模型改进与变更的方式。
有关更多信息,请查看“度量”页面中的“比较模型”部分。
使用来自验证站点的数据训练模型
您现在可以使用在验证站点中验证的文档,进一步提高模型的性能。请访问“模型重新训练”操作方法页面,以了解有关如何收集重新训练候选对象以及如何利用这些候选对象重新训练模型的更多详细信息。
您目前只能重新训练使用 UiPath.DocumentUnderstanding.Activities 包处理的文档。使用此活动包处理并在验证站点中验证的所有文档都会自动收集,可用于重新训练。
文档类型管理器中的分类字段
“文档类型管理器”中现在通常提供分类字段。分类字段是整体引用文档的数据点。例如,收据的费用类型(伙食、住宿、航空或交通)或发票的币种(美元、欧元、日元)是分类字段。
有关更多信息,请查看《Document Understanding 新式项目用户指南》中“构建”页面的“分类字段”部分。
已知限制
- 使用“提取文档数据”活动时,分类字段支持新式项目提取程序和开箱即用的模型,但不支持传统项目提取程序。
- 只有训练成功后,才会为自定义文档类型提取分类字段。
- 我们添加了一个新的“删除”按钮,以防数据集导出失败。您现在可以使用此按钮删除导出失败的数据集,然后重试。
- 现在,您可以更改从传统项目和新式项目以 zip 文件形式导入的文档的文档类型。
- 您现在可以在列表中对注释字段重新排序。从“文档类型管理器”访问此功能。
- 为改善体验,在以下情况下更新字段类型时,我们更新了
dmyParsing属性:- 将字段类型从
non-date更改为Date时,dmyParsing属性设置为“自动”。 - 将字段类型从
Date更改为non-date时,dmyParsing属性设置为 null。 -
高级指标文件现在包含文件和标签的实际名称。 本次更新对过去仅包含文件和标签名称 GUID 值的高级指标文件进行了改进。
- 将字段类型从
- 我们增强了表格标注功能。您现在可以独立对表中的单个行进行标注和确认,而不会影响表格的其余部分。
- 现在,用户可以在“批注服务”中按“批注字段名称”筛选文档时,排除标记为缺失的字段。
- 全新的CPU 推理功能减少了对 GPU 资源的依赖,让您只需使用两个 GPU 即可运行 Document Understanding。有关更多信息,请参阅其他 Document Understanding 新式项目要求部分。