- Document Understanding 发行说明
- 2026 年 3 月
- 2026 年 2 月
- 2026 年 1 月
- ML 包和公共端点发行说明

Document Understanding 发行说明
错误修复
提高了针对特定供应商的提取可靠性
布局 LM 和 Helix 等提取模型不再跳过某些文档供应商的特定字段。现在,字段提取在受支持的供应商中的行为是一致的。
Document Understanding API v2(预览版)
Document Understanding API v2 在提取结果中添加了分类驱动的提取和验证、业务规则评估、扩展的非拉丁语言支持以及 IXP 字段组支持。
新增功能
- 发现在响应中返回关联的分类,因此您可以使用它来指导提取和验证。
- “提取”和“验证”接受分类作为输入参数。这将实现部分提取、数据类型覆盖和其他验证自定义(例如,更改字段热键或显示颜色)。
- 在提取和验证期间,API 会评估分类中定义的业务规则,以确保提取的数据符合配置的要求,例如必填字段和允许的值。
- 预定义的项目现在使用名为Production 的单个标签支持基于标签的提取 。
- IXP 提取结果现在以字段组(而不是表格)的形式返回。使用字段组时,每个字段都会保留其实际的 IXP 数据类型(例如,
Date、Number、MonetaryQuantity)。 - 新的预定义项目可提供对非拉丁字符集的增强支持。
重大变更
从Document Understanding API v1 升级到 v2时,请更新您的自动化以进行以下更改:
- 基于标签的路由现在使用
/projects/{projectId}/tags/{tag}/...。在 v2 中,使用先前路由结构的请求将返回400 错误请求。 - 已从发现响应中删除
fields属性。请改用taxonomy。 - 发现路由现在返回
tags而不是tag。 - IXP 提取结果现在作为“字段组”而不是“表格”的形式返回,如果您的自动化当前将提取结果视为表格,以处理新的 “字段组”结构和数据类型,则需要更新更新。
- 更新用于检查“字段类型 == 表格”的逻辑。在 v2 中,这些条目将返回 “FieldType”==“FieldGroup”。如果您的解析器仅处理Table ,那么它会忽略数据。
字段组和货币数量支持(预览版)
“预览”现已在“验证站点”、“活动”和“API”中提供“字段组”和“货币数量”支持。
字段组可在“验证站点”中显示分层字段结构,从而对提取的数据进行逻辑组织。组可以是单值组、多值组或混合组,可以由字段和表格组成。字段组会保留所提取数据的层次结构,从而使大型多页文档数据包的验证更加轻松快捷。
新的 “货币数量”字段类型引入了专用的金额和货币数据类型,以消除提取和验证之间的数据类型不匹配问题。
此增强功能将 Document Understanding 数据类型模型与 IXP 非结构化和复杂文档保持一致。
错误修复
- 修复了下列问题:在(自定义)Apps 和(自定义)Action Apps 中,“验证控制”过早触发“就绪”组件回调事件,从而导致在“就绪”工作流中设置字段值等操作失败。
- 修复了下列问题:OpenAI 许可异常被错误地公开显示。
字段访问权限
根据角色,您可以分配字段访问权限。- Fields.Create 权限允许用户创建字段。
- Fields.Delete 权限允许用户删除现有字段。
- Fields.Read 权限允许用户查看字段。
- Fields.Update 权限允许用户更新现有字段。
拥有 Document Understanding 数据注释者角色或 Document Understanding 查看者角色的用户仅拥有 Fields.Read 权限。
拥有 Document Understanding 开发者、Document Understanding 模型训练者或 Document Understanding 管理员角色的用户拥有所有可用的字段权限。
租户级项目权限
租户级别新增了“项目”权限。项目创建现在通过 Projects.Create 权限在租户级别进行控制,而项目级别权限根据角色分配仅限于读取、更新和删除操作。
分配了 Document Understanding 管理员角色的用户可以使用新的 Projects.Create 权限创建项目。
有关更多信息,请查看“基于角色的访问控制”页面。