Document Understanding 发行说明
2023.4.0
通过查看自上次发布 LTS 到现在为止发生更改的下一个列表,及时了解有关 Document Manager 的所有最新消息。
“计算器”选项卡中的“数据集诊断”菜单下现在提供一个新选项。使用“计算器”选项卡了解所需的数据集大小,从而使经过训练的模型获得最佳准确性。您可以更新以下任何字段:“开箱即用文档类型”、“语言数量”或“布局数量”。在“计算器”选项卡中所做的更改会影响整个数据集的大小和准确性,这意味着可能需要更多已标记的训练数据。
Document Manager 会话中提供的搜索选项已重新设计,以提高可访问性。
我们将在 10 个位置(可能在同一页面上)标记数据的要求更改为 10 个不同的页面,从而提高了“导出数据”的准确性。
我们已更新重复周期少于 7 天的所有现有计划导出,现在它们反映了新的最短重复周期(7 天)。
If you create or configure a regular field of type date, you can now choose the date format: Auto, US style, or Non-US style, Auto being the default value. This feature applies to ML Packages version 22.10.2, or higher.
现在,对于长文档(超过 10 页),加载时间已缩短,浏览体验也得到了改善。
现在,在为多值字段添加标签时,字段值列表会自动展开。现在,在创建新项目时,“将 OCR 应用于 PDF”选项的默认值设置为“自动”。这意味着我们会尽可能地抓取 PDF 中的文本。如果在某些情况下这无法产生预期结果,请将此设置切换为“是”。
现在可以在 Document Manager 会话中将分类字段标记为隐藏。请注意,如果将分类字段标记为隐藏,则该字段不会包含在导出文件中,也不会包含在“数据集诊断字段”选项卡中。
适用于所有 AI 产品的新许可方法 AI Unit 现在可用于 Document Understanding。
已对导入大小限制进行了改进。我们删除了 Document Manager 类型导入的导入页面限制,但每次导入的大小限制为 4000 MiB。
如果您创建或配置类型为日期的常规字段,现在可以选择以下日期格式:“自动”、“美式样式”或“非美式样式”,默认值为“自动”。
不能将 / 键设置为表格快捷方式的热键,因为它已用作操作键。Enter 或 / 键可用于对跨多行文本的表格行进行分组。
已从 Document Manager 的“导入数据”对话框中删除“启用大型文档”复选框。默认情况下可以导入大型文档。
当您首次在 AI Center 独立离线环境中访问 Document Manager 会话时,系统会将您重定向到该环境中尚未启用的服务。当 Automation Suite 离线环境中的会话过期时,也会发生同样的情况。我们建议您关闭会话,然后重新打开会话。
""
)。
我们建议您定期查看弃用时间表,以获取有关针对即将弃用和删除功能的任何更新。