document-understanding
latest
false
- Document Understanding 发行说明
- ML 包和公共端点发行说明
Document Understanding 发行说明
Last updated 2024年10月31日
2022 年 3 月
改进
添加了有关“训练”、“验证”和“评估”文档类型的更多描述性工具提示。
错误修复
- 修复了一个已知问题,该问题导致搜索或下载文档时,如果文件名中含有需要 URL 编码的字符(
&
、,
、+
、#
、'
),则查询失败。 - 修复了导致“预测”功能在文本非常密集的文档上失败的错误。
改进
在文档搜索中实现,允许您仅在当前文档中搜索文本实例。这对于包含许多页面的文档尤其有用。搜索栏位于屏幕左下方,也可以使用快捷键
Ctrl
+ Shift
+ F
访问。
使用“预测”功能时,将删除手动标记的数据,并使用模型中的新值覆盖文档。
将数据集导入另一个 Document Manager 会话或运行训练管道时,不再使用
split.csv
。文件中的数据现在已集成到数据集中最新文件夹的 JSON 文件中,更确切地说,是在“子集”字段中。因此,如果您手动修改文件或将其从数据集中完全删除,则不会对模型的训练产生影响。但是,请注意,对于 21.10 ML 包版本或更低版本,该文件仍会保留以用于文档级别导出。
添加了永久删除单个文件的选项。此选项可以在文档名称旁边的下拉列表中找到,旁边是下载选项。