document-understanding
2020.10
false
- 入门指南
- 框架组件
- AI Center 中的 Document Understanding
- 管道
- ML 包
- Data Manager
- OCR 服务
- 许可
- 参考
已弃用
Document Understanding 用户指南
导出文档
已标记的图像是具有至少一个已标记字段(可以是任何类型)的图像。您可以在页面左上角查看有多少图像可见。“导出”按钮用于轻松导出数据以训练 ML 模型。
导出标签文档时会考虑活动筛选器。
- 如果没有应用筛选器,则系统会导出当前视图中所有可见的已标记图像,测试集图像除外。
- 如果应用了筛选器,则系统会导出视图中所有可见的已标记图像,包括测试集图像。
- 如果要导出所有测试集图像,请从筛选器下拉列表中选择“test-set”选项。
重要提示:
导出数据集时需满足以下条件:
- 在至少 10 个不同的图像上标记每个常规字段或列字段
- 每个分类字段的每个类至少出现一次
导出数据集后,该数据集将导出为压缩文件和日志文件。您需要先解压缩文件,然后才能在 AI Fabric 中使用该数据集。然后,可以按此处所述,将提取的文件夹作为新数据集或现有数据集上的子文件夹上传。