document-understanding
2020.10
false
- 入门指南
- 框架组件
- 数据提取训练概述
- 训练提取程序作用域的配置提取程序向导
- 机器学习提取程序训练器
- 数据提取训练相关活动
- AI Center 中的 Document Understanding
- 管道
- ML 包
- Data Manager
- OCR 服务
- 许可
- 参考
机器学习提取程序训练器
已弃用
Document Understanding 用户指南
Last updated 2024年7月29日
机器学习提取程序训练器
机器学习提取程序训练器会在所选目录中为您收集人工反馈。收集数据后,如果要重新训练 ML 模型,您只需压缩目录的内容,然后将其上传到 Data Manager 中进行策划。
与机器学习提取程序相同的规则适用于机器学习提取程序训练器。请参阅此处。
以下是使用“机器学习提取程序训练器”活动时需要遵循的步骤。
- 使用“分类管理器”向导定义文档类型和字段。
- 在“训练提取程序作用域”活动中拖动机器学习提取程序训练器。
- 在自动打开的“机器学习提取程序”向导中,添加端点信息。
- 如果您还希望使用输入的值作为活动(更确切地说是端点)的输入参数,请选中“更新活动参数”复选框。
- 单击“获取功能”按钮。完成此操作后,向导将关闭。
- 输入输出文件夹的值。
- 选择“训练提取程序作用域”的“配置提取程序”选项。系统将显示向导。
- 现在即可配置机器学习提取程序训练器。展开要应用的文档类型,然后单击相应字段旁边的复选框,开始选择要训练的字段。
- 手动填写文本框,或从可用的下拉列表中选择要映射到每个字段的正确数据。下拉列表包含机器学习提取程序训练器(使用在机器学习提取程序向导中输入的端点)声明为提取功能的所有字段。
注意:如果您单击复选框但将文本框留空,则后者将自动使用本地分类中的文档类型 ID 填充。保存后即将应用更改。如果您想避免对字段 ID 使用长字符串,我们建议您手动输入一个值,以防您无权访问提取程序的内部分类。
- 要检查您是否正在使用提取程序的最新功能,可以单击“获取或刷新提取程序功能”,这将打开“机器学习提取程序”向导。
- 从下拉列表中选择一个选项会自动确认该字段。
- 要根据提取结果训练提取程序,您可以在先前用于提取程序的“框架别名”字段中设置确切的字母数字值。
- 正确配置所有字段后,选择“保存”按钮。
重要提示:您不能为两个不同的字段选择相同的选项。