活动
最新
False
横幅背景图像
Document Understanding 活动
上次更新日期 2024 年 4 月 10 日

机器学习提取程序训练器

UiPath.DocumentUnderstanding.ML.Activities.MachineLearningExtractorTrainer

用于收集已通过验证站点处理的数据,以便将其导入到 Document Manager 中。此活动只能在“训练提取程序范围”活动中使用。

属性

常见
  • “显示名称”- 活动的显示名称。
本地存储
  • 输出文件夹 ” - 存储收集的数据的目录。 存储数据后,即可将其导入到机器学习训练工具中。
其他
  • “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
提供公共数据集端点
  • 数据集 ApiKey ” - 数据集的身份验证密钥。
  • “数据集端点”- 可将训练数据上传到的数据集端点。数据集设为公开后,即可在 UiPath 环境外部通过端点使用 API 密钥访问该数据集。如果您要将数据集上传到未连接的 AI Center 实例(例如,在混合部署中,AI Center 位于云端,而机器人连接到本地部署租户),请执行此操作。
选择项目的私有数据集
  • 数据集 ” - 可上传训练数据的数据集。 如果机器人连接到启用了 AI Center 的租户,则您可以在下拉菜单中查看 AI Center 中的所有数据集,并使用下拉菜单选择要上传经过验证的文档的文件夹。
  • “项目” - 可以上传训练数据的项目。

    注意:仅当连接到 Orchestrator 时,才会启用项目和数据集选择。有关公共/私有数据集的更多信息,请参见此处
服务器
  • “失败时重试”- 出现暂时性失败时重试。该字段仅支持“布尔值”(True 和 False)。默认值为“True”。
  • “超时 (以毫秒为单位)”- 指定等待时间 (以毫秒为单位),如果超出该时间服务器未响应,就会引发错误。默认值为 100000 毫秒 (100 秒)。

使用机器学习提取程序训练向导

机器学习提取程序训练器会在所选目录中为您收集人工反馈。收集数据后,如果要重新训练 ML 模型,您只需压缩目录的内容,然后将其上传到 Document Manager 中进行策划。

如何使用

以下是使用“机器学习提取程序训练器”活动时需要遵循的步骤。

  1. 使用“分类管理器”向导定义文档类型和字段。
  2. 在“训练提取程序作用域”活动中拖动“机器学习提取程序训练器”。
  3. 在自动打开的“机器学习提取程序”向导中,添加端点信息。您可以从此处选择可用的公共端点之一。
  4. 如果您还希望使用输入的值作为活动(更确切地说是端点)的输入参数,请选中“更新活动参数”复选框。
  5. 单击“获取功能”按钮。完成此操作后,向导将关闭。
  6. 输入输出文件夹的值。
  7. 选择“训练提取程序作用域”的“配置提取程序”选项。系统将显示向导。



  8. 现在即可配置机器学习提取程序训练器。展开要应用的文档类型,然后单击相应字段旁边的复选框,开始选择要训练的字段。
  9. 手动填写文本框,或从可用的下拉列表中选择要映射到每个字段的正确数据。下拉列表包含机器学习提取程序训练器(使用在机器学习提取程序向导中输入的端点)声明为提取功能的所有字段。

    注意:如果您单击复选框但将文本框留空,则后者将自动使用本地分类中的文档类型 ID 填充。保存后即将应用更改。如果您想避免对字段 ID 使用长字符串,我们建议您手动输入一个值,以防您无权访问提取程序的内部分类。
  10. 要检查您是否正在使用提取程序的最新功能,可以单击“获取或刷新提取程序功能”,这将打开“机器学习提取程序”向导。
  11. 从下拉列表中选择一个选项会自动确认该字段。



  12. 要根据提取结果训练提取程序,您可以在先前用于提取程序的“框架别名”字段中设置确切的字母数字值。
  13. 正确配置所有字段后,选择“保存”按钮。

    重要提示:您不能为两个不同的字段选择相同的选项。
Document Understanding 集成

机器学习提取程序训练器活动是 Document Understanding 解决方案的一部分。如需了解详情,请访问 Document Understanding 指南

  • 属性
  • 使用机器学习提取程序训练向导
  • 如何使用

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.