Communications Mining
最新
False
Communications Mining 用户指南
Last updated 2024年7月2日

使用随机播放进行训练

需要的用户权限:“查看来源”和“审核并标记”。

“随机播放”是“探索”的第一步,其目的是为用户提供随机选择的邮件供他们审核。 在随机播放模式下,平台将显示具有涵盖所有标签的预测(以及没有标签的预测)的消息,因此,“随机播放”步骤与“探索”中的其他步骤不同,因为它并不专注于要训练的特定标签,而是涵盖所有标签。

为什么使用“随机”模式进行训练如此重要?

使用随机播放模式非常重要,以确保为模型提供足够的训练样本,这些样本在整体上可以代表数据集,并且不会因为只关注数据的非常特定区域而产生偏差。

总体而言,在数据集中完成的训练中,至少有 10%应在“随机播放”模式下进行。

在随机播放模式下批注本质上有助于确保分类很好地覆盖数据集中的数据,并防止您创建的模型无法非常准确地仅对数据集中的一小部分数据进行预测。

因此,在随机播放模式下查看消息是了解整个模型运行情况的简单方法,并且可以在整个训练过程中作为参考。 在训练有素的分类中,您应该能够随机播放任何未审核的邮件,并仅接受预测以进一步训练模型。 如果您发现很多预测都不正确,您可以查看哪些标签需要更多训练。

稍后在训练过程中浏览随机播放的多个页面也是一个好方法,可以检查是否存在分类法本应捕获而未捕获的意图或概念。 然后,您可以根据需要添加现有标签,或根据需要创建新标签。

关键步骤:

docs image
  1. 从下拉菜单中选择“随机播放”,即可显示 20 条随机消息
  2. 筛选出未审核的消息
  3. 审核每条消息和任何相关预测
    • 如果存在预测,您应该确认或拒绝这些预测。 单击适用选项进行确认
    • 请记住,您还应添加所有其他适用的附加标签
    • 如果您拒绝预测,则应应用所有正确的标签 - 不要在未应用标签的情况下留下消息
  4. 您也可以单击“刷新”按钮以获取一组新消息,或单击进入下一页(位于底部)

我们建议在随机播放中至少批注至少 10 页的消息。 在具有大量训练示例的大型数据集中这可能要多得多

您的目标应该是在随机播放模式下完成所有训练的约 10% 或更多。

  • 关键步骤:

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.