ixp
latest
false

Communications Mining 用户指南
上次更新日期 2025年10月7日
注意:您必须以 Automation Cloud 用户的身份分配“来源 - 读取和数据集 - 审核”权限,或者以旧版用户的身份分配“查看源”和“审核和标记”权限。
随机播放是“探索”阶段的第一步,其目的是为用户提供随机选择的消息,以供他们查看。在随机播放模式下,平台将显示具有涵盖所有标签的预测的消息,以及没有涵盖所有标签的预测的消息,因此“随机播放”步骤与“探索”中的其他步骤不同,因为它不专注于要训练的特定标签,而是涵盖所有标签。
使用随机播放模式非常重要,以确保为模型提供足够的训练示例,这些示例能够代表整个数据集,并且不会因仅关注数据的非常特定区域而产生偏差。
总体而言,您在数据集中完成的训练中至少有 10% 应在随机播放模式下完成。
在随机播放模式下批注本质上有助于确保分类很好地覆盖数据集中的数据,并会阻止您创建的模型无法非常准确地仅对数据集中的一小部分数据进行预测。
因此,在随机播放模式下查看消息是了解整个模型运行情况的简单方法,并且可以在整个训练过程中作为参考。在训练良好的分类中,您应该能够浏览Shuffle上任何未审核的消息,并仅接受预测以进一步训练模型。如果您发现很多预测不正确,您可以查看哪些标签需要更多训练。
稍后在训练过程中遍历Shuffle上的多个页面也是一个好方法,可以检查分类法是否本应捕获而未捕获意图或概念。然后,您可以在需要时添加现有标签,或在需要时创建新标签。