Communications Mining 用户指南
使用“检查标签”和“缺少标签”进行训练
所需的用户权限:“查看来源”和“审核并注释”。
以前,当筛选出已 审核的消息 时,“示 教 ”功能将显示平台认为所选标签可能已被误应用或遗漏的消息。“检查标签”和“缺少标签”将这些拆分为两个单独的视图,其中“检查标签”显示带有可能误用的标签的消息,“缺少标签”显示可能缺少所选标签的消息。
“检查标签”和“缺少标签”的使用简介
使用“检查标签”和“漏掉标签”训练模式是“优化”阶段的一部分,您将在该阶段尝试识别已审核的消息中的任何不一致之处或漏掉的标签。 这与“学习标签”步骤不同,后者侧重于具有平台做出的预测的未审核消息,而不是已分配的标签。
“检查标签”会向您显示平台认为可能未应用所选标签(即可能不应该应用该标签)的消息。
“缺少标签”会向您显示平台认为可能缺少所选标签的消息,即可能本应应用但并未应用。 在这里,选定的标签通常会显示为建议,如下图所示。
在任何一种模式下,平台提供的建议都不一定正确,这些只是平台根据迄今为止已完成的训练而不确定的实例。 如果您在查看平台的建议后不同意这些建议,可以选择忽略这些建议。
使用这些训练模式是查找用户在应用标签时可能不一致的情况的非常有效的方法。 通过使用它们,您可以更正这些情况,从而提高标签的性能。
何时使用“检查标签”和“缺少标签”?
根据经验,任何具有大量固定示例但平均精度较低的标签(可以通过“验证”页面或标签筛选器栏中的红色标签警告来指示)可能会从以下方面的一些纠正训练中受益“检查标签”和“标签缺失”模式。
验证模型的性能时,平台将确定其是否认为经常会错误应用标签,或者是否认为经常会忽略标签,并确定其认为最有利于提高标签性能的纠正措施的优先级。
如果您已向包含大量已审核示例的现有分类添加新标签,则“缺少标签”也是一个非常有用的工具。 为新标签概念提供一些初始示例后,“缺失标签”可以快速帮助您识别先前审核的消息中也应适用该概念的任何示例。 有关更多详细信息,请参阅此处。
如何使用“检查标签”和“缺少标签”:
要进入其中任何训练模式,有两个主要选项:
-
如果这是“ 验证 ”中针对标签的 建议操作 ,则操作卡将充当链接,直接将您带到所选标签的训练模式
- 或者,您可以从页面顶部的下拉菜单中选择“探索”中的任一训练模式,然后选择要排序的标签(例如,请参见上图)
请注意:您必须先选择一个标签,然后才能在下拉菜单中显示“检查标签”或“缺少标签”。 这两种模式还会禁用在已审核和未审核消息之间进行筛选的功能,因为它们仅适用于已审核的消息)
在每种模式下,每页平台最多会显示 20 个已审核消息示例,其中平台会认为可能未正确应用所选标签(“检查标签”)或可能缺少所选标签(“缺少标签”)。
“检查标签”
在“检查标签”中,查看页面上的每个示例,以确认它们为所选标签的真实示例。 如果有效,请在不采取任何操作的情况下继续操作。 如果不是,请删除标签(将鼠标悬停在标签上时单击“X”),并确保您应用了正确的标签。
根据需要查看尽可能多的已审核消息页,以识别已审核集中的任何不一致之处,并提高模型对标签的理解。 更正错误添加的标签可确保模型具有用于对标签进行预测的正确且一致的示例,从而对标签的性能产生重大影响。
“缺少标签”
在“缺少标签”中,查看页面上的每个示例,查看所选标签是否确实已丢失。 如果存在,请单击标签建议(如上图所示)以应用标签。 如果没有,请忽略建议并继续操作。
平台会为已审核的消息“建议”标签,并不意味着模型会将其视为预测,也不会计入有关数据集中标签数量的任何统计信息。 如果建议有误,您可以忽略该建议。
根据需要查看尽可能多的已审核消息页数,以识别已审核集中应具有所选标签但实际上没有的任何示例。 部分标注的消息可能会非常不利于模型预测标签的能力,因为当您不对消息应用标签时,您实际上是在告诉模型“这不是此标签概念的示例”。 如果这实际上是正确的示例,则模型可能会非常困惑,尤其是当有其他非常相似的示例确实应用了该标签时。
因此,通过确保模型具有用于对标签进行预测的正确且一致的示例,添加已遗漏的标签可能会对标签的性能产生重大影响。
在这些模式下进行校正训练后,一旦模型有时间进行重新训练,您可以在“验证”中重新检查,以查看您的操作对模型评分以及已训练的特定标签的性能产生的积极影响。