Communications Mining 用户指南
标签(预测、可信度、层次结构等)
标签是消息中所表达的意图或概念的结构化摘要。 一条消息通常由多个标签进行摘要,即标签不是消息的互斥分类。
例如,在监控客户体验的数据集中,我们可以创建一个名为“不正确的发票通知”的标签,该标签描述了客户何时通知企业他们收到了他们认为不正确的发票。
已固定与预测
标签最初由用户通过将标签应用于相关消息来创建。 用户可以继续应用它们为模型构建训练示例,然后平台将开始自动预测数据集中的相关标签。
用户已应用到消息的标签被视为“已固定”,而平台分配给消息的标签称为标签预测。 有关更多详细信息,请参阅此处以了解已审核和未审核的消息。
置信度级别
当平台预测标签是否适用于未经用户审核的消息时,平台会提供该标签预测的可信度(%)。 置信度越高,平台就越有可能应用标签。
标签以平台在预测标签中的置信度级别显示阴影。 标签越不透明,平台应用标签的可信度就越高。
标签层次结构
标签可以按层次结构进行组织,以帮助您更快地组织和训练新概念。
此层次结构采用如下格式: [父标签] > [分支标签 1] > [分支标签 n] > [子标签]
标签可以是独立的父标签,也可以具有构成层次结构中先前标签子集的分支标签和子标签(用“>”分隔)。
每当固定或预测子标签或分支标签时,模型都将层次结构中的先前级别视为已固定或预测。 父标签的预测通常比较层次结构中较低级别的预测具有更高的置信度,因为它们通常更容易识别。
要了解有关标签层次结构的更多信息,请参阅此处。
标签情感
对于启用了情感分析的数据集,每个标签(固定的标签和预测的标签)都有关联的正面或负面情感,以绿色或红色表示(例如下面的正面情感预测)。
标签层次结构的不同级别可能有不同的情感预测,例如,评论可能总体上对“属性”持积极看法,但对“属性 > 位置”持消极看法。