Communications Mining 用户指南
启用标签情感分析的情况下进行训练
标签情感分析是一项功能,允许为标签分配积极或消极情感,具体取决于标签概念在消息中的表达方式。
每个分配的标签都需要给出积极或消极的情感(不存在中性情感),而分配给同一条消息的多个标签可以具有不同的情感,具体取决于它们的表达方式。
此功能的好处是能够报告数据集中特定主题的情感,并且报告中提供了许多与情感相关的图表。
标签情感分析通常仅适用于与客户反馈相关的数据集。 这是因为它们比其他数据集包含更多可识别的情感表达,而其他数据集本质上往往更加中性。
请务必确保标签情感分析适合您的用例,因为在创建数据集期间启用标签情感分析后,便无法在该数据集上禁用它。
该平台确实有一个预训练的语气分析模型可用,该模型可以预测消息的整体语气,即情感。 对于所有其他用例,这通常是适当且充分的,例如 电子邮件收件箱分析和自动化。
标签情感分析在创建数据集时启用,以后无法更改。 在完成数据集设置流程时,您可以选择启用标签情感分析。
语气分析可为消息提供从 -10 到 10 的总体情感分数,可以在创建数据集时启用,也可以稍后在数据集设置中启用。 可以关闭和打开此功能,因此在安装过程中是否启用它并不重要。
分配带有情感的标签与分配不带有情感的标签非常相似 – 请参阅下面的步骤 1、2 和 3,这些步骤演示了如何注释来自客户酒店评论数据集的消息。
主要区别在于步骤 2,在输入标签名称后,您必须始终选择正面或负面情绪,以绿色或红色图标表示(已针对“价格”和“房间”大小的标签)。
应用带有情感的标签时,要记住的一件重要事情是,在可能的情况下,使用中性标签名称创建分类。 例如,上面使用的是“价格”,而不是“昂贵”,因为“价格”是中性,而“昂贵”本质上是负面的。
为具有中性名称的标签选择负面情绪将捕获消息表达对标签的负面看法的实例。
在大多数情况下,根据语言的固有积极性或消极性,应用标签时应该选择哪种情感是显而易见的(例如上面的“价格”和“房间 > 大小”示例)。
对于某些标签,该概念可能不适合使用中性名称,并且本质上是消极或积极,因此始终仅适用于一种情感。 例如,与“错误”相关的标签通常都会应用负面情绪。 这没关系,但应用时应保持一致。
但是,有时可能会非常不清楚。 如果消息中的语言语气非常中性,则我们需要更仔细地考虑要应用哪种情感。 此处主要需要考虑两点:
消息元数据
第一个选项是查看消息的元数据。 对于与客户反馈相关的消息(启用情感的数据集中最常见的数据类型),消息通常会有某种分数或评分(例如 NPS 分数)。 您通常可以使用这些分数来衡量语气中性的消息,其情感是更积极还是更消极,例如,如果客户不满意,他们很少会在 NPS 分数为 10 时离开。
如果您基于“分数”元数据字段始终如一地将标签情感应用于语气中性的消息,则模型可以学习接受这一点并相应地预测情感。
应用程序的一致性
第二个是,当标签的语气非常中性并且没有其他区别(例如,与“分数”相关的元数据字段)时,标签的情感应用方式要保持一致。
如果对于某个标签来说,积极反馈更常见,则假设它是积极反馈,除非消息明确表示消极,反之亦然。 但是,如果不一致,模型将难以预测情感。