
Communications Mining 用户指南
“探索”页面允许您搜索、查看和筛选数据集,以检查和审核各个消息和通用字段。从导航栏中选择“探索”选项卡以导航页面:
默认情况下, “探索”会以“最近”模式显示数据集中的 20 条最新消息。您可以选择下拉模式选取器来更改此设置。
您可以从下拉菜单中选择的不同选项包括:
- 最近– 查看 20 条最近的消息。
- 随机播放– 随机查看 20 条消息。
- 指导– 显示平台不确定如何标注的 20 条消息。
- 低置信度– 显示 20 条未全部包含在信息丰富的标签预测中的消息。
- 再平衡– 显示数据集中训练数据不足的 20 条消息。
- 标签– 查看 20 个已分配或预测已选择所选标签的消息,这是选择标签时的默认模式。
- 检查标签– 查看可能未正确应用所选标签的 20 条消息。
- 缺少的标签– 查看可能缺少所选标签的 20 个消息。
在页面底部,您可以选择移至下一页,共 20 条消息,或返回上一页。
本节介绍 Communications Mining™ 中的筛选器及其应用方法。
“筛选器”栏用于查找特定的消息组,您可以在其中进行筛选:
- 特定日期范围,用于选择确切的日期,或从过去一周、过去一个月、过去 90 天或过去一年等选项中进行选择。
- 已审核或未审核的消息。
- 具有正面或负面情感预测的消息(如果在数据集上启用了情感)。
- 具有预测或分配的特定通用字段的消息。
- Messages that include or exclude a specific label or a combination of predicted labels. For more details, check Advanced Prediction Filters.
此外,您可以通过选择“添加新筛选条件”,根据与消息关联的元数据属性添加任何筛选器。
当您选择“添加新筛选器”时,下拉菜单将显示所有可用属性筛选器的完整列表。
这些内容按类别自然分组,有些是数据集中的通信类型所特有的,例如电子邮件。
将属性分组到一起的属性类别包括:
- 来源- 仅在数据集中有多个来源时显示。
- “电子邮件” - 这些特定于单个电子邮件,例如电子邮件的发件人。
- 会话- 这些是特定于电子邮件的,并且与电子邮件会话的特征相关。
- 附件- 特定于消息,主要是电子邮件,具有特定附件属性。
- 用户- 上传的但平台未派生的所有其他元数据属性,与每条消息相关。
图标指示每个属性的属性类型,无论是数字还是字符串。对于字符串用户属性,平台会在您悬停时提供示例值。
为具有字符串格式的元数据字段添加筛选器时,您可以选择要在选择中包含或排除的筛选器,如下图所示:
如果您为具有数字格式的元数据字段添加筛选器,则可以选择最小值或最大值,以创建所选范围,如下图所示:
You can use the label filter bar to filter messages that include or exclude specific labels predicted. You can do this either during model training, or when exploring and interpreting your data. For more details, check Advanced prediction filters.
您可以使用“标签”部分中的以下按钮,在显示所有消息、已分配标签的消息或具有预测(未审核)的消息之间进行筛选。图标如下所示,在选中时会改变颜色:
选择已分配标签的消息。 | |
选择具有预测标签的消息。 |
要取消选择筛选器,请再次选择该按钮。
如果您未选择其中任何按钮,但筛选到某个标签,则平台将筛选已固定或预测的所有消息,首先从已审核的消息开始筛选。
The label filter bar and the + Add label filter allow you to add complex combinations of inclusion and exclusion filters, for example, show me messages with X and Y predicted, but not Z. For more details on how to use these filters, check Advanced prediction filters.
红色拨号盘训练指示器
- The red dial training indicator shows up for some labels and highlights the ones that require more training examples for the platform to accurately evaluate the performance of the label. For more details, check Reviewing messages.
- 圆圈的完整性表示还需要多少示例。红色部分越大,需要的示例就越多。
- 一旦您拥有 25 个已批注示例,红色圆圈就会消失,具体取决于标签的复杂性。但是,您可能需要更多示例才能获得准确的预测。
- You should review messages to find more training examples.