communications-mining
latest
false
重要 :
请注意,此内容已使用机器翻译进行了本地化。
UiPath logo, featuring letters U and I in white
Communications Mining 用户指南
Last updated 2024年11月19日

概述

关键步骤

探索”页面包含各种训练模式,此阶段主要介绍其中三种模式:

随机播放” - 显示随机选择的邮件消息,以供用户批注。 在随机播放中完成大部分训练至关重要,以便创建代表更广泛数据集的训练示例训练集。

“训练” (适用于未审核的消息)- 当平台对标签做出一些合理的预测后,您可以通过在默认的训练模式(适用于未审核的消息)。 这将向您显示平台不确定是否适用所选标签的消息。

“低可信度” - 显示信息标签预测未充分涵盖的邮件。 对于平台认为内容丰富的标签,这些消息将没有预测,或者预测的可信度非常低。

知识库的这一部分还将介绍在“探索”中使用搜索进行训练,这与在“发现”中使用搜索进行训练非常相似。

在“探索 - 传授”模式中还有另一种训练模式(用于已审核的消息),知识库的“优化模型和使用验证”部分对此进行了说明

布局



布局说明:

A调整所显示消息的日期范围或期间
B根据消息的元数据添加各种其他筛选器,例如 分数或发件人
C添加常规字段筛选器
D从所有消息切换到已审核或未审核消息,还可以调整固定标签计数与预测标签计数
E添加标签筛选器
F搜索分类中的特定标签
G添加其他标签
H展开消息的元数据
I刷新当前查询
J在不同的训练模式(例如“最近”、“随机”、“训练”和“低置信度”)之间切换,并选择要排序的标签
K在数据集搜索包含特定词语或短语的消息
L下载此页面上的所有消息,或将应用了筛选器的数据集导出为 CSV 文件

您应该为每个标签进行多少训练?

准确预测每个标签所需的示例数量可能会因标签概念的广度或特殊性而有很大差异。

标签通常与非常具体且易于识别的单词、短语或意图相关联,并且平台能够使用相对较少的训练示例对其进行一致的预测。 标签也可能包含一个广泛的主题,其中包含与之相关的许多不同的语言变体,在这种情况下,可能需要更多的训练示例,才能使平台一致地识别应应用标签的实例。

该平台通常可以从少用 5 个示例开始对标签进行预测,但为了准确估计标签的性能(平台预测标签的能力),每个标签至少需要 25 个示例。

在“探索”中注释时,每个标签旁边的红色小转盘(示例如下所示)会指示是否需要更多示例以准确估计标签的性能。 随着您提供的训练样本数量增加,转盘开始消失;当达到 25 个后,转盘将完全消失。

标签训练拨号盘

这并不意味着平台能够通过 25 个示例准确预测每个标签,但至少能够验证其预测每个标签的效果,并在需要额外训练时向您发出警示。

因此,在“探索”阶段,您应结合使用上述步骤(主要是“随机播放”和“学习”+“未审核”),确保为您感兴趣的所有标签提供至少 25 个示例。

在“优化” 阶段,您可能会发现某些标签需要进行更多训练,以提高其性能,此处对此进行了详细介绍。

标签性能警告

在“探索”中,一旦标签的固定示例达到 25 个,您可能会在训练拨号盘的位置看到以下标签绩效指标之一:

  • 灰色圆圈表示平台正在计算该标签的性能 - 计算完成后,该灰色圆圈会更新并消失,或者显示为黄色或红色圆圈
  • 黄色表示标签的性能稍差,可以改进
  • 红色表示标签性能不佳,需要额外的训练/纠正措施来改进
  • 如果没有圆圈,则表示标签的性能令人满意(尽管仍可能需要改进,具体取决于用例和所需的准确性级别)
  • 要详细了解标签性能及其改进方法,可以从此处开始
为绩效指标添加标签

预测标签计数与固定标签计数

如果单击标签筛选器栏顶部的对勾图标(如下所示)以筛选已审核的邮件,系统将显示已应用该标签的已审核邮件消息的数量。

如果单击计算机图标以筛选出未审核的消息,则系统将显示该标签的预测总数(其中也包括已审核示例的数量)。

“探索” 中,如果未选择“已审核”或“未审核”,平台会 默认 显示某个标签的已 固定 消息总数。在“报告”中,默认设置为显示预测总数

docs imagedocs image
注意:预测数字是平台为此标签计算的所有概率的汇总。 例如,2 条置信度级别为 50% 的消息将被视为 1 个预测标签。

有关使用“探索”的实用提示

  • 该模型只需少量带注释的消息即可开始进行预测,但为了使其做出可靠的预测,每个标签至少应注释 25 条消息。 有些需要的远不止于此,这取决于数据的复杂性、标签以及所应用标签的一致性
  • 在“探索”中,您还应该尝试查找模型错误预测标签的消息。 您应该删除不正确的标签并应用正确的标签。 此流程有助于防止模型将来做出类似的错误预测
重要提示:在此阶段,您将应用大量标签,因此请记住遵守关键注释最佳实践,即添加所有适用的标签、一致地应用标签以及为您在前面看到的内容添加注释

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。