
Communications Mining 用户指南
生成式注释使用 Microsoft Azure OpenAI 端点生成 AI 建议的标签,以加快分类设计和模型训练的早期阶段,并缩短所有 Communications Mining™ 用例的价值实现时间。
生成式注释包括:
- 集群建议- 根据集群识别的主题为集群提供新标签或现有标签的建议。
- 辅助批注- 根据标签名称或说明自动预测标签。
系统会自动对数据集启用生成式注释功能,无需采取进一步的操作。
创建数据集后,系统会在短时间内自动生成集群建议。如果已上传分类(强烈建议这样做),Communications Mining™ 会为集群提供现有标签和新标签的建议。
当您将分类上传到数据集时,这也会自动触发不使用训练数据,仅使用标签名称和说明来训练初始模型。上传分类后,此操作可能需要几分钟。
- 对于“集群建议” ,转到“训练”选项卡,然后选择一个集群批次。或者,转到“发现”选项卡,然后选择“集群模式”以开始标注。
- 对于辅助批注,请转到“训练”选项卡,然后按照建议的操作进行操作。或者,转到“探索”选项卡,然后选择“随机播放”或“学习标签”模式,以开始注释。
每个“集群”页面都将显示集群建议。这可以是为每个集群提供的一个或多个建议标签。
如果您启用了标签情感分析,则“集群建议”将包含积极或消极情感,并可以以绿色或红色高亮显示。
要识别 AI 建议的标签,请查看下图:
模型训练者应审核每个集群建议,并执行以下一项操作:
- 选择它以接受它。
- 如果他们不同意给定的建议,请分配一个新标签。
通过为每个集群自动生成建议标签,集群建议可以显着加快模型训练过程的第一阶段。如果用户难以定义他们要训练的概念,它还可以帮助进行分类设计。
集群建议是根据在集群中的消息之间共享的已识别主题生成的。
集群的创建和标签建议的生成是一个完全无监督的自动过程,无需人工输入。
在带有或不带有预定义分类的情况下生成集群上的标签建议,但建议会受到影响,并且通常会利用导入或现有的标签而变得更有用。
- You must have assigned the IXP Model Trainer role as an Automation Cloud™ user, or the Review and label permission as a legacy user.
- 导入的标签名称列表。
- Optionally, an imported list of label descriptions is highly recommended.
Once the initial model has automatically trained using label names and descriptions as its training input, predictions will appear for many of the messages in the dataset.
这些预测的工作方式与以前的完全相同,这意味着它们只是在没有训练数据的情况下生成的。
If you have Label sentiment analysis enabled, initial predictions will have either a positive or negative sentiment in different shades of green or red, depending on the confidence level.
Assisted Annotating works in any training batch or mode, but it is most effective to use in Shuffle and Teach Label. You should follow the regular annotating steps in each training batch in the Train or Explore tabs.