ixp
latest
false
UiPath logo, featuring letters U and I in white

Communications Mining 用户指南

上次更新日期 2025年8月11日

分类设计最佳实践

关键分类元素

  • 标签数量:典型的数据集包含 50-100 个标签,但此数量可能会因数据集的目标而异。一个有效用例可以拥有的标签要少于 50 个。 系统规定一个数据集不得超过 200 个标签,因为超出此限制,分类将非常难以管理和训练,并导致性能下降。

  • 标签名称:标签名称应简洁明了,具有描述性,因为“生成式批注”功能将其用作训练输入,以加快和改进训练过程。您可以随时编辑它们,但为了确保它们在平台用户界面中有效显示,我们为任何给定的标签(包括其层次结构级别)设置了 64 个字符的字符限制。
  • 标签说明:向标签添加自然语言描述,因为生成式批注功能将其用作训练输入,以进行自动训练。描述还有助于确保模型训练器之间注释的一致性,并为其他查看数据集以进行分析的人提供有用的上下文。

构建分类结构

我们建议您遵循以下最佳实践,以正确构建分类结构并确保模型具有高性能:

  • 与目标保持一致: 确保每个标签服务于特定的业务目的,并且与您定义的目标保持一致。如果您的数据集用于自动化,则许多标签应与下游处理所需的特定请求相匹配。 如果您的数据集用于分析(或两者),请包含其他标签,其中涵盖问题类型、根本原因和服务质量问题(例如追踪器消息、升级和争议)等概念。
  • 保持独立 : 每个标签都应具体明确,并且不应与其他标签重叠。
  • 明确说明:避免使用宽泛、模糊或令人困惑的概念,因为这些概念很可能表现不佳,并且提供的业务价值较少。如有可能,将广泛的标签拆分为多个不同的标签。 从特定的标签开始,例如更多的层次结构级别,然后在需要时合并它们,而不是手动分解大致的标签。
  • 可识别: 确保每个标签都可以从所应用到的消息文本中清楚识别。
  • 使用父标签:如果您预计会有许多与更广泛的主题相关的类似概念,请使用父标签。
  • 使用子标签: 确保嵌套在另一个标签下的每个标签是该标签的子集。
  • 限制层次结构级别:尽量不要添加超过 4 个层次结构级别,因为模型训练起来会变得越来越复杂。
  • 包括无信息性的标签 :创建一些无价值的标签,例如感谢电子邮件,这样您可以告诉平台哪些标签需要分析,哪些不重要。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo
信任与安全
© 2005-2025 UiPath。保留所有权利。