ixp
latest
false

Communications Mining 用户指南
上次更新日期 2025年10月7日
第三阶段也是训练流程的最后一步,称为“优化” 。此阶段的目的是了解模型的执行情况并进行优化,直到其性能符合要求。这涉及改进表现不及预期的特定标签,确保您已捕获所有相关的标签概念,并确保您的训练数据是整个数据集的平衡表示。
该平台的设计初衷是在模型性能方面对用户完全透明,并且在需要提高性能的领域中非常灵活地提高性能。对于任何用例,您都希望模型能够准确捕获数据集中的内容,而此阶段的训练可帮助确保您实现这一点。
这部分知识库将详细介绍下面列出的步骤,但将首先详细说明精度和召回率、验证的工作原理以及如何了解模型性能的不同方面。
-
查看模型评分 - 此步骤是关于在“验证” 中检查您的 模型评分 ,确定平台认为您的模型可能存在性能问题的方面,以及解决问题的指南。本节包括有关理解和提高模型性能的详细信息。
-
优化标签性能- 此步骤是关于采取平台建议的操作,以提高标签的性能。其中包括使用“检查标签”和“缺少的标签”训练模式(这两种模式可帮助您解决批注中潜在的不一致问题),以及学习标签模式。有关更多详细信息,请查看使用学习标签进行训练(探索) 。
-
提高覆盖率- 帮助确保有意义的标签预测尽可能多地覆盖数据集。
-
提高平衡性- 此步骤是为了确保训练数据是整个数据集的平衡表示。改善数据集的平衡性有助于减少批注偏差并提高预测的可靠性。