communications-mining
latest
false
重要 :
请注意,此内容已使用机器翻译进行了本地化。
Communications Mining 用户指南
上次更新日期 2024年12月20日
“优化”简介
第三阶段也是训练流程的最后一步,称为“优化”。 此阶段的目的是了解模型的执行情况,并进行优化,直到其执行符合要求。 这涉及改进未按预期运行的特定标签,确保您已捕获所有相关的标签概念,并确保您的训练数据是整个数据集的均衡表示。
该平台经过精心设计,在模型性能方面对用户完全透明,并且在提高需要领域性能方面非常灵活。 对于任何用例,您都希望确信模型能够准确捕获数据集中的内容,而此阶段的训练可帮助您实现这一点。
知识库的这一部分将详细介绍下面列出的步骤,但首先将详细说明精度和召回率、验证的工作原理,以及如何了解模型性能的不同方面。
关键步骤
查看模型评分- 此步骤是关于在“验证”中检查您的模型评分,查看平台认为您的模型在哪些方面可能存在性能问题,以及有关如何解决这些问题的指南。 本节包含有关了解和提高模型性能的详细信息。
优化标签性能- 此步骤是关于采取平台建议的操作,以提高标签的性能。 其中包括使用“检查标签”和“缺少标签”训练模式,这些模式可帮助您解决注释中潜在的不一致问题,以及“训练标签”模式(在 此处 的“ 探索” 阶段有更详细的介绍)
提高覆盖率- 此步骤有助于确保有意义的标签预测尽可能多地覆盖数据集。
提高平衡性- 此步骤是为了确保训练数据平衡地表示整个数据集。 改善数据集中的平衡性有助于减少注释偏差并提高预测的可靠性。