Communications Mining 用户指南
了解提取和提取性能的验证
“验证”页面显示提取性能的概述,并帮助您深入了解每次提取的单独性能。
您可以从“验证”中的“提取”选项卡访问“验证”页面,并且仅当您在数据集上定义了提取字段时,该页面才可用。
“提取验证”页面的默认页面是“全部”概述页面,该页面提供有关数据集中提取的整体性能的以下摘要统计信息:
- 提取平均 F1 分数
- 提取平均精度
- 提取平均召回率
置信度级别的工作方式因您使用的基础 LLM 模型而异。
If you use the CommPath LLM, themodel assigns a set of confidence scores for each prediction (%).
CommPath calculates and returns the following:
-
出现次数置信度:检测到的出现次数与分配的标签相对应的可能性。
-
提取置信度:对所提取内容正确性的置信度。
These confidence values enable downstream automations to filter out extractions with confidence levels below a set label threshold. If you set an appropriate threshold, you can ensure that only predictions that meet a desired confidence level are used in workflows.
本节介绍“获取流结果”活动的输出。 有关更多详细信息,请查看Communications Mining 调度程序框架页面。
要自动使用生成式提取,请务必了解提取输出的内容。
出现次数置信度:是指模型对消息上可能出现请求的实例数量(即可能发生提取的次数)的置信度。
例如:要在下游系统中处理对账单,您始终需要帐户 ID、采购订单号、付款金额和到期日期。
查看下方的出现置信度示例。 它说明了模型如何确信无疑地识别出存在 2 种可能发生的情况,您需要在这两种情况下推进此下游流程。
提取可信度是指模型对其预测的可信度。 这包括它在预测标签实例及其相关字段时的准确度。 它还包括模型在缺少字段的情况下正确预测的置信度。
考虑与之前相同的示例。 要在下游系统中处理对账单,您始终需要帐户 ID、采购订单号、付款金额和到期日期。
但是,这一次,消息中不会显示 PO 编号,也不会显示到期日期(仅显示开始日期)。
此示例中的提取置信度是指模型关于识别与标签关联的每个字段的值是否存在的置信度。 它还包括模型在缺少字段的情况下正确预测的置信度。
在此示例中,您没有所需的所有字段,因此无法完全提取所有必填字段。
请查看下面的示例输出,了解“获取流响应”活动返回的内容。
流是指您在 Communications Mining 中设置的阈值,以及消息是否符合此阈值。
此路由不会返回置信度符合阈值的预测,而不是根据阈值筛选出预测。
换句话说,如果满足阈值,则返回流。 如果不存在,则此值为空。
此外,在存在多次提取的情况下,它以之前的提取为条件。
对于没有提取字段的标签,出现可信度等同于您在用户界面中看到的标签可信度。