communications-mining
latest
false
重要 :
请注意,此内容已使用机器翻译进行了本地化。
Communications Mining 用户指南
上次更新日期 2024年12月20日
正在生成提取内容
备注: 先决条件。 选择一个没有性能指标/警告,并且精度/召回率级别适合您的用例的标签。
- 需要使用提取验证流程,以通过验证了解这些提取的性能。
决定要训练的提取。 我们以“报告”>“帐户对账单”作为要训练的架构示例。
要自动执行此流程,请提取以下数据点以输入到下游系统中:
注意:这仅适用于在“探索”中训练的情况。 在训练中,单击提取训练批次会预加载提取内容。根据需要使用此训练模式,将每次提取的训练示例数量(即分配给标签的一组字段)增加到至少 25 个,从而使模型能够准确地估计提取的性能。
- 转到“探索” ,然后转到“标签”,然后选择要在其上生成提取内容的标签。
- 选择“预测提取次数” 。 预测提取在“探索”中按页生成提取(即,这将预测应用于给定页面上的所有注释)。
注意:每次转到下一页时,您都需要再次选择“预测提取操作”。
您还可以在单个注释级别生成提取内容。 选择“标注字段” ,然后选择“预测提取内容” 图标。
- 该模型使用生成式模型,并映射您先前定义(在我们的提取架构中)的每个数据点,以将其与意图(标签)相关联。
- 它提取这些内容并以结构化架构返回,以供 SME 检查和确认。
- 结构化架构旨在实现更复杂的自动化,并在 API 中以 JSON 格式进行结构化,以供任何下游自动化使用。
- 进行提取预测后,如果模型从注释中提取了字段提取内容,则会在文本中高亮显示相关跨度(如果适用)。 模型会在右侧显示提取的值。 查看验证和注释提取页面,了解如何验证预测值。