Communications Mining 用户指南

上次更新日期 2024年12月20日

正在生成提取内容

备注： 先决条件。 选择一个没有性能指标/警告，并且精度/召回率级别适合您的用例的标签。

需要使用提取验证流程，以通过验证了解这些提取的性能。
决定要训练的提取。我们以“报告”>“帐户对账单”作为要训练的架构示例。

要自动执行此流程，请提取以下数据点以输入到下游系统中：

注意：这仅适用于在“探索”中训练的情况。在训练中，单击提取训练批次会预加载提取内容。
根据需要使用此训练模式，将每次提取的训练示例数量（即分配给标签的一组字段）增加到至少 25 个，从而使模型能够准确地估计提取的性能。
转到“探索” ，然后转到“标签”，然后选择要在其上生成提取内容的标签。
选择“预测提取次数” 。预测提取在“探索”中按页生成提取（即，这将预测应用于给定页面上的所有注释）。
注意：每次转到下一页时，您都需要再次选择“预测提取操作”。

您还可以在单个注释级别生成提取内容。选择“标注字段” ，然后选择“预测提取内容” 图标。

当您预测提取时会发生什么情况?
- 该模型使用生成式模型，并映射您先前定义（在我们的提取架构中）的每个数据点，以将其与意图（标签）相关联。
- 它提取这些内容并以结构化架构返回，以供 SME 检查和确认。
- 结构化架构旨在实现更复杂的自动化，并在 API 中以 JSON 格式进行结构化，以供任何下游自动化使用。
进行提取预测后，如果模型从注释中提取了字段提取内容，则会在文本中高亮显示相关跨度（如果适用）。模型会在右侧显示提取的值。查看验证和注释提取页面，了解如何验证预测值。