ixp
latest
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。

非结构化复杂文档用户指南
上次更新日期 2026年3月3日
概述
本节概述在项目中验证模型版本性能所涉及的流程。在将模型部署到生产环境之前,验证模型性能对于确保模型的准确性和可靠性而言具有重要意义。
模型验证流程
- 通过比较不同的模型版本来评估模型性能。
- 收集验证统计信息。
- 按照以下步骤细化模型,直到它达到适合您用例的性能水平:
- 查看模型预测。
- 迭代提取架构。
用户界面
“度量 ”选项卡中的仪表板包含以下详细信息:
- 特定字段组和字段组中所有字段的完整提取性能。
- 特定字段组中所有字段的平均性能。
- 各个字段级的性能。
以下列表包含对所有字段性能指标的描述:
- 红色表盘 - 红色字段性能表盘表示没有提供足够的标注示例。
- 琥珀色圆圈 - 当字段性能不符合预期时,系统将显示琥珀色性能指标。
- 红色圆圈 - 当字段性能较差时,会显示红色性能指标。
- 召回 - 在真实提取中,模型实际预测的提取数量。
- 精度 - 在模型应用的提取中实际正确的提取数量。
- F1 分数 - 精度与召回率之间的谐波均值。
当您了解字段级性能以及更改字段指令的影响时,这些有助于您确定模型是否已就绪,可用于生产。
最佳实践
- 请至少批注 10 个文档和 10 个字段,以便获得有意义的项目和字段分数。
- 您应根据您的特定业务需求和用例目标决定何时停止训练模型。这意味着您应要求某些字段具备比其他字段更高的精确度与召回率。
备注:
高精度模型可最大程度地减少误报,而高召回率模型可减少漏报。