Document Understanding 新式项目用户指南

适用平台：

上次更新日期 2024年12月23日

衡量

您可以从“衡量”部分查看项目的整体状态，并查看具有改进潜力的领域。

页面上的主要衡量指标是项目的总体分数。

此衡量标准会影响所有文档类型的分类器和提取程序分数。每个因素的分数都对应于模型评分，可以分别在“分类衡量标准”和“提取衡量标准”中查看。

模型评分是一项功能，旨在帮助您为分类模型的性能实现可视化。具体表现形式为 0 到 100 之间的模型分数，如下所示：

无论模型分数如何，您都可以根据项目需求决定何时停止训练。即使模型被评为“优秀”，也不意味着它将满足所有业务要求。

“分类”分数影响模型的性能以及数据集的大小和质量。

注意：仅当您创建了多个文档类型时，才可使用“分类分数”。

如果单击“分类”，右侧将显示两个选项卡：

提取分数影响模型的整体性能以及数据集的大小和质量。此视图分为多种文档类型。您也可以通过单击“注释”，直接转到每种文档类型的“注释”视图。

如果在“提取”视图中单击任何可用的文档类型，右侧会显示三个选项卡：

因素：提供有关如何提高模型性能的建议。您可以获得有关所选文档类型的数据集大小（上传的文档数量、带注释的文档数量）或训练的模型性能（字段准确性）的建议。
数据集：提供有关用于训练模型的文档、已导入页面总数和已标记页面总数的信息。
指标：提供有用的信息和指标，例如字段名称、训练状态数量以及所选文档类型的准确性。您还可以使用“下载高级指标”按钮访问提取模型的高级指标。此功能允许您下载包含每批详细指标和模型结果的 Excel 文件。