Document Understanding

document-understanding

latest

false

Document Understanding 用户指南

重要 :

新发布内容的本地化可能需要 1-2 周的时间才能完成。

衡量

Document Understanding 的“衡量”部分中的项目分数和衡量工具，可结合所有文档类型的分类器和提取程序分数，以显示需要改进的方面。

您可以从“衡量”部分查看项目的整体状态，并查看具有改进潜力的领域。

项目衡量指标

页面上的主要衡量指标是项目的总体分数。

此衡量标准会影响所有文档类型的分类器和提取程序分数。每个因素的分数都对应于模型评分，可以分别在“分类衡量标准”和“提取衡量标准”中查看。

模型评分是一项功能，旨在帮助您为分类模型的性能实现可视化。具体表现形式为 0 到 100 之间的模型分数，如下所示：

差 (0-49)
一般 (50-69)
良好 (70-89)
非常好 (90-100)

无论模型分数如何，您都可以根据项目需求决定何时停止训练。即使模型被评为“优秀”，也不意味着它将满足所有业务要求。

备注：

您可以直接从“度量”页面为任何模型启动新的训练运行。每个模型旁边的“模型训练状态”药丸会显示“开始训练”操作，您无需导航到模型的注释页面。有关按钮状态和训练生命周期的详细信息，请参阅开始训练运行。

分类衡量标准

“分类”分数影响模型的性能以及数据集的大小和质量。

备注：

仅当您创建了多个文档类型时，才可使用“分类分数”。

如果选择“分类”，右侧将显示两个选项卡：

因素：提供有关如何提高模型性能的建议。您可以获得有关每种文档类型的数据集大小或经过训练的模型性能的建议。
指标：提供有用的指标，例如训练和测试文档的数量、精度、准确性、召回率和每种文档类型的 F1 分数。

提取衡量指标

提取分数影响模型的整体性能以及数据集的大小和质量。此视图分为多种文档类型。您也可以通过选择“注释” 直接转到每种文档类型的“注释” 视图。

如果在“提取”视图中选择任何可用文档类型，右侧将显示三个选项卡：

因素：提供有关如何提高模型性能的建议。您可以获得有关所选文档类型的数据集大小（上传的文档数量、带注释的文档数量）或训练的模型性能（字段准确性）的建议。
数据集：提供有关用于训练模型的文档、已导入页面总数和已标记页面总数的信息。
指标：提供有用的信息和指标，例如字段名称、训练状态数量以及所选文档类型的准确性。您还可以使用“下载高级指标”按钮访问提取模型的高级指标。此功能允许您下载包含每批详细指标和模型结果的 Excel 文件。

数据集诊断

“数据集”选项卡通过提供反馈和有关步骤的建议，帮助您构建有效的数据集，以使经过训练的模型获得良好的准确性。

“管理”栏中显示了三个数据集状态级别：

Red - More labelled training data is required.
Orange - More labelled training data is recommended.
浅绿色 - 建议使用已标记的训练数据。
深绿色- 已标记的训练数据在建议范围内。不过，表现不佳的领域可能需要更多数据。

如果会话中未创建任何字段，则数据集状态级别为灰色。

比较模型

您可以在“度量”部分比较两个分类或提取模型版本的性能。

分类模型比较

要比较两个分类模型版本的性能，请先导航至“度量”部分。然后，为您感兴趣的分类模型选择“比较模型”。

您可以从每列顶部的下拉列表中选择要比较的版本。系统默认选中左侧的当前版本（即最新可用版本），而右侧为最新发布的版本。

图 1. 分类模型比较

比较分类模型依赖于四个关键指标：

精度：正确预测的正实例与预测为正的实例总数的比率。精度高的模型意味着误报率较低。
准确性：正确预测的样本数（包括真正例和真负例）占样本总数的比率。
召回率：正确识别的真正例占比。
F1 分数：精度和召回率的几何均值，旨在达到这两个指标的平衡。作用是在误报和漏报之间进行权衡。

所显示文档类型的排序依据，来源于比对中最新版本所采用的顺序。如果文档类型在其中一个比较版本中不可用，每个度量的值都会被替换为“不适用”。

备注：

如果在当前版本中删除了某个字段，但在比较模型功能可用之前，该字段在旧版本中可用，则名称将替换为“未知” 。

提取模型比较

要比较两个提取模型版本的性能，请先导航至“度量”部分。然后，为您感兴趣的提取模型选择“比较模型”。

您可以从每列顶部的下拉列表中选择要比较的版本。系统默认选中左侧的当前版本（即最新可用版本），而右侧为最新发布的版本。

图 2. 提取模型比较

对提取模型的比较有赖于以下重要指标：

字段名称：标注字段的名称。
内容类型：字段的内容类型：
- 字符串
- 数字
- 日期
- 电话
- ID 编号
评分：模型分数，旨在帮助您可视化所提取字段的表现。
准确度：模型做出的正确预测在预测总数中所占比例。

所显示字段名称的排序依据，来源于比对中最新版本所采用的顺序。如果字段名称在其中一个比较版本中不可用，每个度量的值都会被替换为“不适用”。

备注：

如果在当前版本中删除了某个字段，但在比较模型功能可用之前，该字段在旧版本中可用，则名称将替换为“未知” 。

您还可以比较“表格”部分中表格的字段分数。

您可以通过比较页面的“下载高级指标”按钮下载每个版本的高级指标文件。

在此页面上

项目衡量指标
分类衡量标准
提取衡量指标
数据集诊断
比较模型
分类模型比较
提取模型比较

此页面有帮助吗？

前一个构建

下一个发布

项目衡量指标​

分类衡量标准​

提取衡量指标​

数据集诊断​

比较模型​

分类模型比较​

提取模型比较​