document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white

Document Understanding 新式项目用户指南

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
上次更新日期 2024年11月20日

衡量

您可以从“衡量”部分查看项目的整体状态,并查看具有改进潜力的领域。

项目衡量指标

页面上的主要衡量指标是项目的总体分数

此衡量标准会影响所有文档类型的分类器和提取程序分数。每个因素的分数都对应于模型评分,可以分别在“分类衡量标准”“提取衡量标准”中查看。

模型评分是一项功能,旨在帮助您为分类模型的性能实现可视化。具体表现形式为 0 到 100 之间的模型分数,如下所示:
  • 差 (0-49)
  • 一般 (50-69)
  • 良好 (70-89)
  • 非常好 (90-100)

无论模型分数如何,您都可以根据项目需求决定何时停止训练。即使模型被评为“优秀”,也不意味着它将满足所有业务要求。

分类衡量标准

“分类”分数影响模型的性能以及数据集的大小和质量。

注意:仅当您创建了多个文档类型时,才可使用“分类分数”。
如果单击“分类”,右侧将显示两个选项卡:
  • 因素:提供有关如何提高模型性能的建议。您可以获得有关每种文档类型的数据集大小或经过训练的模型性能的建议。
  • 指标:提供有用的指标,例如训练文档和测试文档的数量、精度、准确度、召回率和每种文档类型的 F1 分数。


提取衡量指标

提取分数影响模型的整体性能以及数据集的大小和质量。此视图分为多种文档类型。您也可以通过单击“注释”,直接转到每种文档类型的“注释”视图。

如果在“提取”视图中单击任何可用的文档类型,右侧会显示三个选项卡:
  • 因素:提供有关如何提高模型性能的建议。您可以获得有关所选文档类型的数据集大小(上传的文档数量、带注释的文档数量)或训练的模型性能(字段准确性)的建议。
  • 数据集:提供有关用于训练模型的文档、已导入页面总数和已标记页面总数的信息。
  • 指标:提供有用的信息和指标,例如字段名称、训练状态数量以及所选文档类型的准确性。您还可以使用“下载高级指标”按钮访问提取模型的高级指标。此功能允许您下载包含每批详细指标和模型结果的 Excel 文件。


数据集诊断

“数据集”选项卡通过提供反馈和有关步骤的建议,帮助您构建有效的数据集,以使经过训练的模型获得良好的准确性。



“管理”栏中显示了三个数据集状态级别:

  • 红色 - 需要更多已加标签的训练数据。
  • 橙色 - 建议使用更多已加标签的训练数据。
  • 绿色 - 已达到所需的已加标签训练数据级别。

如果会话中未创建任何字段,则数据集状态级别为灰色。

  • 项目衡量指标
  • 分类衡量标准
  • 提取衡量指标
  • 数据集诊断

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。