Document Understanding 新式项目用户指南

适用平台：

上次更新日期 2025年4月17日

监控

您可以在“监控”部分的以下主要区域检查 Document Understanding^TM 自动化的性能指标：

项目业绩（预览）
已处理的文档和相应的文档详细信息

提示：查看“基于角色的访问控制”页面，了解有关“监控”部分的用户权限的详细信息。

项目业绩（预览）

“项目性能”选项卡提供实用的项目性能指标，例如已处理的文档数量、处理文档所节省的时间或从文档中提取数据所节省的时间。

图 1.项目绩效（预览）仪表板

启用仪表板

“项目绩效”仪表板中显示的指标以“Insights”仪表板的形式显示。要使用仪表板，您需要在租户上启用 Insights：

转到屏幕右上角的三点菜单 ⋮，然后选择“租户配置文件”。
选择“Insights 仪表板 URL”切换按钮以启用 Insights。

注意： “项目绩效”仪表板的数据是异步提取的。由于此流程，最多可能需要 10 到 15 分钟才能将数据显示在仪表板上。有关更多信息，请查看《Insights 用户指南》中的“Insights 数据提取”部分。

指标

项目发布后，您可以查看自动化和重要业务指标的性能。

表 1. 项目成功指标
指标	描述
预计节省的时间	节省的时间由运行 Document Understanding 流程后节省的小时数计算得来，该时间考虑到了在配置时人工处理 1 个文档页面的情况。该指标使用以下公式： {预计节省的时间} = {已处理的文档数} * {x}（分钟）- {验证时间} 已处理的文档数：使用自动化处理的文档总数。 x：在没有自动化的情况下，用户处理一个文档所需的时间。验证时间：用户在验证站点中花费的时间。
预计成本	为使用的 AI Unit 支付的预计成本，具体取决于仪表板上作为设置提供的“AI Unit 成本”输入。
已处理文档数量的月度趋势（按使用者）	某个使用者在一个月内处理的文档总数。使用者可以是以下任何内容： APIs 使用 Document Understanding.Activities
每个验证程序的验证时间	每个验证程序验证分类和提取结果所花费的总时间（以小时为单位）。
文档等待验证所花费的时间	文档等待用户操作所花费的时间：最短时间最长时间平均时间
平均处理时间	验证文档所需的平均时间。具体来说，是用户平均花费在验证分类和提取结果上的时间。您可以通过以下方式检查此指标：总计：总平均处理时间。每个验证程序：每个验证程序的平均处理时间。
直通处理与已处理的文档总数	已直接处理的文档数是指未为其创建验证或分类操作、自动处理的文档数。已处理的文档总数是已直通处理的文档数与手动验证的文档数的总和。

表 2. 消耗指标
指标	描述
AI Unit 消耗概述	可用 AI Unit 数量与已消耗 AI Unit 数量的对比，按项目分组。还可以显示它们的有效时间范围和总消耗率。
AI Unit 消耗详细信息	按使用者划分的每月消耗的 AI Unit 总数。模型托管消耗的 AI Unit 总数，按项目版本和月份划分。托管模型的每个部署事件消耗的 AI Unit 数量。
运行时使用者	按已处理页面数量排名前列的使用者： API 使用者：使用所选项目已将至少一个页面数字化的使用者。 RPA 使用者：包含至少一个 Document Understanding 活动（引用当前项目）的 Studio、Studio X 或 Studio Web 项目。

表 3. 运行时指标
指标	描述
最需要验证的文档类型	要创建验证或分类操作的主要文档类型，其中包含以下信息：文档类型名称已处理的页数平均分类可信度平均提取可信度请求的字段数与提取的字段数验证文档所花费的总时间每页平均时间
字段更正趋势	每月按修改内容（已编辑的值、已编辑的框、已标记为缺失等）分组的已更正字段数。
字段更正详细信息（按文档类型）	对文档类型进行最重要的字段修改，其中包含以下信息： Document type 字段名称字段值（区分大小写）平均可信度平均准确度修改方式出现次数
提取准确性指标	平均输出精度：未修改的字段数或请求的字段数。验证程序输出准确性：未修改的字段数，或每个验证程序请求的字段数。
分类准确性指标	平均分类输出准确度，特别是标记为已更正的分类结果数或已分类文档的数量。
分类混淆矩阵	检查与其他类型混淆的文档类型。
验证操作概述	使用 RPA 或 API 创建的验证任务，按状态分组：已分配未分配已提交已拒绝
遇到的首要异常情况	使用 API 运行工作流或使用模型时遇到的主要异常。还会显示异常发生的次数以及异常发生在哪个使用者中。

筛选仪表板

有多种方法可以筛选仪表板。为了准确、更好地理解可用选项，我们来浏览一下所有选项。

有几个选项可用于筛选仪表板中显示的数据：

手动处理文档的时间（分钟）
期间
分组依据
AI Unit 成本（美分）

选项	描述
手动处理文档的时间（分钟）	选择手动处理文档所需的分钟数。
期间	选择显示信息的时间段。位于最后是当天位于范围内之前不早于年份月内这是是下一个是否为上一个是为 null 是任何时间不为 null 匹配用户属性匹配项 (高级)
分组依据	选择信息的分组方式。日周月季度年
AI Unit 成本（美分）	选择一个 AI Unit 的成本，以美分为单位
重新加载信息	刷新可用信息。
隐藏/显示筛选器	选择筛选器在仪表板中是否可见。
下载	将仪表板中显示的信息下载为 PDF 或 CSV 格式。
计划传送	计划仪表板导出重复周期（每天、每月、每周或在特定日期）。可用格式为 PDF、CSV zip 文件或 PNG 可视化。
重置筛选条件	重置所有自定义筛选器。
查看者时区	选择查看者时区。

计划传送

您可以使用仪表板数据计划电子邮件的发送。单击三点菜单 ⋮，选择“计划交付”选项，然后根据需要进行自定义。

选项卡	选项	描述
设置	计划名称	为您的计划交付命名。
	重复周期	设置电子邮件传递的重复周期。
	时间	设置计划交付的时间。
	目标	设置计划交付的目标。
	电子邮件地址	设置需要接收仪表板信息的电子邮件地址。
	格式	设置计划交付的格式。
	立即测试	测试计划交付选项。
筛选条件	手动处理文档的时间（分钟）	选择手动处理文档所需的分钟数。
	期间	设置仪表板中显示的信息的时间段。
	分组依据	选择信息的分组方式。
	AI Unit 成本（美分）	选择一个 AI Unit 的成本，以美分为单位
	立即测试	测试计划交付选项。
高级选项	自定义消息	将自定义消息添加到计划的传递中。
	包含链接	添加计划交付的可访问链接。
	展开表格以显示所有行	选择是否应在导出中显示所有行。大型表格可能呈现为纯文本或限制显示的行数。
	在单列中排列仪表板图块	选择是否应堆叠显示信息。
	纸张大小	选择所需的纸张尺寸: 使页面适应仪表板、letter、legal、小报、a0、a1、a2、a3、a4、a5。
	传送时区	选择要用于计划交付的时区。
	立即测试	测试计划交付的设置。

已处理的文档

“已处理文档”选项卡提供已通过 API 或 UiPath.DocumentUnderstanding.Activities 包的活动部分使用所选项目处理的文档列表。对于文档而言，如果已通过 API 进行数字化，或通过引用项目的活动以任意方式进行了处理，则该文档将显示在此处。可用指标如下：

文件名：已处理文档的名称。单击文档名称以转到“文档详细信息”视图。
文档类型：已处理文档的文档类型。
使用者：
- API：使用所选项目已将至少一个页面数字化的使用者。将鼠标悬停在字段上以查看设置外部应用程序时配置的应用编号，以唯一标识使用者。
- RPA： 包含至少一个 Document Understanding 活动（引用当前项目）的 Studio Desktop 或 Studio Web 项目。将鼠标悬停在字段上以查看流程名称。
修改日期：上次对文档进行操作的日期。
验证者：验证任务的用户的用户名。如果没有为相应文档创建验证任务，则该字段中将显示“不适用”。
AI Unit：消耗的 AI Unit 数量。

使用搜索栏按文件名搜索已处理的文档。

注意：文档在“已处理的文档”选项卡中可用六个月。

文档详细信息

单击“已处理文档”选项卡中的文件名，以转到“文档详细信息”视图。此视图提供以下信息：

指标：
- 总消耗量：文档消耗的 AI Unit 数。
- 创建日期：文档创建日期。
- 上次更新日期：上次对文档进行操作的日期。
- 使用者：在 RPA 项目中创建的工作流的名称。
分类：
- 版本：所使用的分类模型的版本。
- 预验证文档类型：由分类器自动确定的文档类型。
- 验证后文档类型：如果手动更改，则为验证后的文档类型。如果验证后未更改文档类型，则该值将为 N/A。
- 置信度：由分类器确定的置信度分数。
提取：
- 模型：使用的提取模型。
- 版本：所使用的提取模型的版本。
- 提取的字段：与文档类型的每个字段相关的信息：
  - 预测值：模型预测的值。
  - 提取置信度：提取程序确定的置信度分数。
  - OCR 置信度：由 OCR 引擎确定的置信度分数。
  - 验证后值：如果手动更改，则为验证后的值。如果验证后未更改文档类型，则该值将为 N/A。
验证：
- 任务名称：验证任务的名称。
- 任务类型：验证任务的类型。可能的值：“分类”或“提取”。
- 任务目录名称：验证任务目录的名称。
- 受分配人：验证任务的受分配人（如果尚未分配用户，则为“未分配”）。
- 严重性：验证任务的优先级。
- 任务创建日期：验证任务的创建日期。
- 任务完成日期：验证任务的完成日期。
- 有效字段：在人机回圈后已验证的字段数（标记为有效）。
- 修改的字段：在人机回圈后修改的字段数。
- 任务结果：任务的结果。