document-understanding
latest
false
- 概述
- 入门指南
- 构建模型
- 使用模型
- ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 941x - ML 包
- 9465 - ML 包
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 工资单 - ML 包
- 护照 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- Receipts Japan - ML package
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 公共端点
- 支持的语言
- Insights 仪表板
- 数据与安全性
- 许可
- 如何
Document Understanding 新式项目用户指南
Last updated 2024年11月28日
监控
提示:查看“基于角色的访问控制”页面,了解有关“监控”部分的用户权限的详细信息。
“项目性能”选项卡提供实用的项目性能指标,例如已处理的文档数量、处理文档所节省的时间或从文档中提取数据所节省的时间。
“项目绩效”仪表板中显示的指标以“Insights”仪表板的形式显示。要使用仪表板,您需要在租户上启用 Insights:
- 转到屏幕右上角的三点菜单 ⋮,然后选择“租户配置文件”。
- 选择“Insights 仪表板 URL”切换按钮以启用 Insights。
Note: The data for the Project performance dashboard is ingested asynchronously. Due to this process, it can take up to 10-15 minutes until data is displayed on the dashboard. For more information, check the Data Ingestion for Insights section from the Insights User Guide.
项目发布后,您可以查看自动化和重要业务指标的性能。
指标 | 描述 |
---|---|
预计节省的时间 | 节省的时间由运行 Document Understanding 流程后节省的小时数计算得来,该时间考虑到了在配置时人工处理 1 个文档页面的情况。该指标使用以下公式:
{预计节省的时间} = {已处理的文档数} * {x}(分钟)- {验证时间}
|
预计成本 | 为使用的 AI Unit 支付的预计成本,具体取决于仪表板上作为设置提供的“AI Unit 成本”输入。 |
已处理文档数量的月度趋势(按使用者) | 某个使用者在一个月内处理的文档总数。使用者可以是以下任何内容:
|
每个验证程序的验证时间 | 每个验证程序验证分类和提取结果所花费的总时间(以小时为单位)。 |
文档等待验证所花费的时间 | 文档等待用户操作所花费的时间:
|
平均处理时间 | 验证文档所需的平均时间。具体来说,是用户平均花费在验证分类和提取结果上的时间。您可以通过以下方式检查此指标:
|
直通处理与已处理的文档总数 | 已直接处理的文档数是指未为其创建验证或分类操作、自动处理的文档数。
已处理的文档总数是已直通处理的文档数与手动验证的文档数的总和。 |
指标 | 描述 |
---|---|
AI Unit 消耗概述 | 可用 AI Unit 数量与已消耗 AI Unit 数量的对比,按项目分组。还可以显示它们的有效时间范围和总消耗率。 |
AI Unit 消耗详细信息 |
|
运行时使用者 | 按已处理页面数量排名前列的使用者:
|
指标 | 描述 |
---|---|
最需要验证的文档类型 | 要创建验证或分类操作的主要文档类型,其中包含以下信息:
|
字段更正趋势 | 每月按修改内容(已编辑的值、已编辑的框、已标记为缺失等)分组的已更正字段数。 |
字段更正详细信息(按文档类型) | 对文档类型进行最重要的字段修改,其中包含以下信息:
|
提取准确性指标 |
|
分类准确性指标 | 平均分类输出准确度,特别是标记为已更正的分类结果数或已分类文档的数量。 |
分类混淆矩阵 | 检查与其他类型混淆的文档类型。 |
验证操作概述 | 使用 RPA 或 API 创建的验证任务,按状态分组:
|
遇到的首要异常情况 | 使用 API 运行工作流或使用模型时遇到的主要异常。还会显示异常发生的次数以及异常发生在哪个使用者中。 |
筛选仪表板
有多种方法可以筛选仪表板。为了准确、更好地理解可用选项,我们来浏览一下所有选项。
有几个选项可用于筛选仪表板中显示的数据:
- 流程名称
- 期间
- 每个文档花费的秒数
- 重新加载信息
- 隐藏/显示筛选器
- 清除缓存
- 下载可用信息
- 计划交付
- 重置筛选条件
- 选择时区
选项 |
描述 |
---|---|
流程名称 | 选择在仪表板中生成信息时要考虑的一个、多个或所有流程。 |
期间 |
选择显示信息的时间段。
|
每个文档花费的秒数 | 选择用户处理文档所花费的时间。 |
Document Understanding 项目 | 选择在仪表板中生成信息时要考虑的一个、多个或所有项目。 |
重新加载信息 | 刷新可用信息。 |
隐藏/显示筛选器 | 选择筛选器在仪表板中是否可见。 |
下载 | 将仪表板中显示的信息下载为 PDF 或 CSV 格式。 |
计划传送 | 计划仪表板导出重复周期(每天、每月、每周或在特定日期)。 可用格式为 PDF、CSV zip 文件或 PNG 可视化。 |
重置筛选条件 | 重置所有自定义筛选器。 |
查看者时区 | 选择查看者时区。 |
计划传送
您可以使用仪表板数据计划电子邮件的发送。单击三点菜单 ⋮,选择“计划交付”选项,然后根据需要进行自定义。
选项卡 |
选项 |
描述 |
---|---|---|
设置 | 计划名称 | 为您的计划交付命名。 |
重复周期 | 设置电子邮件传递的重复周期。 | |
时间 | 设置计划交付的时间。 | |
目标 | 设置计划交付的目标。 | |
电子邮件地址 | 设置需要接收仪表板信息的电子邮件地址。 | |
格式 | 设置计划交付的格式。 | |
立即测试 | 测试计划交付选项。 | |
筛选条件 | 流程名称 | 选择在仪表板中生成信息时要考虑的一个、多个或所有流程。 |
期间 | 设置仪表板中显示的信息的时间段。 | |
每个文档花费的秒数 | 设置用户处理文档所花费的时间。 | |
Document Understanding 项目 | 选择在仪表板中生成信息时要考虑的一个、多个或所有项目。 | |
立即测试 | 测试计划交付选项。 | |
高级选项 | 自定义消息 | 将自定义消息添加到计划的传递中。 |
包含链接 | 添加计划交付的可访问链接。 | |
展开表格以显示所有行 | 选择是否应在导出中显示所有行。大型表格可能呈现为纯文本或限制显示的行数。 | |
在单列中排列仪表板图块 | 选择是否应堆叠显示信息。 | |
纸张大小 | 选择所需的纸张尺寸: 使页面适应仪表板、letter、legal、小报、a0、a1、a2、a3、a4、a5。 | |
传送时区 | 选择要用于计划交付的时区。 | |
立即测试 | 测试计划交付的设置。 |
“已处理文档”选项卡提供已通过 API 或 UiPath.DocumentUnderstanding.Activities 包的活动部分使用所选项目处理的文档列表。对于文档而言,如果已通过 API 进行数字化,或通过引用项目的活动以任意方式进行了处理,则该文档将显示在此处。可用指标如下:
- 文件名:已处理文档的名称。单击文档名称以转到“文档详细信息”视图。
- 文档类型:已处理文档的文档类型。
- 使用者:
- API:使用所选项目已将至少一个页面数字化的使用者。将鼠标悬停在字段上以查看设置外部应用程序时配置的应用编号,以唯一标识使用者。
- RPA: 包含至少一个 Document Understanding 活动(引用当前项目)的 Studio Desktop 或 Studio Web 项目。将鼠标悬停在字段上以查看流程名称。
- 修改日期:上次对文档进行操作的日期。
- 验证者:验证任务的用户的用户名。如果没有为相应文档创建验证任务,则该字段中将显示“不适用”。
- AI Unit:消耗的 AI Unit 数量。
使用搜索栏按文件名搜索已处理的文档。
注意:文档在“已处理的文档”选项卡中可用六个月。
单击“已处理文档”选项卡中的文件名,以转到“文档详细信息”视图。此视图提供以下信息:
- 指标:
- 总消耗量:文档消耗的 AI Unit 数。
- 创建日期:文档创建日期。
- 上次更新日期:上次对文档进行操作的日期。
- 使用者:在 RPA 项目中创建的工作流的名称。
- 分类:
- 预验证文档类型:由分类器自动确定的文档类型。
- 验证后文档类型:如果手动更改,则为验证后的文档类型。如果验证后未更改文档类型,则该值将为 N/A。
- 置信度:由分类器确定的置信度分数。
- 提取:
- 模型:使用的提取模型。
- 提取的字段:与文档类型的每个字段相关的信息:
- 预测值:模型预测的值。
- 提取置信度:提取程序确定的置信度分数。
- OCR 置信度:由 OCR 引擎确定的置信度分数。
- 验证后值:如果手动更改,则为验证后的值。如果验证后未更改文档类型,则该值将为 N/A。
- 验证:
- 任务名称:验证任务的名称。
- 任务类型:验证任务的类型。可能的值:“分类”或“提取”。
- 任务目录名称:验证任务目录的名称。
- 受分配人:验证任务的受分配人(如果尚未分配用户,则为“未分配”)。
- 严重性:验证任务的优先级。
- 任务创建日期:验证任务的创建日期。
- 任务完成日期:验证任务的完成日期。
- 有效字段:在人机回圈后已验证的字段数(标记为有效)。
- 修改的字段:在人机回圈后修改的字段数。
- 任务结果:任务的结果。