Document Understanding
2022.4
False
横幅背景图像
Document Understanding 用户指南
上次更新日期 2024年3月13日

从收据中提取数据

重要提示:

此页面旨在帮助首次使用 Document Understanding 的用户。

对于可扩展的生产部署,我们强烈建议您使用 UiPath Studio 模板部分下的 Document Understanding 流程

本快速入门向您展示如何使用开箱即用的收据 ML 模型及其相应的公共端点从收据中提取数据。

可以通过提供“验证站点”或使用 Action Center 中的“验证操作”来完成验证。以下各部分将介绍这两个选项。

将收据 ML 模型与公共端点和验证站点一起使用

在本节中,我们将使用“验证站点”来验证提取结果。

要使用收据 ML 模型创建基本工作流,请按照以下步骤操作。

  1. 创建空白流程
  2. 安装所需的活动包
  3. 创建分类
  4. 将文档数字化
  5. 使用收据 ML 模型提取数据
  6. 使用验证站点验证结果
  7. 导出提取结果

现在,让我们详细了解每个步骤。

1. 创建空白流程

启动 UiPath Studio。

在“主页”的后台视图中,单击“流程”以新建项目。

系统将显示“新的空白流程”窗口。在此窗口中,输入新项目的名称。如果需要,您还可以添加说明,以便更轻松地对项目进行排序。

单击“创建”。系统随即会在 Studio 中打开新项目。

2. 安装所需的活动包

通过功能区的“管理包”按钮,除了默认添加到项目中的核心活动包(UiPath.Excel.ActivitiesUiPath.Mail.ActivitiesUiPath.System.ActivitiesUiPath.UIAutomation.Activities)外,请安装以下活动包:

3. 创建分类

安装活动包后,请列出必填字段。收据 ML 模型支持以下字段的数据提取:

  • 名称 - Text
  • 供应商地址 - Address
  • 总计 - Number
  • 日期 - Date
  • 电话号码 - Text
  • 货币 - Text
  • 费用类型 - Text
  • 项目 - Table
    • 说明 - Text
    • 行数量 - Number
    • 单价 - Number
    • 数量 - Number

请打开分类管理器并创建一个名为“半结构化文档”的组、一个名为“财务”的类别,及一个名为“收据”的文档类型。使用用户友好名称以及相应的数据类型创建上面列出的字段。



4. 将文档数字化

Main.xaml 文件中,添加“加载分类”活动并为分类输出创建一个变量。

使用 UiPath Document OCR 添加数字化文档活动。提供输入属性文档路径,并为文档文本文档对象模型创建输出变量。

请记住在“UiPath 文档 OCR”活动中添加 Document Understanding API 密钥。

5. 使用收据 ML 模型提取数据

添加“数据提取作用域”活动并填写属性。

拖放“机器学习提取程序”活动。屏幕上将显示一个包含三个输入参数(“端点”、“ML 技能”和“API 密钥”)的弹出窗口。

在“端点”参数中填写收据公共端点,即 https://du.uipath.com/ie/receipts,并提供 Document Understanding API 密钥。

单击“获取功能”

下一步是配置提取程序。配置提取程序意味着将您在分类管理器中创建的字段映射到 ML 模型中的可用字段,如下图所示:



要将机器学习提取程序与 ML 技能一起使用,请从下拉列表中选择 ML 技能并配置提取程序。

您必须将机器人 Assistant 连接到与 ML 技能所在的同一租户。



6. 使用验证站点验证结果

要通过“验证站点”检查结果,请拖放“呈现验证站点”活动并提供输入详细信息。



7. 导出提取结果

要导出提取结果,请将“导出提取结果”活动拖放到工作流的末尾。这会将结果输出到包含多个表格的 DataSet 中,然后可以将其写入 Excel 文件或直接在下游流程中使用。


下载示例

请使用此链接下载此示例项目。

该示例包含两个工作流:

  • Main.xaml - 在此工作流中,使用“验证站点”验证提取结果;这在上面的部分中有所描述
  • Main - Unattended.xaml - 在此工作流中,使用“验证操作”验证提取结果;下一节将对此进行说明

将收据 ML 模型与公共端点和验证操作一起使用

现在,让我们看看如何使用 Action Center 验证操作,而不是提供验证站点。

Action Center 中的任务如何工作?

当自动化包括应人工做出的决策(例如批准、升级和异常处理)时,UiPath Action Center 可以轻松高效地将流程从机器人移交给人工。然后再次返回。

Document Understanding Action Center 活动随附 UiPath.IntelligentOCR.Activities 包和 UiPath.Persistance.Activities 包。请勿忘记从 UiPath Studio 的“常规设置”中启用“暂留”活动:



验证操作如何工作?

通过在内部部署 Orchestrator 和 Automation Cloud 中创建可在 Action Center 中添加文档验证操作的编排流程来提高生产力。此操作可减少在本地存储文档、在每个人类操作的计算机上安装一个机器人或让机器人等待人类用户完成验证的需求。

更多详情请点击此处

如何使用验证操作?

重复上一部分中描述的步骤 1 至步骤 5。

然后,不要使用“呈现验证站点”活动,而使用“创建文档验证操作”和“等待文档验证操作并继续”活动。

下图显示了“创建文档验证操作”活动及其属性。



这将在 Action Center 中创建一个文档验证操作。然后,可以将“创建文档验证操作”活动的输出与“等待文档验证操作然后继续”活动一起使用,以在 Action Center 中完成人工操作后暂停和继续编排工作流。

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.