document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
上次更新日期 2024年12月18日

从表单中提取数据

重要提示:

The aim of this page is to help first time users get familiar with Document UnderstandingTM.

对于可扩展的生产部署,我们强烈建议您使用 UiPath™ Studio 模板部分下的 Document Understanding 流程 。

本快速入门将指导您完成使用智能表单提取程序从 W-9 表单中提取信息所需的步骤。以 W-9 表单为例,该过程与其他类型的数据结构化文档类似。

从头开始,以下是需要遵循的步骤:

  1. 创建空白流程
  2. 安装所需的活动包
  3. 创建分类
  4. 将文档数字化
  5. 使用智能表单提取程序提取数据
  6. 使用验证站点验证结果
  7. 导出提取结果

现在,让我们详细了解每个步骤。

1. 创建空白流程

启动 UiPath Studio。

在“主页”的后台视图中,单击“流程”以新建项目。

系统将显示“新的空白流程”窗口。在此窗口中,输入新项目的名称。如果需要,您还可以添加说明,以便更轻松地对项目进行排序。

单击“创建”。系统随即会在 Studio 中打开新项目。

2. 安装所需的活动包

通过功能区的“管理包”按钮,除了默认添加到项目中的核心活动包(UiPath.Excel.ActivitiesUiPath.Mail.ActivitiesUiPath.System.ActivitiesUiPath.UIAutomation.Activities)外,请安装以下活动包:

3. 创建分类

安装包后,请列出必填字段。我们将对以下字段进行数据提取:

  • 1_名称 - Text
  • 2_企业名称 - Text
  • 3a_个人 - Boolean
  • 3b_Ccorp - Boolean
  • 3c_Scorp - Boolean
  • 3d_合作伙伴 - Boolean
  • 3e_TrustEstate - Boolean
  • 3f_LLC - Boolean
  • 3f_LLC 税分类 - Boolean
  • 3g_其他 - Boolean
  • 3g_其他详情 - Boolean
  • 5_地址 - Text
  • 6_邮政编码 - Text
  • 7_帐户编号 - Text
  • TIN_SSN - Text
  • TIN_ETN - Text
  • 认证签名 - Boolean
  • 认证签名日期 - Date

请打开“分类管理器”并创建一个名为“结构化文档”的组、一个名为“贷款表单”的类别,及一个名为“W-9”的文档类型。使用用户友好名称以及相应的数据类型创建上面列出的字段。



4. 将文档数字化

Main.xaml 文件中,添加“加载分类”活动并为分类输出创建一个变量。

使用 UiPath Document OCR 添加“数字化文档”活动。提供输入属性文档路径,并为文档文本文档对象模型创建输出变量。

请记住在“UiPath 文档 OCR”活动中添加 Document Understanding API 密钥。

5. 使用智能表单提取程序提取数据

添加“数据提取作用域”活动并填写属性。

智能表单提取程序拖放到其中。该端点会自动填充智能表单提取程序端点,即 https://du.uipath.com/svc/intelligentforms。提供 Document Understanding API 密钥。

完成后,如要创建新模板,请单击“管理模板”>“创建模板”。系统将打开一个弹出窗口。

在“文档类型”下,选择之前创建的 W-9 文档类型。

文档名称下,输入模板的名称。

模板文档(如果可能)下,附加要在其中映射字段位置的模板文档。

在“OCR 引擎”下,再次选择“UiPath 文档 OCR”。像以前一样,端点会自动填充,即 https://du.uipath.com/ocr,而您只需要提供 API 密钥。

单击“配置”以转到下一步。系统将打开“模板管理器”弹出窗口。

在这里,我们需要选择希望智能表单提取程序搜索字段的区域。请按照此处详述的步骤对其进行配置。您还可以选择为字段使用锚点。有关锚点的更多信息,请单击此处

您应该得到如下结果:



单击“保存”。在此屏幕中,您可以定义手写或签名字段(如果适用)。您还可以为布尔值字段定义同义词。完成后请关闭窗口。



下一步是配置提取程序,这意味着让智能表单提取程序处理所有类型为 W-9 的文档。



6. 使用验证站点验证结果

要通过“验证站点”检查结果,请拖放“呈现验证站点”活动并提供输入详细信息。



7. 导出提取结果

要导出提取结果(无论是否经过验证),请将“导出提取结果”活动拖放到工作流的末尾。这会将结果输出到包含多个表格的 DataSet 中,然后可以将其写入 Excel 文件或直接在下游流程中使用。


下载示例

请使用此链接下载此示例项目,以执行 W-9 和智能表单提取程序工作流。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。