document-understanding
2023.10
false
UiPath logo, featuring letters U and I in white
Document Understanding 用户指南
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 2024年11月11日

从表单中提取数据

重要提示:

The aim of this page is to help first time users get familiar with Document UnderstandingTM.

For scalable production deployments, we strongly recommend using the Document Understanding Process available in UiPath® Studio under the Templates section.

本快速入门将指导您完成使用智能表单提取程序从 W-9 表单中提取信息所需的步骤。以 W-9 表单为例,该过程与其他类型的数据结构化文档类似。

从头开始,以下是需要遵循的步骤:

  1. 创建空白流程
  2. 安装所需的活动包
  3. 创建分类
  4. 将文档数字化
  5. 使用智能表单提取程序提取数据
  6. 使用验证站点验证结果
  7. 导出提取结果

现在,让我们详细了解每个步骤。

1. 创建空白流程

启动 UiPath Studio。

在“主页”的后台视图中,单击“流程”以新建项目。

系统将显示“新的空白流程”窗口。在此窗口中,输入新项目的名称。如果需要,您还可以添加说明,以便更轻松地对项目进行排序。

单击“创建”。系统随即会在 Studio 中打开新项目。

2. 安装所需的活动包

通过功能区的“管理包”按钮,除了默认添加到项目中的核心活动包(UiPath.Excel.ActivitiesUiPath.Mail.ActivitiesUiPath.System.ActivitiesUiPath.UIAutomation.Activities)外,请安装以下活动包:

3. 创建分类

安装包后,请列出必填字段。我们将对以下字段进行数据提取:

  • 1_名称 - Text
  • 2_企业名称 - Text
  • 3a_个人 - Boolean
  • 3b_Ccorp - Boolean
  • 3c_Scorp - Boolean
  • 3d_合作伙伴 - Boolean
  • 3e_TrustEstate - Boolean
  • 3f_LLC - Boolean
  • 3f_LLC 税分类 - Boolean
  • 3g_其他 - Boolean
  • 3g_其他详情 - Boolean
  • 5_地址 - Text
  • 6_邮政编码 - Text
  • 7_帐户编号 - Text
  • TIN_SSN - Text
  • TIN_ETN - Text
  • 认证签名 - Boolean
  • 认证签名日期 - Date

请打开“分类管理器”并创建一个名为“结构化文档”的组、一个名为“贷款表单”的类别,及一个名为“W-9”的文档类型。使用用户友好名称以及相应的数据类型创建上面列出的字段。



4. 将文档数字化

Main.xaml 文件中,添加“加载分类”活动并为分类输出创建一个变量。

使用 UiPath Document OCR 添加“数字化文档”活动。提供输入属性文档路径,并为文档文本文档对象模型创建输出变量。

请记住在“UiPath 文档 OCR”活动中添加 Document Understanding API 密钥。

5. 使用智能表单提取程序提取数据

添加“数据提取作用域”活动并填写属性。

智能表单提取程序拖放到其中。该端点会自动填充智能表单提取程序端点,即 https://du.uipath.com/svc/intelligentforms。提供 Document Understanding API 密钥。

完成后,如要创建新模板,请单击“管理模板”>“创建模板”。系统将打开一个弹出窗口。

在“文档类型”下,选择之前创建的 W-9 文档类型。

文档名称下,输入模板的名称。

模板文档(如果可能)下,附加要在其中映射字段位置的模板文档。

在“OCR 引擎”下,再次选择“UiPath 文档 OCR”。像以前一样,端点会自动填充,即 https://du.uipath.com/ocr,而您只需要提供 API 密钥。

单击“配置”以转到下一步。系统将打开“模板管理器”弹出窗口。

在这里,我们需要选择希望智能表单提取程序搜索字段的区域。请按照此处详述的步骤对其进行配置。您还可以选择为字段使用锚点。有关锚点的更多信息,请单击此处

您应该得到如下结果:



单击“保存”。在此屏幕中,您可以定义手写或签名字段(如果适用)。您还可以为布尔值字段定义同义词。完成后请关闭窗口。



下一步是配置提取程序,这意味着让智能表单提取程序处理所有类型为 W-9 的文档。



6. 使用验证站点验证结果

要通过“验证站点”检查结果,请拖放“呈现验证站点”活动并提供输入详细信息。



7. 导出提取结果

要导出提取结果(无论是否经过验证),请将“导出提取结果”活动拖放到工作流的末尾。这会将结果输出到包含多个表格的 DataSet 中,然后可以将其写入 Excel 文件或直接在下游流程中使用。


下载示例

请使用此链接下载此示例项目,以执行 W-9 和智能表单提取程序工作流。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。