UiPath Documentation
document-understanding
2.2510
true
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

上次更新日期 2026年4月15日

从表单中提取数据

重要提示:

The aim of this page is to help first time users get familiar with Document UnderstandingTM.

For scalable production deployments, we strongly recommend using the Document Understanding Process available in UiPath® Studio under the Templates section.

This quickstart guides you through the steps required to extract information from W-9 forms using the Intelligent Form Extractor. The W-9 forms are used as an example, but the procedure is similar for other types of documents where the data is structured.

从头开始,以下是需要遵循的步骤:

  1. 创建空白流程
  2. 安装所需的活动包
  3. 创建分类
  4. 将文档数字化
  5. 使用智能表单提取程序提取数据
  6. 使用验证站点验证结果
  7. 导出提取结果

1. 创建空白流程

启动 UiPath Studio。

在“主页”的后台视图中,选择“流程”以新建项目。

系统将显示“新的空白流程”窗口。在此窗口中,输入新项目的名称。如果需要,您还可以添加说明,以便更轻松地对项目进行排序。

选择“创建”。系统随即会在 Studio 中打开新项目。

2. 安装所需的活动包

通过功能区的“管理包”按钮,除了默认添加到项目中的核心活动包(UiPath.Excel.ActivitiesUiPath.Mail.ActivitiesUiPath.System.ActivitiesUiPath.UIAutomation.Activities)外,请安装以下活动包:

3. 创建分类

安装包后,请列出必填字段。我们将对以下字段进行数据提取:

  • 1_名称 - Text
  • 2_企业名称 - Text
  • 3a_个人 - Boolean
  • 3b_Ccorp - Boolean
  • 3c_Scorp - Boolean
  • 3d_合作伙伴 - Boolean
  • 3e_TrustEstate - Boolean
  • 3f_LLC - Boolean
  • 3f_LLC 税分类 - Boolean
  • 3g_其他 - Boolean
  • 3g_其他详情 - Boolean
  • 5_地址 - Text
  • 6_邮政编码 - Text
  • 7_帐户编号 - Text
  • TIN_SSN - Text
  • TIN_ETN - Text
  • 认证签名 - Boolean
  • 认证签名日期 - Date

Open Taxonomy Manager and create a group named Structured Documents, a category named Lending Forms, and a document type named W-9. Createlisted fields with user friendly names along with respective data types.

描述分类管理器的屏幕截图。

4. 将文档数字化

Main.xaml 文件中,添加“加载分类”活动并为分类输出创建一个变量。

Add a Digitize Document activity with UiPath Document OCR. Provide the input property Document Path and create output variables for Document Text and Document Object Model.

请记住在“UiPath 文档 OCR”活动中添加 Document Understanding API 密钥。

5. 使用智能表单提取程序提取数据

添加“数据提取作用域”活动并填写属性。

Drag and drop the Intelligent Form Extractor within it. The endpoint should be auto-populated with the Intelligent Form Extractor endpoint, namely https://du.uipath.com/svc/intelligentforms. Provide the Document Understanding API key.

完成后,如要创建新模板,请选择“管理模板”>“创建模板”。此时会打开一个弹出窗口。

在“文档类型”下,选择之前创建的 W-9 文档类型。

文档名称下,输入模板的名称。

模板文档(如果可能)下,附加要在其中映射字段位置的模板文档。

Under OCR Engine, select again the UiPath Document OCR. Just like before, the endpoint should be auto-populated, namely https://du.uipath.com/ocr, and you just need to provide the API Key.

选择“配置”以转到下一步。系统将打开“模板管理器”弹出窗口。

在这里,我们需要选择希望智能表单提取程序搜索字段的区域。请按照此处详述的步骤对其进行配置。您还可以选择为字段使用锚点。有关锚点的更多信息,请单击此处

您应该得到如下结果:

描述 Template Manager 中 W-9 表单的屏幕截图。

选择保存。在此屏幕中,您可以定义手写或签名字段(如果适用)。您还可以为布尔值字段定义同义词。完成后请关闭窗口。

描述模板管理器的屏幕截图。

下一步是配置提取程序,这意味着让智能表单提取程序处理所有类型为 W-9 的文档。

描述“配置提取”程序的屏幕截图。

6. 使用验证站点验证结果

要通过“验证站点”检查结果,请拖放“呈现验证站点”活动并提供输入详细信息。

“显示验证站点”活动的屏幕截图。

7. 导出提取结果

To export the extraction results, validated or not, drag and drop an Export Extraction Results activity to the end of your workflow. This outputs the results into a DataSet that contains multiple tables, which could then be written to an Excel file or be used directly in a downstream process.

描述“导出提取结果”活动的屏幕截图。

下载示例

Download this sample project to execute the W-9 with Intelligent Form Extractor workflow using this link.

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新