- 概述
- Document Understanding 流程
- 快速入门教程
- 从收据中提取数据
- 使用附加字段重新训练发票
- 从表单中提取数据
- 框架组件
- ML 包
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 709 - ML 包
- 941x - ML 包
- 9465 - ML 包
- 990 - ML 包 - 预览
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 护照 - ML 包
- 工资单 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 硬件要求
- 管道
- Document Manager
- OCR 服务
- 支持的语言
- 深度学习
- Insights 仪表板
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 许可
- Activities (活动)
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding 用户指南
从表单中提取数据
The aim of this page is to help first time users get familiar with Document UnderstandingTM.
For scalable production deployments, we strongly recommend using the Document Understanding Process available in UiPath® Studio under the Templates section.
This quickstart guides you through the steps required to extract information from W-9 forms using the Intelligent Form Extractor. The W-9 forms are used as an example, but the procedure is similar for other types of documents where the data is structured.
从头开始,以下是需要遵循的步骤:
- 创建空白流程
- 安装所需的活动包
- 创建分类
- 将文档数字化
- 使用智能表单提取程序提取数据
- 使用验证站点验证结果
- 导出提取结果
1. 创建空白流程
启动 UiPath Studio。
在“主页”的后台视图中,选择“流程”以新建项目。
系统将显示“新的空白流程”窗口。在此窗口中,输入新项目的名称。如果需要,您还可以添加说明,以便更轻松地对项目进行排序。
选择“创建”。系统随即会在 Studio 中打开新项目。
2. 安装所需的活动包
通过功能区的“管理包”按钮,除了默认添加到项目中的核心活动包(UiPath.Excel.Activities、UiPath.Mail.Activities、UiPath.System.Activities 及 UiPath.UIAutomation.Activities)外,请安装以下活动包:
3. 创建分类
安装包后,请列出必填字段。我们将对以下字段进行数据提取:
- 1_名称 -
Text - 2_企业名称 -
Text - 3a_个人 -
Boolean - 3b_Ccorp -
Boolean - 3c_Scorp -
Boolean - 3d_合作伙伴 -
Boolean - 3e_TrustEstate -
Boolean - 3f_LLC -
Boolean - 3f_LLC 税分类 -
Boolean - 3g_其他 -
Boolean - 3g_其他详情 -
Boolean - 5_地址 -
Text - 6_邮政编码 -
Text - 7_帐户编号 -
Text - TIN_SSN -
Text - TIN_ETN -
Text - 认证签名 -
Boolean - 认证签名日期 -
Date
Open Taxonomy Manager and create a group named Structured Documents, a category named Lending Forms, and a document type named W-9. Createlisted fields with user friendly names along with respective data types.

4. 将文档数字化
在 Main.xaml 文件中,添加“加载分类”活动并为分类输出创建一个变量。
Add a Digitize Document activity with UiPath Document OCR. Provide the input property Document Path and create output variables for Document Text and Document Object Model.
请记住在“UiPath 文档 OCR”活动中添加 Document Understanding API 密钥。
5. 使用智能表单提取程序提取数据
添加“数据提取作用域”活动并填写属性。
Drag and drop the Intelligent Form Extractor within it. The endpoint should be auto-populated with the Intelligent Form Extractor endpoint, namely https://du.uipath.com/svc/intelligentforms. Provide the Document Understanding API key.
完成后,如要创建新模板,请选择“管理模板”>“创建模板”。此时会打开一个弹出窗口。
在“文档类型”下,选择之前创建的 W-9 文档类型。
在文档名称下,输入模板的名称。
在模板文档(如果可能)下,附加要在其中映射字段位置的模板文档。
Under OCR Engine, select again the UiPath Document OCR. Just like before, the endpoint should be auto-populated, namely https://du.uipath.com/ocr, and you just need to provide the API Key.
选择“配置”以转到下一步。系统将打开“模板管理器”弹出窗口。
您应该得到如下结果:

选择保存。在此屏幕中,您可以定义手写或签名字段(如果适用)。您还可以为布尔值字段定义同义词。完成后请关闭窗口。

下一步是配置提取程序,这意味着让智能表单提取程序处理所有类型为 W-9 的文档。

6. 使用验证站点验证结果
要通过“验证站点”检查结果,请拖放“呈现验证站点”活动并提供输入详细信息。

7. 导出提取结果
To export the extraction results, validated or not, drag and drop an Export Extraction Results activity to the end of your workflow. This outputs the results into a DataSet that contains multiple tables, which could then be written to an Excel file or be used directly in a downstream process.

下载示例
Download this sample project to execute the W-9 with Intelligent Form Extractor workflow using this link.