- 概述
- Document Understanding 流程
- 快速入门教程
- 从收据中提取数据
- 使用附加字段重新训练发票
- 从表单中提取数据
- 框架组件
- ML 包
- 管道
- Data Manager
- OCR 服务
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 许可
- 参考
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding 用户指南
从收据中提取数据
此页面旨在帮助首次使用 Document Understanding 的用户。
对于可扩展的生产部署,我们强烈建议您使用 UiPath Studio 模板部分下的 Document Understanding 流程。
本快速入门向您展示如何使用开箱即用的收据 ML 模型及其相应的公共端点从收据中提取数据。
可以通过提供“验证站点”或使用 Action Center 中的“验证操作”来完成验证。以下各部分将介绍这两个选项。
在本节中,我们将使用“验证站点”来验证提取结果。
要使用收据 ML 模型创建基本工作流,请按照以下步骤操作。
- 创建空白流程
- 安装所需的活动包
- 创建分类
- 将文档数字化
- 使用收据 ML 模型提取数据
- 使用验证站点验证结果
- 导出提取结果
现在,让我们详细了解每个步骤。
启动 UiPath Studio。
在“主页”的后台视图中,单击“流程”以新建项目。
系统将显示“新的空白流程”窗口。在此窗口中,输入新项目的名称。如果需要,您还可以添加说明,以便更轻松地对项目进行排序。
单击“创建”。系统随即会在 Studio 中打开新项目。
通过功能区的“管理包”按钮,除了默认添加到项目中的核心活动包(UiPath.Excel.Activities、UiPath.Mail.Activities、UiPath.System.Activities 及 UiPath.UIAutomation.Activities)外,请安装以下活动包:
安装活动包后,请列出必填字段。收据 ML 模型支持以下字段的数据提取:
- 名称 -
Text
- 供应商地址 -
Address
- 总计 -
Number
- 日期 -
Date
- 电话号码 -
Text
- 货币 -
Text
- 费用类型 -
Text
-
项目 -
Table
- 说明 -
Text
- 行数量 -
Number
- 单价 -
Number
- 数量 -
Number
- 说明 -
请打开分类管理器并创建一个名为“半结构化文档”的组、一个名为“财务”的类别,及一个名为“收据”的文档类型。使用用户友好名称以及相应的数据类型创建上面列出的字段。
在 Main.xaml 文件中,添加“加载分类”活动并为分类输出创建一个变量。
使用 UiPath Document OCR 添加“数字化文档”活动。提供输入属性文档路径,并为文档文本和文档对象模型创建输出变量。
请记住在“UiPath 文档 OCR”活动中添加 Document Understanding API 密钥。
添加“数据提取作用域”活动并填写属性。
拖放“机器学习提取程序”活动。屏幕上将显示一个包含三个输入参数(“端点”、“ML 技能”和“API 密钥”)的弹出窗口。
在“端点”参数中填写收据公共端点,即 https://du.uipath.com/ie/receipts,并提供 Document Understanding API 密钥。
单击“获取功能”。
下一步是配置提取程序。配置提取程序意味着将您在分类管理器中创建的字段映射到 ML 模型中的可用字段,如下图所示:
要将机器学习提取程序与 ML 技能一起使用,请从下拉列表中选择 ML 技能并配置提取程序。
您必须将机器人 Assistant 连接到与 ML 技能所在的同一租户。
要通过“验证站点”检查结果,请拖放“呈现验证站点”活动并提供输入详细信息。
DataSet
中,然后可以将其写入 Excel 文件或直接在下游流程中使用。
请使用此链接下载此示例项目。
该示例包含两个工作流:
- Main.xaml - 在此工作流中,使用“验证站点”验证提取结果;这在上面的部分中有所描述
- Main - Unattended.xaml - 在此工作流中,使用“验证操作”验证提取结果;下一节将对此进行说明
现在,让我们看看如何使用 Action Center 验证操作,而不是提供验证站点。
当自动化包括应人工做出的决策(例如批准、升级和异常处理)时,UiPath Action Center 可以轻松高效地将流程从机器人移交给人工。然后再次返回。
Document Understanding Action Center 活动随附 UiPath.IntelligentOCR.Activities 包和 UiPath.Persistance.Activities 包。请勿忘记从 UiPath Studio 的“常规设置”中启用“暂留”活动:
通过在内部部署 Orchestrator 和 Automation Cloud 中创建可在 Action Center 中添加文档验证操作的编排流程来提高生产力。此操作可减少在本地存储文档、在每个人类操作的计算机上安装一个机器人或让机器人等待人类用户完成验证的需求。
更多详情请点击此处。
重复上一部分中描述的步骤 1 至步骤 5。
然后,不要使用“呈现验证站点”活动,而使用“创建文档验证操作”和“等待文档验证操作并继续”活动。
下图显示了“创建文档验证操作”活动及其属性。
这将在 Action Center 中创建一个文档验证操作。然后,可以将“创建文档验证操作”活动的输出与“等待文档验证操作然后继续”活动一起使用,以在 Action Center 中完成人工操作后暂停和继续编排工作流。