- 概述
- 入门指南
- 活动
- Insights 仪表板
- Document Understanding 流程
- 快速入门教程
- 从收据中提取数据
- 使用附加字段重新训练发票
- 从表单中提取数据
- 从文件开始创建新自动化
- 框架组件
- ML 包
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 709 - ML 包
- 941x - ML 包
- 9465 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 工资单 - ML 包
- 护照 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 流量限制
- OCR 配置
- 管道
- OCR 服务
- 支持的语言
- 深度学习
- 许可
Document Understanding 用户指南
使用附加字段重新训练发票
此页面旨在帮助首次使用Document Understanding TM的用户。
对于可扩展的生产部署,我们强烈建议您使用 UiPath™ Studio 模板部分下的 Document Understanding 流程 。
本快速入门向您展示如何重新训练开箱即用的发票 ML 模型,以再提取一个字段。
我们使用上一个快速入门中用于收据的同一工作流进行修改,以便支持发票。
为此,我们需要在工作流中执行以下步骤:
- 修改分类
- 添加分类器
- 添加机器学习提取程序
- 标记数据
- 重新训练发票 ML 模型
现在,让我们详细了解每个步骤。
在此步骤中,我们需要修改分类以添加发票文档类型。
为此,请打开分类管理器并创建一个名为“半结构化文档”的组、一个名为“财务”的类别,及一种名为“发票”的文档类型。使用用户友好名称以及相应的数据类型创建上面列出的字段。
- 名称 -
Text
- 供应商地址 -
Address
- 账单名称 -
Text
- 账单地址 -
Address
- 收货地址 -
Address
- 发票编号 -
Text
- 订单号 -
Text
- 供应商增值税号 -
Text
- 日期 -
Date
- 税金 -
Number
- 总计 -
Number
- 付款条款 -
Text
- 净额 -
Number
- 到期日 -
Date
- 折扣 -
Number
- 运费 -
Number
- 付款地址 -
Address
- 说明 -
Text
- 项目 -
Table
- 说明 -
Text
- 数量 -
Number
- 单价 -
Number
- 行数量 -
Number
- 项目订单号 -
Text
- 行号 -
Text
- 部分编号 -
Text
- 账单增值税号 -
Text
- 说明 -
在此步骤中,我们需要添加分类器,以便使用工作流处理收据和发票。
由于我们的工作流现在支持“收据”和“发票”两种文档类型,因此我们需要添加分类器以区分作为输入的不同文档类型:
在重新训练基本发票 ML 模型之前,我们需要为数据加上标签,以使其支持新的 IBAN 字段。
- 考虑到您需要解决的用例的复杂性,收集足够数量的需求和发票文档示例。按照此文档页面中的说明,标记 50 页。
- 获得对 Document Manager 实例的访问权限(无论是本地部署还是 Cloud AI Center)。请确保您有使用 Data Manager 的权限。
- 创建一个 AI Center 项目,转到“数据标签”>“UiPath Document Understanding”,然后创建一个“数据标签”会话。
- 按此处所述配置 OCR 引擎,尝试导入多种生产文档,并确保 OCR 引擎读取您需要提取的文本。
更多建议,请参阅本部分。只有在您确定了 OCR 引擎后,才能继续下一步。
- 创建新的 Data Manager 会话,然后导入训练集和评估集,同时确保在导入评估集时选中“将此作为测试集”复选框。有关导入的更多详细信息,请参阅此处。
- 按此处所述创建并配置 IBAN 字段。本节提供了更高级的准则。
- 请按此处所述标记训练数据集和评估数据集。此处描述的 Document Manager 预加标签功能可以使标记工作变得更加容易。
- 首先从“Document Manager”视图顶部的筛选器下拉列表中选择评估集,然后将训练集导出到 AI Center。有关导出的更多详细信息,请参阅此处。
接下来,让我们创建模型,重新训练并部署它。
现在,我们的工作流支持处理发票,我们需要从发票中提取 IBAN,此字段是开箱即用的发票 ML 模型默认情况下不会选取的字段。这意味着我们需要从基本模型开始重新训练新模型。
- 请按此处所述创建 ML 包。如果您的文档类型与开箱即用的文档类型不同,请选择“Document Understanding ML 包”。否则,请使用与您需要提取的文档类型最接近的包。
- 使用您在上一节中从 Data Manager 导出的输入数据集,按照此处的说明创建训练管道。
-
当训练完成并且您有包次要版本 1 时,请在此次要版本上运行评估管道,并并排检查 evaluation.xlsx。请使用此处的详细准则。
- 如果评估结果令人满意,请转到“ML 技能”视图并使用 ML 包的新次要版本创建 ML 技能。如果要使用它在 Data Manager 中进行预加标签,则需要单击 ML 技能视图右上角的“修改当前部署”按钮,然后打开“将 ML 技能设为公开”。
- 创建 ML 技能后,我们现在需要在 Studio 中使用它。最简单的方法是按此处所述将 ML 技能设为公开。然后,唯一要做的就是将我们最初在工作流中添加到机器学习提取程序的发票 ML 模型公共端点替换为 ML 技能的公共端点。
- 运行工作流,您应该会看到沿默认发票字段提取新添加的 IBAN 字段。
请使用此链接下载此示例项目。您需要将发票的机器学习提取程序从端点模式更改为经过训练的 ML 技能。