document-understanding
2023.10
false
- 概述
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 4506T - ML 包
- 990 - ML 包 - 预览
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 护照 - ML 包
- 工资单 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 硬件要求
- 管道
- Document Manager
- OCR 服务
- 深度学习
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 许可
- 活动
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
使用 Document Manager
Document Understanding 用户指南
Last updated 2024年11月11日
使用 Document Manager
本页介绍如何使用 Document Manager 为新的数据集添加标签并重新训练 ML 模型。
在“首次运行体验”中启动创建的数据标签会话,然后转到设置以配置 OCR。
在“ OCR 方法”下拉菜单中选择要使用的 OCR。 对于UiPath文档 OCR ,粘贴Document Understanding TM许可证密钥(从 “管理员”>“许可证”页面检索 Document Understanding API 密钥),然后粘贴部署 UiPath 文档OCR 时生成的 OCR URL。
请按照此处的说明,使用已部署的模型配置预加标签。粘贴模型公共 ML 技能端点和 Document Understanding 许可证密钥,然后单击“保存”。
有关更多详细信息,请查看此处的文档:使用预定义架构。
单击 以创建要提取的字段。
您最多可以创建 40 个字段。
对于此验证练习,您可以创建一些常见的发票字段,例如日期、名称、发票编号和总计。请确保相应地更改内容类型 - 日期(日期)、名称(字符串)、发票编号(字符串)和总计(数字)。
现在,您可以开始为文档添加标签了。
单击“预测”按钮以使用基本发票模型预测已定义字段的标签,并在预测错误时进行更正。
要更改标签,请将鼠标拖动到字段上方,然后点击键盘快捷键为其添加标签(例如,在下面的示例中,
d
为日期添加标签)。
使用顶部的箭头切换到下一个文档,直到完成所有已上传发票的标签验证。
注意:由于发票基本模型运行良好,并且示例发票很简单,没有太多的变化,因此在这种情况下,预测准确度接近 100%,您可能不需要更正任何标签。
- 确保在数据集筛选中选择正确的数据集,然后单击“导出”按钮 。
- 选择 “导出”。
- 转到同一 AI Center 项目下的“数据集”,您应该能够看到导出的训练数据集。
在 AI Center 上训练自定义模型
- 转到“管道”>“新建”。请选择评估运行类型,选择模型包和输入数据集。
- 选择“导出”下的子文件夹作为输入数据集。
- 选择“创建”以启动管道。可能需要 1 到 2 个小时的时间管道才能在 CPU 计算机上运行。