- 概述
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 4506T - ML 包
- 990 - ML 包 - 预览
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 护照 - ML 包
- 工资单 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 硬件要求
- 管道
- Document Manager
- OCR 服务
- 深度学习
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 许可
- 活动
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding 用户指南
使用 Document Manager
本页介绍如何使用 Document Manager 为新的数据集添加标签并重新训练 ML 模型。
在“首次运行体验”中启动创建的数据标签会话,然后转到设置以配置 OCR。
Choose the OCR you intend to use in the OCR method dropdown menu. For UiPathDocumentOCR, paste the Document UnderstandingTM license key (retrieve the Document Understanding API key from the Admin > License page) and then paste the OCR URL you generated when you deployed UiPathDocumentOCR.
请按照此处的说明,使用已部署的模型配置预加标签。粘贴模型公共 ML 技能端点和 Document Understanding 许可证密钥,然后单击“保存”。
单击 以创建要提取的字段。
您最多可以创建 40 个字段。
对于此验证练习,您可以创建一些常见的发票字段,例如日期、名称、发票编号和总计。请确保相应地更改内容类型 - 日期(日期)、名称(字符串)、发票编号(字符串)和总计(数字)。
- 确保在数据集筛选中选择正确的数据集,然后单击“导出”按钮 。
- 选择 “导出”。
- 转到同一 AI Center 项目下的“数据集”,您应该能够看到导出的训练数据集。
在 AI Center 上训练自定义模型
- 转到“管道”>“新建”。请选择评估运行类型,选择模型包和输入数据集。
- 选择“导出”下的子文件夹作为输入数据集。
- 选择“创建”以启动管道。可能需要 1 到 2 个小时的时间管道才能在 CPU 计算机上运行。