- 入门指南
- 框架组件
- ML 包
- 管道
- Data Manager
- OCR 服务
- 部署在 Automation Suite 中的 Document Understanding
- 安装和使用
- 首次运行体验
- 部署 UiPath 文档 OCR
- 部署开箱即用的 ML 包
- ML 包离线安装
- 使用 Data Manager
- 使用框架
- 在 AI Center 独立版中部署的 Document Understanding
- 深度学习
- 许可
- 参考
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding 用户指南
使用 Data Manager
本页介绍如何使用 Data Manager 为新的数据集添加标签并重新训练 ML 模型。
在“首次运行体验”中启动创建的数据标签会话,然后转到设置以配置 OCR。
在“OCR 方法”下拉菜单中选择要使用的 OCR。对于 UiPath 文档 OCR,粘贴 Document Understanding 许可证密钥(从“管理员”>“许可证”页面检索 Document Understanding API 密钥),然后粘贴部署 UiPath 文档 OCR 时生成的 OCR URL。
请按照此处的说明,使用已部署的模型配置预加标签。粘贴模型公共 ML 技能端点和 Document Understanding 许可证密钥,然后单击“保存”。
有关更多详细信息,请在此处查看文档:
单击 以创建要提取的字段。
您最多可以创建 40 个字段。
对于此验证练习,您可以创建一些常见的发票字段,例如日期、名称、发票编号和总计。请确保相应地更改内容类型 - 日期(日期)、名称(字符串)、发票编号(字符串)和总计(数字)。
有关更多详细信息,请查看此处的文档:创建和配置字段。
现在,您可以开始为文档添加标签了。
单击“预测”按钮 以使用基本发票模型预测已定义字段的标签,并在预测错误时进行更正。
d
为日期添加标签)。
使用顶部的箭头切换到下一个文档,直到完成所有已上传发票的标签验证。
有关为文档添加标签的更多详细信息,请查看此处的文档:标签文档。
确保在数据集筛选中选择正确的数据集,然后单击“导出”按钮 。
单击“导出”。
转到同一 AI Center 项目下的“数据集”,您应该能够看到导出的训练数据集。
有关更多详细信息,请查看文档:导出文档。
在 AI Center 上训练自定义模型
转到“管道”>“新建”。请选择评估运行类型,选择模型包和输入数据集。
请选择“导出”下的子文件夹作为输入数据集。
单击“创建”以启动管道。可能需要 1 到 2 个小时的时间管道才能在 CPU 计算机上运行。