- 概述
- 入门指南
- 构建模型
- 使用模型
- 模型详细信息
- 公共端点
- 1040 - 文档类型
- 1040 计划 C - 文档类型
- 1040 计划 D - 文档类型
- 1040 计划 E - 文档类型
- 1040x - 文档类型
- 3949a - 文档类型
- 4506T - 文档类型
- 709 - 文档类型
- 941x - 文档类型
- 9465 - 文档类型
- ACORD125 - 文档类型
- ACORD126 - 文档类型
- ACORD131 - 文档类型
- ACORD140 - 文档类型
- ACORD25 - 文档类型
- 银行对账单 - 文档类型
- 提单 - 文档类型
- 公司注册证书 - 文档类型
- 原产地证书 - 文档类型
- 支票 - 文档类型
- 儿童产品证书 - 文档类型
- CMS 1500 - 文档类型
- 欧盟符合性声明 - 文档类型
- 财务报表 - 文档类型
- FM1003 - 文档类型
- I9 - 文档类型
- 身份证 - 文档类型
- 发票 - 文档类型
- 发票 2 - 文档类型
- 澳大利亚发票 - 文档类型
- 发票中国 - 文档类型
- 希伯来语发票 - 文档类型
- 发票印度 - 文档类型
- 日本发票 - 文档类别
- 发票运输 - 文档类型
- 装箱单列表 - 文档类型
- 工资单 - 文档类型
- 护照 - 文档类型
- 采购订单 - 文档类型
- 收据 - 文档类型
- 收据 2 - 文档类型
- 日本收据 - 文档类型
- 汇款通知书 - 文档类型
- UB04 - 文档类型
- 美国抵押贷款平交披露 - 文档类型
- 公用事业账单 - 文档类型
- 车辆标题 - 文档类型
- W2 - 文档类型
- W9 - 文档类型
- 支持的语言
- Insights 仪表板
- 部署在 Automation Suite 中的 Document Understanding
- 数据与安全性
- 日志记录
- 许可
- 如何
- 故障排除

Document Understanding 新式项目用户指南
您可以使用在验证站点中验证的文档,进一步提高模型的性能。
- UiPath.DocumentUnderstanding.Activities:使用此活动包处理并在验证站点中验证的所有文档都会自动收集,可用于重新训练。
- UiPath.IntelligentOCR.Activities(从 6.25.0 预览版开始):要重新训练使用此活动包处理的文档,请在工作流中使用 Document Understanding 项目提取程序训练活动。这样,可以收集文档以进行重新训练。
现在, “审核例外”按钮对于“构建”部分中的相应文档类型始终可见。如果未收集到任何文档,则该按钮保持可用状态,并显示计数为 0。
不会收集持续时间超过 7 天的验证任务的文档。
您可以创建新的项目版本,并使用“度量”部分中的“比较模型”功能对模型性能进行比较。
Document Understanding 允许您从一个环境导出重新训练候选对象并将其导入到另一个环境中。
此设置通常用于您维护“开发-测试-生产”环境结构的场景,并且流程涉及在更高环境(例如测试、UAT 或生产)中创建开发 Document Understanding 项目的副本。在这种安排中,重新训练文档将收集在生产项目中,而导出– 导入功能允许您将文档带回开发环境以进行模型重新训练,然后将更新提升回更高级的环境。
导出再训练候选对象
您可以通过选择“导出” 按钮,直接从“例外以供审核” 页面导出重新训练候选对象。选择“查看导出”以访问导出文件的列表。
您可以选择导出所有收集的文档,也可以仅导出选定的子集,具体取决于您希望如何管理审核流程,如以下示例中所述:
- 您可以导出所有收集的文档,并在计划导入这些文档的环境中对这些文档进行分类,然后重新训练模型。
- 您可以在当前环境中完成审核,并仅导出要用于重新训练的特定文档。
导入重新训练候选对象
从“待审核的例外”页面导入。导入的文档的显示方式与自动从“验证站点”收集的文档类似,并具有“目标审核”状态。
导入的文档将添加为重新训练候选对象。对于模型微调,只需遵循与直接在项目中收集的文档相同的步骤。请记住在将重新训练候选对象添加到训练集之前对其进行审核和确认。