document-understanding
latest
false
- 概述
- 入门指南
- 构建模型
- 使用模型
- 模型详细信息
- 公共端点
- 1040 - 文档类型
- 1040 计划 C - 文档类型
- 1040 计划 D - 文档类型
- 1040 计划 E - 文档类型
- 1040x - 文档类型
- 3949a - 文档类型
- 4506T - 文档类型
- 709 - 文档类型
- 941x - 文档类型
- 9465 - 文档类型
- ACORD125 - 文档类型
- ACORD126 - 文档类型
- ACORD131 - 文档类型
- ACORD140 - 文档类型
- ACORD25 - 文档类型
- 银行对账单 - 文档类型
- 提单 - 文档类型
- 公司注册证书 - 文档类型
- 原产地证书 - 文档类型
- 支票 - 文档类型
- 儿童产品证书 - 文档类型
- CMS 1500 - 文档类型
- 欧盟符合性声明 - 文档类型
- 财务报表 - 文档类型
- FM1003 - 文档类型
- I9 - 文档类型
- 身份证 - 文档类型
- 发票 - 文档类型
- 发票 2 - 文档类型
- 澳大利亚发票 - 文档类型
- 发票中国 - 文档类型
- 希伯来语发票 - 文档类型
- 发票印度 - 文档类型
- 日本发票 - 文档类别
- 发票运输 - 文档类型
- 装箱单列表 - 文档类型
- 工资单 - 文档类型
- 护照 - 文档类型
- 采购订单 - 文档类型
- 收据 - 文档类型
- 收据 2 - 文档类型
- 日本收据 - 文档类型
- 汇款通知书 - 文档类型
- UB04 - 文档类型
- 美国抵押贷款平交披露 - 文档类型
- 公用事业账单 - 文档类型
- 车辆标题 - 文档类型
- W2 - 文档类型
- W9 - 文档类型
- 支持的语言
- Insights 仪表板
- 数据与安全性
- 许可
- 如何
- 故障排除
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。

Document Understanding 新式项目用户指南
上次更新日期 2025年10月15日
本页概述了当前可用来最佳利用 Document UnderstandingTM 新式项目的规范和参数。
描述 | 上限 |
---|---|
支持的文件格式 |
|
图像大小限制 |
|
文档类型中的最大页数 | 5000
在超过某一阈值之后,添加更多数据不会提高模型性能。此限制可确保您注释的文档数量不会超过所需数量。 |
文档中的最大页数 | 上一代模型为 500,DocPath 模型为 100 |
项目中的最大页数 | 30,000 |
每个文档预加标签的最大页数 | 20
如果文档超过 20 页,则仅会为前 20 页预先添加标注。 |
最大字段数 | 300 |
并行处理的最大请求数 | 10 |
开箱即用模型处理的最大页数 | 20 |
数字化的最大文件大小 | 160 MB |
每个文档可数字化的最大页数 | 500 页 |
分类名称的字符数 |
|
分类说明的字符数 |
|
要分类的文档中的字符数 |
|
分类器数量 |
|
UiPath DocPath 模型在运行时处理的最大页面数 | 100 页 |
描述 | 上限 |
---|---|
支持的文件格式 |
|
图像大小限制 |
|
数字化的最大文件大小 | 160 MB |
并行处理的最大请求数(在新式项目中部署的项目版本) | 10 |
活动中的生成式提取 |
|
活动中的生成式分类 |
|
开箱即用模型处理的最大页数 | 20 页 |
注意:如果您在租户上创建了 500 个项目,并使用以下其中一项活动,则 500 个之后的项目在 UiPath Studio 或 Studio Web 中将不可见,并且无法使用:
- DocumentUnderstanding.Activities 包中的“提取文档数据”和“分类文档”活动。
- IntelligentOCR.Activities 包中的 Document Understanding 项目分类器和 Document Understanding 项目提取程序。
- 目前,不支持导入超过 3000 页的数据集。只能成功导入前 3000 页,导入任何其他页面都将失败。例如,如果您的数据集包含 2999 页,并且您尝试导入 4 页的文档,则该过程将不会成功。
- 批次名称和相应的批次结果当前不可用。如果您的数据已组织为批次,则系统不会显示此信息,但会保存此信息。
- 不支持从 AI Center 导出。 仅支持从 Document Manager 导出。
- “项目绩效”仪表板显示通过 API 或 DocumentUnderstanding.Activities 包中的活动,使用相应项目处理的文档。
- 由于 Insights 仪表板不可用,您在英国和印度无法访问“项目绩效”仪表板。
- When training a custom model on version 24.4 or 24.10 in a modern project, data extraction may fail if the model is trained on a single document template. This occurs because the model can become overfit to one layout, causing extraction errors even on visually similar documents. You can improve accuracy by training the model with a more diverse dataset.