document-understanding
latest
false
- 概述
- 入门指南
- 构建模型
- 使用模型
- 模型详细信息
- Public endpoints for Automation Cloud and Test Cloud
- Public endpoints for Automation Cloud and Test Cloud Public Sector
- 1040 - 文档类型
- 1040 计划 C - 文档类型
- 1040 计划 D - 文档类型
- 1040 计划 E - 文档类型
- 1040x - 文档类型
- 3949a - 文档类型
- 4506T - 文档类型
- 709 - 文档类型
- 941x - 文档类型
- 9465 - 文档类型
- ACORD125 - 文档类型
- ACORD126 - 文档类型
- ACORD131 - 文档类型
- ACORD140 - 文档类型
- ACORD25 - 文档类型
- 银行对账单 - 文档类型
- 提单 - 文档类型
- 公司注册证书 - 文档类型
- 原产地证书 - 文档类型
- 支票 - 文档类型
- 儿童产品证书 - 文档类型
- CMS 1500 - 文档类型
- 欧盟符合性声明 - 文档类型
- 财务报表 - 文档类型
- FM1003 - 文档类型
- I9 - 文档类型
- 身份证 - 文档类型
- 发票 - 文档类型
- 发票 2 - 文档类型
- 澳大利亚发票 - 文档类型
- 发票中国 - 文档类型
- 希伯来语发票 - 文档类型
- 发票印度 - 文档类型
- 日本发票 - 文档类别
- 发票运输 - 文档类型
- 装箱单列表 - 文档类型
- 工资单 - 文档类型
- 护照 - 文档类型
- 采购订单 - 文档类型
- 收据 - 文档类型
- 收据 2 - 文档类型
- 日本收据 - 文档类型
- 汇款通知书 - 文档类型
- UB04 - 文档类型
- 美国抵押贷款平交披露 - 文档类型
- 公用事业账单 - 文档类型
- 车辆标题 - 文档类型
- W2 - 文档类型
- W9 - 文档类型
- 支持的语言
- Insights 仪表板
- 数据与安全性
- 日志记录
- 许可
- 如何
- 故障排除
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。

Document Understanding 用户指南
上次更新日期 2026年4月23日
已知限制
This page provides an overview of the current specifications and parameters for optimal utilization of Document UnderstandingTM modern projects.
基于项目的限制
| 描述 | 上限 |
|---|---|
| 支持的文件格式 |
|
| 图像大小限制 |
|
| 文档类型中的最大页数 | 5000 在超过某一阈值之后,添加更多数据不会提高模型性能。此限制可确保您注释的文档数量不会超过所需数量。 |
| 文档中的最大页数 | 500 for previous generation models, 100 for Helix Extractor models |
| 项目中的最大页数 | 30,000 |
| 每个文档预加标签的最大页数 | 20 如果文档超过 20 页,则仅会为前 20 页预先添加标注。 |
| 最大字段数 | 300 |
| 并行处理的最大请求数 | 10 |
| 开箱即用模型处理的最大页数 | 20 |
| 数字化的最大文件大小 | 160 MB |
| 每个文档可数字化的最大页数 | 500 页 |
| 分类名称的字符数 |
|
| 分类说明的字符数 |
|
| 要分类的文档中的字符数 |
|
| 分类器数量 |
|
| Maximum number of pages processed by UiPath Helix Extractor models at run-time | 100 页 |
基于活动或 API 的限制
| 描述 | 上限 |
|---|---|
| 支持的文件格式 |
|
| 图像大小限制 |
|
| 数字化的最大文件大小 | 160 MB |
| 并行处理的最大请求数(在新式项目中部署的项目版本) | 10 |
| 活动中的生成式提取 |
|
| 活动中的生成式分类 |
|
| 开箱即用模型处理的最大页数 | 20 页 |
迁移现有传统项目时的当前限制
- Currently, importing datasets larger than 5000pages is not supported. Only the initial 5000 pages will be successfully imported, with any additional pages failing to do so. For example, if your dataset consists of 4999 pages and you try to import a document of 4 pages, the process will not succeed.
- 批次名称和相应的批次结果当前不可用。如果您的数据已组织为批次,则系统不会显示此信息,但会保存此信息。
- 不支持从 AI Center 导出。 仅支持从 Document Manager 导出。
其他限制
- The Project Performance dashboard displays documents processed by consuming the respective project, either through APIs or through activities from the DocumentUnderstanding.Activities package.
- 由于 Insights 仪表板不可用,您在英国和印度无法访问“项目绩效”仪表板。
- 在新式项目中使用 24.4 或 24.10 版本训练自定义模型时,如果模型是在单个文档模板上训练的,数据提取可能会失败。发生这种情况的原因是模型可能过于适合一种布局,即使在视觉上相似的文档上也会导致提取错误。您可以使用更多样化的数据集训练模型,以提高准确性。
- When using the Project Extractor activity, the Project Name must be provided with the exact same letter casing as it was originally defined in the Document Understanding project.
- “文档类型分类器”不支持以非拉丁字母编写的文档,例如希伯来语、中文或日语。 当将文档类型分类用于此类文档时,管道可能会失败或产生意外结果,包括与编码相关的错误。 如果未使用分类,则文档提取仍然适用于非拉丁语言。