UiPath Documentation
document-understanding
latest
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

上次更新日期 2026年4月23日

已知限制

This page provides an overview of the current specifications and parameters for optimal utilization of Document UnderstandingTM modern projects.

基于项目的限制

描述 上限
支持的文件格式
  • PNG
  • JPG/JPEG
  • PDF
  • TIF/TIFF
图像大小限制
  • 最小值:50 x 50 像素
  • 最大值:10,000 x 10,000 像素
文档类型中的最大页数 5000

在超过某一阈值之后,添加更多数据不会提高模型性能。此限制可确保您注释的文档数量不会超过所需数量。

文档中的最大页数 500 for previous generation models, 100 for Helix Extractor models
项目中的最大页数 30,000
每个文档预加标签的最大页数 20

如果文档超过 20 页,则仅会为前 20 页预先添加标注。

最大字段数 300
并行处理的最大请求数 10
开箱即用模型处理的最大页数 20
数字化的最大文件大小 160 MB
每个文档可数字化的最大页数 500 页
分类名称的字符数
  • 最小值:1
  • 最大值:50
分类说明的字符数
  • 最小值:0
  • 最大值:2000
要分类的文档中的字符数
  • 最小值:0
  • 最大值:1e10(几乎无限制)
分类器数量
  • 最小值:1
  • 最大值:50
Maximum number of pages processed by UiPath Helix Extractor models at run-time 100 页

基于活动或 API 的限制

描述 上限
支持的文件格式
  • PNG
  • JPG/JPEG
  • PDF
  • TIF/TIFF
图像大小限制
  • 最小值:50 x 50 像素
  • 最大值:10,000 x 10,000 像素
数字化的最大文件大小 160 MB
并行处理的最大请求数(在新式项目中部署的项目版本) 10
活动中的生成式提取
  • 文档中最小字符数:10
  • 文档长度:500 页
  • 字段数:150
  • 提示词长度:1000 个字符
活动中的生成式分类
  • 文档长度:500 页
  • 提示词长度:1000 个字符
开箱即用模型处理的最大页数 20 页

迁移现有传统项目时的当前限制

  • Currently, importing datasets larger than 5000pages is not supported. Only the initial 5000 pages will be successfully imported, with any additional pages failing to do so. For example, if your dataset consists of 4999 pages and you try to import a document of 4 pages, the process will not succeed.
  • 批次名称和相应的批次结果当前不可用。如果您的数据已组织为批次,则系统不会显示此信息,但会保存此信息。
  • 不支持从 AI Center 导出。 仅支持从 Document Manager 导出。

其他限制

  • The Project Performance dashboard displays documents processed by consuming the respective project, either through APIs or through activities from the DocumentUnderstanding.Activities package.
  • 由于 Insights 仪表板不可用,您在英国和印度无法访问“项目绩效”仪表板。
  • 在新式项目中使用 24.4 或 24.10 版本训练自定义模型时,如果模型是在单个文档模板上训练的,数据提取可能会失败。发生这种情况的原因是模型可能过于适合一种布局,即使在视觉上相似的文档上也会导致提取错误。您可以使用更多样化的数据集训练模型,以提高准确性。
  • When using the Project Extractor activity, the Project Name must be provided with the exact same letter casing as it was originally defined in the Document Understanding project.
  • “文档类型分类器”不支持以非拉丁字母编写的文档,例如希伯来语、中文或日语。 当将文档类型分类用于此类文档时,管道可能会失败或产生意外结果,包括与编码相关的错误。 如果未使用分类,则文档提取仍然适用于非拉丁语言。

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新