UiPath Documentation
document-understanding
latest
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。

Document Understanding 用户指南

已知限制

本页概述了最佳利用 Document Understanding TM新式项目的当前规范和参数。

基于项目的限制

描述 上限
支持的文件格式
  • PNG
  • JPG/JPEG
  • PDF
  • TIF/TIFF
图像大小限制
  • 最小值:50 x 50 像素
  • 最大值:10,000 x 10,000 像素
文档类型中的最大页数 5000

在超过某一阈值之后,添加更多数据不会提高模型性能。此限制可确保您注释的文档数量不会超过所需数量。

文档中的最大页数 上一代模型为 500,Helix 提取程序模型为 100
项目中的最大页数 30,000
项目中文档类型的最大数量 150
每个文档预加标签的最大页数 20

如果文档超过 20 页,则仅会为前 20 页预先添加标注。

最大字段数 300
并行处理的最大请求数 10
开箱即用模型处理的最大页数 20
数字化的最大文件大小 160 MB
每个文档可数字化的最大页数 500 页
分类名称的字符数
  • 最小值:1
  • 最大值:50
分类说明的字符数
  • 最小值:0
  • 最大值:2000
要分类的文档中的字符数
  • 最小值:0
  • 最大值:1e10(几乎无限制)
分类器数量
  • 最小值:1
  • 最大值:50
UiPath Helix 提取程序模型在运行时处理的最大页面数 100 页

基于活动或 API 的限制

描述 上限
支持的文件格式
  • PNG
  • JPG/JPEG
  • PDF
  • TIF/TIFF
图像大小限制
  • 最小值:50 x 50 像素
  • 最大值:10,000 x 10,000 像素
数字化的最大文件大小 160 MB
并行处理的最大请求数(在新式项目中部署的项目版本) 10
活动中的生成式提取
  • 文档中最小字符数:10
  • 文档长度:500 页
  • 字段数:150
  • 提示词长度:1000 个字符
活动中的生成式分类
  • 文档长度:500 页
  • 提示词长度:1000 个字符
开箱即用模型处理的最大页数 20 页

迁移现有传统项目时的当前限制

  • 目前,不支持导入超过5000 页的数据集。只能成功导入前 5000 页,导入任何其他页面都将失败。例如,如果您的数据集包含 4999 页,并且您尝试导入 4 页的文档,此流程将不会成功。
  • 批次名称和相应的批次结果当前不可用。如果您的数据已组织为批次,则系统不会显示此信息,但会保存此信息。
  • 不支持从 AI Center 导出。 仅支持从 Document Manager 导出。

其他限制

  • “项目绩效”仪表板显示通过 API 或 DocumentUnderstanding.Activities 包中的活动,使用相应项目处理的文档。
  • 由于 Insights 仪表板不可用,您在英国和印度无法访问“项目绩效”仪表板。
  • 在新式项目中使用 24.4 或 24.10 版本训练自定义模型时,如果模型是在单个文档模板上训练的,数据提取可能会失败。发生这种情况的原因是模型可能过于适合一种布局,即使在视觉上相似的文档上也会导致提取错误。您可以使用更多样化的数据集训练模型,以提高准确性。
  • 使用“项目提取程序”活动时,项目名称的字母大小写必须与 Document Understanding 项目中的初始定义完全一致。
  • “文档类型分类器”不支持以非拉丁字母编写的文档,例如希伯来语、中文或日语。 当将文档类型分类用于此类文档时,管道可能会失败或产生意外结果,包括与编码相关的错误。 如果未使用分类,则文档提取仍然适用于非拉丁语言。

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新