Document Understanding - 已知限制

document-understanding

latest

false

Document Understanding 用户指南

重要 :

新发布内容的本地化可能需要 1-2 周的时间才能完成。

已知限制

Document Understanding 新式项目的当前规范和已知限制，包括数据集大小上限和导入限制。

本页概述了最佳利用 Document Understanding ^TM新式项目的当前规范和参数。

基于项目的限制

描述	上限
支持的文件格式	PNG JPG/JPEG PDF TIF/TIFF
图像大小限制	最小值：50 x 50 像素最大值：10,000 x 10,000 像素
文档类型中的最大页数	5000 在超过某一阈值之后，添加更多数据不会提高模型性能。此限制可确保您注释的文档数量不会超过所需数量。
文档中的最大页数	上一代模型为 500，Helix 提取程序模型为 100
项目中的最大页数	30,000
项目中文档类型的最大数量	150
每个文档预加标签的最大页数	20 如果文档超过 20 页，则仅会为前 20 页预先添加标注。
最大字段数	300
并行处理的最大请求数	10
开箱即用模型处理的最大页数	20
数字化的最大文件大小	160 MB
每个文档可数字化的最大页数	500 页
分类名称的字符数	最小值：1 最大值：50
分类说明的字符数	最小值：0 最大值：2000
要分类的文档中的字符数	最小值：0 最大值：1e10（几乎无限制）
每个项目的文档类型	最小值：1 最大值：150
UiPath Helix 提取程序模型在运行时处理的最大页面数	100 页

基于活动或 API 的限制

描述	上限
支持的文件格式	PNG JPG/JPEG PDF TIF/TIFF
图像大小限制	最小值：50 x 50 像素最大值：10,000 x 10,000 像素
数字化的最大文件大小	160 MB
并行处理的最大请求数（在新式项目中部署的项目版本）	10
活动中的生成式提取	文档中最小字符数：10 文档长度：500 页字段数：150 提示词长度：1000 个字符
活动中的生成式分类	文档长度：500 页提示词长度：1000 个字符
开箱即用模型处理的最大页数	20 页

迁移现有传统项目时的当前限制

目前，不支持导入超过5000 页的数据集。只能成功导入前 5000 页，导入任何其他页面都将失败。例如，如果您的数据集包含 4999 页，并且您尝试导入 4 页的文档，此流程将不会成功。
批次名称和相应的批次结果当前不可用。如果您的数据已组织为批次，则系统不会显示此信息，但会保存此信息。
不支持从 AI Center 导出。仅支持从 Document Manager 导出。

其他限制

“项目绩效”仪表板显示通过 API 或 DocumentUnderstanding.Activities 包中的活动，使用相应项目处理的文档。
由于 Insights 仪表板不可用，您在英国和印度无法访问“项目绩效”仪表板。
在新式项目中使用 24.4 或 24.10 版本训练自定义模型时，如果模型是在单个文档模板上训练的，数据提取可能会失败。发生这种情况的原因是模型可能过于适合一种布局，即使在视觉上相似的文档上也会导致提取错误。您可以使用更多样化的数据集训练模型，以提高准确性。
使用“项目提取程序”活动时，项目名称的字母大小写必须与 Document Understanding 项目中的初始定义完全一致。
“文档类型分类器”不支持以非拉丁字母编写的文档，例如希伯来语、中文或日语。当将文档类型分类用于此类文档时，管道可能会失败或产生意外结果，包括与编码相关的错误。如果未使用分类，则文档提取仍然适用于非拉丁语言。

在此页面上

基于项目的限制
基于活动或 API 的限制
迁移现有传统项目时的当前限制
其他限制

此页面有帮助吗？

前一个基础架构

下一个Document Understanding™ 中的自动化