UiPath Documentation
document-understanding
2024.10
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

上次更新日期 2026年4月6日

硬件要求

在 GPU 上运行 Document Understanding TM ML 包的过程包含一项旨在加速训练流程的优化。

兼容性矩阵

因此,在 GPU 上训练的速度比在 CPU 上训练快 5 倍(以前是 10 到 20 倍)。这也使在 CPU 上训练多达 5000 页(以前最多为 500 页)的模型成为可能。

Please be aware that training Document Understanding models on GPU requires a GPU with at least 11GB of video RAM to run successfully.

使用下表检查 ML 包、CUDA 版本和 GPU 驱动程序版本之间的兼容性。

ML 包版本CUDA 版本cudDNN 版本NVIDIA 驱动程序(最低兼容版本)硬件生成
2024.10.7CUDA 12.8 或最新版本cuDNN 9.8.0 或最新版本R525.60.13Hopper、Ada Lovelace、Ampere、Turing、Volta、Pascal、Maxwell
2024.10.6 或更早版本CUDA 11.8 或最新版本cuDNN 8.2.0 或最新版本R450.80.04Ampere, Turing, Volta, Pascal, Maxwell, Kepler

CUDA 向后兼容,这意味着现有的 CUDA 应用程序可以继续与较新的 CUDA 版本一起使用。

有关兼容性的更多信息,请参见此处

CPU 和 GPU 使用情况

您可以使用 Document Understanding 框架,利用 OCR 引擎读取文本,对文档进行分类并从文档中提取信息。虽然分类和提取任务在 CPU 上运行,但建议在 GPU 上运行 OCR(尽管在 GPU 不可用的情况下,还提供 CPU 版本)。

本地部署使用 Automation Suite 并按照其硬件要求完成。

您可以对提取程序和分类器使用相同类型的虚拟机,唯一的区别是基础架构大小。我们建议将 OCR 引擎与 GPU 虚拟机一起使用。“兼容新矩阵”部分介绍了 ML 包、CUDA 版本和 GPU 驱动程序版本之间的兼容性。

让我们举一个实际中的例子,以更好地了解硬件要求。

ML 包硬件要求功能
提取程序包(发票、收据、采购订单等)使用至少具有 2 个 CPU 内核和 8 GB RAM 的虚拟机Can process 25,000 pages/day or 5 million pages/year, assuming perfectly constant traffic (no spikes).
分类器包(文档分类器)使用至少具有 2 个 CPU 内核和 8 GB RAM 的虚拟机Can process 40,000 documents/day or 8 million documents/year, assuming perfectly constant traffic (no spikes).
OCR如果在 CPU 上运行,则至少需要 8 GB RAM。如果在 GPU 上运行,则无要求。Can process 50,000 pages/day.
OCR_CPU至少需要 4 GB RAM。每天可以处理 25,000 个页面

示例:如果您每年处理 1000 万页,则需要一个具有 4 个 CPU 内核、16 GB RAM 的虚拟机用于提取程序,还需要一个用于分类器,还需要一个具有 NVIDIA GPU 内核的虚拟机用于 OCR 引擎。

您还可以选择让提取程序和分类器共同使用一个虚拟机,这意味着您需要一个具有 8 个 CPU 内核和 32 GB RAM 的虚拟机。

备注:

You can always use more more powerful CPU/GPU VMs for increasing the number of processed documents/day.

  • 兼容性矩阵
  • CPU 和 GPU 使用情况

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新