UiPath Documentation
document-understanding
2024.10
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

上次更新日期 2026年4月6日

硬件要求

Running the Document UnderstandingTM ML Packages on a GPU includes an optimization meant to accelerate the training process.

兼容性矩阵

因此,在 GPU 上训练的速度比在 CPU 上训练快 5 倍(以前是 10 到 20 倍)。这也使在 CPU 上训练多达 5000 页(以前最多为 500 页)的模型成为可能。

Please be aware that training Document Understanding models on GPU requires a GPU with at least 11GB of video RAM to run successfully.

使用下表检查 ML 包、CUDA 版本和 GPU 驱动程序版本之间的兼容性。

ML 包版本CUDA 版本cudDNN 版本NVIDIA 驱动程序(最低兼容版本)硬件生成
2024.10.7CUDA 12.8 或最新版本cuDNN 9.8.0 或最新版本R525.60.13Hopper、Ada Lovelace、Ampere、Turing、Volta、Pascal、Maxwell
2024.10.6 或更早版本CUDA 11.8 或最新版本cuDNN 8.2.0 或最新版本R450.80.04Ampere, Turing, Volta, Pascal, Maxwell, Kepler

CUDA 向后兼容,这意味着现有的 CUDA 应用程序可以继续与较新的 CUDA 版本一起使用。

More information about compatibility can be found here.

CPU 和 GPU 使用情况

您可以使用 Document Understanding 框架,利用 OCR 引擎读取文本,对文档进行分类并从文档中提取信息。虽然分类和提取任务在 CPU 上运行,但建议在 GPU 上运行 OCR(尽管在 GPU 不可用的情况下,还提供 CPU 版本)。

The On-premises deployment is done using Automation Suite and its hardware requirements.

您可以对提取程序和分类器使用相同类型的虚拟机,唯一的区别是基础架构大小。我们建议将 OCR 引擎与 GPU 虚拟机一起使用。“兼容新矩阵”部分介绍了 ML 包、CUDA 版本和 GPU 驱动程序版本之间的兼容性。

让我们举一个实际中的例子,以更好地了解硬件要求。

ML 包硬件要求功能
Extractor packages (Invoices, Receipts, PurchaseOrders, etc.)使用至少具有 2 个 CPU 内核和 8 GB RAM 的虚拟机Can process 25,000 pages/day or 5 million pages/year, assuming perfectly constant traffic (no spikes).
Classifier packages (DocumentClassifier)使用至少具有 2 个 CPU 内核和 8 GB RAM 的虚拟机Can process 40,000 documents/day or 8 million documents/year, assuming perfectly constant traffic (no spikes).
OCR如果在 CPU 上运行,则至少需要 8 GB RAM。如果在 GPU 上运行,则无要求。Can process 50,000 pages/day.
OCR_CPU至少需要 4 GB RAM。Can process 25,000 pages/day.

Example: If you process 10 million pages/year, then you need a VM with 4 CPU cores, 16 GB RAM for the extractor, another one for the classifier, and a third VM with an NVidia GPU core for the OCR engine.

您还可以选择让提取程序和分类器共同使用一个虚拟机,这意味着您需要一个具有 8 个 CPU 内核和 32 GB RAM 的虚拟机。

备注:

You can always use more more powerful CPU/GPU VMs for increasing the number of processed documents/day.

  • 兼容性矩阵
  • CPU 和 GPU 使用情况

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新