UiPath Documentation
document-understanding
2023.4
false
重要 :
新发布内容的本地化可能需要 1-2 周的时间才能完成。
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

上次更新日期 2025年12月4日

具有 OCR 功能的 ML 包

通过将具有 OCR 功能的 ML 包合并到工作流中,在您使用 Document UnderstandingTM 时优化结果并简化工作。

UiPathDocumentOCR(本地部署和云)

这是一个不可重新训练的模型,可与“UiPath 文档 OCR 引擎”活动一起使用,作为“数字化文档”活动的一部分。要使用此模型,首先必须将 ML 技能设为公开,以便将 URL 复制粘贴到 UiPath™ 文档 OCR 引擎活动中。

您可以在 GPU 或 CPU 上运行 UiPath 文档 OCR,两种情况下的准确性相同,GPU 上的预测比 CPU 上的快。

UiPath Document OCR 需要访问 https://du.uipath.com/metering 上的 Document Understanding 计量服务器,如果 ML 技能在内部部署 AI Center 常规部署上运行。内部部署 AI Center 离线部署不需要互联网访问。

UiPath 文档 OCR_CPU(仅限本地部署)

此 ML 包的部署方式与 UiPathDocumentOCR ML 包相同,但有以下区别:

  • 它针对在 CPU 上运行进行了优化,因此在工作流中运行时速度提高了 3-4 倍,使用它将文档其导入 Document Manager 时速度提高了 5-10 倍
  • 准确性略低于 UiPathDocumentOCR ML 包,但类似于 UiPath.DocumentUnderstanding.OCR.LocalServer Studio 包
  • 由于速度更快,因此在没有 GPU 的情况下,当文档很大(每个文档超过 20 页)时,也建议使用 CPU,这是理想的选择。

适用于中文、日语、韩语的 OCR(本地部署和云)

在 Document Understanding 框架中可用作端点,仅 CPU。您可以在配置时将此端点的 URL 用于中文、日语和韩语的 OCR 活动,或直接在 Document Manager 会话中使用。

注意:从 2025 年 1 月开始,UiPath 中文、日语、韩语 OCR 将于 2025 年 1 月弃用。我们建议改用 UiPath 扩展语言 OCR。查看弃用时间线,详细了解即将弃用和删除的内容。

UiPath 扩展语言 OCR

UiPath 扩展语言 OCR 能够处理 200 多种语言的文档,尤其是中文、韩语、越南语、泰语、主要的印度语言以及使用西里尔语或希腊字母的语言。

您可以在配置时将此端点的 URL 用于 UiPath 扩展语言 OCR 活动,也可以直接在 Document Understanding 项目中使用。

此页面有帮助吗?

连接

需要帮助? 支持

想要了解详细内容? UiPath Academy

有问题? UiPath 论坛

保持更新