document-understanding
latest
false
UiPath logo, featuring letters U and I in white

Document Understanding 用户指南

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
上次更新日期 2024年12月12日

具有 OCR 功能的 ML 包

通过将具有 OCR 功能的 ML 包合并到工作流中,在您使用Document Understanding TM时优化结果并简化工作。

UiPathDocumentOCR(本地部署和云)

这是一个不可重新训练的模型,可与UiPath 文档 OCR引擎活动一起使用,作为“数字化文档”活动的一部分。 要使用此模型,首先必须将 ML 技能设为公开,以便将 URL 复制粘贴到UiPath™ Document OCR 引擎活动中。

您可以在 GPU 或 CPU 上运行 UiPath 文档 OCR,两种情况下的准确性相同,GPU 上的预测比 CPU 上的快。

UiPath Document OCR 需要访问 https://du.uipath.com/metering 上的 Document Understanding 计量服务器,如果 ML 技能在内部部署 AI Center 常规部署上运行。内部部署 AI Center 离线部署不需要互联网访问。

UiPath 文档 OCR_CPU(仅限本地部署)

此 ML 包的部署方式与 UiPathDocumentOCR ML 包相同,但有以下区别:

  • 它针对在 CPU 上运行进行了优化,因此在工作流中运行时速度提高了 3-4 倍,并且将其导入 Document Manager 时速度提高了 5-10 倍
  • 准确性略低于 UiPathDocumentOCR ML 包,但类似于 UiPath.DocumentUnderstanding.OCR.LocalServer Studio 包
  • 由于速度更快,因此在没有 GPU 的情况下,当文档很大(每个文档超过 20 页)时,也建议使用 CPU,这是理想的选择。

UiPath 扩展语言 OCR

UiPath 扩展语言 OCR 能够处理 200 多种语言的文档,尤其是中文、韩语、越南语、泰语、主要的印度语言以及使用西里尔语或希腊字母的语言。

您可以在配置时将此端点的 URL 用于 UiPath 扩展语言 OCR 活动,也可以直接在 Document Understanding 项目中使用。

适用于中文、日语、韩语的 OCR(本地部署和云)

在 Document Understanding 框架中可用作端点,仅 CPU。您可以在配置时将此端点的 URL 用于中文、日语和韩语的 OCR 活动,或直接在 Document Manager 会话中使用。

注意:从 2025 年 1 月开始,UiPath 中文、日语、韩语 OCR 将于 2025 年 1 月弃用。 我们建议改用UiPath 扩展语言 OCR 。 查看弃用时间线,详细了解即将弃用和删除的内容。

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。