Document Understanding
2023.10
False
横幅背景图像
Document Understanding 用户指南
上次更新日期 2024年5月8日

OCR 服务

关于 OCR 服务

OCR 服务用于以下目的:

  • 在为数据加标签时,当将文档导入到 Document Manager 时。此步骤可用的引擎包括 UiPath Document OCR、Google Cloud Vision OCR 和 Microsoft Read OCR。
  • At run time when calling models from RPA workflows. The engines available for this step are all the engines integrated with the UiPath RPA platform including the above, plus Microsoft OCR (legacy), Microsoft Project Oxford OCR, and Tesseract.

在生产中,我们建议在工作流中使用“数字化文档”活动来调用 OCR,并将文档对象模型作为输入传递给调用 ML 模型的活动。为此,您需要使用机器学习提取程序活动(官方订阅源)。

为便于测试,您也可以直接在 AI Center(“设置”窗口)中配置 OCR,但对于生产部署不建议这样做。

在 Document Manager 和 AI Center Document Understanding ML 包中配置 OCR 服务

下表显示了如何在 Document Manager 和 AI Center 中配置 6 种受支持的 OCR 引擎类型。

重要提示:ocr.method 参数对应于 AI Center 的“ML 包创建”视图中的“OCR 引擎”下拉列表。

OCR 引擎

OCR 方法

OCR 密钥

OCR URL

UiPath

UiPath 文档 OCR(云端和本地部署)

UiPathDocumentOCR_CPU(本地部署)

中文版、日语版、韩语版 OCR(云端和内部部署)

UiPath Automation Cloud

Document Understanding API 密钥

企业计划

http://<IP_addr>:<port_number>

Google

Google Cloud Vision OCR

GCP 控制台 API 密钥

https://vision.googleapis.com/v1/images:annotate

Microsoft Read 2.0 内部部署

Microsoft Read OCR

http://<IP_addr>:<port_number>/vision/v2.0/read/core/Analyze

Microsoft Read 2.0 Azure

Microsoft Read OCR

来自 Azure 门户的资源的 API 密钥

<Azure_resource_Endpoint>/vision/v2.0/read/core/asyncBatchAnalyze

Microsoft Read 3.2 内部部署

Microsoft Read OCR

http://<IP_addr>:<port_number>/vision/v3.2/read/analyze

Microsoft Read 3.2 Azure

Microsoft Read OCR

来自 Azure 门户的资源的 API 密钥

<Azure_resource_Endpoint>/vision/v3.2/read/analyze

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.