document-understanding
2020.10
false
UiPath logo, featuring letters U and I in white
已弃用

Document Understanding 用户指南

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
上次更新日期 2024年7月29日

配置 OCR

为了将文档导入 Data Manager,必须配置 OCR 服务。您可以从“设置”>“OCR”视图完成配置,该视图可通过屏幕右上角的按钮访问。

配置 OCR 时,需要 OCR 服务具有 URL。您可能会用到以下 URL:

  • 公共 URL,例如 https://du.uipath.com/ocr,或来自 Google Vision OCR 或 Microsoft Read OCR 的第三方 URL;
  • 由内部部署的 UiPath 提供的 UiPath 文档 OCR 或 Omnipage OCR 独立容器的 URL;
  • 作为“ML 技能”部署的 OCR ML 包的 URL,这些 URL 已在 AI Center 内部部署版 v2020.10 或更高版本中公开
    重要提示:
    如果您在与 Data Manager 相同的计算机上运行 OCR,则不要使用 localhost 来引用本地计算机,而要使用本地计算机的 IP 地址域名

    如果是作为 AI Center 内部部署版中公共 ML 技能部署的 OCR 的 URL,请使用 AI Center ML 技能详细信息页面中显示的 URL。

选择 OCR 引擎

重要提示:

选择用于将文档导入到 Data Manager 的 OCR 引擎是一项关键决策。

建议使用相同的 OCR 导入训练数据(训练时间),这是因为在部署模型时(运行时)也会用到它。

理想情况下,您应该尝试几个不同的选项,看看哪个选项最适合您的文档,然后再作出决策。

内部部署选项包括:

  • UiPath OCR 容器,支持主要的西欧语言;
  • Omnipage OCR 容器(也可从 UiPath 获得),最适用于干净扫描的文档,并且语言覆盖面最广;
  • Microsoft Read 容器(可从 Microsoft 处获得预览版)的语言覆盖面也广;
  • 在 AI Center 内部部署版 v2020.10 或更高版本中部署的 UiPath OCR ML 技能

基于云的选项包括:

  • “UiPath 文档 OCR”- https://du.uipath.com/ocr
  • 具有最广语言覆盖范围的 Google Cloud OCR
  • Microsoft 读取 Azure OCR
  • 选择 OCR 引擎

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。