document-understanding
2020.10
false
- 入门指南
- 框架组件
- AI Center 中的 Document Understanding
- 管道
- ML 包
- Data Manager
- OCR 服务
- 许可
- 参考
已弃用
Document Understanding 用户指南
Last updated 2024年7月29日
配置 OCR
为了将文档导入 Data Manager,必须配置 OCR 服务。您可以从“设置”>“OCR”视图完成配置,该视图可通过屏幕右上角的按钮访问。
配置 OCR 时,需要 OCR 服务具有 URL。您可能会用到以下 URL:
- 公共 URL,例如 https://du.uipath.com/ocr,或来自 Google Vision OCR 或 Microsoft Read OCR 的第三方 URL;
- 由内部部署的 UiPath 提供的 UiPath 文档 OCR 或 Omnipage OCR 独立容器的 URL;
- 作为“ML 技能”部署的 OCR ML 包的 URL,这些 URL 已在 AI Center 内部部署版 v2020.10 或更高版本中公开。
重要提示:如果您在与 Data Manager 相同的计算机上运行 OCR,则不要使用
localhost
来引用本地计算机,而要使用本地计算机的 IP 地址或域名。如果是作为 AI Center 内部部署版中公共 ML 技能部署的 OCR 的 URL,请使用 AI Center ML 技能详细信息页面中显示的 URL。
重要提示:
选择用于将文档导入到 Data Manager 的 OCR 引擎是一项关键决策。
建议使用相同的 OCR 导入训练数据(训练时间),这是因为在部署模型时(运行时)也会用到它。
理想情况下,您应该尝试几个不同的选项,看看哪个选项最适合您的文档,然后再作出决策。
内部部署选项包括:
- UiPath OCR 容器,支持主要的西欧语言;
- Omnipage OCR 容器(也可从 UiPath 获得),最适用于干净扫描的文档,并且语言覆盖面最广;
- Microsoft Read 容器(可从 Microsoft 处获得预览版)的语言覆盖面也广;
- 在 AI Center 内部部署版 v2020.10 或更高版本中部署的 UiPath OCR ML 技能。
基于云的选项包括:
- “UiPath 文档 OCR”- https://du.uipath.com/ocr;
- 具有最广语言覆盖范围的 Google Cloud OCR;
- Microsoft 读取 Azure OCR。