Document Understanding

document-understanding

2020.10

false

Document Understanding 用户指南

重要 :

新发布内容的本地化可能需要 1-2 周的时间才能完成。

配置 OCR

为了将文档导入 Data Manager，必须配置 OCR 服务。您可以从“设置”>“OCR”视图完成配置，该视图可通过屏幕右上角的按钮访问。

配置 OCR 时，需要 OCR 服务具有 URL。您可能会用到以下 URL：

公共 URL，例如 https://du.uipath.com/ocr，或来自 Google Vision OCR 或 Microsoft Read OCR 的第三方 URL；
由内部部署的 UiPath 提供的 UiPath 文档 OCR 或 Omnipage OCR 独立容器的 URL；
作为“ML 技能”部署的 OCR ML 包的 URL，这些 URL 已在 AI Center 内部部署版 v2020.10 或更高版本中公开。
重要提示：
如果您在与 Data Manager 相同的计算机上运行 OCR，则不要使用 localhost 来引用本地计算机，而要使用本地计算机的 IP 地址或域名。

如果是作为 AI Center 内部部署版中公共 ML 技能部署的 OCR 的 URL，请使用 AI Center ML 技能详细信息页面中显示的 URL。

重要提示：

选择用于将文档导入到 Data Manager 的 OCR 引擎是一项关键决策。

建议使用相同的 OCR 导入训练数据（训练时间），这是因为在部署模型时（运行时）也会用到它。

理想情况下，您应该尝试几个不同的选项，看看哪个选项最适合您的文档，然后再作出决策。

内部部署选项包括：

基于云的选项包括：

在此页面上

前一个配置 Data Manager

下一个配置预标注