- 概述
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 管道
- Document Manager
- OCR 服务
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 深度学习
- 许可
- 参考
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
安装和使用
本页介绍如何部署和配置 Document Understanding,以及有关如何在 Automation Suite 上使用 Document Understanding 的特殊说明。
Document Understanding 依赖于 AI Center,这意味着如果安装了 Document Understanding,则始终需要安装 AI Center。
此外,在使用 Document Understanding 之前,必须激活 Orchestrator。
在开始安装 Document Understanding 之前,请务必在此处查看满足 Automation Suite 单节点版和多节点版的所有要求。
在以下任一情况下,强烈建议为 Document Understanding 使用 GPU:
-
如果您在 AI Center 上重新训练 Document Understanding 模型(DocumentUnderstanding - 常规模型、发票、收据等)。
与在 GPU 上训练相比,在 CPU 上训练的速度要慢 5-7 倍,并且模型性能会下降。
-
如果您在 AI Center 上运行 UiPath 文档 OCR(非 Edge 版本)且每年处理超过 200 万页的文档。
如果您不使用 GPU,性能下降可能会影响产品体验。
有关如何配置 GPU 的更多详细信息,请参阅添加具有 GPU 支持的专用代理节点。
有关在在线环境中安装 Document Understanding 的更多信息,请参阅以下指南:
该流程与安装其他服务大致相同,唯一的要求是确保启用 AI Center 和 Document Understanding。
- 如果您使用的是交互式安装程序,请确保按照以下步骤选择两个产品。
-
如果您没有使用交互式安装程序,请在安装前在配置文件中或在安装后在 ArgoCD 中将 AI Center 和 Document Understanding 设置为“启用”。
示例配置文件包含在 Document Understanding 配置文件页面中。
有关在离线环境中安装 Document Understanding 的更多信息,请参阅以下指南:
要在离线环境中成功安装 Document Understanding,需要进行以下更改:
-
安装前请确保在配置文件中或安装后在 ArgoCD 中将 AI Center 和 Document Understanding 设置为“启用”。如果要使用该功能,请确保在配置文件中也启用了手写功能。
示例配置文件包含在 Document Understanding 配置文件页面中。
-
请确保下载并安装 Document Understanding 捆绑包。
有关下载和安装 Document Understanding 捆绑包的更多信息,请查看 ML 包离线安装页面。
请在此处查看 Document Understanding 配置文件。
使用以下公共 URL 访问“表单提取程序”和“智能关键字分类器”:
<FQDN>/du_/svc/formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
占位符替换为实际的环境信息。例如,在工作流中使用时, <FQDN>/du_/svc/formextractor
将变为 https://servicefabricserver.domain.com/du_/svc/formextractor
。
作为安装后操作,您可以启用或禁用 Document Understanding。如需了解更多详情,请参阅此处。
如果要在离线环境中使用中文、日语、韩语 OCR 端点,则需要按照以下说明安装离线捆绑包。安装捆绑包后,必须在 ArgoCD 中启用 OCR。
- 在 Document Understanding 中使用 中文、日语、韩语 OCR 时, 请确保已使用 OCR 的公共端点和 Document Understanding API 密钥配置活动。
- 仅 Automation Suite 中部署的 Document Understanding 支持中文、日语、韩语 OCR。连接到外部 Orchestrator 的 AI Center 中部署的 Document Understanding 不提供此支持。
为了在 ArgoCD 中启用 OCR,您需要执行以下步骤:
- 访问 ArgoCD。
- 打开 Document Understanding 框架。
- 单击“参数”选项卡,然后转到
du-cjk-ocr.enabled
。 - 单击“编辑”按钮,将值设置为
TRUE
,然后单击“保存”按钮。
{Cluster_FQDN}/du_/cjk-ocr/
。
请在此处查看与 Document Understanding 相关的问题。