Document Understanding 用户指南

部署 UiPath 文档 OCR

在 AI Center 中创建 UiPath 文档 OCR ML 包。

对于在线安装，“开箱即用包”部分已包含“UiPath 文档 OCR”模型。转到“ML 包”>“开箱即用包”>“UiPath Document Understanding”>“UiPath 文档 OCR”，然后单击“提交”。

对于离线安装，请从 AI Center 的左侧边栏中转到“ML 包”选项卡，然后创建一个新包。为包命名并上传您从此页面下载的包。选择 JSON 输入类型和相应的 Python 语言。创建包。

注意：在 AI Center 中创建 UiPath 文档 OCR ML 包时，其名称不能为 ocr 或 OCR。请务必选择其他名称。

转到“ML 技能”，并为您创建的 UiPath 文档 OCR 包创建新的 ML 技能。

请使用高级基础架构设置以更新部署来更新副本（理想情况下，副本数应等于节点数），并最大化 CPU（至少 4 个）和 RAM 请求（如果您未使用 GPU 计算机，或 UiPath 文档 OCR 处理速度较慢，并且可能会失败）。

注意：UiPath 文档 OCR 已针对在 GPU 上运行进行了优化。为确保更快的 CPU 性能，我们建议为 ML 技能分配更多 CPU 内核。

OCR 引擎需要 GPU 上才能实现最佳性能，建议用于生产工作负载。但是，如果无可用 GPU，它仍可以在 CPU 上运行，但需要比默认设置更多的资源。高级基础架构设置应进行如下调整：

副本：如果并发使用 UiPath 文档 OCR，则增加副本数量。如果您一次使用 UiPath 文档 OCR 在单个数据标签会话中执行导入操作，并且 UiPath 文档 OCR 未在其他 UiPath 工作流中使用，则 1 个副本就足够了。否则，需要增加副本的数量。没有一个“确定无误”的数字，您需要反复进行试验。不要在单个节点安装上使用 2 个以上的副本。理想情况下，副本计数应等于集群中的节点数（1 个副本/节点）。如果需要更多并行度，增加 CPU 会有所帮助
CPU：至少应为 4 个（对于每个副本）。请确保您拥有适当的资源。没有一个“确定无误”的数字，但更多的 CPU 意味着更快的处理时间。您需要在特定场景下测试是否足够。

ML 技能可能需要长达 30 分钟才能准备就绪。您可能需要刷新 AI Center 页面才能查看状态更改。

恭喜!您已在 AI Center 上成功部署 UiPath 文档 OCR。

您可以在 Studio 工作流中直接选择 ML 技能作为您的私有技能。或者，如果您已经安装了 AI Center 独立版的在线版本，并且想要使用公共 ML 技能，请按照以下说明获取公共 ML 技能端点（可选）。

ML 技能可用后，双击 ML 技能并转到“修改当前部署”。

打开开关，将 ML 技能设为公开。您可能需要等待几分钟才能刷新页面。

双击 ML 技能并复制 URL，即 UiPath 文档 OCR 的端点，以供以后使用。

前一个启动数据标签会话

下一个部署开箱即用的 ML 包