- 概述
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 4506T - ML 包
- 990 - ML 包 - 预览
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 护照 - ML 包
- 工资单 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 硬件要求
- 管道
- Document Manager
- OCR 服务
- 深度学习
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 许可
- 活动
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
安装和使用
本页介绍如何部署和配置 Document UnderstandingTM,以及有关如何在 Automation Suite 上使用 Document UnderstandingTM 的特殊说明。
Document Understanding 依赖于 AI Center,这意味着如果安装了 Document Understanding,则始终需要安装 AI Center。
此外,在使用 Document Understanding 之前,必须激活 Orchestrator。
在开始安装 Document Understanding 之前,请务必在此处查看满足 Automation Suite 单节点版和多节点版的所有要求。
在以下任一情况下,强烈建议为 Document Understanding 使用 GPU:
-
如果您在 AI Center 上重新训练 Document Understanding 模型(DocumentUnderstanding - 常规模型、发票、收据等)。
与在 GPU 上训练相比,在 CPU 上训练的速度要慢 5-7 倍,并且模型性能会下降。
-
如果您在 AI Center 上运行 UiPath 文档 OCR(非 Edge 版本)且每年处理超过 200 万页的文档。
如果您不使用 GPU,性能下降可能会影响产品体验。
有关如何配置 GPU 的更多详细信息,请参阅添加具有 GPU 支持的专用代理节点。
请在此处查看 Document Understanding 配置文件。
使用以下公共 URL 访问“表单提取程序”和“智能关键字分类器”:
<FQDN>/du_/svc/formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
占位符替换为实际的环境信息。例如,在工作流中使用时, <FQDN>/du_/svc/formextractor
将变为 https://servicefabricserver.domain.com/du_/svc/formextractor
。
作为安装后操作,您可以启用或禁用 Document Understanding。如需了解更多详情,请参阅此处。
如果要在离线环境中使用中文、日语、韩语 OCR 端点,则需要按照以下说明安装离线捆绑包。安装捆绑包后,必须在 ArgoCD 中启用 OCR。
- 在 Document Understanding 中使用 中文、日语、韩语 OCR 时, 请确保已使用 OCR 的公共端点和 Document Understanding API 密钥配置活动。
- 仅 Automation Suite 中部署的 Document Understanding 支持中文、日语、韩语 OCR。连接到外部 Orchestrator 的 AI Center 中部署的 Document Understanding 不提供此支持。
为了在 ArgoCD 中启用 OCR,您需要执行以下步骤:
- 访问 ArgoCD。
- 打开 Document Understanding 框架。
- 单击“参数”选项卡,然后转到
du-cjk-ocr.enabled
。 - 单击“编辑”按钮,将值设置为
TRUE
,然后单击“保存”按钮。
{Cluster_FQDN}/du_/cjk-ocr/
。
请在此处查看与 Document Understanding 相关的问题。