- 概述
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 管道
- Document Manager
- OCR 服务
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 深度学习
- 许可
- 参考
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding 用户指南
ML 包离线安装
根据要使用的模型,您需要满足以下条件:
- 对于 2022.10 及更高版本的模型:
- 下载所需的 Document Understanding 捆绑包。此处是所有可用捆绑包的链接。DU 捆绑包包含有关特定版本中包含的所有模型的信息。例如,
dusemistructured-2022.10.0.tar.gz
包含有关 2023.4.0 版本中包含的所有开箱即用的预训练 ML 包的信息。
- 下载所需的 Document Understanding 捆绑包。此处是所有可用捆绑包的链接。DU 捆绑包包含有关特定版本中包含的所有模型的信息。例如,
- 对于 2022.4 及更早版本的模型(
python37duv3
和python37duv4
):- 所有 ML 包都以
.zip
文件的形式提供,并在 AI Center 中作为自定义包直接上传。要下载模型,请联系您的客户经理、CSM 或支持团队,以获取每个包的下载链接。 - 下载所需的 Document Understanding 捆绑包。此处是所有可用捆绑包的链接。
- 所有 ML 包都以
du-ondemand.tar.gz
。例如,如果您下载了名为 dusemistructured-2023.4.0.tar.gz
的 DU 捆绑包,则需要在安装时将其重命名为 du-ondemand.tar.gz
。
- 对于 Windows 计算机,请通过捆绑包链接直接下载,并将文件重命名为
du-ondemand.tar.gz
-
对于 Linux 计算机,请在可以访问互联网的计算机上按照以下命令下载所需的捆绑包:
wget -O ~/<bundle-name.tar.gz> 'bundle-link'
wget -O ~/<bundle-name.tar.gz> 'bundle-link'以下示例说明了如何下载适用于 Linux 的所需捆绑包:
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.4.0/dusemistructured-2023.4.0.tar.gz'
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.4.0/dusemistructured-2023.4.0.tar.gz' -
将以下捆绑包复制到集群的主计算机(进行安装的位置)上的
/uipath/tmp
文件夹:scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/
scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/ -
连接到此主计算机并加载捆绑包:
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
下载并安装模型后,请按照此处所述的步骤将模型上传到 AI Center。
每个离线捆绑包都包含多个 ML 包使用的基本映像。要确定要为特定型号版本下载哪个捆绑包,请检查其兼容性。
模型版本 | 平台版本 | ||||
---|---|---|---|---|---|
2024.10 | 2023.10 | 2023.4 | 2022.10 | 2022.4 | |
2024.10 | |||||
2023.10 | |||||
2023.4 | |||||
2022.10 | * | * | |||
2022.4 | * | * | * | * |
只需为 UiPath 文档 OCR ML 包 22.10.8 安装 UiPath 文档 OCR 离线捆绑包。
ML 包 |
模型版本 |
元数据 |
---|---|---|
UiPath 文档 OCR 仅适用于在 AI Center 独立环境中安装的 DU |
22.10.8 |
需要为下表中的 ML 包安装 UiPathDocumentOCR_CPU 离线捆绑包。
ML 包 |
模型版本 |
元数据 |
---|---|---|
UiPathDocumentOCR_CPU |
22.10.8 |
需要为下表中的 ML 包安装中文版、日语版、韩语版 OCR 离线捆绑包。此捆绑包只能在 CPU 虚拟机上使用。
如果要在离线环境中启用中文、日语、韩语 OCR,还需要按照以下步骤操作。
ML 包 |
模型版本 |
元数据 |
---|---|---|
OCR for Chinese, Japanese, Korean |
22.10.8 |
不适用 |
需要为下表中的 ML 包安装 开箱即用的预训练 ML 包 离线捆绑包。
ML 包 |
模型版本 |
元数据 |
---|---|---|
Document Understanding |
22.10.8 | |
发票 |
22.10.8 | |
澳大利亚发票 |
22.10.8 | |
印度发票 |
22.10.8 | |
日本发票 |
22.10.8 | |
中国发票 |
22.10.8 | |
收据 |
22.10.8 | |
订单 |
22.10.8 | |
水电费 |
22.10.8 | |
身份证 |
22.10.8 | |
护照 |
22.10.8 | |
汇款通知书 |
22.10.8 | |
提单 |
22.10.8 | |
第 2 周 |
22.10.8 | |
第 9 周 |
22.10.8 | |
ACORD125 |
22.10.8 | |
I9 |
22.10.8 | |
990 |
22.10.8
Preview | |
4506T |
22.10.8 | |
FM1003 |
22.10.8
Preview | |
ACORD25 |
22.10.8 | |
ACORD131 |
22.10.8 | |
ACORD126 |
22.10.8 | |
ACORD140 |
22.10.8 | |
1040 |
22.10.8 | |
检查 |
22.10.8 | |
银行对账单 |
22.10.8 | |
财务报表 |
22.10.8 | |
装箱单 |
22.10.8 | |
车辆所有权证明 |
22.10.8 |
仅当您要将 2022.10.8 企业版中的 ML 包与 AI Center 版本 2022.4 一起使用时,才需要安装 dulv4 离线捆绑包。
ML 包 |
模型版本 |
元数据 |
---|---|---|
Document Understanding |
22.10.8 | |
发票 |
22.10.8 | |
澳大利亚发票 |
22.10.8 | |
印度发票 |
22.10.8 | |
日本发票 |
22.10.8
Preview | |
中国发票 |
22.10.8
Preview | |
收据 |
22.10.8 | |
订单 |
22.10.8 | |
水电费 |
22.10.8 | |
身份证 |
22.10.8 | |
护照 |
22.10.8 | |
汇款通知书 |
22.10.8 | |
提单 |
22.10.8 | |
第 2 周 |
22.10.8 | |
第 9 周 |
22.10.8 | |
ACORD125 |
22.10.8 | |
I9 |
22.10.8 | |
990 |
22.10.8
Preview | |
4506T |
22.10.8 | |
FM1003 |
22.10.8
Preview | |
ACORD25 |
22.10.8 | |
ACORD131 |
22.10.8 | |
ACORD126 |
22.10.8 | |
ACORD140 |
22.10.8 | |
1040 |
22.10.8 | |
检查 |
22.10.8 | |
银行对账单 |
22.10.8 | |
财务报表 |
22.10.8 | |
装箱单 |
22.10.8 | |
车辆所有权证明 |
22.10.8 |
仅当您要将 2021.10 企业版中的 ML 包与 AI Center 版本 2022.10 一起使用时,才需要安装 dulv3 离线捆绑包。
有关元数据链接,请查看 2021.10 Document Understanding 用户指南中的表格。
仅当您要将 2021.10 企业版中的 ML 包与 AI Center 版本 2022.10.8 一起使用时,才需要安装 dulv2 离线捆绑包。
有关元数据链接,请查看 2021.10 Document Understanding 用户指南中的表格。