document-understanding
2024.10
true
- 概述
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 1040 附表 C - ML 包
- 1040 附表 D - ML 包
- 1040 附表 E - ML 包
- 1040x - ML 包
- 3949a - ML 包
- 4506T - ML 包
- 709 - ML 包
- 941x - ML 包
- 9465 - ML 包
- 990 - ML 包 - 预览
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- 中国发票 - ML 包
- 希伯来语发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 护照 - ML 包
- 工资单 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- UB04 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 硬件要求
- 管道
- Document Manager
- OCR 服务
- 深度学习
- Insights 仪表板
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 许可
- 活动
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding 用户指南
Last updated 2024年11月11日
ML 包离线安装
Download the needed Document Understanding bundle. Here are the links for all the available bundles. The Document Understanding bundle contains information about all models included into a specific version. For example, the
dusemistructured-2024.10.0.tar.gz
contains information about all out-of-the-box pre-trained ML Packages included in the 2023.4.0 version.
离线安装要求在命令行中将下载的 DU 捆绑包重命名为
du-ondemand.tar.gz
。例如,如果您下载了名为 dusemistructured-2024.10.0.tar.gz
的 DU 捆绑包,则需要在安装时将其重命名为 du-ondemand.tar.gz
。
- 对于 Windows 计算机,请通过捆绑包链接直接下载,并将文件重命名为
du-ondemand.tar.gz
-
对于 Linux 计算机,请在可以访问互联网的计算机上按照以下命令下载所需的捆绑包:
wget -O ~/<bundle-name.tar.gz> 'bundle-link'
wget -O ~/<bundle-name.tar.gz> 'bundle-link'以下示例说明了如何下载适用于 Linux 的所需捆绑包:
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2024.10.0/dusemistructured-2024.10.0.tar.gz'
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2024.10.0/dusemistructured-2024.10.0.tar.gz' -
将以下捆绑包复制到集群的主计算机(进行安装的位置)上的
/uipath/tmp
文件夹:scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/
scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/ -
连接到此主计算机并加载捆绑包:
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
下载并安装模型后,请按照此处所述的步骤将模型上传到 AI Center。
使用以下公共 URL 访问“表单提取程序”和“智能关键字分类器”:
<FQDN>/du_/svc/formextractor
<FQDN>/du_/svc/intelligentkeywords
注意: 使用公共 URL 时,请将
<FQDN>
占位符替换为实际的环境信息。例如,在工作流中使用时, <FQDN>/du_/svc/formextractor
将变为 https://servicefabricserver.domain.com/du_/svc/formextractor
。
请按照以下步骤将 Document Understanding 捆绑包上传到外部 Docker 注册表:
- Pull the desired DU image from the UiPath® registry hosted on registry.uipath.com
- 根据您的 Docker 注册表名称重命名映像主机。
- 将映像推送到外部 Docker 注册表
Pull the images from UiPath® registry by running these
commands:
docker pull <uipath_registry_server>/<image_name>
docker pull <uipath_registry_server>/<image_name>
以下示例说明了如何从名为 registry.uipath.com 的注册表中拉取 UiPath 文档 OCR 捆绑包的映像:
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.10.0
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.10.0
通过运行以下命令,重命名映像主机:
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
以下示例说明了如何将 UiPath 文档 OCR 捆绑包的映像从名为 registry.uipath.com 的注册表重命名为名为 registry.mycompany.com 的注册表:
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
通过运行以下命令,将映像推送到外部 Docker 注册表:
docker push <your_registry_server>/<image_name>
docker push <your_registry_server>/<image_name>
以下示例说明了如何将 UiPath 文档 OCR 捆绑包的映像推送到外部 Docker 注册表:
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.10.0
Document Understanding 捆绑包 |
图像 |
---|---|
UiPath 文档 OCR | aicenter/du-doc-ocr:v23.10.0 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.10.0 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.10.0 |
文档分类器 | aicenter/du-ml-document-type-text-classifier:v23.10.0 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.10.0 |
Dulv4 | aicenter/python37duv4:23.10.0 |
Dulv3 | aicenter/python37duv3:23.10.0 |
Dulv2 | aicenter/python37duv2:23.10.0 |