document-understanding
2023.4
false
- 概述
- Document Understanding 流程
- 快速入门教程
- 框架组件
- ML 包
- 概述
- Document Understanding - ML 包
- DocumentClassifier - ML 包
- 具有 OCR 功能的 ML 包
- 1040 - ML 包
- 4506T - ML 包
- 990 - ML 包 - 预览
- ACORD125 - ML 包
- ACORD126 - ML 包
- ACORD131 - ML 包
- ACORD140 - ML 包
- ACORD25 - ML 包
- 银行对账单 - ML 包
- 提单 - ML 包
- 公司注册证书 - ML 包
- 原产地证书 - ML 包
- 检查 - ML 包
- 儿童产品证书 - ML 包
- CMS1500 - ML 包
- 欧盟符合性声明 - ML 包
- 财务报表 (Financial statements) - ML 包
- FM1003 - ML 包
- I9 - ML 包
- ID Cards - ML 包
- Invoices - ML 包
- InvoicesAustralia - ML 包
- 中国发票 - ML 包
- 印度发票 - ML 包
- 日本发票 - ML 包
- 装运发票 - ML 包
- 装箱单 - ML 包
- 护照 - ML 包
- 工资单 - ML 包
- 采购订单 - ML 包
- 收据 - ML 包
- 汇款通知书 - ML 包
- 水电费账单 - ML 包
- 车辆所有权证明 - ML 包
- W2 - ML 包
- W9 - ML 包
- 其他开箱即用的 ML 包
- 公共端点
- 硬件要求
- 管道
- Document Manager
- OCR 服务
- 深度学习
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 许可
- 活动
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding 用户指南
ML 包离线安装
根据要使用的模型,您需要满足以下条件:
- 对于 2022.10 及更高版本的模型:
- 下载所需的 Document Understanding 捆绑包。此处是所有可用捆绑包的链接。DU 捆绑包包含有关特定版本中包含的所有模型的信息。例如,
dusemistructured-2023.4.0.tar.gz
包含有关 2023.4.0 版本中包含的所有开箱即用的预训练 ML 包的信息。
- 下载所需的 Document Understanding 捆绑包。此处是所有可用捆绑包的链接。DU 捆绑包包含有关特定版本中包含的所有模型的信息。例如,
- 对于 2022.4 及更早版本的模型(
python37duv3
和python37duv4
):- 所有 ML 包都以
.zip
文件的形式提供,并在 AI Center 中作为自定义包直接上传。要下载模型,请联系您的客户经理、CSM 或支持团队,以获取每个包的下载链接。 - 下载所需的 Document Understanding 捆绑包。此处是所有可用捆绑包的链接。
- 所有 ML 包都以
离线安装要求在命令行中将下载的 DU 捆绑包重命名为
du-ondemand.tar.gz
。例如,如果您下载了名为 dusemistructured-2023.4.0.tar.gz
的 DU 捆绑包,则需要在安装时将其重命名为 du-ondemand.tar.gz
。
- 对于 Windows 计算机,请通过捆绑包链接直接下载,并将文件重命名为
du-ondemand.tar.gz
-
对于 Linux 计算机,请在可以访问互联网的计算机上按照以下命令下载所需的捆绑包:
wget -O ~/<bundle-name.tar.gz> 'bundle-link'
wget -O ~/<bundle-name.tar.gz> 'bundle-link'以下示例说明了如何下载适用于 Linux 的所需捆绑包:
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.4.0/dusemistructured-2023.4.0.tar.gz'
wget -O ~/du-ondemand.tar.gz 'https://download.uipath.com/automation-suite/2023.4.0/dusemistructured-2023.4.0.tar.gz' -
将以下捆绑包复制到集群的主计算机(进行安装的位置)上的
/uipath/tmp
文件夹:scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/
scp ~/<bundle-name.tar.gz> <username>@<node dns>:/uipath/tmp/ -
连接到此主计算机并加载捆绑包:
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
./configureUiPathAS.sh registry upload --optional-offline-bundle "/uipath/tmp/du.tar.gz" --offline-tmp-folder "/uipath/tmp"
下载并安装模型后,请按照此处所述的步骤将模型上传到 AI Center。
请按照以下步骤将 DU 捆绑包上传到外部 Docker 注册表:
- 从托管于 registry.uipath.com 的 UiPath 注册表中拉取所需的 DU 映像
- 根据您的 Docker 注册表名称重命名映像主机。
- 将映像推送到外部 Docker 注册表
通过运行以下命令,从 UiPath 注册表中拉取映像:
docker pull <uipath_registry_server>/<image_name>
docker pull <uipath_registry_server>/<image_name>
以下示例说明了如何从名为 registry.uipath.com 的注册表中拉取 UiPath 文档 OCR 捆绑包的映像:
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70
docker pull registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70
通过运行以下命令,重命名映像主机:
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
docker tag <uipath_registry_server>/<image_name> <your_registry_server>/<image_name>
以下示例说明了如何将 UiPath 文档 OCR 捆绑包的映像从名为 registry.uipath.com 的注册表重命名为名为 registry.mycompany.com 的注册表:
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.4.0-rc70
docker tag registry.uipath.com/aicenter/du-doc-ocr:v23.4.0-rc70 registory.mycompany.com/aicenter/du-doc-ocr:v23.4.0-rc70
通过运行以下命令,将映像推送到外部 Docker 注册表:
docker push <your_registry_server>/<image_name>
docker push <your_registry_server>/<image_name>
以下示例说明了如何将 UiPath 文档 OCR 捆绑包的映像推送到外部 Docker 注册表:
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.4.0-rc70
docker push registory.mycompany.com/aicenter/du-doc-ocr:v23.4.0-rc70
Document Understanding bundle | 图像 |
---|---|
UiPath 文档 OCR | aicenter/du-doc-ocr:v23.4-11.15-rc01 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.4-11.15-rc01 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4-12.01-rc01 |
文档分类器 | aicenter/du-ml-document-type-text-classifier:v23.4-11.15-rc01 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4-11.15-rc01 |
Document Understanding bundle | 图像 |
---|---|
UiPath 文档 OCR | aicenter/du-doc-ocr:v23.4-10.10-rc02 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.4-10.10-rc02 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4-10.11-rc02 |
文档分类器 | aicenter/du-ml-document-type-text-classifier:v23.4-10.10-rc02 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4-10.10-rc02 |
Document Understanding bundle | 图像 |
---|---|
UiPath 文档 OCR | aicenter/du-doc-ocr:v23.4-rc02 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.4-rc02 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.7-rc62 |
文档分类器 | aicenter/du-ml-document-type-text-classifier:v23.4-rc02 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4-rc02 |
Document Understanding bundle | 图像 |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.7-rc35 |
文档分类器 | aicenter/du-ml-document-type-text-classifier:v23.4.7-rc35 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4.7-rc35 |
Document Understanding bundle | 图像 |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.6-rc16 |
文档分类器 | aicenter/du-ml-document-type-text-classifier:v23.4.5-rc83 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4.5-rc83 |
Document Understanding bundle | 图像 |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.5-rc12 |
文档分类器 | aicenter/du-ml-document-type-text-classifier:v23.4.5-rc72 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4.5-rc72 |
Document Understanding bundle | 图像 |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.4-rc16 |
Document Understanding bundle | 图像 |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.3-rc24 |
文档分类器 | aicenter/du-ml-document-type-text-classifier:v23.4.3-rc21 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4.3-rc21 |
Document Understanding bundle | 图像 |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.2-rc29 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4.1-rc09 |
Document Understanding bundle | 图像 |
---|---|
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.1-rc60 |
Out of the box pre-trained ML packages | aicenter/du-semistructured:v23.4.1-rc09 |
Document Understanding bundle | 图像 |
---|---|
UiPath 文档 OCR | aicenter/du-doc-ocr:v23.4.0-rc70 |
UiPathDocumentOCR_CPU | aicenter/du-doc-ocr-cpu:v23.4.0-rc70 |
OCR for Chinese, Japanese, Korean | du/du-cjk-ocr-proxy:v23.4.0-rc70 |
文档分类器 | aicenter/du-ml-document-type-text-classifier:v23.4.0-rc70 |
Out-of-the-box Pre-trained ML Packages | aicenter/du-semistructured:v23.4.0-rc70 |