- 入门指南
- 框架组件
- ML 包
- 管道
- Data Manager
- OCR 服务
- OCR 服务
- 部署在 Automation Suite 中的 Document Understanding
- 在 AI Center 独立版中部署的 Document Understanding
- 深度学习
- 许可
- 参考
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.Intelligent OCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding 用户指南
OCR 服务
OCR 服务用于以下目的:
- 在数据加标签时,当将文档导入 Data Manager 时。此步骤可用的引擎包括 UiPath Document OCR、Google Cloud Vision OCR 和 Microsoft Read OCR。
- 在运行时,从 RPA 工作流调用模型时。此步骤可用的引擎是与 UiPath RPA 平台集成的所有引擎,包括上述引擎,以及 Abbyy Finereader、Microsoft OCR(旧版)、Microsoft Project Oxford OCR 和 Tesseract。
为便于测试,您也可以直接在 AI Center(“设置”窗口)中配置 OCR,但对于生产部署不建议这样做。
本节详细介绍了安装 OCR 引擎的硬件要求和软件要求。
-
涉及的计算机:云虚拟机/内部部署计算机/笔记本电脑
-
操作系统:Windows (Windows 10)/Linux (Ubuntu/RedHat)
-
计算引擎:CPU/GPU
-
OCR:UiPath 文档 OCR CPU/UiPath 文档 OCR GPU
|
CPU 核心 |
RAM (GB) |
视频 RAM (GB) | 硬盘 (GB) |
---|---|---|---|---|
UiPath CPU |
4 |
4 |
50 | |
UiPath GPU |
1 |
4 |
8 |
50 |
Linux 操作系统
如果您在云虚拟机上安装产品,则支持以下操作系统:
软件 |
版本 |
---|---|
Ubuntu |
20.04 LTS 18.04 LTS 16.04 LTS |
RHEL |
7.x |
如果您在内部部署数据中心的计算机上安装产品,则支持以下操作系统:
软件 |
版本 |
---|---|
Ubuntu |
20.04 LTS 18.04 LTS 16.04 LTS |
RHEL |
7.x |
Windows 操作系统
有关受支持的 Windows 操作系统的列表,请访问 Docker 官方网站。
在 Windows 上,您的计算机需要启用虚拟化。我们强烈建议您仅在笔记本电脑或桌面工作站等物理计算机上执行此操作。我们不支持使用嵌套虚拟化技术在虚拟机(云或数据中心)的 Windows 上的 Docker 上运行。
浏览器
软件 |
版本 |
---|---|
Google Chrome |
50+ |
-
Data Manager 需要访问 OCR 引擎
<IP>:<port_number>
。OCR 引擎可能是本地部署 UiPath Document OCR、Google Cloud Vision OCR、Microsoft Read Azure 或本地部署 Microsoft Read。 -
机器人需要访问 OCR
<IP>:<port_number>
。与上述相同的 OCR 选项。 -
OCR 引擎需要通过端口 443 访问 Azure 中 UiPath 托管的许可服务器。
OCR 引擎是在 Docker 之上运行的容器化应用程序。不能在与内部部署 AI Center 相同的计算机上运行这些 OCR 引擎。为了在单独的计算机上运行它们,可以使用下面的先决条件安装程序命令来设置 Docker,并选择性地安装 NVidia 驱动程序。这些脚本不应在将安装 AI Center 的计算机上运行。
/
的行:
df -h
df -h
如果该分区的大小低于最小存储要求,请参阅“配置 Docker 数据文件夹”一节。
Linux
按照 Docker 官方文档中的说明进行操作,或运行以下命令:
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu
如果此命令失败,则说明您的 Linux 操作系统不兼容,您需要请求 IT 部门按照 Docker 官方文档中的说明在计算机上安装 Docker。
Azure 虚拟机
如果要在 Azure 虚拟机上安装,请改用此命令:
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu --cloud azure
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env cpu --cloud azure
Windows 10
下载并安装 Docker Desktop。在 Windows 10 的最新更新版本上,您需要安装 WSL 2。因此,当出现“WSL 2 安装未完成”对话框时,请单击“重新启动”按钮。
workdir
),并将其路径包含在 docker run 命令中的 -v
标志后面。在 Windows 上执行此操作时,Docker Desktop 将弹出如下通知。您需要单击“共享”以继续。
填写您希望 Docker 将其文件保存到的文件夹的路径,然后运行此命令,接着重新启动:
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --change-mount </path/to/folder>
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --change-mount </path/to/folder>
Docker 帮助以“Docker 映像”形式发布软件。映像的运行实例称为容器。只要有映像,就可以根据需要多次停止、删除和重新启动容器。
删除映像后,映像将丢失。恢复映像的唯一方法是,如果它仍然存在,请从它来自的注册表中再次拉取它。
–v
和 –p
参数分别将文件夹和端口从容器映射到主机。
在下表中,您可以找到 Docker 命令行的常用命令列表。
单击此处查看基本 Docker 命令的完整列表。
命令 |
描述 |
---|---|
|
登录到注册表。 |
|
从注册表下载映像。标签“最新”通常用于指代映像的最新版本。 |
或
|
在分离模式下运行映像,同时将端口 80 从容器内部映射到主机上的端口 5000,并将 <container folder> 映射到 <host folder>。分离模式表示容器不会阻止终端,因此您可以在同一个终端上执行其他操作。 |
|
列出系统中存在的映像。 |
|
列出所有容器(正在运行和已停止)。 容器 ID 用于在需要停止或删除容器时引用该容器。 |
|
停止容器 此命令不会删除容器,但在删除容器之前需要执行此命令。 |
“
docker rm <container id> ”
|
删除容器 必须事先停止容器。 |
|
并显示容器的日志。 |
|
从系统中删除一个或多个映像。 这可帮助节省存储空间,因为映像可能会占用大量空间。 |
|
删除所有已停止的容器 |
命令 |
描述 |
---|---|
|
以管理员身份运行命令。遇到“权限被拒绝”错误时,请尝试此方法。 |
|
显示有关系统中网络接口的信息。在 eth0 或 docker0 部分中找到您的计算机 IP。 |
|
显示当前文件夹的路径。 |
|
列出目录的内容。 |
|
转到其他文件夹。 |
|
创建新文件夹。 |
Linux
运行以下命令:
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env gpu
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env gpu
在某些系统上必须运行此命令两次,否则可能需要重新启动系统以安装所要求的所有依赖项。
特定于 Azure:要使用 NV 系列虚拟机,您需要在执行上述命令之前安装 NVIDIA 驱动程序,或者您可以使用 Azure 的驱动程序扩展程序根据该层 GPU 模型安装必要的 NVIDIA 驱动程序。
Azure 虚拟机
如果要在 Azure 虚拟机上安装,请改用此命令:
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env gpu --cloud azure
curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env gpu --cloud azure
UiPath 文档 OCR 是 UiPath 的专有 OCR 技术,支持以下拉丁语脚本语言使用的字符:英语、法语、德语、意大利语、葡萄牙语、罗马尼亚语和西班牙语。该技术能够识别其他语言的文本,但不带重音符号,例如,波兰语中的“Ł”将被识别为“L”。使用 UiPath 文档 OCR 处理的页面不计入与 Document Understanding 企业版许可证一起购买的页面配额,因此 UiPath 文档 OCR 可免费使用。
UiPath 文档 OCR 可用于以下部署类型:
- Cloud 公共 URL - 有关更多详细信息,请参阅公共端点页面
- 使用 UiPath.DocumentUnderstanding.OCR. 本地服务器活动包(无需互联网访问)的内部部署(包括离线部署)
- 内部部署的常规独立 Docker 容器(需要互联网访问)
- 内部部署的离线独立 Docker 容器(无需互联网访问)
- 在 AI Center 常规部署中作为 ML 技能进行内部部署(需要访问互联网)
- 在 AI Center 离线部署中作为 ML 技能进行内部部署(无需互联网访问)
-
要安装 UiPath 文档 OCR 独立 Docker 容器,请运行以下命令:
docker login aiflprodweacr.azurecr.io -u *** -p **docker pull aiflprodweacr.azurecr.io/uipath-ocr:latest
docker login aiflprodweacr.azurecr.io -u *** -p **docker pull aiflprodweacr.azurecr.io/uipath-ocr:latest -
使用 CPU 运行
docker run -d -p 5000:80 aiflprodweacr.azurecr.io/uipath-ocr:latest LicenseAgreement=accept
docker run -d -p 5000:80 aiflprodweacr.azurecr.io/uipath-ocr:latest LicenseAgreement=accept -
使用 GPU 运行
docker run -d -p 5000:80 --gpus all aiflprodweacr.azurecr.io/uipath-ocr:latest LicenseAgreement=accept
docker run -d -p 5000:80 --gpus all aiflprodweacr.azurecr.io/uipath-ocr:latest LicenseAgreement=accept -
在 AI Center 中,当创建新的 ML 包时,屏幕底部有一个可选的 OCR 配置部分,您可以在其中定义服务器端 OCR 引擎类型、OCR URL 和 OCR 密钥。OCR 密钥是您从 Automation Cloud 帐户的“许可证”部分获取的 API 密钥。如果您选中“使用服务器端 OCR”复选框,则机器学习提取程序活动将使用此 OCR 配置。默认情况下,此复选框处于未选中状态,在这种情况下,提取程序将在“数字化文档”活动中使用 OCR。
重要提示:UiPath 文档 OCR 容器不能与本地部署 AI Center 在同一台计算机上运行。
可以从 Google Cloud Platform 文档中获取端点。如果您的订阅中包含 Google Cloud Vision 服务,则可以从 Google Cloud Platform 控制台获取 API 密钥。
下表显示了如何在 Data Manager 和 AI Center 中配置 6 种受支持的 OCR 引擎类型。
OCR 引擎 |
OCR 方法 |
OCR 密钥 |
OCR URL |
---|---|---|---|
UiPath |
UiPath 文档 OCR |
UiPath Automation Cloud Document Understanding API 密钥 企业计划 |
|
|
Google Cloud Vision OCR |
GCP 控制台 API 密钥 |
|
Microsoft Read 2.0 内部部署 |
Microsoft Read OCR |
无 |
|
Microsoft Read 2.0 Azure |
Microsoft Read OCR |
来自 Azure 门户的资源的 API 密钥 |
|
Microsoft Read 3.2 内部部署 |
Microsoft Read OCR |
无 |
|
Microsoft Read 3.2 Azure |
Microsoft Read OCR |
来自 Azure 门户的资源的 API 密钥 |
|