- 概述
- 要求
- 推荐:部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 1:为离线安装配置符合 OCI 的注册表
- 步骤 2:配置外部对象存储
- 步骤 3:配置 High Availability Add-on
- 步骤 4:配置 Microsoft SQL Server
- 步骤 5:配置负载均衡器
- 步骤 6:配置 DNS
- 步骤 7:配置磁盘
- 步骤 8:配置内核和操作系统级别设置
- 步骤 9:配置节点端口
- 步骤 10:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- 步骤 13:生成 cluster_config.json
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- install-uipath.sh 参数
- 添加具有 GPU 支持的专用代理节点
- 为 Task Mining 添加专用代理节点
- 连接 Task Mining 应用程序
- 为 Automation Suite Robot 添加专用代理节点
- 步骤 15:为离线安装配置临时 Docker 注册表
- 步骤 16:验证安装的先决条件
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 如何在安装过程中对服务进行故障排除
- 如何卸载集群
- 如何清理离线工件以改善磁盘空间
- 如何清除 Redis 数据
- 如何启用 Istio 日志记录
- 如何手动清理日志
- 如何清理存储在 sf-logs 存储桶中的旧日志
- 如何禁用 AI Center 的流日志
- 如何对失败的 Automation Suite 安装进行调试
- 如何在升级后从旧安装程序中删除映像
- 如何禁用 TX 校验和卸载
- 如何从 Automation Suite 2022.10.10 和 2022.4.11 升级到 2023.10.2
- 如何手动将 ArgoCD 日志级别设置为 Info
- 如何扩展 AI Center 存储
- 如何为外部注册表生成已编码的 pull_secret_value
- 如何解决 TLS 1.2 中的弱密码问题
- 单节点升级在结构阶段失败
- 从 2021.10 自动升级后,集群运行状况不佳
- 由于 Ceph 运行状况不佳,升级失败
- 由于空间问题,RKE2 未启动
- 卷无法装载,且仍处于附加/分离循环状态
- 由于 Orchestrator 数据库中的传统对象,升级失败
- 并行升级后,发现 Ceph 集群处于降级状态
- Insights 组件运行状况不佳导致迁移失败
- Apps 服务升级失败
- 就地升级超时
- Docker 注册表迁移卡在 PVC 删除阶段
- 升级到 2023.10 或更高版本后 AI Center 配置失败
- 在离线环境中升级失败
- 升级期间 SQL 验证失败
- 快照-控制器-crds Pod 在升级后处于 CrashLoopBackOff 状态
- Longhorn REST API 端点升级/重新安装错误
- 运行诊断工具
- 使用 Automation Suite 支持捆绑包
- 探索日志
Linux 版 Automation Suite 安装指南
硬件和软件要求
要了解有关 Automation Suite 部署中使用的核心概念的更多信息,请参阅 词汇表。
默认安装体验包括两种产品选择:
- 完整(所有产品)– 安装 Automation Suite 中可用产品的完整列表。有关详细信息,请参阅 Automation Suite 产品。
-
选择产品 – 允许您仅选择并安装您感兴趣的产品。但请注意,安装程序会考虑跨产品依赖项。这意味着,如果使用某个产品需要安装另一个产品,则必须同时安装这两个产品。有关详细信息,请参阅跨产品依赖项。
您可以在单节点评估或多节点 HA 就绪生产模式下部署 Automation Suite。虽然这两个配置文件的大多数先决条件相同,但多节点 HA 就绪生产模式需要额外资源。
一旦部署开始,您便无法从一个部署配置文件切换/升级到另一个部署配置文件。在选择部署配置文件之前,请参阅支持的单节点和多节点安装用例。
先决条件类型 |
先决条件 |
---|---|
硬件 |
|
一般计算机要求 | |
特定于以下产品的要求:
| |
受支持的 RHEL 版本和在所有 Linux 计算机上安装的 ipcalc 工具。 有关 RHEL 与 Automation Suite 版本的兼容性的详细信息,请参阅RHEL 兼容性矩阵。 备注:
我们在新的 RHEL 次要版本发布后 90 天内支持新版本。 我们通过默认策略支持 SELinux。 | |
FIPS 140-2 | |
负载均衡器 L4/网络负载均衡器 | |
NFS 服务器要求(基于 Linux 的具有 NFSv3/NFSv4 版本的本地或云管理 NFS 服务器)
| |
节点端口 | |
软件 |
每台计算机上的 RPM 包 |
SQL 服务器 | |
对象存储(Azure Blob 存储、AWS S3、与 S3 兼容的对象存储) | |
符合 OCI 的注册表 | |
Dns | |
TLS 1.2+ | |
IPv4
(不支持 IPv6) | |
必须禁用交换内存。 | |
|
- 您需要根用户权限才能安装和部署 Automation Suite。有关需要根用户权限访问特定组件的更多信息,请参阅根用户权限要求。
-
Cilium 需要 CAP_SYS_ADMIN 权限才能正常运行。确保已授予这些权限。
- 在系统上运行扫描代理可能会导致安装或运行时失败,因为它们对 IPTable 进行了更改。 为避免此行为,请配置扫描代理,使其不会干扰 Automation Suite 安装。
- 只要满足 Automation Suite 要求,UiPath™ 就不会规定特定的防火墙或开发者工具配置。根据我们的观察,只有少数外部工具会干扰 Automation Suite 的顺利运行。如果出现此类问题,请联系相关供应商寻求帮助。有关其他指导,请参阅 Automation Suite 职责矩阵。
开始之前,请考虑以下事项:
- Automation Suite 支持联邦信息处理标准 140-2 (FIPS 140-2)。您可以在启用 FIPS 140-2 的主机上执行 Automation Suite 的全新安装。您还可以在之前执行过 Automation Suite 安装的计算机上启用 FIPS 140-2。有关详情,请参阅安全性与合规性。
备注:
已启用 FIPS 的主机当前不支持 Insights。因此,在已启用 FIPS 的主机上安装 Automation Suite 时,请确保禁用 Insights。
- 最低硬件要求不能保护部署免受节点故障的影响。
- 多节点 HA 就绪生产配置文件仅可应对一个节点故障。 这意味着您只能丢失一个服务器节点。 此限制不适用于代理节点。 只要有足够的整体集群容量可用,您就可以失去尽可能多的代理节点,但仍可以继续使用集群而不会停机。
- 您可以按照高级安装体验中的说明操作,提高服务器节点的故障容错能力。
以下部分列出了完整产品选择和单个产品的硬件要求。
以下部分介绍了完整产品选择的硬性要求。
一般要求
适用于所有产品的硬件 |
单节点最低要求 |
多节点最低要求 |
---|---|---|
每个集群的处理器 |
32 (v-)CPU/内核 |
96 (v-)CPU/内核 |
每个节点的最小处理器 |
不适用 |
8 (v-)CPU/内核 |
RAM |
64 GiB |
192 GiB |
每个节点的最小 RAM |
不适用 |
16GB |
集群磁盘* |
256 GiB SSD 最低 IOPS:1100 |
256 GiB SSD 最低 IOPS:1100 |
数据磁盘
|
512 GiB SSD 最低 IOPS:1100 |
512 GiB SSD 最低 IOPS:1100 |
etcd 磁盘
|
16 GiB SSD 最低 IOPS:240 |
16 GiB SSD 最低 IOPS:240 |
UiPath™ 捆绑包磁盘
|
512 GiB SSD 最低 IOPS:1100 |
512 GiB SSD 最低 IOPS:1100 |
对象存储
|
512 GiB SSD 最低 IOPS:1100 |
512 GiB SSD 最低 IOPS:1100 |
*根据您的 AI Center ML 技能和训练存储要求,可能需要增加集群磁盘容量。
如果您在单节点评估模式下安装 Automation Suite,并且没有具有 32 (v-)CPU/内核和 64 GiB RAM 的计算机,则可以使用至少具有 8 (v-)CPU/内核和 16 GiB RAM 的计算机。有关更多详细信息,请参阅容量计算器。
如果选择此选项,请按照多节点安装和配置说明进行操作。
建议尽可能使用外部对象存储。这有助于独立于集群扩展对象存储,并带来额外的稳定性。我们支持以下对象存储选项:
- Azure 存储帐户
- AWS S3 存储桶
- 兼容 S3 的存储桶
有关在 Automation Suite 中安装单个产品或各种产品组合必须满足的硬件要求的详细信息,请使用 Automation Suite 安装规格调整计算器。
其他 Task Mining 要求
Task Mining 需要一个额外的代理节点,该节点必须满足以下要求:
硬件 |
最低要求 |
---|---|
处理器 |
20 (v-)CPU/内核 |
RAM |
60 GiB |
集群二进制文件和状态磁盘 |
256 GiB SSD 最低 IOPS:1100 |
数据磁盘 |
不适用 |
其他 Automation Suite Robot 要求
在多节点 HA 就绪生产环境中,Automation Suite Robot 需要额外的代理节点。在单节点评估环境中,额外的 Automation Suite 机器人节点为可选项。
Automation Suite Robot 节点的硬件要求取决于您计划使用资源的方式。除了其他代理节点要求外,您还需要至少 10 GiB 的空间才能启用包缓存。
以下部分介绍了影响 Automation Suite Robot 节点所需硬件数量的因素。
机器人尺寸
下表描述了所有机器人规格所需的 CPU、内存和存储。
大小 |
CPU |
内存 |
存储 |
---|---|---|---|
小 |
0.5 |
1 GiB |
1 GiB |
标准 |
1 |
2 GiB |
2 GiB |
中 |
2 |
4 GiB |
4 GiB |
大 |
6 |
10 GiB |
10 GiB |
代理节点规格
Automation Suite Robot 代理节点的资源会影响可并发运行的作业数量。原因是作业的 CPU/内存要求需要使用 CPU 内核数和 RAM 容量。
例如,具有 16 个 CPU 和 32 GiB RAM 的节点将能够运行以下任何内容:
- 32 个小型作业
- 16 个标准作业
- 8 个中型作业
- 2 个大型作业
作业规格可以混合使用,因此在任何给定时刻,同一节点都可以运行作业组合,如下所示:
- 10 个小型作业(消耗 5 个 CPU 和 10 GiB 内存)
- 4 个标准作业 (消耗 4 个 CPU 和 8 GiB 内存)
- 3 个中型作业 (消耗 6 个 CPU 和 12 GiB 内存)
Kubernetes 资源消耗
鉴于节点是 Kubernetes 集群的一部分,服务器上的 Kubernetes 代理 (kubelet) 会消耗少量资源。根据我们的测量结果,kubelet 会使用以下资源:
- 0.6 个 CPU
- 0.4 GiB RAM
与先前描述的节点类似的节点实际上具有大约 15.4 个 CPU 和 31.6 GiB RAM。
自动选择计算机规格
默认情况下,所有跨平台流程的“Automation Suite Robots”选项都设置为“自动”。此设置会选择适当的计算机规格,以使用 Serverless Robot 运行流程。
自动选择规格时,系统会按顺序评估下表中列出的条件。只要满足一个标准,就会选择相应的计算机规格,并且不会再评估其余标准。
顺序 |
条件 |
计算机规格 |
---|---|---|
1 |
[远程调试作业] |
中 |
2 |
流程视用户界面自动化而定 或 |
标准 |
3 |
其他 Unattended 流程 |
小 |
其他 AI Center 和 Document Understanding 要求
除了作为完整平台要求一部分的核心服务要求之外,AI Center 还需要其他资源,具体取决于您要运行或训练的模型。有关所需 GPU 硬件版本和兼容的 NVIDIA 驱动程序的更多详细信息,请参阅兼容性矩阵。
AI Center 在运行时需要磁盘存储用于 ML 技能和训练管道,如下所示:
-
ML 技能需要
/var/lib/rancher
分区上的磁盘空间,用于存储经过训练的预测模型。在最坏的情况下,模型大小可能会达到 20 GiB。 -
训练管道使用
/var/lib/rancher
分区中的存储空间来托管模型。在最坏的情况下,模型大小可能高达 20 GiB,此外,可能需要存储数据集。数据集存储的最小大小可以为 51 GiB;建议大小为 105 GiB。该存储必须位于 AI Center 的专用磁盘上。训练管道仅在附加了专用 AI Center 磁盘的节点上进行计划。
下表描述了 AI Center 所需的其他资源。在此表格中,所有服务器节点都需要数据磁盘。代理节点不需要数据磁盘。
使用 |
CPU |
RAM (GiB) |
GPU |
磁盘 (GiB) |
---|---|---|---|---|
用于服务的最小值(ML 技能,一个副本) |
0.6 |
2 |
0 |
|
用于训练的最小值(管道) |
1 |
4 |
0 |
|
DU 模型服务(ML 技能,一个副本) |
1 |
4 |
0 |
|
DU 模型训练 |
2 |
24 |
强烈推荐 |
|
在下表中,所有服务器节点都需要数据磁盘。代理节点不需要数据磁盘。
使用 |
CPU |
RAM (GiB) |
GPU |
磁盘 (GiB) |
---|---|---|---|---|
小型实现:
|
4 |
32 |
0 |
|
平均实现:
|
8 |
52 |
强烈推荐 |
|
rancher
分区上的 20 GiB = rancher
分区上的 80 GiB
2 1 个管道 * 105 GiB = 105 数据磁盘
rancher
分区上的 20 GiB = rancher
分区上的 160 GiB
4(2 个管道 + 1 个 DU 管道)* 105 GiB = 315 数据磁盘
其他 AI Computer Vision 要求
此设置适用于本地部署的 NVIDIA GPU,但也适用于 AWS、Azure 和 GCP 等云提供商。建议的 GPU 类型包括 RTX、Tesla 和 Ampere 系列产品中的 GPU,这些产品具有足够的 GPU 内存和处理能力。
这两类 GPU 之间的主要区别在于,具有虚拟化功能的 GPU 通常具有更多的 GPU RAM,并且由大多数云提供商提供。拥有更多 GPU RAM 会增加可以输入到模型的图像的最大尺寸。总之,虚拟化 GPU 的速度并不比消费类 GPU 快得多。
您需要一台具有以下硬件规格的计算机:
硬件规格 | 要求 |
---|---|
内存 |
|
CPU |
|
GPU |
|
存储 |
|
其他 Document Understanding 建议
为了提高性能,您可以在具有 GPU 支持的其他代理节点上安装 Document Understanding。但请注意,Document Understanding 在没有 GPU 节点的情况下也完全可以正常运行。实际上,Document Understanding 使用 CPU 虚拟机执行所有提取和分类任务,而对于 OCR,我们强烈建议使用 GPU 虚拟机。
有关 Document Understanding 框架中 CPU/GPU 使用情况的更多详细信息,请参阅 CPU 和 GPU 使用情况。
如果要使用具有 GPU 支持的其他节点,则必须满足以下要求:
硬件 |
最低要求 |
---|---|
处理器 |
8 (v-)CPU/内核 |
RAM |
52 GiB |
集群二进制文件和状态磁盘 |
256 GiB SSD 最低 IOPS:1100 |
数据磁盘 |
不适用 |
GPU RAM |
11 GiB |
有关更多详细信息,请参阅 AI Center 注意事项。
在开始安装 Automation Suite 之前,您必须确保满足以下要求:
- 您已订阅 RHEL;
- 您已启用 BaseOS 和 AppStream 存储库;
- 您已安装所需的 RPM 包。
下表列出了所需的 RPM 包:
RPM 包 |
描述 |
---|---|
|
在安装节点上是必需的。 |
|
在节点上执行就绪检查时需要。 |
|
仅离线安装需要。 |
默认情况下,RHEL 8.4 及更高版本在 BaseOS 和 AppStream 存储库中具有所需的 RPM 包。
如果您执行 Automation Suite 的手动全新安装,则必须确保满足 RPM 包要求。 在这种情况下,您有责任安装所需的 RPM 包。
如果从之前的 Automation Suite 版本升级,则表示您已经安装了 RPM 包。
有关可用于安装和验证 RPM 包的工具的详细信息,请参阅验证并安装所需的 RPM 包。
安装需要外部 SQL Server 作为先决条件。支持 Microsoft SQL Server 2016、2017、2019 和 2022 标准版和企业版。
只要 Microsoft SQL Server 数据库引擎满足要求,其他 Microsoft SQL 平台(如 Azure SQL 数据库或 Azure SQL 托管实例)以及 Amazon Relational Database Service 也受支持。
各个产品支持的配置各不相同。
对于计划部署的每个产品,您必须:
- 根据产品的要求检查 SQL Server 的支持版本;
- 根据产品的要求,应用 SQL Server 配置先决条件,包括 SQL Server 用户权限。
有关产品特定的 SQL Server 要求的更多信息,请参阅配置 Microsoft SQL Server。
Microsoft SQL Server 的一般最低硬件要求如下:
- 8 (v-)CPU
- 32 GiB RAM
- 256 GiB SSD
这些最低要求仅作为一般指导原则,并不能保证在生产部署中可靠地运行。您需要进行容量规划,以确定可靠运行所需的硬件要求。
对于计划部署的每个产品,您必须评估预计的使用情况并应用产品指定的容量规划指南。此信息可在每个产品的帮助部分中找到。
要启用备份,您需要一个外部 NFS 服务器。Automation Suite 支持基于 Linux 的内部部署或云管理的 NFS 服务器,版本为 NFSv3/NFSv4。
NFS 服务器的一般最低硬件要求如下:
-
CPU - 4 vCPU
-
RAM - 8 GiB
-
存储 - 1 TiB
注意:如果使用外部对象存储,则存储要求为几个 GiB。如果使用集群内对象存储,则最小存储大小与对象存储的大小相同。
要配置主动/被动部署,请确保满足以下要求:
- 硬件
- 负载均衡器
- Dns
- 证书
- 对象存储
- 流量管理器
两个 Automation Suite 集群都必须满足一组软件和硬件要求。有关详细信息,请参阅多节点模式的硬件要求。
两个 Automation Suite 集群都必须具有负载均衡器。有关详细信息,请参阅配置负载均衡器。
有关 DNS 要求的详细信息,请参阅配置 DNS。