- 概述
- 要求
- 部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 2:为离线安装配置符合 OCI 的注册表
- 步骤 3:配置外部对象存储
- 步骤 4:配置 High Availability Add-on
- 步骤 5:配置 SQL 数据库
- 步骤 6:配置负载均衡器
- 步骤 7:配置 DNS
- 步骤 8:配置磁盘
- 步骤 9:配置内核和操作系统级别设置
- 步骤 10:配置节点端口
- 步骤 11:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- 步骤 13:生成 cluster_config.json
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- Kerberos 身份验证配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- install-uipath.sh 参数
- 添加具有 GPU 支持的专用代理节点
- 为 Task Mining 添加专用代理节点
- 连接 Task Mining 应用程序
- 为 Automation Suite Robot 添加专用代理节点
- 步骤 15:为离线安装配置临时 Docker 注册表
- 步骤 16:验证安装的先决条件
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 如何在安装过程中对服务进行故障排除
- 如何卸载集群
- 如何清理离线工件以改善磁盘空间
- 如何清除 Redis 数据
- 如何启用 Istio 日志记录
- 如何手动清理日志
- 如何清理存储在 sf-logs 存储桶中的旧日志
- 如何禁用 AI Center 的流日志
- 如何对失败的 Automation Suite 安装进行调试
- 如何在升级后从旧安装程序中删除映像
- 如何禁用 TX 校验和卸载
- 如何从 Automation Suite 2022.10.10 和 2022.4.11 升级到 2023.10.2
- 如何手动将 ArgoCD 日志级别设置为 Info
- 如何扩展 AI Center 存储
- 如何为外部注册表生成已编码的 pull_secret_value
- 如何解决 TLS 1.2 中的弱密码问题
- 如何使用证书
- 如何将应用程序日志转发到 Splunk
- 如何从注册表 Pod 中清理未使用的 Docker 映像
- 如何使用集群内对象存储 (Ceph) 收集 DU 使用情况数据
- 如何在离线环境中安装 RKE2 SELinux
- 如何清理 NFS 服务器上的旧差异备份
- 升级 Automation Suite 后重新安装或升级 Insights 时丢失数据
- 单节点升级在结构阶段失败
- 从 2021.10 自动升级后,集群运行状况不佳
- 由于 Ceph 运行状况不佳,升级失败
- 由于空间问题,RKE2 未启动
- 卷无法装载,且仍处于附加/分离循环状态
- 由于 Orchestrator 数据库中的传统对象,升级失败
- 并行升级后,发现 Ceph 集群处于降级状态
- Insights 组件运行状况不佳导致迁移失败
- Apps 服务升级失败
- 就地升级超时
- Docker 注册表迁移卡在 PVC 删除阶段
- 升级到 2023.10 或更高版本后 AI Center 配置失败
- 在离线环境中升级失败
- 升级期间 SQL 验证失败
- 快照-控制器-crds Pod 在升级后处于 CrashLoopBackOff 状态
- Longhorn REST API 端点升级/重新安装错误
- 由于 Insights PVC 大小被覆盖,升级失败
- 预服务脚本执行期间服务升级失败
- 使用 Process Mining 运行高可用性
- 使用 Kerberos 登录时 Process Mining 挖掘失败
- 在 Disaster Recovery 后,DAPR 无法正常用于 Process Mining
- 在集群模式下使用 Redis 配置 Dapr
- 无法使用 pyodbc 格式连接字符串连接到 AutomationSuite_ProcessMining_Warehouse 数据库
- Airflow 安装失败,并显示 sqlalchemy.exc.ArgumentError:无法从字符串“”中解析 rfc1738 URL
- 如何添加 IP 表格规则以使用 SQL Server 端口 1433
- 运行 CData Sync 的服务器不信任 Automation Suite 证书
- 运行诊断工具
- 使用 Automation Suite 支持捆绑包
- 探索日志
- 探索汇总遥测
Linux 版 Automation Suite 安装指南
术语
要了解有关 Automation Suite 部署中使用的核心概念的更多信息,请参阅词汇表。
产品选择
默认安装体验包括两种产品选择:
- 完整(所有产品) - 安装 Automation Suite 中可用产品的完整列表。有关详细信息,请参阅“Automation Suite 产品” 。
- 选择产品- 允许您仅选择并安装您感兴趣的产品。但请注意,安装程序会考虑跨产品依赖项。这意味着,如果使用某个产品需要安装另一个产品,则必须同时安装这两个产品。有关详细信息,请参阅“Automation Suite 产品” 。
选择您的部署配置文件
You can deploy Automation Suite in either single-node evaluation or multi-node HA-ready production mode. While most of the prerequisites for the two profiles are identical, multi-node HA-ready production mode requires additional resources.
一旦部署开始,您便无法从一个部署配置文件切换或升级到另一个部署配置文件。在选择部署配置文件之前,请参阅。
无论您选择哪种部署配置文件,都需要具备有关 Linux 和 Kubernetes 的知识。如果您在安装和配置 Automation Suite 时遇到问题,请联系 UiPath™ 专业服务。
先决条件概览
| 先决条件类型 | 先决条件 |
|---|---|
| 硬件 |
为避免潜在的安装问题,请确保将部署中使用的所有节点设置为相同的时区。 |
| 一般计算机要求 | |
| 特定于以下产品的要求:
| |
| 受支持的 RHEL 版本和所有 Linux 计算机上安装的 ipcalc 工具。有关 RHEL 与 Automation Suite 版本的兼容性的详细信息,请参阅RHEL 兼容性矩阵( 和 ) 。 我们在新的 RHEL 次要版本发布后 90 天内支持新版本。 我们通过默认策略支持 SELinux。 *(全部) | |
| FIPS 140-2 | |
| 负载均衡器 L4/网络负载均衡器 | |
| NFS 服务器要求(基于 Linux 的具有 NFSv3/NFSv4 版本的本地或云管理 NFS 服务器)
| |
| 节点端口 | |
| 软件 | 每台计算机上的 RPM 包 |
| SQL 服务器 | |
| 对象存储(Azure Blob 存储、AWS S3、与 S3 兼容的对象存储) | |
| 符合 OCI 的注册表 | |
| Dns | |
| TLS 1.2+ | |
| IPv4 (不支持 IPv6) | |
| 必须禁用交换内存。 | |
|
*对于离线安装,系统不会自动安装rke2-selinux包。如果遇到与 SELinux 相关的问题,则必须手动安装 SELinux 策略包。有关详细信息,请参阅“如何…”部分。
- 您需要根用户权限才能安装和部署 Automation Suite。有关需要根用户权限访问特定组件的更多信息,请参阅根用户权限要求。
- Cilium 需要 CAP_SYS_ADMIN 权限才能正常运行。确保已授予这些权限。
- 在系统上运行扫描代理可能会导致安装或运行时失败,因为它们对 IPTable 进行了更改。 为避免此行为,请配置扫描代理,使其不会干扰 Automation Suite 安装。
- 只要满足 Automation Suite 要求,UiPath™ 就不会规定特定的防火墙或开发者工具配置。根据我们的观察,只有少数外部工具会干扰 Automation Suite 的顺利运行。如果出现此类问题,请联系相关供应商寻求帮助。有关其他指导,请参阅Automation Suite 职责矩阵(Automation Suite 职责矩阵) 。
硬件要求
开始之前,请考虑以下事项:
-
Automation Suite 支持联邦信息处理标准 140-2 (FIPS 140-2)。您可以在启用 FIPS 140-2 的主机上执行 Automation Suite 的全新安装。您还可以在之前执行过 Automation Suite 安装的计算机上启用 FIPS 140-2。有关详细信息,请参阅安全性与合规性。
备注:已启用 FIPS 的主机当前不支持 Insights。因此,在已启用 FIPS 的主机上安装 Automation Suite 时,请确保禁用 Insights。
-
最低硬件要求不能保护部署免受节点故障的影响。
-
多节点 HA 就绪生产配置文件仅可应对一个节点故障。 这意味着您只能丢失一个服务器节点。 此限制不适用于代理节点。 只要有足够的整体集群容量可用,您就可以失去尽可能多的代理节点,但仍可以继续使用集群而不会停机。
-
您可以按照高级安装体验中的说明操作,提高服务器节点的故障容错能力。
以下部分列出了完整产品选择和单个产品的硬件要求。
完整的产品选择:硬件要求
以下部分描述了完整产品选择的硬性要求。
一般要求
| 适用于所有产品的硬件 | 单节点最低要求 | 多节点最低要求 |
|---|---|---|
| 每个集群的处理器 | 32 (v-)CPU/内核 | 96 (v-)CPU/内核 |
| 每个节点的最小处理器 | 不适用 | 8 (v-)CPU/内核 |
| RAM | 64 GB | 192GB |
| 每个节点的最小 RAM | 不适用 | 16GB |
| 集群磁盘* | 256 GB 固态硬盘 最低 IOPS:1100 | 256 GB 固态硬盘 最低 IOPS:1100 |
| 数据磁盘
| 512 GB 固态硬盘 最低 IOPS:1100 | 512 GB 固态硬盘 最低 IOPS:1100 |
| etcd 磁盘
| 16 GB 固态硬盘 最低 IOPS:240 | 16 GB 固态硬盘 最低 IOPS:240 |
| UiPath™ 捆绑包磁盘
| 512 GB 固态硬盘 最低 IOPS:1100 | 512 GB 固态硬盘 最低 IOPS:1100 |
| 对象存储
| 512 GB 固态硬盘 最低 IOPS:1100 | 512 GB 固态硬盘 最低 IOPS:1100 |
*根据您的 AI Center ML 技能和训练存储要求,可能需要增加集群磁盘容量。
如果您在单节点评估模式下安装 Automation Suite,并且没有具有 32 (v-)CPU/内核和 64 GB RAM 的计算机,则可以带来至少具有 8 (v-)CPU/内核的计算机和 16 GB RAM。有关更多详细信息,请参阅容量计算器。
如果选择此选项,请按照多节点安装和配置说明进行操作。
建议尽可能使用外部对象存储。这有助于独立于集群扩展对象存储,并带来额外的稳定性。我们支持以下对象存储选项:
- Azure 存储帐户
- AWS S3 存储桶
- 兼容 S3 的存储桶
单个产品:硬件要求
有关在 Automation Suite 中安装单个产品或各种产品组合必须满足的硬件要求的详细信息,请使用 Automation Suite 安装规格调整计算器。
其他 Task Mining 要求
Task Mining 需要一个额外的代理节点,该节点必须满足以下要求:
| 硬件 | 最低要求 |
|---|---|
| 处理器 | 20 (v-)CPU/内核 |
| RAM | 60 GB |
| 集群二进制文件和状态磁盘 | 256 GB SSD 最低 IOPS:1100 |
| 数据磁盘 | 不适用 |
其他 Automation Suite Robot 要求
在多节点 HA 就绪生产环境中,Automation Suite Robot 需要额外的代理节点。在单节点评估环境中,额外的 Automation Suite 机器人节点为可选项。
Automation Suite Robot 节点的硬件要求取决于您计划使用资源的方式。除了其他代理节点要求外,您还需要至少10 GB的文件存储空间才能启用包缓存。
以下部分介绍了影响 Automation Suite Robot 节点所需硬件数量的因素。
机器人尺寸
下表描述了所有机器人规格所需的 CPU、内存和存储。
| 大小 | CPU | 内存 | 存储 |
|---|---|---|---|
| 小 | 0.5 | 1 GB | 1 GB |
| 标准 | 1 | 2 GB | 2 GB |
| 中 | 2 | 4GB | 4GB |
| 大 | 6 | 10 GB | 10 GB |
代理节点规格
Automation Suite Robot 代理节点的资源会影响可并发运行的作业数量。原因是作业的 CPU/内存要求需要使用 CPU 内核数和 RAM 容量。
例如,具有 16 个 CPU 和 32 GB RAM 的节点将能够运行以下任何内容:
- 32 个小型作业
- 16 个标准作业
- 8 个中型作业
- 2 个大型作业
作业规格可以混合使用,因此在任何给定时刻,同一节点都可以运行作业组合,如下所示:
- 10 个小型作业(使用 5 个 CPU 和 10 GB 内存)
- 4 个标准作业(使用 4 个 CPU 和 8 GB 内存)
- 3 个中型作业(使用 6 个 CPU 和 12 GB 内存)
Kubernetes 资源消耗
鉴于节点是 Kubernetes 集群的一部分,服务器上的 Kubernetes 代理 (kubelet) 会消耗少量资源。根据我们的测量结果,kubelet 会使用以下资源:
- 0.6 个 CPU
- 0.4 GB 内存
与上述节点类似的节点实际上将具有大约 15.4 个 CPU 和 31.6 GB RAM。
自动选择计算机规格
All your cross-platform processes have the Automation Suite Robots option set to Automatic by default. This setting selects the appropriate machine size for running the process using serverless robots.
自动选择规格时,系统会按顺序评估下表中列出的条件。只要满足一个标准,就会选择相应的计算机规格,并且不会再评估其余标准。
| 顺序 | 条件 | 计算机规格 |
|---|---|---|
| 1 | [远程调试作业] | 中 |
| 2 | 流程取决于用户界面自动化或流程取决于UiPath Document Understanding 活动 | 标准 |
| 3 | 其他 Unattended 流程 | 小 |
其他 AI Center 和 Document Understanding 要求
除了作为完整平台要求一部分的核心服务要求之外,AI Center 还需要其他资源,具体取决于您要运行或训练的模型。有关所需 GPU 硬件版本和兼容的 NVIDIA 驱动程序的更多详细信息,请参阅兼容性矩阵。
AI Center 在运行时需要磁盘存储用于 ML 技能和训练管道,如下所示:
- ML 技能需要
/var/lib/rancher分区上的磁盘空间,用于存储经过训练的模型以进行预测。 在最坏的情况下,模型大小可能会达到 20 GB。 - 训练管道使用
/var/lib/rancher分区中的存储空间来托管模型。 在最坏的情况下,模型大小可能高达 20 GB,此外,可能需要存储数据集。 数据集存储的最小大小可以为 51 GB;其建议大小为 105 GB。 该存储必须位于 AI Center 的专用磁盘上。 训练管道仅在附加了专用 AI Center 磁盘的节点上进行计划。
下表描述了 AI Center 所需的其他资源。在此表格中,所有服务器节点都需要数据磁盘。代理节点不需要数据磁盘。
| 使用 | CPU | RAM (GB) | GPU | 磁盘 (GB) |
|---|---|---|---|---|
| 用于服务的最小值(ML 技能,一个副本) | 0.6 | 2 | 0 |
|
| 用于训练的最小值(管道) | 1 | 4 | 0 |
|
| DU 模型服务(ML 技能,一个副本) | 1 | 4 | 0 |
|
| DU 模型训练 | 2 | 24 | 强烈推荐 |
|
下表描述了小型和平均 AI Center 实现所需的资源。请注意,这些数字是一般指导原则。
在下表中,所有服务器节点都需要数据磁盘。代理节点不需要数据磁盘。
| 使用 | CPU | RAM (GB) | GPU | 磁盘 (GB) |
|---|---|---|---|---|
| 小型实现:
| 4 | 32 | 0 |
|
| 平均实现:
| 8 | 52 | 强烈推荐 |
|
1 (3 个技能 + 1 个管道)* rancher分区上的 20 GB = rancher分区上的 80 GB
2 1 个管道 * 105GB = 105 数据磁盘
3 (5 个技能 + 2 个管道 + 1 个 DU 管道)* rancher分区上的 20 GB = rancher分区上的 160 GB
4(2 个管道 + 1 个 DU 管道)* 105GB = 315 数据磁盘
其他 AI Computer Vision 要求
此设置适用于本地部署的 NVIDIA GPU,但也适用于 AWS、Azure 和 GCP 等云提供商。建议的 GPU 类型包括 RTX、Tesla 和 Ampere 系列产品中的 GPU,这些产品具有足够的 GPU 内存和处理能力。
这两类 GPU 之间的主要区别在于,具有虚拟化功能的 GPU 通常具有更多的 GPU RAM,并且由大多数云提供商提供。拥有更多 GPU RAM 会增加可以输入到模型的图像的最大尺寸。总之,虚拟化 GPU 的速度并不比消费类 GPU 快得多。
您需要一台具有以下硬件规格的计算机:
| 硬件规格 | 要求 |
|---|---|
| 内存 |
|
| CPU |
|
| GPU |
|
| 存储 |
|
其他 Document Understanding 建议
为了提高性能,您可以在具有 GPU 支持的其他代理节点上安装 Document Understanding。但请注意,Document Understanding 在没有 GPU 节点的情况下也完全可以正常运行。实际上,Document Understanding 使用 CPU 虚拟机执行所有提取和分类任务,而对于 OCR,我们强烈建议使用 GPU 虚拟机。
有关 Document Understanding 框架中 CPU/GPU 使用情况的更多详细信息,请参阅 CPU 和 GPU 使用情况。
如果要使用具有 GPU 支持的其他节点,则必须满足以下要求:
| 硬件 | 最低要求 |
|---|---|
| 处理器 | 8 (v-)CPU/内核 |
| RAM | 52GB |
| 集群二进制文件和状态磁盘 | 256 GB SSD 最低 IOPS:1100 |
| 数据磁盘 | 不适用 |
| GPU RAM | 11GB |
有关更多详细信息,请查看AI Center 注意事项部分。
RPM package requirements
在开始安装 Automation Suite 之前,您必须确保满足以下要求:
- 您已订阅 RHEL
- 您启用了 BaseOS 和 AppStream 存储库
- 您已安装所需的RPM 包
下表列出了所需的 RPM 包:
| RPM 包 | 描述 |
|---|---|
iscsi-initiator-utils nfs-utils rpcbind util-linux nmap-ncat openssl httpd-tools gettext zstd | 在安装节点上是必需的。 |
podman>=4.0.2 nmap-ncat bind-utils openssl wget unzip conmon=>2.0.24 | 在节点上执行就绪检查时需要。 |
iscsi-initiator-utils gettext nfs-utils rpcbind util-linux nmap-ncat openssl httpd-tools podman=>4.0.2 zstd | 仅离线安装需要。 |
默认情况下,RHEL 8.4 及更高版本在 BaseOS 和 AppStream 存储库中具有所需的 RPM 包。
手动安装
如果您执行 Automation Suite 的手动全新安装,则必须确保满足 RPM 包要求。 在这种情况下,您有责任安装所需的 RPM 包。
如果从之前的 Automation Suite 版本升级,则表示您已经安装了 RPM 包。
有关可用于安装和验证 RPM 包的工具的详细信息,请参阅验证和安装所需 RPM 包。
Cloud templates
如果您使用我们的 Azure、AWS 或 GCP 模板安装 Automation Suite,则无需执行任何操作。模板会配置完整的基础架构,包括 RPM 包。
Microsoft SQL Server 一般要求
除非专用要求部分中另有说明,否则这些要求适用于所有 Automation Suite 产品。
安装需要外部 SQL Server 作为先决条件。支持 Microsoft SQL Server 2016、2017、2019 和 2022 标准版和企业版。
只要 Microsoft SQL Server 数据库引擎满足要求,其他 Microsoft SQL 平台(如 Azure SQL 数据库或 Azure SQL 托管实例)以及 Amazon Relational Database Service 也受支持。
确保可以从每个集群虚拟机访问 SQL Server。
各个产品支持的配置各不相同。 对于计划部署的每个产品,您必须:
- 根据产品的要求检查 SQL Server 的支持版本
- 根据产品的要求,应用 SQL Server 配置先决条件,包括 SQL Server 用户权限
有关产品特定的 SQL Server 要求的更多信息,请参阅配置 Microsoft SQL Server 。
Microsoft SQL Server 的一般最低硬件要求如下:
- 8 (v-)CPU
- 32 GB RAM
- 256 GB 固态硬盘
这些最低要求仅作为一般指导原则,并不能保证在生产部署中可靠地运行。您需要进行容量规划,以确定可靠运行所需的硬件要求。
对于计划部署的每个产品,您必须评估预计的使用情况并应用产品指定的容量规划指南。此信息可在每个产品的帮助部分中找到。
NFS 服务器一般要求
要启用备份,您需要一个外部 NFS 服务器。Automation Suite 支持基于 Linux 的内部部署或云管理的 NFS 服务器,版本为 NFSv3/NFSv4。
确保可以从每个集群虚拟机访问 NFS 服务器。
NFS 服务器的一般最低硬件要求如下:
- CPU - 4 vCPU
- RAM - 8 GB
- 存储 - 1 TB
备注:
如果使用外部对象存储,则存储要求为几 GB。如果使用集群内对象存储,则最小存储大小与对象存储的大小相同。
Disaster Recovery - 主动/被动要求
要配置主动/被动部署,请确保满足以下要求:
- 硬件
- 负载均衡器
- Dns
- 证书
- 对象存储
- 流量管理器
硬件
两个 Automation Suite 集群都必须满足一组软件和硬件要求。有关详细信息,请参阅多节点模式的硬件要求。
Load balancer
两个 Automation Suite 集群都必须具有负载均衡器。有关详细信息,请参阅配置负载均衡器。
Dns
有关 DNS 要求的详细信息,请参阅配置 DNS 。
证书
有关证书要求的详细信息,请参阅证书要求。
如果您打开了 DNS,则还必须将 SAN 添加到证书中。
对象存储
在多站点中部署 Automation Suite 时,不支持集群内对象存储。相反,您必须使用外部对象存储。
RHEL 兼容性矩阵
下表列出了每个 Automation Suite 版本支持的 RHEL 版本:
| Automation Suite 版本 | 支持的 RHEL 版本 |
|---|---|
| 2023.10.12 | 8.6、8.8、8.9、8.10、9.2、9.4、9.5、9.6、9.7 |
| 2023.10.11 | 8.6、8.8、8.9、8.10、9.2、9.4、9.5、9.6、9.7 |
| 2023.10.10 | 8.6、8.8、8.9、8.10、9.2、9.4、9.5、9.6、9.7 |
| 2023.10.9 | 8.6、8.8、8.9、8.10、9.2、9.4、9.5、9.6 |
| 2023.10.8 | 8.6、8.8、8.9、8.10、9.2、9.4、9.5、9.6 |
| 2023.10.7 | 8.6、8.8、8.9、8.10、9.2、9.4、9.6 |
| 2023.10.6 | 8.6、8.8、8.9、8.10、9.2、9.4、9.6 |
| 2023.10.5 | 8.6、8.8、8.9、8.10、9.2 |
| 2023.10.4 | 8.6、8.8、8.9 |
| 2023.10.3 | 8.6、8.8、8.9 |
| 2023.10.2 | 8.6、8.8、8.9 |
| 2023.10.1 | 8.6、8.8 |
| 2023.10.0 | 8.6、8.8 |
RHEL 内核版本kernel-4.18.0-372.91.1.el8_6和kernel-4.18.0-477.10.1.el8_8受 Automation Suite 集群安装或管理中断问题的影响。请确保在安装前或安装后,没有 Automation Suite 节点使用这些内核版本。