- 概述
- 要求
- 推荐:部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 1:为离线安装配置符合 OCI 的注册表
- 步骤 2:配置外部对象存储
- 步骤 3:配置 High Availability Add-on
- 步骤 4:配置 Microsoft SQL Server
- 步骤 5:配置负载均衡器
- 步骤 6:配置 DNS
- 步骤 7:配置内核和操作系统级别设置
- Step 8: Configuring the disks
- 步骤 9:配置节点端口
- 步骤 10:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- 步骤 13:生成 cluster_config.json
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- install-uipath.sh 参数
- 添加具有 GPU 支持的专用代理节点
- 为 Task Mining 添加专用代理节点
- 连接 Task Mining 应用程序
- 为 Automation Suite Robot 添加专用代理节点
- Step 15: Configuring the temporary Docker registry for offline installations
- Step 16: Validating the prerequisites for the installation
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
多节点架构和设计注意事项
以下架构图描述了在 Linux 上部署 Automation Suite,其中 Kubernetes 安装在六台计算机上,并设有一个负载均衡器和数据存储。有多种计算机类型:三种服务器节点、两种代理节点和一种专用代理节点。
etcd
组件所致,该组件是 Kubernetes 控制平面的一部分。有关更多详细信息,请参阅 etcd 文档。出于同样的原因,大多数服务器节点必须在任何时候都可用,以保持集群的正常运行。
这些节点还在节点上托管需要数据存储的组件,例如 Prometheus、集群内对象存储 Ceph、UiPath Insights 和集群内 Docker 注册表。
Agent nodes are sometimes called worker nodes. The purpose of these nodes is to host UiPath® services and other shared suite capabilities. Since there is no data disk attached to these nodes, they cannot host the components that require disk storage.
代理节点不对在任何时间点可用的节点数量施加任何限制。只要生成的集群有足够的容量来托管丢失节点中的所有 Pod,集群就会按预期工作,而不会出现任何中断。
These nodes are the special agent nodes dedicated to special tasks, such as the Task Mining node for analysis, Automation Suite Robots node for robots execution, and the GPU node for the Document Understanding model. You cannot host other UiPath® services on these nodes.
是否要使用更多的小型计算机或更少的大型计算机,完全取决于您,这两个选项都有各自的优点和缺点。与较少数量的大型计算机相比,较多的小型计算机可提供更好的节点容错能力。同时,它也带来了额外的管理开销。
例如,如果您的 Automation Suite 集群需要 96 个 vCPU,则可以选择以下任一选项:
-
选项 1:6 台计算机,每台具有 16 个 vCPU。
-
影响:失去一台计算机只会使集群的容量减少 16 个 vCPU,因此,仅当生成的集群没有容量来托管所有 Pod 时,才会影响服务。但是,管理 6 台计算机意味着需要付出更大的努力。
-
-
选项 2:3 台计算机,每台具有 32vCPU
-
影响:丢失计算机会使集群容量减少 32vCPU,这对 Automation Suite 产生重大影响。但是,管理 3 台计算机意味着更少的工作量。
-
总之,部署设计取决于目标。如果目标是更好的容错能力,则可以选择更小的计算机。但是,如果目标是减少管理开销,则应选择数量较少的大型计算机。
是否选择所有服务器节点而不是代理节点取决于您的 RTO 或 RPO。
例如,假设您的 Automation Suite 需要 80 个 vCPU。您可以通过以下方式实现此目的:
-
选项 1:5 台服务器计算机,每台具有 16 个 vCPU。在这里,您最多可以丢失 2 个服务器节点。
-
如果目标是防止数据丢失,则推荐使用。即使丢失 2 个服务器节点,数据也将保持不变,并且可以从剩余的副本中重建。
-
-
选项 2:3 个服务器节点和 2 个代理节点,每个节点具有 16 个 vCPU。在这里,您可以失去 1 个服务器节点和两个代理节点,因此总共 3 个计算机。
-
如果目标是恢复节点可用性,则推荐使用。即使没有 3 台计算机,集群仍将可用,但功能仍将有限,一旦节点恢复,整个集群将恢复。但是,由于存储连接到服务器节点,此设置更容易丢失数据。如果 2 个服务器节点完全丢失,则在不从备份中恢复数据的情况下可能很难再次重建数据。
-