- 概述
- 要求
- 推荐:部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 1:为离线安装配置符合 OCI 的注册表
- 步骤 2:配置外部对象存储
- 步骤 3:配置 High Availability Add-on
- 步骤 4:配置 Microsoft SQL Server
- 步骤 5:配置负载均衡器
- 步骤 6:配置 DNS
- 步骤 7:配置磁盘
- 步骤 8:配置内核和操作系统级别设置
- 步骤 9:配置节点端口
- 步骤 10:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- 步骤 13:生成 cluster_config.json
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- install-uipath.sh 参数
- 添加具有 GPU 支持的专用代理节点
- 为 Task Mining 添加专用代理节点
- 连接 Task Mining 应用程序
- 为 Automation Suite Robot 添加专用代理节点
- 步骤 15:为离线安装配置临时 Docker 注册表
- 步骤 16:验证安装的先决条件
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 如何在安装过程中对服务进行故障排除
- 如何卸载集群
- 如何清理离线工件以改善磁盘空间
- 如何清除 Redis 数据
- 如何启用 Istio 日志记录
- 如何手动清理日志
- 如何清理存储在 sf-logs 捆绑包中的旧日志
- 如何禁用 AI Center 的流日志
- 如何对失败的 Automation Suite 安装进行调试
- 如何在升级后从旧安装程序中删除映像
- 如何禁用 TX 校验和卸载
- 如何从 Automation Suite 2022.10.10 和 2022.4.11 升级到 2023.10.2
- 如何手动将 ArgoCD 日志级别设置为 Info
- 如何扩展 AI Center 存储
- 如何为外部注册表生成已编码的 pull_secret_value
- 如何解决 TLS 1.2 中的弱密码问题
- 运行诊断工具
- 使用 Automation Suite 支持包工具
- 探索日志
多节点架构和设计注意事项
以下架构图描述了在 Linux 上部署 Automation Suite,其中 Kubernetes 安装在六台计算机上,并设有一个负载均衡器和数据存储。有多种计算机类型:三种服务器节点、两种代理节点和一种专用代理节点。
etcd
组件所致,该组件是 Kubernetes 控制平面的一部分。有关更多详细信息,请参阅 etcd 文档。出于同样的原因,大多数服务器节点必须在任何时候都可用,以保持集群的正常运行。
这些节点还在节点上托管需要数据存储的组件,例如 Prometheus、集群内对象存储 Ceph、UiPath Insights 和集群内 Docker 注册表。
代理节点有时称为工作器节点。这些节点旨在托管 UiPath™ 服务和其他共享套件功能。由于没有数据磁盘连接到这些节点,因此它们无法托管需要磁盘存储的组件。
代理节点不对在任何时间点可用的节点数量施加任何限制。只要生成的集群有足够的容量来托管丢失节点中的所有 Pod,集群就会按预期工作,而不会出现任何中断。
这些节点是专用于特殊任务的特殊代理节点,例如用于分析的 Task Mining 节点、用于执行机器人的 Automation Suite 机器人节点以及用于 Document Understanding 模型的 GPU 节点。您不能在这些节点上托管其他 UiPath™ 服务。
是否要使用更多的小型计算机或更少的大型计算机,完全取决于您,这两个选项都有各自的优点和缺点。与较少数量的大型计算机相比,较多的小型计算机可提供更好的节点容错能力。同时,它也带来了额外的管理开销。
例如,如果您的 Automation Suite 集群需要 96 个 vCPU,则可以选择以下任一选项:
-
选项 1:6 台计算机,每台具有 16 个 vCPU。
-
影响:失去一台计算机只会使集群的容量减少 16 个 vCPU,因此,仅当生成的集群没有容量来托管所有 Pod 时,才会影响服务。但是,管理 6 台计算机意味着需要付出更大的努力。
-
-
选项 2:3 台计算机,每台具有 32vCPU
-
影响:丢失计算机会使集群容量减少 32vCPU,这对 Automation Suite 产生重大影响。但是,管理 3 台计算机意味着更少的工作量。
-
总之,部署设计取决于目标。如果目标是更好的容错能力,则可以选择更小的计算机。但是,如果目标是减少管理开销,则应选择数量较少的大型计算机。
是否选择所有服务器节点而不是代理节点取决于您的 RTO 或 RPO。
例如,假设您的 Automation Suite 需要 80 个 vCPU。您可以通过以下方式实现此目的:
-
选项 1:5 台服务器计算机,每台具有 16 个 vCPU。在这里,您最多可以丢失 2 个服务器节点。
-
如果目标是防止数据丢失,则推荐使用。即使丢失 2 个服务器节点,数据也将保持不变,并且可以从剩余的副本中重建。
-
-
选项 2:3 个服务器节点和 2 个代理节点,每个节点具有 16 个 vCPU。在这里,您可以失去 1 个服务器节点和两个代理节点,因此总共 3 个计算机。
-
如果目标是恢复节点可用性,则推荐使用。即使没有 3 台计算机,集群仍将可用,但功能仍将有限,一旦节点恢复,整个集群将恢复。但是,由于存储连接到服务器节点,此设置更容易丢失数据。如果 2 个服务器节点完全丢失,则在不从备份中恢复数据的情况下可能很难再次重建数据。
-