automation-suite
2023.10
true
- 概述
- 要求
- 推荐:部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 1:为离线安装配置符合 OCI 的注册表
- 步骤 2:配置外部对象存储
- 步骤 3:配置 High Availability Add-on
- 步骤 4:配置 Microsoft SQL Server
- 步骤 5:配置负载均衡器
- 步骤 6:配置 DNS
- 步骤 7:配置磁盘
- 步骤 8:配置内核和操作系统级别设置
- 步骤 9:配置节点端口
- 步骤 10:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- 步骤 13:生成 cluster_config.json
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- install-uipath.sh 参数
- 添加具有 GPU 支持的专用代理节点
- 为 Task Mining 添加专用代理节点
- 连接 Task Mining 应用程序
- 为 Automation Suite Robot 添加专用代理节点
- 步骤 15:为离线安装配置临时 Docker 注册表
- 步骤 16:验证安装的先决条件
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 如何在安装过程中对服务进行故障排除
- 如何卸载集群
- 如何清理离线工件以改善磁盘空间
- 如何清除 Redis 数据
- 如何启用 Istio 日志记录
- 如何手动清理日志
- 如何清理存储在 sf-logs 捆绑包中的旧日志
- 如何禁用 AI Center 的流日志
- 如何对失败的 Automation Suite 安装进行调试
- 如何在升级后从旧安装程序中删除映像
- 如何禁用 TX 校验和卸载
- 如何从 Automation Suite 2022.10.10 和 2022.4.11 升级到 2023.10.2
- 如何手动将 ArgoCD 日志级别设置为 Info
- 如何扩展 AI Center 存储
- 如何为外部注册表生成已编码的 pull_secret_value
- 如何解决 TLS 1.2 中的弱密码问题
- 运行诊断工具
- 使用 Automation Suite 支持包工具
- 探索日志
Linux 版 Automation Suite 安装指南
Last updated 2024年10月4日
从集群中删除节点
安装 Automation Suite 后,您可以从集群中删除任何节点,以进行计算机维护或释放未使用的资源。您可以从集群中删除服务器、代理、Task Mining 和 GPU 节点。
重要提示:
只有在多节点 HA 就绪生产设置中才能从集群中删除节点。
从集群中删除节点不会导致任何停机。但是,如果未配置 HAA,它仍会影响内部缓存组件。
删除 Task Mining 或 GPU 节点时,不会等待已计划的作业,例如训练管道或分析。如果在删除节点的流程中删除了这些作业,则需要重新开始。确保计划删除的节点上没有运行任何流程。
执行以下步骤只会从集群中删除节点。计算机不会完全擦除,一些残留物可能会使其无法用于进一步的安装。
确保按照配置磁盘中的说明格式化计算机,并做好安装或将其添加到现有集群的准备。
要成功从集群中删除节点,您必须满足以下要求:
- 生成的集群的容量必须与运行计划的工作负载(删除节点前)所需的总容量相匹配。例如,如果总工作负载需要 32 个 vCPU 和 64 GiB 内存,则删除节点后,集群中的其余节点应至少具有相同数量的资源。否则,您将无法删除节点。
- 生成的集群必须至少具有 3 个服务器节点;并且需要奇数个服务器节点。
- 如果设置为多区域,则生成的集群必须在 3 个区域中的每个区域中都有服务器节点。
- 集群必须处于正常运行状态,即所有节点或 Pod 都处于正常运行状态。当 Pod 处于以下任何状态时,它们的运行状况不佳:
Pending
、Error
、Init
、Crashloopbackoff
、Terminating
。 - 除非有其他相应的 Task Mining 和 GPU 节点可用,否则您无法删除 Task Mining 和 GPU 节点。
要从集群中删除节点,请执行以下步骤:
重要提示:
该脚本会警告您关闭或终止节点;在您关闭节点之前,它不会从集群中删除该节点。 该脚本将等待 5 分钟,以便在超时之前关闭节点。 该脚本提供有关要关闭的节点和关闭顺序的说明。 如果您未在请求的时间内关闭节点,也可以重新运行脚本。
要自动化整个节点删除流程,请执行以下步骤:
- 在步骤 3 中的脚本末尾添加
--skip-node-deletion
标志。 - 脚本运行成功后,关闭第一个目标节点,然后重新运行脚本,这次不运行
--skip-node-deletion
。 如果您没有按照提供给脚本的顺序关闭节点,则会失败。 关闭预期的节点后,您始终可以重新运行脚本。 - 重复上一步,直到成功删除所有节点。
要获取要删除的节点的名称,请参阅如何获取节点名称。
注意:删除服务器节点最多可能需要几个小时,具体取决于集群中存储的数据总量。删除代理节点(包括 Task Mining 和 GPU 节点)最多可能需要 20 分钟。