automation-suite
2023.10
false
- 概述
- 要求
- 推荐:部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 1:为离线安装配置符合 OCI 的注册表
- 步骤 2:配置外部对象存储
- 步骤 3:配置 High Availability Add-on
- 步骤 4:配置 Microsoft SQL Server
- 步骤 5:配置负载均衡器
- 步骤 6:配置 DNS
- 步骤 7:配置磁盘
- 步骤 8:配置内核和操作系统级别设置
- 步骤 9:配置节点端口
- 步骤 10:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- 步骤 13:生成 cluster_config.json
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- install-uipath.sh 参数
- 添加具有 GPU 支持的专用代理节点
- 为 Task Mining 添加专用代理节点
- 连接 Task Mining 应用程序
- 为 Automation Suite Robot 添加专用代理节点
- 步骤 15:为离线安装配置临时 Docker 注册表
- 步骤 16:验证安装的先决条件
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 如何在安装过程中对服务进行故障排除
- 如何卸载集群
- 如何清理离线工件以改善磁盘空间
- 如何清除 Redis 数据
- 如何启用 Istio 日志记录
- 如何手动清理日志
- 如何清理存储在 sf-logs 存储桶中的旧日志
- 如何禁用 AI Center 的流日志
- 如何对失败的 Automation Suite 安装进行调试
- 如何在升级后从旧安装程序中删除映像
- 如何禁用 TX 校验和卸载
- 如何从 Automation Suite 2022.10.10 和 2022.4.11 升级到 2023.10.2
- 如何手动将 ArgoCD 日志级别设置为 Info
- 如何扩展 AI Center 存储
- 如何为外部注册表生成已编码的 pull_secret_value
- 如何解决 TLS 1.2 中的弱密码问题
- 单节点升级在结构阶段失败
- 从 2021.10 自动升级后,集群运行状况不佳
- 由于 Ceph 运行状况不佳,升级失败
- 由于空间问题,RKE2 未启动
- 卷无法装载,且仍处于附加/分离循环状态
- 由于 Orchestrator 数据库中的传统对象,升级失败
- 并行升级后,发现 Ceph 集群处于降级状态
- Insights 组件运行状况不佳导致迁移失败
- Apps 服务升级失败
- 就地升级超时
- Docker 注册表迁移卡在 PVC 删除阶段
- 升级到 2023.10 或更高版本后 AI Center 配置失败
- 在离线环境中升级失败
- 升级期间 SQL 验证失败
- 快照-控制器-crds Pod 在升级后处于 CrashLoopBackOff 状态
- Longhorn REST API 端点升级/重新安装错误
- 运行诊断工具
- 使用 Automation Suite 支持捆绑包
- 探索日志
Linux 版 Automation Suite 安装指南
Last updated 2024年12月3日
完成升级
执行 Automation Suite 集群升级后,需要做出一些更改,以确保新节点通过横向扩展操作正确加入集群。要自动执行更改,我们建议使用
upgrade_wrapper.py
脚本。
确保满足以下要求:
- 必须在执行脚本的计算机上安装 Python 3.8 或更高版本。有关详细信息,请参阅 Python 文档。
- 脚本需要 Python 包。您可以使用以下 pip 命令安装这些包。有关详细信息,请参阅 pip 文档。
pip install wget requests boto3
pip install wget requests boto3 boto3
客户端必须能够通过 AWS 进行身份验证,因为部署更改通过该方式发生。您可以提供凭据作为环境变量,也可以使用共享凭据文件通过默认配置文件提供。用户必须有权执行“脚本行为”部分中所述的操作。-
确保自动调整组(服务器、代理等)的 RHEL 版本已更新,并且与要升级到的版本相符。
- 请务必查看
cluster_config.json
文件,并将标记为字符串 ("true"
/"false"
) 的所有布尔值更改为实际的布尔值 (true
/false
)。例如:- 要启用区域恢复,请使用
"zone_resilience": true
。 - 要允许安装程序创建数据库,请使用
"sql.create_db": true
。
- 要启用区域恢复,请使用
- 如果从 Automation Suite 2022.10 升级到 Automation Suite 2023.4 或更高版本,并且新旧版本中都启用了 Orchestrator,则必须在
cluster_config.json
文件中将orchestrator.block_classic_executions
标志设置为true
。使用该标志即表示您同意阻止传统文件夹执行。不使用该标志会导致升级操作失败。新安装中不需要此参数。 - 如果您升级到 Automation Suite 2023.10 或更高版本,并且在新旧环境中都启用了 Insights,则必须将
insights.external_object_storage.bucket_name
标志设置为cluster_config.json
文件中platform
使用的相同存储桶。不使用该标志会导致升级操作失败。新安装中不需要此参数。 - 如果您升级到 Automation Suite 2023.10 或更高版本,请确保在将
sql.create_db
设置为true
时,在cluster_config.json
中填写以下字段:sql.server_url = "<db_endpoint>" sql.port = "1433" sql.username = <SQL Username> sql.password = <SQL password>
sql.server_url = "<db_endpoint>" sql.port = "1433" sql.username = <SQL Username> sql.password = <SQL password>
运行
upgrade_wrapper.py
脚本时,请注意该脚本执行的以下操作:
- 在当前文件夹中下载所需的依赖项;
- 从 Automation Suite 部署堆栈中提取信息;
-
创建一个新堆栈,其中包含:
- 初始部署中存在的每个自动调整组的新启动模板,其中包含新版本安装流程所需的更改;
-
Automation Suite 节点使用的已附加到 IAM 角色的 IAM 策略,允许对当前堆栈执行
DescribeStackResource
操作;注意:仅当部署时未提供自定义 IAM 角色时,才会部署该策略。否则,您应将新部署堆栈的cloudformation:DescribeStackResource
权限授予 Automation Suite 节点使用的 IAM 角色。
- 更新自动调整组以使用在新堆栈中创建的启动模板;
- 更新包含安装程序 URL 的 SSM 参数(可选,具体取决于初始部署模板版本);
-
通过 SSM 运行命令在所有节点上使用用于升级的安装程序覆盖初始部署中使用的旧安装程序。这是为了保留初始部署中已存在的 SSM 文档的功能;
注意:更新启动模板后,AMI 更新 SSM 文档可能不再有效。应使用新创建的启动模板的ec2:CreateLaunchTemplateVersion
权限和ec2:RunInstances
权限更新 SSM 文档所使用的 IAM 角色。 - 清理下载的文件。