Automation Suite
2023.10
False
- 手动:准备安装
- 步骤 1:为离线安装配置符合 OCI 的注册表
- 步骤 2:配置外部对象存储
- 步骤 3:配置 Microsoft SQL Server
- 步骤 4:配置负载均衡器
- 步骤 5:配置 DNS
- 步骤 6:配置磁盘
- 步骤 7:配置节点端口
- 步骤 8:应用其他设置
- 步骤 10:验证并安装所需的 RPM 包
- 步骤 11:生成 cluster_config.json
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- install-uipath.sh 参数
- 为集群启用 Redis High Availability Add-on
- 添加具有 GPU 支持的专用代理节点
- 连接 Task Mining 应用程序
- 为 Task Mining 添加专用代理节点
- 为 Automation Suite Robot 添加专用代理节点
- 步骤 13:为离线安装配置临时 Docker 注册表
- 步骤 14:验证安装的先决条件
Linux 版 Automation Suite 安装指南
上次更新日期 2023年12月4日
从 2021.10 自动升级后,集群运行状况不佳
在从 Automation Suite 2021.10 自动升级期间,CNI 提供程序将从 Canal 迁移到 Cilium。此操作要求重新启动所有节点。在极少数情况下,一个或多个节点可能无法成功重新启动,从而导致在这些节点上运行的 Pod 保持槽糕的运行状态。
恢复步骤
-
识别失败的重新启动。
在 Ansible 执行期间,您可能会看到类似于以下代码片段的输出:
TASK [Reboot the servers] *************************************************************************************************************************** fatal: [10.0.1.6]: FAILED! => msg: 'Failed to connect to the host via ssh: ssh: connect to host 10.0.1.6 port 22: Connection timed out'
TASK [Reboot the servers] *************************************************************************************************************************** fatal: [10.0.1.6]: FAILED! => msg: 'Failed to connect to the host via ssh: ssh: connect to host 10.0.1.6 port 22: Connection timed out'或者,浏览位于
/var/tmp/uipathctl_<version>/_install-uipath.log
的 Ansible 主机上的日志。如果发现任何重新启动失败,请在所有节点上执行步骤 2 到 4。 -
确认每个节点都需要重新启动。
连接到每个节点并运行以下命令:
ssh <username>@<ip-address> iptables-save 2>/dev/null | grep -i cali -c
ssh <username>@<ip-address> iptables-save 2>/dev/null | grep -i cali -c如果结果不为零,则需要重新启动。
-
重新启动节点:
sudo reboot
sudo reboot - 等待节点响应(您应该能够通过 SSH 访问该节点),然后在每个其他节点上重复步骤 2 到 4。