- 概述
- 要求
- 部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 2:为离线安装配置符合 OCI 的注册表
- 步骤 3:配置外部对象存储
- 步骤 4:配置 High Availability Add-on
- 步骤 5:配置 SQL 数据库
- 步骤 6:配置负载均衡器
- 步骤 7:配置 DNS
- 步骤 8:配置磁盘
- 步骤 9:配置内核和操作系统级别设置
- 步骤 10:配置节点端口
- 步骤 11:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- Cluster_config.json 示例
- 常规配置
- 配置文件配置
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- ArgoCD 配置
- Kerberos 身份验证配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- AI Center 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- 添加具有 GPU 支持的专用代理节点
- 为 Task Mining 添加专用代理节点
- 连接 Task Mining 应用程序
- 为 Automation Suite Robot 添加专用代理节点
- 步骤 15:为离线安装配置临时 Docker 注册表
- 步骤 16:验证安装的先决条件
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 如何在安装过程中对服务进行故障排除
- 如何卸载集群
- 如何清理离线工件以改善磁盘空间
- 如何清除 Redis 数据
- 如何启用 Istio 日志记录
- 如何手动清理日志
- 如何清理存储在 sf-logs 存储桶中的旧日志
- 如何禁用 AI Center 的流日志
- 如何对失败的 Automation Suite 安装进行调试
- 如何在升级后从旧安装程序中删除映像
- 如何禁用 TX 校验和卸载
- 如何手动将 ArgoCD 日志级别设置为 Info
- 如何扩展 AI Center 存储
- 如何为外部注册表生成已编码的 pull_secret_value
- 如何解决 TLS 1.2 中的弱密码问题
- 如何查看 TLS 版本
- 如何使用证书
- 如何计划 Ceph 备份和还原数据
- 如何从注册表 Pod 中清理未使用的 Docker 映像
- 如何使用集群内对象存储 (Ceph) 收集 DU 使用情况数据
- 如何在离线环境中安装 RKE2 SELinux
- How to clean up old differential backups on an NFS server
- 升级 Automation Suite 后重新安装或升级 Insights 时丢失数据
- 升级到 Automation Suite 2024.10.0 后无法访问 Automation Hub
- 单节点升级在结构阶段失败
- 由于 Ceph 运行状况不佳,升级失败
- 由于空间问题,RKE2 未启动
- 卷无法装载,且仍处于附加/分离循环状态
- 由于 Orchestrator 数据库中的传统对象,升级失败
- 并行升级后,发现 Ceph 集群处于降级状态
- Insights 组件运行状况不佳导致迁移失败
- Apps 服务升级失败
- 就地升级超时
- Docker 注册表迁移卡在 PVC 删除阶段
- 升级到 2023.10 或更高版本后 AI Center 配置失败
- 在离线环境中升级失败
- 升级期间 SQL 验证失败
- 快照-控制器-crds Pod 在升级后处于 CrashLoopBackOff 状态
- 由于 Insights PVC 大小被覆盖,升级失败
- 无法升级到 Automation Suite 2024.10.1
- 由于 Velero 迁移问题,升级失败
- 升级卡在 r-ceph 应用程序删除上
- 无法在 Automation Suite 2024.10.0 中还原部分备份
- 无法获取沙盒映像
- Pod 未显示在 ArgoCD 用户界面中
- Redis 探测器失败
- RKE2 服务器无法启动
- 在 UiPath 命名空间中找不到密码
- ArgoCD 在首次安装后进入“进行中”状态
- MongoDB Pod 处于 CrashLoopBackOff 状态或在删除后处于“等待 PVC 配置”状态
- Pod 在 Init:0/X 中卡住
- 监控仪表板中缺少 Ceph-rook 指标
- 诊断性运行状况检查期间报告的错误不匹配
- 无正常的上游问题
- 日志流式传输在代理设置中不起作用
- 无法在离线环境中添加代理节点
- 在上传大型 Document Understanding 捆绑包期间,节点无响应 (OOM)
- 使用 Process Mining 运行高可用性
- 使用 Kerberos 登录时 Process Mining 挖掘失败
- 在 Disaster Recovery 后,DAPR 无法正常用于 Process Mining
- 无法使用 pyodbc 格式连接字符串连接到 AutomationSuite_ProcessMining_Warehouse 数据库
- Airflow 安装失败,并显示 sqlalchemy.exc.ArgumentError:无法从字符串“”中解析 rfc1738 URL
- 如何添加 IP 表格规则以使用 SQL Server 端口 1433
- 运行 CData Sync 的服务器不信任 Automation Suite 证书
- 运行诊断工具
- 使用 Automation Suite 支持捆绑包
- 探索日志
- 探索汇总遥测

Linux 版 Automation Suite 安装指南
Automation Suite 并行升级使您可以使用并行环境安全地执行升级操作,而无需进行就地升级。
此方法允许管理员在验证新部署后,将流量从旧的 Automation Suite 集群(例如,蓝色部署)切换到新的 Automation Suite 集群(例如,绿色部署)。如果检测到问题,可以快速回滚到旧版部署。
执行并行升级时,两个并行集群共享一个许可证。
- 如果启用了 AI Center,请确保您满足 CUDA 要求。
- 硬件要求,取决于您选择的型号:
- 并行升级(大小相同的目标集群)- 源环境和目标环境必须满足相同的硬件和软件要求。
- 并行升级(单节点启动)- 您可以设置单节点目标集群,然后扩大规模。确保您满足Automation Suite 安装大小调整计算器根据您的产品选择和使用情况详细信息建议的硬件要求。
- 软件要求: 源环境和目标环境必须满足相同的硬件和软件要求。
|
数据 |
升级机制 | |
|---|---|---|
| 状态 | 职责 | |
|
SQL |
保留 |
客户 |
| FQDN |
保留;可选 您必须为新集群选择新的 FQDN。或者,您可以根据需要还原为以前的 FQDN。 | 客户 |
| 按需捆绑包 |
未迁移 运行脚本以查看集群中存在哪些捆绑包。需要手动设定种子。 | 客户 |
| 证书 |
未迁移 您必须将证书作为新集群安装的一部分。 | 客户 |
| 集群配置 |
未迁移 您必须从原始源集群生成
cluster_config.json,以便将相同的服务映射到新的集群安装。
| 客户 |
| 用户创建的自定义警示和仪表板 |
未迁移 升级后,您必须重新配置自定义警示和仪表板。 | 客户 |
| 用户创建的应用程序日志/Prometheus 流配置 |
未迁移 您必须重新配置应用程序日志和 Prometheus 流。 | 客户 |
| 动态工作负载 |
取决于应用程序 AI Center 训练作业会丢失;技能会保留。 |
技能(升级后需要执行的脚本):UiPath™ 训练作业:客户机 |
|
对象存储 |
保留 |
集群内对象存储 (Ceph):UiPath™ 外部对象存储:客户机 |
|
Insights |
保留 |
UiPath™ |
|
MongoDB 数据 |
保留 MongoDB 数据将移至目标 SQL。 |
UiPath™ |
|
RabbitMQ |
不需要 |
UiPath™ |
| 监控(数据) |
不需要 监控数据不适用于新集群。 | 不适用 |
| Docker 注册表 |
不需要 您必须安装集群内 Docker 注册表或引入外部 Docker 注册表。 | 不适用 |
|
# |
升级流程步骤 |
|---|---|
|
1 |
准备新集群:
|
|
2 |
将数据迁移到新集群:
|
|
3 |
完成升级:
|
| 4 | 扩展目标集群 - 仅在您选择“并行升级”(单节点启动)时适用:
|
我们提供两种并行升级模式:
- 并行升级(大小相同的目标集群):
- 要求目标集群具有与源集群相同的硬件资源。
- 准备好一次流量:
-
数据迁移完成。
-
健全性检查成功。
-
- 并行升级(单节点启动):
- 从单节点设置开始,然后扩展到 HA 设置。这降低了并行升级所需的初始硬件要求。
- 单节点设置的硬件必须符合容量计算器针对单节点设置的建议。
- 对于缩放:
- 源集群中的节点可以停用并将其添加到目标集群。
- 准备好一次流量:
- 数据迁移完成。
- 集群已扩展为多节点。
- 健全性检查成功。
| 并行升级(大小相同的目标集群) | 并行升级(单节点启动) | |
|---|---|---|
| 硬件要求 | 源集群和目标集群需要相同的硬件。 | 从最小的硬件开始,根据需要扩大规模。 |
| 停机时间 | 由于目标环境完全冗余,因此停机时间最短。 | 由于节点扩展操作,停机时间更长。 |
| 对源集群的影响 | 无影响。 | 可以停用源节点并将其加入目标集群。 |
| 回滚流程 | 简单回滚,源保持不变。 | 如果目标集群中的扩展操作失败,回滚涉及将节点重新集成到源集群中。 |
| 成本影响 | 重复的基础架构导致成本增加。 | 通过降低初始硬件要求来降低成本。 |