automation-suite
2022.4
false
- 概述
- 要求
- 安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 无法获取沙盒映像
- Pod 未显示在 ArgoCD 用户界面中
- Redis 探测器失败
- RKE2 服务器无法启动
- 在 UiPath 命名空间中找不到密码
- 初始安装后,ArgoCD 应用程序进入“进行中”状态
- MongoDB Pod 处于 CrashLoopBackOff 状态或在删除后处于“等待 PVC 配置”状态
- 意外错误:不一致;手动运行 fsck
- 集群还原后 MongoDB 或业务应用程序降级
- 缺少 Self-heal-operator 和 Sf-k8-utils 存储库
- 集群还原或回滚后服务不正常
- RabbitMQ Pod 卡在 CrashLoopBackOff 中
- Prometheus 处于 CrashLoopBackoff 状态,并出现内存不足 (OOM) 错误
- 监控仪表板中缺少 Ceph-rook 指标
- Pod 无法在代理环境中与 FQDN 通信
- 使用 Automation Suite 诊断工具
- 使用 Automation Suite 支持包工具
- 探索日志
重要 :
请注意此内容已使用机器翻译进行了部分本地化。
Automation Suite 安装指南
Last updated 2024年11月4日
优化对象存储存储
重要提示: 仅多节点 HA 就绪生产部署需要存储优化。 单节点评估部署不需要它。
在 2022.4 之前的版本中, Ceph 使用的是复制类型的数据池,该池需要 900 GiB 的集群空间来存储 50 GiB 的对象。 选择纠删码池而不是复制类型,可以将存储相同的 50 GiB 对象所需的存储空间从 900 GiB 减少到 450 GiB。
仅当 Automation Suite 集群中运行的 Ceph 版本为 15.x 时,才能优化对象存储存储。
Automation Suite 集群托管 Ceph 15.x 的场景如下:
- 全新安装 Automation Suite 2022.4.0;
- Automation Suite 2021.10.0、2021.10.1、2021.10.2 的现有安装;
- 从 Automation Suite 2021.10.0、2021.10.1、2021.10.2 升级到 2022.4.0。
Automation Suite 2021.10.3 和 2021.10.4 托管 Ceph 16.x,您无法在其中利用优化的对象存储存储。 我们正在努力为此提供解决方案。
重要提示: 如果您使用 Ceph 15.x,则以降低对数据损坏的容错能力为代价完成存储优化。 要利用优化的存储,您可以承受 Automation Suite 中一次运行一个存储副本损坏的后果。 如果丢失多个存储副本,则很可能会丢失数据。 恢复存储副本的唯一方法是从备份数据中还原(前提是您已配置备份)。
要检查已安装的 Ceph 版本,请在任何服务器节点上运行以下命令:
kubectl -n rook-ceph get deployment -l rook_cluster=rook-ceph -o jsonpath='{range .items[*]}{"ceph-version="}{.metadata.labels.ceph-version}{"\n"}{end}' | sort | uniq
kubectl -n rook-ceph get deployment -l rook_cluster=rook-ceph -o jsonpath='{range .items[*]}{"ceph-version="}{.metadata.labels.ceph-version}{"\n"}{end}' | sort | uniq
以下示例输出显示了存储优化不支持的 Ceph 版本:
ceph-version=16.2.7-0
ceph-version=16.2.7-0
要优化对象存储存储,您需要将复制的 Ceph 算法迁移到纠删码算法。 下表显示了可以迁移数据的方法。
迁移方法 |
场景 |
---|---|
| |
|