Automation Suite
2022.4
False
- 概述
- 要求
- 安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 无法获取沙盒映像
- Pod 未显示在 ArgoCD 用户界面中
- Redis 探测器失败
- RKE2 服务器无法启动
- 在 UiPath 命名空间中找不到密码
- 初始安装后,ArgoCD 应用程序进入“进行中”状态
- MongoDB Pod 处于 CrashLoopBackOff 状态或在删除后处于“等待 PVC 配置”状态
- 意外错误:不一致;手动运行 fsck
- 集群还原后 MongoDB 或业务应用程序降级
- 缺少 Self-heal-operator 和 Sf-k8-utils 存储库
- 集群还原或回滚后服务不正常
- RabbitMQ Pod 卡在 CrashLoopBackOff 中
- Prometheus 处于 CrashLoopBackoff 状态,并出现内存不足 (OOM) 错误
- 监控仪表板中缺少 Ceph-rook 指标
- 使用 Automation Suite 诊断工具
- 使用 Automation Suite 支持包工具
- 探索日志
无法在对象存储中上传或下载数据
Automation Suite 安装指南
上次更新日期 2024年4月24日
无法在对象存储中上传或下载数据
当对象存储由于置放群组 (PG) 不一致而处于降级状态时,可能会发生此问题。
通过运行以下命令,验证问题是否确实与 rook-ceph PG 不一致有关:
export KUBECONFIG=/etc/rancher/rke2/rke2.yaml PATH=$PATH:/var/lib/rancher/rke2/bin
ROOK_CEPH_TOOLS=$(kubectl -n rook-ceph get pods | grep rook-ceph-tools)
kubectl -n rook-ceph exec -it $ROOK_CEPH_TOOLS -- ceph status
export KUBECONFIG=/etc/rancher/rke2/rke2.yaml PATH=$PATH:/var/lib/rancher/rke2/bin
ROOK_CEPH_TOOLS=$(kubectl -n rook-ceph get pods | grep rook-ceph-tools)
kubectl -n rook-ceph exec -it $ROOK_CEPH_TOOLS -- ceph status
如果问题与 rook-ceph PG 不一致有关,则输出将包含以下消息:
....
....
Possible data damage: X pgs inconsistent
....
....
X active+clean+inconsistent
....
....
....
....
Possible data damage: X pgs inconsistent
....
....
X active+clean+inconsistent
....
....
要修复不一致的 PG,请执行以下步骤:
-
执行到 rook-ceph 工具:
kubectl -n rook-ceph exec -it $ROOK_CEPH_TOOLS -- sh
kubectl -n rook-ceph exec -it $ROOK_CEPH_TOOLS -- sh -
触发 rook-ceph 垃圾收集器流程。等待该流程完成。
radosgw-admin gc process
radosgw-admin gc process -
查找包含
active+clean+inconsistent
个 PG 的列表:ceph health detail # output of this command be like # .... # pg <pg-id> is active+clean+inconsistent, acting .. # pg <pg-id> is active+clean+inconsistent, acting .. # .... #
ceph health detail # output of this command be like # .... # pg <pg-id> is active+clean+inconsistent, acting .. # pg <pg-id> is active+clean+inconsistent, acting .. # .... # -
一次触发一个对 PG 的深度清理。此命令需要几分钟才能运行,具体取决于 PG 大小。
ceph pg deep-scrub <pg-id>
ceph pg deep-scrub <pg-id> -
观察清理状态:
ceph -w | grep <pg-id>
ceph -w | grep <pg-id> -
检查 PG 清理状态。如果 PG 清理成功,则 PG 状态应为
active+clean+inconsistent
。ceph health detail | grep <pg-id>
ceph health detail | grep <pg-id> -
修复 PG:
ceph pg repair <pg-id>
ceph pg repair <pg-id> -
检查 PG 修复状态。如果成功修复 PG,则应从
active+clean+inconsistent
列表中删除 PG ID。ceph health detail | grep <pg-id>
ceph health detail | grep <pg-id> - 对其余不一致的 PG 重复步骤 3 到 8。