Automation Suite
2022.4
False
- 概述
- 要求
- 安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 无法获取沙盒映像
- Pod 未显示在 ArgoCD 用户界面中
- Redis 探测器失败
- RKE2 服务器无法启动
- 在 UiPath 命名空间中找不到密码
- 初始安装后,ArgoCD 应用程序进入“进行中”状态
- MongoDB Pod 处于 CrashLoopBackOff 状态或在删除后处于“等待 PVC 配置”状态
- 意外错误:不一致;手动运行 fsck
- 集群还原后 MongoDB 或业务应用程序降级
- 缺少 Self-heal-operator 和 Sf-k8-utils 存储库
- 集群还原或回滚后服务不正常
- RabbitMQ Pod 卡在 CrashLoopBackOff 中
- Prometheus 处于 CrashLoopBackoff 状态,并出现内存不足 (OOM) 错误
- 监控仪表板中缺少 Ceph-rook 指标
- 使用 Automation Suite 诊断工具
- 使用 Automation Suite 支持包工具
- 探索日志
RabbitMQ Pod 卡在 CrashLoopBackOff 中
Automation Suite 安装指南
上次更新日期 2024年4月24日
RabbitMQ Pod 卡在 CrashLoopBackOff 中
此问题会导致 RabbitMQ Pod 卡在 CrashLoopBackOff 中,故障 Pod 的日志中显示
wal_checksum_validation_failure
是一个原因。
要获取所有 Pod 的列表,请运行以下命令:
kubectl -n rabbitmq get pods
kubectl -n rabbitmq get pods
要获取 Pod 的日志,请运行以下命令:
kubectl -n rabbitmq logs <CrashLoopBackOff-Pod-Name>
kubectl -n rabbitmq logs <CrashLoopBackOff-Pod-Name>
要解决此问题,请执行以下步骤:
-
查找 RabbitMQ 副本的数量:
rabbitmqReplicas=$(kubectl -n rabbitmq get rabbitmqcluster rabbitmq -o json | jq -r '.spec.replicas')
rabbitmqReplicas=$(kubectl -n rabbitmq get rabbitmqcluster rabbitmq -o json | jq -r '.spec.replicas') -
缩减 RabbitMQ 副本:
kubectl -n rabbitmq patch rabbitmqcluster rabbitmq -p "{\"spec\":{\"replicas\": 0}}" --type=merge
kubectl -n rabbitmq patch rabbitmqcluster rabbitmq -p "{\"spec\":{\"replicas\": 0}}" --type=mergekubectl -n rabbitmq scale sts rabbitmq-server --replicas=0
kubectl -n rabbitmq scale sts rabbitmq-server --replicas=0 -
等待所有 RabbitMQ Pod 终止:
kubectl -n rabbitmq get pod
kubectl -n rabbitmq get pod -
查找并删除卡在 CrashLoopBackOff 状态的 RabbitMQ Pod 的 PVC:
kubectl -n rabbitmq get pvc
kubectl -n rabbitmq get pvckubectl -n rabbitmq delete pvc <crashloopbackupoff_pod_pvc_name>
kubectl -n rabbitmq delete pvc <crashloopbackupoff_pod_pvc_name> -
扩展 RabbitMQ 副本:
kubectl -n rabbitmq patch rabbitmqcluster rabbitmq -p "{\"spec\":{\"replicas\": $rabbitmqReplicas}}" --type=merge
kubectl -n rabbitmq patch rabbitmqcluster rabbitmq -p "{\"spec\":{\"replicas\": $rabbitmqReplicas}}" --type=merge -
检查所有 RabbitMQ Pod 是否运行状况良好:
kubectl -n rabbitmq get pod
kubectl -n rabbitmq get pod