RabbitMQ ポッドが CrashLoopBackOff でスタックする

説明

この問題により、RabbitMQ ポッドが CrashLoopBackOff でスタックし、失敗したポッドのログに wal_checksum_validation_failure が理由として表示されます。

すべてのポッドのリストを取得するには、次のコマンドを実行します。

kubectl -n rabbitmq get podskubectl -n rabbitmq get pods

ポッドのログを取得するには、次のコマンドを実行します。

kubectl -n rabbitmq logs <CrashLoopBackOff-Pod-Name>kubectl -n rabbitmq logs <CrashLoopBackOff-Pod-Name>

解決策

この問題を修正するには、次の手順に従います。

RabbitMQ レプリカの数を確認します。

rabbitmqReplicas=$(kubectl -n rabbitmq get rabbitmqcluster rabbitmq -o json | jq -r '.spec.replicas')rabbitmqReplicas=$(kubectl -n rabbitmq get rabbitmqcluster rabbitmq -o json | jq -r '.spec.replicas')

RabbitMQ レプリカを縮小します。

kubectl -n rabbitmq patch rabbitmqcluster rabbitmq -p "{\"spec\":{\"replicas\": 0}}" --type=mergekubectl -n rabbitmq patch rabbitmqcluster rabbitmq -p "{\"spec\":{\"replicas\": 0}}" --type=merge

kubectl -n rabbitmq scale sts rabbitmq-server --replicas=0kubectl -n rabbitmq scale sts rabbitmq-server --replicas=0

すべての RabbitMQ ポッドが終了するまで待ちます。
```
kubectl -n rabbitmq get podkubectl -n rabbitmq get pod
```

CrashLoopBackOff ステートでスタックしている RabbitMQ ポッドの PVC を見つけて削除します。

kubectl -n rabbitmq get pvckubectl -n rabbitmq get pvc

kubectl -n rabbitmq delete pvc <crashloopbackupoff_pod_pvc_name>kubectl -n rabbitmq delete pvc <crashloopbackupoff_pod_pvc_name>

RabbitMQ レプリカを拡大します。

kubectl -n rabbitmq patch rabbitmqcluster rabbitmq -p "{\"spec\":{\"replicas\": $rabbitmqReplicas}}" --type=mergekubectl -n rabbitmq patch rabbitmqcluster rabbitmq -p "{\"spec\":{\"replicas\": $rabbitmqReplicas}}" --type=merge