Automation Suite
2022.4
False
- 概述
- 要求
- 安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 无法获取沙盒映像
- Pod 未显示在 ArgoCD 用户界面中
- Redis 探测器失败
- RKE2 服务器无法启动
- 在 UiPath 命名空间中找不到密码
- 初始安装后,ArgoCD 应用程序进入“进行中”状态
- MongoDB Pod 处于 CrashLoopBackOff 状态或在删除后处于“等待 PVC 配置”状态
- 意外错误:不一致;手动运行 fsck
- 集群还原后 MongoDB 或业务应用程序降级
- 缺少 Self-heal-operator 和 Sf-k8-utils 存储库
- 集群还原或回滚后服务不正常
- RabbitMQ Pod 卡在 CrashLoopBackOff 中
- Prometheus 处于 CrashLoopBackoff 状态,并出现内存不足 (OOM) 错误
- 监控仪表板中缺少 Ceph-rook 指标
- 使用 Automation Suite 诊断工具
- 使用 Automation Suite 支持包工具
- 探索日志
意外错误:不一致;手动运行 fsck
Automation Suite 安装指南
上次更新日期 2024年4月24日
意外错误:不一致;手动运行 fsck
安装或升级 Automation Suite 时,如果 MongoDB Pod 无法挂载到 PVC Pod,则会显示以下错误消息:
UNEXPECTED INCONSISTENCY; RUN fsck MANUALLY
如果您遇到上述错误,请按照以下恢复步骤操作:
-
通过运行以下命令通过 SSH 连接到系统:
ssh <user>@<node-ip>
ssh <user>@<node-ip> -
检查 PVC 的事件,并验证该问题是否与由于文件错误导致 PVC 挂载失败有关。 为此,请运行以下命令:
export KUBECONFIG=/etc/rancher/rke2/rke2.yaml PATH=$PATH:/var/lib/rancher/rke2/bin:/usr/local/bin kubectl get events -n mongodb kubectl get events -n longhorn-system
export KUBECONFIG=/etc/rancher/rke2/rke2.yaml PATH=$PATH:/var/lib/rancher/rke2/bin:/usr/local/bin kubectl get events -n mongodb kubectl get events -n longhorn-system -
检查事件中提到的 PVC 卷,然后运行
fsck
命令。fsck -a <pvc-volume-name> Eg - fsck -a /dev/longhorn/pvc-5abe3c8f-7422-44da-9132-92be5641150a
fsck -a <pvc-volume-name> Eg - fsck -a /dev/longhorn/pvc-5abe3c8f-7422-44da-9132-92be5641150a -
删除失败的 MongoDB Pod,以将其正确挂载到 PVC。
kubectl delete pod <pod-name> -n mongodb
kubectl delete pod <pod-name> -n mongodb