automation-suite
2023.4
false
- 概述
- 要求
- 安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 如何在安装过程中对服务进行故障排除
- 如何卸载集群
- 如何清理离线工件以改善磁盘空间
- 如何清除 Redis 数据
- 如何启用 Istio 日志记录
- 如何手动清理日志
- 如何清理存储在 sf-logs 存储桶中的旧日志
- 如何禁用 AI Center 的流日志
- 如何对失败的 Automation Suite 安装进行调试
- 如何在升级后从旧安装程序中删除映像
- 如何自动清理 Longhorn 快照
- 如何禁用 TX 校验和卸载
- 如何手动将 ArgoCD 日志级别设置为 Info
- 如何为外部注册表生成已编码的 pull_secret_value
- 如何解决 TLS 1.2 中的弱密码问题
- 如何使用证书
- 如何使用集群内对象存储 (Ceph) 收集 DU 使用情况数据
- 如何在离线环境中安装 RKE2 SELinux
- 无法获取沙盒映像
- Pod 未显示在 ArgoCD 用户界面中
- Redis 探测器失败
- RKE2 服务器无法启动
- 在 UiPath 命名空间中找不到密码
- ArgoCD 在首次安装后进入“进行中”状态
- 访问 ArgoCD 只读帐户时出现问题
- MongoDB Pod 处于 CrashLoopBackOff 状态或在删除后处于“等待 PVC 配置”状态
- 集群还原或回滚后服务运行状况不佳
- Pod 在 Init:0/X 中卡住
- Prometheus 处于 CrashLoopBackoff 状态,并出现内存不足 (OOM) 错误
- 监控仪表板中缺少 Ceph-rook 指标
- Pod 无法在代理环境中与 FQDN 通信
- 无法配置升级后的电子邮件警示
- 无正常的上游问题
- 使用 Automation Suite 诊断工具
- 使用 Automation Suite 支持捆绑包
- 探索日志
重要 :
请注意,此内容已使用机器翻译进行了部分本地化。
新发布内容的本地化可能需要 1-2 周的时间才能完成。

Linux 版 Automation Suite 安装指南
上次更新日期 2025年11月6日
由于 PVC 损坏,MongoDB Pod 可能会卡在
CrashLoopBackOff 中。此问题的最可能原因是非正常关机。
遇到此问题时,日志将显示以下内容:
Common point must be at least stable timestamp
{"t":{"$date":"2022-05-18T09:37:55.053+00:00"},"s":"W", "c":"STORAGE", "id":22271, "ctx":"initandlisten","msg":"Detected unclean shutdown - Lock file is not empty","attr":{"lockFile":"/data/mongod.lock"}}
['currentState.Running' = false]
['currentState.IsVCRedistCorrect' = true]
['desiredState.ProcessType' != mongos ('desiredState.ProcessType' = mongod)]Common point must be at least stable timestamp
{"t":{"$date":"2022-05-18T09:37:55.053+00:00"},"s":"W", "c":"STORAGE", "id":22271, "ctx":"initandlisten","msg":"Detected unclean shutdown - Lock file is not empty","attr":{"lockFile":"/data/mongod.lock"}}
['currentState.Running' = false]
['currentState.IsVCRedistCorrect' = true]
['desiredState.ProcessType' != mongos ('desiredState.ProcessType' = mongod)]-
删除失败的 Pod。如果此解决方案不起作用,请继续执行后续步骤。
kubectl delete pod <pod-name> -n mongodbkubectl delete pod <pod-name> -n mongodb - 获取故障 Pod 的损坏 PVC 的名称。
kubectl -n mongodb get pvckubectl -n mongodb get pvc -
删除发生故障的 Pod 的 PVC。
kubectl -n mongodb delete pvc <pvc-name>kubectl -n mongodb delete pvc <pvc-name>注意:此时,PVC 应该会自动同步,并且 Pod 应该不会再遇到任何问题。如果未发生自动配置,则需要通过以下步骤手动执行该操作。 -
获取运行状况良好的节点的 PVC YAML。
kubectl -n mongodb get pvc <pvc-name> -o yaml > pvc.yamlkubectl -n mongodb get pvc <pvc-name> -o yaml > pvc.yaml - 编辑名称并从 YAML 中删除
uuids/pvc-ids。 -
删除卷名称和 UID,并将 PVC 重命名为已删除的 PVC 名称。
-
应用 PVC。
kubectl -n mongodb apply pvc.yamlkubectl -n mongodb apply pvc.yaml - 应配置 PVC 并将其附加到 Pod 的 PVC,并且 Pod 不应再遇到任何问题。如果 Pod 未重新同步,则将其删除。