automation-suite
2023.4
false
- 概述
- 要求
- 安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 导航至 Insights 主页会生成 404
- Looker 无法初始化
- 由于文件系统损坏,无法在节点重新启动后启动 Pod
- 使用 Automation Suite 诊断工具
- 使用 Automation Suite 支持包工具
- 探索日志
由于文件系统损坏,无法在节点重新启动后启动 Pod
重要 :
请注意此内容已使用机器翻译进行了部分本地化。
Linux 版 Automation Suite 安装指南
Last updated 2024年9月5日
由于文件系统损坏,无法在节点重新启动后启动 Pod
有时,当主机重新启动时,
insights-insightslooker
Pod 由于卷附件问题而无法启动。发生这种情况时,insights
应用程序将卡在“进行中”状态,如下图所示:
如果您在 ArgoCD 用户界面中检查
insights-insightslooker
Pod,应该会收到以下错误消息:
要解决此问题,请执行以下步骤:
-
确定有故障的卷。在上一条消息中,此卷为
pvc-5abe3c8f-7422-44da-9132-92be5641150a
。 -
缩小使用受影响卷的工作负载规模。确保该卷已与节点分离。要检查卷是否已分离,请运行以下命令:
kubectl get volumes.longhorn.io -n longhorn-system |grep <PV>
kubectl get volumes.longhorn.io -n longhorn-system |grep <PV> -
在 Longhorn 用户界面手动将有故障的卷附加到任何节点。
-
登录到节点并通过运行以下命令修复与该卷对应的设备:
fsck.ext4 /dev/longhorn/<ERRORED_VOLUME>
fsck.ext4 /dev/longhorn/<ERRORED_VOLUME>有关详细信息,请参见以下示例:
-
修复有故障的卷后,将其与节点分离。您可以在 Longhorn 用户界面中执行此操作。
-
扩大工作负载规模。
-
Pod 应该会自动启动,并在一段时间后恢复正常。