ノードの再起動後にファイルシステムの破損によりポッドが起動しない

説明

場合によっては、ホストが再起動されたときに、ボリューム接続の問題が原因で insights-insightslooker ポッドが起動しないことがあります。これが発生すると、次の図に示すように、insights アプリは処理中ステータスでスタックします。

ArgoCD UI で insights-insightslooker ポッドを確認すると、次のエラーメッセージが表示されます。

この問題を修正するには、次の手順に従います。

エラーが発生しているボリュームを特定します。前のメッセージでは、pvc-5abe3c8f-7422-44da-9132-92be5641150a です。
影響を受けるボリュームを使用するワークロードをスケールダウンします。ボリュームがノードからデタッチされていることを確認します。ボリュームがデタッチされているかどうかを確認するには、次のコマンドを実行します。
```
kubectl get volumes.longhorn.io -n longhorn-system |grep <PV>kubectl get volumes.longhorn.io -n longhorn-system |grep <PV>
```
エラーが発生したボリュームを Longhorn UI から任意のノードに手動でアタッチします。
ノードにログインし、次のコマンドを実行してそのボリュームに対応するデバイスを修正します。
```
fsck.ext4 /dev/longhorn/<ERRORED_VOLUME>fsck.ext4 /dev/longhorn/<ERRORED_VOLUME>
```
詳しくは、以下の例をご覧ください。
エラーが発生したボリュームを修復した後、そのボリュームをノードからデタッチします。この操作は、Longhorn UI から行えます。
ワークロードをスケールアップします。
ポッドが自動的に起動し、しばらくすると正常になります。

PREVIOUSLooker が初期化に失敗する

次へProcess Mining のトラブルシューティング