すべての Longhorn レプリカでエラーが発生します。

説明

Longhorn レプリカがエラー状態にあり、手動でのサルベージが必要な場合、ボリュームをアタッチできず、デタッチ状態のままになることがあります。

ボリュームに手動サルベージが必要かどうかを確認するには、次のコマンドを実行します。

kubectl  logs -l app=longhorn-manager  -n longhorn-system  -c longhorn-manager --prefix=true  --tail=-1  |grep "set engine salvageRequested to true" | grep <PV NAME>kubectl  logs -l app=longhorn-manager  -n longhorn-system  -c longhorn-manager --prefix=true  --tail=-1  |grep "set engine salvageRequested to true" | grep <PV NAME>

出力例:

2023-11-20T18:22:16.667609096+11:00 time="2023-11-20T07:22:16Z" level=info msg="All replicas are failed, set engine salvageRequested to true" accessMode=rwo controller=longhorn-volume frontend=blockdev migratable=false node=rpa-suite-dev-01.it.csiro.au owner=rpa-suite-dev-01.it.csiro.au state=detaching volume=pvc-031fd6bc-9cfe-420a-9213-da38509d733a2023-11-20T18:22:16.667609096+11:00 time="2023-11-20T07:22:16Z" level=info msg="All replicas are failed, set engine salvageRequested to true" accessMode=rwo controller=longhorn-volume frontend=blockdev migratable=false node=rpa-suite-dev-01.it.csiro.au owner=rpa-suite-dev-01.it.csiro.au state=detaching volume=pvc-031fd6bc-9cfe-420a-9213-da38509d733a

解決策

この問題を修正するには、次の手順に従います。

ワークロードポッドをスケールダウンします。

次のコマンドを実行して、関連するボリュームのレプリカを検索します。

kubectl get replicas.longhorn.io -n longhorn-system |grep <PV_NAME>kubectl get replicas.longhorn.io -n longhorn-system |grep <PV_NAME>

次のコマンドを実行して、関連するPVの replicas.longhorn.io オブジェクトを編集し、 spec.failedat フィールドをempty(““)に設定します。
```
kubectl get replicas.longhorn.io -n longhorn-system |grep <PV_NAME>kubectl get replicas.longhorn.io -n longhorn-system |grep <PV_NAME>
```
ワークロードポッドをスケールアップします。