ワークロードの準備ができていないためボリュームをマウントできない

説明

ノードの再起動または Longhorn 管理ポッドの再起動が原因で、ボリュームが同期ループを完了できないことがあります。これにより、ボリュームは新しいワークロードの準備ができなくなります。この問題により、基になるレプリカはエラーステートになるため、準備完了にするには復旧操作が必要です。 Longhorn では自動復旧が有効化されていますが、レプリカが復旧されずに手動操作が必要になる場合があります。

この問題がボリュームアタッチのエラーの原因であるかどうかを確認するには、Longhorn マネージャーのログに次のエラーが含まれているかどうかを確認します。

level=info msg="All replicas are failed, set engine salvageRequested to true" accessMode=rwo controller=longhorn-volume frontend=blockdev migratable=false node=agent0 owner=agent0 state=detached volume=pvc-49b22fef-772e-4c1f-b9eb-6bc15e7addbb
    level=warning msg="Cannot auto salvage volume: no data exists" accessMode=rwo controller=longhorn-volume frontend=blockdev migratable=false node=agent0 owner=agent0 state=detached volume=pvc-49b22fef-772e-4c1f-b9eb-6bc15e7addbb level=info msg="All replicas are failed, set engine salvageRequested to true" accessMode=rwo controller=longhorn-volume frontend=blockdev migratable=false node=agent0 owner=agent0 state=detached volume=pvc-49b22fef-772e-4c1f-b9eb-6bc15e7addbb
    level=warning msg="Cannot auto salvage volume: no data exists" accessMode=rwo controller=longhorn-volume frontend=blockdev migratable=false node=agent0 owner=agent0 state=detached volume=pvc-49b22fef-772e-4c1f-b9eb-6bc15e7addbb

解決策

この問題を修正するには、次の手順に従います。

影響を受けるワークロードをスケールダウンします。
Longhorn UI から復旧操作をトリガーします。問題が解決しない場合は、関連する replica.longhorn.io リソースを編集し、failedAt を empty に設定します。
影響を受けるワークロードをスケールアップします。