Automation Suite
2022.4
偽
- 概要
- 要件
- インストール
- インストール後
- クラスターの管理
- 監視とアラート機能
- 移行とアップグレード
- 製品固有の設定
- ベストプラクティスとメンテナンス
- トラブルシューティング
- インストール時にサービスをトラブルシューティングする方法
- クラスターをアンインストールする方法
- オフライン成果物をクリーンアップしてディスク領域を改善する方法
- Redis データをクリアする方法
- Istio ログを有効化する方法
- ログを手動でクリーンアップする方法
- sf-logs バンドルに保存されている古いログをクリーンアップする方法
- AI Center のストリーミング ログを無効化する方法
- 失敗した Automation Suite インストールをデバッグする方法
- アップグレード後に古いインストーラーからイメージを削除する方法
- Longhorn スナップショットを自動的にクリーンアップする方法
- NIC チェックサムオフロードを無効にする方法
- RHEL 8.4 OS でオフライン インストールを実行できない
- バンドルのダウンロード中のエラー
- バイナリがないため、オフライン インストールが失敗する
- オフライン インストールでの証明書の問題
- Longhorn のセットアップ中に最初のインストールが失敗する
- SQL 接続文字列の検証エラー
- selinux iscsid モジュールの前提条件の確認が失敗する
- Azure ディスクが SSD としてマークされない
- 証明書の更新後のエラー
- OS のアップグレード後に Automation Suite が動作しない
- Automation Suite で Backlog_wait_time を 1 に設定する必要がある
- ワークロードの準備ができていないためボリュームをマウントできない
- インストールおよびアップグレード中に RKE2 が失敗する
- 管理ポータルのタイムアウト期間を設定する
- 基になるディレクトリ接続を更新する
- 移行後にログインできない
- Kinit: Cannot Find KDC for Realm <AD Domain> While Getting Initial Credentials
- kinit: Keytab contains no suitable keys for *** while getting initial credentials
- GSSAPI operation failed with error: An invalid status code was supplied (Client's credentials have been revoked).
- Alarm received for failed kerberos-tgt-update job
- SSPI Provider: Server not found in Kerberos database
- Login Failed for User <ADDOMAIN><aduser>.Reason: The Account Is Disabled.
- ArgoCD へのログインに失敗した
- サンドボックス イメージを取得できない
- ポッドが ArgoCD UI に表示されない
- Redis プローブの障害
- RKE2 サーバーの起動に失敗する
- UiPath 名前空間でシークレットが見つからない
- 初期インストール後、ArgoCD アプリが Progressing ステートになる
- MongoDB ポッドが CrashLoopBackOff になるか、削除後に PVC プロビジョニングの保留中になる
- Unexpected inconsistency; run fsck manually
- クラスターの復元後に MongoDB またはビジネス アプリケーションの機能が低下する
- self-heal-operator および sf-k8-utils リポジトリが見つからない
- クラスターの復元またはロールバック後にサービスが異常になる
- RabbitMQ ポッドが CrashLoopBackOff でスタックする
- Prometheus が CrashloopBackoff ステートでメモリ不足 (OOM) エラーを伴う
- 監視ダッシュボードに Ceph-rook メトリックが表示されない
- Automation Suite 診断ツールを使用する
- Automation Suite サポート バンドル ツールを使用する
- ログを確認する
ObjectStore ストレージを最適化する
Automation Suite インストール ガイド
最終更新日 2024年4月24日
ObjectStore ストレージを最適化する
重要: ストレージの最適化は、マルチノードの高可用性対応運用環境のデプロイでのみ必要です。シングルノードの評価デプロイでは不要です。
2022.4 より前のバージョンでは、Ceph はレプリケートされたデータ プールを使用していました。この種類のデータ プールは、50 GiB のオブジェクトを保存するのにクラスター全体で 900 GiB のスペースを要します。レプリケートされたプールではなく、イレイジャー コーディングされたプールを選択すれば、同じ 50 GiB のオブジェクトの保存に必要なストレージ スペースが 900 GiB から 450 GiB に減ります。
ObjectStore ストレージを最適化できるのは、Automation Suite クラスター内で実行される Ceph のバージョンが 15.x の場合だけです。
Automation Suite クラスターで Ceph 15.x をホストするシナリオは次のとおりです。
- Automation Suite 2022.4.0 の新規インストール
- Automation Suite 2021.10.0、2021.10.1、2021.10.2 の既存のインストール
- Automation Suite 2021.10.0、2021.10.1、2021.10.2 から 2022.4.0 へのアップグレード
Automation Suite 2021.10.3 および 2021.10.4 では Ceph 16.x がホストされており、最適化された ObjectStore ストレージを利用できません。現在、この解決策の提供に取り組んでいます。
重要: Ceph 15.x を使用する場合、ストレージの最適化を実行すると、データの破損に対するフォールト トレランスが低下します。最適化されたストレージを活用する場合、Automation Suite 内で実行されるストレージ レプリカが一度に 1 つ破損しても許容できます。複数のストレージ レプリカが失われると、データが失われる可能性が高くなります。ストレージ レプリカを回復する唯一の方法は、バックアップ データから復元する方法です (バックアップが構成されている場合)。
インストールされている Ceph のバージョンを確認するには、任意のサーバー ノードで次のコマンドを実行します。
kubectl -n rook-ceph get deployment -l rook_cluster=rook-ceph -o jsonpath='{range .items[*]}{"ceph-version="}{.metadata.labels.ceph-version}{"\n"}{end}' | sort | uniq
kubectl -n rook-ceph get deployment -l rook_cluster=rook-ceph -o jsonpath='{range .items[*]}{"ceph-version="}{.metadata.labels.ceph-version}{"\n"}{end}' | sort | uniq
次のサンプル出力は、ストレージの最適化でサポートされていない Ceph のバージョンを示しています。
ceph-version=16.2.7-0
ceph-version=16.2.7-0
ObjectStore ストレージを最適化するには、Ceph をレプリケーション アルゴリズムからイレイジャー コーディング アルゴリズムに移行する必要があります。次の表に、データを移行する方法を示します。
移行方法 |
シナリオ |
---|---|
| |
|