Automation Suite
2022.4
偽
- 概要
- 要件
- インストール
- インストール後
- クラスターの管理
- 製品を管理する
- ArgoCD でクラスターを管理する
- ObjectStore を永続ボリュームから RAW ディスクに移行する
- 手動: Ceph データ プールをレプリケートされたものからイレージャーコーディングされたプールに移行する
- 自動: Ceph データ プールをレプリケートされたものからイレージャーコーディングされたプールに移行する
- 監視とアラート機能
- 移行とアップグレード
- 製品固有の設定
- ベストプラクティスとメンテナンス
- トラブルシューティング
- インストール時にサービスをトラブルシューティングする方法
- クラスターをアンインストールする方法
- オフライン成果物をクリーンアップしてディスク領域を改善する方法
- Redis データをクリアする方法
- Istio ログを有効化する方法
- ログを手動でクリーンアップする方法
- sf-logs バンドルに保存されている古いログをクリーンアップする方法
- AI Center のストリーミング ログを無効化する方法
- 失敗した Automation Suite インストールをデバッグする方法
- アップグレード後に古いインストーラーからイメージを削除する方法
- Longhorn スナップショットを自動的にクリーンアップする方法
- NIC チェックサムオフロードを無効にする方法
- RHEL 8.4 OS でオフライン インストールを実行できない
- バンドルのダウンロード中のエラー
- バイナリがないため、オフライン インストールが失敗する
- オフライン インストールでの証明書の問題
- Longhorn のセットアップ中に最初のインストールが失敗する
- SQL 接続文字列の検証エラー
- selinux iscsid モジュールの前提条件の確認が失敗する
- Azure ディスクが SSD としてマークされない
- 証明書の更新後のエラー
- OS のアップグレード後に Automation Suite が動作しない
- Automation Suite で Backlog_wait_time を 1 に設定する必要がある
- ワークロードの準備ができていないためボリュームをマウントできない
- インストールおよびアップグレード中に RKE2 が失敗する
- 管理ポータルのタイムアウト期間を設定する
- 基になるディレクトリ接続を更新する
- 移行後にログインできない
- Kinit: Cannot Find KDC for Realm <AD Domain> While Getting Initial Credentials
- kinit: Keytab contains no suitable keys for *** while getting initial credentials
- GSSAPI operation failed with error: An invalid status code was supplied (Client's credentials have been revoked).
- Alarm received for failed kerberos-tgt-update job
- SSPI Provider: Server not found in Kerberos database
- Login Failed for User <ADDOMAIN><aduser>.Reason: The Account Is Disabled.
- ArgoCD へのログインに失敗した
- サンドボックス イメージを取得できない
- ポッドが ArgoCD UI に表示されない
- Redis プローブの障害
- RKE2 サーバーの起動に失敗する
- UiPath 名前空間でシークレットが見つからない
- 初期インストール後、ArgoCD アプリが Progressing ステートになる
- MongoDB ポッドが CrashLoopBackOff になるか、削除後に PVC プロビジョニングの保留中になる
- Unexpected inconsistency; run fsck manually
- クラスターの復元後に MongoDB またはビジネス アプリケーションの機能が低下する
- self-heal-operator および sf-k8-utils リポジトリが見つからない
- クラスターの復元またはロールバック後にサービスが異常になる
- RabbitMQ ポッドが CrashLoopBackOff でスタックする
- Prometheus が CrashloopBackoff ステートでメモリ不足 (OOM) エラーを伴う
- 監視ダッシュボードに Ceph-rook メトリックが表示されない
- Automation Suite 診断ツールを使用する
- Automation Suite サポート バンドル ツールを使用する
- ログを確認する
自動: Ceph データ プールをレプリケートされたものからイレージャーコーディングされたプールに移行する
Automation Suite インストール ガイド
最終更新日 2024年4月24日
自動: Ceph データ プールをレプリケートされたものからイレージャーコーディングされたプールに移行する
HA デプロイ モデルの ObjectStore ストレージの要件を減らすには、Ceph データ プールをレプリケートされたものからイレイジャー コーディングされたプールに移行します。
2022.4 より前のバージョンでは、Ceph はレプリケートされたデータ プールを使用していました。この種類のデータ プールは、50 GiB のオブジェクトを保存するのにクラスター全体で 900 GiB のスペースを要します。イレイジャー コーディングされたプールであれば、同じ 50 GiB のオブジェクトの保存に必要なストレージ スペースが 900 GiB から 450 GiB に減ります。
注: HA 以外のデプロイでは、Ceph データ プールの移行は不要です。
レプリケートされたデータ プールから、イレイジャー コーディングされたデータ プールに移行するには、次の手順を実行します。
注:
このスクリプトは、Ceph クラスターが正常であり、移行の対象としてサポートされているかどうかを確認するために移行前チェックを実行します。実際の移行は、事前のチェックを行った後でのみ行います。
「
Insufficient Storage space available for LH node
(LH ノードで利用可能なストレージ スペースが不十分です)」というエラーが発生して移行スクリプトが失敗し、なおかつストレージ スペースを増やせない場合は、Rados Export/Import を使用して手動で移行できます。手順については、「手動: Ceph データ プールを複製して消去コード化された種類に移行する」をご覧ください。