- 概要
- 要件
- デプロイ テンプレート
- 手動: インストールを準備する
- 手動: インストールを準備する
- 手順 2: オフライン インストール用に OCI 準拠レジストリを設定する
- 手順 3: 外部 ObjectStore を構成する
- 手順 4: High Availability Add-on を構成する
- 手順 5: SQL データベースを構成する
- 手順 6: ロード バランサーを構成する
- 手順 7: DNS を構成する
- 手順 8: ディスクを構成する
- 手順 9: カーネルと OS レベルの設定を構成する
- 手順 10: ノード ポートを構成する
- 手順 11: その他の設定を適用する
- 手順 12: 必要な RPM パッケージを検証してインストールする
- 手順 13: cluster_config.json を生成する
- 証明書の設定
- データベースの構成
- 外部 ObjectStore の構成
- 署名済み URL の構成
- Kerberos 認証の構成
- 外部の OCI 準拠レジストリの設定
- Disaster Recovery - アクティブ/パッシブおよびアクティブ/アクティブの構成
- High Availability Add-on の構成
- Orchestrator 固有の設定
- Insights 固有の構成
- Process Mining 固有の構成
- Document Understanding 固有の構成
- Automation Suite ロボット固有の構成
- 監視の構成
- 任意: プロキシ サーバーを構成する
- 任意: マルチノードの HA 対応の運用クラスターにおけるゾーン障害に対する復元設定を有効化する
- 任意: カスタムの Resolv.con を渡す
- 任意: フォールト トレランスを向上させる
- install-uipath.sh パラメーター
- GPU がサポートされた専用のエージェント ノードを追加する
- Task Mining 専用のエージェント ノードを追加する
- Task Mining アプリケーションを接続する
- Automation Suite ロボット専用のエージェント ノードを追加する
- 手順 15: オフライン インストール用に一時的な Docker レジストリを設定する
- 手順 16: インストールの前提条件を検証する
- 手動: インストールを実行する
- インストール後
- クラスターの管理
- 監視とアラート機能
- 移行とアップグレード
- 製品固有の設定
- ベスト プラクティスとメンテナンス
- トラブルシューティング
- インストール時にサービスをトラブルシューティングする方法
- クラスターをアンインストールする方法
- オフライン成果物をクリーンアップしてディスク領域を改善する方法
- Redis データをクリアする方法
- Istio ログを有効化する方法
- ログを手動でクリーンアップする方法
- sf-logs バケットに保存されている古いログをクリーンアップする方法
- AI Center のストリーミング ログを無効化する方法
- 失敗した Automation Suite インストールをデバッグする方法
- アップグレード後に古いインストーラーからイメージを削除する方法
- TX チェックサム オフロードを無効化する方法
- Automation Suite 2022.10.10 および 2022.4.11 から 2023.10.2 にアップグレードする方法
- ArgoCD のログ レベルを手動で Info に設定する方法
- AI Center のストレージを拡張する方法
- 外部レジストリーのエンコードされたpull_secret_valueを生成する方法
- TLS 1.2 で弱い暗号に対処する方法
- 証明書の操作方法
- アプリケーション ログを Splunk に転送する方法
- レジストリ ポッドから未使用の Docker イメージをクリーンアップする方法
- クラスター内の ObjectStore (Ceph) を使用して DU の使用状況データを収集する方法
- エアギャップ環境に RKE2 SELinux をインストールする方法
- NFS サーバー上の古い差分バックアップをクリーンアップする方法
- RHEL 8.4 OS でオフライン インストールを実行できない
- バンドルのダウンロード中のエラー
- バイナリがないため、オフライン インストールが失敗する
- オフライン インストールでの証明書の問題
- Longhorn のセットアップ中に最初のインストールが失敗する
- SQL 接続文字列の検証エラー
- selinux iscsid モジュールの前提条件の確認が失敗する
- Azure ディスクが SSD としてマークされない
- 証明書の更新後のエラー
- ウイルス対策が原因でインストールの問題が発生する
- OS のアップグレード後に Automation Suite が動作しない
- Automation Suite で backlog_wait_time を 0 に設定する必要がある
- ワークロードの準備ができていないためボリュームをマウントできない
- サポート バンドルのログ収集の失敗
- Test Automation SQL の接続文字列は無視されます
- DNS 設定が CoreDNS によって受け入れられない
- Automation Suite のアップグレード後に Insights を再インストールまたはアップグレードするとデータが失われる
- シングルノードのアップグレードがファブリック ステージで失敗する
- 2021.10 からの自動アップグレード後にクラスターが異常になる
- Ceph の異常によりアップグレードが失敗する
- 領域の問題のために rke2 が開始しない
- ボリュームがマウントできず、アタッチ/デタッチ ループ状態のまま
- Orchestrator データベース内のクラシック オブジェクトが原因でアップグレードが失敗する
- Ceph クラスターがサイドバイサイド アップグレード後に機能低下ステートで検出される
- 異常な Insights コンポーネントが原因で移行が失敗する
- Apps のサービス アップグレードの失敗
- インプレース アップグレードのタイムアウト
- Docker レジストリの移行が PVC の削除段階でスタックする
- v2023.10 以降へのアップグレード後に AI Center のプロビジョニングが失敗する
- オフライン環境でアップグレードが失敗する
- アップグレード中に SQL の検証が失敗する
- アップグレード後に snapshot-controller-crds ポッドが CrashLoopBackOff ステートになる
- Longhorn REST API エンドポイントのアップグレード/再インストール エラー
- Insights の PVC サイズが上書きされたためにアップグレードが失敗する
- サービス スクリプトの実行中にサービスのアップグレードが失敗する
- 管理ポータルのタイムアウト期間を設定する
- 移行後に認証が機能しない
- Kinit: Cannot find KDC for realm <AD Domain> while getting initial credentials
- kinit: Keytab contains no suitable keys for *** while getting initial credentials
- 無効なステータス コードが原因で GSSAPI 操作が失敗した
- Alarm received for failed kerberos-tgt-update job
- SSPI Provider: Server not found in Kerberos database
- アカウントが無効なため AD ユーザーのログインに失敗した
- ArgoCD へのログインに失敗した
- 基になるディレクトリ接続を更新する
- サンドボックス イメージを取得できない
- ポッドが ArgoCD UI に表示されない
- Redis プローブの障害
- RKE2 サーバーの起動に失敗する
- UiPath 名前空間でシークレットが見つからない
- 初回インストール後に ArgoCD が進行中ステートになる
- クラスターの復元またはロールバック後にサービスが異常になる
- Init:0/X でポッドがスタックする
- Ceph-rook のメトリックが監視ダッシュボードに表示されない
- プロキシ環境でポッドが FQDN と通信できない
- アップグレード後にメール アラートを設定できない
- アップストリームに正常な問題はありません
- オフライン環境でエージェント ノードを追加できない
- FQDN にアクセスすると RBAC: アクセス拒否エラーが返されます
- Process Mining で高可用性を実行する
- Kerberos を使用してログインすると、Process Mining を取り込むことができなかった
- 障害復旧後、Dapr が Process Mining に対して正しく機能しない
- クラスター モードで Redis を使用した Dapr を構成する
- pyodbc 形式の接続文字列を使用して AutomationSuite_ProcessMining_Warehouse データベースに接続できない
- Airflow のインストールが「sqlalchemy.exc.ArgumentError: Could not parse rfc1738 URL from string ''」で失敗する
- SQL Server ポート 1433 を使用する IP テーブル ルールを追加する方法
- CData Sync を実行しているサーバーの Automation Suite の証明書が信頼されない
- 診断ツールを実行する
- Automation Suite サポート バンドルを使用する
- ログを確認する
- 要約されたテレメトリを確認する

Linux の Automation Suite のインストール ガイド
診断ツールを実行する
Automation Suite 診断ツールは、一連のチェックを実行してクラスターの健全性に関するレポートを生成します。このレポートを分析することで、問題および考えられる根本原因を特定できます。このツールは、データベースの接続が失われた、資格情報が無効または期限切れであるといった一般的な問題の特定に役立ちます。
Automation Suite 診断ツールは、uipathctl と uipathtools の両方で利用でき、管理マシンにダウンロードできます。
uipathtools は、健全性コマンドに固有の uipathctl 機能のサブセットを含む CLI ツールです。このツールには後方互換性があり、サポートされているすべての Automation Suite バージョンで動作します。問題が発生した場合は、uipathtools を第一段階として使用することをお勧めします。
クイック検証
クイック検証
check コマンドと test コマンドを使用すると、詳細分析を実行することなくクラスターのステートに対する洞察を素早く得ることができます。
checkは ArgoCD の健全性と同期ステータスに依存しており、クラスターのステートを一切変更しません。testは、アプリケーション、デプロイ、ポッドを調べ、クラスターのステートを一時的に変更して洞察を提供します。
健全性チェック
健全性チェックを実行するには、使用するCLIツールに応じて、次のいずれかのコマンドを使用します。
uipathctlを使用する場合は、次のコマンドを実行します。./uipathctl health check./uipathctl health checkuipathtoolsを使用する場合は、次のコマンドを実行します。./uipathtools health check./uipathtools health check
既定では、uipathctl health check コマンドはすべてのコンポーネントの健全性を確認します。ただし、関心のあるコンポーネントのみを確認することもできます。
- コンポーネントを実行から除外するには、
--excludedフラグを使用します。たとえば SQL の健全性を確認しない場合は、uipathctl health check --excluded SQLを実行します。このコマンドは、SQL を除くすべてのコンポーネントの健全性を確認します。 - 特定のコンポーネントのみを実行時に含めるには、
--includedフラグを使用します。たとえば、DNS と ObjectStore の健全性のみを確認する場合は、uipathctl health check --included DNS,OBJECTSTORAGEを実行します。
ログを分析する
- 健全性チェックの実行後、ログに、Data Service アプリケーションの健全性チェックが失敗したことが示されます。
❌ [DATASERVICE] ❌ [DATASERVICE_HEALTH] Application health check failed: health status is Progressing and sync status is Synced❌ [DATASERVICE] ❌ [DATASERVICE_HEALTH] Application health check failed: health status is Progressing and sync status is Synced - 詳しく調べると、Data Service アプリケーションが失敗した理由は、
dataservice-runtime-8f5bb7d56-v5krgポッドとdataservice-taskrunner-787df76c74-98h5lポッドが「失敗」ステートであることが明らかになります。さらに分析すると、dataservice-external-storage-secretが見つからないことがわかります。❌ [POD] ✓ [LIST_NAMESPACES] Retrieved 25 namespaces to check pod health ❌ [CANNOT_MOUNT_VOLUME] Pod uipath/dataservice-runtime-8f5bb7d56-v5krg cannot mount volume: MountVolume.SetUp failed for volume "external-storage-creds" : secret "dataservice-external-storage-secret" not found ❌ [CANNOT_MOUNT_VOLUME] Pod uipath/dataservice-runtime-8f5bb7d56-xs9t5 cannot mount volume: MountVolume.SetUp failed for volume "external-storage-creds" : secret "dataservice-external-storage-secret" not found ❌ [CANNOT_MOUNT_VOLUME] Pod uipath/dataservice-taskrunner-787df76c74-98h5l cannot mount volume: MountVolume.SetUp failed for volume "external-storage-creds" : secret "dataservice-external-storage-secret" not found❌ [POD] ✓ [LIST_NAMESPACES] Retrieved 25 namespaces to check pod health ❌ [CANNOT_MOUNT_VOLUME] Pod uipath/dataservice-runtime-8f5bb7d56-v5krg cannot mount volume: MountVolume.SetUp failed for volume "external-storage-creds" : secret "dataservice-external-storage-secret" not found ❌ [CANNOT_MOUNT_VOLUME] Pod uipath/dataservice-runtime-8f5bb7d56-xs9t5 cannot mount volume: MountVolume.SetUp failed for volume "external-storage-creds" : secret "dataservice-external-storage-secret" not found ❌ [CANNOT_MOUNT_VOLUME] Pod uipath/dataservice-taskrunner-787df76c74-98h5l cannot mount volume: MountVolume.SetUp failed for volume "external-storage-creds" : secret "dataservice-external-storage-secret" not found - この問題を修正するには、
cluster_config.jsonで ObjectStore に正しい資格情報を指定していることを確認します。
健全性テスト
健全性テストを実行するには、使用するCLIツールに応じて、次のいずれかのコマンドを使用します。
uipathctlを使用する場合は、次のコマンドを実行します。./uipathctl health test./uipathctl health testuipathtoolsを使用する場合は、次のコマンドを実行します。./uipathtools health test./uipathtools health test
既定では、uipathctl health test コマンドはすべてのコンポーネントに対して健全性のテストを実行します。ただし、関心のあるコンポーネントのみを確認することもできます。
- コンポーネントを実行から除外するには、
--excludedフラグを使用します。たとえば SQL の健全性を確認しない場合は、uipathctl health test --excluded SQLを実行します。このコマンドは、SQL を除くすべてのコンポーネントの健全性を確認します。 - 特定のコンポーネントのみを実行時に含めるには、
--includedフラグを使用します。たとえば、DNS と ObjectStore の健全性のみを確認する場合は、uipathctl health test --included DNS,OBJECTSTORAGEを実行します。注:Data Service アプリケーションに対する
checkコマンドとtestコマンドの出力を比較すると、前者がアプリケーションの健全性を検証するのに対し、後者はルーティングを確認することがわかります。
既知の問題
次のサンプルのようなエラー メッセージが表示されることがあります。ユーザー側での操作は不要であるため、無視してかまいません。
E0621 23:32:56.426321 24470 reflector.go:138] external/io_k8s_client_go/tools/cache/reflector.go:167: Failed to watch *v1.Pod: context deadline exceeded
E0621 23:32:56.426392 24470 reflector.go:138] external/io_k8s_client_go/tools/cache/reflector.go:167: Failed to watch *v1.Pod: context deadline exceeded
E0621 23:32:56.444420 24470 reflector.go:138] external/io_k8s_client_go/tools/cache/reflector.go:167: Failed to watch *v1.Pod: context deadline exceeded
E0621 23:32:56.446150 24470 reflector.go:138] external/io_k8s_client_go/tools/cache/reflector.go:167: Failed to watch *v1.Pod: context deadline exceeded
E0621 23:32:56.513357 24470 reflector.go:138] external/io_k8s_client_go/tools/cache/reflector.go:167: Failed to watch *v1.Pod: context deadline exceeded
E0621 23:32:56.426321 24470 reflector.go:138] external/io_k8s_client_go/tools/cache/reflector.go:167: Failed to watch *v1.Pod: context deadline exceeded
E0621 23:32:56.426392 24470 reflector.go:138] external/io_k8s_client_go/tools/cache/reflector.go:167: Failed to watch *v1.Pod: context deadline exceeded
E0621 23:32:56.444420 24470 reflector.go:138] external/io_k8s_client_go/tools/cache/reflector.go:167: Failed to watch *v1.Pod: context deadline exceeded
E0621 23:32:56.446150 24470 reflector.go:138] external/io_k8s_client_go/tools/cache/reflector.go:167: Failed to watch *v1.Pod: context deadline exceeded
E0621 23:32:56.513357 24470 reflector.go:138] external/io_k8s_client_go/tools/cache/reflector.go:167: Failed to watch *v1.Pod: context deadline exceeded
詳細な検証
詳細な検証
diagnose コマンドを使用すると、クラスターのステートに関する詳細な洞察が得られます。SQL、ObjectStore、ノード、シークレット、Istio、ネットワークなど、あらゆるレベルの問題を特定するのに役立ちます。
checkコマンドとtestコマンドの両方をカバーしています。- Automation Suite のインストール前に実行される前提条件の確認を実行し、インストール後に環境の構成に加えられた変更と、問題の原因と考えられる変更を検証します。
- すべてのノードで実行され、ノード固有の問題 (リソースが利用不可、ネットワークの干渉など) を収集します。
診断チェックを実行するには、使用するCLIツールに応じて、次のいずれかのコマンドを使用します。
uipathctlを使用する場合は、次のコマンドを実行します。./uipathctl health diagnose cluster_config.json --versions version.json./uipathctl health diagnose cluster_config.json --versions version.jsonuipathtoolsを使用する場合は、次のコマンドを実行します。./uipathtools health diagnose cluster_config.json --versions version.json./uipathtools health diagnose cluster_config.json --versions version.json
前述のサンプルはトリミングされています。実際のログには他の情報も含まれます。diagnose コマンドは、インフラストラクチャ、ネットワーク、ストレージ、ポッド、DNS など、複数のレベルで実行されます。
ログを分析する
前のログで確認できる潜在的な問題として次の 2 つがあります。
- Istio の設定が不適切である。このため、Document Understanding プラットフォームへのアクセスに問題が発生する可能性があります。
❌ [ISTIO] ✓ [ISTIO_SYNC_STATUS] Istio sync is up-to-date ❌ [ISTIO_ENVOY_CONFIG_STATUS] Istio Envoy configs are not healthy: Error [IST0101] (VirtualService uipath/du-platform-vs) Referenced host:port not found: "aistorage:5000"❌ [ISTIO] ✓ [ISTIO_SYNC_STATUS] Istio sync is up-to-date ❌ [ISTIO_ENVOY_CONFIG_STATUS] Istio Envoy configs are not healthy: Error [IST0101] (VirtualService uipath/du-platform-vs) Referenced host:port not found: "aistorage:5000" - Data Service が利用不可である。コードの例で Ceph をご覧ください。
❌ [DATASERVICE] ❌ [DATASERVICE_HEALTH] Application health check failed: health status is Progressing and sync status is Synced ❌ [CANNOT_MOUNT_VOLUME] Pod uipath/dataservice-runtime-8f5bb7d56-v5krg cannot mount volume: (combined from similar events): Unable to attach or mount volumes: unmounted volumes=[external-storage-creds], unattached volumes=[workload-socket is-secrets openssl istio-podinfo temp-location cert-location istio-data external-storage-creds workload-certs istio-envoy java domain-cert-config edk2 credential-socket tmp additional-ca-cert-config pem istiod-ca-cert istio-token app-secrets ceph-storage-creds]: timed out waiting for the condition ❌ [CANNOT_MOUNT_VOLUME] Pod uipath/dataservice-runtime-8f5bb7d56-xs9t5 cannot mount volume: MountVolume.SetUp failed for volume "external-storage-creds" : secret "dataservice-external-storage-secret" not found ❌ [CANNOT_MOUNT_VOLUME] Pod uipath/dataservice-taskrunner-787df76c74-98h5l cannot mount volume: MountVolume.SetUp failed for volume "external-storage-creds" : secret "dataservice-external-storage-secret" not found❌ [DATASERVICE] ❌ [DATASERVICE_HEALTH] Application health check failed: health status is Progressing and sync status is Synced ❌ [CANNOT_MOUNT_VOLUME] Pod uipath/dataservice-runtime-8f5bb7d56-v5krg cannot mount volume: (combined from similar events): Unable to attach or mount volumes: unmounted volumes=[external-storage-creds], unattached volumes=[workload-socket is-secrets openssl istio-podinfo temp-location cert-location istio-data external-storage-creds workload-certs istio-envoy java domain-cert-config edk2 credential-socket tmp additional-ca-cert-config pem istiod-ca-cert istio-token app-secrets ceph-storage-creds]: timed out waiting for the condition ❌ [CANNOT_MOUNT_VOLUME] Pod uipath/dataservice-runtime-8f5bb7d56-xs9t5 cannot mount volume: MountVolume.SetUp failed for volume "external-storage-creds" : secret "dataservice-external-storage-secret" not found ❌ [CANNOT_MOUNT_VOLUME] Pod uipath/dataservice-taskrunner-787df76c74-98h5l cannot mount volume: MountVolume.SetUp failed for volume "external-storage-creds" : secret "dataservice-external-storage-secret" not found
既知の問題
次のサンプルのようなエラー メッセージが表示されることがあります。ユーザー側での操作は不要であるため、無視してかまいません。
その他のユーティリティ
その他のツール
Automation Suite 診断ツールのすべてのコマンド (check、test、diagnose) では、他のフィルター処理と出力形式もサポートされています。
フィルター処理
| フィルター | 説明 | 用途 |
|---|---|---|
--included | 検証に含めるサービスのコンマ区切りのリストです。 | /uipathctl health diagnose cluster_config.json --versions.json --included ISTIO,INSIGHTS このコマンドは、Istio と Insights に対してのみ診断を実行します。 |
--excluded | 検証から除外するサービスの、コンマ区切りのリストです。 | /uipathctl health test --excluded ISTIO,INSIGHTS このコマンドは、Istio と Insights を除くクラスター全体でテストを実行します。 |
出力フォーマット
Automation Suite 診断ツールでは、json、yaml、text、junit の複数の形式でレポートを生成できます。--output フラグを使用して、これらの値を任意のコマンドに渡すことができます。これらの出力形式は、各ツールを利用して独自のトラブルシューティング フレームワークを構築する場合に便利です。
使用例
| 使用状況 | 出力例 |
|---|---|
./uipathctl health check --included DATASERVICE --output json ./uipathtools health check --included DATASERVICE --output json | { "cluster/": { "DATASERVICE": [ { "name": "DATASERVICE_HEALTH", "description": "Application health check failed: health status is Progressing and sync status is Synced", "status": "failed" } ] } } |
./uipathctl health check --included DATASERVICE --output yaml ./uipathtools health check --included DATASERVICE --output yaml | ? locationType: cluster : DATASERVICE: - name: DATASERVICE_HEALTH description: 'Application health check failed: health status is Progressing and sync status is Synced' status: failed |
./uipathctl health check --included DATASERVICE --output text ./uipathtools health check --included DATASERVICE --output text | Checks run on cluster/ ❌ [DATASERVICE] ❌ [DATASERVICE_HEALTH] Application health check failed: health status is Progressing and sync status is Synced |
./uipathctl health check --included DATASERVICE --output junit ./uipathtools health check --included DATASERVICE --output junit | <testsuite name="Health" tests="1" errors="0" failures="1" time="0" timestamp="2023-06-22T01:59:08.313362+05:30" hostname=""> <testcase name="DATASERVICE_HEALTH" classname="" time="0"> <failure message="Application health check failed: health status is Progressing and sync status is Synced" type=""> </failure> </testcase> </testsuite> |
診断レポートを読む
INFO ログ
緑色の INFO ログは、必要なチェックに合格したことを示します。ただし、それでも、隠れたエラーを回避するためにディスク/メモリの使用状況を正しくチェックする必要があります。
WARN メッセージ
このようなメッセージは高いリスクを示しているわけではありませんが、場合によっては修正が必要です。特定の状況において、何らかのサービスに影響が生じる可能性があります。
エラー メッセージ
このようなメッセージで示される問題はクラスター内のサービスに影響するので、修正する必要があります。
Rke2-server または Rke2-agent サービスが停止している
これらのサービスが停止している場合は、ノードが停止しています。<service-name> を使用してサービスを再実行してください。これによって問題が修正されます。
/var/lib にマウントされているディレクトリ サイズ
レポートには、Kubernetes がデータの格納に使用している、/var/lib にマウントされているディレクトリのサイズが表示されます。ディレクトリがいっぱいの場合は、さまざまな問題が発生する可能性があります。こうした問題を回避するには、このサイズを大きくしてください。
Rke2 のバージョン
レポートには、rke2 のバージョンが参考のために表示されます。
ディスク圧迫またはメモリ圧迫
すべてのノードについて、そのノードがディスク圧迫かメモリ圧迫なのかを指定します。そのようになると、こうしたノードでのワークロードに問題が出始める可能性があります。こうしたノードで実行中の他のプロセスがリソースを消費していないかどうかを確認し、該当するプロセスがあれば削除します。
Ceph サービスのステータス
UiPath では、さまざまなアプリケーションからのログやファイルを保存する S3 オブジェクト ストレージとして、Ceph を使用します。Ceph のサービスのステータスは表示することができます。サービスが停止している場合は、再実行が必要になることがあります。Ceph によるディスク使用量がフルになっていないかどうかも確認してください。
ポート 443 および 31443
ポート 443 と 31443 は、指定されたホスト名で開かれている必要があります。レポートには、これらのポートがアクセス不可であるかどうかが示されます。ここでアクセスできないことが指摘された場合、適切なポートを開いてください。
証明書の有効性
このツールは、アップロードされた証明書が指定のホスト名で有効かどうか、有効期限が切れていないかどうかをチェックします。証明書がこれらの基準を満たしていない場合、エラーが発生します。この問題を回避するには、アップロードされた証明書をチェックし、必要に応じて変更します。
GPU
サービスによっては、クラスター内の一部のノードに GPU が存在する必要があります。したがって、GPU ノードがあるかどうかを Automation Suite 診断ツールがチェックし、該当するノードの数を出力します。GPU ノードが存在すると予想されるものの、ここに表示されない場合は、GPU のセットアップに何らかの問題があります。
RabbitMQ と DockerRegistry
RabbitMQ と DockerRegistry は、一部のサービスで使用される 2 つの重要なコンポーネントです。どちらか 1 つでも停止している場合は、問題を調査し、再起動する必要があります。
ArgoCD サービスの停止
ArgoCD は、アプリケーション ライフサイクル管理 (ALM) ツールです。そのいずれかのサービスが停止している場合、他のアプリケーションが古くなっているか、他の問題が発生している可能性があります。こうしたサービスの回復は重要であり、場合によってはさらなるデバッグが必要になります。
存在しないか、機能が低下している ArgoCD アプリケーション
Automation Suite 診断ツールは、ArgoCD アプリケーションが見つからないかどうか、および機能低下していないかどうかを示します。
- アプリケーションが見つからない場合は、ArgoCD UI に移動し、これを同期します。
- アプリケーションが機能低下している場合は、ArgoCD がスローするエラーを調査するために追加のデバッグが必要です。
- クイック検証
- クイック検証
- 健全性チェック
- 健全性テスト
- 詳細な検証
- 詳細な検証
- その他のユーティリティ
- その他のツール
- 診断レポートを読む
- INFO ログ
- WARN メッセージ
- エラー メッセージ
- Rke2-server または Rke2-agent サービスが停止している
- /var/lib にマウントされているディレクトリ サイズ
- Rke2 のバージョン
- ディスク圧迫またはメモリ圧迫
- Ceph サービスのステータス
- ポート 443 および 31443
- 証明書の有効性
- GPU
- RabbitMQ と DockerRegistry
- ArgoCD サービスの停止
- 存在しないか、機能が低下している ArgoCD アプリケーション