Automation Suite 診断ツールを使用する

Automation Suite に問題が発生したときに、まず最初に使用するのが Automation Suite 診断ツールです。診断ツールでは、さまざまな必須コンポーネントの正常性をチェックし、統合されたレポートを提供します。

ヒント:

次のコマンドを使用して supportability-tools zip をダウンロードし、そのコンテンツを抽出します。

curl "https://download.uipath.com/automation-suite/2021.10.3/supportability-tools-2021.10.3.zip" -o supportability-tools-2021.10.3.zip

unzip supportability-tools-2021.10.3.zip -d support-tools

その後、bash diagnostics-report.sh コマンドを使用して、support-tools/diagnostics-tool/ フォルダーから Automation Suite 診断ツールを実行できます。

次の表に、Automation Suite 診断ツールで実行するチェックを示します。スクリプトは、クラスター内の任意のノードでも、外部からでも実行できます。

ノード	チェック項目
マスターノード	必要なサービスが実行中かどうかを確認します。ディスクサイズが適切に構成されているかどうかをテストします。他のサービスの正常性を収集する Kubernetes ジョブを実行します。
エージェントノード	必要なサービスがノード上で実行されているかどうかを確認します。ディスクサイズが適切に構成されているかどうかをテストします。
外部マシン	サービスの正常性を収集する Kubernetes ジョブを実行します。注: 外部マシンからスクリプトを実行するには、まず適切な `kubeconfig` コンテキストをクラスターに設定してから、`-e` フラグをスクリプト `bash diagnostics-report.sh -e` に渡します。

Automation Suite 診断ツールによって生成されたサンプルレポートが表示されます。

診断レポートを読む

INFO ログ

緑色の INFO ログは、必要なチェックに合格したことを示します。ただし、それでも、隠れたエラーを回避するためにディスク/メモリの使用状況を正しくチェックする必要があります。

WARN メッセージ

このようなメッセージは高いリスクを示しているわけではありませんが、場合によっては修正が必要です。特定の状況において、何らかのサービスに影響が生じる可能性があります。

エラーメッセージ

このようなメッセージで示される問題はクラスター内のサービスに影響するので、修正する必要があります。

Rke2-server または Rke2-agent サービスが停止している

これらのサービスが停止している場合は、ノードが停止しています。<service-name> を使用してサービスを再実行してください。これによって問題が修正されます。

/var/lib にマウントされているディレクトリサイズ

レポートには、Kubernetes がデータの格納に使用している、/var/lib にマウントされているディレクトリのサイズが表示されます。ディレクトリがいっぱいの場合は、さまざまな問題が発生する可能性があります。こうした問題を回避するには、このサイズを大きくしてください。

Rke2 のバージョン

レポートには、rke2 のバージョンが参考のために表示されます。

ディスク圧迫またはメモリ圧迫

すべてのノードについて、そのノードがディスク圧迫かメモリ圧迫なのかを指定します。そのようになると、こうしたノードでのワークロードに問題が出始める可能性があります。こうしたノードで実行中の他のプロセスがリソースを消費していないかどうかを確認し、該当するプロセスがあれば削除します。

Ceph サービスのステータス

UiPath では、さまざまなアプリケーションからのログやファイルを保存する S3 オブジェクトストレージとして、Ceph を使用します。Ceph のサービスのステータスは表示することができます。サービスが停止している場合は、再実行が必要になることがあります。Ceph によるディスク使用量がフルになっていないかどうかも確認してください。

ポート 443 および 31443

ポート 443 と 31443 は、指定されたホスト名で開かれている必要があります。レポートには、これらのポートがアクセス不可であるかどうかが示されます。ここでアクセスできないことが指摘された場合、適切なポートを開いてください。

証明書の有効性

このツールは、アップロードされた証明書が指定のホスト名で有効かどうか、有効期限が切れていないかどうかをチェックします。証明書がこれらの基準を満たしていない場合、エラーが発生します。この問題を回避するには、アップロードされた証明書をチェックし、必要に応じて変更します。

GPU

サービスによっては、クラスター内の一部のノードに GPU が存在する必要があります。したがって、GPU ノードがあるかどうかを Automation Suite 診断ツールがチェックし、該当するノードの数を出力します。GPU ノードが存在すると予想されるものの、ここに表示されない場合は、GPU のセットアップに何らかの問題があります。