automation-suite

2021.10

false

重要 :

このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

サポート対象外

Automation Suite インストールガイド

最終更新日時 2025年2月24日

監視スタックを使用する

Automation Suite クラスターの監視スタックには、Prometheus、Grafana、および Alertmanager が含まれ、これらは Rancher Cluster Explorer UI 内で連携されます。

注:

ノードに障害が発生すると Kubernetes がシャットダウンし、Prometheus のアラートが中断される可能性があります。これを防ぐには、RKE2 サーバー上に別個のアラートを設定することをお勧めします。

このページでは、一連の監視シナリオについて説明します。詳細については、Rancher Monitoring の使用に関する公式の Rancher ドキュメントをご覧ください。

重要:

コレクターを使用してサードパーティツールにメトリックをエクスポートする場合、アプリケーションの監視を有効化すると、Automation Suite の機能が中断される可能性があります。

Rancher 監視ダッシュボードにアクセスする

https://monitoring.{cluster_host} から Rancher Cluster Explorer にアクセスします。表示される画面は、Rancher サーバーへの接続が初めてかどうかによって異なります。
パスワードを入力します。パスワードはどちらの場合でも同じです。これは次のコマンドで取得できます。
```
kubectl get secret -n cattle-system rancher-admin-password -o jsonpath='{.data.password}' | base64 -d && echokubectl get secret -n cattle-system rancher-admin-password -o jsonpath='{.data.password}' | base64 -d && echo
```
Rancher サーバーのメインページでローカル リンクをクリックし、Cluster Explorerを開きます。
サイドバーの [監視] メニューをクリックします。

現在発生しているアラートを確認する

[Monitoring] ダッシュボードの下部ペインで、現在発生しているアラートを確認します。次のスクリーンショットに、現在発生しているいくつかのアラートを示します。

アラートを抑制する

アラートが多すぎる場合は、これらを抑制できます。そのためには、以下の手順に従ってください。

[監視] ダッシュボードの左上隅にある[Alertmanager] タイルを選択します。次の画面が表示されます。
該当のアラートを見つけ、[Silence] を選択します。
[Creator] と [Comment] の詳細を入力し、[Create] を選択します。アラートが [Monitoring] ダッシュボードに表示されたり、設定した受信者にレポートされることはなくなります。

外部受信者にアラートを送信する

アラートの外部受信者を設定することを強くお勧めします。このようにして、アラートは発生するとプッシュされ、最新のアラートを表示するために [Monitoring] ダッシュボードを更新する必要はありません。

外部受信者にアラートを送信する方法の詳細については、Alertmanager Receiver の設定に関する Rancher のドキュメントをご覧ください。

受信者に加え、その受信者を使用するルートを少なくとも 1 つ構成する必要があります。ルートにより、アラートをどのようにグループ化するか、およびどのアラートを受信者に送信するかが定義されます。Alertmanager のルート設定に関する Rancher ドキュメントをご覧ください。

Slack Receiver の使用時にアラートを表示する方法の例を以下に示します。AlertManager へのリンクをクリックすると、AlertManager コンソールが表示されます。ここでは、アラートを抑制することができ、アラートをトリガーした Prometheus 式へのリンクも表示されます。Runbook URLをクリックすると、このページが表示され、具体的な修正策が示されます。これらのリンクは、アラートが他の外部受信者に送信される場合にも示されます。

Grafana ダッシュボードにアクセスする

[Monitoring] ダッシュボードで、[Grafana] タイルをクリックします。これで [Grafana] ダッシュボードが表示されます。

サービスメッシュを監視する

[Istio Mesh] と [Istio Workload] の Grafana ダッシュボードから、Istio サービスメッシュを監視できます。

Istio Mesh ダッシュボード

このダッシュボードには、選択した期間での全体的な要求量と、サービスメッシュ全体の 400 と 500 のエラー率が表示されます。このデータはウィンドウの右上に表示されます。この情報については、上部の 4 つのグラフをご覧ください。

ここには、個々のサービスの過去 1 分間における即時成功率も表示されます。NaN という成功率は、そのサービスで現在トラフィックがないことを示しています。

Istio Workload ダッシュボード

このダッシュボードでは、ウィンドウの右上で選択した時間範囲におけるトラフィックメトリックが表示されます。

ダッシュボードの上部にあるセレクターを使用して、特定のワークロードにドリルダウンします。特に注目するのは、uipath 名前空間です。

上部セクションには全体的なメトリックが示されます。[Inbound Workloads] セクションは送信元に基づいてトラフィックを分離し、[Outbound Services] セクションは宛先に基づいてトラフィックを分離しています。

永続ボリュームを監視する

[Kubernetes / Persistent Volumes] ダッシュボードでは、永続ボリュームを監視できます。各ボリュームについて、空き領域と使用されている領域を追跡できます。

Cluster Explorer の [Storage] メニュー内の [PersistentVolumes] 項目をクリックして、各ボリュームのステータスを確認することもできます。

ハードウェアの使用状況を監視する

ノードごとのハードウェア使用状況を確認するには、[Nodes] ダッシュボードを使用できます。CPU 上のデータ、メモリ、ディスク、およびネットワークについて表示できます。

[Kubernetes / Compute Resources / Namespace (Workloads)] ダッシュボードを使用して、特定のワークロードのハードウェア使用状況を監視できます。uipath 名前空間を選択して必要なデータを取得します。

Grafana のグラフの共有可能な視覚的スナップショットを作成する

グラフのタイトルの横にある下向き矢印を選択し、[ 共有] を選択します。
[ スナップショット ] タブを選択し、[ スナップショット名]、[有効期限]、[ タイムアウト] を設定します。
[snapshot.raintank.io に パブリッシュ ] を選択します。

詳細については、ダッシュボードの共有に関する Grafana のドキュメントをご覧ください。

注: このスナップショットは、このリンクを持つ誰もがパブリックインターネット上で表示できます。

カスタムの永続 Grafana ダッシュボードを作成する

カスタムの永続 Grafana ダッシュボードを作成する方法について詳しくは、Rancher のドキュメントをご覧ください。

Grafana への管理アクセス

ダッシュボードは既定で匿名ユーザーに対して読み取りアクセスが可能になっているため、Automation Suite クラスターでは通常、Grafana への管理者アクセスは必要ありません。また、カスタムの永続的なダッシュボードを作成するには、このドキュメントで前述した Kubernetes ネイティブの手順を使用して作成する必要があります。

それにもかかわらず、Grafana への管理者アクセスは、次の手順で可能です。

Grafana 管理アクセスの既定のユーザー名とパスワードは、次のようにして取得できます。

kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-user}' | base64 -d && echo
kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-password}' | base64 -d && echokubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-user}' | base64 -d && echo
kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-password}' | base64 -d && echo

高可用性 Automation Suite クラスターでは、ノードに障害が発生した場合に中断のない読み取りアクセスと、大量の読み取りクエリを可能にするために、複数の Grafana ポッドが存在することに注意してください。これは、ポッドがセッション状態を共有せず、ログインに必要になるため、管理者アクセスと互換性がありません。この問題を回避するには、管理者アクセスが必要な状態で、Grafana レプリカの数を一時的に 1 に増やす必要があります。 Grafana レプリカの数をスケーリングする方法については、以下の手順をご覧ください。

# scale down
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=1
# scale up
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=2# scale down
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=1
# scale up
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=2

Prometheus にクエリを実行する

[Monitoring] ダッシュボードで、 [Prometheus Graph] をクリックします。新しいウィンドウが表示されます。

使用可能なメトリックについてのドキュメントを以下に示します。

カスタムアラートを作成する

ブール式による Prometheus クエリを使用して、カスタムアラートを作成できます。

このためには、[Monitoring] ダッシュボードの [Advanced] メニューで [Prometheus Rules] をクリックします。
ウィンドウの右上にある [Create] をクリックして新しいアラートを作成し、Rancher のドキュメント「PrometheusRules」に従います。
アラートが発生すると、これが [Monitoring] ダッシュボードに表示されます。また、設定した受信者に通知されます。

Kubernetes リソースステータスを監視する

ポッド、デプロイ、ステートフルセットなどのステータスを表示するには、Cluster Explorer UI を使用できます。これは、Rancher サーバーエンドポイントにログインした後に表示されるページと同じページです。このホームページには、概要が表示され、左側で各リソースタイプに固有の詳細にドリルダウンできます。ページの上部には、名前空間セレクターがあります。このダッシュボードをレンズツールと置き換えることもできます。

Prometheus メトリックを外部システムにエクスポートする

Prometheus は、Prometheus リモート書き込み機能を使用して、Prometheus メトリックを収集し、外部システムにエクスポートします。

注: UiPath では、リモート書き込みエンドポイント連携のサポートまたは保守を行いません。ただし、エンドポイントは、Automation Suite 内で提供される Prometheus インスタンスと互換性があります。

Automation Suite クラスターで remote_write を設定するには、以下の手順を実行します。

ArgoCD に接続します。
[Applications] をクリックします。
fabric-installer に移動します。
[APP DETAILS] パネルを開き、self-heal を無効化します。
Rancher 監視アプリケーションに移動します。
[APP DETAILS] パネル > [MANIFEST] タブを開きます。
[EDIT] をクリックし、[values] > [prometheus] > [prometheusSpec] セクションに移動します。
必要な remoteWrite 設定を追加します。

リモート書き込み機能で使用できる設定を見つけます。
新しい設定を保存します。新しい設定が適用されるまで、Rancher の監視アプリケーションには OutOfSync が表示されます。

注: Prometheus は、新しいリモート書き込み設定を適用するために再起動する必要はありません。
必要なリモート書き込み連携をテストします。手順 8 に戻り、新しい設定を追加します。