通知を受け取る

UiPath Automation Suite

UiPath Automation Suite ガイド

監視スタックの使用

Automation Suite クラスターの監視スタックには、Prometheus、Grafana、および Alertmanager が含まれ、これらは Rancher Cluster Explorer UI 内で連携されます。

This page describes a series of monitoring scenarios. For more details, see the official Rancher documentation on using Rancher Monitoring.

Rancher 監視ダッシュボードにアクセスする


  1. https://monitoring.{cluster_host} から Rancher Cluster Explorer にアクセスします。表示される画面は、Rancher サーバーへの接続が初めてかどうかによって異なります。
  2. パスワードを入力します。パスワードはどちらの場合でも同じです。これは次のコマンドで取得できます。
kubectl get secret -n cattle-system rancher-admin-password -o jsonpath='{.data.password}' | base64 -d && echo
13411341

初回ログイン

14241424

2 回目以降のログイン

  1. Rancher サーバーのメインページでローカル リンクをクリックし、Cluster Explorerを開きます。
12821282
  1. サイドバーの [監視] メニューをクリックします。
14241424 13401340

 

現在発生しているアラートを確認する


[Monitoring] ダッシュボードの下部ペインで、現在発生しているアラートを確認します。次のスクリーンショットに、現在発生しているいくつかのアラートを示します。

14241424

 

アラートを抑制する


アラートが多すぎる場合は、これらを抑制できます。そのためには、以下の手順に従ってください。

  1. [監視] ダッシュボードの左上の [Alertmanager] タイルをクリックします。次の画面が表示されます。
11681168
  1. 該当のアラートを見つけ、[Silence] を選択します。
11811181
  1. [Creator][Comment] の詳細を入力し、[Create] をクリックします。アラートが [Monitoring] ダッシュボードに表示されたり、設定した受信者にレポートされることはなくなります。

 

外部受信者にアラートを送信する


アラートの外部受信者を設定することを強くお勧めします。このようにして、アラートは発生するとプッシュされ、最新のアラートを表示するために [Monitoring] ダッシュボードを更新する必要はありません。

For details on how to send alerts to an external receiver, see the Rancher documentation on Alertmanager Receiver Configuration.

14241424

In addition to a receiver, you must configure at least one route that uses that receiver. A route defines how alerts are grouped, and which alerts are sent to the receiver. See the Rancher documentation on Alertmanager Route Configuration.

14241424

See below for an example of how the alerts will be displayed when using the Slack receiver. Clicking the link to AlertManager will take you to the AlertManager console where alerts can be silenced and there are further links to the Prometheus expression that triggered the alert. Clicking the Runbook URL will take you to this page with specific remediation instructions. These links are also present when alerts are sent to other external receivers.

745745

 

Grafana ダッシュボードにアクセスする


[Monitoring] ダッシュボードで、[Grafana] タイルをクリックします。これで [Grafana] ダッシュボードが表示されます。

16061606

 

サービス メッシュを監視する


[Istio Mesh][Istio Workload] の Grafana ダッシュボードから、Istio サービス メッシュを監視できます。

 

Istio Mesh ダッシュボード


このダッシュボードには、選択した期間での全体的な要求量と、サービス メッシュ全体の 400 と 500 のエラー率が表示されます。このデータはウィンドウの右上に表示されます。この情報については、上部の 4 つのグラフをご覧ください。

ここには、個々のサービスの過去 1 分間における即時成功率も表示されます。NaN という成功率は、そのサービスで現在トラフィックがないことを示しています。

14691469

 

Istio Workload ダッシュボード


このダッシュボードでは、ウィンドウの右上で選択した時間範囲におけるトラフィック メトリックが表示されます。

ダッシュボードの上部にあるセレクターを使用して、特定のワークロードにドリルダウンします。特に注目するのは、uipath 名前空間です。

上部セクションには全体的なメトリックが示されます。[Inbound Workloads] セクションは送信元に基づいてトラフィックを分離し、[Outbound Services] セクションは宛先に基づいてトラフィックを分離しています。

14611461 14641464

 

永続ボリュームを監視する


[Kubernetes / Persistent Volumes] ダッシュボードでは、永続ボリュームを監視できます。各ボリュームについて、空き領域と使用されている領域を追跡できます。

13151315

Cluster Explorer[Storage] メニュー内の [PersistentVolumes] 項目をクリックして、各ボリュームのステータスを確認することもできます。

13361336

 

ハードウェアの使用状況を監視する


ノードごとのハードウェア使用状況を確認するには、[Nodes] ダッシュボードを使用できます。CPU 上のデータ、メモリ、ディスク、およびネットワークについて表示できます。

16061606

[Kubernetes / Compute Resources / Namespace (Workloads)] ダッシュボードを使用して、特定のワークロードのハードウェア使用状況を監視できます。uipath 名前空間を選択して必要なデータを取得します。

15081508

 

Grafana のグラフの共有可能な視覚的スナップショットを作成する


  1. グラフ タイトルの横にある下矢印をクリックし、[Share] を選択します。

  2. [Snapshot] タブをクリックし、[Snapshot name][Expire]、および [Timeout] を設定します。

  3. [Publish] をクリックし、snapshot.raintank.io. にパブリッシュします。

For more details, see the Grafana documentation on sharing dashboards.

📘

注:

このスナップショットは、このリンクを持つ誰もがパブリック インターネット上で表示できます。

 

カスタムの永続 Grafana ダッシュボードを作成する


Refer to the Rancher instructions on Persistent Grafana Dashboards for details on this.

 

Grafana への管理アクセス


ダッシュボードは、既定で匿名ユーザーでも読み取りアクセスが可能であるため、Grafana への管理アクセスは、通常 Automation Suite クラスターでは必要ありません。カスタムの永続ダッシュボードの作成は、このドキュメントでリンクを示した Kubernetes ネイティブの手順を使用して作成する必要があります。

Grafana への管理アクセスは、次の手順で実行できます。
Grafana 管理アクセスの既定のユーザー名とパスワードは、次のようにして取得できます。

kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-user}' | base64 -d && echo
kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-password}' | base64 -d && echo

高可用性 Automation Suite クラスターでは、ノードの障害時の中断のない読み取りアクセスや、より大量の読み取りクエリを可能にするため、複数の Grafana ポッドが存在することに注意してください。ポッドはセッション ステートを共有せず、ログインにはこのステートが必要なため、この状況は管理アクセスには適合しません。これを回避するには、管理アクセスが必要な場合に、Grafana レプリカの数を一時的に 1 にする必要があります。Grafana レプリカの数をスケーリングする方法については以下をご覧ください。

# scale down
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=1
# scale up
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=2

 

Prometheus にクエリを実行する


  1. [Monitoring] ダッシュボードで、 [Prometheus Graph] をクリックします。新しいウィンドウが表示されます。
981981 12511251

使用可能なメトリックについてのドキュメントを以下に示します。

 

カスタム アラートを作成する


ブール式による Prometheus クエリを使用して、カスタム アラートを作成できます。

  1. このためには、[Monitoring] ダッシュボード[Advanced] メニューで [Prometheus Rules] をクリックします。
228228 14241424
  1. ウィンドウの右上にある [Create] をクリックして新しいアラートを作成し、Rancher のドキュメント「PrometheusRules」に従います。
  2. アラートが発生すると、これが [Monitoring] ダッシュボードに表示されます。また、設定した受信者に通知されます。

 

Kubernetes リソース ステータスを監視する


ポッド、デプロイ、ステートフルセットなどのステータスを表示するには、Cluster Explorer UI を使用できます。これは、Rancher サーバー エンドポイントにログインした後に表示されるページと同じページです。このホームページには、概要が表示され、左側で各リソース タイプに固有の詳細にドリルダウンできます。ページの上部には、名前空間セレクターがあります。このダッシュボードをレンズツールと置き換えることもできます。

14241424 14251425

 

Prometheus メトリックを外部システムにエクスポートする


Prometheus uses the Prometheus remote write feature to collect and export Prometheus metrics to an external system.

📘

リモート書き込みエンドポイント連携

UiPath では、リモート書き込みエンドポイント連携のサポートまたは保守を行いません。ただし、エンドポイントは、Automation Suite 内で提供される Prometheus インスタンスと互換性があります。

To configure remote_write on an Automation Suite cluster:

  1. ArgoCD に接続します
  2. Rancher 監視アプリケーションに移動します。
16391639
  1. [APP DETAILS] パネル > [MANIFEST] タブを開きます。
16261626
  1. [EDIT] をクリックし、[values] > [prometheus] > [prometheusSpec] セクションに移動します。
  2. 必要な remoteWrite 設定を追加します。
    リモート書き込み機能で使用できる設定を見つけます。
16261626
  1. 新しい設定を保存します。新しい設定が適用されるまで、Rancher の監視アプリケーションには OutOfSync が表示されます。
    Prometheus は、新しいリモート書き込み設定を適用するために再起動する必要はありません
973973 932932
  1. 必要なリモート書き込み連携をテストします。手順 5 に戻り、新しい設定を追加します。

11 か月前に更新


監視スタックの使用


改善の提案は、API リファレンスのページでは制限されています

改善を提案できるのは Markdown の本文コンテンツのみであり、API 仕様に行うことはできません。