Automation Suite
2022.4
バナーの背景画像
Automation Suite インストール ガイド
最終更新日 2024年4月24日

監視スタックを使用する

Automation Suite クラスターの監視スタックには、Prometheus、Grafana、および Alertmanager が含まれ、これらは Rancher Cluster Explorer UI 内で連携されます。

注:

ノードに障害が発生すると Kubernetes がシャットダウンし、Prometheus のアラートが中断される可能性があります。 これを防ぐには、RKE2 サーバーに個別のアラートを設定することをお勧めします。

このページでは、一連の監視シナリオについて説明します。詳細については、Rancher Monitoring の使用に関する公式の Rancher ドキュメントをご覧ください。

重要:

コレクターを使用してサードパーティ ツールにメトリックをエクスポートする場合、アプリケーションの監視を有効化すると、Automation Suite の機能が中断される可能性があります。

Rancher 監視ダッシュボードにアクセスする

  1. https://monitoring.{cluster_host} から Rancher Cluster Explorer にアクセスします。表示される画面は、Rancher サーバーへの接続が初めてかどうかによって異なります。
  2. パスワードを入力します。パスワードはどちらの場合でも同じです。これは次のコマンドで取得できます。
    kubectl get secret -n cattle-system rancher-admin-password -o jsonpath='{.data.password}' | base64 -d && echokubectl get secret -n cattle-system rancher-admin-password -o jsonpath='{.data.password}' | base64 -d && echo




  3. Rancher サーバーのメインページでローカル リンクをクリックし、Cluster Explorerを開きます。


  4. サイドバーの [監視] メニューをクリックします。




現在発生しているアラートを確認する

[Monitoring] ダッシュボードの下部ペインで、現在発生しているアラートを確認します。次のスクリーンショットに、現在発生しているいくつかのアラートを示します。



アラートを抑制する

アラートが多すぎる場合は、これらを抑制できます。そのためには、以下の手順に従ってください。

  1. [監視] ダッシュボードの左上の [Alertmanager] タイルをクリックします。次の画面が表示されます。


  2. 該当のアラートを見つけ、[Silence] を選択します。


  3. [Creator][Comment] の詳細を入力し、[Create] をクリックします。アラートが [Monitoring] ダッシュボードに表示されたり、設定した受信者にレポートされることはなくなります。

外部受信者にアラートを送信する

アラートの外部受信者を設定することを強くお勧めします。このようにして、アラートは発生するとプッシュされ、最新のアラートを表示するために [Monitoring] ダッシュボードを更新する必要はありません。

外部受信者にアラートを送信する方法の詳細については、Alertmanager Receiver の設定に関する Rancher のドキュメントをご覧ください。



受信者に加え、その受信者を使用するルートを少なくとも 1 つ構成する必要があります。ルートにより、アラートをどのようにグループ化するか、およびどのアラートを受信者に送信するかが定義されます。Alertmanager のルート設定に関する Rancher ドキュメントをご覧ください。



Slack Receiver の使用時にアラートを表示する方法の例を以下に示します。AlertManager へのリンクをクリックすると、AlertManager コンソールが表示されます。ここでは、アラートを抑制することができ、アラートをトリガーした Prometheus 式へのリンクも表示されます。Runbook URLをクリックすると、このページが表示され、具体的な修正策が示されます。これらのリンクは、アラートが他の外部受信者に送信される場合にも示されます。



Grafana ダッシュボードにアクセスする

[Monitoring] ダッシュボードで、[Grafana] タイルをクリックします。これで [Grafana] ダッシュボードが表示されます。



サービス メッシュを監視する

[Istio Mesh][Istio Workload] の Grafana ダッシュボードから、Istio サービス メッシュを監視できます。

Istio Mesh ダッシュボード

このダッシュボードには、選択した期間での全体的な要求量と、サービス メッシュ全体の 400 と 500 のエラー率が表示されます。このデータはウィンドウの右上に表示されます。この情報については、上部の 4 つのグラフをご覧ください。

ここには、個々のサービスの過去 1 分間における即時成功率も表示されます。NaN という成功率は、そのサービスで現在トラフィックがないことを示しています。



Istio Workload ダッシュボード

このダッシュボードでは、ウィンドウの右上で選択した時間範囲におけるトラフィック メトリックが表示されます。

ダッシュボードの上部にあるセレクターを使用して、特定のワークロードにドリルダウンします。特に注目するのは、uipath 名前空間です。

上部セクションには全体的なメトリックが示されます。[Inbound Workloads] セクションは送信元に基づいてトラフィックを分離し、[Outbound Services] セクションは宛先に基づいてトラフィックを分離しています。





永続ボリュームを監視する

[Kubernetes / Persistent Volumes] ダッシュボードでは、永続ボリュームを監視できます。各ボリュームについて、空き領域と使用されている領域を追跡できます。



Cluster Explorer[Storage] メニュー内の [PersistentVolumes] 項目をクリックして、各ボリュームのステータスを確認することもできます。



ハードウェアの使用状況を監視する

ノードごとのハードウェア使用状況を確認するには、[Nodes] ダッシュボードを使用できます。CPU 上のデータ、メモリ、ディスク、およびネットワークについて表示できます。



[Kubernetes / Compute Resources / Namespace (Workloads)] ダッシュボードを使用して、特定のワークロードのハードウェア使用状況を監視できます。uipath 名前空間を選択して必要なデータを取得します。



Grafana のグラフの共有可能な視覚的スナップショットを作成する

  1. グラフ タイトルの横にある下矢印をクリックし、[Share] を選択します。
  2. [Snapshot] タブをクリックし、[Snapshot name][Expire]、および [Timeout] を設定します。
  3. [Publish] をクリックし、snapshot.raintank.io. にパブリッシュします。

詳細については、ダッシュボードの共有に関する Grafana のドキュメントをご覧ください。

注: このスナップショットは、このリンクを持つ誰もがパブリック インターネット上で表示できます。

カスタムの永続 Grafana ダッシュボードを作成する

カスタムの永続 Grafana ダッシュボードを作成する方法について詳しくは、Rancher のドキュメントをご覧ください。

Grafana への管理アクセス

ダッシュボードは、既定で匿名ユーザーでも読み取りアクセスが可能であるため、Grafana への管理アクセスは、通常 Automation Suite クラスターでは必要ありません。カスタムの永続ダッシュボードの作成は、このドキュメントでリンクを示した Kubernetes ネイティブの手順を使用して作成する必要があります。

Grafana への管理アクセスは、次の手順で実行できます。

Grafana 管理アクセスの既定のユーザー名とパスワードは、次のようにして取得できます。

kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-user}' | base64 -d && echo
kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-password}' | base64 -d && echokubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-user}' | base64 -d && echo
kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-password}' | base64 -d && echo

高可用性 Automation Suite クラスターでは、ノードの障害時の中断のない読み取りアクセスや、より大量の読み取りクエリを可能にするため、複数の Grafana ポッドが存在することに注意してください。ポッドはセッション ステートを共有せず、ログインにはこのステートが必要なため、この状況は管理アクセスには適合しません。これを回避するには、管理アクセスが必要な場合に、Grafana レプリカの数を一時的に 1 にする必要があります。Grafana レプリカの数をスケーリングする方法については以下をご覧ください。

# scale down
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=1
# scale up
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=2# scale down
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=1
# scale up
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=2

Prometheus にクエリを実行する

[Monitoring] ダッシュボードで、 [Prometheus Graph] をクリックします。新しいウィンドウが表示されます。

カスタム アラートを作成する

ブール式による Prometheus クエリを使用して、カスタム アラートを作成できます。

  1. このためには、[Monitoring] ダッシュボード[Advanced] メニューで [Prometheus Rules] をクリックします。




  2. ウィンドウの右上にある [Create] をクリックして新しいアラートを作成し、Rancher のドキュメント「PrometheusRules」に従います。
  3. アラートが発生すると、これが [Monitoring] ダッシュボードに表示されます。また、設定した受信者に通知されます。

Kubernetes リソース ステータスを監視する

ポッド、デプロイ、ステートフルセットなどのステータスを表示するには、Cluster Explorer UI を使用できます。これは、Rancher サーバー エンドポイントにログインした後に表示されるページと同じページです。このホームページには、概要が表示され、左側で各リソース タイプに固有の詳細にドリルダウンできます。ページの上部には、名前空間セレクターがあります。このダッシュボードをレンズツールと置き換えることもできます。





Prometheus メトリックを外部システムにエクスポートする

Prometheus は、Prometheus リモート書き込み機能を使用して、Prometheus メトリックを収集し、外部システムにエクスポートします。

注: UiPath では、リモート書き込みエンドポイント連携のサポートまたは保守を行いません。ただし、エンドポイントは、Automation Suite 内で提供される Prometheus インスタンスと互換性があります。
Automation Suite クラスターで remote_write を構成する場合
  1. ArgoCD に接続します。
  2. [Applications] をクリックします。
  3. fabric-installer に移動します。
  4. [APP DETAILS] パネルを開き、self-heal を無効化します。
  5. Rancher 監視アプリケーションに移動します。


  6. [APP DETAILS] パネル > [MANIFEST] タブを開きます。


  7. [EDIT] をクリックし、[values] > [prometheus] > [prometheusSpec] セクションに移動します。
  8. 必要な remoteWrite 設定を追加します。
  9. 新しい設定を保存します。新しい設定が適用されるまで、Rancher の監視アプリケーションには OutOfSync が表示されます。
    注: Prometheus は、新しいリモート書き込み設定を適用するために再起動する必要はありません


  10. 必要なリモート書き込み連携をテストします。手順 8 に戻り、新しい設定を追加します。

Was this page helpful?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
UiPath ロゴ (白)
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.