仪表板和指标

我们提供预构建的特定于组件的仪表板，您可以在 Grafana 中访问这些仪表板。有关可以监控的组件的详细信息，请参阅 Automation Suite 架构。

下图显示了 Grafana 中的一些仪表板：

已针对重要指标预先配置了某些警示。您可以在 Prometheus 用户界面的“警示”部分找到这些配置。您负责配置警示接收人。

访问 Grafana 仪表板

要访问 Grafana 仪表板，您必须检索凭据并使用它们进行登录：

用户名:
```
kubectl -n cattle-monitoring-system get secrets/rancher-monitoring-grafana -o "jsonpath={.data.admin-user}" | base64 -d; echokubectl -n cattle-monitoring-system get secrets/rancher-monitoring-grafana -o "jsonpath={.data.admin-user}" | base64 -d; echo
```

密码:

kubectl -n cattle-monitoring-system get secrets/rancher-monitoring-grafana -o "jsonpath={.data.admin-password}" | base64 -d; echokubectl -n cattle-monitoring-system get secrets/rancher-monitoring-grafana -o "jsonpath={.data.admin-password}" | base64 -d; echo

Automation Suite 组件仪表板

监控网络

您可以通过以下 Grafana 仪表板监控 Automation Suite 网络：Istio 网格和 Istio。

Istio 网格仪表板

此仪表板显示所选时间段内整个服务网格的整体请求量以及 400 和 500 错误率。数据显示在窗口的右上角。有关此信息，请参阅顶部的 4 张图表。

它还显示每项服务在过去一分钟内的即时成功率。请注意，成功率为 NaN 表示该服务当前未提供流量。

Istio 工作负载仪表板

此仪表板显示窗口右上角所选时间范围内的流量指标。

使用仪表板顶部的选取器深入了解特定的工作负载。特别值得一提的是 UiPath 命名空间。

顶部显示整体指标，“入站工作负载”部分根据来源分离流量，“出站服务”部分根据目标分离流量。

监控存储

监控持久卷

您可以通过 Kubernetes/持久卷仪表板监控持久卷。您可以跟踪每个卷的可用空间和已用空间。

您还可以通过单击 Cluster Explore 的“存储”菜单中的“持久卷”项目来检查每个卷的状态。

Ceph 集群仪表板

Ceph 是一个开源存储提供程序，可在 Longhorn 创建的持久卷之上公开符合 Amazon S3 的对象/Blob 存储。

监控硬件利用率

要检查每个节点的硬件利用率，您可以使用节点仪表板。可以使用 CPU、内存、磁盘和网络上的数据。

您可以使用 Kubernetes/计算资源/命名空间（工作负载）仪表板监控特定工作负载的硬件利用率。选择 UiPath 命名空间以获取所需的数据。

监控 Kubernetes 资源状态

要查看 Pod、部署、状态副本集等的状态，可以使用 Cluster Explorer 用户界面。这与登录到 Rancher-Server 端点后访问的登录页面相同。主页将显示摘要，并在左侧向下钻取每种资源类型的特定详细信息。请注意页面顶部的命名空间选取器。此仪表板也可以替换为 Lens 工具。

创建可共享的 Grafana 图表可视化快照

单击图表标题旁边的向下箭头，然后选择“共享”。
单击“快照”选项卡，然后设置“快照名称”、“过期”和“超时”。
单击“发布”到 snapshot.raintank.io。

有关更多详细信息，请参阅有关共享仪表板的 Grafana 文档。

注意：任何知道此链接的人都可以在公共互联网上查看此快照。

创建自定义持久性 Grafana 仪表板

有关如何创建自定义持久性 Grafana 仪表板的详细信息，请参阅 Rancher 文档。

对 Grafana 的管理员访问权限

在 Automation Suite 集群中，通常不需要对 Grafana 的管理员访问权限，因为在默认情况下，匿名用户可以读取访问仪表板，而创建自定义持久性仪表板必须使用本文档上面链接的 Kubernetes 原生说明。

不过，使用以下说明可以对 Grafana 进行管理员访问。

可以按如下方式检索 Grafana 管理员访问权限的默认用户名和密码：

kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-user}' | base64 -d && echo
kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-password}' | base64 -d && echokubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-user}' | base64 -d && echo
kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-password}' | base64 -d && echo

请注意，在高可用性 Automation Suite 集群中存在多个 Grafana Pod，以便在节点出现故障以及进行大量读取查询时实现不间断的读取访问。这与管理员访问权限不兼容，因为 Pod 不共享会话状态，并且登录需要它。为了解决此问题，需要管理员访问权限时，必须将 Grafana 副本的数量临时增加到 1。有关如何扩展 Grafana 副本数量的说明，请参见下文：

# scale down
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=1
# scale up
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=2# scale down
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=1
# scale up
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=2