- 概述
- 要求
- 安装
- 安装后
- 迁移和升级
- 监控和警示
- 使用监控堆栈
- 警示 runbook
- 集群管理
- 特定于产品的配置
- 故障排除
使用监控堆栈
Automation Suite 集群的监控堆栈包括 Prometheus、Grafana 和 Alertmanager,除非您选择使用自己的监控堆栈,否则系统会自动安装它们。
本页描述了一系列针对使用监控工具进行优化的监控场景,该工具与 Automation Suite 集群捆绑。 如果您选择使用自己的监控堆栈,请确保遵循工具的官方文档来监控集群的运行状况。
使用收集器将指标导出到第三方工具时,如果启用应用程序监控,可能会中断 Automation Suite 的正常运行。
Automation Suite 集群的监控堆栈包括 Prometheus、Grafana 和警示管理器。
您可以使用以下 URL 单独访问 Automation Suite 监控工具:
应用程序 |
工具 |
URL |
示例 |
---|---|---|---|
指标 |
Prometheus |
|
|
仪表板 |
Grafana |
|
|
警示管理 |
警示管理器 |
|
|
要首次访问监控工具,请按照 访问 Automation Suite 中的说明进行操作。
https://monitoring.fqdn/metrics
导航到 Prometheus,然后单击“警示”选项卡。您可以在此处看到 Automation Suite 中配置的所有警示。
要查看活动警示,请单击顶部的“触发”复选框和“显示注释”复选框,以筛选警示状态。您可以在此处看到当前触发的所有警示及其相应的消息。
.../UiPathAutomationSuite/UiPath_Installer/bin
中找到 uipathctl
。
Before starting configuring the alerts, make sure to enable kubectl.
要在安装后添加新的电子邮件配置,请运行以下命令:
./uipathctl config alerts add-email \
--name test \
--to "admin@example.com" \
--from "admin@example.com" \
--smtp server.mycompany.com \
--username admin \
--password somesecret \
--require-tls \
--ca-file <path_to_ca_file> \
--cert-file <path_to_cert_file> \
--key-file <path_to_key_file> \
--send-resolved
--ASEA
./uipathctl config alerts add-email \
--name test \
--to "admin@example.com" \
--from "admin@example.com" \
--smtp server.mycompany.com \
--username admin \
--password somesecret \
--require-tls \
--ca-file <path_to_ca_file> \
--cert-file <path_to_cert_file> \
--key-file <path_to_key_file> \
--send-resolved
--ASEA
标记 |
描述 |
示例 |
---|---|---|
|
电子邮件配置名称 |
|
|
收件人的电子邮件地址 |
|
|
发件人的电子邮件地址 |
|
|
SMTP 服务器 URL 或 IP 地址和端口号 |
|
|
身份验证用户名 |
|
|
身份验证密码 |
|
|
表示已在 SMTP 服务器上启用 TLS 的布尔值标志。 |
不适用 |
|
包含 SMTP 服务器的 CA 证书的文件路径。如果 CA 为私有,则这是可选项。 |
|
|
包含 SMTP 服务器证书的文件路径。如果证书为私有,则这是可选项。 |
|
|
包含 SMTP 服务器 CA 证书的文件路径。如果证书是私有,则这是必需项。 |
|
|
解决警示后发送电子邮件的布尔值标志。 |
不适用 |
|
布尔值标志,表示您是在 EKS 还是 AKS 上安装了 Automation Suite。 |
不适用 |
要删除电子邮件配置,您必须运行以下命令。确保传递要删除的电子邮件配置的名称。
./uipathctl config alerts remove-email --name test --ASEA
./uipathctl config alerts remove-email --name test --ASEA
要访问 Grafana 仪表板,您必须检索凭据并使用它们进行登录:
-
用户名:
kubectl -n cattle-monitoring-system get secrets/rancher-monitoring-grafana -o "jsonpath={.data.admin-user}" | base64 -d; echo
kubectl -n cattle-monitoring-system get secrets/rancher-monitoring-grafana -o "jsonpath={.data.admin-user}" | base64 -d; echo -
密码:
kubectl -n cattle-monitoring-system get secrets/rancher-monitoring-grafana -o "jsonpath={.data.admin-password}" | base64 -d; echo
kubectl -n cattle-monitoring-system get secrets/rancher-monitoring-grafana -o "jsonpath={.data.admin-password}" | base64 -d; echo
您可以通过 Kubernetes/持久卷仪表板监控持久卷。您可以跟踪每个卷的可用空间和已用空间。
您还可以通过单击 Cluster Explore 的“存储”菜单中的“持久卷”项目来检查每个卷的状态。
要检查每个节点的硬件利用率,您可以使用节点仪表板。可以使用 CPU、内存、磁盘和网络上的数据。
您可以使用 Kubernetes/计算资源/命名空间(工作负载)仪表板监控特定工作负载的硬件利用率。选择 UiPath 命名空间以获取所需的数据。
- 单击图表标题旁边的向下箭头,然后选择“共享”。
- 单击“快照”选项卡,然后设置“快照名称”、“过期”和“超时”。
- 单击“发布”到 snapshot.raintank.io。
有关更多详细信息,请参阅有关共享仪表板的 Grafana 文档。
有关如何创建自定义持久性 Grafana 仪表板的详细信息,请参阅 Grafana 文档。