- 概述
- 要求
- 安装
- 安装后
- 迁移和升级
- 监控和警示
- 使用监控堆栈
- 警示 runbook
- 集群管理
- 特定于产品的配置
- 故障排除
EKS/AKS 上的 Automation Suite 安装指南
Automation Suite 集群的监控堆栈包括 Prometheus、Grafana 和 Alertmanager,除非您选择使用自己的监控堆栈,否则系统会自动安装它们。
本页描述了一系列针对使用监控工具进行优化的监控场景,该工具与 Automation Suite 集群捆绑。 如果您选择使用自己的监控堆栈,请确保遵循工具的官方文档来监控集群的运行状况。
使用收集器将指标导出到第三方工具时,如果启用应用程序监控,可能会中断 Automation Suite 的正常运行。
访问监控工具
概述
Automation Suite 集群的监控堆栈包括 Prometheus、Grafana 和警示管理器。
您可以使用以下 URL 单独访问 Automation Suite 监控工具:
| 应用程序 | 工具 | URL | 示例 |
|---|---|---|---|
| 指标 | Prometheus | https://monitoring.fqdn/metrics | https://monitoring.automationsuite.mycompany.com/metrics |
| 仪表板 | Grafana | https://monitoring.fqdn/grafana | https://monitoring.automationsuite.mycompany.com/grafana |
| 警示管理 | 警示管理器 | https://monitoring.fqdn/alertmanager | https://monitoring.automationsuite.mycompany.com/alertmanager |
监控工具身份验证
要首次访问监控工具,请按照访问 Automation Suite中的说明进行操作。
检查当前触发的警示
要查看警示,请使用https://monitoring.fqdn/metrics导航到 Prometheus,然后选择“警示”选项卡。您可以在此处看到 Automation Suite 中配置的所有警示。
-
要查看活动警示,请使用“触发”复选框筛选警示状态。
-
选中“显示注释”以显示与警示相对应的消息。
静默警示
如果警示过于嘈杂,您可以将其静音。为此,请执行以下步骤:
-
选择监控仪表板左上角的“警示管理器”图块。显示以下消息:
-
找到相关警示,然后选择“静默”。
-
填写“创建者”和“注释”详细信息,然后选择“创建” 。警示应该不会再显示在监控仪表板上,也应该不会报告给任何已配置的收件人。
配置警示
在开始配置警示之前,请确保启用 kubectl 。
添加新的电子邮件配置
要在安装后添加新的电子邮件配置,请运行以下命令:
./uipathctl config alerts add-email \
--name test \
--to "admin@example.com" \
--from "admin@example.com" \
--smtp server.mycompany.com \
--username admin \
--password somesecret \
--require-tls \
--ca-file <path_to_ca_file> \
--cert-file <path_to_cert_file> \
--key-file <path_to_key_file> \
--send-resolved \
--ASEA
./uipathctl config alerts add-email \
--name test \
--to "admin@example.com" \
--from "admin@example.com" \
--smtp server.mycompany.com \
--username admin \
--password somesecret \
--require-tls \
--ca-file <path_to_ca_file> \
--cert-file <path_to_cert_file> \
--key-file <path_to_key_file> \
--send-resolved \
--ASEA
| 标记 | 描述 | 示例 |
|---|---|---|
name | 电子邮件配置名称 | testconfig |
to | 收件人的电子邮件地址 | admin@example.com |
from | 发件人的电子邮件地址 | admin@example.com |
SMTP | SMTP 服务器 URL 或 IP 地址和端口号 | server.mycompany.com:567 |
username | 身份验证用户名 | admin |
password | 身份验证密码 | securepassword |
require-tls | 表示已在 SMTP 服务器上启用 TLS 的布尔值标志。 | 不适用 |
ca-file | 包含 SMTP 服务器的 CA 证书的文件路径。如果 CA 为私有,则这是可选项。 | ./ca-file.crt |
cert-file | 包含 SMTP 服务器证书的文件路径。如果证书为私有,则这是可选项。 | ./cert-file.crt |
key-file | 包含 SMTP 服务器 CA 证书的文件路径。如果证书是私有,则这是必需项。 | ./key-file.crt |
send-resolved | 解决警示后发送电子邮件的布尔值标志。 | 不适用 |
ASEA | 布尔值标志,表示您是在 EKS 还是 AKS 上安装了 Automation Suite。 | 不适用 |
删除电子邮件配置
要删除电子邮件配置,您必须运行以下命令。确保传递要删除的电子邮件配置的名称。
./uipathctl config alerts remove-email --name test --ASEA
./uipathctl config alerts remove-email --name test --ASEA
更新电子邮件配置
要更新电子邮件配置,您必须运行以下命令。确保传递要更新的电子邮件配置的名称以及要编辑的其他可选参数。这些参数与添加新电子邮件配置的参数相同。您可以同时传递一个或多个标志。
./uipathctl config alerts update-email --name test --ASEA [additional_flags]
./uipathctl config alerts update-email --name test --ASEA [additional_flags]
访问 Grafana 仪表板
要访问 Grafana 仪表板,您必须检索凭据并使用它们进行登录:
- 用户名:
kubectl -n monitoring get secrets/grafana-creds -o "jsonpath={.data.admin-user}" | base64 -d; echokubectl -n monitoring get secrets/grafana-creds -o "jsonpath={.data.admin-user}" | base64 -d; echo - 密码:
kubectl -n monitoring get secrets/grafana-creds -o "jsonpath={.data.admin-password}" | base64 -d; echokubectl -n monitoring get secrets/grafana-creds -o "jsonpath={.data.admin-password}" | base64 -d; echo
监控持久卷
您可以通过 Kubernetes/持久卷仪表板监控持久卷。您可以跟踪每个卷的可用空间和已用空间。
您还可以通过选择Cluster Explorer的“存储”菜单中的“持久卷”项目来检查每个卷的状态。
监控硬件利用率
要检查每个节点的硬件利用率,您可以使用节点仪表板。可以使用 CPU、内存、磁盘和网络上的数据。
您可以使用 Kubernetes/计算资源/命名空间(工作负载)仪表板监控特定工作负载的硬件利用率。选择 UiPath 命名空间以获取所需的数据。
创建可共享的 Grafana 图表可视化快照
- 选择图表标题旁边的向下箭头,然后选择“共享” 。
- 选择“快照”选项卡,然后设置“快照名称” 、 “过期”和“超时” 。
- 选择“发布到快照.raintank.io”。
有关更多详细信息,请参阅有关共享仪表板的 Grafana 文档。
任何知道此链接的人都可以在公共互联网上查看此快照。
创建自定义持久性 Grafana 仪表板
有关如何创建自定义持久性 Grafana 仪表板的详细信息,请参阅Grafana 文档。
查询 Prometheus
在监控仪表板上,选择“Prometheus 图形” 。系统将显示一个新窗口。
有关可用指标的文档如下: