automation-suite
2021.10
false
重要 :
请注意此内容已使用机器翻译进行了部分本地化。
Automation Suite 安装指南
Last updated 2024年8月26日

使用 Automation Suite 诊断工具

当 Automation Suite 出现任何问题时,首先要使用 Automation Suite 诊断工具。 它会检查不同所需组件的运行状况,并提供综合报告。

提示:
下载 supportability-tools ZIP 文件并使用以下命令提取其内容:

curl "https://download.uipath.com/automation-suite/2021.10.3/supportability-tools-2021.10.3.zip" -o supportability-tools-2021.10.3.zip

unzip supportability-tools-2021.10.3.zip -d support-tools

然后,您可以使用 bash diagnostics-report.sh 命令从 support-tools/diagnostics-tool/ 文件夹运行 Automation Suite 诊断工具。

下表列出了 Automation Suite 诊断工具执行的检查。请注意,您可以在集群中的任何节点以及外部节点上运行该脚本。

节点

检查

主节点

  • 检查所需服务是否正在运行;
  • 测试磁盘大小是否配置得当;
  • 运行用以收集其他服务运行状况的 Kubernetes 作业;

代理节点

  • 检查所需服务是否正在节点上运行
  • 测试磁盘大小是否配置得当;

外部计算机

  • 运行 Kubernetes 作业以收集服务的运行状况。
注意:要从外部计算机运行脚本,请先为集群设置适当的 kubeconfig 上下文,然后将 -e 标志传递给脚本 bash diagnostics-report.sh -e

Automation Suite 诊断工具生成的示例报告。



读取诊断报告

信息日志

绿色的 INFO 日志显示所需的检查已通过。但是,您仍应正确检查磁盘/内存的使用情况,以避免隐藏的错误。

警告消息

即使这些消息并不表示高风险,您也可能需要纠正它们,因为在某些情况下它们可能会影响某些服务。

错误消息

您必须修复这些消息描述的问题,因为它们会影响集群中的某些服务。

Rke2-server 或 Rke2-agent 服务关闭

如果这些服务关闭,则意味着节点已关闭。尝试使用 systemctl restart <service-name> 命令来重新启动服务,因为这应该可以解决问题。

装载于 /var/lib 的目录大小

该报告显示在 /var/lib 中装载的目录大小,因为 Kubernetes 使用它来存储其数据。如果目录已满,则可能会出现各种问题。为防止出现这些问题,请确保增加其大小。

Rke2 版本

报告将显示 rke2 版本以供参考。

磁盘压力或内存压力

对于所有节点,我们指定它们是处于磁盘压力之下,还是内存压力之下。如果发生这种情况,这些节点上的工作负载可能会开始出现问题。检查这些节点上是否正在运行任何其他正在消耗资源的流程,如果是这种情况,请将其删除。

Ceph 服务状态

我们使用 Ceph 作为 S3 对象存储,用于存储来自不同应用程序的日志和文件。您可以查看其服务的状态。如果它们已关闭,则可能必须重新启动它们。请务必同时检查 Ceph 的磁盘使用情况是否已满。

端口 443 和 31443

我们希望使用提供的主机名打开 44331443 端口。报告会指出它们是否不可访问。如果指向此处,请确保打开相应的端口。

证书有效性

该工具会检查上传的证书对于给定的主机名是否有效,以及是否未过期。如果证书不符合这些条件,则会发生错误。为防止出现这种情况,请务必检查您上传的证书,并在需要时进行更改。

GPU

由于某些服务要求集群中的某些节点存在 GPU,因此 Automation Suite 诊断工具会检查是否存在 GPU 节点并打印此类节点的数量。如果您期望 GPU 节点存在,但它们没有显示在此处,则意味着 GPU 设置中出现了问题。

MongoDB

MongoDB 是 UiPath Apps 服务使用的重要组件。如果 MongoDB 或其主实例已关闭,则您需要使用支持捆绑包调查此问题。

RabbitMQ 和 DockerRegistry

RabbitMQ 和 DockerRegistry 是某些服务使用的两个重要组件。如果其中任何一个出现故障,您需要调查问题并重新启动。

ArgoCD 服务关闭

ArgoCD 是我们的应用程序生命周期管理 (ALM) 工具。如果其任何服务关闭,则其他应用程序可能已过期或存在其他问题。恢复这些服务很重要,并且可能需要进一步调试。

ArgoCD 应用程序缺失或降级

Automation Suite 诊断工具显示 ArgoCD 应用程序是否丢失和降级。

  • 如果缺少应用程序,请转到 ArgoCD 用户界面并进行同步。
  • 如果应用程序降级,则需要额外调试以调查 ArgoCD 引发的错误

此页面有帮助吗?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath Logo White
信任与安全
© 2005-2024 UiPath。保留所有权利。