- 概述
- 要求
- 安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 使用 Automation Suite 诊断工具
- 使用 Automation Suite 支持包工具
- 探索日志
使用 Automation Suite 诊断工具
当 Automation Suite 出现任何问题时,首先要使用 Automation Suite 诊断工具。 它会检查不同所需组件的运行状况,并提供综合报告。
supportability-tools
ZIP 文件并使用以下命令提取其内容:
curl "https://download.uipath.com/automation-suite/2021.10.3/supportability-tools-2021.10.3.zip" -o supportability-tools-2021.10.3.zip
unzip supportability-tools-2021.10.3.zip -d support-tools
bash diagnostics-report.sh
命令从 support-tools/diagnostics-tool/
文件夹运行 Automation Suite 诊断工具。
下表列出了 Automation Suite 诊断工具执行的检查。请注意,您可以在集群中的任何节点以及外部节点上运行该脚本。
节点 |
检查 |
---|---|
主节点 |
|
代理节点 |
|
外部计算机 |
注意:要从外部计算机运行脚本,请先为集群设置适当的
kubeconfig 上下文,然后将 -e 标志传递给脚本 bash diagnostics-report.sh -e 。
|
Automation Suite 诊断工具生成的示例报告。
如果这些服务关闭,则意味着节点已关闭。尝试使用 systemctl restart <service-name> 命令来重新启动服务,因为这应该可以解决问题。
/var/lib
中装载的目录大小,因为 Kubernetes 使用它来存储其数据。如果目录已满,则可能会出现各种问题。为防止出现这些问题,请确保增加其大小。
对于所有节点,我们指定它们是处于磁盘压力之下,还是内存压力之下。如果发生这种情况,这些节点上的工作负载可能会开始出现问题。检查这些节点上是否正在运行任何其他正在消耗资源的流程,如果是这种情况,请将其删除。
我们使用 Ceph 作为 S3 对象存储,用于存储来自不同应用程序的日志和文件。您可以查看其服务的状态。如果它们已关闭,则可能必须重新启动它们。请务必同时检查 Ceph 的磁盘使用情况是否已满。
由于某些服务要求集群中的某些节点存在 GPU,因此 Automation Suite 诊断工具会检查是否存在 GPU 节点并打印此类节点的数量。如果您期望 GPU 节点存在,但它们没有显示在此处,则意味着 GPU 设置中出现了问题。