automation-suite
2022.4
false
- 概述
- 要求
- 安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 无法获取沙盒映像
- Pod 未显示在 ArgoCD 用户界面中
- Redis 探测器失败
- RKE2 服务器无法启动
- 在 UiPath 命名空间中找不到密码
- 初始安装后,ArgoCD 应用程序进入“进行中”状态
- MongoDB Pod 处于 CrashLoopBackOff 状态或在删除后处于“等待 PVC 配置”状态
- 意外错误:不一致;手动运行 fsck
- 集群还原后 MongoDB 或业务应用程序降级
- 缺少 Self-heal-operator 和 Sf-k8-utils 存储库
- 集群还原或回滚后服务不正常
- RabbitMQ Pod 卡在 CrashLoopBackOff 中
- Prometheus 处于 CrashLoopBackoff 状态,并出现内存不足 (OOM) 错误
- 监控仪表板中缺少 Ceph-rook 指标
- Pod 无法在代理环境中与 FQDN 通信
- 使用 Automation Suite 诊断工具
- 使用 Automation Suite 支持包工具
- 探索日志
添加具有 GPU 支持的专用代理节点
重要 :
请注意此内容已使用机器翻译进行了部分本地化。
Automation Suite 安装指南
Last updated 2024年11月4日
添加具有 GPU 支持的专用代理节点
备注:
Automation Suite 当前仅支持 NVIDIA GPU 驱动程序。请参阅支持 GPU 的操作系统列表。
有关特定于云的实例类型的更多信息,请参阅以下内容:
在添加具有 GPU 支持的专用代理节点之前,请确保检查硬件要求。
有关如何在 GPU 上部署 NVIDIA CUDA 的更多示例,请查看此 页面。
备注:
-
以下说明适用于在线和离线 Automation Suite 安装。对于离线安装,您必须确保临时互联网访问,以检索所需的 GPU 驱动程序依赖项。如果在安装 GPU 驱动程序时遇到问题,请联系 NVIDIA 支持团队。
-
GPU 驱动程序存储在
/opt/nvidia
和/usr
文件夹下。强烈建议在 GPU 代理计算机上,这些文件夹的大小应分别至少为5 GiB和15 GiB。
验证驱动程序是否已正确安装
在节点上运行
sudo nvidia-smi
命令以验证驱动程序是否已正确安装。
注意:配置集群后,需要执行其他步骤来配置已配置的 GPU。
此时,GPU 驱动程序已安装,并且 GPU 节点已添加到集群中。
请按照以下步骤配置计算机,以确保磁盘分区正确且满足所有网络要求。
在线安装
- 通过 SSH 连接到 GPU 节点。
-
运行以下命令:
sudo su - cd /opt/UiPathAutomationSuite chmod -R 755 /opt/UiPathAutomationSuite yum install unzip jq -y CONFIG_PATH=/opt/UiPathAutomationSuite/cluster_config.json UNATTENDED_ACTION="accept_eula,download_bundle,extract_bundle,join_gpu" ./installUiPathAS.sh
sudo su - cd /opt/UiPathAutomationSuite chmod -R 755 /opt/UiPathAutomationSuite yum install unzip jq -y CONFIG_PATH=/opt/UiPathAutomationSuite/cluster_config.json UNATTENDED_ACTION="accept_eula,download_bundle,extract_bundle,join_gpu" ./installUiPathAS.sh
离线安装
- 通过 SSH 连接到 GPU 专用节点。
-
使用以下脚本在 GPU 专用节点上安装平台捆绑包:
sudo su mv /var/tmp/UiPathAutomationSuite /opt cd /opt/UiPathAutomationSuite chmod -R 755 /opt/UiPathAutomationSuite ./install-uipath.sh -i ./cluster_config.json -o ./output.json -k -j gpu --offline-bundle ./sf-infra.tar.gz --offline-tmp-folder /opt/UiPathAutomationSuite/tmp --install-offline-prereqs --accept-license-agreement
sudo su mv /var/tmp/UiPathAutomationSuite /opt cd /opt/UiPathAutomationSuite chmod -R 755 /opt/UiPathAutomationSuite ./install-uipath.sh -i ./cluster_config.json -o ./output.json -k -j gpu --offline-bundle ./sf-infra.tar.gz --offline-tmp-folder /opt/UiPathAutomationSuite/tmp --install-offline-prereqs --accept-license-agreement