automation-suite
2022.10
false
- 概述
- 要求
- 安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 无法获取沙盒映像
- Pod 未显示在 ArgoCD 用户界面中
- Redis 探测器失败
- RKE2 服务器无法启动
- 在 UiPath 命名空间中找不到密码
- ArgoCD 在首次安装后进入“进行中”状态
- 意外不一致;手动运行 fsck
- MongoDB Pod 处于 CrashLoopBackOff 状态或在删除后处于“等待 PVC 配置”状态
- MongoDB Pod 从 4.4.4-ent 升级到 5.0.7-ent 失败
- 集群还原或回滚后服务运行状况不佳
- Pod 在 Init:0/X 中卡住
- Prometheus 处于 CrashLoopBackoff 状态,并出现内存不足 (OOM) 错误
- 监控仪表板中缺少 Ceph-rook 指标
- Pod 无法在代理环境中与 FQDN 通信
- AI Center 技能部署问题
- 在还原集群上启用 AI Center
- 访问 AI Center 时出现未知错误
- 使用 Automation Suite 诊断工具
- 使用 Automation Suite 支持包工具
- 探索日志
AI Center 技能部署问题
重要 :
请注意此内容已使用机器翻译进行了部分本地化。
Automation Suite 安装指南
Last updated 2024年11月4日
AI Center 技能部署问题
有时,首次部署模型时,DU 模型技能部署可能会间歇性地失败,并显示“无法列出部署”或“未知错误”。解决方法是再次尝试部署模型。第二次部署会更快,因为大多数映像构建的部署工作都会在第一次尝试期间完成。首次部署 DU 模型大约需要 1 到 1.5 个小时,再次部署时会更快。
在极少数情况下,由于集群状态,技能部署或包上传等异步操作可能会停留很长时间。如果 DU 技能部署需要耗费超过 2 到 3 个小时,请尝试部署更简单的模型(例如模板模型)。如果部署该模型也需要耗费一个小时以上,则缓解措施是使用以下命令重新启动 AI Center 服务:
kubectl -n uipath rollout restart deployment ai-deployer-deployment
kubectl -n uipath rollout restart deployment ai-trainer-deployment
kubectl -n uipath rollout restart deployment ai-pkgmanager-deployment
kubectl -n uipath rollout restart deployment ai-helper-deployment
kubectl -n uipath rollout restart deployment ai-appmanager-deployment
kubectl -n uipath rollout restart deployment ai-deployer-deployment
kubectl -n uipath rollout restart deployment ai-trainer-deployment
kubectl -n uipath rollout restart deployment ai-pkgmanager-deployment
kubectl -n uipath rollout restart deployment ai-helper-deployment
kubectl -n uipath rollout restart deployment ai-appmanager-deployment
使用以下命令进行验证,等待 AI Center Pod 重新启动:
kubectl -n uipath get pods | grep ai-*
kubectl -n uipath get pods | grep ai-*
以上所有 Pod 都应处于“正在运行”状态,并且容器状态应显示为 2/2。