AI Center
2020.10
False
横幅背景图像
AI Center
上次更新日期 2024年3月11日

AI Center 常规故障排除和常见问题解答

问题:正在检查连接中阻止的配置作业

配置作业可能会卡在Connection checking in progress中。

解决方案

要解决此问题,请按照以下步骤操作:

  1. 退出日志并检查连接检查程序 Pod kubectl get pods的状态。
  2. 如果您看到显示的“ 图像名称无效” ,请尝试描述 Pod: kubectl describe <conn-checked-pod-name>
  3. 如果“事件”(底部)中显示“ 应用默认图像失败..” 消息,这可能意味着同时存在离线和非离线:
    1. 检查基础架构和应用程序是否安装在同一个 Pod 上。
    2. 检查许可证是否相同。 检查yaml文件中的离线字段,查看其是否为 true,以及是否符合预期。
  4. 如果问题出在许可证上,则需要从后端进行更改。 请联系许可证提供者或 AI Center 团队,请他们更改许可证。

问题:主机管理员页面错误

如果出现主机管理页面错误(租户配置错误),请使用以下解决方案。

解决方案

确保 Orchestrator 和 AI Center 虚拟机上的系统时间同步,包括夏令时。 如果系统时间未同步,Identity Server 提供的令牌可能是未来一小时后的时间。

消息:Kubectl 获取 Pod -A |已逐出 Grep

如果由于上述错误消息而导致大量 Pod 被逐出,则可能会降低计算机速度或导致网络问题。 要解决此问题,请使用以下解决方案。

解决方案

要解决此问题,请运行以下脚本或类似脚本:

IFS=$'\)
'
for line in $(kubectl get pods -A | awk {'printf "%s,%s,%s\)
", $1,$2,$4'} | grep -E "Evicted"); do 
  ns=$(echo $line | cut -d',' -f1)
  pod=$(echo $line | cut -d',' -f2)
  kubectl delete pod -n $ns $pod
doneIFS=$'\)
'
for line in $(kubectl get pods -A | awk {'printf "%s,%s,%s\)
", $1,$2,$4'} | grep -E "Evicted"); do 
  ns=$(echo $line | cut -d',' -f1)
  pod=$(echo $line | cut -d',' -f2)
  kubectl delete pod -n $ns $pod
done

预测期间有关 ML 技能的问题

如果要在调用 Pod 时监控 Pod 的进度,则需要识别与技能对应的 Pod,然后连接到 Linux 计算机,以便在执行预测时检查日志。 有关执行此操作的最有效方法,请查看下面的“ 解决方案 ”部分。

解决方案

要以最有效的方式识别与技能对应的 Pod,请按照以下步骤操作。

  1. 转到 AI Center 应用程序。
  2. 转到“ ML 技能 ” 页面。
  3. 在检查页面时打开网络调用。
  4. 刷新网格以获取 ML 技能。
  5. 找到 ML 技能调用并进行预览。
  6. 在列表中找到正确的 ML 技能,然后搜索租户 ID 和 ID。 租户 ID 是命名空间,也是 Pod 名称。


  7. 获得上述信息后,请使用以下命令检查运行日志:
    kubectl -n <tenant-id> logs -f <id>kubectl -n <tenant-id> logs -f <id>

您现在可以调用该技能并实时查看流程。

管道运行时出现问题

由于文件上传失败,管道发生故障,并显示类似于以下内容的错误消息:

2021-04-30 20:59:43,397 - uipath_core.storage.local_storage_client:upload:132 - ERROR:  Failed to upload file: logs/f5f7b9f4-0813-4107-a269-bf65de12444f/train.log.20210430205938 to bucket: training-8319b955-6187-43c3-a46f-612a9ea6f523, error: can't start new thread
2021-04-30 20:59:48,401 - uipath_core.utils.utils:_retries:172 - WARNING:  Function: upload execution failed, retry count 12021-04-30 20:59:43,397 - uipath_core.storage.local_storage_client:upload:132 - ERROR:  Failed to upload file: logs/f5f7b9f4-0813-4107-a269-bf65de12444f/train.log.20210430205938 to bucket: training-8319b955-6187-43c3-a46f-612a9ea6f523, error: can't start new thread
2021-04-30 20:59:48,401 - uipath_core.utils.utils:_retries:172 - WARNING:  Function: upload execution failed, retry count 1

解决方案

升级到更新的 AI Center 版本 (2021.4、 例如)修复了此问题的位置。

如果目前无法解决升级问题,请使用以下命令删除训练 Pod 中的日志:

kubectl -n <namespace> exec -it <pod_id> -- sh -c 'rm -rf /microservice/trainer_run_logs'kubectl -n <namespace> exec -it <pod_id> -- sh -c 'rm -rf /microservice/trainer_run_logs'

在上述命令中,使用了以下变量:

  • namespace - Pod 的命名空间。 这可以通过运行kubectl get namespaces命令来获取。 训练命名空间以training-开头。
  • pod_id - 训练 Pod 的 Pod ID。 这可以通过在上述训练空间中运行kubectl get pod来实现。

消息:./export.sh:Line 2: &dollar;'\r': 无法找到命令

运行导入或导出脚本时,可能会出现以下错误消息:

./export.sh: line 2: $'\r': command not found

使用脚本导入或导出 ML 包时,会显示此错误消息。

解决方案

在运行导入或导出脚本之前运行以下命令:

dos2unix <filename>dos2unix <filename>

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.