automation-suite
2023.10
false
- 概述
- 要求
- 推荐:部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 1:为离线安装配置符合 OCI 的注册表
- 步骤 2:配置外部对象存储
- 步骤 3:配置 High Availability Add-on
- 步骤 4:配置 Microsoft SQL Server
- 步骤 5:配置负载均衡器
- 步骤 6:配置 DNS
- 步骤 7:配置磁盘
- 步骤 8:配置内核和操作系统级别设置
- 步骤 9:配置节点端口
- 步骤 10:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- 步骤 13:生成 cluster_config.json
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- install-uipath.sh 参数
- 添加具有 GPU 支持的专用代理节点
- 为 Task Mining 添加专用代理节点
- 连接 Task Mining 应用程序
- 为 Automation Suite Robot 添加专用代理节点
- 步骤 15:为离线安装配置临时 Docker 注册表
- 步骤 16:验证安装的先决条件
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 如何在安装过程中对服务进行故障排除
- 如何卸载集群
- 如何清理离线工件以改善磁盘空间
- 如何清除 Redis 数据
- 如何启用 Istio 日志记录
- 如何手动清理日志
- 如何清理存储在 sf-logs 存储桶中的旧日志
- 如何禁用 AI Center 的流日志
- 如何对失败的 Automation Suite 安装进行调试
- 如何在升级后从旧安装程序中删除映像
- 如何禁用 TX 校验和卸载
- 如何从 Automation Suite 2022.10.10 和 2022.4.11 升级到 2023.10.2
- 如何手动将 ArgoCD 日志级别设置为 Info
- 如何扩展 AI Center 存储
- 如何为外部注册表生成已编码的 pull_secret_value
- 如何解决 TLS 1.2 中的弱密码问题
- 单节点升级在结构阶段失败
- 从 2021.10 自动升级后,集群运行状况不佳
- 由于 Ceph 运行状况不佳,升级失败
- 由于空间问题,RKE2 未启动
- 卷无法装载,且仍处于附加/分离循环状态
- 由于 Orchestrator 数据库中的传统对象,升级失败
- 并行升级后,发现 Ceph 集群处于降级状态
- Insights 组件运行状况不佳导致迁移失败
- Apps 服务升级失败
- 就地升级超时
- Docker 注册表迁移卡在 PVC 删除阶段
- 升级到 2023.10 或更高版本后 AI Center 配置失败
- 在离线环境中升级失败
- 升级期间 SQL 验证失败
- 快照-控制器-crds Pod 在升级后处于 CrashLoopBackOff 状态
- Longhorn REST API 端点升级/重新安装错误
- 运行诊断工具
- 使用 Automation Suite 支持捆绑包
- 探索日志
如何在安装过程中对服务进行故障排除
Linux 版 Automation Suite 安装指南
Last updated 2024年12月3日
如何在安装过程中对服务进行故障排除
在其中一个集群服务器节点上执行以下步骤:
-
获取 Kubernetes 访问权限。
on server nodes: export KUBECONFIG="/etc/rancher/rke2/rke2.yaml" export PATH="$PATH:/usr/local/bin:/var/lib/rancher/rke2/bin" on agent nodes: export KUBECONFIG="/var/lib/rancher/rke2/agent/kubelet.kubeconfig" export PATH="$PATH:/usr/local/bin:/var/lib/rancher/rke2/bin" # To validate, execute the following command which should not return an error: kubectl get nodes
on server nodes: export KUBECONFIG="/etc/rancher/rke2/rke2.yaml" export PATH="$PATH:/usr/local/bin:/var/lib/rancher/rke2/bin" on agent nodes: export KUBECONFIG="/var/lib/rancher/rke2/agent/kubelet.kubeconfig" export PATH="$PATH:/usr/local/bin:/var/lib/rancher/rke2/bin" # To validate, execute the following command which should not return an error: kubectl get nodes -
通过运行以下命令检索 ArgoCD 密码:
kubectl get secrets/argocd-admin-password -n argocd --template '{{ .data.password }}' | base64 -d
kubectl get secrets/argocd-admin-password -n argocd --template '{{ .data.password }}' | base64 -d - 连接到 ArgoCD。
- 导航到
https://alm.<fqdn>/:443
。 - 使用
admin
作为用户名,以及在步骤 2 中获得的密码进行登录。 - 找到 UiPath 服务应用程序,如下所示:
- 使用 ArgoCD 中提供的搜索栏,键入
uipath
。 - 然后单击其卡打开 UiPath™ 应用程序。
- 检查以下内容:
Application was not synced due to a failed job/pod
。 - 如果存在上述错误,请执行以下步骤。
- 通过查找红色的心碎图标来找到任何未同步的组件,如下图所示。
- 打开最右侧的组件(通常是 Pod),然后单击“日志”选项卡。日志将包含一条错误消息,指明 Pod 失败的原因。
- 解决任何未解决的配置问题后,请返回主页并单击 UiPath™ 应用程序上的“同步”按钮。