automation-suite
2023.10
true
- 概述
- 要求
- 推荐:部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 1:为离线安装配置符合 OCI 的注册表
- 步骤 2:配置外部对象存储
- 步骤 3:配置 High Availability Add-on
- 步骤 4:配置 Microsoft SQL Server
- 步骤 5:配置负载均衡器
- 步骤 6:配置 DNS
- 步骤 7:配置磁盘
- 步骤 8:配置内核和操作系统级别设置
- 步骤 9:配置节点端口
- 步骤 10:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- 步骤 13:生成 cluster_config.json
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- install-uipath.sh 参数
- 添加具有 GPU 支持的专用代理节点
- 为 Task Mining 添加专用代理节点
- 连接 Task Mining 应用程序
- 为 Automation Suite Robot 添加专用代理节点
- 步骤 15:为离线安装配置临时 Docker 注册表
- 步骤 16:验证安装的先决条件
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 如何在安装过程中对服务进行故障排除
- 如何卸载集群
- 如何清理离线工件以改善磁盘空间
- 如何清除 Redis 数据
- 如何启用 Istio 日志记录
- 如何手动清理日志
- 如何清理存储在 sf-logs 捆绑包中的旧日志
- 如何禁用 AI Center 的流日志
- 如何对失败的 Automation Suite 安装进行调试
- 如何在升级后从旧安装程序中删除映像
- 如何禁用 TX 校验和卸载
- 如何从 Automation Suite 2022.10.10 和 2022.4.11 升级到 2023.10.2
- 如何手动将 ArgoCD 日志级别设置为 Info
- 如何扩展 AI Center 存储
- 如何为外部注册表生成已编码的 pull_secret_value
- 如何解决 TLS 1.2 中的弱密码问题
- 运行诊断工具
- 使用 Automation Suite 支持包工具
- 探索日志
无法在对象存储中上传或下载数据
Linux 版 Automation Suite 安装指南
Last updated 2024年10月4日
无法在对象存储中上传或下载数据
当对象存储由于置放群组 (PG) 不一致而处于降级状态时,可能会发生此问题。
通过运行以下命令,验证问题是否确实与 rook-ceph PG 不一致有关:
export KUBECONFIG=/etc/rancher/rke2/rke2.yaml PATH=$PATH:/var/lib/rancher/rke2/bin
ROOK_CEPH_TOOLS=$(kubectl -n rook-ceph get pods | grep rook-ceph-tools)
kubectl -n rook-ceph exec -it $ROOK_CEPH_TOOLS -- ceph status
export KUBECONFIG=/etc/rancher/rke2/rke2.yaml PATH=$PATH:/var/lib/rancher/rke2/bin
ROOK_CEPH_TOOLS=$(kubectl -n rook-ceph get pods | grep rook-ceph-tools)
kubectl -n rook-ceph exec -it $ROOK_CEPH_TOOLS -- ceph status
如果问题与 rook-ceph PG 不一致有关,则输出将包含以下消息:
....
....
Possible data damage: X pgs inconsistent
....
....
X active+clean+inconsistent
....
....
....
....
Possible data damage: X pgs inconsistent
....
....
X active+clean+inconsistent
....
....
要修复不一致的 PG,请执行以下步骤:
-
执行到 rook-ceph 工具:
kubectl -n rook-ceph exec -it $ROOK_CEPH_TOOLS -- sh
kubectl -n rook-ceph exec -it $ROOK_CEPH_TOOLS -- sh -
触发 rook-ceph 垃圾收集器流程。等待该流程完成。
radosgw-admin gc process
radosgw-admin gc process -
查找包含
active+clean+inconsistent
个 PG 的列表:ceph health detail # output of this command be like # .... # pg <pg-id> is active+clean+inconsistent, acting .. # pg <pg-id> is active+clean+inconsistent, acting .. # .... #
ceph health detail # output of this command be like # .... # pg <pg-id> is active+clean+inconsistent, acting .. # pg <pg-id> is active+clean+inconsistent, acting .. # .... # -
一次触发一个对 PG 的深度清理。此命令需要几分钟才能运行,具体取决于 PG 大小。
ceph pg deep-scrub <pg-id>
ceph pg deep-scrub <pg-id> -
观察清理状态:
ceph -w | grep <pg-id>
ceph -w | grep <pg-id> -
检查 PG 清理状态。如果 PG 清理成功,则 PG 状态应为
active+clean+inconsistent
。ceph health detail | grep <pg-id>
ceph health detail | grep <pg-id> -
修复 PG:
ceph pg repair <pg-id>
ceph pg repair <pg-id> -
检查 PG 修复状态。如果成功修复 PG,则应从
active+clean+inconsistent
列表中删除 PG ID。ceph health detail | grep <pg-id>
ceph health detail | grep <pg-id> - 对其余不一致的 PG 重复步骤 3 到 8。