- 概述
- 要求
- 安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 无法获取沙盒映像
- Pod 未显示在 ArgoCD 用户界面中
- Redis 探测器失败
- RKE2 服务器无法启动
- 在 UiPath 命名空间中找不到密码
- 初始安装后,ArgoCD 应用程序进入“进行中”状态
- MongoDB Pod 处于 CrashLoopBackOff 状态或在删除后处于“等待 PVC 配置”状态
- 意外错误:不一致;手动运行 fsck
- 集群还原后 MongoDB 或业务应用程序降级
- 缺少 Self-heal-operator 和 Sf-k8-utils 存储库
- 集群还原或回滚后服务不正常
- RabbitMQ Pod 卡在 CrashLoopBackOff 中
- Prometheus 处于 CrashLoopBackoff 状态,并出现内存不足 (OOM) 错误
- 监控仪表板中缺少 Ceph-rook 指标
- 使用 Automation Suite 诊断工具
- 使用 Automation Suite 支持包工具
- 探索日志
评估存储需求
Automation Suite 集群使用连接到其服务器节点的数据磁盘作为集群上启用的所有产品可用的存储资源。 每个产品都以不同的方式使用这些资源。
要了解您的存储需求并相应地进行规划,请参阅以下术语和准则。
-
服务器节点磁盘大小 – 连接到每个服务器节点的 所有 单个磁盘的大小。
- 所有服务器必须连接相同数量的磁盘。
- 只要所有服务器上所有磁盘大小的总和相同,每台服务器上的磁盘可能具有不同的大小。
- 集群磁盘总大小 – 服务器节点磁盘大小乘以服务器节点数。
-
应用程序可用存储 – 可供应用程序使用的存储量。
- 由于 Automation Suite 集群中实现故障恢复和高可用性的方式,应用程序可用存储小于集群磁盘总大小。
下表在前面介绍的术语的上下文中描述了 基本 配置文件和 完整 配置文件的多节点 HA 就绪硬件要求。
预设硬件配置 |
服务器节点数 |
服务器节点磁盘大小 |
集群磁盘总大小 |
应用程序可用存储 (在线) |
应用程序可用存储 (离线) |
---|---|---|---|---|---|
3 |
512 GiB |
1.5 TiB |
41 GiB |
37 GiB | |
3 |
2 TiB |
6 TiB |
291 GiB |
286 GiB |
要利用 291 GiB 可用存储,您必须将 PVC 值的大小调整为 291 GiB,而不是预配置的 100 GiB 值。否则,您的应用程序将无法利用超过 100 GiB 的空间。
有关说明,请参阅 调整 PVC 大小。
当您在集群上启用和使用产品时,它们会使用应用程序可用存储中的一些存储。 产品通常具有较小的启用占用空间,以及一些依赖于使用情况的占用空间,这些占用空间因用例、使用规模和项目而异。 存储消耗量均匀分布在所有存储资源(数据磁盘)中,您可以使用 Automation Suite 监控堆栈监控存储利用率水平。
Automation Suite 集群使用称为“持久卷”的内部 Kubernetes 概念作为内部抽象,用于表示集群上所有节点上的磁盘。
为避免出现不稳定情况,建议设置监控和警示,以不断检查持久卷上的可用空间是否低于应用程序可用存储值。 有关更多详细信息,请参阅 监控持久卷。
如果触发警示,您可以通过增加集群的存储容量来缓解警示,如下节所述。
如果您评估的需求不满足建议的硬件要求,则可以使用以下一种或两种方法添加更多存储容量:
- 添加更多具有磁盘的服务器节点。 有关说明,请参阅 向集群添加新节点。
-
向现有节点添加更多磁盘。 有关说明,请参阅 在单节点评估环境中 扩展数据磁盘和在多节点 HA 就绪生产环境中扩展数据磁盘。
重要提示:每需要 60 GiB 的产品特定存储,Automation Suite 集群就需要在集群上的总可用存储空间中额外增加 1 TiB 存储空间,并在服务器节点上平均分配这些存储空间。
您可以使用下表中的产品特定指标估计存储消耗量。 这些表格描述了您可以在集群上放置多少开箱即用的内容。 作为参考,它们包括每个产品的典型使用场景的存储占用空间。
基本产品选择
产品 |
存储驱动指标 |
每个指标的存储空间 |
典型用例 |
---|---|---|---|
Orchestrator |
|
|
通常情况下,包大小为 5 MiB,存储桶(如有)小于 1 MiB。成熟的企业部署 5 GiB 的包和 6 GiB 的存储桶。 |
Action Center |
|
|
通常情况下,一个文档需要 0.15 MiB,要填写的表单会额外占用 0.15 KiB。在成熟的企业中,总计可累积至 4GiB。 |
Test Manager |
|
|
通常,所有文件和附件加起来约为 5 GiB。 |
Insights |
|
|
启用需要 2 GiB,存储占用空间会随着数量的增加而增加。非常成熟的企业级部署还需要一些 GiB 用于所有仪表板。 |
Automation Hub |
不适用 |
不适用 |
2 GiB 固定占用空间 |
Automation Ops |
不适用 |
不适用 |
无存储空间 |
完成产品选择
产品 |
存储驱动指标 |
每个指标的存储空间 |
典型用例 |
---|---|---|---|
Apps |
|
|
通常情况下,数据库大约需要 5 GiB,而典型的复杂应用程序大约需要 15 MiB。 |
AI Center |
|
|
典型的已完成安装将针对 5 个包消耗 8 GiB,另外针对数据集消耗 1 GiB。 管道可能会额外消耗 50 GiB,但前提是处于主动运行状态。 |
Document Understanding |
|
|
在成熟的部署中,12GiB 将用于 ML 模型,17GiB 用于 OCR,50GiB 用于存储的所有文档。 |
Task Mining |
|
|
通常,应分析约 200GiB 的活动日志数据,以推荐有意义的自动化。但是,高度重复的任务可能需要更少的数据。 |