- 概述
- 要求
- 推荐:部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 1:为离线安装配置符合 OCI 的注册表
- 步骤 2:配置外部对象存储
- 步骤 3:配置 High Availability Add-on
- 步骤 4:配置 Microsoft SQL Server
- 步骤 5:配置负载均衡器
- 步骤 6:配置 DNS
- 步骤 7:配置磁盘
- 步骤 8:配置内核和操作系统级别设置
- 步骤 9:配置节点端口
- 步骤 10:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- 步骤 13:生成 cluster_config.json
- Cluster_config.json 示例
- 常规配置
- 配置文件配置
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- ArgoCD 配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- AI Center 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- 添加具有 GPU 支持的专用代理节点
- 为 Task Mining 添加专用代理节点
- 连接 Task Mining 应用程序
- 为 Automation Suite Robot 添加专用代理节点
- 步骤 15:为离线安装配置临时 Docker 注册表
- 步骤 16:验证安装的先决条件
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 升级 Automation Suite 后重新安装或升级 Insights 时丢失数据
- 升级到 Automation Suite 2024.10.0 后无法访问 Automation Hub
- 单节点升级在结构阶段失败
- 由于 Ceph 运行状况不佳,升级失败
- 由于空间问题,RKE2 未启动
- 卷无法装载,且仍处于附加/分离循环状态
- 由于 Orchestrator 数据库中的传统对象,升级失败
- 并行升级后,发现 Ceph 集群处于降级状态
- Insights 组件运行状况不佳导致迁移失败
- Apps 服务升级失败
- 就地升级超时
- Docker 注册表迁移卡在 PVC 删除阶段
- 升级到 2023.10 或更高版本后 AI Center 配置失败
- 在离线环境中升级失败
- 升级期间 SQL 验证失败
- 快照-控制器-crds Pod 在升级后处于 CrashLoopBackOff 状态
- 由于 Insights PVC 大小被覆盖,升级失败
- 无法升级到 Automation Suite 2024.10.1
- 使用 Process Mining 运行高可用性
- 使用 Kerberos 登录时 Process Mining 挖掘失败
- 在 Disaster Recovery 后,DAPR 无法正常用于 Process Mining
- 无法使用 pyodbc 格式连接字符串连接到 AutomationSuite_ProcessMining_Warehouse 数据库
- Airflow 安装失败,并显示 sqlalchemy.exc.ArgumentError:无法从字符串“”中解析 rfc1738 URL
- 如何添加 IP 表格规则以使用 SQL Server 端口 1433
- 运行 CData Sync 的服务器不信任 Automation Suite 证书
- 运行诊断工具
- 使用 Automation Suite 支持捆绑包
- 探索日志

Automation Suite on Linux installation guide
步骤 7:配置磁盘
在执行 Automation Suite 安装之前,必须使用 LVM 对磁盘进行分区和配置,以便您可以轻松更改其大小,而不会迁移任何数据或丢失数据。
/var
分区下,而默认情况下,系统仅会分配给该分区 8 GB 的空间。
- 支持的磁盘格式为
ext4
或xfs
。 - 您必须使用 LVM 创建所有分区,以确保集群数据可以驻留在不同的磁盘上,但仍然能够以一致的方式查看。这也有助于将来扩展分区大小,而无需担心数据迁移或丢失。
- 所有 Pod 和应用程序日志都存储在
/var/log/pods
目录下。 确保此目录的容量至少为 8 GB。 我们还建议配置logrotate
,使其按每天到每周的间隔轮换日志。 -
如果将单节点 RKE2 设置与集群内存储一起使用,则必须提供至少 512 GB 的额外磁盘空间,用于存储 Ceph 数据备份。 有关详细信息,请参阅如何计划 Ceph 备份和还原数据。
在线和离线安装的磁盘要求相同,不同之处在于解压缩离线 UiPath™ 捆绑包需要额外的空间。
对于 RHEL 操作系统,您需要确保计算机上的装载点不小于以下数据。
磁盘标签 |
服务器 |
代理 |
分区 |
大小 |
用途 |
---|---|---|---|---|---|
集群磁盘 |
|
|
|
190GB 备注:
如果启用 Document Understanding 新式项目,则最小大小为400 GB 。 |
存储容器映像和层。 |
|
56GB |
存储运行时 Kubernetes 配置,例如密码、配置映射和空目录。 | |||
|
10 GB |
存储安装程序二进制文件。 | |||
etcd 磁盘 |
|
|
|
16GB |
存储 Kubernetes 的分布式数据库 |
数据磁盘 |
|
|
|
15GB |
对于 Insights 为必要项。 |
|
50 GB |
对于监控工具为必要项。 | |||
/datadisk/registry 1 |
200GB |
对于 Docker 注册表为必要项。 | |||
/datadisk/objectstore 2 |
10 GB |
对于 ceph-mon 为必要项。 | |||
对象存储2 |
|
|
不适用 | 512 GB |
对于集群内对象存储为必需。 |
AI Center3 |
|
|
不适用 |
1 个训练管道至少需要51 GB ,建议使用105 GB 。 |
仅在安装 AI Center 时才为必要项。 |
UiPath™ 捆绑包磁盘 |
|
| /uipath | 512 GB |
仅用于离线安装,用于存储离线捆绑包 |
Ceph 备份 |
|
| /backup | 512 GB | 仅对于具有集群内存储的单节点 RKE2 设置是必需的,用于存储 Ceph 数据备份。 |
2这指的是集群内对象存储,如果您使用外部对象存储,则不适用。
3指 AI Center 训练管道所需的存储空间。仅在计划运行 AI Center 训练管道的计算机和专用 Task Mining 节点上才需要磁盘。我们建议在代理计算机上附加此磁盘。
We recommend that you do not use OS disk for any of the previous purposes, to ensure processes get their fair share of resources.
uipathctl
。
uipathctl
是as-installer.zip
安装包的一部分。 要使用uipathctl
,请执行以下步骤:
-
下载
as-installer.zip
并将其保存到临时位置。 有关下载说明,请参阅as-installer.zip 。 -
通过运行以下命令提取内容:
unzip as-installer.zip -d installer
unzip as-installer.zip -d installer
uipathctl
配置磁盘的详细信息,请运行以下命令: ./bin/uipathctl rke2 disk --help
./bin/uipathctl rke2 disk --help
要配置集群磁盘,请在所有计算机上运行以下命令:
./bin/uipathctl rke2 disk --cluster-disk-name name_of_cluster_disk
./bin/uipathctl rke2 disk --cluster-disk-name name_of_cluster_disk
要配置 etcd 磁盘,请在所有服务器计算机上运行以下命令:
./bin/uipathctl rke2 disk --etcd-disk-name name_of_etcd_disk
./bin/uipathctl rke2 disk --etcd-disk-name name_of_etcd_disk
要配置数据磁盘,请在所有服务器计算机上运行以下命令,并根据您的要求提供必要的标志:
./bin/uipathctl rke2 disk --volume name_of_data_disk
./bin/uipathctl rke2 disk --volume name_of_data_disk
标记 |
值 |
---|---|
|
磁盘名称示例:
/dev/sde 对托管用于监控、Insights、对象存储和注册表的各种装载的磁盘进行分区时,您需要磁盘名称。 首次配置磁盘时,必须提供磁盘名称。如果在后续运行期间未提供名称,则与
uipathdatavg 关联的任何现有磁盘都用于为所选组件创建分区。
|
|
可选。仅在外部注册表不可用时才需要。 |
|
可选标志。 监控分区(Prometheus 存储)是必需的,因此,即使在首次运行执行期间未明确传递该标志,系统也会自动创建监控分区。 但是,在后续运行中,在调整监控分区大小期间,需要该标志以及
--size 标志。
|
| |
|
可选标志。 即使在首次运行执行期间未明确传递该标志,系统也会自动创建 Insights 分区。 在安装基础架构时需要配置 Insights 存储,以便您在安装后启用 Insights。 但是,在后续运行中,在调整 Insights 分区大小期间,需要该标志以及
--size 标志。
|
|
可选。如果提供了整数值,则在有足够的可用空间的情况下,系统会调整所选组件的大小。否则,将使用整个磁盘来扩展所选分区。必须精确指明一个必须调整大小的分区。 备注:
在磁盘配置期间,不需要
--size 选项。 可在配置后使用此操作以扩展磁盘大小。
|
|
Automation Suite Robot 节点上用于下载包进行缓存的位置的路径。 此操作必须仅在 Automation Suite Robot 节点上执行。 |
--size
标志的帮助下使用命令调整所选分区的大小,如以下示例所示:
./bin/uipathctl rke2 disk --docker-registry --size 300
./bin/uipathctl rke2 disk --docker-registry --size 300
仅当外部对象存储不可用时,才需要执行此步骤。
您可以通过在所有服务器节点上运行以下脚本来添加集群内对象存储或扩展集群内对象存储的存储大小:
./bin/uipathctl rke2 disk --ceph-raw-disk-name name_ceph_raw_disk
./bin/uipathctl rke2 disk --ceph-raw-disk-name name_ceph_raw_disk
-
Azure 中存在一个已知问题,即错误地将 Azure 磁盘标记为非 SSD。如果 Azure 是您的云提供商,并且您要配置对象存储磁盘,请按照故障排除中的说明进行操作。
-
不支持对现有磁盘进行垂直扩展。要在安装后增大集群内存储的大小,请添加新的原始磁盘。
要配置 AI Center 磁盘,请在计划执行训练管道的计算机上运行以下命令:
./bin/uipathctl rke2 disk --aicenter-disk-name name_of_aicenter_disk_to_partition
./bin/uipathctl rke2 disk --aicenter-disk-name name_of_aicenter_disk_to_partition
要扩展 AI Center 的存储,请执行以下操作:
-
如果要添加新的 AI Center 磁盘,请在计划添加磁盘的计算机上运行以下命令:
./bin/uipathctl rke2 disk --aicenter-storage-extend name_of_new_aicenter_disk_to_attach
./bin/uipathctl rke2 disk --aicenter-storage-extend name_of_new_aicenter_disk_to_attach -
如果您已扩展现有的 AI Center 磁盘,请在已扩展的基础 AI Center 磁盘的计算机上运行以下命令:
./bin/uipathctl rke2 disk --aicenter-storage-extend
./bin/uipathctl rke2 disk --aicenter-storage-extend
对于没有专用 Automation Suite Robot 代理的单节点设置,需要执行此步骤。
要在服务器节点上托管 Automation Suite Robot 包缓存,您需要创建至少 10 GB 的磁盘:
./bin/uipathctl rke2 disk --volume name_of_data_disk --robot-package-cache
./bin/uipathctl rke2 disk --volume name_of_data_disk --robot-package-cache
fstab
文件中,并在这些 fstab
条目中加入 nofail
选项,以便在发生故障时不会影响虚拟机启动。
/etc/fstab
是否已正确配置并且可以处理系统重新启动,请执行以下步骤,运行以下命令:
mount -afv
mount -afv
您应该获得以下输出:
/var/lib/rancher : already mounted
/var/lib/kubelet : already mounted
/opt/UiPathAutomationSuite : already mounted
/datadisk/monitoring : already mounted
/datadisk/insights : already mounted
/var/lib/rancher/rke2/server/db : already mounted
# Additional mount point is require if customer is installing offline with internal registry
/datadisk/registry : already mounted
# Additional mount point is require if customer is using in-cluster objectstore
/datadisk/objectstore : already mounted
/var/lib/rancher : already mounted
/var/lib/kubelet : already mounted
/opt/UiPathAutomationSuite : already mounted
/datadisk/monitoring : already mounted
/datadisk/insights : already mounted
/var/lib/rancher/rke2/server/db : already mounted
# Additional mount point is require if customer is installing offline with internal registry
/datadisk/registry : already mounted
# Additional mount point is require if customer is using in-cluster objectstore
/datadisk/objectstore : already mounted