- 概述
- 要求
- 部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 2:为离线安装配置符合 OCI 的注册表
- 步骤 3:配置外部对象存储
- 步骤 4:配置 High Availability Add-on
- 步骤 5:配置 SQL 数据库
- 步骤 6:配置负载均衡器
- 步骤 7:配置 DNS
- 步骤 8:配置磁盘
- 步骤 9:配置内核和操作系统级别设置
- 步骤 10:配置节点端口
- 步骤 11:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- 步骤 13:生成 cluster_config.json
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- Kerberos 身份验证配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- install-uipath.sh 参数
- 添加具有 GPU 支持的专用代理节点
- 为 Task Mining 添加专用代理节点
- 连接 Task Mining 应用程序
- 为 Automation Suite Robot 添加专用代理节点
- 步骤 15:为离线安装配置临时 Docker 注册表
- 步骤 16:验证安装的先决条件
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 如何在安装过程中对服务进行故障排除
- 如何卸载集群
- 如何清理离线工件以改善磁盘空间
- 如何清除 Redis 数据
- 如何启用 Istio 日志记录
- 如何手动清理日志
- 如何清理存储在 sf-logs 存储桶中的旧日志
- 如何禁用 AI Center 的流日志
- 如何对失败的 Automation Suite 安装进行调试
- 如何在升级后从旧安装程序中删除映像
- 如何禁用 TX 校验和卸载
- 如何从 Automation Suite 2022.10.10 和 2022.4.11 升级到 2023.10.2
- 如何手动将 ArgoCD 日志级别设置为 Info
- 如何扩展 AI Center 存储
- 如何为外部注册表生成已编码的 pull_secret_value
- 如何解决 TLS 1.2 中的弱密码问题
- 如何使用证书
- 如何将应用程序日志转发到 Splunk
- 如何从注册表 Pod 中清理未使用的 Docker 映像
- 如何使用集群内对象存储 (Ceph) 收集 DU 使用情况数据
- 如何在离线环境中安装 RKE2 SELinux
- 如何清理 NFS 服务器上的旧差异备份
- 升级 Automation Suite 后重新安装或升级 Insights 时丢失数据
- 单节点升级在结构阶段失败
- 从 2021.10 自动升级后,集群运行状况不佳
- 由于 Ceph 运行状况不佳,升级失败
- 由于空间问题,RKE2 未启动
- 卷无法装载,且仍处于附加/分离循环状态
- 由于 Orchestrator 数据库中的传统对象,升级失败
- 并行升级后,发现 Ceph 集群处于降级状态
- Insights 组件运行状况不佳导致迁移失败
- Apps 服务升级失败
- 就地升级超时
- Docker 注册表迁移卡在 PVC 删除阶段
- 升级到 2023.10 或更高版本后 AI Center 配置失败
- 在离线环境中升级失败
- 升级期间 SQL 验证失败
- 快照-控制器-crds Pod 在升级后处于 CrashLoopBackOff 状态
- Longhorn REST API 端点升级/重新安装错误
- 由于 Insights PVC 大小被覆盖,升级失败
- 预服务脚本执行期间服务升级失败
- 使用 Process Mining 运行高可用性
- 使用 Kerberos 登录时 Process Mining 挖掘失败
- 在 Disaster Recovery 后,DAPR 无法正常用于 Process Mining
- 在集群模式下使用 Redis 配置 Dapr
- 无法使用 pyodbc 格式连接字符串连接到 AutomationSuite_ProcessMining_Warehouse 数据库
- Airflow 安装失败,并显示 sqlalchemy.exc.ArgumentError:无法从字符串“”中解析 rfc1738 URL
- 如何添加 IP 表格规则以使用 SQL Server 端口 1433
- 运行 CData Sync 的服务器不信任 Automation Suite 证书
- 运行诊断工具
- 使用 Automation Suite 支持捆绑包
- 探索日志
Linux 版 Automation Suite 安装指南
在执行 Automation Suite 安装之前,必须使用 LVM 对磁盘进行分区和配置,以便您可以轻松更改其大小,而不会迁移任何数据或丢失数据。
分区磁盘
RHEL 计算机上的默认分区结构不适合安装 Kubernetes。这是因为 Kubernetes 基础架构通常安装在 /var 分区下,而默认情况下,系统仅会分配给该分区 8 GB 的空间。
- 支持的磁盘格式为
ext4或xfs。 - 您必须使用 LVM 创建所有分区,以确保集群数据可以驻留在不同的磁盘上,但仍然能够以一致的方式查看。这也有助于将来扩展分区大小,而无需担心数据迁移或丢失。
- 所有 Pod 和应用程序日志都存储在
/var/log/pods目录下。 确保此目录的容量至少为 8 GB。 我们还建议配置logrotate,使其按每天到每周的间隔轮换日志。
在线和离线安装的磁盘要求相同,不同之处在于解压缩离线 UiPath™ 捆绑包需要额外的空间。
对于 RHEL 操作系统,您需要确保计算机上的装载点不小于以下数据。
| 磁盘标签 | 服务器 | 代理 | 分区 | 大小 | 用途 |
|---|---|---|---|---|---|
| 集群磁盘 | ✅ | ✅ |
| 190GB | 存储容器映像和层。 |
|
| 56GB | 存储运行时 Kubernetes 配置,例如密码、配置映射和空目录。 | |||
|
| 10 GB | 存储安装程序二进制文件。 | |||
| etcd 磁盘 | ✅ | ❌ |
| 16GB | 存储 Kubernetes 的分布式数据库 |
| 块存储 | ✅ | ❌ |
| 15GB | 对于 Insights 为必要项。 |
|
| 50 GB | 对于监控工具为必要项。 | |||
/datadisk/registry 1 | 200GB | 对于 Docker 注册表为必要项。 | |||
/datadisk/objectstore 2 | 10 GB | 对于 ceph-mon 为必要项。 | |||
| 对象存储2 | ✅ | ❌ | 不适用 | 512 GB | 对于集群内对象存储为必需。 |
| AI Center3 | ✅ | ✅ | 不适用 | 1 个训练管道至少需要51 GB ,建议使用105 GB 。 | 仅在安装 AI Center 时才为必要项。 |
| UiPath™ 捆绑包磁盘 | ✅ | ❌ | /uipath | 512 GB | 仅用于离线安装,用于存储离线捆绑包 |
1集群内 Docker 注册表,如果您使用外部注册表,则不适用。
2这指的是集群内对象存储,如果您使用外部对象存储,则不适用。
3指 AI Center 训练管道所需的存储空间。仅在计划运行 AI Center 训练管道的计算机和专用 Task Mining 节点上才需要磁盘。我们建议在代理计算机上附加此磁盘。
我们建议您不要将操作系统磁盘用于上述任何目的,以确保流程获得其应有的资源份额。
使用脚本配置磁盘
下载脚本
您可以使用 configureUiPathDisks.sh 脚本对磁盘进行配置和分区。
有关下载说明,请参阅configureUiPathDisks.sh 。
运行脚本
您可以将 configureUiPathDisks.sh 脚本用于以下目的:
- 为新的 Automation Suite 集群安装配置磁盘和装载点;
- 安装后调整数据磁盘的大小。
要使脚本可执行,请运行以下命令:
chmod +x ./configureUiPathDisks.sh
chmod +x ./configureUiPathDisks.sh
有关脚本用法的更多详细信息,请运行以下命令:
sudo ./configureUiPathDisks.sh --help
sudo ./configureUiPathDisks.sh --help
在所有计算机上配置集群磁盘
要配置集群磁盘,请在所有计算机上运行以下命令:
./configureUiPathDisks.sh --cluster-disk-name name_of_cluster_disk
./configureUiPathDisks.sh --cluster-disk-name name_of_cluster_disk
在所有服务器计算机上配置 etcd 磁盘
要配置 etcd 磁盘,请在所有服务器计算机上运行以下命令:
./configureUiPathDisks.sh --etcd-disk-name name_of_etcd_disk
./configureUiPathDisks.sh --etcd-disk-name name_of_etcd_disk
只有在完成集群磁盘配置后,才能执行 etcd 磁盘配置。
必须保留配置顺序,因为 etcd 磁盘已装载到集群磁盘中。
如果在配置集群磁盘之前执行此步骤,则可能会导致计算机重新启动后数据丢失,因为内核会按顺序自动装载磁盘(首先装载集群磁盘,然后再装载 etcd 磁盘)。
在所有服务器计算机上配置数据磁盘
要配置数据磁盘,您必须确定要使用的特定磁盘。运行lsblk命令以列出所有块储存设备、其大小和装载点。使用磁盘大小来标识相关磁盘(对于--volume标志,应使用 512 GB 的数据磁盘)。
在所有服务器计算机上运行以下命令,并根据您的要求提供必要的标志:
./configureUiPathDisks.sh --volume name_of_data_disk
./configureUiPathDisks.sh --volume name_of_data_disk
| 标记 | 值 |
|---|---|
-v | --volume |
--docker-registry | 可选。仅在外部注册表不可用时才需要。 |
--monitoring | 可选。如果在首次运行执行期间未传递该标志,则系统会自动创建用于监控(Prometheus 存储空间)的分区。但是,在后续运行中,在调整监控分区大小期间,需要该标志以及 --resize 标志。 |
--objectstore | 可选。仅在外部对象存储不可用时才需要。 |
--insights | 可选。如果在首次运行执行期间未传递该标志,则会自动为 Insights 创建分区。但是,在后续运行中,在调整 Insights 分区大小期间,需与 --resize 标志一起使用。 |
--resize <int> | 可选。如果提供了整数值,则在有足够的可用空间的情况下,系统会调整所选组件的大小。否则,将使用整个磁盘来扩展所选分区。必须精确指明一个必须调整大小的分区。 |
--robot-package-cache | Automation Suite Robot 节点上用于下载包进行缓存的位置的路径。 此操作必须仅在 Automation Suite Robot 节点上执行。 |
您还可以在--resize标志的帮助下使用命令调整所选分区的大小,如以下示例所示:
./configureUiPathDisks.sh --volume /dev/sde --docker-registry --resize 300
./configureUiPathDisks.sh --volume /dev/sde --docker-registry --resize 300
此示例演示如何将/dev/sde磁盘附加到现有数据磁盘,以及如何将 Docker 注册表分区的大小调整为 300 GB。
在所有服务器计算机上配置对象存储磁盘
仅当外部对象存储不可用时,才需要执行此步骤。
您可以通过在所有服务器节点上运行以下脚本来添加集群内对象存储或扩展集群内对象存储的存储大小:
./configureUiPathDisks.sh --ceph-raw-disk-name name_ceph_raw_disk
./configureUiPathDisks.sh --ceph-raw-disk-name name_ceph_raw_disk
- Azure 中存在一个已知问题,即错误地将 Azure 磁盘标记为非 SSD。如果 Azure 是您的云提供商,并且您要配置对象存储磁盘,请按照故障排除中的说明进行操作。
- 不支持对现有磁盘进行垂直扩展。要在安装后增大集群内存储的大小,请添加新的原始磁盘。
在选定的计算机上配置 AI Center 磁盘
要配置 AI Center 磁盘,请在计划执行训练管道的计算机上运行以下命令:
./configureUiPathDisks.sh --aicenter-disk-name name_of_aicenter_disk_to_partition
./configureUiPathDisks.sh --aicenter-disk-name name_of_aicenter_disk_to_partition
要扩展 AI Center 的存储,请执行以下操作:
- 如果要添加新的 AI Center 磁盘,请在计划添加磁盘的计算机上运行以下命令:
./configureUiPathDisks.sh --aicenter-storage-extend name_of_new_aicenter_disk_to_attach./configureUiPathDisks.sh --aicenter-storage-extend name_of_new_aicenter_disk_to_attach - 如果您已扩展现有的 AI Center 磁盘,请在已扩展的基础 AI Center 磁盘的计算机上运行以下命令:
./configureUiPathDisks.sh --aicenter-storage-extend./configureUiPathDisks.sh --aicenter-storage-extend
为 Automation Suite Robot 包缓存配置托管磁盘
对于没有专用 Automation Suite Robot 代理的单节点设置,需要执行此步骤。
要在服务器节点上托管 Automation Suite Robot 包缓存,您需要创建至少 10 GB 的磁盘:
./configureUiPathDisks.sh --volume name_of_data_disk --robot-package-cache
./configureUiPathDisks.sh --volume name_of_data_disk --robot-package-cache
建议由 LVM 备份磁盘。
在第一个服务器节点上为集群内注册表配置捆绑磁盘
需在以下情况下执行此步骤:
- 执行离线安装时;
- 外部注册表不可用时。
要配置捆绑包磁盘,请仅在第一个服务器节点上运行以下命令:
./configureUiPathDisks.sh --bundle-disk-name name_of_bundle_disk
./configureUiPathDisks.sh --bundle-disk-name name_of_bundle_disk
验证磁盘安装
确保将所有装载点添加到 fstab 文件中,并在这些 fstab 条目中加入 nofail 选项,以便在发生故障时不会影响虚拟机启动。
要验证 /etc/fstab 是否已正确配置并且可以处理系统重新启动,请执行以下步骤,运行以下命令:
mount -afv
mount -afv
您应该获得以下输出:
# Servers
/datadisk/monitoring : already mounted
/datadisk/insights : already mounted
/var/lib/rancher/rke2/server/db : already mounted
# Servers or agents
/opt/UiPathAutomationSuite : already mounted
/var/lib/rancher : already mounted
/var/lib/kubelet : already mounted
# In case of an offline environment, only on the primary server node
/uipath : already mounted
# Additional mount point is require if customer is installing offline with internal registry
/datadisk/registry : already mounted
# Additional mount point is require if customer is using in-cluster objectstore
/datadisk/objectstore : already mounted
# Servers
/datadisk/monitoring : already mounted
/datadisk/insights : already mounted
/var/lib/rancher/rke2/server/db : already mounted
# Servers or agents
/opt/UiPathAutomationSuite : already mounted
/var/lib/rancher : already mounted
/var/lib/kubelet : already mounted
# In case of an offline environment, only on the primary server node
/uipath : already mounted
# Additional mount point is require if customer is installing offline with internal registry
/datadisk/registry : already mounted
# Additional mount point is require if customer is using in-cluster objectstore
/datadisk/objectstore : already mounted