- 概述
- 要求
- 推荐:部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 1:为离线安装配置符合 OCI 的注册表
- 步骤 2:配置外部对象存储
- 步骤 3:配置 High Availability Add-on
- 步骤 4:配置 SQL 数据库
- 步骤 5:配置负载均衡器
- 步骤 6:配置 DNS
- 步骤 7:配置磁盘
- 步骤 8:配置内核和操作系统级别设置
- 步骤 9:配置节点端口
- 步骤 10:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- 步骤 13:生成 cluster_config.json
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- install-uipath.sh 参数
- 添加具有 GPU 支持的专用代理节点
- 为 Task Mining 添加专用代理节点
- 连接 Task Mining 应用程序
- 为 Automation Suite Robot 添加专用代理节点
- 步骤 15:为离线安装配置临时 Docker 注册表
- 步骤 16:验证安装的先决条件
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 如何在安装过程中对服务进行故障排除
- 如何卸载集群
- 如何清理离线工件以改善磁盘空间
- 如何清除 Redis 数据
- 如何启用 Istio 日志记录
- 如何手动清理日志
- 如何清理存储在 sf-logs 存储桶中的旧日志
- 如何禁用 AI Center 的流日志
- 如何对失败的 Automation Suite 安装进行调试
- 如何在升级后从旧安装程序中删除映像
- 如何禁用 TX 校验和卸载
- 如何从 Automation Suite 2022.10.10 和 2022.4.11 升级到 2023.10.2
- 如何手动将 ArgoCD 日志级别设置为 Info
- 如何扩展 AI Center 存储
- 如何为外部注册表生成已编码的 pull_secret_value
- 如何解决 TLS 1.2 中的弱密码问题
- 如何使用证书
- 如何将应用程序日志转发到 Splunk
- 如何从注册表 Pod 中清理未使用的 Docker 映像
- 升级 Automation Suite 后重新安装或升级 Insights 时丢失数据
- 单节点升级在结构阶段失败
- 从 2021.10 自动升级后,集群运行状况不佳
- 由于 Ceph 运行状况不佳,升级失败
- 由于空间问题,RKE2 未启动
- 卷无法装载,且仍处于附加/分离循环状态
- 由于 Orchestrator 数据库中的传统对象,升级失败
- 并行升级后,发现 Ceph 集群处于降级状态
- Insights 组件运行状况不佳导致迁移失败
- Apps 服务升级失败
- 就地升级超时
- Docker 注册表迁移卡在 PVC 删除阶段
- 升级到 2023.10 或更高版本后 AI Center 配置失败
- 在离线环境中升级失败
- 升级期间 SQL 验证失败
- 快照-控制器-crds Pod 在升级后处于 CrashLoopBackOff 状态
- Longhorn REST API 端点升级/重新安装错误
- 由于 Insights PVC 大小被覆盖,升级失败
- 使用 Process Mining 运行高可用性
- 使用 Kerberos 登录时 Process Mining 挖掘失败
- 在 Disaster Recovery 后,DAPR 无法正常用于 Process Mining
- 无法使用 pyodbc 格式连接字符串连接到 AutomationSuite_ProcessMining_Warehouse 数据库
- Airflow 安装失败,并显示 sqlalchemy.exc.ArgumentError:无法从字符串“”中解析 rfc1738 URL
- 如何添加 IP 表格规则以使用 SQL Server 端口 1433
- 运行 CData Sync 的服务器不信任 Automation Suite 证书
- 运行诊断工具
- 使用 Automation Suite 支持捆绑包
- 探索日志
- 探索汇总遥测

Linux 版 Automation Suite 安装指南
基本架构注意事项
与任何多站点部署一样,Automation Suite 的主要架构注意事项涉及基础架构、延迟、数据源、管理、恢复时间目标、恢复点目标等。
在设计主动/主动模型时,延迟至关重要。它表示两个 Automation Suite 集群之间的往返时间 (RTT)。两个站点之间的延迟级别越短越好,因为它可以大大降低中断期间数据丢失的风险。RTT 必须低于 10 毫秒的阈值。
在进入生产阶段之前,您应该严格测试 RTT,因为它直接影响性能指标。如果站点对之间的延迟超过 10 毫秒基准,我们建议考虑主动/被动设置,而不是主动/主动配置。
任何需要同步的组件的 RTT 均不得超过 10 毫秒。这包括 SQL Server、HAA、对象存储等。
两个 Automation Suite 集群相互独立,不共享任何配置。因此,必须在这些集群上单独完成任何管理或维护活动。例如,您必须更新两个集群上的 SQL 连接字符串,并且单独配置证书等。此外,您必须独立监控两个集群,并且单独升级它们等。
对象存储与 SQL 数据库一起构成 Automation Suite 上已安装产品的状态。
SQL Server 配置在多站点部署中起着至关重要的作用。尽管 SQL Server 是 Automation Suite 的外部组件,但在使用 Automation Suite 时,还需要一些其他步骤以确保真正的 HA。
MultiSubnetFailover=True
属性。
有关更多详细信息,请参阅“始终开启”可用性组和“始终开启”可用性组的先决条件、限制和建议。
外部对象存储不会因节点故障而可能发生损坏。数据复制和 Disaster Recovery 可以独立于 Automation Suite 执行。与 SQL Server 一样,必须在高可用性 Disaster Recovery 设置中配置外部对象存储。主对象存储实例在实际位于主数据中心,并且至少一个辅助实例位于辅助数据中心且已启用数据同步。您可以在对象存储上配置负载均衡器,以确保两个 Automation Suite 集群引用相同的端点。这使得部署独立于对象存储的内部配置方式。
对于 AWS S3,多区域访问点不支持 Automation Suite 中运行的所有产品所需的所有 s3 API。有关支持 API 列表的详细信息,请参阅将多区域接入点与受支持的 API 操作一起使用。
您可以在这两个区域中为每个产品/套件创建两个存储桶并启用同步。在同一区域中运行的 Automation Suite 集群将引用同一区域中的存储桶。
在设计多站点 Automation Suite 集群时,您组织的 RTO 策略至关重要。要实现所需的 RTO,请考虑以下方面:
- 流量管理器的设计;
- 辅助/被动集群中节点的可用性;
- 辅助集群上的动态工作负载可用性,例如,ML 技能;
- 配置管理。
要释放两个集群的全部潜力,适当配置流量管理器至关重要。理想情况下,设置应有助于将流量分配到两个集群。此策略不仅可确保均衡的负载分布,还可保障业务连续性,从而在任一站点完全关闭时减少任何潜在的中断。
一些产品(例如 AI Center)会在运行时动态部署 ML 技能。另一个集群中的技能部署始终为异步。这不能保证它们的可用性。为确保您的自动化解决方案在所需时间内恢复在线,您可以定期同步另一个集群中的技能。
在设计多站点 Automation Suite 集群时,您组织的恢复点目标 (RTO) 策略至关重要。要实现所需的 RPO,必须考虑以下方面:
- 数据同步;
- 计划的备份。
并非所有 Disaster Recovery 都可以完全防止数据丢失。但是,您可以部署定期备份策略,以最大程度地减少灾难对数据恢复的影响。有关详细信息,请参阅备份和还原集群。