- 概述
- 要求
- 推荐:部署模板
- 手动:准备安装
- 手动:准备安装
- 步骤 1:为离线安装配置符合 OCI 的注册表
- 步骤 2:配置外部对象存储
- 步骤 3:配置 High Availability Add-on
- 步骤 4:配置 Microsoft SQL Server
- 步骤 5:配置负载均衡器
- 步骤 6:配置 DNS
- 步骤 7:配置内核和操作系统级别设置
- Step 8: Configuring the disks
- 步骤 9:配置节点端口
- 步骤 10:应用其他设置
- 步骤 12:验证并安装所需的 RPM 包
- 步骤 13:生成 cluster_config.json
- 证书配置
- 数据库配置
- 外部对象存储配置
- 预签名 URL 配置
- 符合 OCI 的外部注册表配置
- Disaster Recovery:主动/被动和主动/主动配置
- High Availability Add-on 配置
- 特定于 Orchestrator 的配置
- Insights 特定配置
- Process Mining 特定配置
- Document Understanding 特定配置
- Automation Suite Robot 特定配置
- 监控配置
- 可选:配置代理服务器
- 可选:在多节点 HA 就绪生产集群中启用区域故障恢复
- 可选:传递自定义 resolv.conf
- 可选:提高容错能力
- install-uipath.sh 参数
- 添加具有 GPU 支持的专用代理节点
- 为 Task Mining 添加专用代理节点
- 连接 Task Mining 应用程序
- 为 Automation Suite Robot 添加专用代理节点
- Step 15: Configuring the temporary Docker registry for offline installations
- Step 16: Validating the prerequisites for the installation
- 手动:执行安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
基本架构注意事项
As with any multi-site deployment, the primary architecture considerations for Automation Suite account for infrastructure, latency, data source, management, Recovery Time Objective, Recovery Point Objective, etc.
在设计主动/主动模型时,延迟至关重要。 它表示两个 Automation Suite 集群之间的往返时间 (RTT)。 两个站点之间的延迟级别越短越好,因为它可以大大降低中断期间数据丢失的风险。 RTT 必须低于 10 毫秒的阈值。
在进入生产阶段之前,您应该严格测试 RTT,因为它直接影响性能指标。 如果站点对之间的延迟超过 10 毫秒基准,我们建议考虑主动/被动设置,而不是主动/主动配置。
任何需要同步的组件的 RTT 均不得超过 10 毫秒。 这包括 SQL Server、HAA、对象存储等。
The two Automation Suite clusters are independent and do not share any configuration. Therefore, any management or maintenance activity must be done individually on these clusters. For instance, you must update the SQL connection strings on both clusters, configure certificates separately, etc. In addition, you must monitor the two clusters independently, upgrade them individually, etc.
对象存储与 SQL 数据库一起构成 Automation Suite 上已安装产品的状态。
SQL Server configuration plays a vital role in a multi-site deployment. Though SQL Server is a component external to Automation Suite, a few additional steps are required to ensure true HA when working with Automation Suite.
MultiSubnetFailover=True
属性。
有关更多详细信息,请参阅“始终开启”可用性组和“始终开启”可用性组的先决条件、限制和建议。
The external objectstore is immune to possible corruption due to node failure. Data replication and disaster recovery can be carried out independently of Automation Suite. Like SQL Server, the external objectstore must be configured in a highly available Disaster Recovery setup. The primary objectstore instance is physically located in the primary data center, and at least one secondary instance is located in the secondary data center with data sync enabled. You can configure a load balancer on the objectstore to ensure both Automation Suite clusters refer to the same endpoints. This makes the deployment independent of how the objectstore is configured internally.
对于 AWS S3,多区域访问点不支持 Automation Suite 中运行的所有产品所需的所有 s3 API。有关支持 API 列表的详细信息,请参阅将多区域接入点与受支持的 API 操作一起使用。
您可以在这两个区域中为每个产品/套件创建两个存储桶并启用同步。在同一区域中运行的 Automation Suite 集群将引用同一区域中的存储桶。
在设计多站点 Automation Suite 集群时,您组织的 RTO 策略至关重要。要实现所需的 RTO,请考虑以下方面:
- 流量管理器的设计;
- 辅助/被动集群中节点的可用性;
- 辅助集群上的动态工作负载可用性,例如,ML 技能;
- 配置管理。
要释放两个集群的全部潜力,适当配置流量管理器至关重要。 理想情况下,设置应有助于将流量分配到两个集群。 此策略不仅可确保均衡的负载分布,还可保障业务连续性,从而在任一站点完全关闭时减少任何潜在的中断。
一些产品(例如 AI Center)会在运行时动态部署 ML 技能。另一个集群中的技能部署始终为异步。这不能保证它们的可用性。为确保您的自动化解决方案在所需时间内恢复在线,您可以定期同步另一个集群中的技能。
Since multi-site Automation Suite deployments consist of two distinct clusters, any operation performed on any cluster must be performed on the other cluster in time to reduce the drift. This ensures that both clusters possess similar configurations and that no additional effort is required during recovery.
在设计多站点 Automation Suite 集群时,您组织的恢复点目标 (RTO) 策略至关重要。要实现所需的 RPO,必须考虑以下方面:
- 数据同步;
- 计划的备份。
When written to the primary data source, data must also be synced to the secondary cluster. However, there is a risk of data loss when the data center is down, and data is not synced. Exemplary network configurations, such as high bandwidth and low latency between the two data centers, can speed up synchronization.
并非所有 Disaster Recovery 都可以完全防止数据丢失。但是,您可以部署定期备份策略,以最大程度地减少灾难对数据恢复的影响。有关详细信息,请参阅备份和还原集群。