- 概述
- 要求
- 安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 无法获取沙盒映像
- Pod 未显示在 ArgoCD 用户界面中
- Redis 探测器失败
- RKE2 服务器无法启动
- 在 UiPath 命名空间中找不到密码
- 初始安装后,ArgoCD 应用程序进入“进行中”状态
- MongoDB Pod 处于 CrashLoopBackOff 状态或在删除后处于“等待 PVC 配置”状态
- 意外错误:不一致;手动运行 fsck
- 集群还原后 MongoDB 或业务应用程序降级
- 缺少 Self-heal-operator 和 Sf-k8-utils 存储库
- 集群还原或回滚后服务不正常
- RabbitMQ Pod 卡在 CrashLoopBackOff 中
- Prometheus 处于 CrashLoopBackoff 状态,并出现内存不足 (OOM) 错误
- 监控仪表板中缺少 Ceph-rook 指标
- 使用 Automation Suite 诊断工具
- 使用 Automation Suite 支持包工具
- 探索日志
部署架构
要了解有关 Automation Suite 部署中使用的核心概念的更多信息,请参阅 词汇表。
Automation Suite 支持以下两种部署模式:
部署模式 |
描述 |
---|---|
单节点 — 评估 |
支持用于评估和演示。 |
多节点 — 生产(已启用 HA) |
支持用于生产。 您可以在部署后执行其他配置,以获得完整的 HA 功能。 |
有关如何选择最适合您需求的部署模式的更多详细信息,请参阅支持的单节点和多节点安装用例。
此页面提供对 Automation Suite 架构的深入了解,并描述捆绑到安装程序中的组件。
服务器节点托管集群管理服务(控制平面),这些服务执行重要的集群操作,例如工作负载编排、集群状态管理、负载均衡传入请求等。Kubernetes 还可以根据基础资源可用性运行一些 UiPath 产品和共享组件。
代理节点仅负责运行 UiPath 产品和共享组件。
专门代理节点运行特殊的工作负载,例如需要 GPU 功能的 Task Mining 分析和 Document Understanding 管道。但是,核心 Task Mining 和 Document Understanding 服务仍会在服务器或代理节点上运行。专用代理节点不托管任何 UiPath 产品或共享组件。
此处的单节点评估部署是指单服务器节点。这并不意味着在单台计算机上部署整个 Automation Suite。如果单个服务器节点无法搭载整个产品套件,或您想运行 Task Mining 分析和 Document understanding 管道等需使用 GPU 能力特殊任务,则可添加额外代理或专门的代理节点。
多节点 HA 就绪生产部署涉及负载均衡器后面的 3 个或更多服务器节点。这是为了确保在发生灾难时,如果任何服务器节点出现故障,自动化套件仍可用于执行关键业务工作流。代理节点的数量是可选的,具体视实际使用情况而定。
在多节点设置中,默认情况下启用高可用性 (HA)。但是,集群服务使用的基于 Redis 的内存缓存在单个 Pod 上运行,并且表示单点故障。为了减轻缓存节点故障或重新启动的影响,您可以购买高可用性插件 (HAA),它可以实现缓存的冗余多节点部署。
有关如何在多节点设置中启用 HAA 的更多详细信息,请参阅为集群启用 High Availability Add-on。
离线部署(离线)是完全隔离的设置,无法访问互联网。这种设置需要安装额外的注册表来存储所有 UiPath™ 产品的容器映像和二进制文件,需以 tar 包的形式提供这些映像和二进制文件。
与在线部署相比,将二进制文件(已填充数值)上传到注册表会带来更高的硬件要求,增加了与其他流程和安装时间相关的安装复杂性。离线安装不仅会增加安装过程的复杂性,还会增加集群管理操作,例如计算机维护、灾难恢复、升级到较新版本、应用安全补丁等。
不允许在安装后更改部署方法。这意味着如果在线完成安装,您将无法更改为离线模式,反之亦然。建议在仔细考虑后选择部署策略。
Automation Suite 安装程序捆绑了必需组件和可选组件。
下表列出了这些组件:
组件 |
可选/必填 |
描述 |
---|---|---|
RKE2 |
必填 |
Rancher 提供的 Kubernetes 发行版。它是运行所有架构组件和服务的容器编排平台。 |
Rancher Server |
必填 |
Rancher 的 Kubernetes 管理工具。 |
Longhorn |
必填 |
Rancher 为 Kubernetes 提供的分布式块存储。它有助于公开 Kubernetes 集群内的外部存储,以供工作负载声明和使用,如已装载的持久性存储。 |
CEPH 对象存储 |
必填 |
开源存储提供程序,可在 Longhorn 创建的持久卷之上公开符合 Amazon S3 的对象/Blob 存储。它使服务能够使用 Blob 存储等功能进行操作。 |
Argo CD |
必填 |
用于 Kubernetes 的开源声明性 CD 工具。它遵循 GitOps 模式,即使用 Git 存储库作为定义所需应用程序状态的事实来源。它为在 Kubernetes 集群中运行的 Automation Suite 组件和 UiPath 服务提供应用程序生命周期管理 (ALM) 功能。 |
Docker 注册表 |
必填 |
用于推送和拉取本地安装时和运行时容器映像的开源 Docker 注册表。 |
Istio |
必填 |
开源服务网格,可为 Kubernetes 集群内运行的微服务提供入口、请求路由、流量监控等功能。 |
Prometheus |
必填 |
Kubernetes 的开源系统监控工具包。它可以从 Kubernetes 组件以及在集群中运行的工作负载抓取或接受指标,并将其存储在时间序列数据库中。 |
Grafana |
必填 |
用于查询和可视化 Prometheus 中存储的数据的开源可视化工具。您可以创建和发布各种用于监控集群和服务的仪表板。 |
警示管理器 |
必填 |
帮助处理客户端应用程序(如 Prometheus 服务器)发送的警示的开源工具。它负责对数据进行重复数据删除、分组并将其路由到正确的接收器集成,例如电子邮件、PagerDuty 或 OpsGenie。 |
Redis |
必填 |
一些 UiPath 服务使用 Redis 企业版非 HA(单个分片)来获取集中式缓存功能。 |
RabbitMQ |
必填 |
一些 UiPath 服务使用开源可靠消息代理来实现异步执行模式。 |
MongoDB |
可选 |
MongoDB 是一个源代码可用的跨平台面向文档的数据库程序。MongoDB 属于 NoSQL 数据库程序,使用具有可选架构的类 JSON 文档。仅当已启用 Uipath Apps 时才会部署 MongoDB |
FluentD 和 Fluentbit |
必填 |
开源可靠的日志抓取解决方案。日志记录运算符在每个节点上部署并配置后台流程,以从节点文件系统收集容器和应用程序日志。 |
Gatekeeper |
必填 |
开源工具,可以帮助 Kubernetes 管理员实施策略以确保其集群中的合规性和最佳实践。 |