- 概述
- 要求
- 安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 无法获取沙盒映像
- Pod 未显示在 ArgoCD 用户界面中
- Redis 探测器失败
- RKE2 服务器无法启动
- 在 UiPath 命名空间中找不到密码
- ArgoCD 在首次安装后进入“进行中”状态
- 意外不一致;手动运行 fsck
- MongoDB Pod 处于 CrashLoopBackOff 状态或在删除后处于“等待 PVC 配置”状态
- MongoDB Pod 从 4.4.4-ent 升级到 5.0.7-ent 失败
- 集群还原或回滚后服务运行状况不佳
- Pod 在 Init:0/X 中卡住
- Prometheus 处于 CrashLoopBackoff 状态,并出现内存不足 (OOM) 错误
- 监控仪表板中缺少 Ceph-rook 指标
- Pod 无法在代理环境中与 FQDN 通信
- 使用 Automation Suite 诊断工具
- 使用 Automation Suite 支持包工具
- 探索日志
部署架构
For more information on the core concepts used in an Automation Suite deployment, refer to Glossary.
Automation Suite 支持以下两种部署模式:
部署模式 |
描述 |
---|---|
单节点 — 评估 |
支持用于评估和演示。 |
多节点 — 生产(已启用 HA) |
支持用于生产。 您可以在部署后执行其他配置,以获得完整的 HA 功能。 |
有关如何选择最适合您需求的部署模式的更多详细信息,请参阅支持的单节点和多节点安装用例。
此页面提供对 Automation Suite 架构的深入了解,并描述捆绑到安装程序中的组件。
服务器节点托管集群管理服务(控制平面),这些服务执行重要的集群操作,例如工作负载编排、集群状态管理、负载均衡传入请求等。Kubernetes 还可以根据基础资源可用性运行一些 UiPath™ 产品和共享组件。
代理节点仅负责运行 UiPath™ 产品和共享组件。
专用代理节点运行特殊工作负载,例如 Task Mining 分析、需要 GPU 功能的 Document Understanding 管道或 Automation Suite Robot。但是,核心 Task Mining、Document Understanding 或 Automation Suite 机器人服务仍会在服务器或代理节点上运行。专用代理节点不托管任何 UiPath™ 产品或共享组件。
此处的单节点评估部署是指单服务器节点。这并不意味着在单台计算机上部署整个 Automation Suite。如果单个服务器节点无法搭载整个产品套件,或您想运行 Task Mining 分析和 Document understanding 管道等需使用 GPU 能力特殊任务,则可添加额外代理或专门的代理节点。
多节点 HA 就绪生产部署涉及负载均衡器后面的 3 个或更多服务器节点。这是为了确保在发生灾难时,如果任何服务器节点出现故障,自动化套件仍可用于执行关键业务工作流。代理节点的数量是可选的,具体视实际使用情况而定。
在多节点设置中,默认情况下启用高可用性 (HA)。但是,集群服务使用的基于 Redis 的内存缓存在单个 Pod 上运行,并且表示单点故障。为了减轻缓存节点故障或重新启动的影响,您可以购买高可用性插件 (HAA),它可以实现缓存的冗余多节点部署。
有关如何在多节点设置中启用 HAA 的更多详细信息,请参阅为集群启用 High Availability Add-on。
离线部署(离线)是完全隔离的设置,无法访问互联网。这种设置需要安装额外的注册表来存储所有 UiPath™ 产品的容器映像和二进制文件,需以 tar 包的形式提供这些映像和二进制文件。
Uploading binaries (hydration) to the registry introduces additional hardware requirements and installation complexity, increasing the time required to perform an installation as compared to an online deployment.
An offline installation increases not only the complexity during installation, but also the cluster management operations like machine maintenance, disaster recovery, upgrading to newer versions, applying security patches, etc.
不允许在安装后更改部署方法。这意味着如果在线完成安装,您将无法更改为离线模式,反之亦然。建议在仔细考虑后选择部署策略。
Automation Suite 安装程序捆绑了必需组件和可选组件。
下表列出了这些组件:
组件 |
可选/必填 |
描述 |
---|---|---|
RKE2 |
必填 |
Rancher 提供的 Kubernetes 发行版。它是运行所有架构组件和服务的容器编排平台。 |
Rancher Server |
必填 |
Rancher 的 Kubernetes 管理工具。 |
Longhorn |
必填 |
Rancher 为 Kubernetes 提供的分布式块存储。它有助于公开 Kubernetes 集群内的外部存储,以供工作负载声明和使用,如已装载的持久性存储。 |
CEPH 对象存储 |
如果您有外部对象存储,则为可选项 |
开源存储提供程序,可在 Longhorn 创建的持久卷之上公开符合 Amazon S3 的对象/Blob 存储。它使服务能够使用 Blob 存储等功能进行操作。 |
Argo CD |
必填 |
用于 Kubernetes 的开源声明性 CD 工具。它遵循 GitOps 模式,即使用 Git 存储库作为定义所需应用程序状态的事实来源。它为在 Kubernetes 集群中运行的 Automation Suite 组件和 UiPath 服务提供应用程序生命周期管理 (ALM) 功能。 |
Docker 注册表 |
必填 |
用于推送和拉取本地安装时和运行时容器映像的开源 Docker 注册表。 |
Istio |
必填 |
开源服务网格,可为 Kubernetes 集群内运行的微服务提供入口、请求路由、流量监控等功能。 |
Prometheus |
必填 |
Kubernetes 的开源系统监控工具包。它可以从 Kubernetes 组件以及在集群中运行的工作负载抓取或接受指标,并将其存储在时间序列数据库中。 |
Grafana |
必填 |
用于查询和可视化 Prometheus 中存储的数据的开源可视化工具。您可以创建和发布各种用于监控集群和服务的仪表板。 |
警示管理器 |
必填 |
帮助处理客户端应用程序(如 Prometheus 服务器)发送的警示的开源工具。它负责对数据进行重复数据删除、分组并将其路由到正确的接收器集成,例如电子邮件、PagerDuty 或 OpsGenie。 |
Redis |
必填 |
一些 UiPath 服务使用 Redis 企业版非 HA(单个分片)来获取集中式缓存功能。 |
RabbitMQ |
必填 |
一些 UiPath 服务使用开源可靠消息代理来实现异步执行模式。 |
MongoDB |
可选 |
MongoDB 是一个源代码可用的跨平台面向文档的数据库程序。MongoDB 属于 NoSQL 数据库程序,使用具有可选架构的类 JSON 文档。仅当已启用 Uipath Apps 时才会部署 MongoDB |
FluentD 和 Fluentbit |
必填 |
开源可靠的日志抓取解决方案。日志记录运算符在每个节点上部署并配置后台流程,以从节点文件系统收集容器和应用程序日志。 |
Gatekeeper |
必填 |
开源工具,可以帮助 Kubernetes 管理员实施策略以确保其集群中的合规性和最佳实践。 |