- 概述
- 要求
- 安装
- 安装后
- 迁移和升级
- 监控和警示
- 集群管理
- 特定于产品的配置
- 故障排除
EKS/AKS 上的 Automation Suite 安装指南
Kubernetes 集群和节点
您可以从 Azure 或 AWS 引入自己的 Kubernetes 集群,并按照标准实践进行配置和管理。Automation Suite 需要具有集群管理员权限的专用集群,因为它部署整个 UiPath™ Business Platform,并且包含许多 UiPath™ 产品,而这些产品又包含许多微服务。
每个 Automation Suite 长期支持版本都附带一个兼容性矩阵。 有关兼容的 EKS 或 AKS 版本,请参阅 兼容性矩阵。
我们测试了 Automation Suite 与以下 Linux 操作系统的兼容性:
云提供程序 | 操作系统 |
---|---|
AKS |
|
EKS |
|
要根据您的产品和规模要求估计节点容量,请使用 UiPath Automation Suite 安装大小调整计算器。
代理(工作器)节点的根卷要求为 256 GB。
要开始使用必需的平台服务(身份、许可和路由)和 Orchestrator,您必须为每个节点配置 8 个 vCPU 和 16 GB RAM。
由于稳定性和性能问题,我们不建议在生产场景中使用 Automation Suite 中的点实例。
在安装 Automation Suite 之前,您必须禁用交换内存。已知交换内存会导致容器工作负载出现问题。此外,Automation Suite 工作负载不会从使用交换内存中受益,并且 Kubernetes 已优化内存使用情况。
如果安装 Task Mining,则必须配置其他具有 20 vCPU 和 60 GB RAM 的工作线程节点。 必须污染此节点,以确保仅在其上运行 Task Mining 工作负载。 有关详细信息,请参阅 节点计划 部分。
Automation Suite Robot 需要其他工作线程节点。
Automation Suite Robot 节点的硬件要求取决于您计划使用资源的方式。除了其他代理节点要求外,您还需要至少 10 GiB 的空间才能启用包缓存。
有关详细信息,请参阅存储文档。
以下部分介绍了影响 Automation Suite Robot 节点所需硬件数量的因素。
下表描述了所有机器人规格所需的 CPU、内存和存储。
大小 |
CPU |
内存 |
存储 |
---|---|---|---|
小 |
0.5 |
1 GiB |
1 GiB |
标准 |
1 |
2 GiB |
2 GiB |
中 |
2 |
4 GiB |
4 GiB |
大 |
6 |
10 GiB |
10 GiB |
Automation Suite Robot 代理节点的资源会影响可并发运行的作业数量。原因是作业的 CPU/内存要求需要使用 CPU 内核数和 RAM 容量。
例如,具有 16 个 CPU 和 32 GiB RAM 的节点将能够运行以下任何内容:
- 32 个小型作业
- 16 个标准作业
- 8 个中型作业
- 2 个大型作业
作业规格可以混合使用,因此在任何给定时刻,同一节点都可以运行作业组合,如下所示:
- 10 个小型作业(消耗 5 个 CPU 和 10 GiB 内存)
- 4 个标准作业 (消耗 4 个 CPU 和 8 GiB 内存)
- 3 个中型作业 (消耗 6 个 CPU 和 12 GiB 内存)
鉴于节点是 Kubernetes 集群的一部分,服务器上的 Kubernetes 代理 (kubelet) 会消耗少量资源。根据我们的测量结果,kubelet 会使用以下资源:
- 0.6 个 CPU
- 0.4 GiB RAM
与先前描述的节点类似的节点实际上具有大约 15.4 个 CPU 和 31.6 GiB RAM。
默认情况下,所有跨平台流程的“Automation Suite Robots”选项都设置为“自动”。此设置会选择适当的计算机规格,以使用 Serverless Robot 运行流程。
自动选择规格时,系统会按顺序评估下表中列出的条件。只要满足一个标准,就会选择相应的计算机规格,并且不会再评估其余标准。
顺序 |
条件 |
计算机规格 |
---|---|---|
1 |
[远程调试作业] |
中 |
2 |
流程视用户界面自动化而定 或 |
标准 |
3 |
其他 Unattended 流程 |
小 |
为了提高性能,您可以在具有 GPU 支持的其他代理节点上安装 Document Understanding。但请注意,Document Understanding 在没有 GPU 节点的情况下也完全可以正常运行。实际上,Document Understanding 使用 CPU 虚拟机执行所有提取和分类任务,而对于 OCR,我们强烈建议使用 GPU 虚拟机。
有关 Document Understanding 框架中 CPU/GPU 使用情况的更多详细信息,请参阅 CPU 和 GPU 使用情况。
如果要使用具有 GPU 支持的其他节点,则必须满足以下要求:
硬件 |
最低要求 |
---|---|
处理器 |
8 (v-)CPU/内核 |
RAM |
52 GiB |
集群二进制文件和状态磁盘 |
256 GiB SSD 最低 IOPS:1100 |
数据磁盘 |
不适用 |
GPU RAM |
11 GiB |
--node-taints nvidia.com/gpu=present:NoSchedule
而不是 --node-taints sku=gpu:NoSchedule
。
我们建议在 Task Mining、Automation Suite Robot 和 Document Understanding 的专用工作器节点上启用节点污点。
AI Center 和 DU 示例:
-
对于 CPU:
kubectl taint node <node_name> aic.ml/cpu=present:NoSchedule
kubectl taint node <node_name> aic.ml/cpu=present:NoSchedule
-
对于 GPU:
kubectl taint node <node_name> nvidia.com/gpu=present:NoSchedule
kubectl taint node <node_name> nvidia.com/gpu=present:NoSchedule
Task Mining 示例:
kubectl taint node <node_name> task.mining/cpu=present:NoSchedule
kubectl taint node <node_name> task.mining/cpu=present:NoSchedule
Automation Suite Robot 示例:
kubectl taint node <node_name> serverless.robot=present:NoSchedule
kubectl taint node <node_name> serverless.robot=present:NoSchedule
如果您有网守策略强制执行的自定义节点污点,例如工作线程节点的特定角色或标签,则这些污点不会传递到 Automation Suite ,并且可能会中断安装过程。
要了解污点和容忍度,请参阅 Kubernetes 文档。