- 概述
- 要求
- 安装
- 安装后
- 集群管理
- 监控和警示
- 迁移和升级
- 特定于产品的配置
- 最佳实践和维护
- 故障排除
- 无法获取沙盒映像
- Pod 未显示在 ArgoCD 用户界面中
- Redis 探测器失败
- RKE2 服务器无法启动
- 在 UiPath 命名空间中找不到密码
- ArgoCD 在首次安装后进入“进行中”状态
- 意外不一致;手动运行 fsck
- MongoDB Pod 处于 CrashLoopBackOff 状态或在删除后处于“等待 PVC 配置”状态
- MongoDB Pod 从 4.4.4-ent 升级到 5.0.7-ent 失败
- 集群还原或回滚后服务运行状况不佳
- Pod 在 Init:0/X 中卡住
- Prometheus 处于 CrashLoopBackoff 状态,并出现内存不足 (OOM) 错误
- 监控仪表板中缺少 Ceph-rook 指标
- 使用 Automation Suite 诊断工具
- 使用 Automation Suite 支持捆绑包
- 探索日志
步骤 1:准备 AWS 部署
本页列出了将 Automation Suite 部署到 AWS 之前需要采取的步骤。
AWS 部署需要对 AWS 服务有一定程度的熟悉度。
如果您是 AWS 的新手,可以先阅读以下介绍性材料来熟悉一下。它们提供有关如何在 AWS Cloud 上设计、部署和操作基础架构及应用程序的基本材料。
本快速入门还假定您熟悉本指南请求资源配额部分中列出的 AWS 服务。有关架构的详细图表和说明,请参阅:
如果您还没有 AWS 帐户,请按照分步说明创建帐户。您的 AWS 帐户将自动注册所有 AWS 服务。您只需为使用的服务付费。
以下部分将指导您完成配置特定于 Automation Suite 部署要求的 AWS 帐户所需的步骤。
您需要在您将部署快速入门的区域中的 AWS 帐户中至少有一个 EC2 密钥对。
要创建密钥对,请参阅 Amazon EC2 密钥对和 Linux 实例。
请记下部署期间需要的密钥对名称。
如有必要,请求增加以下资源的服务配额。如果您的现有部署当前使用这些资源,并且此快速入门部署可能会导致超出默认配额,则您可能需要请求增加配额。服务配额控制台显示某些服务的某些方面的使用情况和配额。
资源 |
要求 |
---|---|
VPC |
1 |
子网 |
最多 6 个 |
NAT 网关 |
2 |
VPC 端点 |
1 |
互联网网关 |
1 |
弹性 IP 地址 |
最多 6 个 |
AWS 身份和访问管理 (IAM) 安全组 |
1 |
IAM 角色 |
最多 7 个 |
自动调整组 |
最多 2 个 |
应用程序负载均衡器 |
0 或 1 |
网络负载均衡器 |
1 或 2 |
公共证书颁发机构 (CA) |
1 |
托管区域 |
1 |
RDS 实例 |
1 |
堡垒主机 |
1 |
密码 |
4 |
Parameter Store 中的参数 |
3 |
SSM 文档 |
0 或 3 |
Lambda 函数 |
3 |
实例配置文件 |
2 |
安全组 |
3 |
在启动本快速入门之前,您必须使用模板部署的资源的 IAM 权限登录 AWS 管理控制台。IAM 中的管理员访问权限托管策略可提供足够的权限,但您的组织可能会选择使用具有更多限制的自定义策略。
有关更多信息,请参阅作业功能的 AWS 托管策略。
若要获取 CloudFormation 模板创建的角色和策略的完整列表,请参阅角色和策略。
下表描述了与该服务交互的所有外部端点:
要求 |
详细信息 |
---|---|
AWS 元数据服务 |
提供有关 Amazon EC2 实例的详细信息 |
AWS 管理 API |
通过 AWS CLI 或 lambda 函数使用 |
AWS 引导存档 |
用于服务,以便配置和管理资源。从以下 URL 检索:
https://s3.amazonaws.com/cloudformation-examples/aws-cfn-bootstrap-py3-latest.tar.gz |
AWS CLI 包 |
用于命令行接口,以便通过计算机与 AWS 服务交互。您可以从以下 URL 访问该包:
https://awscli.amazonaws.com/awscli-exe-linux-x86_64.zip |
AWS SSM 代理 |
用于通过远程命令大规模管理实例。您可以从以下 URL 下载代理:
https://s3.${AWS::Region}.amazonaws.com/amazon-ssm-${AWS::Region}/latest/linux_amd64/amazon-ssm-agent.rpm |
AWS Cloudwatch 代理 |
用于收集系统和应用程序日志进行监控。您可以从以下 URL 下载代理:
https://s3.amazonaws.com/amazoncloudwatch-agent/redhat/amd64/latest/amazon-cloudwatch-agent.rpm |
NVIDIA 驱动程序 |
对于启用 GPU 的虚拟机为必需。您可以从 NVIDIA 存储库获取驱动程序。 |
外部存储库(如果使用) |
不适用 |
用于模板的 UiPath S3 存储桶/lambda 函数使用情况/用于安装的 bash 脚本。 |
不适用 |
有关详细信息,请参阅网络要求。
Connect AiCenter to an external Orchestrator
设置为 true
,并将 Orchestrator 证书和身份证书提供给 AWS 部署参数中列出的参数。有关如何获取证书的详细信息,请参阅链式证书。
要以 Base64 格式对证书进行编码,请运行以下命令:
cat orchestrator.cer | base64 | tr -d '\n' > orchestratorCert
cat identity.cer | base64 | tr -d '\n' > identityCert
cat orchestrator.cer | base64 | tr -d '\n' > orchestratorCert
cat identity.cer | base64 | tr -d '\n' > identityCert
要将 AI Center 注册到外部 Orchestrator,您必须运行此 SSM 文档。