Automation Suite - 步骤 3：部署后步骤

验证安装

若要检查 Automation Suite 是否已成功安装，您必须转到标志容器内的存储帐户。如果自动生成的名为 installResult 的文件（在容器中）的内容为 successful，则安装完成。如果安装失败，则内容将为 failed 。

更新证书

重要提示：

安装流程会代表您生成自签名证书。但是，您也可以通过 Azure 部署模板，选择在安装时提供由 CA 颁发的服务器证书，而不是使用自动生成的自签名证书。

自签名证书将在 90 天后过期，安装完成后，您必须将其替换为由受信任的 CA 签名的证书。如果不更新证书，安装将在 90 天后停止工作。

有关说明，请参阅管理证书。

探索标志和日志

如果您需要有关 Automation Suite 安装流程或其他操作的更多信息，则可以从用于在集群部署和维护期间存储各种标志和日志的存储帐户入手。

若要找到存储帐户，请执行以下步骤：

导航到执行部署的资源组。
按资源类型“ 存储帐户”筛选。
找到名称以st结尾的存储帐户。例如：
选择存储帐户，然后单击“ 容器” 。您可以选择 flags 和 logs。

标志容器

标志容器存储编排所需的各种标志或文件，或者仅用于报告各种操作的状态。在新集群上，标志容器内容通常如以下示例所示：

标志容器中的文件用于编排各种操作，例如集群上的 Automation Suite 安装流程，或特定集群操作，例如实例刷新。例如：

uipath-server-000000.success表示已在集群的该特定节点上成功完成基础架构安装；
如果整体安装成功，则installResult将显示为success 。

日志容器

执行操作时，它通常会在日志容器中生成一个日志文件。在新集群上，日志容器内容通常如以下示例所示：

日志容器中的每个文件都代表安装过程中特定步骤的日志。例如：

infra-uipath-server-000000.log存储基础架构安装日志；
fabric.log存储结构安装的日志；
services.log存储应用程序和服务安装的日志。

访问部署输出

安装完成后，您需要访问“输出”选项卡中的“部署输出”。

为此，请转到“资源组”，然后转到“部署”→“主模板”（或类似于 Microsoft. 模板 - DateTime）→“输出”。

部署输出

输出	描述
文档	文档链接。
URL	负载均衡器 URL。可用于直接访问。如果启用了自定义域，则此域将用于真实名称绑定。
密钥保险库 URL	部署创建的密钥保险库的 Azure 门户 URL。它包含部署中使用的所有密码（凭据）。
ArgoCDURL	用于访问 ArgoCD 的 URL。这在 VNet 中可用。必须按照步骤 4：配置 DNS 中的说明设置对此 URL 的外部访问。
ArgoCD 密码	用于登录 ArgoCD 门户的密码。
主机管理员用户名和主机管理员密码	用于主机管理员的凭据。

部署中使用的所有凭据都作为密码存储在部署期间配置的密钥保险库中。要访问密码，请在“资源组”中筛选资源，搜索“保险库”，然后单击“密码”。

备注：

如果您在“密码”选项卡下看到“The operation “List” is not enabled in the key vault’s access policy”警告，请执行以下步骤：

转到“访问策略”→“添加访问策略”→“配置模板”→“密码管理”→“选择主体”。
选择您的用户，然后单击“保存”。
导航回“密码”。警告应该消失，并且密码应该是可见的。

访问集群虚拟机

虚拟机需在私有 VNet 中加以配置。您可以按照以下步骤通过 Azure 堡垒对其加以访问：

导航到已部署 Automation Suite 的资源组。
由于代理、GPU 代理和服务器虚拟机位于规模集内，因此您必须转到包含所需实例的规模集。
转到“设置”选项卡中的“实例”部分。
单击要连接的虚拟机的名称。
单击“连接”按钮，然后从下拉菜单中选择“堡垒”。
输入部署中提供的凭据（“管理员用户名”和“管理员密码”参数，您可以在“密码”下的凭据密钥库中找到这些参数），然后单击“连接”。

DNS 要求

如步骤 1：准备 Azure 部署中所述，Automation Suite Azure 部署将创建一个具有公共 IP 和关联的 DNS 标签的负载均衡器。此 DNS 标签归 Microsoft 所有。

该部署还在集群 VNet 内配置了一个私有 DNS 区域，并添加了在安装和配置流程中使用的几个记录。

如果您选择从外部计算机连接，则无法使用私有 DNS 区域来解析各种服务的 DNS，因此您需要将这些记录添加到主机文件中。

有关更多详细信息，请参阅步骤 4：配置 DNS。

现在，您应该能够连接到集群上运行的各种服务。

访问 Automation Suite 常规界面

通用的 Automation Suite 用户界面可用作组织管理员和组织用户的门户。它是常见的组织级别资源，每个人都可以从中访问 Automation Suite 的所有区域：管理页面、平台级别页面、特定于服务的页面和特定于用户的页面。

要访问 Automation Suite，请执行以下步骤：

转到以下 URL：https://${Loadbalancer_dns}，其中 <loadbalancer_dns> 是负载均衡器的 DNS 标签，位于“输出”下。
切换到默认组织。
用户名是组织管理员。
依次转到“ 密钥保管库”、“密码”和“ 主机管理员密码”，以检索密码。

访问主机管理

主机门户是系统管理员配置 Automation Suite 实例的地方。从该门户配置的设置将由您的所有组织继承，有些设置可以在组织级别覆盖。

有关主机管理员的更多信息，请参阅管理系统管理员。

有关主机门户的更多信息，请参阅界面演示。

要访问主机管理，请执行以下步骤：

转到以下 URL：https://${Loadbalancer_dns}，其中 <loadbalancer_dns> 是负载均衡器的 DNS 标签，位于“输出”下。
切换到主机组织。
输入您先前指定的用户名作为 UiPath 管理员用户 名参数的值。
输入先前指定的密码作为“UiPath 管理员密码”参数的值。转到“密钥保险库”>“密码”>“主机管理员密码”，检索密码。

访问 ArgoCD

您可以使用 ArgoCD 控制台来管理已安装的产品。

要访问 ArgoCD，请执行以下步骤：

转到以下 URL：https://alm.${Loadbalancer_dns}，其中 <loadbalancer_dns> 是负载均衡器的 DNS 标签，位于“输出”下。请注意，您必须按照步骤 4：配置 DNS 中的说明配置对此 URL 的外部访问。
用户名是管理员。
要访问密码，请转到“输出”选项卡或凭据密钥保险库。

访问 Rancher

Automation Suite 使用 Rancher 提供开箱即用的集群管理工具。这可帮助您管理集群以及访问监控和故障排除功能。

有关更多详细信息，请参阅 Rancher 文档。

有关如何在 Automation Suite 中使用 Rancher 监控的更多信息，请参阅使用监控堆栈。

要访问 Rancher 控制台，请执行以下步骤：

转到以下 URL：https://monitoring.${Loadbalancer_dns}，其中 <loadbalancerdns> 是负载均衡器的 DNS 标签，可以在部署的“输出”中找到。
用户名是管理员。
要访问密码，请运行以下命令。
```
kubectl get secrets/rancher-admin-password -n cattle-system \
-o "jsonpath={.data['password']}" | echo $(base64 -d)kubectl get secrets/rancher-admin-password -n cattle-system \
-o "jsonpath={.data['password']}" | echo $(base64 -d)
```

扩展集群

从部署中配置的计算资源由 Azure 规模集组成，可轻松实现扩展。

您可以手动将其他资源添加到特定的规模集，包括添加服务器节点、代理节点或专用代理节点（例如 GPU 节点）。

您可以通过识别特定的规模集并直接添加资源来执行手动扩展。

为此，请执行以下步骤：

转到 Azure 门户并筛选特定的规模集：
选择合适的规模集，然后单击“缩放比例”。
使用滑块或旁边的输入字段修改“实例计数”字段，然后单击“保存”。

注意：对于服务器规模集，实例计数需要为奇数。
缩放操作应在后台启动，完成后即有新资源可用。

Azure 虚拟机生命周期操作

重要提示：

Azure 在关闭前至多支持 15 分钟的准备时间，而 Automation Suite 节点的正常终止时间从 20 分钟（对于代理和 GPU 代理节点）到几小时（对于服务器节点）不等。

为避免数据丢失，已将服务器的 VMSS 升级策略设置为“手动”，并且已为服务器虚拟机启用规模集操作保护。因此，我们建议通过提供的 Runbook 管理服务器的生命周期。

只有多节点 HA 就绪生产部署支持 Runbook InstanceRefresh 、 RemoveNodes 、 RemoveServers和CheckServerZoneResilience 。

运行任何 Runbook 后的服务器数量必须为奇数，且必须大于三（例如，如果有 4 台服务器，则无法执行实例刷新；如果总共有 5 台服务器，则无法删除服务器）。

VMSS 中的所有虚拟机都应处于Running状态。

一次只能运行一个 Runbook。

InstanceRefresh

描述

InstanceRefresh Runbook 具有以下用例：

更新服务器、代理和 GPU 规模集上的 VMSS 操作系统 SKU。
为一个/多个 VMSS 执行节点轮换操作。
预先应用于 VMSS 的其他 VMSS 配置更改。

用法

转到 Azure 门户并搜索名为InstanceRefresh的资源。
单击“开始” 按钮以打开参数列表。考虑以下因素，完成参数：
- 仅当参数REFRESH<node_type>设置为True时，才会对 VMSS 执行节点轮换操作。如果将多个REFRESH<node_type>参数设置为True ，则 VMSS 节点轮换顺序将为服务器 -> 代理 -> GPU 代理。
- 您必须提供NEWOSVERSION参数才能更新 VMSS 操作系统 SKU。您可以使用az vm image list-skus --location <deployment_location> --offer RHEL --publisher RedHat --output table找到可用的 Azure 市场虚拟机映像 SKU。当前的虚拟机不会自动更新为最新模型（为此需要执行节点轮换操作）。
  
  单击“确定”按钮以启动 Runbook。

实施细节

InstanceRefresh Runbook 是RemoveNodes Runbook 的包装程序。因此，系统会在运行RemoveNodes时跟踪状态。它会更新所有 VMSS 操作系统版本（如果需要），并根据收到的参数提取节点轮换操作的主机名，并将其转发到RemoveNodes 。如果集群恰好有三台服务器，则InstanceRefresh Runbook 将创建三台新服务器；否则， RemoveNodes将处理纵向扩展，以始终在每个可用区中至少维护一台服务器。

RemoveNodes

描述

RemoveNodes Runbook 具有以下用例：

从 Automation Suite 集群中删除指定节点。
为一个/两个虚拟机执行节点轮换操作。

用法

搜索要删除的节点的计算机名称。为此，请转到 VMSS，然后单击Settings部分中的Instances 。
转到 Azure 门户并搜索名为RemoveNodes的资源。
单击“开始” 按钮以打开参数列表。请考虑以下因素，完成参数：
- NODESTOBEREMOVEDCOMPUTERNAME是以逗号分隔的要删除的虚拟机的计算机名称列表（例如pxlqw-agent-000009,pxlqw-agent-00000A ），并且是唯一的必需参数。我们建议一次从单个 VMSS 中删除节点。
- ISINSTANCEREFRESH和THREESERVERSSCENARIO是由InstanceRefresh包装程序填充的标志。
  
  单击“确定”按钮以启动 Runbook。

实施详细信息

RemoveNodes Runbook 使用递归方法来克服 3 小时超长超时。该 Runbook 从接收到的列表中删除或重新铺设前两个节点（选择数量是为了满足服务器的奇数限制），并使用剩余的列表重新运行 Runbook 的另一个实例。

节点的节点重新铺设操作需要执行以下步骤：

根据要删除的节点数量，使用一个或两个虚拟机横向扩展 VMSS。
对旧实例执行节点删除。

节点的节点删除操作需要执行以下步骤：

封锁并排空实例。对于代理，此操作将在 20 分钟后超时，对于服务器，此操作将在number_of_instances * 60分钟后超时。
停止实例上的 rke 服务。操作将在 5 分钟后超时。
从 Automation Suite 集群中删除节点并删除虚拟机。对于代理，此操作将在 20 分钟后超时，对于服务器，此操作将在number_of_instances * 60分钟后超时。

RemoveServers

描述

RemoveServers Runbook 具有以下用例：

从 Automation Suite 集群中删除服务器。

用法

转到 Azure 门户并搜索名为RemoveServers 的资源。
单击“开始” 按钮以打开参数列表。请考虑以下因素，完成参数：

REMOVEDSERVERSCOUNT 是将要删除的服务器的数量。我们建议一次删除不超过 2 台服务器，以免遇到超长超时。