- 发行说明
- 要求
- 安装
- 入门指南
- 项目
- 数据集
- ML 包
- 管道
- ML 技能
- ML 日志
- AI Fabric 中的 Document Understanding
- 基本故障排除指南
4. 运行 AI Fabric 应用程序安装程序
- Cloud Shell 控制台日志将包含用于访问 Kots 管理控制台的 URL,因此可通过该 URL 登录到控制台 如果您选择不通过负载均衡器公开 Kots,请按照“如何设置 Kubernetes 集群上下文”一节中所述设置 kube 上下文,然后触发以下命令。
kubectl -n aifabric port-forward service/kotsadm 8800:3000
kubectl -n aifabric port-forward service/kotsadm 8800:3000 - 现在,可通过以下链接访问 KotsAdmin:http://localhost:8800
- 如果 kotsAdmin 密码无效,或者您想重置密码。
Option 1: if you have a linux machine or WSL enabled on your windows, then Install Kots CLI: curl https://kots.io/install | bash Reset password: kubectl kots reset-password -n aifabric or login to cloud shell cd aks-arm ./kots reset-password -n aifabric
Option 1: if you have a linux machine or WSL enabled on your windows, then Install Kots CLI: curl https://kots.io/install | bash Reset password: kubectl kots reset-password -n aifabric or login to cloud shell cd aks-arm ./kots reset-password -n aifabric
您必须按照以下屏幕中的说明输入详细信息。
要获取 Identity Server 访问令牌,请执行以下操作:
可以通过以下地址“https://<IdentityServerEndpoint>/identity/configuration”以管理员用户身份使用租户“host”(相对于租户“default”)登录来找到 IS 访问令牌。客户应该已经知道此地址,因为他可以在此处配置外部身份提供程序,例如 Azure AD、Windows 或 Google。
复制令牌并将其粘贴到复制的安装控制台中。
为核心服务启用 HA
启用此功能可确保始终为 AI Fabric 核心服务运行 2 个副本,同时启用水平 Pod 缩放,即根据工作负载的需求,相应地自动增加/减少与核心服务相关的 Pod 数量。如果我们不启用 HA,则始终仅运行核心服务的一个副本,但水平 Pod 缩放仍处于启用状态,这确保了如有需要,Pod 将在短时间内自动缩放。
为基于 CPU 的 ML 技能启用 HA
启用此功能可确保我们为所有基于 CPU 的 ML 技能部署 2 个副本,并且这 2 个副本将部署到多个区域下的节点。如果未启用 HA,则仅部署一个副本。
为基于 GPU 的 ML 技能启用 HA
启用此功能可确保我们为所有基于 GPU 的 ML 技能部署 2 个副本,并且这 2 个副本将部署到多个区域下的节点。如果未启用 HA,则仅部署一个副本。由于 GPU 计算机在 Azure 上非常昂贵,因此我们提供此选项,以便部署 ML 技能时不需要 2 个节点,因为 GPU 可以在部署之间共享。
配置基于 GPU 的作业可以使用的最大 CPU 和内存
由于标准 NC6 是 Azure 上提供的具有 GPU 可用性的最小配置计算机,因此我们默认将最大 CPU 设置为 5000(5 个 CPU),将最大内存设置为 50 GB。但是,如果客户对 GPU 节点池使用 Standard_NC6s_v2 或某些其他配置的计算机而非 Standard_NC6 节点,那么在这种情况下,客户可以覆盖默认值(即最大 CPU 和内存),并且可以使用基于 GPU 的训练作业。
保存配置后,KOTS 将开始验证输入,如果所有预检均通过,则 KOTS 将触发部署,这与一体化安装完全相似
如果所有预检均通过,配置屏幕将如下所示。单击“继续”以继续操作。
可以通过从本地查询此 Pod 来跟踪配置作业的状态。请确保您已按照说明设置了 Kubernetes 集群上下文:
rajivchodisetti@DESKTOP-LOUPTI1:/mnt/c/Users/rajiv.chodisetti$ kubectl -n aifabric get pods | grep provision
provision-4xls7mzjpnui8j7n-s9tct 0/1 Completed 0 14h
To check the logs of this pod:
kubectl -n aifabric logs -f provision-4xls7mzjpnui8j7n-s9tct
If AIFabric deployment is successful, this is what you would see in the pod logs at the end,
Successfully setup cronjob for oob installation run on daily basis.
< Total steps: Current step: 8 Estimated time: 2s >
AiFabric in Azure AKS has been provisioned successfully
rajivchodisetti@DESKTOP-LOUPTI1:/mnt/c/Users/rajiv.chodisetti$ kubectl -n aifabric get pods | grep provision
provision-4xls7mzjpnui8j7n-s9tct 0/1 Completed 0 14h
To check the logs of this pod:
kubectl -n aifabric logs -f provision-4xls7mzjpnui8j7n-s9tct
If AIFabric deployment is successful, this is what you would see in the pod logs at the end,
Successfully setup cronjob for oob installation run on daily basis.
< Total steps: Current step: 8 Estimated time: 2s >
AiFabric in Azure AKS has been provisioned successfully
请参见此处