automation-suite
2023.4
false
- 概要
- 要件
- インストール
- インストール後
- クラスターの管理
- 監視とアラート機能
- 移行とアップグレード
- 製品固有の設定
- ベスト プラクティスとメンテナンス
- トラブルシューティング
- インストール時にサービスをトラブルシューティングする方法
- クラスターをアンインストールする方法
- オフライン成果物をクリーンアップしてディスク領域を改善する方法
- Redis データをクリアする方法
- Istio ログを有効化する方法
- ログを手動でクリーンアップする方法
- sf-logs バンドルに保存されている古いログをクリーンアップする方法
- AI Center のストリーミング ログを無効化する方法
- 失敗した Automation Suite インストールをデバッグする方法
- アップグレード後に古いインストーラーからイメージを削除する方法
- Longhorn のスナップショットを自動的にクリーンアップする方法
- TX チェックサム オフロードを無効化する方法
- ArgoCD のログ レベルを手動で Info に設定する方法
- 外部レジストリーのエンコードされたpull_secret_valueを生成する方法
- TLS 1.2 で弱い暗号に対処する方法
- RHEL 8.4 OS でオフライン インストールを実行できない
- バンドルのダウンロード中のエラー
- バイナリがないため、オフライン インストールが失敗する
- オフライン インストールでの証明書の問題
- Longhorn のセットアップ中に最初のインストールが失敗する
- SQL 接続文字列の検証エラー
- selinux iscsid モジュールの前提条件の確認が失敗する
- Azure ディスクが SSD としてマークされない
- 証明書の更新後のエラー
- ウイルス対策が原因でインストールの問題が発生する
- OS のアップグレード後に Automation Suite が動作しない
- Automation Suite で backlog_wait_time を 0 に設定する必要がある
- リソースが利用できないことの影響を受ける GPU ノード
- ワークロードの準備ができていないためボリュームをマウントできない
- 管理ポータルのタイムアウト期間を設定する
- 基になるディレクトリ接続を更新する
- 移行後に認証が機能しない
- Kinit: Cannot find KDC for realm <AD Domain> while getting initial credentials
- kinit: Keytab contains no suitable keys for *** while getting initial credentials
- 無効なステータス コードが原因で GSSAPI 操作が失敗した
- Alarm received for failed kerberos-tgt-update job
- SSPI Provider: Server not found in Kerberos database
- アカウントが無効なため AD ユーザーのログインに失敗した
- ArgoCD へのログインに失敗した
- サンドボックス イメージを取得できない
- ポッドが ArgoCD UI に表示されない
- Redis プローブの障害
- RKE2 サーバーの起動に失敗する
- UiPath 名前空間でシークレットが見つからない
- 初回インストール後に ArgoCD が進行中ステートになる
- ArgoCD の読み取り専用アカウントにアクセスする際の問題
- MongoDB ポッドが CrashLoopBackOff になるか、削除後に PVC プロビジョニングの保留中になる
- クラスターの復元またはロールバック後にサービスが異常になる
- Init:0/X でポッドがスタックする
- Prometheus が CrashloopBackoff ステートにあり、メモリ不足 (OOM) エラーを伴う
- Ceph-rook のメトリックが監視ダッシュボードに表示されない
- Automation Suite 診断ツールを使用する
- Automation Suite サポート バンドル ツールを使用する
- ログを確認する
Azure のデプロイ アーキテクチャ
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
Linux の Automation Suite のインストール ガイド
Last updated 2024年10月2日
Azure のデプロイ アーキテクチャ
このページでは、Azure でのデプロイ アーキテクチャとともに、必要なコンポーネントについての洞察を提供します。
- ユーザー割り当て ID (
Microsoft.ManagedIdentity/userAssignedIdentities
) – サーバー仮想マシン スケール セットで設定され、以下に使用されます。- サーバー仮想マシン スケール セットが VMSS に対してクエリを実行し、インストールを実行する最初のサーバーを特定できるようにするため。
- サブスクリプションのハードウェア要件とクォータが満たされているかどうかを検証するため。
- サーバー ノードにインスタンス保護を設定し、サーバー ノードが誤って削除されないようにするため。インストール プロセスの一環として、スケール セット操作からのインスタンス保護が、サーバー スケール セットのすべてのノードに追加されます。これらの操作は Azure からサーバー コンテキストなしで実行されるため、クラスターの誤動作が防止されます。スケール セットのインスタンス保護の詳細については、Azure のドキュメントをご覧ください。サーバー ノードはワークロードも実行し、専用のデータ ディスクを備えています。
- Automation アカウント Runbook を介してクラスター操作を実行するため。
- ロールの割り当て、共同作成者 (
Microsoft.Authorization/roleAssignments
) – マネージド ID で前述の操作を実行できるようにするために使用されます。 - デプロイ スクリプト (
Microsoft.Resources/deploymentScripts
):- デプロイの開始時に、選択された構成 (クォータ、可用性など) を検証するために実行されるスクリプト。
- 一部のタスクは非同期であるため、デプロイの最後に、デプロイのステータスを検証するために実行されるスクリプト。
- Key Vault (
Microsoft.KeyVault/vaults
) – さまざまなユーザー名とシークレット (例: SQL のユーザー名とパスワード、ArgoCD のパスワード) を保存するために使用されます。 - SQL Server (
Microsoft.Sql/servers
) – SQL データベースの作成に使用するサーバーです。 - SQL データベース (
Microsoft.Sql/servers/databases
) – 有効化された各サービスに必要なデータベースです。マルチノードの HA 対応の運用設定で Process Mining をインストールする場合、AutomationSuite_ProcessMining_Warehouse
というデータベースをエラスティック プールとは別にインストールする必要があります。その理由は、運用環境のワークロードでは、このデータベースが要求するリソースが他のワークロードよりもかなり多くなるためです。 - SQL エラスティック プール (
Microsoft.Sql/servers/elasticPools
) – コストを低く維持するために使用されるエラスティック プールです。 - 仮想マシン スケール セット (
Microsoft.Compute/virtualMachineScaleSets
) – クラスターのノード。- サーバー ノードには 1 つのスケール セットが使用されます (クラスター制御プレーン)。インストール プロセスの一環として、スケール セット操作からのインスタンス保護が、サーバー スケール セットのすべてのノードに追加されます。これらの操作は Azure からサーバー コンテキストなしで実行されるため、クラスターの誤動作が防止されます。スケール セットのインスタンス保護の詳細については、Azure のドキュメントをご覧ください。サーバー ノードはワークロードも実行し、専用のデータ ディスクを備えています。また、ID も割り当てられます (ユーザー割り当て ID)。各ノードのディスク:
- 256 GiB の OS ディスク (
Premium_LRS
) - 256 GiB のバイナリ ディスク (
Premium_LRS
) - 512 GiB または 2 TiB のデータ ディスク (基本またはすべて、
Premium_LRS
) - 有効化されている場合は 16 GiB の
UltraSSD_LRS
、それ以外の場合はPremium_LRS
- 256 GiB の OS ディスク (
- エージェント ノードには 1 つのスケール セットが使用されます。ワークロードの実行専用に設計されています (制御プレーン サービスはありません)。必要なエージェント ノード数が 0 の場合、空のスケール セットが作成されます。各ノードのディスク:
- 256 GiB の OS ディスク (
Premium_LRS
) - 256 GiB のバイナリ ディスク (
Premium_LRS
)
- 256 GiB の OS ディスク (
- GPU ノード。任意です。ビデオ カードを備えた ML モデル専用のノードです。必要な GPU ノード数が 0 の場合、スケール セットが作成されますが、非 GPU 仮想マシン ファミリの SKU が使用されます。各ノードのディスク:
- 256 GiB の OS ディスク (
Premium_LRS
) - 256 GiB のバイナリ ディスク (
Premium_LRS
)
- 256 GiB の OS ディスク (
- Automation Suite ロボット ノード。任意です。Automation Suite ロボット専用に使用されるノードです。各ノードのディスク:
- 256 GiB の OS ディスク (
Premium_LRS
) - 256 GiB のバイナリ ディスク (
Premium_LRS
) - 32 GiB のキャッシュ ディスク (
Premium_LRS
)
- 256 GiB の OS ディスク (
- 仮想マシン (
Microsoft.Compute/virtualMachines
) – Task Mining ノード。 - VM 拡張機能 (
Microsoft.Compute/virtualMachines/extensions
) – Automation Suite をインストールするために使用されます。 - ディスク (
Microsoft.Compute/disks
):- 256 GiB の OS ディスク (
Premium_LRS
) - 256 GiB のバイナリ ディスク (
Premium_LRS
)
- 256 GiB の OS ディスク (
- ネットワーク インターフェイス (
Microsoft.Network/networkInterfaces
)
- サーバー ノードには 1 つのスケール セットが使用されます (クラスター制御プレーン)。インストール プロセスの一環として、スケール セット操作からのインスタンス保護が、サーバー スケール セットのすべてのノードに追加されます。これらの操作は Azure からサーバー コンテキストなしで実行されるため、クラスターの誤動作が防止されます。スケール セットのインスタンス保護の詳細については、Azure のドキュメントをご覧ください。サーバー ノードはワークロードも実行し、専用のデータ ディスクを備えています。また、ID も割り当てられます (ユーザー割り当て ID)。各ノードのディスク:
- オートメーション アカウント (
Microsoft.Automation/automationAccounts
) – クラスターの操作に使用されるオートメーション アカウント。注: すべてのストレージ アカウントと SQL Server には、プライベート エンドポイントがあります。Hybrid Worker グループは、既存の自動化された処理を実行し、問題なく動作するようにします。詳しくは、「Hybrid Worker」をご覧ください。
InstanceRefresh
(Microsoft.Automation/automationAccounts/runbooks
) – Automation Suite クラスター上でインスタンスの更新操作を開始するための Runbook。RemoveServers
(Microsoft.Automation/automationAccounts/runbooks
) – Automation Suite クラスターからのサーバーの削除を実行するための Runbook。RemoveNodes
(Microsoft.Automation/automationAccounts/runbooks
) – Automation Suite クラスターからの特定のノードの削除を実行するための Runbook。CheckServerZoneResilience
(Microsoft.Automation/automationAccounts/runbooks
) - サーバー ゾーンの回復機能を確認し、必要に応じてノードを他の可用性ゾーンに分散させるための Runbook。ImportASModules
(Microsoft.Automation/automationAccounts/runbooks
) - Automation Suite の Runbook に必要なモジュール (Microsoft.Automation/automationAccounts/modules
) をインポートするための Runbook。AddGpuNode
– Automation Suite クラスターの GPU スケール セットに GPU ノードを追加するための Runbook。RegisterAiCenterExternalOrchestrator
– AI Center のインストールを外部の Orchestrator と ID サービスに登録するための Runbook。BackupCluster
– Automation Suite クラスター上でインスタンスの更新を実行するための Runbook。GetAllBackups
– Automation Suite クラスター上でインスタンスの更新を実行するための Runbook。RestoreClusterInitialize
– Automation Suite クラスター上でインフラストラクチャの復元を実行するための Runbook。RestoreClusterSnapshot
– Automation Suite クラスター上でスナップショットの復元を実行するための Runbook。この Runbook は手動で実行しないでください。これは、復元用の Runbook のシーケンスの一部として実行されます。
- 仮想ネットワーク (
Microsoft.Network/virtualNetworks
) – ノード仮想マシンをデプロイするために使用される仮想ネットワークです。- 仮想ネットワーク サブネット (
Microsoft.Network/virtualNetworks/subnets
) – すべてのノードが存在する場所。 - 仮想ネットワーク サブネット (
Microsoft.Network/virtualNetworks/subnets
) – Azure Bastion に使用されます (任意。Azure Bastion が有効化されていて、既存の仮想ネットワークを選択しなかった場合に作成されます)。
- 仮想ネットワーク サブネット (
- パブリック ロード バランサー (
Microsoft.Network/loadBalancers
) – ノードへのトラフィックを分散させるために使用されます。443
– クラスターへの HTTPS トラフィック6443
– Kubernetes API への HTTPS トラフィック
- 内部ロード バランサー (
Microsoft.Network/loadBalancers
) – ノード登録のためのインストール時に使用されます。IP は固定で、すべてのポートでトラフィックを許可します。 - Bastion (
Microsoft.Network/bastionHosts
) – クラスターのノードにアクセスするためのジャンプ ボックスとして使用されます。任意です。既存の仮想ネットワークを選択した場合にはデプロイされません。 - ネットワーク セキュリティ グループ (
Microsoft.Network/networkSecurityGroups
) – サブネット トラフィックをセキュリティで保護するために使用されます。HTTPS
(443) および内部 VNet 接続が許可されます。 - NAT (ネットワーク アドレス変換) Gateway (
Microsoft.Network/natGateways
) – インストール時に送信接続に使用されます。既存の VNet 送信接続を使用する場合はデプロイされないため、指定する必要があります。 - パブリック IP アドレス (
Microsoft.Network/publicIpAddresses
)- Azure Bastion に使用されるアドレス。新しい仮想ネットワークを選択し、かつ Azure Bastion が有効化されている場合にデプロイされます。
- パブリック ロード バランサーに使用されるアドレス。
- NAT Gateway に使用されるアドレス。既存の VNet 送信接続を使用する場合はデプロイされないため、指定する必要があります。
- パブリック IP プレフィックス (
Microsoft.Network/publicIPPrefixes
) – NAT Gateway に使用されます。既存の VNet 送信接続を使用する場合はデプロイされないため、指定する必要があります。 -
プライベート DNS ゾーン (
Microsoft.Network/privateDnsZones
) – このデプロイはパブリック DNS ゾーンなしでも使用できるため、プライベート DNS ゾーンが作成されます。- DNS レコード (必要な場合)
- 仮想ネットワーク リンク
- ストレージ アカウント (
Microsoft.Storage/storageAccounts
)- インストールのオーケストレーションとログの公開に使用されるアカウント (末尾が
st
)。 - クラスターにより拡張ストレージに使用されるアカウント (末尾が
est
) - 任意です。バックアップが有効化されていて、NFS ファイル共有として使用される場合にデプロイされるアカウント。
- インストールのオーケストレーションとログの公開に使用されるアカウント (末尾が