- 概要
- 要件
- インストール
- インストール後
- クラスターの管理
- 監視とアラート機能
- 移行とアップグレード
- 製品固有の設定
- ベスト プラクティスとメンテナンス
- トラブルシューティング
- インストール時にサービスをトラブルシューティングする方法
- クラスターをアンインストールする方法
- オフライン成果物をクリーンアップしてディスク領域を改善する方法
- Redis データをクリアする方法
- Istio ログを有効化する方法
- ログを手動でクリーンアップする方法
- sf-logs バンドルに保存されている古いログをクリーンアップする方法
- AI Center のストリーミング ログを無効化する方法
- 失敗した Automation Suite インストールをデバッグする方法
- アップグレード後に古いインストーラーからイメージを削除する方法
- Longhorn のスナップショットを自動的にクリーンアップする方法
- TX チェックサム オフロードを無効化する方法
- ArgoCD のログ レベルを手動で Info に設定する方法
- 外部レジストリーのエンコードされたpull_secret_valueを生成する方法
- TLS 1.2 で弱い暗号に対処する方法
- RHEL 8.4 OS でオフライン インストールを実行できない
- バンドルのダウンロード中のエラー
- バイナリがないため、オフライン インストールが失敗する
- オフライン インストールでの証明書の問題
- Longhorn のセットアップ中に最初のインストールが失敗する
- SQL 接続文字列の検証エラー
- selinux iscsid モジュールの前提条件の確認が失敗する
- Azure ディスクが SSD としてマークされない
- 証明書の更新後のエラー
- ウイルス対策が原因でインストールの問題が発生する
- OS のアップグレード後に Automation Suite が動作しない
- Automation Suite で backlog_wait_time を 0 に設定する必要がある
- リソースが利用できないことの影響を受ける GPU ノード
- ワークロードの準備ができていないためボリュームをマウントできない
- 管理ポータルのタイムアウト期間を設定する
- 基になるディレクトリ接続を更新する
- 移行後に認証が機能しない
- Kinit: Cannot find KDC for realm <AD Domain> while getting initial credentials
- kinit: Keytab contains no suitable keys for *** while getting initial credentials
- 無効なステータス コードが原因で GSSAPI 操作が失敗した
- Alarm received for failed kerberos-tgt-update job
- SSPI Provider: Server not found in Kerberos database
- アカウントが無効なため AD ユーザーのログインに失敗した
- ArgoCD へのログインに失敗した
- サンドボックス イメージを取得できない
- ポッドが ArgoCD UI に表示されない
- Redis プローブの障害
- RKE2 サーバーの起動に失敗する
- UiPath 名前空間でシークレットが見つからない
- 初回インストール後に ArgoCD が進行中ステートになる
- ArgoCD の読み取り専用アカウントにアクセスする際の問題
- MongoDB ポッドが CrashLoopBackOff になるか、削除後に PVC プロビジョニングの保留中になる
- クラスターの復元またはロールバック後にサービスが異常になる
- Init:0/X でポッドがスタックする
- Prometheus が CrashloopBackoff ステートにあり、メモリ不足 (OOM) エラーを伴う
- Ceph-rook のメトリックが監視ダッシュボードに表示されない
- Automation Suite 診断ツールを使用する
- Automation Suite サポート バンドル ツールを使用する
- ログを確認する
手順 1: AWS のデプロイを計画する
このページでは、AWS に Automation Suite をデプロイする前に必要となる手順を説明します。
AWS のデプロイには、AWS サービスに関する中程度の習熟度が求められます。
AWS が初めての場合、まず次の入門資料を読んで慣れてください。これらでは、AWS クラウドでインフラストラクチャやアプリケーションを設計、デプロイ、操作する方法についての基本が説明されています。
このクイック スタートでは、このガイドの「リソースのクォータをリクエストする」のセクションに示した AWS サービスに精通していることも前提としています。アーキテクチャの詳細なダイアグラムと説明については、以下をご覧ください。
AWS アカウントがまだない場合は、ステップバイステップの手順に従って作成します。AWS アカウントは、すべての AWS サービスに自動的に登録されます。使用するサービスに対してのみ課金されます。
次のセクションでは、Automation Suite のデプロイ要件に固有の AWS アカウントを設定するために必要な手順について説明します。
クイック スタートをデプロイするリージョンの AWS アカウントには、1 つ以上の EC2 キー ペアが必要です。
新しいキー ペアを作成するには、「Amazon EC2 key pairs and Linux instances」をご覧ください。
キー ペア名はデプロイ時に必要となるため、メモしておいてください。
このクイック スタートでは、Web アプリケーションが提供される親ドメインの所有権が確立されている必要があります。ドメインを登録する場合は、「ドメインの登録」をご覧ください。
AWS Route 53 を使用してドメインを登録した場合、ホスト ゾーンは事前に設定されており、追加の設定は不要です。
それ以外の場合は、AWS アカウントで、必要なネーム サーバー、SOA、CNAME、テキスト レコードを使用して、ホスト ゾーンを設定する必要があります。パブリック ホスト ゾーンの作成方法の詳細については、「パブリック ホスト ゾーンの使用」をご覧ください。
必要に応じて、次のリソースに対してサービス クォータの引き上げをリクエストします。既存のデプロイで現在これらのリソースを使用している場合や、このクイック スタート デプロイで既定のクォータを超える可能性がある場合は、引き上げをリクエストする必要があります。サービス クォータ コンソールには、複数のサービスの複数の側面について、使用状況とクォータが表示されます。
詳しくは、「What is Service Quotas?」および「AWS サービス クォータ」をご覧ください。
リソース |
要件 |
---|---|
VPC |
1 |
サブネット |
最大 6 |
NAT ゲートウェイ |
2 |
VPC エンドポイント |
1 |
インターネット ゲートウェイ |
1 |
Elastic IP アドレス |
最大 6 |
AWS Identity and Access Management (IAM) セキュリティ グループ |
1 |
IAM ロール |
最大 7 |
Auto Scaling グループ |
最大 2 |
アプリケーション ロード バランサー |
0 または 1 |
ネットワーク ロード バランサー |
1 または 2 |
公的証明機関 (CA) |
1 |
ホスト ゾーン |
1 |
RDS インスタンス |
1 |
踏み台ホスト |
1 |
シークレット |
4 |
Parameter Store のパラメーター |
3 |
SSM ドキュメント |
0 または 3 |
ラムダ関数 |
3 |
インスタンス プロファイル |
2 |
セキュリティ グループ |
3 |
クイック スタートが既定のリージョン以外のリージョンで動作するためには、デプロイに含まれるすべてのサービスがそのリージョンでサポートされている必要があります。
AWS リージョンとそれらがサポートしている AWS サービスの最新リストは、「AWS リージョン別のサービス」をご覧ください。
Unrecognized resource type
」というエラーが表示された場合、そのリージョンでクイック スタートはサポートされていません。
クイック スタートを起動する前に、テンプレートでデプロイされるリソースに対する IAM のアクセス許可により、AWS 管理コンソールにサインインする必要があります。IAM 内の AdministratorAccess 管理ポリシーにより十分な権限が与えられますが、組織でより制約の厳しいカスタム ポリシーを使用することもできます。
詳しくは、「AWS ジョブ機能の管理ポリシー」をご覧ください。
CloudFormation テンプレートが作成するロールとポリシーの完全なリストについては、「ロールとポリシー」をご覧ください。
次の表では、サービスが対話するすべての外部エンドポイントについて説明します。
要件 |
詳細 |
---|---|
AWS メタデータ サービス |
Amazon EC2 インスタンスの詳細を提供します。 |
AWS 管理 API |
AWS CLI またはラムダ関数を介して使用されます。 |
AWS ブートストラップ アーカイブ |
サービスがリソースをプロビジョニングおよび管理するために使用されます。次の URL から取得します。
https://s3.amazonaws.com/cloudformation-examples/aws-cfn-bootstrap-py3-latest.tar.gz |
AWS CLI パッケージ |
コマンド ライン インターフェイスがマシンから AWS サービスと対話するために使用されます。パッケージには次の URL からアクセスできます。
https://awscli.amazonaws.com/awscli-exe-linux-x86_64.zip |
AWS SSM エージェント |
リモート コマンドによる大規模なインスタンスの管理に使用されます。エージェントは次の URL からダウンロードできます。
https://s3.${AWS::Region}.amazonaws.com/amazon-ssm-${AWS::Region}/latest/linux_amd64/amazon-ssm-agent.rpm |
AWS CloudWatch エージェント |
監視のためにシステム ログとアプリケーション ログを収集するために使用されます。エージェントは次の URL からダウンロードできます。
https://s3.amazonaws.com/amazoncloudwatch-agent/redhat/amd64/latest/amazon-cloudwatch-agent.rpm |
Nvidia ドライバー |
GPU が有効な仮想マシンに必要です。ドライバーは Nvidia のリポジトリから入手できます。 |
外部リポジトリ (使用する場合) |
N/A |
テンプレート用の UiPath S3 バケット/ラムダ関数の使用/インストール用の bash スクリプト |
N/A |
詳細については、「ネットワーク要件」をご覧ください。
Connect AiCenter to an external Orchestrator
を true
に設定し、AWS のデプロイ パラメーターに記載されているパラメーターに Orchestrator と Identity の証明書を指定する必要があります。証明書を取得する方法の詳細については、「チェーン証明書」をご覧ください。
証明書を Base64 形式でエンコードするには、次のコマンドを実行します。
cat orchestrator.cer | base64 | tr -d '\n' > orchestratorCert
cat identity.cer | base64 | tr -d '\n' > identityCert
cat orchestrator.cer | base64 | tr -d '\n' > orchestratorCert
cat identity.cer | base64 | tr -d '\n' > identityCert
AI Center を外部 Orchestrator に登録するには、この SSM ドキュメントを実行する必要があります。