Automation Suite
2022.10
偽
- 概要
- 要件
- インストール
- インストール後
- クラスターの管理
- 監視とアラート機能
- 移行とアップグレード
- 製品固有の設定
- ベストプラクティスとメンテナンス
- トラブルシューティング
- インストール時にサービスをトラブルシューティングする方法
- クラスターをアンインストールする方法
- オフライン成果物をクリーンアップしてディスク領域を改善する方法
- Redis データをクリアする方法
- Istio ログを有効化する方法
- ログを手動でクリーンアップする方法
- sf-logs バンドルに保存されている古いログをクリーンアップする方法
- AI Center のストリーミング ログを無効化する方法
- 失敗した Automation Suite インストールをデバッグする方法
- アップグレード後に古いインストーラーからイメージを削除する方法
- Longhorn スナップショットを自動的にクリーンアップする方法
- NIC チェックサムオフロードを無効にする方法
- RHEL 8.4 OS でオフライン インストールを実行できない
- バンドルのダウンロード中のエラー
- バイナリがないため、オフライン インストールが失敗する
- オフライン インストールでの証明書の問題
- Longhorn のセットアップ中に最初のインストールが失敗する
- SQL 接続文字列の検証エラー
- selinux iscsid モジュールの前提条件の確認が失敗する
- Azure ディスクが SSD としてマークされない
- 証明書の更新後のエラー
- ウイルス対策が原因でインストールの問題が発生する
- OS のアップグレード後に Automation Suite が動作しない
- Automation Suite で backlog_wait_time を 0 に設定する必要がある
- ワークロードの準備ができていないためボリュームをマウントできない
- プロキシ設定がある場合に Automation Hub と Apps を起動できない
- 管理ポータルのタイムアウト期間を設定する
- 基になるディレクトリ接続を更新する
- 移行後に認証が機能しない
- Kinit: Cannot Find KDC for Realm <AD Domain> While Getting Initial Credentials
- kinit: Keytab contains no suitable keys for *** while getting initial credentials
- 無効なステータス コードが原因で GSSAPI 操作が失敗した
- Alarm received for failed kerberos-tgt-update job
- SSPI Provider: Server not found in Kerberos database
- アカウントが無効なため AD ユーザーのログインに失敗した
- ArgoCD へのログインに失敗した
- サンドボックス イメージを取得できない
- ポッドが ArgoCD UI に表示されない
- Redis プローブの障害
- RKE2 サーバーの起動に失敗する
- UiPath 名前空間でシークレットが見つからない
- 初回インストール後に ArgoCD が進行中ステートになる
- Unexpected inconsistency; run fsck manually
- MongoDB ポッドが CrashLoopBackOff になるか、削除後に PVC プロビジョニングの保留中になる
- MongoDB ポッドを 4.4.4-ent から 5.0.7-ent にアップグレードできない
- クラスターの復元またはロールバック後にサービスが異常になる
- Init:0/X でポッドがスタックする
- Prometheus が CrashloopBackoff ステートでメモリ不足 (OOM) エラーを伴う
- 監視ダッシュボードに Ceph-rook メトリックが表示されない
- Automation Suite 診断ツールを使用する
- Automation Suite サポート バンドル ツールを使用する
- ログを確認する
GCP のデプロイ アーキテクチャ
Automation Suite インストール ガイド
最終更新日 2024年4月24日
GCP のデプロイ アーキテクチャ
重要: 現在、GCP のデプロイ テンプレートは Automation Suite 2023.10 でのみ使用できます。したがって、Automation Suite 2023.10 のドキュメントを参照することをお勧めします。
- 仮想ネットワーク
- すべてのノードが存在するサブネット。
- 送信接続用の NAT ゲートウェイ (Cloud Router に接続される Cloud Nat リソース)。
- サブネット トラフィックを保護するためのファイアウォール ルール。
- インストールに必要な DNS プライベート ゾーン。詳細については、「既知の制限事項」のセクションをご覧ください。
- 4 つの Managed Instance Group。サーバー ノード、エージェント ノード、GPU エージェント ノード、Automation Suite ロボット ノードのインスタンスの種類を選択できます。マルチノードの高可用性対応の運用環境のマシン要件とシングルノードの評価のマシン要件を確認し、ハードウェア要件を満たすようにしてください。各仮想マシンは、128 GiB の OS、256 GiB のクラスター バイナリ、およびステート ディスクを持ちます。サーバー ノードには、追加で 512 GiB のデータ ディスクと、ObjectStore に使用される 512 GiB ディスクの 2 つのディスクがあります。
- サーバー ノード (クラスター制御プレーン)。サーバー ノードはワークロードも実行します。
- エージェント ノード。ワークロードの実行専用に設計されています (制御プレーン サービスはありません)。必要なエージェント ノード数が 0 の場合、空の Managed Instance Group が作成されます。
- GPU ノード。ビデオ カードを備えた ML モデル専用のノードです。必要な GPU ノード数が 0 の場合、Managed Instance Group は作成されません。
- Automation Suite ロボット ノード。ロボット ワークロードの実行専用です。必要な Automation Suite ロボット ノード数が 0 の場合、空の Managed Instance Group が作成されます。Automation Suite ロボット ノードには、追加でロボットのパッケージのキャッシュ用として 32 GiB のディスクがあります。
- ポート
443
からノードへの HTTPS トラフィックのバランスを取るために使用されるパブリック ロード バランサー。 - ノード登録要求を転送するために必要な 2 つの内部ロード バランサーと 1 つの Managed Instance Group。VM のインスタンス サイズは可能な限り小さいサイズとなります。
- 別個の VM としてデプロイされる Task Mining ノード。このインスタンス タイプは n2-standard-32 です。
- 他のノードへのアクセスに使用される踏み台インスタンス。パブリック IP を持ち、SSH が有効化されています。
- SQL データベース インスタンス:
- 8 コア、32 GiB RAM
- ディスク サイズ 1000 GiB (手動で拡張可能)
- データベースはインストーラーによって作成されます。
- Process Mining がインストールされていて、クラスターが HA である (サーバー ノードが 3 つ以上ある) 場合は、セカンダリ SQL データベース インスタンスがデプロイされます。
- 16 コア、32 GiB RAM
- ディスク サイズ 100 GiB (手動で拡張可能)
- Process Mining に必要なデータベースはインストーラーによって作成されます。
- SQL Server、Automation Suite プラットフォーム、および ArgoCD コンソール用に自動生成された資格情報を保存するために使用される Secret Manager。
DNS
- DNS を自動的に LB に接続することはできないため、以下のとおりとなります。
- DNS の構成手順を実行できるのはインストールが終わった後のみですが、このような構成はインストール中に必要となります。プライベート DNS ゾーンはこの問題を解決し、インストールの完了後に安全に削除することができます。テスト目的の場合は、「手順 4: DNS を構成する」を確認してください。
RHEL
- Google が予告なしに RHEL のバージョンを更新し、これにより Automation Suite のデプロイがサポート対象外となる場合があります。現在のところ、カスタム RHEL イメージを使用した手動デプロイが、サポート対象であり続ける唯一の方法です。