Automation Suite
2021.10
偽
- 概要
- 要件
- インストール
- インストール後
- クラスターの管理
- 監視とアラート機能
- 移行とアップグレード
- 製品固有の設定
- ベストプラクティスとメンテナンス
- トラブルシューティング
- 移行後にログインできない
- 管理ポータルのタイムアウト期間を設定する
- 基になるディレクトリ接続を更新する
- Kinit: Cannot Find KDC for Realm <AD Domain> While Getting Initial Credentials
- kinit: Keytab contains no suitable keys for *** while getting initial credentials
- GSSAPI operation failed with error: An invalid status code was supplied (Client's credentials have been revoked).
- Login Failed for User <ADDOMAIN><aduser>.Reason: The Account Is Disabled.
- Alarm received for failed kerberos-tgt-update job
- SSPI Provider: Server not found in Kerberos database
- Automation Suite 診断ツールを使用する
- Automation Suite サポート バンドル ツールを使用する
- ログを確認する
AI Center に関する考慮事項
Automation Suite インストール ガイド
最終更新日 2024年4月19日
AI Center に関する考慮事項
プラットフォームの全要件に含まれるコア サービス要件に加えて、AI Center では、実行またはトレーニングするモデルに応じて追加リソースが必要です。
次の表で、AI Center で必要となる追加リソースについて説明します。この表では、すべてのサーバー ノードにデータ ディスクが必要です。これは、エージェント ノードでは不要です。
使用 |
CPU |
RAM (GiB) |
GPU |
ディスク (GiB) |
---|---|---|---|---|
サービング (ML スキル、1 つのレプリカ) の最小要件 |
0.6 |
2 |
0 |
|
トレーニング (パイプライン) の最小要件 |
1 |
4 |
0 |
|
DU モデルのサービング (ML スキル、1 つのレプリカ) |
1 |
4 |
0 |
|
DU モデルのトレーニング |
2 |
24 |
強く推奨 |
|
次の表で、AI Center の小規模および平均的な実装に必要なリソースについて説明します。これらの数は一般的な指針です。この表では、すべてのサーバー ノードにデータ ディスクが必要です。これは、エージェント ノードでは不要です。
使用 |
CPU |
RAM (GiB) |
GPU |
ディスク (GiB) |
---|---|---|---|---|
小規模な実装:
|
4 |
32 |
0 |
|
平均的な実装:
|
8 |
52 |
強く推奨 |
|