- リリース ノート
- はじめる前に
- 基本情報
- AI Center をインストールする
- 移行とアップグレード
- プロジェクト
- データセット
- データのラベル付け
- ML パッケージ
- すぐに使えるパッケージ
- パイプライン
- パイプラインを管理する
- ループを閉じる
- ML スキル
- ML ログ
- AI Center の Document UnderstandingTM
- AI Center API
- 使い方
- ライセンス
- 基本的なトラブルシューティング ガイド
AI Center ガイド
パイプラインを管理する
パイプラインが作成され、[パイプライン] ページと、選択したパッケージの [ML パッケージの詳細] ページの [パイプライン実行] タブに、詳細とともに表示されます。作成時に選択したタイムフレームに従って、パイプラインが実行されます。
パイプラインの作成時には、すべての種類のパイプラインについて、将来のある特定の日時にスケジュール設定するか、定期的なスケジュールを設定することができます。たとえば、パイプラインを日曜の午前 1 時に実行するようにスケジュールを設定できます。これにより、データが人間参加型のタスクから送り返されてきたときにモデルを継続的に更新し、AI Unit ライセンスをより効率的に使用することができます。
⏲ 将来の 1 つの日付にスケジュール設定されるパイプラインを作成するには、[新しいパイプライン実行を作成] ページで [時間ベース] オプションを選択します。
📅 定期的なスケジュールでパイプラインを作成するには、[新しいパイプライン実行を作成] ページで [定期的] オプションを選択します。
⚙ [定期的なスケジュールを設定] ウィンドウで [詳細] タブを選択し、cron 式を入力すると、ただ「毎日、特定の時間に」実行されるよう指定するのではなく、より複雑なスケジュールを設定できます。cron 式は、さまざまな無料のオンライン ツールで簡単に生成できます。
デプロイされた GPU の数によっては、リソースが制限されるクラスターがあります。
キュー メカニズムでは、GPU の使用要求を管理し、GPU のステータスを監視して、GPU が利用可能になったときに要求を実行します。リソースを管理することにより、要求の追跡と再開始を効率よく行えます。
- ArgoCD の AI Center アプリケーションに移動します。
- [App Details] ボタンをクリックして、アプリケーションの詳細を表示します。
- [Parameters] タブをクリックして、パラメーターとその詳細を確認します。
global.waitQueue.gpuCount
- モデルのトレーニングに使用できる GPU リソースの数を設定します。global.waitQueue.queueLength
- キューの最大長を設定します。この値を超えると、新しい要求はキューに追加できません。推奨されるキューの長さは 5*numGPU です。
機能の有効化
global.waitQueue.enabled
プロパティを true に設定します。
構成
global.waitQueue.gpuCount
または global.waitQueue.queueLength
を変更します。
機能
まだ実行されていないパイプラインのみ編集できます。
- [パイプラインの詳細] ページに移動します。
- [パイプライン] ページで、スケジュールされたパイプラインの横の ⁝ をクリックして、[詳細] を選択します。
- 特定のパッケージの [ML パッケージの詳細] で [パイプライン実行] タブを選択し、実行が予定されているパイプラインの横にある ⁝ をクリックして、[詳細] を選択します。[パイプラインの詳細] ページが表示されます。
- [パイプラインを編集] をクリックします。[パイプライン実行を編集] ページが表示されます。
- パイプラインの名前、スケジュールされたパイプラインのデータ ディレクトリ、および定期的なスケジュールを変更できます。
- [送信] をクリックして変更を保存します。スケジュールされたパイプラインが更新情報とともに、[パイプライン] ページに表示されます。
特定のパイプラインの詳細情報を調べたり、他のアクションを実行したりできます。
-
[パイプライン] ページで、スケジュールされたパイプラインの横の ⁝ をクリックして、[詳細] を選択します。
- 特定のパッケージの [ML パッケージの詳細] で [パイプライン実行] タブを選択し、実行が予定されているパイプラインの横にある ⁝ をクリックして、[詳細] を選択します。[パイプラインの詳細] ページが表示されます。
- また、ML パッケージがパイプラインによって生成された場合には、そのパイプラインに関するすべての情報に [ML パッケージ] ウィンドウの 3 点リーダー メニューのアイコン ⁝ > [パイプラインの詳細] から直接アクセスすることもできるようになりました。この機能は、新しいパイプラインに対してのみ利用できます。
表示される情報と実行できるアクションは、パイプラインのステータスによって異なります。
スケジュールされたパイプラインの [パイプラインの詳細] ページには、情報タブが表示されます。
以下のアクションを実行できます。
パイプラインを削除します。
パイプラインを編集します。表示された [パイプライン実行を編集] ページで、任意のフィールドを更新できます。[今すぐ実行] を選択しても、新しいパイプラインが作成されるわけではありません。このパイプラインが直ちに実行され、スケジュールされたパイプラインのリストから削除されます。
パッケージ中のパイプラインの [パイプラインの詳細] ページには、情報タブが表示されます。
以下のアクションを実行できます。
パイプラインを強制終了します。これによりパイプラインの実行が停止するため、パイプラインは実行されなくなり、AI Unit は消費されなくなります。ステータスは [強制終了] に変わります。
リソース待機中のパイプラインの [パイプラインの詳細] ページには、情報タブが表示されます。
以下のアクションを実行できます。
パイプラインを強制終了します。これによりパイプラインはキューから削除されるため、パイプラインは実行されなくなり、AI Unit は消費されなくなります。ステータスは [強制終了] に変わります。
実行中のパイプラインの [パイプラインの詳細] ページには、情報タブとリアルタイム ログが表示されます。
以下のアクションを実行できます。
パイプラインを強制終了します。これによりパイプラインが直ちに停止し、ステータスが [強制終了] に変わります。ログには、強制終了アクションが実行された時刻のスナップショットが表示されます。
失敗したパイプラインの [パイプラインの詳細] ページには、情報タブとログが表示されます。このパイプラインが失敗したステージに応じて、パイプラインの (部分的な) 出力が表示されます。
以下のアクションを実行できます。
パイプラインを再開します。これにより、作成時とまったく同じパラメーターで、新しいパイプラインがキューに追加されます。キューが空の場合、パイプラインの実行が直ちに開始されます。
強制終了されたパイプラインの [パイプラインの詳細] ページには、情報タブが表示されます。また、このパイプラインが強制終了されたポイントによっては、[パイプラインの詳細] ページにログが表示されることもあります。
以下のアクションを実行できます。
パイプラインを再開します。
パイプラインを削除します。