ai-center
2021.10
false
- 基本情報
- ネットワーク要件
- シングルノードの要件とインストール
- マルチノードの要件とインストール
- インストール後
- GPU をプロビジョニングする
- 構成ファイルを使用する
- ノードのスケジュール設定
- 移行とアップグレード
- 基本的なトラブルシューティング ガイド
- AI Center の一般的なトラブルシューティングとよくある質問
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
AI Center インストール ガイド
Last updated 2024年6月6日
AI Center の一般的なトラブルシューティングとよくある質問
データセット ファイルのアップロード時に、次のエラーが発生することがあります。
Failed to upload item(s), it may be due to a slow or lost internet connection
パイプラインを実行する権限がある場合でも、パイプラインを表示または実行しようとすると、エラーが発生することがあります。
まれに、マシンを 2 回連続して再起動すると、サービスのデプロイがスタックする場合があります。これは、DATABASECHANGELOGLOCK のロックが 1 つのサービスで解放されていないことが原因で発生します。この場合、AI Center のポッドが継続的に再起動します。
インポート/エクスポート スクリプトが失敗し、次のエラー メッセージが表示されます。
cookfile_new.txt: Permission denied
インポートまたはエクスポート スクリプトを実行すると、次のエラー メッセージが発生する場合があります。
./export.sh: line 2: $'\r': command not found
このエラー メッセージは、スクリプトを使用して ML パッケージをインポートまたはエクスポートするときに表示されます。
この問題は、UiPath Studio のオートメーションを実行し、パブリック データセットを使用してトレーニング用の検証データをアップロードする際に発生することがあります。
AI Center バージョン 2021.10.1 および 2021.10.2 で
update-mlskills-cm
cronjob が見つかりません。
この問題により ML スキルのデプロイや予測が失敗するのを避けるには、以下の
YAML
ファイルを使用して cronjob を手動で作成します。
apiVersion: batch/v1beta1
kind: CronJob
metadata:
name: update-mlskill-cm
namespace: uipath
spec:
concurrencyPolicy: Forbid
failedJobsHistoryLimit: 1
jobTemplate:
spec:
template:
metadata:
annotations:
sidecar.istio.io/inject: "false"
spec:
containers:
- args:
- -XPOST
- ai-deployer-svc.uipath.svc.cluster.local/ai-deployer/v1/system/mlskills:update-cm
image: registry.uipath.com/aicenter/alpine-curl:7.78.0
imagePullPolicy: IfNotPresent
name: update-mlskill-cm
securityContext:
allowPrivilegeEscalation: false
capabilities:
drop:
- NET_RAW
privileged: false
readOnlyRootFilesystem: true
runAsNonRoot: true
dnsPolicy: ClusterFirst
imagePullSecrets:
- name: regcred
restartPolicy: OnFailure
schedulerName: default-scheduler
securityContext: {}
terminationGracePeriodSeconds: 30
ttlSecondsAfterFinished: 120
schedule: 0 */2 * * *
startingDeadlineSeconds: 200
successfulJobsHistoryLimit: 1
suspend: false
apiVersion: batch/v1beta1
kind: CronJob
metadata:
name: update-mlskill-cm
namespace: uipath
spec:
concurrencyPolicy: Forbid
failedJobsHistoryLimit: 1
jobTemplate:
spec:
template:
metadata:
annotations:
sidecar.istio.io/inject: "false"
spec:
containers:
- args:
- -XPOST
- ai-deployer-svc.uipath.svc.cluster.local/ai-deployer/v1/system/mlskills:update-cm
image: registry.uipath.com/aicenter/alpine-curl:7.78.0
imagePullPolicy: IfNotPresent
name: update-mlskill-cm
securityContext:
allowPrivilegeEscalation: false
capabilities:
drop:
- NET_RAW
privileged: false
readOnlyRootFilesystem: true
runAsNonRoot: true
dnsPolicy: ClusterFirst
imagePullSecrets:
- name: regcred
restartPolicy: OnFailure
schedulerName: default-scheduler
securityContext: {}
terminationGracePeriodSeconds: 30
ttlSecondsAfterFinished: 120
schedule: 0 */2 * * *
startingDeadlineSeconds: 200
successfulJobsHistoryLimit: 1
suspend: false
既存のスキルでのログ ストリーミングを無効化するには、スキルのデプロイを編集し、
LOGS_STREAMING_ENABLED
環境変数を false
に変更します。また、ArgoCD を使用して、aicenter アプリの詳細で logsStreamingEnabled
グローバル変数を追加し、値を false
に設定することもできます。変更後、必ず ArgoCD を同期してください。
- メッセージ: アイテムのアップロードに失敗しました。インターネット接続が遅い、または切断されたことが原因である可能性があります。
- 考えられる原因
- 解決策
- 問題: パイプラインを実行する権限がある場合でも、[パイプライン] ページでエラーが発生する
- 解決策
- 問題: DATABASECHANGELOGLOCK のロックが 1 つのサービスで解放されていないために、サービスのデプロイがスタックすることがある
- 解決策
- 問題: インポート/エクスポート スクリプトが失敗する
- 解決策
- メッセージ: ./export.sh: Line 2: $'r': Command Not Found
- 解決策
- 問題: パブリック データセットの署名済み URL が失敗する
- 解決策
- 問題: update-mlskills-cm cronjob が見つからない
- 解決策
- ストリーミング ログを無効化する
- 2021.10.4 までのバージョン
- 2021.10.5 以降のバージョン