- リリース ノート
- 要件
- インストール
- 基本情報
- プロジェクト
- データセット
- ML パッケージ
- パイプライン
- ML スキル
- ML ログ
- AI Fabric での Document Understanding
- 基本的なトラブルシューティング ガイド
- AI Center の一般的なトラブルシューティングとよくある質問
AI Center の一般的なトラブルシューティングとよくある質問
Connection checking in progress
(接続を確認中)」でスタックすることがあります。
この問題を修正するには、以下の手順を行います。
- ログを終了し、
kubectl get pods
コマンドを使用して conn-checker ポッドのステータスを確認します。 - 「Invalid Image Name」と表示されている場合は、
kubectl describe <conn-checked-pod-name>
コマンドを使用してポッドの説明を表示します。 - 「Failed to apply default image... (既定のイメージの適用に失敗しました...)」というメッセージが [Events] (下部) に表示された場合は、エアギャップ環境と非エアギャップ環境が混在していることを意味する可能性があります。
- インフラストラクチャとアプリケーションが同じポッドにインストールされていることを確認します。
- ライセンスが同じであることを確認します。
yaml
ファイルの [airgapped] フィールドの値が true に設定されているか、およびそれが期待どおりの値であるかを確認します。
- 問題がライセンスに関連している場合は、バックエンドから変更を行う必要があります。ライセンスの提供者に連絡して変更してもらうか、AI Center チームにお問い合わせください。
ホスト管理者ページのエラー (テナント プロビジョニング エラー) が発生した場合は、以下の解決策を使用します。
上記のエラー メッセージにより多数のポッドが退避されていると、マシンの速度が低下したりネットワークの問題を引き起こしたりすることがあります。この問題を解決するには、以下の解決策を使用します。
この問題を解決するには、以下のスクリプトまたは同様のスクリプトを実行します。
IFS=$'\)
'
for line in $(kubectl get pods -A | awk {'printf "%s,%s,%s\)
", $1,$2,$4'} | grep -E "Evicted"); do
ns=$(echo $line | cut -d',' -f1)
pod=$(echo $line | cut -d',' -f2)
kubectl delete pod -n $ns $pod
done
IFS=$'\)
'
for line in $(kubectl get pods -A | awk {'printf "%s,%s,%s\)
", $1,$2,$4'} | grep -E "Evicted"); do
ns=$(echo $line | cut -d',' -f1)
pod=$(echo $line | cut -d',' -f2)
kubectl delete pod -n $ns $pod
done
ポッドの呼び出し中に進行状況を監視するには、スキルに対応するポッドを特定し、Linux マシンに接続して予測実行中のログを確認できるようにする必要があります。最も効率的な方法については、以下の「解決策」セクションをご覧ください。
スキルに対応するポッドを最も効率的に特定するには、以下の手順を行います。
- AI Center アプリケーションに移動します。
- [ML スキル] ページに移動します。
- ページの検証ツールでネットワークの呼び出しを開きます。
- グリッドを更新して ML スキルを取得します。
- ML スキルの呼び出しを見つけてプレビューします。
- リストから正しい ML スキルを見つけて、[tenant-id] と [id] を検索します。テナント ID は名前空間であり、ポッド名です。
- 上記の情報が得られたら、次のコマンドを使用して実行ログを確認します。
kubectl -n <tenant-id> logs -f <id>
kubectl -n <tenant-id> logs -f <id>
これで、スキルの呼び出しプロセスをリアル タイムで確認できます。
ファイルのアップロードの失敗が原因でパイプラインが失敗します。以下のようなエラー メッセージが表示されます。
2021-04-30 20:59:43,397 - uipath_core.storage.local_storage_client:upload:132 - ERROR: Failed to upload file: logs/f5f7b9f4-0813-4107-a269-bf65de12444f/train.log.20210430205938 to bucket: training-8319b955-6187-43c3-a46f-612a9ea6f523, error: can't start new thread
2021-04-30 20:59:48,401 - uipath_core.utils.utils:_retries:172 - WARNING: Function: upload execution failed, retry count 1
2021-04-30 20:59:43,397 - uipath_core.storage.local_storage_client:upload:132 - ERROR: Failed to upload file: logs/f5f7b9f4-0813-4107-a269-bf65de12444f/train.log.20210430205938 to bucket: training-8319b955-6187-43c3-a46f-612a9ea6f523, error: can't start new thread
2021-04-30 20:59:48,401 - uipath_core.utils.utils:_retries:172 - WARNING: Function: upload execution failed, retry count 1
この問題が既に修正されている新しいバージョンの AI Center (例: 2021.4) にアップグレードします。
OR
現時点でアップグレードが不可能な場合は、次のコマンドを使用してトレーニング ポッド内のログを削除します。
kubectl -n <namespace> exec -it <pod_id> -- sh -c 'rm -rf /microservice/trainer_run_logs'
kubectl -n <namespace> exec -it <pod_id> -- sh -c 'rm -rf /microservice/trainer_run_logs'
上記のコマンドでは、次の変数が使用されています。
namespace
- ポッドの名前空間です。kubectl get namespaces
コマンドを実行して取得できます。トレーニングの名前空間はtraining-
で始まります。pod_id
- トレーニング ポッドのポッド ID です。これは、上記のトレーニングの名前空間でkubectl get pod
を実行して取得できます。
インポートまたはエクスポート スクリプトを実行すると、次のエラー メッセージが発生する場合があります。
./export.sh: line 2: $'\r': command not found
このエラー メッセージは、スクリプトを使用して ML パッケージをインポートまたはエクスポートするときに表示されます。