automation-suite
2024.10
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Linux の Automation Suite のインストール ガイド

最終更新日時 2026年3月9日

ストレージ アラート

kubernetes-system

KubernetesDiskPressure

このアラートは、Kubernetes ノードでのディスクの使用量が非常に高いことを示しています。

このアラートが発生した場合は、どのポッドがより多くのディスクを消費しているかを確認してみてください。

  • 次のコマンドを使用して、ノードが DiskPressure 状態にあるかどうかを確認します。

    kubectl describe node <node-name>
    kubectl describe node <node-name>
    

    出力の DiskPressure 条件を特定します。

  • 影響を受けるノードのディスク領域の使用状況を確認します。

    df -h
    df -h
    

    これは、マウントされているすべてのファイルシステムのディスク使用量を示します。 使用率が高い場所を特定します。

  • ディスクがいっぱいでクリーンアップが不十分な場合は、ノードのディスクのサイズを変更することを検討してください (特に AWS や GCP などのクラウド環境の場合)。 このプロセスでは、インフラストラクチャによってはボリュームの拡張が必要になる場合があります。

KubernetesMemoryPressure

このアラートは、Kubernetes ノードでのメモリ使用量が非常に高いことを示しています。

インシデントの種類 MemoryPressure Kubernetes ノードは、Kubernetes クラスター ノードのメモリが不足している場合に発生し、アプリケーションのメモリ リークが原因である可能性があります。 この種類のインシデントでは、ダウンタイムを防ぎ、Kubernetes クラスターが適切に機能するように、早急な対応が必要です。

このアラートが発生した場合は、以下の手順を実行して、より多くのメモリを消費しているノード上のポッドを特定してみてください。

  1. ノードの CPU とメモリの統計情報を取得します。

    kubectl top node
    kubectl top node
    
  2. ノードで実行されているポッドを取得します。

    kubectl get pods --all-namespaces -o wide --field-selector spec.nodeName=${NODE_NAME}
    kubectl get pods --all-namespaces -o wide --field-selector spec.nodeName=${NODE_NAME}
    
  3. 名前空間内のポッドのメモリ使用量を確認するには、以下を使用します。

    kubectl top pod --namespace <namespace>
    kubectl logs -f <pod-name> -n <ns>
    kubectl top pod --namespace <namespace>
    kubectl logs -f <pod-name> -n <ns>
    

メモリ使用量が多いポッドを特定できる場合は、そのポッドのログをチェックして、メモリ リーク エラーを探します。

この問題を解決するには、可能であればノードのメモリ仕様を増やします。

問題が解決しない場合は、 サポート バンドル を生成して UiPath® サポートにお問い合わせください。

KubePersistentVolumeFillingUp

Warning の場合: 利用可能な領域が 30% を下回っており、4 日以内に満杯になる可能性があります。

Critical の場合: 利用可能な領域が 10% を下回っています。

サービスで領域を使い果たした場合、データの復元が困難になる可能性があります。したがって、利用可能な領域が 0% に達する前にボリュームのサイズを変更する必要があります。

手順については、「 クラスターを構成する」をご覧ください。

Prometheus 固有のアラートに関する詳細と手順については、「 PrometheusStorageUsage 」をご覧ください。

KubePersistentVolumeErrors

PersistentVolume をプロビジョニングできません。これは、ボリュームを必要とするサービスが開始されないことを意味します。Longhorn や Ceph のストレージでその他のエラーが発生していないかご確認のうえ、UiPath® サポートにお問い合わせください。

node-exporter

NodeFilesystemSpaceFillingUp

特定のノードのファイルシステムが満杯になりつつあります。

このアラートが発生した場合は、以下の手順を検討してください。

  • 次のコマンドを使用して、ノードが DiskPressure 状態にあるかどうかを確認します。

    kubectl describe node <node-name>
    kubectl describe node <node-name>
    

    出力の DiskPressure 条件を特定します。

  • ログと一時ファイルをクリアします。 /var/log/内の大きなログ ファイルを確認し、可能であればクリーンアップします。

  • 影響を受けるノードのディスク領域の使用状況を確認します。

    df -h
    df -h
    

    これは、マウントされているすべてのファイルシステムのディスク使用量を示します。 使用率が高い場所を特定します。

  • ディスクがいっぱいでクリーンアップが不十分な場合は、ノードのディスクのサイズを変更することを検討してください (特に AWS や GCP などのクラウド環境の場合)。 このプロセスでは、インフラストラクチャによってはボリュームの拡張が必要になる場合があります。

NodeFilesystemAlmostOutOfSpace

特定のノードのファイルシステムが満杯になりつつあります。ディスクを追加するか未使用のディスクをマウントすることによって、さらに多くの領域をプロビジョニングします。

NodeFilesystemFilesFillingUp

特定のノードのファイルシステムが満杯になりつつあります。ディスクを追加するか未使用のディスクをマウントすることによって、さらに多くの領域をプロビジョニングします。

NodeFilesystemAlmostOutOfFiles

特定のノードのファイルシステムが満杯になりつつあります。ディスクを追加するか未使用のディスクをマウントすることによって、さらに多くの領域をプロビジョニングします。

NodeNetworkReceiveErrs

これらのエラーは、ネットワーク ドライバーが多数のエラーを報告していることを示しています。 これは、物理的なハードウェア障害、または物理ネットワークの設定ミスが原因である可能性があります。 この問題は OS に関連し、UiPath® アプリケーションでは制御できません。

このアラートは、Linux カーネルが提供する/proc/net/dev カウンターを監視することによってトリガーされます。

ネットワーク管理者および物理インフラストラクチャを管理するチームに連絡してください。

NodeNetworkTransmitErrs

これらのエラーは、ネットワーク ドライバーが多数のエラーを報告していることを示しています。 これは、物理的なハードウェア障害、または物理ネットワークの設定ミスが原因である可能性があります。 この問題は OS に関連し、UiPath® アプリケーションでは制御できません。

このアラートは、Linux カーネルが提供する/proc/net/dev カウンターを監視することによってトリガーされます。

ネットワーク管理者および物理インフラストラクチャを管理するチームに連絡してください。

ceph.rules、cluster-state-alert.rules

CephClusterErrorState

このアラートは、Ceph ストレージ クラスターが 10 分を超えてエラー ステートにあることを示します。

このアラートは、 rook-ceph-mgr ジョブが許容できない時間エラー ステートにあることを示しています。このアラートよりも前にトリガーされた可能性がある他のアラートがないか確認し、それらのアラートを先にトラブル―シューティングしてください。

kubectl describe cephcluster -n rook-ceph
kubectl describe cephcluster -n rook-ceph

CephMonQuorumAtRisk

このアラートは、ストレージ クラスターのクォーラムが少ないことを示します。

複数の Monitor が連携して動作し冗長性を確保します。これが可能なのは、各 Monitor がメタデータのコピーを保持しているためです。クラスターは 3 つの Monitor でデプロイされ、クォーラムのとストレージ操作を実行するには、2 つ以上の Monitor が実行されている必要があります。クォーラムが失われた場合、データへのアクセスが失われる可能性があります。

このアラートが発生した場合は、終了ステートにある OSD があるかどうかを確認し、そうである場合は、そのポッドを強制的に削除し、演算子が調整を行うまでしばらく待ちます。問題が解決しない場合は UiPath® サポートにお問い合わせください。

CephMgrIsAbsent (英語)

このアラートは、Ceph Manager が Prometheus ターゲットの検出から消滅したことを示します。

このアラートが発生した場合は、Ceph Manager ポッドが起動して実行されており、正常であることを確認してください。 ポッドが正常な場合は、ログを確認し、ポッドで Prometheus メトリックの出力が有効になっているかどうかを確認します。

CephNodeDown

このアラートは、Ceph ポッドを実行しているノードが停止していることを示します。 Ceph はノードの障害に対処するように設計されているため、ストレージ操作は引き続き機能しますが、別のノードがダウンしてストレージ機能に影響を与えるリスクを最小限に抑えるために、この問題を解決することをお勧めします。

このアラートが発生した場合、マルチノード クラスターの場合は、ポッドを別のノードでスケジュールする必要があります。 rook-ceph名前空間の新しい osd ポッドが新しいノードで実行中で正常な状態であることを確認します。

次のコマンドを使用してノードを記述することで、ノードの障害を確認できます。

kubectl get nodes
kubectl get nodes

ノードを確認して問題の根本原因を特定し、UiPath® サポートにお問い合わせください。

cluster-utilization-alert.rules

CephClusterNearFull

このアラートは、Ceph ストレージ クラスターの使用状況が 75% を超えたこと、ならびに 85% に到達すると読み取り専用になることを示します。

このアラートが発生した場合は、AI Center または Task Mining の未使用のデータセットを削除して Ceph 内の一部の領域を解放するか Ceph PVC で利用可能なストレージを拡張します。

PVC のサイズを変更する前に、ストレージ要件を満たしていることを確認してください。詳しくは、「 必要なストレージを評価する」をご覧ください。

CephClusterCriticallyFull

このアラートは、Ceph ストレージ クラスターの使用状況が 80% を超えたこと、ならびに 85% に到達すると読み取り専用になることを示します。

このアラートが発生した場合は、AI Center または Task Mining の未使用のデータセットを削除して Ceph 内の一部の領域を解放するか Ceph PVC で利用可能なストレージを拡張します。

PVC のサイズを変更する前に、ストレージ要件を満たしていることを確認してください。詳しくは、「 必要なストレージを評価する」をご覧ください。

CephClusterReadOnly

このアラートは、Ceph ストレージ クラスターの使用状況が 85% を超えたため、これより読み取り専用になることを示します。いくつかの領域を解放するか、ストレージ クラスターを直ちに拡張してください。

このアラートが発生した場合は、AI Center または Task Mining の未使用のデータセットを削除して Ceph 内の一部の領域を解放するか Ceph PVC で利用可能なストレージを拡張します。

PVC のサイズを変更する前に、ストレージ要件を満たしていることを確認してください。詳しくは、「 必要なストレージを評価する」をご覧ください。

osd-alert.rules

CephOSDCriticallyFull

アラートの重要度が Critical の場合、利用可能な領域は 20% を下回っています。

サービスで領域を使い果たした場合、データの復元が困難になる可能性があります。したがって、利用可能な領域が 10% に達する前にボリュームのサイズを変更する必要があります。手順については「クラスターを構成する」をご覧ください。

CephOSDNearFull

このアラートは、Ceph ストレージ クラスターの使用状況が 75% を超えたこと、ならびに 85% に到達すると読み取り専用になることを示します。

このアラートが発生した場合は、AI Center または Task Mining の未使用のデータセットを削除して Ceph 内の一部の領域を解放するか Ceph PVC で利用可能なストレージを拡張します。

PVC のサイズを変更する前に、ストレージ要件を満たしていることを確認してください。詳しくは、「 必要なストレージを評価する」をご覧ください。

PersistentVolumeUsageNearFull

このアラートは、Ceph ストレージ クラスターの使用状況が 75% を超えたこと、ならびに 85% に到達すると読み取り専用になることを示します。

このアラートが発生した場合は、AI Center または Task Mining の未使用のデータセットを削除して Ceph 内の一部の領域を解放するか Ceph PVC で利用可能なストレージを拡張します。

PVC のサイズを変更する前に、ストレージ要件を満たしていることを確認してください。詳しくは、「 必要なストレージを評価する」をご覧ください。

CephOSDフラッピング

このアラートは、ストレージ デーモンが過去 5 分間に 5 回以上再起動したことを示します。

このアラートが発生した場合は、以下の手順を実行します。

  1. Ceph クラスターの健全性を確認します。 Yuoは、Cephツールボックスで ceph status を実行して、フラッピングしているOSDを特定する必要があります。

    kubectl -n rook-ceph exec -it <ceph-tools-pod> -- ceph status
    kubectl -n rook-ceph exec -it <ceph-tools-pod> -- ceph status
    

    Ceph ツール ポッドは、名前空間 内のポッドを一覧表示することで識別できます。

    kubectl -n rook-ceph get pod | grep tools
    kubectl -n rook-ceph get pod | grep tools
    
  2. OSD ログでフラッピングしている OSD ポッドを確認して、問題を特定します。

    kubectl -n rook-ceph logs <osd-pod>
    kubectl -n rook-ceph logs <osd-pod>
    
  3. ノード レベルの問題を特定します。

    • リソースの使用状況を確認します。

      kubectl top node <node-name>
      kubectl top node <node-name>
      
    • ディスクの状態を確認します。 ノードに SSH で接続し、df -hdmesg を実行してディスク エラーを確認する必要があります。

  4. OSD ポッドを再起動します。 問題が一時的なものである場合は、フラッピングしている OSD ポッドを再起動する必要があります。

    kubectl -n rook-ceph delete pod <osd-pod>
    kubectl -n rook-ceph delete pod <osd-pod>
    
  5. OSDとCephモニターの間にネットワーク接続の問題がないことを確認します。

  6. 必要に応じて、フラッピングしているOSDを一時的にマークしますout

    ceph osd out <osd-id>
    ceph osd out <osd-id>
    
  7. クラスターの監視を続行して、問題が再発しないようにします。

CephOSDDiskNotResponding(CephOSDDiskNotResponding)

このアラートは、ホスト・ディスク・デバイスが応答していないことを示します。

このアラートが発生した場合は、以下の手順を実行します。

  1. Ceph クラスターのステータスを確認します。 Ceph クラスターの全体的な正常性を確認し、OSD ステータスの詳細を取得する必要があります。

    • Ceph ツールボックス ポッド内で次のコマンドを実行します。

      kubectl -n rook-ceph exec -it <ceph-tools-pod> -- ceph status
      kubectl -n rook-ceph exec -it <ceph-tools-pod> -- ceph status
      
    • 名前空間 内のポッドをリストして、Ceph ツール ポッドを特定します。

      kubectl -n rook-ceph get pod | grep tools
      kubectl -n rook-ceph get pod | grep tools
      
  2. OSD ポッドのステータスを確認します。 OSD ポッドが実行されているかどうかを確認する必要があります。 次のコマンドを実行して、すべての OSD ポッドのステータスを確認します。

    kubectl -n rook-ceph get pods | grep osd
    kubectl -n rook-ceph get pods | grep osd
    

    いずれかの OSD ポッドが CrashLoopBackOff 状態または Pending 状態にある場合は、OSD ディスクまたは基になるノードに問題があることを示している可能性があります。

  3. 影響を受ける OSD ポッドを再起動します。 OSD ポッドが不正なステート (CrashLoopBackOffErrorなど) の場合は、ポッドを再起動して、問題が自然に解決するかどうかを確認する必要があります。 Kubernetes は自動的にポッドの再スケジュールを試みます。

    kubectl -n rook-ceph delete pod <osd-pod>
    kubectl -n rook-ceph delete pod <osd-pod>
    

    OSDポッドが再起動され、一時的な問題の場合は、これで解決する可能性があります。

  4. OSDログを確認します。 再起動しても問題が解決しない場合は、OSD ポッド ログで、ディスクが応答しない理由の詳細を確認します。

    kubectl -n rook-ceph logs <osd-pod>
    kubectl -n rook-ceph logs <osd-pod>
    

    ディスク関連のエラーやその他の問題(I/Oエラー、マウントの失敗など)を探します。

  5. ノード レベルの問題を特定します。 OSDディスクが正しくマウントされていないか、切断されている場合は、影響を受けるノードにログインして、ディスクのマウントステータスを確認できます。

    ssh <node> df -h
    ssh <node> df -h
    

    Ceph が予期しているディスクが見つからないか、マウントされていないディスクを探します。 必要に応じて、ディスクを再マウントするか、ディスクに障害が発生した場合は交換します。

CephOSDDisk利用不可

このアラートは、Ceph OSDディスクがホスト上でアクセスできないことを示します。

このアラートが発生した場合は、以下の手順を実行します。

  1. Ceph クラスターのステータスを確認します。 Ceph クラスターの全体的な正常性を確認し、OSD ステータスの詳細を取得する必要があります。

    • Ceph ツールボックス ポッド内で次のコマンドを実行します。

      kubectl -n rook-ceph exec -it <ceph-tools-pod> -- ceph status
      kubectl -n rook-ceph exec -it <ceph-tools-pod> -- ceph status
      
    • 名前空間 内のポッドをリストして、Ceph ツール ポッドを特定します。

      kubectl -n rook-ceph get pod | grep tools
      kubectl -n rook-ceph get pod | grep tools
      
  2. OSD ポッドのステータスを確認します。 OSD ポッドが実行されているかどうかを確認する必要があります。 次のコマンドを実行して、すべての OSD ポッドのステータスを確認します。

    kubectl -n rook-ceph get pods | grep osd
    kubectl -n rook-ceph get pods | grep osd
    

    いずれかの OSD ポッドが CrashLoopBackOff 状態または Pending 状態にある場合は、OSD ディスクまたは基になるノードに問題があることを示している可能性があります。

  3. 影響を受ける OSD ポッドを再起動します。 OSD ポッドが不正なステート (CrashLoopBackOffErrorなど) の場合は、ポッドを再起動して、問題が自然に解決するかどうかを確認する必要があります。 Kubernetes は自動的にポッドの再スケジュールを試みます。

    kubectl -n rook-ceph delete pod <osd-pod>
    kubectl -n rook-ceph delete pod <osd-pod>
    

    OSDポッドが再起動され、一時的な問題の場合は、これで解決する可能性があります。

  4. OSDログを確認します。 再起動しても問題が解決しない場合は、OSD ポッド ログで、ディスクが応答しない理由の詳細を確認します。

    kubectl -n rook-ceph logs <osd-pod>
    kubectl -n rook-ceph logs <osd-pod>
    

    ディスク関連のエラーやその他の問題(I/Oエラー、マウントの失敗など)を探します。

persistent-volume-alert.rules

PersistentVolumeUsageCritical

このアラートが発生した場合は、AI Center または Task Mining の未使用のデータセットを削除して Ceph 内の一部の領域を解放するか Ceph PVC で利用可能なストレージを拡張します。

PVC のサイズを変更する前に、ストレージ要件を満たしていることを確認してください。詳しくは、「 必要なストレージを評価する」をご覧ください。

pool-quota.rules

CephPoolQuotaBytesCriticallyExhausted

このアラートは、Ceph のストレージ プールの使用量が 90% を超えたことを示します。

このアラートが発生した場合は、AI Center または Task Mining の未使用のデータセットを削除して CEPH 内の一部の領域を解放するか Ceph PVC で利用可能なストレージを拡張します。

PVC のサイズを変更する前に、ストレージ要件を満たしていることを確認してください。詳しくは、「 必要なストレージを評価する」をご覧ください。

host-disk

LowDiskForRancherPartition

このアラートは、 /var/lib/rancher パーティションの空き領域が次の割合より少ないことを示します。

  • 25% - アラートの重要度は「重大」です

ホストサーバーにログインし、ディスクの使用状況を確認する必要があります。 df -h /var/lib/rancher などのコマンドを使用して、使用可能なディスク容量を確認できます。スペースが不足している場合は、次のオプションを検討してください。

  • 不要なファイルを消去します。 時間が経つにつれて、ログ ファイル、一時ファイル、孤立したデータ、およびバックアップは、大量の領域を消費する可能性があります。 これらのファイルを定期的にクリーンアップすると、ディスク領域の維持に役立ちます。

  • パーティションのサイズを変更します。 ファイルシステムがサポートしていて、ディスクに未使用の空き領域がある場合は、パーティションのサイズを変更してディスク容量を増やすことができます。

  • ディスク容量を追加します。 前の手順では不十分で、インフラストラクチャで許可されている場合は、Rancher が適切に機能するようにディスクのサイズを増やします。

  • 異常に大きなファイルのストレージ使用量を確認します。

    find /var/lib/rancher -type f -exec du -h {} + | sort -rh | head -n 10
    find /var/lib/rancher -type f -exec du -h {} + | sort -rh | head -n 10
    
  • 巨大なファイルをディスクに書き込んでいるコンテナーがないか確認します。

LowDiskForKubeletPartition

このアラートは、 /var/lib/kubelet パーティションの空き領域が次の割合より少ないことを示します。

  • 25% - アラートの重要度は「重大」です

このアラートが発生した場合は、ディスクの容量を増やしてください。

LowDiskForVarPartition

このアラートは、 /var パーティションの空き領域が次の割合より少ないことを示します。

  • 25% - アラートの重要度は「重大」です
    注:

    これは、コンテナー システム ログの蓄積が原因で発生する可能性があります。

このアラートが発生した場合は、以下の手順を実行します。

  1. ストレージの使用状況を確認します。

    find /var/ -type f -exec du -h {} + | sort -rh | head -n 10
    find /var/ -type f -exec du -h {} + | sort -rh | head -n 10
    
  2. ディスクのサイズを増やします。

LowDiskForVarLogPartition

このアラートは、 /var/lib/var パーティションの空き領域が次の割合より少ないことを示します。

  • 25% - アラートの重要度は「重大」です

このアラートが発生した場合は、ディスクの容量を増やしてください。

このページは役に立ちましたか?

接続

ヘルプ リソース サポート

学習する UiPath アカデミー

質問する UiPath フォーラム

最新情報を取得