ノードの起動とシャットダウン

このページでは、Automation Suite の手動および自動の起動時とシャットダウン時の動作について説明します。

起動時の動作

rke2-service が開始した後、node-drainer と node-uncordon が開始します。node-drainer は起動時に何も実行せず、サービスが稼働しているという確認を返すだけです。

node-uncordon は 1 回だけ実行され、ノードの遮断を解除する /opt/node-drain.sh nodestart を開始します。シャットダウン時に発生するドレイン手順の一部として、ノードが遮断され、スケジュールできなくなります。この状態は、rke2 サービスの開始後も維持されます。そのため、rke2-service の再起動後にノードの遮断を解除する必要があります。

手動の起動

このサービスは Automation Suite によって自動的に開始されます。ただし、手動で rke2-service を停止した場合は、次のコマンドを実行してサービスを再開する必要があります。

サーバーノードで実行されている Kubernetes プロセスを開始します。
```
systemctl start rke2-serversystemctl start rke2-server
```
サーバーノードで実行されている Kubernetes プロセスを開始します。
```
systemctl start rke2-agentsystemctl start rke2-agent
```
rke2 サービスが開始したら、ノードの遮断を解除して、Kubernetes がこのノードでワークロードをスケジュールできるようにします。
```
systemctl restart node-uncordonsystemctl restart node-uncordon
```
ノードが起動したら、ノードのドレインを行う必要があります。
```
systemctl start node-drain.servicesystemctl start node-drain.service
```
重要:
手順 4 をスキップすると、システムの再起動時に Kubelet サービスが異常な方法でシャットダウンする可能性があります。

シャットダウン時の動作

シャットダウン中、systemd は開始時の順序でサービスを停止します。node-drain サービスには After=rke2-server.service または After=rke2-agent.service ディレクティブが設定されているため、rke2-service をシャットダウンする前にシャットダウンシーケンスを実行します。つまり、適切に構成されたシステムでは、単にノードを正常にシャットダウンするのは安全な操作です。

手動の再起動

rke2 サービスを停止してマシンを再起動する場合は、次の手順を実行します。

ノードメンテナンスアクティビティの実行中にクラスターの健全性を確保するためには、そのノードで実行されているワークロードを他のノードにドレインする必要があります。ノードのドレインを行うには、次のコマンドを実行します。
```
systemctl stop node-drain.servicesystemctl stop node-drain.service
```
サーバーノードで実行されている Kubernetes プロセスを停止します。
```
systemctl stop rke2-serversystemctl stop rke2-server
```
エージェントノードで実行されている Kubernetes プロセスを停止します。
```
systemctl stop rke2-agentsystemctl stop rke2-agent
```
rke2 サービスと containerd およびすべての子プロセスを強制終了します。
```
rke2-killall.shrke2-killall.sh
```
これはすでにパスに存在するはずですが、/bin/rke2-killall.sh にあります。

インストール時に作成されるファイル

インストール中に、次のユニットファイルが作成されます。
- rke2-server.service (サーバーのみ)。rke2-server を開始します。これにより、サーバーノードが開始されます。
- rke2-agent.service (エージェントのみ)。rke2-agent を開始します。これにより、エージェントノードが開始されます。
- node-drain.service。シャットダウン時に使用されます。rke2-agent または rke2-server をシャットダウンする前に実行され、ドレインを実行します。タイムアウトは 300 秒です。
- node-uncordon.service。起動時にノードの遮断を解除するために使用されます。
- var-lib-kubelet.mount。fstab ジェネレーターによって自動生成されます。
- var-lib-rancher-rke2-server-db.mount。fstab ジェネレーターによって自動生成されます。
- var-lib-rancher.mount。fstab ジェネレーターによって自動生成されます。

ユニットファイル間に強い依存関係はありません。ただし、node-drain と node-uncordon には After=rke2-server.service または After=rke2-agent.service ディレクティブが設定されています。つまり、これらのサービスは rke2-service の後に開始されます。