automation-suite

2023.10

false

Wichtig :

Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Automation Suite unter Linux – Installationsanleitung

Letzte Aktualisierung 6. Nov. 2025

Starten und Herunterfahren eines Knotens

Auf dieser Seite wird das Verhalten beim manuellen und automatischen Starten und Herunterfahren der Automation Suite erklärt.

Wichtig:

Sie müssen immer fortfahren, indem Sie einen Knoten herunterfahren, den erforderlichen Vorgang ausführen, warten, bis der Knoten intakt ist, und dann den anderen Knoten herunterfahren, um den gleichen Vorgang auszuführen.

In der folgenden Tabelle werden verschiedene Szenarien beschrieben, die beim Herunterfahren von Clusterdiensten oder Knoten auftreten können. Die Tabelle enthält detaillierte Aktionen, die Sie für jede Situation ausführen müssen, sowie eine Anleitung, wie Sie das erwartete Verhalten als Reaktion auf diese Aktionen verstehen können.

Szenario	Aktion	Erwartetes Verhalten
Herunterfahren von Clusterdiensten auf einem Knoten, ohne den Knoten aus Wartungsgründen oder aus anderen Gründen auszuschalten.	Führen Sie die Schritte zum Herunterfahren manuell aus. Starten Sie die Dienste neu, indem Sie den manuellen Start verwenden oder die Maschine neu starten.	In einem HA-Szenario bleiben die meisten Dienste aktiv. Der Knoten sollte problemlos gestartet werden und alle ausgefallenen Dienste sollten neu gestartet werden.
Herunterfahren aller Clusterdienste, ohne Knoten auszuschalten, zu Wartungszwecken oder aus anderen Gründen.	Führen Sie auf allen Knoten, beginnend mit den Agent-Knoten, die Schritte zum Herunterfahren manuell aus. Starten Sie die Dienste entweder über den manuellen Start neu, oder starten Sie die Maschinen neu, beginnend mit den Serverknoten.	Die Dienste sind dann nicht mehr verfügbar. Knoten sollten problemlos gestartet werden.
Herunterfahren aller Knoten.	Wenn Ihr Hypervisor-Verwaltungsportal (z. B. VMware, AWS) das ordnungsgemäße Herunterfahren von Diensten zulässt, ohne die Maschine zwangsweise zu beenden, fahren Sie ein normales Herunterfahren durch. Standardmäßig lässt das Systemd-Subsystem einen Übergangszeitraum für das Herunterfahren von Diensten zu, bevor sie zwangsweise beendet werden. Wenn Ihr System jedoch die konfigurierten Herunterfahrenzeiten überschreibt, kann dies ein ordnungsgemäßes Herunterfahren beeinträchtigen. Auf AWS kann die Plattform beispielsweise die Beendigung einer VM nach zwei Minuten erzwingen. Daher müssen die Dienste manuell heruntergefahren werden, da ein Knotenentleerung bis zu 5 Minuten dauern kann (dies ist eine Voraussetzung für ein ordnungsgemäßes Herunterfahren).	Wenn das Herunterfahren ordnungsgemäß ist, sollten die Knoten problemlos starten.
Herunterfahren eines einzelnen Knotens.	Wenn Ihr Hypervisor-Verwaltungsportal (z. B. VMware, AWS) das ordnungsgemäße Herunterfahren von Diensten zulässt, ohne die Maschine zwangsweise zu beenden, fahren Sie ein normales Herunterfahren durch. Standardmäßig lässt das Systemd-Subsystem einen Übergangszeitraum für das Herunterfahren von Diensten zu, bevor sie zwangsweise beendet werden. Wenn Ihr System jedoch konfigurierte Herunterfahrenzeiten überschreibt, kann dies ein ordnungsgemäßes Herunterfahren beeinträchtigen. Bei AWS kann die Plattform beispielsweise die Beendigung einer VM nach zwei Minuten erzwingen. Daher müssen die Dienste manuell heruntergefahren werden, da ein Knotenentleerung bis zu 5 Minuten dauern kann (dies ist eine Voraussetzung für ein ordnungsgemäßes Herunterfahren).	Wenn das Herunterfahren nicht erzwungen wird, sollte der Knoten problemlos neu gestartet werden.
Erzwingen Sie die Beendigung eines Serverknotens.	Nicht anwendbar.	In den meisten Fällen wird der Knoten gestartet, aber bei einigen Diensten, die persistente Daten verwenden, kann es zu Problemen kommen. Obwohl diese Probleme in der Regel behebbar sind, wird die Einrichtung von Sicherungen dringend empfohlen. Der Insights-Pod wird erst neu gestartet, wenn der ursprüngliche Knoten wieder online ist, um potenzielle Datenverluste zu vermeiden. Wenn der Knoten nicht wiederherstellbar ist, wenden Sie sich an das Supportteam.

Verhalten beim Starten

rke2-service wird gestartet, gefolgt von node-drainer und node-uncordon. node-drainer führt beim Start keine Aktion aus, sondern gibt nur die Bestätigung zurück, dass der Dienst aktiv ist.

node-uncordon wird nur einmal ausgeführt und startet /opt/node-drain.sh nodestart, wodurch der Knoten per Uncordon entsperrt wird. Als Teil des Drain-Vorgangs, der beim Herunterfahren ausgeführt wird, wird der Knoten per Cordon gesperrt, sodass er nicht eingeplant werden kann. Dieser Status bleibt bestehen, wenn der rke2-Dienst gestartet wird. Daher muss der Knoten nach rke2-service-Neustarts per Uncordon entsperrt werden.

Manueller Start

Der Dienst wird automatisch mit der Automation Suite gestartet. Wenn rke2-service jedoch manuell gestoppt wurde, müssen Sie den Dienst erneut starten, indem Sie die folgenden Befehle ausführen:

Starten Sie den Kubernetes-Prozess, der auf dem Serverknoten ausgeführt wird:
```
systemctl start rke2-serversystemctl start rke2-server
```
Starten Sie den Kubernetes-Prozess, der auf dem Serverknoten ausgeführt wird:
```
systemctl start rke2-agentsystemctl start rke2-agent
```
Nachdem der rke2-Dienst gestartet wurde, entsperren Sie den Knoten per Uncordon, um sicherzustellen, dass Kubernetes jetzt Workloads auf diesem Knoten planen kann:
```
systemctl restart node-uncordonsystemctl restart node-uncordon
```
Sobald der Knoten gestartet wurde, müssen Sie den Knoten per Drain entfernen:
```
systemctl start node-drain.servicesystemctl start node-drain.service
```
Wichtig:
Wenn Sie Schritt 4 überspringen, kann das dazu führen, dass der Kubelet-Dienst nicht ordnungsgemäß heruntergefahren wird, wenn das System neu gestartet wird.

Verhalten beim Herunterfahren

Während des Herunterfahrens stoppt systemd die Dienste in der Reihenfolge, in der sie gestartet wurden. Da der node-drain-Dienst die Anweisung After=rke2-server.service oder After=rke2-agent.service hat, führt er seine Herunterfahren-Sequence aus, bevor rke2-service heruntergefahren wird. Das bedeutet, dass in einem korrekt konfigurierten System das einfache ordnungsgemäße Herunterfahren des Knotens ein sicherer Vorgang ist.

Manueller Neustart

Wenn Sie den rke2-Dienst stoppen und die Maschine neu starten möchten, führen Sie die folgenden Schritte aus:

Um sicherzustellen, dass der Cluster fehlerfrei ist, während Sie eine Knotenwartungsaktivität ausführen, müssen Sie die Workloads, die auf diesem Knoten ausgeführt werden, per Drain auf andere Knoten umleiten. Um den Knoten per Drain zu entfernen, führen Sie den folgenden Befehl aus:
```
systemctl stop node-drain.servicesystemctl stop node-drain.service
```
Halten Sie den Kubernetes-Prozess an, der auf dem Serverknoten ausgeführt wird:
```
systemctl stop rke2-serversystemctl stop rke2-server
```
Halten Sie den Kubernetes-Prozess an, der auf dem Agent-Knoten ausgeführt wird:
```
systemctl stop rke2-agentsystemctl stop rke2-agent
```
Beenden Sie die rke2-Dienste, containerd und alle untergeordneten Prozesse:
```
rke2-killall.shrke2-killall.sh
```
Informationen zum Herunterladen des rke2-killall.sh -Skripts finden Sie unter Downloadlinks für Installationspakete.

Während der Installation erstellte Dateien

Die folgenden Einheitendateien werden während der Installation erstellt:
- rke2-server.service (nur Server). Startet rke2-server, wodurch der Serverknoten gestartet wird.
- rke2-agent.service (nur Agent). Startet rke2-agent, wodurch der Agent-Knoten gestartet wird.
- node-drain.service. Wird beim Herunterfahren verwendet. Wird vor dem Herunterfahren von rke2-agent oder rke2-server ausgeführt und führt einen Drain durch. Hat ein Timeout von 300 Sekunden.
- node-uncordon.service. Wird beim Starten verwendet, um einen Knoten per Uncordon zu entsperren.
- var-lib-kubelet.mount. Automatisch von „fstab generator“ generiert.
- var-lib-rancher-rke2-server-db.mount. Automatisch von „fstab generator“ generiert.
- var-lib-rancher.mount. Automatisch von „fstab generator“ generiert.

Es gibt keine strengen Abhängigkeiten zwischen den Einheitendateien. node-drain und node-uncordon haben jedoch die Anweisung After=rke2-server.service oder After=rke2-agent.service. Diese Dienste werden deshalb nach rke2-service gestartet.

Auf dieser Seite