Automation Suite
2021.10
False
- Überblick
- Anforderungen
- Installation
- Fragen und Antworten: Bereitstellungsvorlagen
- Herunterladen von Installationspaketen
- install-uipath.sh-Parameter
- Aktivieren eines High Availability Add-ons für den Cluster
- Document Understanding-Konfigurationsdatei
- Hinzufügen eines dedizierten Agent-Knotens mit GPU-Unterstützung
- Verbinden einer Task Mining-Anwendung
- Hinzufügen eines dedizierten Agent-Knotens für Task Mining
- Nach der Installation
- Clusterverwaltung
- Überwachung und Warnungen
- Migration und Upgrade
- Online-Auswertungsmodus mit einem einzelnen Knoten
- Offline-Auswertungsmodus mit einem einzelnen Knoten
- HA-fähiger Online-Produktionsmodus mit mehreren Knoten
- HA-fähiger Offline-Produktionsmodus mit mehreren Knoten
- Migrieren einer physischen Longhorn-Festplatte zum LVM
- Herabstufen von Ceph von 16.2.6 auf 15.2.9
- Migrationsoptionen
- B) Migration von einzelnen Mandanten
- Produktspezifische Konfiguration
- Best Practices und Wartung
- Fehlersuche und ‑behebung
- Fehlerbehebung bei Diensten während der Installation
- Deinstallieren des Clusters
- Löschen von Offline-Artefakten für mehr Speicherplatz
- So deaktivieren Sie TLS 1.0 und 1.1
- So können Sie die Istio-Protokollierung aktivieren
- So werden Protokolle manuell bereinigt
- So löschen Sie alte Protokolle, die im sf-logs-Paket gespeichert sind
- Fehlerbehebung bei fehlgeschlagenen Automation Suite-Installationen
- Deaktivieren von NIC-Prüfsummen-Offloading
- Es kann keine Offlineinstallation auf RHEL 8.4 OS ausgeführt werden.
- Fehler beim Herunterladen des Pakets
- Die Offlineinstallation schlägt aufgrund fehlender binärer Dateien fehl
- Zertifikatproblem bei der Offlineinstallation
- Validierungsfehler bei der SQL-Verbindungszeichenfolge
- Fehler nach der Zertifikatsaktualisierung
- Für die Automation Suite muss Backlog_wait_time festgelegt werden 1
- Anmeldung nach der Migration nicht mehr möglich
- Festlegen eines Timeout-Intervalls für die Verwaltungsportale
- Aktualisieren Sie die zugrunde liegenden Verzeichnisverbindungen
- Kinit: KDC für Bereich <AD-Domäne> kann beim Abrufen der ursprünglichen Anmeldeinformationen nicht gefunden werden
- Kinit: Keytab enthält keine geeigneten Schlüssel für *** beim Abrufen der ersten Anmeldeinformationen
- Der GSSAPI-Vorgang ist mit Fehler fehlgeschlagen: Es wurde ein ungültiger Statuscode übermittelt (Die Anmeldeinformationen des Clients wurden widerrufen).
- Anmeldung für Benutzer <ADDOMAIN><aduser> fehlgeschlagen. Grund: Das Konto ist deaktiviert.
- Alarm für fehlgeschlagenen Kerberos-tgt-update-Auftrag empfangen
- SSPI-Anbieter: Server nicht in Kerberos-Datenbank gefunden
- Fehler beim Abrufen des Sandbox-Abbilds
- Pods werden nicht in der ArgoCD-Benutzeroberfläche angezeigt
- Redis-Testfehler
- RKE2-Server kann nicht gestartet werden
- Secret nicht im UiPath-Namespace gefunden
- ArgoCD wechselt nach der ersten Installation in den Status „In Bearbeitung“.
- UNERWARTETE INKONSISTENZ; fsck MANUELL AUSFÜHREN
- Self-heal-operator und Sf-k8-utils-Repository fehlen
- Herabgestufte MongoDB- oder Geschäftsanwendungen nach der Clusterwiederherstellung
- Fehlerhafte Dienste nach Clusterwiederherstellung oder Rollback
- Document Understanding erscheint nicht auf der linken Leiste der Automation Suite
- Fehlerstatus beim Erstellen einer Datenbeschriftungssitzung
- Fehlerstatus beim Versuch, eine ML-Fähigkeit bereitzustellen
- Migrationsauftrag schlägt in ArgoCD fehl
- Die Handschrifterkennung mit dem Intelligent Form Extractor funktioniert nicht oder arbeitet zu langsam
- Verwenden des Automation Suite-Diagnosetools
- Verwenden des Automation Suite Support Bundle-Tools
- Erkunden von Protokollen
Starten und Herunterfahren eines Knotens
Automation Suite-Installationsanleitung
Letzte Aktualisierung 19. April 2024
Starten und Herunterfahren eines Knotens
Auf dieser Seite wird das Verhalten beim manuellen und automatischen Starten und Herunterfahren der Automation Suite erklärt.
rke2-service
wird gestartet, gefolgt von node-drainer
und node-uncordon
. node-drainer
führt beim Start keine Aktion aus, sondern gibt nur die Bestätigung zurück, dass der Dienst aktiv ist.
node-uncordon
wird nur einmal ausgeführt und startet /opt/node-drain.sh nodestart
, wodurch der Knoten per Uncordon entsperrt wird. Als Teil des Drain-Vorgangs, der beim Herunterfahren ausgeführt wird, wird der Knoten per Cordon gesperrt, sodass er nicht eingeplant werden kann. Dieser Status bleibt bestehen, wenn der rke2-Dienst gestartet wird. Daher muss der Knoten nach rke2-service
-Neustarts per Uncordon entsperrt werden.
Manueller Start
Der Dienst wird automatisch mit der Automation Suite gestartet. Wenn
rke2-service
jedoch manuell gestoppt wurde, müssen Sie den Dienst erneut starten, indem Sie die folgenden Befehle ausführen:
- Starten Sie den Kubernetes-Prozess, der auf dem Serverknoten ausgeführt wird:
systemctl start rke2-server
systemctl start rke2-server - Starten Sie den Kubernetes-Prozess, der auf dem Serverknoten ausgeführt wird:
systemctl start rke2-agent
systemctl start rke2-agent - Nachdem der
rke2
-Dienst gestartet wurde, entsperren Sie den Knoten per Uncordon, um sicherzustellen, dass Kubernetes jetzt Workloads auf diesem Knoten planen kann:systemctl restart node-uncordon
systemctl restart node-uncordon - Sobald der Knoten gestartet wurde, müssen Sie den Knoten per Drain entfernen:
systemctl start node-drain.service
systemctl start node-drain.serviceWichtig:Wenn Sie Schritt 4 überspringen, kann das dazu führen, dass der Kubelet-Dienst nicht ordnungsgemäß heruntergefahren wird, wenn das System neu gestartet wird.
Während des Herunterfahrens stoppt
systemd
die Dienste in der Reihenfolge, in der sie gestartet wurden. Da der node-drain
-Dienst die Anweisung After=rke2-server.service
oder After=rke2-agent.service
hat, führt er seine Herunterfahren-Sequence aus, bevor rke2-service
heruntergefahren wird. Das bedeutet, dass in einem korrekt konfigurierten System das einfache ordnungsgemäße Herunterfahren des Knotens ein sicherer Vorgang ist.
Manueller Neustart
Wenn Sie den rke2-Dienst stoppen und die Maschine neu starten möchten, führen Sie die folgenden Schritte aus:
-
Um sicherzustellen, dass der Cluster fehlerfrei ist, während Sie eine Knotenwartungsaktivität ausführen, müssen Sie die Workloads, die auf diesem Knoten ausgeführt werden, per Drain auf andere Knoten umleiten. Um den Knoten per Drain zu entfernen, führen Sie den folgenden Befehl aus:
systemctl stop node-drain.service
systemctl stop node-drain.service - Halten Sie den Kubernetes-Prozess an, der auf dem Serverknoten ausgeführt wird:
systemctl stop rke2-server
systemctl stop rke2-server - Halten Sie den Kubernetes-Prozess an, der auf dem Agent-Knoten ausgeführt wird:
systemctl stop rke2-agent
systemctl stop rke2-agent -
Beenden Sie die rke2-Dienste und containerd sowie alle untergeordneten Prozesse:
Es sollte bereits im Pfad vorhanden sein, aber Sie finden es unterrke2-killall.sh
rke2-killall.sh/bin/rke2-killall.sh
.
- Die folgenden Einheitendateien werden während der Installation erstellt:
rke2-server.service
(nur Server). Startetrke2-server
, wodurch der Serverknoten gestartet wird.rke2-agent.service
(nur Agent). Startetrke2-agent
, wodurch der Agent-Knoten gestartet wird.node-drain.service
. Wird beim Herunterfahren verwendet. Wird vor dem Herunterfahren vonrke2-agent
oderrke2-server
ausgeführt und führt einen Drain durch. Hat ein Timeout von 300 Sekunden.node-uncordon.service
. Wird beim Starten verwendet, um einen Knoten per Uncordon zu entsperren.var-lib-kubelet.mount
. Automatisch von „fstab generator“ generiert.var-lib-rancher-rke2-server-db.mount
. Automatisch von „fstab generator“ generiert.var-lib-rancher.mount
. Automatisch von „fstab generator“ generiert.
Es gibt keine strengen Abhängigkeiten zwischen den Einheitendateien.
node-drain
und node-uncordon
haben jedoch die Anweisung After=rke2-server.service
oder After=rke2-agent.service
. Diese Dienste werden deshalb nach rke2-service
gestartet.