- Überblick
- Anforderungen
- Installation
- Fragen und Antworten: Bereitstellungsvorlagen
- Herunterladen der Installationspakete
- install-uipath.sh-Parameter
- Aktivieren eines High Availability Add-ons für den Cluster
- Document Understanding-Konfigurationsdatei
- Hinzufügen eines dedizierten Agent-Knotens mit GPU-Unterstützung
- Verbinden einer Task Mining-Anwendung
- Hinzufügen eines dedizierten Agent-Knotens für Task Mining
- Nach der Installation
- Clusterverwaltung
- Verwalten von Produkten
- Verwalten des Clusters in ArgoCD
- Einrichten des externen NFS-Servers
- Automatisiert: Aktivieren der Sicherung im Cluster
- Automatisiert: Deaktivieren der Clustersicherung
- Automatisiert, online: Wiederherstellen des Clusters
- Automatisiert, offline: Wiederherstellen des Clusters
- Manuell: Aktivieren der Clustersicherung
- Manuell: Deaktivieren der Clustersicherung
- Manuell, online: Wiederherstellen des Clusters
- Manuell, offline: Wiederherstellen des Clusters
- Zusätzliche Konfiguration
- Migrieren von Objectstore von persistentem Volume zu Raw-Festplatten
- Überwachung und Warnungen
- Migration und Upgrade
- Migrationsoptionen
- Schritt 1: Verschieben der Identitätsorganisationsdaten von einer eigenständigen in die Automation Suite
- Schritt 2: Wiederherstellen der eigenständigen Produktdatenbank
- Schritt 3: Sichern der Plattformdatenbank in der Automation Suite
- Schritt 4: Zusammenführen von Organisationen in der Automation Suite
- Schritt 5: Aktualisieren der migrierten Produktverbindungszeichenfolgen
- Schritt 6: Migrieren von eigenständigen Insights
- Schritt 7: Löschen des Standardmandanten
- B) Migration von einzelnen Mandanten
- Produktspezifische Konfiguration
- Best Practices und Wartung
- Fehlersuche und ‑behebung
- Fehlerbehebung bei Diensten während der Installation
- Deinstallieren des Clusters
- Löschen von Offline-Artefakten für mehr Speicherplatz
- So löschen Sie Redis-Daten
- So können Sie die Istio-Protokollierung aktivieren
- So werden Protokolle manuell bereinigt
- So löschen Sie alte Protokolle, die im sf-logs-Bucket gespeichert sind
- So deaktivieren Sie Streaming-Protokolle für das AI Center
- Fehlerbehebung bei fehlgeschlagenen Automation Suite-Installationen
- So löschen Sie Bilder aus dem alten Installationsprogramm nach dem Upgrade
- Automatisches Bereinigen von Longhorn-Snapshots
- Deaktivieren von TX-Prüfsummen-Offloading
- Umgang mit schwachen Verschlüsselungen in TLS 1.2
- Es kann keine Offlineinstallation auf RHEL 8.4 OS ausgeführt werden.
- Fehler beim Herunterladen des Pakets
- Die Offlineinstallation schlägt aufgrund fehlender binärer Dateien fehl
- Zertifikatproblem bei der Offlineinstallation
- Die erste Installation schlägt während des Longhorn-Setups fehl
- Validierungsfehler bei der SQL-Verbindungszeichenfolge
- Voraussetzungsprüfung für das Selinux-iscsid-Modul schlägt fehl
- Azure-Datenträger nicht als SSD markiert
- Fehler nach der Zertifikatsaktualisierung
- Automation Suite funktioniert nach Betriebssystem-Upgrade nicht
- Für die Automation Suite muss Backlog_wait_time festgelegt werden 1
- Volume nicht bereitstellbar, da es nicht für Workloads bereit ist
- RKE2 schlägt während der Installation und Aktualisierung fehl
- Fehler beim Hoch- oder Herunterladen von Daten im Objektspeicher
- Die Größenänderung eines PVC bewirkt keine Korrektur von Ceph
- Fehler beim Ändern der Größe von objectstore PVC
- Rook Ceph oder Looker-Pod hängen im Init-Status fest
- Fehler beim Anhängen eines StatefulSet-Volumes
- Fehler beim Erstellen persistenter Volumes
- Patch zur Rückgewinnung von Speicherplatz
- Sicherung aufgrund des Fehlers „TooManySnapshots“ fehlgeschlagen
- Alle Longhorn-Replikate sind fehlerhaft
- Festlegen eines Timeout-Intervalls für die Verwaltungsportale
- Aktualisieren Sie die zugrunde liegenden Verzeichnisverbindungen
- Anmeldung nach der Migration nicht mehr möglich
- Kinit: KDC kann für Realm <AD Domain> beim Abrufen der ersten Anmeldeinformationen nicht gefunden werden
- Kinit: Keytab enthält keine geeigneten Schlüssel für *** beim Abrufen der ersten Anmeldeinformationen
- Der GSSAPI-Vorgang ist mit Fehler fehlgeschlagen: Es wurde ein ungültiger Statuscode übermittelt (Die Anmeldeinformationen des Clients wurden widerrufen).
- Alarm für fehlgeschlagenen Kerberos-tgt-update-Auftrag empfangen
- SSPI-Anbieter: Server nicht in Kerberos-Datenbank gefunden
- Die Anmeldung ist für den Benutzer <ADDOMAIN><aduser> fehlgeschlagen. Grund: Das Konto ist deaktiviert.
- ArgoCD-Anmeldung fehlgeschlagen
- Fehler beim Abrufen des Sandbox-Abbilds
- Pods werden nicht in der ArgoCD-Benutzeroberfläche angezeigt
- Redis-Testfehler
- RKE2-Server kann nicht gestartet werden
- Secret nicht im UiPath-Namespace gefunden
- Nach der ersten Installation wechselte ArgoCD in den Status „Progressing“.
- MongoDB-Pods in „CrashLoopBackOff“ oder ausstehende PVC-Bereitstellung nach Löschung
- UNERWARTETE INKONSISTENZ; fsck MANUELL AUSFÜHREN
- Herabgestufte MongoDB- oder Geschäftsanwendungen nach der Clusterwiederherstellung
- Self-heal-operator und Sf-k8-utils-Repository fehlen
- Fehlerhafte Dienste nach Clusterwiederherstellung oder Rollback
- RabbitMQ-Pod bleibt in CrashLoopBackOff hängen
- Prometheus im Zustand „CrashloopBackoff“ mit OOM-Fehler (Out-of-Memory)
- Fehlende Ceph-rook-Metriken in Überwachungs-Dashboards
- Pods können nicht mit FQDN in einer Proxy-Umgebung kommunizieren
- Document Understanding erscheint nicht auf der linken Leiste der Automation Suite
- Fehlerstatus beim Erstellen einer Datenbeschriftungssitzung
- Fehlerstatus beim Versuch, eine ML-Fähigkeit bereitzustellen
- Migrationsauftrag schlägt in ArgoCD fehl
- Die Handschrifterkennung mit dem Intelligent Form Extractor funktioniert nicht oder arbeitet zu langsam
- Verwenden des Automation Suite-Diagnosetools
- Verwenden des Automation Suite-Supportpakets
- Erkunden von Protokollen
Automation Suite-Installationsanleitung
Entfernen eines Knotens aus dem Cluster
Nach der Installation der Automation Suite können Sie jeden Knoten zu Maschinenwartungszwecken aus dem Cluster entfernen oder nicht verwendete Ressourcen freigeben. Sie können Server-, Agenten-, Task Mining- und GPU-Knoten aus dem Cluster entfernen.
Das Entfernen eines Knotens aus dem Cluster ist nur bei HA-Produktionsumgebungen mit mehreren Knoten möglich.
Das Entfernen von Knoten aus dem Cluster verursacht keine Ausfallzeit. Dies kann sich jedoch auf die interne Caching-Komponente auswirken, wenn HAA nicht konfiguriert ist.
Das Entfernen des Task Mining- oder GPU-Knotens wartet nicht auf bereits geplante Aufträge, z. B. Trainingspipelines oder Analysen. Wenn diese Aufträge beim Entfernen von Knoten gelöscht werden, müssen Sie sie erneut starten. Stellen Sie sicher, dass keine Prozesse auf den Knoten ausgeführt werden, die Sie entfernen möchten.
Die folgenden Schritte führen nur dazu, dass die Knoten aus dem Cluster entfernt werden. Die Maschine wird nicht vollständig gelöscht und einige Rückstände können sie für die weitere Installation unbrauchbar machen.
Formatieren Sie die Maschine und bereiten Sie sie auf die Installation oder das Hinzufügen zu einem vorhandenen Cluster vor, indem Sie die Anweisungen unter Konfigurieren der Maschine befolgen.
Um einen Knoten erfolgreich aus dem Cluster zu entfernen, müssen die folgenden Voraussetzungen erfüllt sein:
- Die Kapazität des resultierenden Clusters muss mit der insgesamt erforderlichen Kapazität übereinstimmen, um die vor dem Entfernen des Knotens geplanten Workloads auszuführen. Wenn bei Gesamt-Workloads beispielsweise 32 vCPU und 64 GiB Speicher erforderlich sind, dann sollten die verbleibenden Knoten im Cluster nach dem Entfernen des Knotens mindestens die gleiche Menge an Ressourcen haben. Andernfalls dürfen Sie die Knoten nicht entfernen.
- Der resultierende Cluster muss über mindestens 3 Serverknoten verfügen. Außerdem ist eine ungerade Anzahl von Serverknoten erforderlich.
- Wenn das Setup multizonal ist, muss der daraus folgende Cluster in jeder der 3 Zonen Serverknoten haben.
- Der Cluster (d. h. alle Knoten oder Pods) muss sich in einem gesunden Zustand befinden. Der Pod-Zustand ist schlecht, wenn er in einem der folgenden Zustände ist:
Pending
,Error
,Init
,Crashloopbackoff
,Terminating
. - Sie können Task Mining- und GPU-Knoten nur entfernen, wenn zusätzliche entsprechende Task Mining- und GPU-Knoten verfügbar sind.
Um einen Knoten aus dem Cluster zu entfernen, führen Sie die folgenden Schritte aus:
Das Skript warnt Sie, den Knoten herunterzufahren oder zu beenden. Der Knoten wird erst dann aus dem Cluster gelöscht, wenn Sie den Knoten herunterfahren. Das Skript wartet 5 Minuten, bis der Knoten heruntergefahren wurde, bevor das Zeitlimit überschritten wird. Das Skript enthält Anweisungen dazu, welcher Knoten in welcher Reihenfolge heruntergefahren werden soll. Sie können das Skript auch erneut ausführen, wenn Sie den Knoten nicht in der angeforderten Zeit heruntergefahren haben.
Führen Sie die folgenden Schritte aus, um den gesamten Prozess zum Entfernen des Knotens zu automatisieren:
- Fügen Sie das Flag
--skip-node-deletion
am Ende des Skripts in Schritt 3 hinzu. - Sobald das Skript erfolgreich ist, fahren Sie den ersten Zielknoten herunter und führen Sie das Skript erneut aus, diesmal ohne
--skip-node-deletion
. Wenn Sie den Knoten nicht in der für das Skript angegebenen Reihenfolge heruntergefahren haben, schlägt es fehl. Sie können das Skript jederzeit erneut ausführen, sobald der erwartete Knoten heruntergefahren wurde. - Wiederholen Sie den vorherigen Schritt, bis alle Knoten erfolgreich entfernt wurden.
Informationen zum Abrufen des Namens der zu entfernende Knoten finden Sie unter Abrufen des Knotennamens.