- Überblick
- Anforderungen
- Bereitstellungsvorlagen
- Anleitung: Vorbereiten der Installation
- Anleitung: Vorbereiten der Installation
- Schritt 2: Konfigurieren der OCI-konformen Registrierung für Offline-Installationen
- Schritt 3: Konfigurieren des externen Objektspeichers
- Schritt 4: Konfigurieren des High Availability Add-on
- Schritt 5: Konfigurieren von SQL-Datenbanken
- Schritt 7: Konfigurieren des DNS
- Schritt 8: Konfigurieren der Datenträger
- Schritt 9: Konfigurieren der Einstellungen auf Kernel- und Betriebssystemebene
- Schritt 10: Konfigurieren der Knotenports
- Schritt 11: Anwenden verschiedener Einstellungen
- Schritt 12: Validieren und Installieren der erforderlichen RPM-Pakete
- Cluster_config.json-Beispiel
- Allgemeine Konfiguration
- Profilkonfiguration
- Zertifikatkonfiguration
- Datenbankkonfiguration
- Konfiguration des externen Objektspeichers
- Vorsignierte URL-Konfiguration
- ArgoCD-Konfiguration
- Konfiguration der Kerberos-Authentifizierung
- Externe OCI-konforme Registrierungskonfiguration
- Disaster Recovery: Aktiv/Passiv- und Aktiv/Aktiv-Konfigurationen
- Konfiguration des High Availability Add-ons
- Spezifische Orchestrator-Konfiguration
- Insights-spezifische Konfiguration
- Process Mining-spezifische Konfiguration
- Spezifische Konfiguration für Document Understanding
- Spezifische Konfiguration für Automation Suite Robots
- AI Center-spezifische Konfiguration
- Konfiguration der Überwachung
- Optional: Konfigurieren des Proxyservers
- Optional: Aktivieren der Widerstandsfähigkeit gegen zonale Ausfälle in einem HA-fähigen Produktionscluster mit mehreren Knoten
- Optional: Übergeben einer benutzerdefinierten resolv.conf-Datei
- Optional: Erhöhen der Fehlertoleranz
- Hinzufügen eines dedizierten Agent-Knotens mit GPU-Unterstützung
- Hinzufügen eines dedizierten Agentenknotens für Automation Suite-Roboter
- Schritt 15: Konfigurieren der temporären Docker-Registrierung für Offline-Installationen
- Schritt 16: Validieren der Voraussetzungen für die Installation
- Manuell: Durchführen der Installation
- Nach der Installation
- Clusterverwaltung
- Verwalten von Produkten
- Erste Schritte mit dem Clusterverwaltungsportal
- Migrieren von Redis vom clusterinternen zum externen High Availability Add-on
- Migrieren von Daten zwischen Objectstores
- Clusterinterner Objectstore zu einem externen Objectstore migrieren
- Migrieren von der clusterinternen Registrierung zu einer externen OCI-konformen Registrierung
- Manueller Wechsel zum sekundären Cluster in einem Aktiv-/Passiv-Setup
- Disaster Recovery: Durchführen von Vorgängen nach der Installation
- Umwandlung einer bestehenden Installation in eine Multi-Site-Einrichtung
- Richtlinien zum Upgrade einer Aktiv/Passiv- oder Aktiv/Aktiv-Bereitstellung
- Leitlinien zum Sichern und Wiederherstellen einer Aktiv-/Passiv- oder Aktiv/Aktiv-Bereitstellung
- Skalieren einer Bereitstellung mit einem einzelnen Knoten (Auswertung) zu einer Bereitstellung mit mehreren Knoten (HA).
- Überwachung und Warnungen
- Migration und Upgrade
- Migrieren zwischen Automation Suite-Clustern
- Aktualisieren der Automation Suite
- Herunterladen der Installationspakete und Übertragen aller Dateien auf den ersten Serverknoten
- Abrufen der zuletzt angewendeten Konfiguration aus dem Cluster
- Aktualisieren der Clusterkonfiguration
- Konfigurieren der OCI-konformen Registrierung für Offline-Installationen
- Ausführen des Upgrades
- Durchführen von Vorgängen nach dem Upgrade
- Produktspezifische Konfiguration
- Konfigurieren von Orchestrator-Parametern
- Konfigurieren von AppSettings
- Konfigurieren der maximalen Anforderungsgröße
- Überschreiben der Speicherkonfiguration auf Clusterebene
- Konfigurieren von NLog
- Speichern von Roboterprotokollen in Elasticsearch
- Konfigurieren von Anmeldeinformationsspeichern
- Konfigurieren der Verwendung von einem Verschlüsselungsschlüssel pro Mandant
- Bereinigen der Orchestrator-Datenbank
- Best Practices und Wartung
- Fehlersuche und ‑behebung
- Fehlerbehebung bei Diensten während der Installation
- Deinstallieren des Clusters
- Löschen von Offline-Artefakten für mehr Speicherplatz
- So löschen Sie Redis-Daten
- So können Sie die Istio-Protokollierung aktivieren
- So werden Protokolle manuell bereinigt
- So löschen Sie alte Protokolle, die im sf-logs-Bucket gespeichert sind
- So deaktivieren Sie Streaming-Protokolle für das AI Center
- Fehlerbehebung bei fehlgeschlagenen Automation Suite-Installationen
- So löschen Sie Bilder aus dem alten Installationsprogramm nach dem Upgrade
- Deaktivieren von TX-Prüfsummen-Offloading
- So legen Sie die ArgoCD-Protokollebene manuell auf Info fest
- So erweitern Sie den AI Center-Speicher
- So wird der codierte pull_secret_value für externe Registrierungen generiert
- Umgang mit schwachen Verschlüsselungen in TLS 1.2
- So überprüfen Sie die TLS-Version
- So arbeiten Sie mit Zertifikaten
- So planen Sie die Ceph-Sicherung und Wiederherstellung von Daten
- Sammeln von DU-Nutzungsdaten mit dem clusterinternen Objektspeicher (Ceph)
- So installieren Sie RKE2 SELinux in Air-Gap-Umgebungen
- How to clean up old differential backups on an NFS server
- Fehler beim Herunterladen des Pakets
- Die Offlineinstallation schlägt aufgrund fehlender binärer Dateien fehl
- Zertifikatproblem bei der Offlineinstallation
- Validierungsfehler bei der SQL-Verbindungszeichenfolge
- Azure-Datenträger nicht als SSD markiert
- Fehler nach der Zertifikatsaktualisierung
- Virenschutz verursacht Probleme bei der Installation
- Automation Suite funktioniert nach Betriebssystem-Upgrade nicht
- Bei der Automation Suite muss „backlog_wait_time“ auf 0 gesetzt werden.
- Die temporäre Registrierungsinstallation schlägt unter RHEL 8.9 fehl
- Häufiges Neustartproblem bei UiPath-Namespace-Bereitstellungen während Offline-Installationen
- DNS-Einstellungen werden von CoreDNS nicht berücksichtigt
- Upgrade schlägt aufgrund eines fehlerhaften Ceph . fehl
- Rke2 wird aufgrund von Platzproblemen nicht gestartet
- Upgrade schlägt aufgrund von klassischen Objekten in der Orchestrator-Datenbank fehl
- Ceph-Cluster in beeinträchtigtem Status nach parallelem Upgrade
- Dienst-Upgrade schlägt für Apps fehl
- Timeouts beim direkten Upgrade
- Upgrade schlägt in Offline-Umgebungen fehl
- Snapshot-controller-crds Pod im Status CrashLoopBackOff nach dem Upgrade
- Upgrade schlägt aufgrund überschriebener Insights-PVC-Größen fehl
- Festlegen eines Timeout-Intervalls für die Verwaltungsportale
- Die Authentifizierung funktioniert nach der Migration nicht
- kinit: KDC kann für Realm <AD Domain> beim Abrufen der ersten Anmeldeinformationen nicht gefunden werden
- Kinit: Keytab enthält keine geeigneten Schlüssel für *** beim Abrufen der ersten Anmeldeinformationen
- GSSAPI-Vorgang aufgrund eines ungültigen Statuscodes fehlgeschlagen
- Alarm für fehlgeschlagenen Kerberos-tgt-update-Auftrag erhalten
- SSPI-Anbieter: Server in Kerberos-Datenbank nicht gefunden
- Anmeldung eines AD-Benutzers aufgrund eines deaktivierten Kontos fehlgeschlagen
- ArgoCD-Anmeldung fehlgeschlagen
- Aktualisieren Sie die zugrunde liegenden Verzeichnisverbindungen
- Fehler beim Abrufen des Sandbox-Abbilds
- Pods werden nicht in der ArgoCD-Benutzeroberfläche angezeigt
- Redis-Testfehler
- RKE2-Server kann nicht gestartet werden
- Secret nicht im UiPath-Namespace gefunden
- ArgoCD wechselt nach der ersten Installation in den Status „In Bearbeitung“.
- Fehlende Ceph-rook-Metriken in Überwachungs-Dashboards
- Diskrepanz bei gemeldeten Fehlern bei diagnostischen Zustandsprüfungen
- Kein normales Upstream-Problem
- Redis-Start wird durch Antivirenprogramm blockiert
- Document Understanding erscheint nicht auf der linken Leiste der Automation Suite
- Fehlerstatus beim Erstellen einer Datenbeschriftungssitzung
- Fehlerstatus beim Versuch, eine ML-Fähigkeit bereitzustellen
- Migrationsauftrag schlägt in ArgoCD fehl
- Die Handschrifterkennung mit dem Intelligent Form Extractor funktioniert nicht oder arbeitet zu langsam
- Ausführen von Hochverfügbarkeit mit Process Mining
- Die Process Mining-Datenaufnahme ist bei der Anmeldung über Kerberos fehlgeschlagen
- Verbindung mit der Datenbank „AutomationSuite_ProcessMining_Lager“ über eine Verbindungszeichenfolge im pyodbc-Format nicht möglich
- Die Airflow-Installation schlägt mit „sqlaldemy.exc.ArgumentError“ fehl: URL konnte nicht analysiert werden rfc1738 aus Zeichenfolge „
- So fügen Sie eine IP-Tabellenregel hinzu, um den SQL Server-Port 1433 zu verwenden
- Dem Automation Suite-Zertifikat des Servers, auf dem CData Sync ausgeführt wird, wird nicht vertraut
- Ausführen des Diagnosetools
- Verwenden des Automation Suite-Supportpakets
- Erkunden von Protokollen
- Untersuchen der zusammengefassten Telemetrie

Automation Suite unter Linux – Installationsanleitung
Das folgende Architekturdiagramm zeigt eine Bereitstellung von Automation Suite unter Linux mit Kubernetes, das auf sechs Maschinen installiert ist, einem Lastausgleich und Datenspeicher. Es gibt mehrere Maschinentypen: drei Serverknoten, zwei Agent-Knoten und einen spezialisierten Agent-Knoten.
etcd zurückzuführen, die Teil der Kubernetes-Steuerebene ist. Weitere Informationen finden Sie in der etcd-Dokumentation. Aus dem gleichen Grund muss der Großteil der Serverknoten jederzeit verfügbar sein, um den Cluster fehlerfrei zu halten.
Diese Knoten hosten auch die Komponenten, die Datenspeicher auf den Knoten erfordern, z. B. Prometheus, der clusterinterne Objektspeicher Ceph, UiPath Insights und die clusterinterne Docker-Registrierung.
Agent-Knoten werden manchmal als Worker-Knoten bezeichnet. Der Zweck dieser Knoten ist das Hosten von UiPath®-Diensten und anderen gemeinsamen Suite-Funktionen. Da kein Datenträger mit diesen Knoten verbunden ist, können sie die Komponenten nicht hosten, die Datenträgerspeicher erfordern.
Agent-Knoten erzwingen keine Beschränkung für die Anzahl der Knoten, die zu einem bestimmten Zeitpunkt verfügbar sein müssen. Solange der resultierende Cluster über genügend Kapazität verfügt, um alle Pods der verlorenen Knoten zu hosten, funktioniert der Cluster wie erwartet ohne Unterbrechung.
Das sind die speziellen Agent-Knoten, die für spezielle Aufgaben bestimmt sind, z. B. der Automation Suite Robots-Knoten für die Roboterausführung und der GPU-Knoten für das Document Understanding-Modell. Sie können auf diesen Knoten keine anderen UiPath®-Dienste hosten.
Der Lastausgleich, der außerhalb der Automation Suite installiert wird, fungiert als Einstiegspunkt für den Zugriff auf Anwendungen, die im Automation Suite-Cluster gehostet werden. Der Lastausgleich ist erforderlich, um die Fehlertoleranz der Knoten sicherzustellen. Alle Serverknoten müssen auf dem Lastausgleich konfiguriert werden, aber Agent-Knoten können auch optional konfiguriert werden. Spezialisierte Agent-Knoten sind jedoch nicht erforderlich.
Wenn Roboter versuchen, auf den Orchestrator zuzugreifen, trifft der Aufruf auf den Lastausgleich und wird dann einem der verfügbaren Knoten übergeben. Jeder Knoten hostet auch die Netzwerkkomponente namens Istio, ein Service Mesh, das auch wie ein Lastausgleich fungiert. Wenn der Aufruf von Istio empfangen wird, das auf dem Knoten ausgeführt wird, versucht es, die Orchestrator-Instanz auf dem gesamten Cluster zu lokalisieren. Sobald sie gefunden wurde, wird der Aufruf an diese Instanz umgeleitet.
Mehrere kleinere Maschinen oder wenige größere Maschinen?
Es liegt ganz bei Ihnen, ob Sie sich für mehrere kleinere Maschinen oder wenige größere Maschinen entscheiden, wobei beide Optionen ihre Vor- und Nachteile haben. Eine größere Anzahl kleinerer Maschinen bietet eine bessere Resilienz gegenüber Knotenfehlern als eine kleinere Anzahl größerer Maschinen. Doch sie ist auch mit einem größeren Verwaltungsaufwand verbunden.
Wenn Ihr Automation Suite-Cluster beispielsweise 96 vCPU erfordert, können Sie sich für eine der folgenden Optionen entscheiden:
-
Option 1: 6 Maschinen mit jeweils 16 vCPU.
-
Auswirkungen: Wenn eine Maschine ausfällt, wird die Kapazität des Clusters nur um 16 vCPU reduziert, sodass sich dies nur auf Dienste auswirkt, wenn der resultierende Cluster nicht über die erforderliche Kapazität zum Hosten aller Pods verfügt. Die Verwaltung von 6 Maschinen ist jedoch mit einem größeren Aufwand verbunden.
-
-
Option 2: 3 Maschinen mit jeweils 32 vCPU
-
Auswirkungen: Wenn eine Maschine ausfällt, wird die Kapazität des Clusters um 32 vCPU reduziert, was große Auswirkungen auf die Automation Suite hat. Die Verwaltung von 3 Maschinen ist jedoch mit einem geringeren Aufwand verbunden.
-
Letztendlich hängt das Bereitstellungsdesign vom Ziel ab. Wenn das Ziel eine bessere Fehlertoleranz ist, sind mehrere kleinere Maschinen die richtige Wahl. Wenn jedoch ein geringerer Verwaltungsaufwand gewünscht wird, sollte eine kleine Anzahl größerer Maschinen gewählt werden.
Nur Serverknoten anstelle von Agent-Knoten?
Ob Sie sich ausschließlich für Serverknoten anstelle von Agent-Knoten entscheiden, hängt von Ihrem RTO oder RPO ab.
Angenommen, Ihre Automation Suite erfordert 80 vCPU. Dies können Sie folgendermaßen erreichen:
-
Option 1: 5 Servermaschinen mit jeweils 16 vCPU. Hier können höchstens 2 Serverknoten ausfallen.
-
Empfohlen, wenn das Ziel hohe Resilienz gegenüber Datenverlusten ist. Auch wenn 2 Serverknoten ausfallen, sind die Daten intakt und können aus den verbleibenden Replikaten wiederhergestellt werden.
-
-
Option 2: 3 Serverknoten und 2 Agent-Knoten mit jeweils 16 vCPU. Hier können 1 Serverknoten und beide Agent-Knoten ausfallen, also insgesamt 3 Maschinen.
-
Empfohlen, wenn das Ziel die Resilienz der Knotenverfügbarkeit ist. Auch ohne 3 Maschinen ist der Cluster mit begrenzter Kapazität weiterhin verfügbar. Sobald die Knoten wieder funktionieren, wird der gesamte Cluster wiederhergestellt. Dieses Setup ist jedoch anfälliger für Datenverluste, da der Speicher mit den Serverknoten verbunden ist. Wenn 2 Serverknoten vollständig ausfallen, kann es schwierig sein, die Daten wiederherzustellen, ohne sie aus dem Backup abzurufen.
-