- Überblick
- Anforderungen
- Installation
- Fragen und Antworten: Bereitstellungsvorlagen
- Herunterladen der Installationspakete
- install-uipath.sh-Parameter
- Aktivieren eines High Availability Add-ons für den Cluster
- Document Understanding-Konfigurationsdatei
- Hinzufügen eines dedizierten Agent-Knotens mit GPU-Unterstützung
- Verbinden einer Task Mining-Anwendung
- Hinzufügen eines dedizierten Agent-Knotens für Task Mining
- Nach der Installation
- Clusterverwaltung
- Verwalten von Produkten
- Verwalten des Clusters in ArgoCD
- Einrichten des externen NFS-Servers
- Automatisiert: Aktivieren der Sicherung im Cluster
- Automatisiert: Deaktivieren der Clustersicherung
- Automatisiert, online: Wiederherstellen des Clusters
- Automatisiert, offline: Wiederherstellen des Clusters
- Manuell: Aktivieren der Clustersicherung
- Manuell: Deaktivieren der Clustersicherung
- Manuell, online: Wiederherstellen des Clusters
- Manuell, offline: Wiederherstellen des Clusters
- Zusätzliche Konfiguration
- Migrieren von Objectstore von persistentem Volume zu Raw-Festplatten
- Überwachung und Warnungen
- Migration und Upgrade
- Migrationsoptionen
- Schritt 1: Verschieben der Identitätsorganisationsdaten von einer eigenständigen in die Automation Suite
- Schritt 2: Wiederherstellen der eigenständigen Produktdatenbank
- Schritt 3: Sichern der Plattformdatenbank in der Automation Suite
- Schritt 4: Zusammenführen von Organisationen in der Automation Suite
- Schritt 5: Aktualisieren der migrierten Produktverbindungszeichenfolgen
- Schritt 6: Migrieren von eigenständigen Insights
- Schritt 7: Löschen des Standardmandanten
- B) Migration von einzelnen Mandanten
- Produktspezifische Konfiguration
- Best Practices und Wartung
- Fehlersuche und ‑behebung
- Fehlerbehebung bei Diensten während der Installation
- Deinstallieren des Clusters
- Löschen von Offline-Artefakten für mehr Speicherplatz
- So löschen Sie Redis-Daten
- So können Sie die Istio-Protokollierung aktivieren
- So werden Protokolle manuell bereinigt
- So löschen Sie alte Protokolle, die im sf-logs-Bucket gespeichert sind
- So deaktivieren Sie Streaming-Protokolle für das AI Center
- Fehlerbehebung bei fehlgeschlagenen Automation Suite-Installationen
- So löschen Sie Bilder aus dem alten Installationsprogramm nach dem Upgrade
- Automatisches Bereinigen von Longhorn-Snapshots
- Deaktivieren von TX-Prüfsummen-Offloading
- Umgang mit schwachen Verschlüsselungen in TLS 1.2
- Es kann keine Offlineinstallation auf RHEL 8.4 OS ausgeführt werden.
- Fehler beim Herunterladen des Pakets
- Die Offlineinstallation schlägt aufgrund fehlender binärer Dateien fehl
- Zertifikatproblem bei der Offlineinstallation
- Die erste Installation schlägt während des Longhorn-Setups fehl
- Validierungsfehler bei der SQL-Verbindungszeichenfolge
- Voraussetzungsprüfung für das Selinux-iscsid-Modul schlägt fehl
- Azure-Datenträger nicht als SSD markiert
- Fehler nach der Zertifikatsaktualisierung
- Automation Suite funktioniert nach Betriebssystem-Upgrade nicht
- Für die Automation Suite muss Backlog_wait_time festgelegt werden 1
- Volume nicht bereitstellbar, da es nicht für Workloads bereit ist
- RKE2 schlägt während der Installation und Aktualisierung fehl
- Fehler beim Hoch- oder Herunterladen von Daten im Objektspeicher
- Die Größenänderung eines PVC bewirkt keine Korrektur von Ceph
- Fehler beim Ändern der Größe von objectstore PVC
- Rook Ceph oder Looker-Pod hängen im Init-Status fest
- Fehler beim Anhängen eines StatefulSet-Volumes
- Fehler beim Erstellen persistenter Volumes
- Patch zur Rückgewinnung von Speicherplatz
- Sicherung aufgrund des Fehlers „TooManySnapshots“ fehlgeschlagen
- Alle Longhorn-Replikate sind fehlerhaft
- Festlegen eines Timeout-Intervalls für die Verwaltungsportale
- Aktualisieren Sie die zugrunde liegenden Verzeichnisverbindungen
- Anmeldung nach der Migration nicht mehr möglich
- Kinit: KDC kann für Realm <AD Domain> beim Abrufen der ersten Anmeldeinformationen nicht gefunden werden
- Kinit: Keytab enthält keine geeigneten Schlüssel für *** beim Abrufen der ersten Anmeldeinformationen
- Der GSSAPI-Vorgang ist mit Fehler fehlgeschlagen: Es wurde ein ungültiger Statuscode übermittelt (Die Anmeldeinformationen des Clients wurden widerrufen).
- Alarm für fehlgeschlagenen Kerberos-tgt-update-Auftrag empfangen
- SSPI-Anbieter: Server nicht in Kerberos-Datenbank gefunden
- Die Anmeldung ist für den Benutzer <ADDOMAIN><aduser> fehlgeschlagen. Grund: Das Konto ist deaktiviert.
- ArgoCD-Anmeldung fehlgeschlagen
- Fehler beim Abrufen des Sandbox-Abbilds
- Pods werden nicht in der ArgoCD-Benutzeroberfläche angezeigt
- Redis-Testfehler
- RKE2-Server kann nicht gestartet werden
- Secret nicht im UiPath-Namespace gefunden
- Nach der ersten Installation wechselte ArgoCD in den Status „Progressing“.
- MongoDB-Pods in „CrashLoopBackOff“ oder ausstehende PVC-Bereitstellung nach Löschung
- UNERWARTETE INKONSISTENZ; fsck MANUELL AUSFÜHREN
- Herabgestufte MongoDB- oder Geschäftsanwendungen nach der Clusterwiederherstellung
- Self-heal-operator und Sf-k8-utils-Repository fehlen
- Fehlerhafte Dienste nach Clusterwiederherstellung oder Rollback
- RabbitMQ-Pod bleibt in CrashLoopBackOff hängen
- Prometheus im Zustand „CrashloopBackoff“ mit OOM-Fehler (Out-of-Memory)
- Fehlende Ceph-rook-Metriken in Überwachungs-Dashboards
- Pods können nicht mit FQDN in einer Proxy-Umgebung kommunizieren
- Document Understanding erscheint nicht auf der linken Leiste der Automation Suite
- Fehlerstatus beim Erstellen einer Datenbeschriftungssitzung
- Fehlerstatus beim Versuch, eine ML-Fähigkeit bereitzustellen
- Migrationsauftrag schlägt in ArgoCD fehl
- Die Handschrifterkennung mit dem Intelligent Form Extractor funktioniert nicht oder arbeitet zu langsam
- Verwenden des Automation Suite-Diagnosetools
- Verwenden des Automation Suite-Supportpakets
- Erkunden von Protokollen
Automation Suite-Installationsanleitung
Verwenden des Automation Suite-Diagnosetools
Das Automation Suite-Diagnosetool ist die erste Lösung, wenn Probleme mit der Automation Suite auftreten. Es überprüft den Zustand der verschiedenen erforderlichen Komponenten und erstellt einen konsolidierten Bericht.
supportability-tools
herunter und extrahieren Sie ihren Inhalt mit den folgenden Befehlen:
curl "https://download.uipath.com/automation-suite/2021.10.3/supportability-tools-2021.10.3.zip" -o supportability-tools-2021.10.3.zip
unzip supportability-tools-2021.10.3.zip -d support-tools
support-tools/diagnostics-tool/
mit dem Befehl bash diagnostics-report.sh
ausführen.
In der folgenden Tabelle sind die Überprüfungen aufgeführt, die das Automation Suite-Diagnosetool durchführt. Beachten Sie, dass Sie das Skript auf einem der Knoten im Cluster sowie extern ausführen können.
Knoten |
Kontrolliert |
---|---|
Master-Knoten |
|
Agenten-Knoten |
|
Externe Maschine |
Hinweis: Um das Skript von einer externen Maschine aus auszuführen, legen Sie zuerst den richtigen
kubeconfig -Kontext auf den Cluster fest und übergeben Sie dann das Flag -e an das Skript bash diagnostics-report.sh -e .
|
Beispielbericht, der vom Automation Suite-Diagnosetool generiert wurde.
INFO-Protokolle in Grün zeigen, dass die erforderlichen Prüfungen bestanden wurden. Sie sollten jedoch die Festplatten-/Speichernutzung weiterhin gründlich kontrollieren, um verborgene Fehler zu vermeiden.
Obwohl diese Meldungen kein hohes Risiko bedeuten, müssen Sie die Fehler möglicherweise korrigieren, da sie sich in bestimmten Fällen auf einige Dienste auswirken könnten.
Sie müssen die von diesen Nachrichten beschriebenen Probleme beheben, da sie sich auf einen Dienst im Cluster auswirken.
Wenn diese Dienste ausgefallen sind, bedeutet dies, dass der Knoten ausgefallen ist. Versuchen Sie, den Dienst mithilfe des systemctl-Neustarts <service-name> neu zu starten. Dadurch sollte das Problem behoben werden.
/var/lib
bereitgestellt wird, da Kubernetes es zum Speichern ihrer Daten verwendet. Wenn das Verzeichnis voll ist, können verschiedene Probleme auftreten. Um diese Probleme zu vermeiden, vergrößern Sie es entsprechend.
Bei allen Knoten geben wir an, ob Festplattendruck oder Speicherdruck vorliegt. Ist das der Fall, können bei Workloads auf diesen Knoten Probleme auftreten. Überprüfen Sie, ob auf diesen Knoten andere Prozesse ausgeführt werden, die Ressourcen verbrauchen, und entfernen Sie sie gegebenenfalls.
Wir verwenden Ceph als S3-Objektspeicher zum Speichern von Protokollen und Dateien aus verschiedenen Anwendungen. Sie können den Status der Dienste sehen. Falls sie ausgefallen sind, müssen Sie sie möglicherweise neu starten. Überprüfen Sie auch, ob die Festplattennutzung durch Ceph ausgereizt ist.
443
und 31443
mit dem angegebenen Hostnamen offen sind. Der Bericht zeigt an, wenn sie nicht zugänglich sind. Stellen Sie sicher, dass Sie die entsprechenden Ports öffnen, falls dieser Hinweis kommt.
Das Tool prüft, ob das hochgeladene Zertifikat für den angegebenen Hostnamen gültig ist und ob es noch nicht abgelaufen ist. Wenn das Zertifikat diese Kriterien nicht erfüllt, treten Fehler auf. Um dies zu verhindern, überprüfen Sie Ihr hochgeladenes Zertifikat und ändern Sie es bei Bedarf.
Da für einige Dienste erforderlich ist, dass auf einigen Knoten im Cluster eine GPU vorhanden ist, prüft das Automation Suite-Diagnosetool, ob GPU-Knoten vorhanden sind, und gibt die Anzahl dieser Knoten aus. Wenn Sie wissen, dass GPU-Knoten vorhanden sind, diese aber hier nicht angezeigt werden, bedeutet das, dass bei der GPU-Einrichtung ein Fehler aufgetreten ist.
MongoDB ist eine wichtige Komponente, die der Dienst UiPath Apps verwendet. Wenn MongoDB oder seine primäre Instanz ausgefallen ist, müssen Sie das Problem mithilfe des Supportpakets untersuchen.
RabbitMQ und DockerRegistry sind zwei wichtige Komponenten, die von einigen Diensten genutzt werden. Ist einer von ihnen ausgefallen, müssen Sie das Problem untersuchen und einen Neustart durchführen.
Die ArgoCD ist unser Tool für das Application Lifecycle Management (ALM). Wenn einer seiner Dienste ausgefallen ist, kann das daran liegen, dass andere Anwendungen veraltet sind oder andere Probleme haben. Die Wiederherstellung dieser Dienste ist wichtig und erfordert möglicherweise weitere Fehlerbehebungen.
Das Automation Suite-Diagnosetool zeigt an, ob ArgoCD-Anwendungen fehlen und beeinträchtigt sind.
- Wenn Anwendungen fehlen, wechseln Sie zur ArgoCD-Benutzeroberfläche und synchronisieren Sie sie.
- Wenn Anwendungen mangelhaft laufen, sind zusätzliche Fehlerbehebungen erforderlich, um die von der ArgoCD ausgelösten Fehler zu untersuchen.
- Lesen von Diagnoseberichten
- INFO-Protokolle
- WARN-Meldungen
- Fehlermeldungen
- Rke2-Server oder Rke2-Agent-Dienst ausgefallen
- Bereitgestellte Verzeichnisgröße unter /var/lib
- Rke2-Version
- Festplattendruck oder Speicherdruck
- Status der Ceph-Dienste
- Ports 443 und 31443
- Gültigkeit des Zertifikats
- GPU
- MongoDB
- RabbitMQ und DockerRegistry
- ArgoCD ausgefallen
- Fehlende oder mangelhafte ArgoCD-Anwendungen