- Erste Schritte
- Netzwerkanforderungen
- Anforderungen und Installation für einen einzelnen Knoten
- Anforderungen und Installation für mehrere Knoten
- Nach der Installation
- Zugriff auf AI Center
- Bereitstellen eines AI Center-Mandanten
- Aktualisieren von Orchestrator- und Identity Server-Zertifikaten
- Ändern der PVC-Größe
- Hinzufügen eines neuen Knotens zum Cluster
- Offlineinstallation von ML-Paketen
- Konfigurieren des Clusters
- Konfigurieren des FQDN nach der Installation
- Sichern und Wiederherstellen des Clusters
- Verwendung des Überwachungs-Stacks
- Einrichten einer Kerberos-Authentifizierung
- Bereitstellen einer GPU
- Verwenden der Konfigurationsdatei
- Knotenplanung
- Migration und Upgrade
- Grundlegende Anleitung zur Fehlerbehebung
- Allgemeine Fehlerbehebung im AI Center und häufig gestellte Fragen
Allgemeine Fehlerbehebung im AI Center und häufig gestellte Fragen
Meldung: Das Hochladen von Elementen ist fehlgeschlagen. Möglicherweise liegt es an einer langsamen oder unterbrochenen Internetverbindung.
Beim Hochladen von Dataset-Dateien kann der folgende Fehler auftreten:
Failed to upload item(s), it may be due to a slow or lost internet connection
Öffnen Sie die Browserkonsole und rufen Sie das DNS der Objectstore-URL ab. Es hat das Format objectstore.xxx.xx Stellen Sie sicher, dass das Objectstore-DNS auflösbar ist, indem Sie es entweder zur Hostdatei hinzufügen oder mit Ihrem Netzwerkadministrator sprechen. Sobald das DNS aufgelöst ist und das Zertifikat nicht vertrauenswürdig ist, stellen Sie sicher, dass Sie dem Zertifikat vertrauen in Ihrem Browser, bevor Sie das Element hochladen.
Problem: Fehler auf den Pipelines-Seiten, obwohl die Berechtigungen für die Ausführung von Pipelines vorhanden sind.
Beim Versuch, Pipelines anzuzeigen oder auszuführen, kann ein Fehler auftreten, auch wenn die Berechtigungen für die Ausführung von Pipelines vorhanden sind.
Problem: Die Dienstbereitstellung kann stecken bleiben, weil die DATABASECHANGELOGLOCK-Sperre von einem Dienst nicht freigegeben wird.
In seltenen Fällen, wenn Sie die Maschine zweimal hintereinander neu starten, kann die Dienstbereitstellung hängen bleiben, da die Sperre DATABASECHANGELOGLOCK von einem Dienst nicht aufgehoben wird. In diesem Fall werden AI Center-Pods kontinuierlich neu gestartet.
Das Import-/Exportskript schlägt mit der folgenden Fehlermeldung fehl:
cookfile_new.txt: Permission denied
Beim Ausführen der Import- oder Exportskripts kann die folgende Fehlermeldung auftreten:
./export.sh: line 2: $'\r': command not found
Diese Fehlermeldung wird beim Importieren oder Exportieren von ML-Paketen mithilfe von Skripts angezeigt.
Dieses Problem kann auftreten, wenn Sie eine UiPath Studio- Automatisierung ausführen und Validierungsdaten für das Training mit einem öffentlichen Dataset hochladen.
update-mlskills-cm
fehlt in den AI Center-Versionen 2021.10.1 und 2021.10.2.
YAML
-Datei unten verwenden.
apiVersion: batch/v1beta1
kind: CronJob
metadata:
name: update-mlskill-cm
namespace: uipath
spec:
concurrencyPolicy: Forbid
failedJobsHistoryLimit: 1
jobTemplate:
spec:
template:
metadata:
annotations:
sidecar.istio.io/inject: "false"
spec:
containers:
- args:
- -XPOST
- ai-deployer-svc.uipath.svc.cluster.local/ai-deployer/v1/system/mlskills:update-cm
image: registry.uipath.com/aicenter/alpine-curl:7.78.0
imagePullPolicy: IfNotPresent
name: update-mlskill-cm
securityContext:
allowPrivilegeEscalation: false
capabilities:
drop:
- NET_RAW
privileged: false
readOnlyRootFilesystem: true
runAsNonRoot: true
dnsPolicy: ClusterFirst
imagePullSecrets:
- name: regcred
restartPolicy: OnFailure
schedulerName: default-scheduler
securityContext: {}
terminationGracePeriodSeconds: 30
ttlSecondsAfterFinished: 120
schedule: 0 */2 * * *
startingDeadlineSeconds: 200
successfulJobsHistoryLimit: 1
suspend: false
apiVersion: batch/v1beta1
kind: CronJob
metadata:
name: update-mlskill-cm
namespace: uipath
spec:
concurrencyPolicy: Forbid
failedJobsHistoryLimit: 1
jobTemplate:
spec:
template:
metadata:
annotations:
sidecar.istio.io/inject: "false"
spec:
containers:
- args:
- -XPOST
- ai-deployer-svc.uipath.svc.cluster.local/ai-deployer/v1/system/mlskills:update-cm
image: registry.uipath.com/aicenter/alpine-curl:7.78.0
imagePullPolicy: IfNotPresent
name: update-mlskill-cm
securityContext:
allowPrivilegeEscalation: false
capabilities:
drop:
- NET_RAW
privileged: false
readOnlyRootFilesystem: true
runAsNonRoot: true
dnsPolicy: ClusterFirst
imagePullSecrets:
- name: regcred
restartPolicy: OnFailure
schedulerName: default-scheduler
securityContext: {}
terminationGracePeriodSeconds: 30
ttlSecondsAfterFinished: 120
schedule: 0 */2 * * *
startingDeadlineSeconds: 200
successfulJobsHistoryLimit: 1
suspend: false
LOGS_STREAMING_ENABLED
in false
. Sie können auch eine globale Variable logsStreamingEnabled
mit dem Wert false
hinzufügen, indem Sie ArgoCD unter den Details der App aicenter verwenden. Stellen Sie sicher, dass Sie ArgoCD synchronisieren, nachdem die Änderung vorgenommen wurde.
- Meldung: Das Hochladen von Elementen ist fehlgeschlagen. Möglicherweise liegt es an einer langsamen oder unterbrochenen Internetverbindung.
- Mögliche Ursache
- Lösung
- Problem: Fehler auf den Pipelines-Seiten, obwohl die Berechtigungen für die Ausführung von Pipelines vorhanden sind.
- Lösung
- Problem: Die Dienstbereitstellung kann stecken bleiben, weil die DATABASECHANGELOGLOCK-Sperre von einem Dienst nicht freigegeben wird.
- Lösung
- Problem: Import-/Exportskript schlägt fehl
- Lösung
- Meldung: ./export.sh: Zeile 2: $'r': Befehl nicht gefunden
- Lösung
- Problem: Die signierte URL für öffentliche Datasets schlägt fehl
- Lösung
- Problem: Der Cron-Job Update-mlskills-cm fehlt
- Lösung
- Deaktivieren von Streaming-Protokollen
- Versionen bis 2021.10.4
- Versionen ab 2021.10.5