- Démarrage
- Configuration requise pour le réseau
- Exigences et installation d'un nœud unique
- Exigences et installation d'un multi-nœuds
- Post-installation
- Accéder à AI Center
- Enregistrer un locataire AI Center
- Mise à jour des certificats Orchestrator et Identity Server
- Redimensionner le PVC
- Ajouter un nouveau nœud au cluster
- Installation hors ligne des paquets ML
- Configuration du cluster
- Configuration du nom complet de domaine après l'installation
- Sauvegarder et restaurer le cluster
- Utilisation de la pile de surveillance
- Configurer une authentification Kerberos
- Enregistrement d'un GPU
- Utilisation du fichier de configuration
- Planification des nœuds
- Migration et mise à niveau
- Guide de dépannage de base
Dépannage autonome d'AI Center
Cette section fournit des informations de résolution des problèmes pour AI Center dans un environnement autonome.
Les sections ci-dessous sont spécifiques à AI Center.
Assurez-vous de suivre la procédure adaptée à vos besoins.
input.json
expirera et l'enregistrement d'AI Center auprès du serveur d'identité échouera. Suivez les étapes ci-dessous pour le récupérer.
- Connectez-vous à
https://alm.<LB DNS>
à l'aide du nom d'utilisateuradmin
. Pour obtenir le mot de passe, exécutez la commande suivante :kubectl -n argocd get secret argocd-admin-password -o jsonpath={.data.password} | base64 -d
kubectl -n argocd get secret argocd-admin-password -o jsonpath={.data.password} | base64 -d - Accédez à ArgoCD et cliquez sur la vignette aicenter .
- Cliquez sur DÉTAILS DE L'APPLICATION (APP DETAILS) et accédez à l'onglet Manifest (Manifest).
- Dans l'onglet Manifeste (Manifest), cliquez sur Modifier ( Edit) .
- Obtenez le nouveau jeton d'identité en mettant à jour le champ
accessToken
dans l'onglet Manifeste (Manifest) et cliquez sur Enregistrer ( Save).
La synchronisation démarre automatiquement et est terminée.
curl: (92) HTTP/2 stream 0 was not closed cleanly: HTTP_1_1_REQUIRED (err 13)
.
S'il y a un problème avec vos bases de données, vous pouvez les recréer à partir de zéro directement après l'installation.
Vous pouvez le faire en exécutant une commande SQL pour supprimer toutes les bases de données et les recréer comme suit :
USE [master]
ALTER DATABASE [AutomationSuite_AICenter] SET SINGLE_USER WITH ROLLBACK IMMEDIATE
DROP DATABASE [AutomationSuite_AICenter]
CREATE DATABASE [AutomationSuite_AICenter]
GO
USE [master]
ALTER DATABASE [AutomationSuite_AICenter] SET SINGLE_USER WITH ROLLBACK IMMEDIATE
DROP DATABASE [AutomationSuite_AICenter]
CREATE DATABASE [AutomationSuite_AICenter]
GO
L'installateur ne peut pas se connecter à ArgoCD pour vérifier si le mot de passe a été réinitialisé
Ce problème peut se produire lors de l'installation de Fabric. Le programme d'installation peut échouer en renvoyant une erreur similaire à celle présentée ci-dessous.
appproject.argoproj.io/fabric created
configmap/argocd-cm configured
[INFO] [2021-09-02T09:21:15+0000]: Checking if ArgoCD password was reset, looking for secrets/argocd-admin-password.
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:21:16+0000]: Secret not found, trying to log in with initial password...1/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:21:36+0000]: Secret not found, trying to log in with initial password...2/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:21:56+0000]: Secret not found, trying to log in with initial password...3/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:22:16+0000]: Secret not found, trying to log in with initial password...4/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:22:36+0000]: Secret not found, trying to log in with initial password...5/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:22:56+0000]: Secret not found, trying to log in with initial password...6/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:23:17+0000]: Secret not found, trying to log in with initial password...7/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:23:37+0000]: Secret not found, trying to log in with initial password...8/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:23:57+0000]: Secret not found, trying to log in with initial password...9/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:24:17+0000]: Secret not found, trying to log in with initial password...10/10
[ERROR][2021-09-02T09:24:37+0000]: Failed to log in
appproject.argoproj.io/fabric created
configmap/argocd-cm configured
[INFO] [2021-09-02T09:21:15+0000]: Checking if ArgoCD password was reset, looking for secrets/argocd-admin-password.
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:21:16+0000]: Secret not found, trying to log in with initial password...1/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:21:36+0000]: Secret not found, trying to log in with initial password...2/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:21:56+0000]: Secret not found, trying to log in with initial password...3/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:22:16+0000]: Secret not found, trying to log in with initial password...4/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:22:36+0000]: Secret not found, trying to log in with initial password...5/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:22:56+0000]: Secret not found, trying to log in with initial password...6/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:23:17+0000]: Secret not found, trying to log in with initial password...7/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:23:37+0000]: Secret not found, trying to log in with initial password...8/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:23:57+0000]: Secret not found, trying to log in with initial password...9/10
FATA[0000] dial tcp: lookup remusr-sf on 168.63.129.16:53: no such host
[INFO] [2021-09-02T09:24:17+0000]: Secret not found, trying to log in with initial password...10/10
[ERROR][2021-09-02T09:24:37+0000]: Failed to log in
Vérifiez tous les sous-domaines requis et assurez-vous qu'ils sont correctement configurés et routables comme suit :
getent ahosts automationsuite.mycompany.com | awk '{print $1}' | sort | uniq
getent ahosts alm.automationsuite.mycompany.com | awk '{print $1}' | sort | uniq
getent ahosts registry.automationsuite.mycompany.com | awk '{print $1}' | sort | uniq
getent ahosts monitoring.automationsuite.mycompany.com | awk '{print $1}' | sort | uniq
getent ahosts objectstore.automationsuite.mycompany.com | awk '{print $1}' | sort | uniq
getent ahosts automationsuite.mycompany.com | awk '{print $1}' | sort | uniq
getent ahosts alm.automationsuite.mycompany.com | awk '{print $1}' | sort | uniq
getent ahosts registry.automationsuite.mycompany.com | awk '{print $1}' | sort | uniq
getent ahosts monitoring.automationsuite.mycompany.com | awk '{print $1}' | sort | uniq
getent ahosts objectstore.automationsuite.mycompany.com | awk '{print $1}' | sort | uniq
automationsuite.mycompany.com
par le nom de domaine complet de votre cluster.
Si les commandes/lignes ci-dessus ne renvoient pas d'adresse IP routable, le sous-domaine requis pour AI Center n'est pas configuré correctement.
Cette erreur se produit lorsque le DNS n'est pas public.
Vous devez ajouter la zone DNS privée (pour Azure) ou Route 53 (pour AWS).
Si les commandes ci-dessus renvoient la bonne adresse IP, suivez les étapes ci-dessous.
- Supprimez l'espace de noms ArgoCD en exécutant la commande suivante :
export KUBECONFIG=/etc/rancher/rke2/rke2.yaml export PATH=$PATH:/var/lib/rancher/rke2/bin kubectl delete namespace argocd
export KUBECONFIG=/etc/rancher/rke2/rke2.yaml export PATH=$PATH:/var/lib/rancher/rke2/bin kubectl delete namespace argocd - Run the following command to
verify:
kubectl get namespace
kubectl get namespace
Il ne devrait pas y avoir d'espace de noms ArgoCD dans la sortie de cette commande.
Pour les problèmes liés à l'accès à AI Center, veillez à suivre les étapes des sections suivantes :
https://objectstore.${CONFIG_CLUSTER_FQDN}
url une fois avec chaque navigateur que vous souhaitez utiliser afin de pouvoir interagir avec le stockage.
- Jeton d'identité expiré
- Description
- Étapes de récupération
- Message : curl: (92) Le flux HTTP/2 0 n'a pas été fermé correctement : HTTP_1_1_REQUIRED (err 13)
- Description
- Solution
- Comment recréer des bases de données
- L'installateur ne peut pas se connecter à ArgoCD pour vérifier si le mot de passe a été réinitialisé
- Description
- Solution 1
- Solution 2
- Problèmes lors de l’accès à AI Center
- Activation d'AI Center sur le cluster restauré
- Activation d'AI Center sur le cluster restauré