- Vue d'ensemble (Overview)
- Prérequis
- Installation
- Questions et réponses : modèles de déploiement
- Configuration des machines
- Configuration du magasin d'objets externe
- Configuration d'un registre Docker externe
- Configurer l'équilibreur de charge
- Configuration du DNS
- Configuration de Microsoft SQL Server
- Configuration des certificats
- Installation de production en ligne multi-nœuds compatible haute disponibilité
- Installation de production hors ligne multi-nœuds compatible haute disponibilité
- Disaster Recovery - Installation du cluster secondaire
- Téléchargement des packages d'installation
- install-uipath.sh parameters
- Activation du module complémentaire Redis High Availability Add-on pour le cluster
- Fichier de configuration de Document Understanding
- Ajout d'un nœud d'agent dédié avec prise en charge GPU
- Ajout d'un nœud d'agent dédié pour Task Mining
- Connexion de l'application Task Mining
- Ajout d'un nœud d'agent dédié pour les Automation Suite Robots
- Post-installation
- Administration du cluster
- Gestion des produits
- Premiers pas avec le portail d'administration du cluster
- Migration d'un magasin d'objets d'un volume persistant vers des disques bruts
- Migration des données entre les librairies
- Migration d'un magasin d'objets intégré au cluster vers un magasin d'objets externe
- Basculer vers le cluster secondaire
- Disaster Recovery : exécution d'opérations post-installation
- Conversion d'une installation existante en configuration multi-sites
- Directives sur la mise à niveau d'un déploiement actif/passif
- Directives pour la sauvegarde et la restauration d'un déploiement actif/passif
- Surveillance et alerte
- Migration et mise à niveau
- Chemins de mise à niveau Automation Suite
- Automatisée : mise à niveau en ligne
- Automatisée : mise à niveau hors ligne
- Manuel : mise à niveau en ligne
- Manuel : mise à niveau hors ligne
- Annulation en cas d'erreur
- Migration d'un disque physique Longhorn vers LVM
- Migration de Canal vers Cilium CNI
- Rétrogradation de Ceph de la version 16.2.6 à la version 15.2.9
- Options de migration :
- Étape 1 : Déplacement des données d'organisation Identity d'installation autonome vers Automation Suite
- Étape 2 : Restauration de la base de données du produit autonome
- Étape 3 : Sauvegarder la base de données de la plate-forme dans Automation Suite
- Étape 4 : Fusion des organisations dans Automation Suite
- Étape 5 : Mise à jour des chaînes de connexion du produit migré
- Étape 6 : migration de la version autonome d’Insights
- Étape 7 : suppression du locataire par défaut
- B) Migration à locataire unique
- Configuration spécifique au produit
- Rotation des informations d’identification de stockage d’objets blob
- Désactivation de l'utilisation d'URL pré-signées lors du téléchargement de données vers le stockage Amazon S3
- Configuration de la sécurité de l'application de processus
- Configurer une authentification Kerberos avec l’authentification MSSQL de base pour Process Mining
- Bonnes pratiques et maintenance
- Résolution des problèmes
- Comment résoudre les problèmes des services lors de l'installation
- Comment désinstaller le cluster
- Comment nettoyer les artefacts hors ligne pour améliorer l'espace disque
- Comment effacer les données Redis
- Comment activer la journalisation Istio
- Comment nettoyer manuellement les journaux
- Comment nettoyer les anciens journaux stockés dans le bundle sf-logs
- Comment désactiver les journaux de diffusion pour AI Center
- Comment déboguer les installations d'Automation Suite ayant échoué
- Comment supprimer des images de l’ancien programme d’installation après la mise à niveau
- Comment nettoyer automatiquement les instantanés Longhorn
- Comment désactiver le déchargement de la somme de contrôle txt
- Comment définir manuellement le niveau de journalisation d’ArgoCD sur Info
- Comment générer la valeur pull_secret_value encodée pour les registres externes
- Comment résoudre les chiffrements faibles dans TLS 1.2
- Impossible d'exécuter une installation hors ligne sur le système d'exploitation RHEL 8.4
- Erreur lors du téléchargement du bundle
- L'installation hors ligne échoue en raison d'un fichier binaire manquant
- Problème de certificat dans l'installation hors ligne
- La première installation échoue lors de la configuration de Longhorn
- Erreur de validation de la chaîne de connexion SQL
- Échec de la vérification des prérequis pour le module selinux iscsid
- Disque Azure non marqué comme SSD
- Échec après la mise à jour du certificat
- L'antivirus provoque des problèmes d'installation
- Automation Suite ne fonctionne pas après la mise à niveau du système d'exploitation
- Automation Suite requiert que backlog_wait_time soit défini sur 0
- Nœud GPU affecté par l'indisponibilité des ressources
- Volume impossible à monter car il n'est pas prêt pour les charges de travail
- Échec de la mise à niveau du nœud unique à l’étape Fabric
- Cluster défectueux après la mise à niveau automatisée à partir de la version 2021.10
- Échec de la mise à niveau en raison d’un Ceph défectueux
- RKE2 ne démarre pas en raison d'un problème d'espace
- Échec de la validation SQL lors de la mise à niveau
- Échec du chargement ou du téléchargement des données dans l'objectstore
- Le redimensionnement de la PVC ne répare pas Ceph
- Échec du redimensionnement du PVC
- Échec du redimensionnement du PVC objectstore
- Rook Ceph ou pod Looker bloqué dans l'état Init
- Erreur de pièce jointe du volume Ensembles d'états.
- Échec de la création de volumes persistants
- Correctif de récupération du stockage
- La sauvegarde a échoué en raison de l’erreur TropInstantanés (TooManySnapshots)
- Toutes les répliques Longhorn sont défaillantes
- Définition d'un délai d'expiration pour les portails de gestion
- Mettre à jour les connexions du répertoire sous-jacent
- L'authentification ne fonctionne pas après la migration
- kinit : Impossible de trouver le KDC pour le domaine <AD Domain> lors de l'obtention des informations d'identification initiales
- Kinit : Keytab ne contient aucune clé appropriée pour *** lors de l'obtention des informations d'identification initiales
- L'opération GSSAPI a échoué en raison d'un code de statut non valide
- Alarme reçue pour l'échec de la tâche Kerberos-tgt-update
- Fournisseur SSPI : serveur introuvable dans la base de données Kerberos
- La connexion a échoué pour l'utilisateur AD en raison d'un compte désactivé
- Échec de connexion à ArgoCD
- Impossible d'obtenir l'image du bac à sable
- Les pods ne s'affichent pas dans l'interface utilisateur ArgoCD
- Échec de la sonde Redis
- Le serveur RKE2 ne démarre pas
- Secret introuvable dans l'espace de noms UiPath
- ArgoCD passe à l'état Progression (Progressing) après la première installation
- Problèmes d'accès au compte ArgoCD en lecture seule
- Pods MongoDB en mode CrashLoopBackOff ou enregistrement PVC en attente après suppression
- Services défectueux après la restauration ou l'annulation du cluster
- Pods bloqués dans Init:0/X
- Prometheus en état CrashloopBackoff avec erreur de mémoire insuffisante (OOM)
- Métriques Ceph-rook manquantes dans les tableaux de bord de surveillance
- Document Understanding n'est pas affiché sur la barre de gauche d'Automation Suite
- État Échec (Failed) lors de la création d'une session de labellisation des données
- État Échec (Failed) lors de la tentative de déploiement d'une compétence ML
- La tâche de migration échoue dans ArgoCD
- La reconnaissance de l'écriture manuscrite avec l'Extracteur de formulaires intelligents (Intelligent Form Extractor) ne fonctionne pas
- Exécution de la haute disponibilité avec Process Mining
- Échec de l’ingestion de Process Mining lors de la connexion à l’aide de Kerberos
- Impossible de se connecter à la base de données AutomationSuite_ProcessMining_Authentication à l'aide d'une chaîne de connexion au format pyodbc
- L'installation d'airflow échoue avec sqlalchemy.exc.ArgumentError: impossible d'analyser l'URL rfc1738 de la chaîne ''
- Comment ajouter une règle de table d'adresse IP pour utiliser le port SQL Server 1433
- Utilisation de l'outil de diagnostic d'Automation Suite
- Utilisation de l'outil Automation Suite Support Bundle
- Explorer les journaux
Migration d'un disque physique Longhorn vers LVM
Dans la version 2021.10.0, vous deviez apporter un disque physique pour le stockage de blocs/le disque de données. Cependant, avec un disque physique, la taille d'un volume/PVC que vous pouviez créer était limitée à la taille du disque sous-jacent. De plus, seule la mise à l'échelle verticale était possible. C'est pourquoi Longhorn recommande fortement d'utiliser LVM pour agréger tous les disques de données sous une seule partition. Cela permet d'étendre facilement le stockage de blocs dans le futur Longhorn | Meilleures pratiques.
Si vous avez alloué 2 Tio de stockage pour Longhorn et que vos besoins en stockage sont faibles, nous vous recommandons de migrer vers LVM.
- Votre cluster doit être un cluster en mode production multi-nœuds haute disponibilité, c'est-à-dire que le cluster doit contenir au moins trois nœuds de serveur.
- Assurez-vous qu'aucune des charges de travail de la famille AI (AI Center, DU, TM) n'est en cours d'exécution au moment de la rotation des nœuds, sinon ces charges de travail échoueront brusquement.
- Vous devez mettre à niveau Automation Suite vers 2021.10.1.
- Lors de la configuration du cluster sous
cluster_config.json
en tant quefixed_rke2_address
, l'URL LB est utilisée à la place du codage en dur de l'adresse IP ou du nom de domaine complet de la première machine. - Enregistrez trois machines de secours qui remplaceront vos nœuds de serveur d'origine. La configuration matérielle de ces machines doit être la même que celle de vos nœuds de serveur existants. Les machines doivent être placées sous le même VPC, sous-réseau, groupe de sécurité réseau, etc., et le nombre de disques connectés et leur taille doivent également être les mêmes.
- Assurez-vous que tous les ports sont accessibles sur les machines. Voir Configuration des machines pour plus de détails.
- Ne créez pas les partitions de disque manuellement sur les nouvelles machines. Utilisez plutôt le script de partitionnement de disque documenté dans Configuration du disque.
- Assurez-vous que les noms d'hôte des machines sont identiques. Par exemple, si vos anciens serveurs s'appelaient
server0
,server1
etserver2
, attribuez également les mêmes noms d'hôte aux nouveaux nœuds de serveur. - Copiez le dossier du programme d'installation avec
cluster_config.json
du premier serveur existant vers les trois machines nouvellement créées. - Avant de procéder à la rotation des serveurs, exécutez ce script de vérification de l'état à partir de l'un des serveurs existants. Le script ne devrait générer aucune erreur et devrait vous inviter avec le message suivant :
All Deployments are Healthy
.
- La rotation des nœuds de serveur devrait être effectuée une par une. Notez que le processus de rotation des nœuds ne s'applique pas aux nœuds d'agent.
- Arrêtez l'ancien nœud
server-N
, afin que les charges de travail exécutées sur le nœud soient supprimées correctement (N
est le nième nœud de serveur ; par exempleserver0
). -
Supprimez le serveur du cluster en exécutant la commande suivante :
#where N is the nth server node Ex: server0 kubectl delete node server-N
#where N is the nth server node Ex: server0 kubectl delete node server-N - Supprimez le serveur-N du pool principal de l'équilibreur de charge, c'est-à-dire du pool de serveurs et de nœuds. Voir Configuration de l'équilibreur de charge pour plus de détails.
- Sur le nouveau nœud serveur-N, installez Kubernetes et configurez le nouveau nœud en tant que serveur. Voir Ajout d'un nouveau nœud au cluster pour plus de détails.
- Une fois l'installation de Kubernetes réussie, exécutez
kubectl get nodes
et vérifiez que le nouveau nœud est bien joint au cluster d'origine. - Exécutez le script de vérification de l'état à partir du nœud nouvellement ajouté pour surveiller l'état du cluster. Le script doit afficher le message suivant :
All Deployments are Healthy
. - Une fois que le script de vérification de l'état a réussi, ajoutez le nouveau nœud de serveur aux pools de serveurs et de nœuds sous l'équilibreur de charge. Voir Configuration de l'équilibreur de charge pour plus de détails.
- Répétez le processus de rotation des nœuds pour les autres nœuds de serveur, c'est-à-dire server1, server2, server-N.
- Une fois tous les nœuds de serveur pivotés, vous pouvez supprimer les anciens nœuds de serveur qui sont à l'état d'arrêt.