- Vue d'ensemble (Overview)
- Glossaire
- Produits Automation Suite
- Dépendances entre produits
- Cas d'utilisation pris en charge pour les installations à nœud unique et multi-nœuds
- Architecture multi-nœuds et considération de conception
- Comparaison des fonctionnalités de déploiement croisé
- Sécurité et conformité
- Présentation des certificats
- Prérequis
- Recommandé : modèles de déploiement
- Manuel : Préparation de l'installation
- Manuel : Préparation de l'installation
- Étape 1 : Configuration du registre compatible OCI pour les installations hors ligne
- Étape 2 : configuration du magasin d'objets externe
- Étape 3 : Configuration du module complémentaire High Availability Add-on
- Étape 4 : configurer Microsoft SQL Server
- Étape 5 : configurer l’équilibreur de charge
- Étape 6 : configurer le DNS
- Step 7: Configuring kernel and OS level settings
- Step 8: Configuring the disks
- Step 9: Configuring the node ports
- Step 10: Applying miscellaneous settings
- Étape 12 : Validation et installation des packages RPM requis
- Step 13: Generating cluster_config.json
- Configuration du certificat
- Configuration de la base de données
- Configuration du magasin d'objets externe
- Configuration d'URL pré-signée
- Configuration du registre externe compatible OCI
- Disaster Recovery : configurations Active/Passive et Active/Active
- Configuration du module complémentaire High Availability Add-on
- Configuration spécifique à Orchestrator
- Configuration spécifique à Insights
- Configuration spécifique à Process Mining
- Configuration spécifique à Document Understanding
- Configuration spécifique à Automation Suite Robots
- Configuration de la surveillance
- Facultatif : configuration du serveur proxy
- Facultatif : Activation de la résilience aux échecs locaux dans un cluster en mode production multi-nœuds compatible haute disponibilité
- Facultatif : Transmettre le fichier personnalisé resolv.conf
- Facultatif : augmentation de la tolérance aux pannes
- install-uipath.sh parameters
- Ajout d'un nœud d'agent dédié avec prise en charge GPU
- Ajout d'un nœud d'agent dédié pour Task Mining
- Connexion de l'application Task Mining
- Ajout d'un nœud d'agent dédié pour les Automation Suite Robots
- Step 15: Configuring the temporary Docker registry for offline installations
- Step 16: Validating the prerequisites for the installation
- Manuel : Exécution de l'installation
- Post-installation
- Administration du cluster
- Gestion des produits
- Premiers pas avec le portail d'administration du cluster
- Migration d'un magasin d'objets d'un volume persistant vers des disques bruts
- Migration du module complémentaire High Availability Add-on externe vers un module complémentaire High Availability Add-on externe
- Migration des données entre les librairies
- Migration d'un magasin d'objets intégré au cluster vers un magasin d'objets externe
- Basculer manuellement vers le cluster secondaire dans une configuration active/passive
- Disaster Recovery : exécution d'opérations post-installation
- Conversion d'une installation existante en configuration multi-sites
- Guidelines on upgrading an Active/Passive or Active/Active deployment
- Guidelines on backing up and restoring an Active/Passive or Active/Active deployment
- Redirecting traffic for the unsupported services to the primary cluster
- Surveillance et alerte
- Migration et mise à niveau
- Étape 1 : Déplacement des données d'organisation Identity d'installation autonome vers Automation Suite
- Étape 2 : Restauration de la base de données de produits autonome
- Étape 3 : Sauvegarder la base de données de la plate-forme dans Automation Suite
- Étape 4 : Fusion des organisations dans Automation Suite
- Étape 5 : Mise à jour des chaînes de connexion du produit migré
- Étape 6 : migration de la version autonome d'Orchestrator
- Étape 7 : Migration d'Insights autonome
- Step 8: Deleting the default tenant
- B) Migration à locataire unique
- Migration d'Automation Suite sur Linux vers Automation Suite sur EKS/AKS
- Mettre à niveau Automation Suite
- Téléchargement des packages d'installation et obtention de l'ensemble des fichiers sur le premier nœud de serveur
- Récupération de la dernière configuration appliquée à partir du cluster
- Mise à jour de la configuration du cluster
- Configuration du registre compatible OCI pour les installations hors ligne
- Migration vers un registre externe compatible OCI
- Exécution de la mise à niveau
- Exécution d'opérations post-mise à niveau
- Configuration spécifique au produit
- Utilisation de l'outil Orchestrator Configurator
- Configuration des paramètres d'Orchestrator
- Paramètres de l'application Orchestrator
- Configuration des paramètres d'application
- Configuration de la taille maximale de la requête
- Remplacement de la configuration du stockage au niveau du cluster
- Configuration des magasins d'informations d'identification
- Configuration de la clé de chiffrement par locataire
- Bonnes pratiques et maintenance
- Résolution des problèmes
- Comment résoudre les problèmes des services lors de l'installation
- Comment désinstaller le cluster
- Comment nettoyer les artefacts hors ligne pour améliorer l'espace disque
- Comment effacer les données Redis
- Comment activer la journalisation Istio
- Comment nettoyer manuellement les journaux
- Comment nettoyer les anciens journaux stockés dans le bundle sf-logs
- Comment désactiver les journaux de diffusion pour AI Center
- Comment déboguer les installations d'Automation Suite ayant échoué
- Comment supprimer des images de l’ancien programme d’installation après la mise à niveau
- Comment désactiver le déchargement de la somme de contrôle de la carte réseau
- Comment mettre à niveau Automation Suite 2022.10.10 et 2022.4.11 vers 2023.10.2
- Comment définir manuellement le niveau de journal ArgoCD sur Info
- Impossible d'exécuter une installation hors ligne sur le système d'exploitation RHEL 8.4
- Erreur lors du téléchargement du bundle
- L'installation hors ligne échoue en raison d'un fichier binaire manquant
- Problème de certificat dans l'installation hors ligne
- La première installation échoue lors de la configuration de Longhorn
- Erreur de validation de la chaîne de connexion SQL
- Échec de la vérification des prérequis pour le module selinux iscsid
- Disque Azure non marqué comme SSD
- Échec après la mise à jour du certificat
- L'antivirus provoque des problèmes d'installation
- Automation Suite ne fonctionne pas après la mise à niveau du système d'exploitation
- Automation Suite requiert que backlog_wait_time soit défini sur 0
- Volume impossible à monter car il n'est pas prêt pour les charges de travail
- Cluster défectueux après la mise à niveau automatisée à partir de la version 2021.10
- Échec de la mise à niveau en raison d’un Ceph défectueux
- RKE2 ne démarre pas en raison d'un problème d'espace
- Le volume ne peut pas être monté et reste à l'état de boucle d'attachement/détachement
- La mise à niveau échoue en raison d’objets classiques dans la base de données Orchestrator
- Cluster Ceph trouvé dans un état dégradé après une mise à niveau côte à côte
- Un composant Insights défectueux entraîne l’échec de la migration
- La mise à niveau du service échoue pour Apps
- Délais d'attente de mise à niveau sur place
- Migration du registre Docker bloquée lors de la suppression du PVC
- Échec de l'enregistrement d'AI Center après la mise à niveau vers 2023.10
- La mise à niveau échoue dans les environnements hors ligne
- Échec du chargement ou du téléchargement des données dans l'objectstore
- Le redimensionnement de la PVC ne répare pas Ceph
- Échec du redimensionnement du PVC objectstore
- Rook Ceph ou pod Looker bloqué dans l'état Init
- Erreur de pièce jointe du volume Ensembles d'états.
- Échec de la création de volumes persistants
- Définition d'un délai d'expiration pour les portails de gestion
- L'authentification ne fonctionne pas après la migration
- Kinit : Impossible de trouver le KDC pour le domaine <AD Domain> lors de l'obtention des informations d'identification initiales
- Kinit : Keytab ne contient aucune clé appropriée pour *** lors de l'obtention des informations d'identification initiales
- L'opération GSSAPI a échoué en raison d'un code de statut non valide
- Alarme reçue pour l'échec de la tâche Kerberos-tgt-update
- Fournisseur SSPI : serveur introuvable dans la base de données Kerberos
- La connexion a échoué pour l'utilisateur AD en raison d'un compte désactivé
- Échec de connexion à ArgoCD
- Mettre à jour les connexions du répertoire sous-jacent
- Impossible d'obtenir l'image du bac à sable
- Les pods ne s'affichent pas dans l'interface utilisateur ArgoCD
- Échec de la sonde Redis
- Le serveur RKE2 ne démarre pas
- Secret introuvable dans l'espace de noms UiPath
- ArgoCD passe à l'état Progression (Progressing) après la première installation
- Pods MongoDB en mode CrashLoopBackOff ou enregistrement PVC en attente après suppression
- Services défectueux après la restauration ou l'annulation du cluster
- Pods bloqués dans Init:0/X
- Métriques Ceph-rook manquants dans les tableaux de bord de surveillance
- Document Understanding n'est pas affiché sur la barre de gauche d'Automation Suite
- État Échec (Failed) lors de la création d'une session de labellisation des données
- État Échec (Failed) lors de la tentative de déploiement d'une compétence ML
- La tâche de migration échoue dans ArgoCD
- La reconnaissance de l'écriture manuscrite avec l'Extracteur de formulaires intelligents (Intelligent Form Extractor) ne fonctionne pas
- Exécution de l'outil de diagnostic
- Utilisation de l'outil Automation Suite Support Bundle
- Explorer les journaux
Architecture multi-nœuds et considération de conception
Le schéma d'architecture suivant décrit un déploiement d'Automation Suite sur Linux avec Kubernetes installé sur six machines, un équilibreur de charge et le stockage de données. Il existe plusieurs types de machines : trois nœuds de serveur, deux nœuds d'agent et un nœud d'agent spécialisé.
etcd
, qui fait partie du plan de contrôle Kubernetes. Pour plus de détails, consultez la documentation etcd. Pour la même raison, la majorité des nœuds de serveur doivent être disponibles à tout moment pour maintenir le cluster en bonne santé.
Ces nœuds hébergent également les composants qui nécessitent un stockage de données sur les nœuds, tels que Prometheus, le magasin d'objets intégré au cluster Ceph, UiPath Insights et le registre Docker intégré au cluster.
Agent nodes are sometimes called worker nodes. The purpose of these nodes is to host UiPath® services and other shared suite capabilities. Since there is no data disk attached to these nodes, they cannot host the components that require disk storage.
Les nœuds d'agent n'imposent aucune restriction sur le nombre de nœuds disponibles à un moment donné. Tant que le cluster résultant a une capacité suffisante pour héberger tous les pods des nœuds perdus, le cluster fonctionnera comme prévu sans aucune interruption.
These nodes are the special agent nodes dedicated to special tasks, such as the Task Mining node for analysis, Automation Suite Robots node for robots execution, and the GPU node for the Document Understanding model. You cannot host other UiPath® services on these nodes.
L'équilibreur de charge, qui est installé en dehors d'Automation Suite, sert de point d'entrée pour accéder aux applications hébergées sur le cluster Automation Suite. L'équilibreur de charge doit être soumis à la tolérance aux pannes des nœuds. Tous les nœuds de serveur doivent être configurés sur l'équilibreur de charge, mais les nœuds d'agent peuvent également être configurés de manière facultative. Cependant, des nœuds d'agent spécialisés ne sont pas nécessaires.
Lorsque les robots tentent d'accéder à Orchestrator, l'appel arrive sur l'équilibreur de charge, puis est transmis à l'un des nœuds disponibles. Chaque nœud héberge également le composant de mise en réseau appelé Istio, qui est un service Mesh qui agit également comme un équilibreur de charge. Lorsque l'appel est reçu par Istio exécuté sur le nœud, il tente de localiser l'instance Orchestrator sur l'ensemble du cluster. Une fois qu'il est trouvé, il redirige l'appel vers cette instance.
Cela dépend entièrement de vous, les deux options ayant leurs propres avantages et inconvénients. Un nombre plus élevé de machines plus petites offre une meilleure résilience à la tolérance aux pannes de nœud par rapport à un plus petit nombre de machines plus volumineuses. Dans le même temps, elle introduit également des frais généraux de gestion supplémentaires.
Par exemple, si votre cluster Automation Suite nécessite un processeur virtuel 96, vous pouvez opter pour l'une des options suivantes :
-
Option 1 : 6 machines de 16 vCPU chacune.
-
Impact : la perte d'une machine ne réduit la capacité du cluster que de 16 processeurs virtuels, et n'a donc un impact sur les services que si le cluster résultant n'a pas la capacité d'héberger tous les pods. Cependant, la gestion de 6 machines implique un effort plus important.
-
-
Option 2 : 3 machines de 32 VCPU chacune
-
Impact : la perte d'une machine réduit la capacité du cluster de 32 vCPU, ce qui a un impact majeur sur Automation Suite. Cependant, la gestion de 3 machines implique un effort moindre.
-
Pour conclure, la conception du déploiement dépend de l'objectif. Si l'objectif est une meilleure tolérance aux pannes, mieux vaut opter pour des machines plus petites. Cependant, si l'objectif est de réduire les frais généraux de gestion, un plus petit nombre de machines plus volumineuses serait préférable.
Le fait d'opter pour tous les nœuds de serveur au lieu des nœuds d'agent dépend de votre RTO ou RPO.
Par exemple, supposons que votre installation Automation Suite ait besoin de 80 processeurs virtuels. Vous pouvez parvenir à cette configuration comme suit :
-
Option 1 : 5 machines serveur avec 16 vCPU chacune. Dans cette configuration, vous pouvez perdre au maximum 2 nœuds de serveur.
-
Recommandé si vous visez la résilience à la perte de données. Même si 2 nœuds de serveur sont perdus, les données seront intactes et pourront être recréées à partir des répliques restantes.
-
-
Option 2 : 3 nœuds de serveur et les 2 nœuds d'agent avec 16 VCPU chacun. Ici, vous pouvez perdre 1 nœud de serveur et les deux nœuds d'agent, soit un total de 3 machines.
-
Recommandé si vous visez la résilience à la disponibilité des nœuds. Même sans 3 machines, le cluster sera toujours disponible avec une capacité limitée, et une fois les nœuds rétablis, l'intégralité du cluster sera récupérée. Cependant, cette configuration est davantage sujette à la perte de données en raison du stockage lié aux nœuds du serveur. Si 2 nœuds de serveur sont entièrement perdus, il peut être difficile de reconstruire les données sans les restaurer à partir de la sauvegarde.
-