Automation Suite
2022.4
False
- Información general
- Requisitos
- Instalación
- Preguntas y respuestas: plantillas de implementación
- Descarga de los paquetes de instalación
- parámetros de install-uipath.sh
- Habilitar el complemento de alta disponibilidad (HAA) de Redis para el clúster
- Archivo de configuración de Document Understanding
- Inclusión de un nodo agente dedicado compatible con GPU
- Conexión de la aplicación Task Mining
- Añadir un nodo agente dedicado a Task Mining
- Después de la instalación
- Administración de clústeres
- Gestionar los productos
- Gestionar el clúster en ArgoCD
- Configurar el servidor NFS externo
- Automatizado: Habilitar la copia de seguridad en el clúster
- Automatizado: Deshabilitar la copia de seguridad en el clúster
- Automatizado, en línea: restaurar el clúster
- Automatizado, sin conexión: restaurar el clúster
- Manual: Habilitar la copia de seguridad en el clúster
- Manual : Deshabilitar la copia de seguridad en el clúster
- Manual, en línea: restaurar el clúster
- Manual, sin conexión: restaurar el clúster
- Configuración adicional
- Migrating objectstore from persistent volume to raw disks
- Supervisión y alertas
- Migración y actualización
- Opciones de migración
- Paso 1: Mover los datos de la organización de identidad de independiente a Automation Suite
- Paso 2: restaurar la base de datos del producto independiente
- Paso 3: Realizar una copia de seguridad de la base de datos de la plataforma en Automation Suite
- Paso 4: Fusionar organizaciones en Automation Suite
- Paso 5: actualizar las cadenas de conexión de los productos migrados
- Step 6: Migrating standalone Insights
- Paso 7: eliminar el tenant predeterminado
- B) Migración de tenant único
- Configuración específica del producto
- Buenas prácticas y mantenimiento
- Solución de problemas
- Cómo solucionar los problemas de los servicios durante la instalación
- Cómo desinstalar el clúster
- Cómo limpiar los artefactos sin conexión para mejorar el espacio en disco
- Cómo borrar datos de Redis
- Cómo habilitar el registro de Istio
- Cómo limpiar manualmente los registros
- Cómo limpiar los registros antiguos almacenados en el paquete sf-logs
- Cómo deshabilitar los registros de transmisión para AI Center
- Cómo depurar instalaciones de Automation Suite fallidas
- Cómo eliminar imágenes del instalador antiguo después de la actualización
- Cómo limpiar automáticamente las instantáneas de Longhorn
- Cómo deshabilitar la descarga de la suma de comprobación de NIC
- No se puede ejecutar una instalación sin conexión en el sistema operativo RHEL 8.4
- Error al descargar el paquete
- La instalación sin conexión falla porque falta un binario
- Problema de certificado en la instalación sin conexión
- First installation fails during Longhorn setup
- Error de validación de la cadena de conexión SQL
- Error en la comprobación de requisitos previos para el módulo iscsid de selinux
- Azure disk not marked as SSD
- Fallo tras la actualización del certificado
- Automation Suite not working after OS upgrade
- Automation Suite requiere que Backlog_wait_time se establezca 1
- El volumen no se puede montar porque no está listo para las cargas de trabajo
- RKE2 falla durante la instalación y la actualización
- Fallo al cargar o descargar datos en el almacén de objetos
- PVC resize does not heal Ceph
- Fallo en el redimensionamiento de PVC de objectstore
- Rook Ceph o Looker pod atascados en estado Init
- Error de archivo adjunto de volumen de StatefulSet
- Fallo en la creación de volúmenes persistentes
- Parche de reclamación de almacenamiento
- La copia de seguridad falló debido al error
- Todas las réplicas de Longhorn son defectuosas
- Establecer un intervalo de tiempo de espera para los portales de gestión
- Actualizar las conexiones del directorio subyacente
- No se puede iniciar la sesión después de la migración
- Kinit: no se puede encontrar el KDC para el dominio <AD> mientras se obtienen las credenciales iniciales
- kinit: keytab no contiene claves adecuadas para *** mientras se obtienen las credenciales iniciales
- La operación GSSAPI ha fallado con un error: se ha suministrado un código de estado no válido (las credenciales del cliente han sido revocadas).
- Alarma recibida por trabajo de actualización Kerberos-tgt fallido
- Proveedor SSPI: servidor no encontrado en la base de datos de Kerberos
- Error de inicio de sesión para el usuario <ADDOMAIN> <aduser>. Razón: la cuenta está deshabilitada.
- ArgoCD login failed
- Fallo en la obtención de la imagen de Sandbox
- Los pods no se muestran en la interfaz de usuario de ArgoCD
- Fallo de la sonda Redis
- El servidor RKE2 no se inicia
- Secreto no encontrado en el espacio de nombres UiPath
- Después de la instalación inicial, la aplicación ArgoCD pasó al estado de progreso
- Pods MongoDB en CrashLoopBackOff o pendientes de aprovisionamiento de PVC tras su eliminación
- Inconsistencia inesperada, ejecuta fsck manualmente
- MongoDB o aplicaciones empresariales degradadas después de la restauración del clúster
- Falta el operador de Self-heal y el repositorio de Sf-k8-utils
- Servicios en mal estado después de la restauración o reversión del clúster
- El pod de RabbitMQ se atasca en CrashLoopBackOff
- Prometheus en estado CrashloopBackoff con error de falta de memoria (OOM)
- Faltan métricas de Ceph-rook en los paneles de supervisión
- Document Understanding no se encuentra en la barra izquierda de Automation Suite
- Estado fallido al crear una sesión de etiquetado de datos
- Estado fallido al intentar implementar una habilidad ML
- El trabajo de migración falla en ArgoCD
- El reconocimiento de la escritura manual con el extractor de formularios inteligente no funciona
- Uso de la herramienta de diagnóstico de Automation Suite
- Uso de la herramienta del paquete de soporte de Automation Suite
- Explorar registros
Iniciar y apagar un nodo
Guía de instalación de Automation Suite
Última actualización 24 de abr. de 2024
Iniciar y apagar un nodo
Esta página explica el ComportamientoDeApagado y de inicio manuales y automáticos de Automation Suite.
Se
rke2-service
inicia y va seguido de node-drainer
y node-uncordon
. node-drainer
no realiza ninguna acción al inicio, solo devuelve la confirmación de que el servicio está activo.
El
node-uncordon
solo se ejecuta una vez e inicia /opt/node-drain.sh nodestart
, que descordona el nodo. Como parte del procedimiento de drenaje que ocurre al apagado, esto cordona el nodo y lo hace no programable. Este estado persiste cuando se inicia el servicio rke2. Por ello, el nodo no debe estar acordonado después de los rke2-service
reinicios .
Inicio manual
El servicio se inicia automáticamente con Automation Suite. Sin embargo, si
rke2-service
se detuvo manualmente, debes iniciar el servicio de nuevo ejecutando los siguientes comandos:
- Inicia el proceso de Kubernetes que se ejecuta en el nodo del servidor:
systemctl start rke2-server
systemctl start rke2-server - Inicia el proceso de Kubernetes que se ejecuta en el nodo del servidor:
systemctl start rke2-agent
systemctl start rke2-agent - Una vez iniciado el servicio
rke2
, desacordona el nodo para asegurarte de que Kubernetes ahora pueda programar cargas de trabajo en este nodo.systemctl restart node-uncordon
systemctl restart node-uncordon - Una vez iniciado el nodo, debes drenar el nodo:
systemctl start node-drain.service
systemctl start node-drain.serviceImportante:Omitir el paso 4 podría hacer que el servicio Kubelet se apague de forma no saludable si se reinicia el sistema.
Durante el apagado,
systemd
detiene los servicios en el orden en que se iniciaron. Dado que el node-drain
servicio tiene la directiva After=rke2-server.service
o After=rke2-agent.service
, ejecuta la secuencia de apagado antes del apagado de rke2-service
. Esto significa que en un sistema configurado correctamente, simplemente apagar el nodo es una operación segura.
Reinicio manual
Si planeas detener el servicio RKE2 y reiniciar la máquina, ejecuta los siguientes pasos:
-
Para asegurarse de que el clúster está sano mientras realizas la actividad de mantenimiento del nodo, debes drenar las cargas de trabajo que se ejecutan en ese nodo a otros nodos. Para vaciar el nodo, ejecuta el siguiente comando:
systemctl stop node-drain.service
systemctl stop node-drain.service - Detener el proceso de Kubernetes que se ejecuta en el nodo del servidor:
systemctl stop rke2-server
systemctl stop rke2-server - Detener el proceso Kubernetes que se ejecuta en el nodo del agente:
systemctl stop rke2-agent
systemctl stop rke2-agent -
Elimina los servicios rke2 y containerd y todos los procesos secundarios:
Esto ya debería estar en la ruta, pero se encuentra enrke2-killall.sh
rke2-killall.sh/bin/rke2-killall.sh
.
- Los siguientes archivos de unidad se crean durante la instalación:
rke2-server.service
(solo servidor). Inicia elrke2-server
, esto inicia el servidor del nodo.rke2-agent.service
(solo agente). Inicia elrke2-agent
, esto inicia el agente del nodo.node-drain.service
. Se utiliza en el periodo de apagado. Se ejecuta antes del apagado derke2-agent
orke2-server
y realiza un drenaje. Tiene un tiempo de espera de 300 segundos.node-uncordon.service
. Se utiliza al inicio para desacordonar un nodo.var-lib-kubelet.mount
. Generado automáticamente por el generador fstab.var-lib-rancher-rke2-server-db.mount
. Generado automáticamente por el generador fstab.var-lib-rancher.mount
. Generado automáticamente por el generador fstab.
No existen dependencias sólidas entre los archivos de la unidad. Sin embargo,
node-drain
y node-uncordon
tienen la directiva After=rke2-server.service
o After=rke2-agent.service
. Esto significa que esos servicios se iniciarán después del rke2-service
.