- Información general
- Requisitos
- Recomendado: plantillas de implementación
- Manual: preparar la instalación
- Manual: preparar la instalación
- Paso 1: configurar el registro compatible con OCI para las instalaciones sin conexión
- Paso 2: configurar el almacén de objetos externo
- Paso 3: configurar High Availability Add-on
- Paso 4: configurar Microsoft SQL Server
- Paso 5: configurar el equilibrador de carga
- Paso 6: configurar el DNS
- Paso 7: configurar los discos
- Paso 8: configurar el kernel y la configuración en el nivel del sistema operativo
- Paso 9: configurar los puertos de nodo
- Paso 10: aplicar ajustes diversos
- Paso 12: Validar e instalar los paquetes RPM necesarios
- Paso 13: Generar cluster_config.json
- Ejemplo de Clúster_config.json
- Configuración general
- Configuración del perfil
- Configuración de certificados
- Configuración de la base de datos
- Configuración del almacén de objetos externo
- Configuración de URL prefirmada
- Configuración de ArgoCD
- Configuración de registro externo compatible con OCI
- Disaster recovery: configuraciones activas/pasivas y activas/activas
- Configuración de High Availability Add-on
- Configuración específica de Orchestrator
- Configuración específica de Insights
- Process Mining-specific configuration
- Configuración específica de Document Understanding
- Automation Suite Robots-specific configuration
- Configuración específica de AI Center
- Configuración de la supervisión
- Opcional: configurar el servidor proxy
- Opcional: habilitación de la resistencia a fallos de zona en un clúster multinodo de producción preparada para alta disponibilidad
- Opcional: pasar resolv.conf personalizado
- Optional: Increasing fault tolerance
- Inclusión de un nodo agente dedicado compatible con GPU
- Añadir un nodo agente dedicado a Task Mining
- Conexión de la aplicación Task Mining
- Añadir un nodo agente dedicado a Automation Suite Robots
- Paso 15: configurar el registro temporal de Docker para las instalaciones sin conexión
- Paso 16: validar los requisitos previos para la instalación
- Manual: realizar la instalación
- Después de la instalación
- Administración de clústeres
- Gestionar los productos
- Primeros pasos con el Portal de administración del clúster
- Migrating objectstore from persistent volume to raw disks
- Migrar del en el clúster a High Availability Add-on externo
- Migrating data between objectstores
- Migrating in-cluster objectstore to external objectstore
- Migrar a un registro externo compatible con OCI
- Cambiar manualmente al clúster secundario en una configuración activa/pasiva
- Disaster Recovery: realizar operaciones posteriores a la instalación
- Convertir una instalación existente en una configuración en varios sitios
- Directrices sobre la actualización de una implementación activa/pasiva o activa/activa
- Directrices sobre la copia de seguridad y restauración de una implementación activa/pasiva o activa/activa
- Supervisión y alertas
- Migración y actualización
- Migrar entre clústeres de Automation Suite
- Actualizar Automation Suite
- Descargar los paquetes de instalación y obtener todos los archivos del primer nodo del servidor
- Recuperar la última configuración aplicada del clúster
- Actualizar la configuración del clúster
- Configurar el registro compatible con OCI para las instalaciones sin conexión
- Ejecutar la actualización
- Realizar operaciones posteriores a la actualización
- Aplicar un parche
- Configuración específica del producto
- Configurar parámetros de Orchestrator
- Configurar AppSettings
- Configurar el tamaño máximo de la solicitud
- Anular la configuración de almacenamiento a nivel de clúster
- Configurar NLog
- Guardar los registros del robot en Elasticsearch
- Configurar almacenes de credenciales
- Configurar clave de cifrado por tenant
- Limpiar la base de datos de Orchestrator
- Buenas prácticas y mantenimiento
- Solución de problemas
- Cómo solucionar los problemas de los servicios durante la instalación
- Cómo desinstalar el clúster
- Cómo limpiar los artefactos sin conexión para mejorar el espacio en disco
- Cómo borrar datos de Redis
- Cómo habilitar el registro de Istio
- Cómo limpiar manualmente los registros
- Cómo limpiar los registros antiguos almacenados en el depósito sf-logs
- Cómo deshabilitar los registros de transmisión para AI Center
- Cómo depurar instalaciones de Automation Suite fallidas
- Cómo eliminar imágenes del instalador antiguo después de la actualización
- Cómo deshabilitar la descarga de la suma de comprobación TX
- Cómo establecer manualmente el nivel de registro de ArgoCD en Info
- Cómo expandir el almacenamiento de AI Center
- Cómo generar el pull_secret_value codificado para registros externos
- Cómo abordar los cifrados débiles en TLS 1.2
- Cómo comprobar la versión de TLS
- Cómo programar la copia de seguridad y la restauración de datos de Ceph
- No se puede ejecutar una instalación sin conexión en el sistema operativo RHEL 8.4
- Error al descargar el paquete
- La instalación sin conexión falla porque falta un binario
- Problema de certificado en la instalación sin conexión
- Error de validación de la cadena de conexión SQL
- Error en la comprobación de requisitos previos para el módulo iscsid de selinux
- Azure disk not marked as SSD
- Fallo tras la actualización del certificado
- El antivirus causa problemas de instalación
- Automation Suite not working after OS upgrade
- Automation Suite requiere que backlog_wait_time se establezca en 0
- El volumen no se puede montar porque no está listo para las cargas de trabajo
- Error de recopilación de registros del paquete de soporte
- La actualización de nodo único falla en la etapa de tejido
- Upgrade fails due to unhealthy Ceph
- RKE2 no se inicia debido a un problema de espacio
- El volumen no se puede montar y permanece en estado de bucle de conexión/desconexión
- La actualización falla debido a objetos clásicos en la base de datos de Orchestrator
- El clúster de Ceph se encuentra en un estado degradado tras una actualización en paralelo.
- Un componente Insights en mal estado provoca el fallo de la migración
- La actualización del servicio falla para Apps
- Tiempos de actualización in situ
- La migración del registro de Docker se atasca en la fase de eliminación de PVC
- Error de aprovisionamiento de AI Center después de actualizar a 2023.10 o posterior
- La actualización falla en entornos sin conexión
- La validación SQL falla durante la actualización
- pod de snapshot-controller-crds en estado CrashLoopBackOff después de la actualización
- Establecer un intervalo de tiempo de espera para los portales de gestión
- La autenticación no funciona tras la migración
- kinit: no se puede encontrar la KDC para el territorio <AD Domain> mientras se obtienen las credenciales iniciales
- kinit: keytab no contiene claves adecuadas para *** mientras se obtienen las credenciales iniciales
- Error en la operación GSSAPI debido a un código de estado no válido
- Alarma recibida por un error en el trabajo de Kerberos-tgt-update
- Proveedor de SSPI: servidor no encontrado en la base de datos de Kerberos
- Error en inicio de sesión de un usuario AD debido a una cuenta deshabilitada
- ArgoCD login failed
- Actualizar las conexiones del directorio subyacente
- Fallo en la obtención de la imagen de Sandbox
- Los pods no se muestran en la interfaz de usuario de ArgoCD
- Fallo de la sonda Redis
- El servidor RKE2 no se inicia
- Secreto no encontrado en el espacio de nombres UiPath
- ArgoCD entra en estado de progreso tras la primera instalación
- Pods MongoDB en CrashLoopBackOff o pendientes de aprovisionamiento de PVC tras su eliminación
- Pods atascados en Inicialización: 0 / X
- Faltan métricas de Ceph-rook en los paneles de supervisión
- Document Understanding no se encuentra en la barra izquierda de Automation Suite
- Estado fallido al crear una sesión de etiquetado de datos
- Estado fallido al intentar implementar una habilidad ML
- El trabajo de migración falla en ArgoCD
- El reconocimiento de la escritura manual con el extractor de formularios inteligente no funciona
- Ejecutar alta disponibilidad con Process Mining
- La ingestión de Process Mining falló al iniciar sesión con Kerberos
- Después de Disaster Recovery, Dapr no funciona correctamente para Process Mining y Task Mining
- No se puede conectar a la base de datos AutomationSuite_ProcessMining_Warehouse utilizando una cadena de conexión en formato pyodbc
- La instalación de Airflow falla con sqlalchemy.exc.ArgumentError: no se pudo analizar la URL rfc1738 de la cadena ''
- Cómo añadir una regla de tabla de IP para utilizar el puerto 1433 de SQL Server
- El certificado de Automation Suite no es de confianza desde el servidor donde se ejecuta CData Sync
- Ejecutar la herramienta de diagnóstico
- Uso del paquete de soporte de Automation Suite
- Explorar registros
Guía de instalación de Automation Suite en Linux
Arquitectura multinodo y consideración de diseño
El siguiente diagrama de arquitectura muestra una implementación de Automation Suite en Linux con Kubernetes instalado en seis máquinas, un equilibrador de carga y el almacenamiento de datos. Existen varios tipos de máquinas: tres nodos de servidor, dos nodos de agente y un nodo de agente especializado.
etcd
, que forma parte del plano de control de Kubernetes. Para más detalles, consulta la documentación de etcd. Por la misma razón, la mayoría de los nodos del servidor deben estar disponibles en cualquier momento para mantener el clúster en buen estado.
Estos nodos también alojan los componentes que requieren el almacenamiento de datos en los nodos, como Prometheus, el almacén de objetos en el clúster Ceph, UiPath Insights y el registro de Docker en el clúster.
Los nodos de agente a veces se llaman nodos de trabajo. El propósito de estos nodos es alojar los servicios de UiPath® y otras capacidades compartidas de la suite. Dado que no hay un disco de datos conectado a estos nodos, no pueden alojar los componentes que requieren el almacenamiento en disco.
Los nodos de agente no imponen ninguna restricción en el número de nodos disponibles en cualquier momento. Mientras el clúster resultante tenga la capacidad suficiente para alojar todos los pods de los nodos perdidos, el clúster funcionará como se espera sin ninguna interrupción.
Estos nodos son los nodos de agente especiales dedicados a las tareas especiales, como el nodo de Task Mining para el análisis, el nodo de Automation Suite Robots para la ejecución de los robots y el nodo de GPU para el modelo de Document Understanding. No puedes alojar otros servicios de UiPath® en estos nodos.
El equilibrador de carga, que se instala fuera de Automation Suite, actúa como punto de entrada para acceder a las aplicaciones alojadas en el clúster de Automation Suite. El equilibrador de carga debe soportar la tolerancia a los fallos del nodo. Todos los nodos del servidor deben configurarse en el equilibrador de carga, pero los nodos de agente también pueden configurarse de forma opcional. Sin embargo, no se requieren nodos de agente especializados.
Cuando los robots intentan acceder a Orchestrator, la llamada aterriza en el equilibrador de carga y luego pasa a cualquiera de los nodos disponibles. Cada nodo también aloja el componente de red llamado Istio, que es una malla de servicios que también actúa como un equilibrador de carga. Cuando Istio recibe la llamada en el nodo, intenta localizar la instancia de Orchestrator en todo el clúster. Una vez que se encuentra, redirigirá la llamada a esa instancia.
Depende completamente de ti si eliges más máquinas más pequeñas o menos máquinas más grandes, ya que ambas opciones tienen sus pros y sus contras. Un mayor número de máquinas más pequeñas proporciona una mejor resistencia a la tolerancia a los fallos en los nodos en comparación con un menor número de máquinas más grandes. Al mismo tiempo, también introduce una sobrecarga de gestión adicional.
Por ejemplo, si tu clúster de Automation Suite requiere un 96 vCPU, puedes optar por cualquiera de las siguientes opciones:
-
Opción 1: 6 máquinas de 16vCPU cada una.
-
Impacto: perder una máquina solo reduce la capacidad del clúster en 16 vCPU, por lo que solo afecta a los servicios si el clúster resultante no tiene la capacidad para alojar todos los pods. Sin embargo, gestionar 6 máquinas implica un esfuerzo mayor.
-
-
Opción 2: 3 máquinas de 32vCPU cada una
-
Impacto: perder una máquina reduce la capacidad del clúster en 32vCPU, que tiene un impacto importante en Automation Suite. Sin embargo, gestionar 3 máquinas implica un esfuerzo menor.
-
Para concluir, el diseño de implementación depende del objetivo. Si el objetivo es una mayor tolerancia a los fallos, la mejor opción es más máquinas más pequeñas. Sin embargo, si el objetivo es una menor sobrecarga de gestión, la elección debe ser el menor número de máquinas más grandes.
Si optas por todos los nodos del servidor en lugar de los nodos de agente depende de tu RTO o RPO.
Por ejemplo, digamos que tu Automation Suite necesita 80 vCPU. Puedes lograrlo de la siguiente manera:
-
Opción 1: 5 máquina de servidor con 16vCPU cada uno. Aquí puedes perder como máximo 2 nodos de servidor.
-
Recomendado si el objetivo es la resistencia a la pérdida de datos. Aunque se pierdan 2 nodos del servidor, los datos quedarán intactos y se podrán reconstruir a partir de las réplicas restantes.
-
-
Opción 2: 3 nodos de servidor y los 2 nodos de agente con 16vCPU cada uno. Aquí puedes perder 1 nodo del servidor y ambos nodos de agente, por lo que un total de 3 máquinas.
-
Recomendado si el objetivo es la resistencia a la disponibilidad del nodo. Incluso sin 3 máquinas, el clúster seguirá estando disponible con una capacidad limitada y una vez que los nodos vuelvan, se recuperará todo el clúster. Sin embargo, esta configuración es más propensa a la pérdida de datos debido al almacenamiento conectado a los nodos del servidor. Si se pierden 2 nodos del servidor por completo, puede ser difícil reconstruir los datos de nuevo sin restaurarlos a partir de la copia de seguridad.
-