- Información general
- Requisitos
- Instalación
- Q&A: Deployment templates
- Configurar las máquinas
- Configurar el almacén de objetos externo
- Configurar un registro de Docker externo
- Configurar el equilibrador de carga
- Configurar el DNS
- Configurar Microsoft SQL Server
- Configurar los certificados
- Instalación de producción multinodo preparada para alta disponibilidad en línea
- Instalación de producción multinodo preparada para alta disponibilidad sin conexión
- Disaster Recovery: instalar el clúster secundario
- Descarga de los paquetes de instalación
- parámetros de install-uipath.sh
- Habilitar el complemento de alta disponibilidad (HAA) de Redis para el clúster
- Archivo de configuración de Document Understanding
- Inclusión de un nodo agente dedicado compatible con GPU
- Añadir un nodo agente dedicado a Task Mining
- Conexión de la aplicación Task Mining
- Añadir un nodo agente dedicado a Automation Suite Robots
- Después de la instalación
- Administración de clústeres
- Gestionar los productos
- Primeros pasos con el Portal de administración del clúster
- Migrating objectstore from persistent volume to raw disks
- Migrating data between objectstores
- Migrating in-cluster objectstore to external objectstore
- Cambiar al clúster secundario
- Disaster Recovery: realizar operaciones posteriores a la instalación
- Convertir una instalación existente en una configuración en varios sitios
- Directrices para actualizar una implementación activa/pasiva
- Directrices sobre la copia de seguridad y restauración de una implementación activa/pasiva
- Supervisión y alertas
- Utilizar la pila de supervisión
- Runbooks de alerta
- Migración y actualización
- Rutas de actualización de Automation Suite
- Automatizado: Actualización en línea
- Automatizado: Actualización sin conexión
- Manual: Actualización en línea
- Manual: Actualización sin conexión
- Reversión por error
- Migración de disco físico Longhorn a LVM
- Migración de Canal a Cilium CNI
- Downgrading Ceph from 16.2.6 to 15.2.9
- Opciones de migración
- Paso 1: Mover los datos de la organización de identidad de independiente a Automation Suite
- Paso 2: restaurar la base de datos del producto independiente
- Paso 3: Realizar una copia de seguridad de la base de datos de la plataforma en Automation Suite
- Paso 4: Fusionar organizaciones en Automation Suite
- Paso 5: actualizar las cadenas de conexión de los productos migrados
- Paso 6: migrar Insights independiente
- Paso 7: eliminar el tenant predeterminado
- B) Migración de tenant único
- Configuración específica del producto
- Buenas prácticas y mantenimiento
- Solución de problemas
- Cómo solucionar los problemas de los servicios durante la instalación
- Cómo desinstalar el clúster
- Cómo limpiar los artefactos sin conexión para mejorar el espacio en disco
- Cómo borrar datos de Redis
- Cómo habilitar el registro de Istio
- Cómo limpiar manualmente los registros
- Cómo limpiar los registros antiguos almacenados en el paquete sf-logs
- Cómo deshabilitar los registros de transmisión para AI Center
- Cómo depurar instalaciones de Automation Suite fallidas
- Cómo eliminar imágenes del instalador antiguo después de la actualización
- Cómo limpiar automáticamente las instantáneas de Longhorn
- Cómo deshabilitar la descarga de la suma de comprobación TX
- Cómo establecer manualmente el nivel de registro de ArgoCD en Info
- Cómo generar el pull_secret_value codificado para registros externos
- Cómo abordar los cifrados débiles en TLS 1.2
- No se puede ejecutar una instalación sin conexión en el sistema operativo RHEL 8.4
- Error al descargar el paquete
- La instalación sin conexión falla porque falta un binario
- Problema de certificado en la instalación sin conexión
- First installation fails during Longhorn setup
- Error de validación de la cadena de conexión SQL
- Error en la comprobación de requisitos previos para el módulo iscsid de selinux
- Azure disk not marked as SSD
- Fallo tras la actualización del certificado
- El antivirus causa problemas de instalación
- Automation Suite not working after OS upgrade
- Automation Suite requiere que backlog_wait_time se establezca en 0
- Nodo de GPU afectado por la falta de disponibilidad de recursos
- El volumen no se puede montar porque no está listo para las cargas de trabajo
- Error de recopilación de registros del paquete de soporte
- La actualización de nodo único falla en la etapa de tejido
- Cluster unhealthy after automated upgrade from 2021.10
- Upgrade fails due to unhealthy Ceph
- RKE2 no se inicia debido a un problema de espacio
- La validación SQL falla durante la actualización
- pod de snapshot-controller-crds en estado CrashLoopBackOff después de la actualización
- Fallo al cargar o descargar datos en el almacén de objetos
- PVC resize does not heal Ceph
- Fallo en el redimensionamiento de PVC
- Fallo en el redimensionamiento de PVC de objectstore
- Rook Ceph o Looker pod atascados en estado Init
- Error de archivo adjunto de volumen de StatefulSet
- Fallo en la creación de volúmenes persistentes
- Parche de reclamación de almacenamiento
- La copia de seguridad falló debido al error
- Todas las réplicas de Longhorn son defectuosas
- Establecer un intervalo de tiempo de espera para los portales de gestión
- Actualizar las conexiones del directorio subyacente
- La autenticación no funciona tras la migración
- kinit: no se puede encontrar la KDC para el territorio <AD Domain> mientras se obtienen las credenciales iniciales
- kinit: keytab no contiene claves adecuadas para *** mientras se obtienen las credenciales iniciales
- Error en la operación GSSAPI debido a un código de estado no válido
- Alarma recibida por un error en el trabajo de Kerberos-tgt-update
- Proveedor de SSPI: servidor no encontrado en la base de datos de Kerberos
- Error en inicio de sesión de un usuario AD debido a una cuenta deshabilitada
- ArgoCD login failed
- Fallo en la obtención de la imagen de Sandbox
- Los pods no se muestran en la interfaz de usuario de ArgoCD
- Fallo de la sonda Redis
- El servidor RKE2 no se inicia
- Secreto no encontrado en el espacio de nombres UiPath
- ArgoCD entra en estado de progreso tras la primera instalación
- Incidencias al acceder a la cuenta de solo lectura de ArgoCD
- Pods MongoDB en CrashLoopBackOff o pendientes de aprovisionamiento de PVC tras su eliminación
- Unhealthy services after cluster restore or rollback
- Pods atascados en Inicialización: 0 / X
- Prometheus en estado CrashloopBackoff con error de falta de memoria (OOM)
- Faltan métricas de Ceph-rook en los paneles de supervisión
- Document Understanding no se encuentra en la barra izquierda de Automation Suite
- Estado fallido al crear una sesión de etiquetado de datos
- Estado fallido al intentar implementar una habilidad ML
- El trabajo de migración falla en ArgoCD
- El reconocimiento de la escritura manual con el extractor de formularios inteligente no funciona
- Ejecutar alta disponibilidad con Process Mining
- La ingestión de Process Mining falló al iniciar sesión con Kerberos
- No se puede conectar a la base de datos AutomationSuite_ProcessMining_Warehouse utilizando una cadena de conexión en formato pyodbc
- La instalación de Airflow falla con sqlalchemy.exc.ArgumentError: no se pudo analizar la URL rfc1738 de la cadena ''
- Cómo añadir una regla de tabla de IP para utilizar el puerto 1433 de SQL Server
- Uso de la herramienta de diagnóstico de Automation Suite
- Uso de la herramienta del paquete de soporte de Automation Suite
- Explorar registros
Utilizar la pila de supervisión
La pila de supervisión para los clústeres de Automation Suite incluye Prometheus, Grafana y AlertManager, que están integrados en la interfaz de usuario del explorador de clústeres de Rancher.
Los fallos de los nodos pueden provocar un apagado de Kubernetes, que interrumpiría las alertas de Prometheus. Para evitar esto, recomendamos configurar una alerta independiente en el servidor RKE2.
En esta página se describen una serie de escenarios de supervisión. Para más detalles, consulta la documentación oficial de Rancher sobre el uso de Rancher Monitoring.
Al utilizar recopiladores para exportar métricas a herramientas de terceros, al habilitar la supervisión de la aplicación puede interrumpir la funcionalidad de Automation Suite.
La pila de supervisión para los clústeres de Automation Suite incluye Prometheus, Grafana, Gestor de alertas y panel de Longhorn.
En esta página se describen una serie de escenarios de supervisión.
Para obtener más detalles, consulta la documentación oficial de Rancher sobre el uso de la supervisión de Rancher.
Puedes acceder a las herramientas de supervisión de Automation Suite de forma individual utilizando las siguientes URL:
Aplicación |
Herramienta |
URL |
Ejemplo |
---|---|---|---|
Métricas |
Prometheus |
|
|
Panel |
Grafana |
|
|
Gestión de alertas |
AlertManager |
|
|
Almacenamiento de bloques persistentes |
Panel de Longhorn |
|
|
Para acceder a las herramientas de supervisión por primera vez, inicie sesión como administrador con las siguientes credenciales predeterminadas:
- Nombre de usuario: admin
- Contraseña: para recuperar la contraseña , ejecuta el siguiente comando:
kubectl get secrets/dex-static-credential -n uipath-auth -o "jsonpath={.data['password']}" | base64 -d
kubectl get secrets/dex-static-credential -n uipath-auth -o "jsonpath={.data['password']}" | base64 -d
Para actualizar la contraseña predeterminada utilizada para acceder a las herramientas de supervisión, siga los siguientes pasos:
-
Ejecuta el siguiente comando reemplazando
newpassword
con tu nueva contraseña:password="newpassword" password=$(echo -n $password | base64) kubectl patch secret dex-static-credential -n uipath-auth --type='json' -p="[{'op': 'replace', 'path': '/data/password', 'value': '$password'}]"
password="newpassword" password=$(echo -n $password | base64) kubectl patch secret dex-static-credential -n uipath-auth --type='json' -p="[{'op': 'replace', 'path': '/data/password', 'value': '$password'}]" -
Ejecuta el siguiente comando reemplazando
<cluster_config.json>
con la ruta de tu archivo de configuración:/opt/UiPathAutomationSuite/UiPath_Installer/install-uipath.sh -i <cluster_config.json> -f -o output.json --accept-license-agreement
/opt/UiPathAutomationSuite/UiPath_Installer/install-uipath.sh -i <cluster_config.json> -f -o output.json --accept-license-agreement
https://monitoring.fqdn/metrics
y haz clic en la pestaña Alertas. Aquí puedes ver todas las alertas configuradas en Automation Suite.
Para ver las alertas activas, filtra el estado de la alerta haciendo clic en la casilla de verificación Activa y en la casilla de verificación Mostrar anotaciones en la parte superior. Aquí puedes ver todas las alertas que actualmente se activan y sus mensajes correspondientes.
Si las alertas son demasiado intrusivas, puede silenciarlas. Para hacerlo, siga los siguientes pasos:
uipathctl
en la carpeta de instalación de Automation Suite: .../UiPathAutomationSuite/UiPath_Installer/bin
.
Para añadir una nueva configuración de correo electrónico después de una instalación, ejecuta el siguiente comando:
./uipathctl config alerts add-email \
--name test \
--to "admin@example.com" \
--from "admin@example.com" \
--smtp server.mycompany.com \
--username admin \
--password somesecret \
--require-tls \
--ca-file <path_to_ca_file> \
--cert-file <path_to_cert_file> \
--key-file <path_to_key_file> \
--send-resolved
./uipathctl config alerts add-email \
--name test \
--to "admin@example.com" \
--from "admin@example.com" \
--smtp server.mycompany.com \
--username admin \
--password somesecret \
--require-tls \
--ca-file <path_to_ca_file> \
--cert-file <path_to_cert_file> \
--key-file <path_to_key_file> \
--send-resolved
Marca |
Descripción |
Ejemplo |
---|---|---|
|
Nombre de la configuración del correo electrónico |
|
|
Dirección de correo electrónico del receptor |
|
|
Dirección de correo electrónico del usuario |
|
|
URL del servidor SMTP o dirección IP y número de puerto |
|
|
Nombre de usuario de la autenticación |
|
|
Contraseña de autenticación |
|
|
Indicador booleano que indica que TLS está habilitado en el servidor SMTP. |
N/D |
|
Ruta del archivo que contiene el certificado de autoridad de certificación del servidor SMTP. Es opcional si la autoridad de certificación es privada. |
|
|
Ruta del archivo que contiene el certificado del servidor SMTP. Es opcional si el certificado es privado. |
|
|
Ruta del archivo que contiene la clave privada del certificado del servidor SMTP. Es obligatorio si el certificado es privado. |
|
|
Indicador booleano para enviar un correo electrónico una vez que se resuelva la alerta. |
N/D |
Para eliminar una configuración de correo electrónico, debes ejecutar el siguiente comando. Asegúrate de introducir el nombre de la configuración de correo electrónico que deseas eliminar.
./uipathctl config alerts remove-email --name test
./uipathctl config alerts remove-email --name test
Para actualizar una configuración de correo electrónico, debes ejecutar el siguiente comando. Asegúrate de introducir el nombre de la configuración de correo electrónico que deseas actualizar y los parámetros opcionales adicionales que deseas editar. Estos parámetros son los mismos que para añadir una nueva configuración de correo electrónico. Puedes pasar uno o varios indicadores a la vez.
./uipathctl config alerts update-email --name test [additional_flags]
./uipathctl config alerts update-email --name test [additional_flags]
Para acceder a los paneles de Grafana, debe recuperar sus credenciales y usarlas para iniciar sesión:
-
Nombre de usuario:
kubectl -n cattle-monitoring-system get secrets/rancher-monitoring-grafana -o "jsonpath={.data.admin-user}" | base64 -d; echo
kubectl -n cattle-monitoring-system get secrets/rancher-monitoring-grafana -o "jsonpath={.data.admin-user}" | base64 -d; echo -
Contraseña:
kubectl -n cattle-monitoring-system get secrets/rancher-monitoring-grafana -o "jsonpath={.data.admin-password}" | base64 -d; echo
kubectl -n cattle-monitoring-system get secrets/rancher-monitoring-grafana -o "jsonpath={.data.admin-password}" | base64 -d; echo
Puede supervisar el grupo de servicios de Istio a través de los siguientes paneles de Grafana: Panel de grupos de Istio y Carga de trabajo de Istio.
Este panel muestra el volumen global de solicitudes, así como las tasas de error 400 y 500 en toda la malla de servicios, para el período de tiempo seleccionado. Los datos aparecen en la esquina superior derecha de la ventana. Consulte los 4 gráficos de la parte superior para obtener esta información.
También muestra la tasa de éxito inmediata durante el último minuto para cada servicio individual. Ten en cuenta que una tasa de éxito de NaN indica que el servicio no está prestando tráfico actualmente.
Este panel muestra las métricas de tráfico en el rango de tiempo seleccionado en la esquina superior derecha de la ventana.
Usa los selectores de la parte superior del panel para profundizar en cargas de trabajo específicas. Es de especial interés el espacio de nombres uipath.
La sección superior muestra las métricas generales, la sección Cargas de trabajo entrantes separa el tráfico en función del origen, y la sección Servicios salientes separa el tráfico en función del destino.
Puede supervisar los volúmenes persistentes a través del panel Kubernetes / Volúmenes persistentes. Puede hacer un seguimiento del espacio libre y utilizado de cada volumen.
También puede comprobar el estado de cada volumen haciendo clic en el elemento Volúmenes persistentes dentro del menú Almacenamiento del Explorador de clústeres.
Para marcar la utilización del hardware por nodo, puede utilizar el panel Nodos. Los datos sobre la CPU, la memoria, el disco y la red están disponibles.
Puede supervisar la utilización del hardware para cargas de trabajo específicas con el panel Kubernetes / Calcular recursos / Espacio de nombres (cargas de trabajo). Seleccione el espacio de nombres uipath para obtener los datos necesarios.
- Haga clic en la flecha que apunta hacia abajo junto al título del gráfico y, a continuación, seleccione Compartir.
- Haga clic en la pestaña Instantánea, y establezca los valores Nombre de instantánea, Vencimiento y Tiempo de espere.
- Haz clic en Publicar en snapshot.raintank.io.
Para más detalles, consulta la documentación de Grafana sobre compartir paneles.
Para obtener más información sobre cómo crear paneles de Grafana persistentes personalizados, consulta la documentación de Rancher.
El acceso de administrador a Grafana no suele ser necesario en los clústeres de Automation Suite, ya que los paneles están disponibles para el acceso de lectura por defecto para los usuarios anónimos, y la creación de paneles persistentes personalizados debe crearse siguiendo las instrucciones nativas de Kubernetes enlazadas anteriormente en este documento.
Sin embargo, el acceso de administrador a Grafana es posible siguiendo las siguientes instrucciones.
El nombre de usuario y la contraseña predeterminados para el acceso de administrador de Grafana se pueden obtener de la siguiente manera:
kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-user}' | base64 -d && echo
kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-password}' | base64 -d && echo
kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-user}' | base64 -d && echo
kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-password}' | base64 -d && echo
Ten en cuenta que en los clústeres de Automation Suite de alta disponibilidad hay varios pods de Grafana para permitir un acceso de lectura ininterrumpido en caso de que falle el nodo, así como un mayor volumen de consultes de lectura. Esto es incompatible con el acceso de administrador porque los pods no comparten el estado de la sesión y el inicio de sesión lo requiere. Para solucionar esto, el número de réplicas de Grafana debe escalarse temporalmente a 1 mientras se desee el acceso del administrador. Consulte a continuación las instrucciones sobre cómo escalar el número de réplicas de Grafana:
# scale down
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=1
# scale up
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=2
# scale down
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=1
# scale up
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=2
La documentación sobre las métricas disponibles está aquí:
Puede crear alertas personalizadas utilizando una consulte de Prometheus con una expresión booleana.
- Para ello, haga clic en Reglas de Prometheus en el menú avanzado del panel Supervisión.
- Haz clic en Crear en la esquina superior derecha de la ventana para crear una nueva alerta y sigue la documentación de Rancher: Reglas de Prometheus
- Cuando la alerta se dispara, debe aparecer en el panel Supervisión. Además, se dirigirá a cualquiera de los receptores configurados.
Para ver el estado de los pods, implementaciones, StatefulSets, etc., puede utilizar la interfaz de usuario del explorador de clústeres. Esta es la misma página de destino a la que se accede después de registrarse en el punto final de rancher-server. La página de inicio muestra un resumen, con detalles específicos para cada tipo de recurso a la izquierda. El selector de espacio de nombres se encuentra en la parte superior de la página. Este panel también puede sustituirse por la herramienta Lens.
Prometheus utiliza la Función de escritura remota de Prometheus para obtener y exportar las métricas a un sistema externo.
remote_write
en un clúster de Automation Suite:
- Acceder a las herramientas de supervisión
- Información general
- Autenticación
- Comprobación de las alertas en curso
- Silenciar alertas
- Configurar las alertas
- Añadir una nueva configuración de correo electrónico
- Eliminar una configuración de correo electrónico
- Actualizar una configuración de correo electrónico
- Acceder al panel de Grafana
- Seguimiento del grupo de servicios
- Panel de grupos de Istio
- Panel de carga de trabajo de Istio
- Supervisión de los volúmenes persistentes
- Supervisión de la utilización del hardware
- Creación de una instantánea compartible de un gráfico de Grafana
- Creación de paneles personalizados y persistentes de Grafana
- Acceso de administrador a Grafana
- Consulte a Prometheus
- Creación de alertas personalizadas
- Supervisión del estado de los recursos de Kubernetes
- Exportación de las métricas de Prometheus a un sistema externo