Uso de la herramienta de diagnóstico de Automation Suite

Información general

La herramienta de diagnósticos de Automation Suite es la primera cosa que se debe usar al enfrentarse a problemas con Automation Suite. Comprueba el estado de los diferentes componentes necesarios y proporciona un informe consolidado.

Nota:

Puede obtener la herramienta de diagnóstico de Automation Suite de las siguientes maneras:

Descomprime el paquete de instalador as-installer.zip.
Descargando el archivo supportability-tools.zip

Antes de ejecutar la herramienta de diagnóstico de Automation Suite, vaya a la carpeta del instalador. Puede encontrar el instalador en la siguiente ubicación o en cualquier lugar donde lo haya descargado:

cd /opt/UiPathAutomationSuite/{version}/installercd /opt/UiPathAutomationSuite/{version}/installer

Para comenzar a usar la herramienta de diagnóstico de Automation Suite, ejecute el siguiente comando:

./Support-Tools/diagnostics-tool/diagnostics-report.sh./Support-Tools/diagnostics-tool/diagnostics-report.sh

La siguiente tabla enumera las comprobaciones que realiza la herramienta de diagnóstico de Automation Suite. Tenga en cuenta que puede ejecutar el script en cualquiera de los nodos del clúster, así como de forma externa.

Nodo	Comprobaciones
Nodo maestro	Comprueba si los servicios necesarios se están ejecutando. Comprueba si el tamaño de los discos está correctamente configurado. Ejecuta un trabajo de Kubernetes que recopila datos sobre el estado de otros servicios.
Nodo agente	Comprueba si los servicios necesarios se están ejecutando en el nodo. Comprueba si el tamaño de los discos está correctamente configurado.
Máquina externa	Ejecuta un trabajo de Kubernetes para recopilar el estado de los servicios. Nota: para ejecutar el script desde una máquina externa, primero hay que establecer el contexto de `kubeconfig` adecuado para el clúster y luego, pasar el marcador `-e` al script `bash diagnostics-report.sh -e`.

Informe de muestra generado por la herramienta de diagnóstico de Automation Suite.

Leer informes de diagnóstico

Registros de INFO

Los registros de información en verde muestran que las comprobaciones requeridas han sido satisfactorias. Sin embargo, debe comprobar debidamente el uso del disco o de la memoria para evitar errores ocultos.

Mensajes de ADVERTENCIA

Aunque estos mensajes no indican un riesgo elevado, es posible que tenga que rectificarlos, ya que podrían afectar a algunos servicios en determinados escenarios.

Mensajes de ERROR

Debe solucionar los problemas indicados en estos mensajes, ya que afectan a algún servicio del clúster.

Servicio caído del servidor Rke2 o del agente Rke2

Si estos servicios no están operativos, significa que el nodo está inactivo. Intente reiniciar el servicio utilizando systemctl restart <service-name>, ya que esto debería solucionar el problema.

Tamaño del directorio ubicado en /var/lib

Tamaño del directorio ubicado en /var/lib ya que Kubernetes lo utiliza para almacenar sus datos. Si el directorio está lleno, pueden surgir varios problemas. Para evitar estos problemas, asegúrese de aumentar su tamaño.

Versión Rke2

El informe muestra la versión rke2 como referencia.

Presión del disco o presión de la memoria

En todos los nodos, se especifica si están bajo la presión del disco o de la memoria. Si esto sucede, las cargas de trabajo en estos nodos podrían empezar a presentar problemas. Compruebe si hay otros procesos en ejecución en estos nodos que estén consumiendo recursos y elimínelos si es el caso.

Estado de los servicios Ceph

Se utiliza Ceph como almacenamiento de objetos S3 para guardar registros y archivos de distintas aplicaciones. Es posible consultar el estado de sus servicios. Si no están operativos, es posible que deba reiniciarlos. Asegúrese de comprobar también si el disco que utiliza Ceph está lleno.

Puertos 443 y 31443

Los puertos 443 y 31443 deben estar abiertos en el nombre de host proporcionado. El informe indica si no están accesibles. Asegúrese de abrir los puertos apropiados si así se le indica.

Validez del certificado

La herramienta comprueba si el certificado cargado es válido para el nombre de host proporcionado y si este no ha caducado. Si el certificado no cumple estos criterios, aparecerán errores. Para evitarlo, asegúrese de comprobar el certificado cargado y cambiarlo en caso necesario.

GPU

Dado que algunos servicios requieren que la GPU esté presente en algunos nodos del clúster, la herramienta de diagnósticos de Automation Suite comprueba si hay nodos GPU e imprime el número de dichos nodos. Si cree que hay nodos GPU presentes, pero no aparecen aquí, significará que algo ha ido mal en la configuración de la GPU.

RabbitMQ y DockerRegistry

RabbitMQ y DockerRegistry son dos componentes relevantes que utilizan algunos servicios. Si cualquiera de ellos no estuviera operativo, habría que investigar el problema y reiniciar.

Servicios ArgoCD no operativos

ArgoCD es nuestra herramienta de gestión del ciclo de vida de las aplicaciones (ALM). Si cualquiera de sus servicios no está operativo, otras aplicaciones pueden quedar obsoletas o tener otros problemas. La recuperación de estos servicios es importante y puede requerir una mayor depuración.

Aplicaciones ArgoCD ausentes o degradadas

La herramienta de diagnósticos de Automation Suite muestra si las aplicaciones de ArgoCD faltan o están degradadas.

Si faltan aplicaciones, vaya a la interfaz de usuario de ArgoCD y sincronícela.
Si las aplicaciones están degradadas, es necesario realizar una depuración adicional para investigar los errores mostrados por ArgoCD.

En esta página