Automation Suite
2023.10
False
Imagen de fondo del banner
Guía de instalación de Automation Suite en Linux
Última actualización 19 de abr. de 2024

El clúster de Ceph se encuentra en un estado degradado tras una actualización en paralelo.

Descripción

De forma ocasional, después de una actualización en paralelo, la aplicación Rook-ceph pasa a un estado de "sincronización fallida" en el portal de ArgoCD. Esto se debe a un problema de Ceph anterior.

Para identificar la razón del estado degradado, ejecuta el siguiente comando:

kubectl -n rook-ceph exec deploy/rook-ceph-tools -- ceph -skubectl -n rook-ceph exec deploy/rook-ceph-tools -- ceph -s 

Si recibes un resultado que se parece al siguiente ejemplo, el problema está relacionado con el estado de Rook-Ceph:

cluster:
    id:     936b2e58-1014-4237-b2a5-6e95449a9ce8
    health: HEALTH_ERR
            Module 'devicehealth' has failed: disk I/O error

  services:
    mon: 3 daemons, quorum a,b,c (age 11h)
    mgr: b(active, since 37h), standbys: a
    osd: 3 osds: 3 up (since 37h), 3 in (since 37h)
    rgw: 2 daemons active (2 hosts, 1 zones)

  data:
    pools:   8 pools, 225 pgs
    objects: 53.57k objects, 26 GiB
    usage:   80 GiB used, 688 GiB / 768 GiB avail
    pgs:     225 active+clean

  io:
    client:   561 KiB/s rd, 61 KiB/s wr, 316 op/s rd, 123 op/s wr  cluster:
    id:     936b2e58-1014-4237-b2a5-6e95449a9ce8
    health: HEALTH_ERR
            Module 'devicehealth' has failed: disk I/O error

  services:
    mon: 3 daemons, quorum a,b,c (age 11h)
    mgr: b(active, since 37h), standbys: a
    osd: 3 osds: 3 up (since 37h), 3 in (since 37h)
    rgw: 2 daemons active (2 hosts, 1 zones)

  data:
    pools:   8 pools, 225 pgs
    objects: 53.57k objects, 26 GiB
    usage:   80 GiB used, 688 GiB / 768 GiB avail
    pgs:     225 active+clean

  io:
    client:   561 KiB/s rd, 61 KiB/s wr, 316 op/s rd, 123 op/s wr

Solución

Para solucionar el problema, realiza los siguientes pasos:

  1. En el fragmento de salida, identifica el servicio del gestor mgr con un estado activo. En el ejemplo proporcionado, mgr: b está marcado como activo.
  2. Para identificar el nombre exacto del pod, ejecuta el siguiente comando:

    kubectl -n rook-ceph get pods | grep "rook-ceph-mgr-<active-manager-name>"kubectl -n rook-ceph get pods | grep "rook-ceph-mgr-<active-manager-name>"
    El comando debe devolver un resultado similar al siguiente ejemplo, donde rook-ceph-mgr-b-6d7bdb4b54-zz47v es el nombre del pod del gestor:
    rook-ceph-mgr-b-6d7bdb4b54-zz47v 0/1 Init:0/1 0 3h55mrook-ceph-mgr-b-6d7bdb4b54-zz47v 0/1 Init:0/1 0 3h55m
  3. Elimina el gestor activo ejecutando el siguiente comando:

    kubectl -n rook-ceph delete pod <active-manager-pod-name>
    
    // for example: kubectl -n rook-ceph delete pod rook-ceph-mgr-b-6d7bdb4b54-zz47vkubectl -n rook-ceph delete pod <active-manager-pod-name>
    
    // for example: kubectl -n rook-ceph delete pod rook-ceph-mgr-b-6d7bdb4b54-zz47v

Eliminar el gestor activo obliga a reiniciarlo, lo que lo convierte en el estado del clúster de Ceph en buen estado.

  • Descripción
  • Solución

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.