AI Center
2020.10
False
Imagen de fondo del banner
AI Center
Última actualización 11 de mar. de 2024

4. Ejecutar el instalador de infraestructura de AI Fabric

Aviso: Para la instalación de AKS, ve al paso 5. Ejecutar el instalador de la aplicación AI Fabric.

Ejecuta el instalador de infraestructura de AI Fabric. Completar este instalador generará la consola de administración de Kots, en la que puedes gestionar las actualizaciones de la aplicación, la configuración de la aplicación, el uso de recursos (presión de CPU/memoria) y descargar paquetes de asistencia para resolver cualquier problema.

Importante: No canceles el proceso ni desconectes la máquina mientras se ejecuta este paso. Este paso se completará en 15-25 minutos. Si el proceso se cancela por accidente antes de finalizar, tendrás que volver a aprovisionar la máquina y conectar nuevos discos.

Instalación en línea

El primer paso es descargar el archivo .zip del instalador aquí y trasladarlo al servidor de AI Fabric. Como alternativa, puedes descargarlo directamente desde la máquina utilizando el siguiente comando:

Importante:

El script descargará algunos archivos localmente como parte del proceso de instalación; asegúrate de tener 4 GB disponibles en el directorio en el que ejecutas el script.

De forma predeterminada, las máquinas virtuales de Azure RHEL tienen solo 1 GB disponible en el directorio de inicio que es el directorio predeterminado.

wget https://download.uipath.com/aifabric/online-installer/v2020.10.5/aifabric-installer-v20.10.5.tar.gzwget https://download.uipath.com/aifabric/online-installer/v2020.10.5/aifabric-installer-v20.10.5.tar.gz

A continuación, extrae el archivo y ve a la carpeta principal utilizando el siguiente comando:

tar -xvf aifabric-installer-v20.10.5.tar.gz
cd ./aifabric-installer-v20.10.5tar -xvf aifabric-installer-v20.10.5.tar.gz
cd ./aifabric-installer-v20.10.5

A continuación, puedes ejecutar el instalador de AI Fabric ejecutando lo siguiente:

./setup.sh./setup.sh

El primer paso es aceptar el acuerdo de licencia pulsando Y. El script te preguntará a continuación qué tipo de plataforma deseas instalar; escribe onebox y presiona Entrar como en la siguiente imagen:



A continuación, se te pedirá si hay una GPU disponible para tu configuración y Y o N, dependiendo de tu hardware. Asegúrate de que los controladores ya están instalados.



Importante: Solo las GPU de NVIDIA son compatibles y los controladores deben estar instalados antes de la instalación de AI Fabric.

Dependiendo de tu sistema, es posible que tengas que presionar Y algunas veces más para completar la instalación.

Este paso te llevará entre 15 y 25 minutos. Una vez finalizada, verás el mensaje Instalación completa en el output del terminal.

Instalación aislada

En la máquina local con acceso a un navegador (por ejemplo, un servidor de Windows) descarga la instalación del paquete utilizando el vínculo proporcionado por tu gestor de cuentas.

Extrae el contenido del archivo descargado utilizando 7zip de un explorador de archivos de Windows o tar -zxvf aifabric-installer-v2020.10.5.tar.gz de una máquina que admita tar.

Esto creará dos carpetas:

  • aif_infra_20.10.5.tar.gz, que contiene componentes de infraestructura (alrededor de 3,6 GB).
  • ai-fabric-v2020.10.5.airgap, que contiene componentes de la aplicación (alrededor de 8,7 GB). Este se cargará en la IU en el paso 5. Ejecutar el instalador de la aplicación de AI Fabric.
Copia la carpeta aif_infra_20.10.5.tar.gz en la máquina de AI Fabric aislada.

A continuación, ejecuta el siguiente comando para iniciar el instalador de infraestructura:

tar -zxvf aif_infra_20.10.5.tar.gz
cd aif_infra_20.10.5
sudo ./setup.shtar -zxvf aif_infra_20.10.5.tar.gz
cd aif_infra_20.10.5
sudo ./setup.sh

Acceso a la consola de administración

En ambos casos, una instalación correcta mostrará la dirección y la contraseña de KotsAdmin Ui.

...
Install Successful:
configmap/kurl-config created
                Installation
                  Complete ✔
Kotsadm: http://13.59.108.17:8800
Login with password (will not be shown again): NNqKCY82S
The UIs of Prometheus, Grafana and Alertmanager have been exposed on NodePorts 30900, 
30902 and 30903 respectively.
To access Grafana use the generated user:password of admin:msDX5VZ9m .
To access the cluster with kubectl, reload your shell:
    bash -l
    
......
Install Successful:
configmap/kurl-config created
                Installation
                  Complete ✔
Kotsadm: http://13.59.108.17:8800
Login with password (will not be shown again): NNqKCY82S
The UIs of Prometheus, Grafana and Alertmanager have been exposed on NodePorts 30900, 
30902 and 30903 respectively.
To access Grafana use the generated user:password of admin:msDX5VZ9m .
To access the cluster with kubectl, reload your shell:
    bash -l
    
...
Aviso: Fíjate en la dirección de la IU de kotsadm, esta se encuentra en .<machine-ip>:8800. En algún caso, puede que muestre la IP interna en lugar de la IP pública; asegúrate de utilizar la IP pública si accedes desde fuera.
Aviso: En la línea de abajo verás la contraseña de acceso. Anota esta contraseña. Puedes volver a generar esta contraseña si la pierdes o si deseas restablecerla:
bash -l
kubectl kots reset-password -n defaultbash -l
kubectl kots reset-password -n default

Añadir la GPU después de la instalación

Si la GPU no estaba disponible durante la instalación, pero se añade más tarde a la máquina, debes completar los siguientes pasos para que AI Fabric pueda acceder a ella.
  • Comprueba que los controladores de la GPU están correctamente instalados ejecutando el siguiente comando:
    nvidia-sminvidia-smi

    Si los controladores de la GPU están instalados correctamente, debería mostrarse la información de la GPU. Si se produce un error, significa que la GPU no es accesible o que los controladores no se instalaron correctamente. Este problema debe solucionarse antes de continuar.

  • Comprueba que NVIDIA Runtime Container está instalado correctamente ejecutando el siguiente comando:
    /usr/bin/nvidia-container-runtime/usr/bin/nvidia-container-runtime
  1. Descarga los dos scripts disponibles para añadir la GPU del siguiente enlace: scripts de la GPU.
  2. Ejecuta un script para añadir la GPU al clúster para que los procesos y las habilidades ML puedan utilizarla. Dependiendo de tu instalación, elige una de las siguientes opciones:
    • En caso de instalación en línea, ejecuta el siguiente script:
      <h1>navigate to where you untar installer (or redo it if you have removed it)
      cd ./aicenter-installer-v21.4.0/infra/common/scripts
      ./attach_gpu_drivers.sh</h1><h1>navigate to where you untar installer (or redo it if you have removed it)
      cd ./aicenter-installer-v21.4.0/infra/common/scripts
      ./attach_gpu_drivers.sh</h1>
    • En caso de una instalación aislada, primero debes crear el archivo en el directorio aif_infra, asegurándote de que nvidia-device-plugin.yaml se encuentra en la misma carpeta.
      Para crear el archivo, pega el contenido del archivo attach_gpu_drivers.sh descargado en el paso 1. Ejecuta el siguiente script:
      ./attach_gpu_drivers.sh./attach_gpu_drivers.sh

Solución de problemas

El instalador de infraestructura no es idempotente. Esto significa que la ejecución del instalador de nuevo (después de haberlo ejecutado ya una vez) no funcionará. Si este instalador falla, tendrás que volver a aprovisionar una nueva máquina con discos nuevos.

Las causas más habituales de error son que el disco de arranque se llena durante la instalación o que los discos de datos externos están montados/con formato. Recuerda adjuntar solo los discos, sin formato.

Si la instalación falla con discos no formateados y un disco de arranque suficientemente grande, ponte en contacto con nuestro equipo de soporte e incluye un paquete de soporte en tu correo electrónico. Se puede generar un paquete de soporte ejecutando este comando:

curl https://krew.sh/support-bundle | bash
kubectl support-bundle https://kots.iocurl https://krew.sh/support-bundle | bash
kubectl support-bundle https://kots.io

Como alternativa, si no tienes acceso a Internet, puedes crear el archivo support-bundle.yaml con el siguiente texto:

apiVersion: troubleshoot.replicated.com/v1beta1
kind: Collector
metadata:
  name: collector-sample
spec:
  collectors:
    - clusterInfo: {}
    - clusterResources: {}
    - exec:
        args:
          - "-U"
          - kotsadm
        collectorName: kotsadm-postgres-db
        command:
          - pg_dump
        containerName: kotsadm-postgres
        name: kots/admin_console
        selector:
          - app=kotsadm-postgres
        timeout: 10s
    - logs:
        collectorName: kotsadm-postgres-db
        name: kots/admin_console
        selector:
          - app=kotsadm-postgres
    - logs:
        collectorName: kotsadm-api
        name: kots/admin_console
        selector:
          - app=kotsadm-api
    - logs:
        collectorName: kotsadm-operator
        name: kots/admin_console
        selector:
          - app=kotsadm-operator
    - logs:
        collectorName: kotsadm
        name: kots/admin_console
        selector:
          - app=kotsadm
    - logs:
        collectorName: kurl-proxy-kotsadm
        name: kots/admin_console
        selector:
          - app=kurl-proxy-kotsadm
    - secret:
        collectorName: kotsadm-replicated-registry
        includeValue: false
        key: .dockerconfigjson
        name: kotsadm-replicated-registry
    - logs:
        collectorName: rook-ceph-agent
        selector:
          - app=rook-ceph-agent
        namespace: rook-ceph
        name: kots/rook
    - logs:
        collectorName: rook-ceph-mgr
        selector:
          - app=rook-ceph-mgr
        namespace: rook-ceph
        name: kots/rook
- logs:
        collectorName: rook-ceph-mon
        selector:
          - app=rook-ceph-mon
        namespace: rook-ceph
        name: kots/rook
    - logs:
        collectorName: rook-ceph-operator
        selector:
          - app=rook-ceph-operator
        namespace: rook-ceph
        name: kots/rook
    - logs:
        collectorName: rook-ceph-osd
        selector:
          - app=rook-ceph-osd
        namespace: rook-ceph
        name: kots/rook
    - logs:
        collectorName: rook-ceph-osd-prepare
        selector:
          - app=rook-ceph-osd-prepare
        namespace: rook-ceph
        name: kots/rook
    - logs:
        collectorName: rook-ceph-rgw
        selector:
          - app=rook-ceph-rgw
        namespace: rook-ceph
        name: kots/rook
    - logs:
        collectorName: rook-discover
        selector:
          - app=rook-discover
        namespace: rook-ceph
        name: kots/rookapiVersion: troubleshoot.replicated.com/v1beta1
kind: Collector
metadata:
  name: collector-sample
spec:
  collectors:
    - clusterInfo: {}
    - clusterResources: {}
    - exec:
        args:
          - "-U"
          - kotsadm
        collectorName: kotsadm-postgres-db
        command:
          - pg_dump
        containerName: kotsadm-postgres
        name: kots/admin_console
        selector:
          - app=kotsadm-postgres
        timeout: 10s
    - logs:
        collectorName: kotsadm-postgres-db
        name: kots/admin_console
        selector:
          - app=kotsadm-postgres
    - logs:
        collectorName: kotsadm-api
        name: kots/admin_console
        selector:
          - app=kotsadm-api
    - logs:
        collectorName: kotsadm-operator
        name: kots/admin_console
        selector:
          - app=kotsadm-operator
    - logs:
        collectorName: kotsadm
        name: kots/admin_console
        selector:
          - app=kotsadm
    - logs:
        collectorName: kurl-proxy-kotsadm
        name: kots/admin_console
        selector:
          - app=kurl-proxy-kotsadm
    - secret:
        collectorName: kotsadm-replicated-registry
        includeValue: false
        key: .dockerconfigjson
        name: kotsadm-replicated-registry
    - logs:
        collectorName: rook-ceph-agent
        selector:
          - app=rook-ceph-agent
        namespace: rook-ceph
        name: kots/rook
    - logs:
        collectorName: rook-ceph-mgr
        selector:
          - app=rook-ceph-mgr
        namespace: rook-ceph
        name: kots/rook
- logs:
        collectorName: rook-ceph-mon
        selector:
          - app=rook-ceph-mon
        namespace: rook-ceph
        name: kots/rook
    - logs:
        collectorName: rook-ceph-operator
        selector:
          - app=rook-ceph-operator
        namespace: rook-ceph
        name: kots/rook
    - logs:
        collectorName: rook-ceph-osd
        selector:
          - app=rook-ceph-osd
        namespace: rook-ceph
        name: kots/rook
    - logs:
        collectorName: rook-ceph-osd-prepare
        selector:
          - app=rook-ceph-osd-prepare
        namespace: rook-ceph
        name: kots/rook
    - logs:
        collectorName: rook-ceph-rgw
        selector:
          - app=rook-ceph-rgw
        namespace: rook-ceph
        name: kots/rook
    - logs:
        collectorName: rook-discover
        selector:
          - app=rook-discover
        namespace: rook-ceph
        name: kots/rook

Y a continuación, crea el archivo de paquete de soporte support-bundle utilizando el siguiente comando:

kubectl support-bundle support-bundle.yamlkubectl support-bundle support-bundle.yaml

Esto creará un archivo llamado supportbundle.tar.gz que puedes cargar al subir un ticket de soporte.

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.