- Notas relacionadas
- Requisitos
- Instalación
- Acerca de la instalación
- 1. Aprovisionar una máquina
- 2. Configurar la base de datos
- 3. Configurar Orchestrator
- 4. Ejecutar el instalador de infraestructura de AI Fabric
- 5. Ejecutar el instalador de la aplicación AI Fabric
- 6. Verificar la instalación
- Software de terceros
- Soporte
- Actualizar AI Fabric
- Actualizar el certificado de AI Fabric
- Primeros pasos
- Proyectos
- Conjuntos de datos
- Paquetes ML
- Procesos
- Habilidades ML
- Logs de ML
- Document Understanding en AI Fabric
- Guía básica de resolución de problemas
4. Ejecutar el instalador de infraestructura de AI Fabric
Ejecuta el instalador de infraestructura de AI Fabric. Completar este instalador generará la consola de administración de Kots, en la que puedes gestionar las actualizaciones de la aplicación, la configuración de la aplicación, el uso de recursos (presión de CPU/memoria) y descargar paquetes de asistencia para resolver cualquier problema.
El primer paso es descargar el archivo .zip del instalador aquí y trasladarlo al servidor de AI Fabric. Como alternativa, puedes descargarlo directamente desde la máquina utilizando el siguiente comando:
El script descargará algunos archivos localmente como parte del proceso de instalación; asegúrate de tener 4 GB disponibles en el directorio en el que ejecutas el script.
De forma predeterminada, las máquinas virtuales de Azure RHEL tienen solo 1 GB disponible en el directorio de inicio que es el directorio predeterminado.
wget https://download.uipath.com/aifabric/online-installer/v2020.10.5/aifabric-installer-v20.10.5.tar.gz
wget https://download.uipath.com/aifabric/online-installer/v2020.10.5/aifabric-installer-v20.10.5.tar.gz
A continuación, extrae el archivo y ve a la carpeta principal utilizando el siguiente comando:
tar -xvf aifabric-installer-v20.10.5.tar.gz
cd ./aifabric-installer-v20.10.5
tar -xvf aifabric-installer-v20.10.5.tar.gz
cd ./aifabric-installer-v20.10.5
A continuación, puedes ejecutar el instalador de AI Fabric ejecutando lo siguiente:
./setup.sh
./setup.sh
El primer paso es aceptar el acuerdo de licencia pulsando Y. El script te preguntará a continuación qué tipo de plataforma deseas instalar; escribe onebox y presiona Entrar como en la siguiente imagen:
A continuación, se te pedirá si hay una GPU disponible para tu configuración y Y o N, dependiendo de tu hardware. Asegúrate de que los controladores ya están instalados.
Dependiendo de tu sistema, es posible que tengas que presionar Y algunas veces más para completar la instalación.
Este paso te llevará entre 15 y 25 minutos. Una vez finalizada, verás el mensaje Instalación completa en el output del terminal.
En la máquina local con acceso a un navegador (por ejemplo, un servidor de Windows) descarga la instalación del paquete utilizando el vínculo proporcionado por tu gestor de cuentas.
tar -zxvf aifabric-installer-v2020.10.5.tar.gz
de una máquina que admita tar.
Esto creará dos carpetas:
aif_infra_20.10.5.tar.gz
, que contiene componentes de infraestructura (alrededor de 3,6 GB).ai-fabric-v2020.10.5.airgap
, que contiene componentes de la aplicación (alrededor de 8,7 GB). Este se cargará en la IU en el paso 5. Ejecutar el instalador de la aplicación de AI Fabric.
aif_infra_20.10.5.tar.gz
en la máquina de AI Fabric aislada.
A continuación, ejecuta el siguiente comando para iniciar el instalador de infraestructura:
tar -zxvf aif_infra_20.10.5.tar.gz
cd aif_infra_20.10.5
sudo ./setup.sh
tar -zxvf aif_infra_20.10.5.tar.gz
cd aif_infra_20.10.5
sudo ./setup.sh
En ambos casos, una instalación correcta mostrará la dirección y la contraseña de KotsAdmin Ui.
...
Install Successful:
configmap/kurl-config created
Installation
Complete ✔
Kotsadm: http://13.59.108.17:8800
Login with password (will not be shown again): NNqKCY82S
The UIs of Prometheus, Grafana and Alertmanager have been exposed on NodePorts 30900,
30902 and 30903 respectively.
To access Grafana use the generated user:password of admin:msDX5VZ9m .
To access the cluster with kubectl, reload your shell:
bash -l
...
...
Install Successful:
configmap/kurl-config created
Installation
Complete ✔
Kotsadm: http://13.59.108.17:8800
Login with password (will not be shown again): NNqKCY82S
The UIs of Prometheus, Grafana and Alertmanager have been exposed on NodePorts 30900,
30902 and 30903 respectively.
To access Grafana use the generated user:password of admin:msDX5VZ9m .
To access the cluster with kubectl, reload your shell:
bash -l
...
<machine-ip>:8800
. En algún caso, puede que muestre la IP interna en lugar de la IP pública; asegúrate de utilizar la IP pública si accedes desde fuera.
bash -l
kubectl kots reset-password -n default
bash -l
kubectl kots reset-password -n default
- Comprueba que los controladores de la GPU están correctamente instalados ejecutando el siguiente comando:
nvidia-smi
nvidia-smiSi los controladores de la GPU están instalados correctamente, debería mostrarse la información de la GPU. Si se produce un error, significa que la GPU no es accesible o que los controladores no se instalaron correctamente. Este problema debe solucionarse antes de continuar.
- Comprueba que NVIDIA Runtime Container está instalado correctamente ejecutando el siguiente comando:
/usr/bin/nvidia-container-runtime
/usr/bin/nvidia-container-runtime
- Descarga los dos scripts disponibles para añadir la GPU del siguiente enlace: scripts de la GPU.
-
Ejecuta un script para añadir la GPU al clúster para que los procesos y las habilidades ML puedan utilizarla. Dependiendo de tu instalación, elige una de las siguientes opciones:
- En caso de instalación en línea, ejecute el siguiente script:
<h1>navigate to where you untar installer (or redo it if you have removed it) cd ./aicenter-installer-v21.4.0/infra/common/scripts ./attach_gpu_drivers.sh</h1>
<h1>navigate to where you untar installer (or redo it if you have removed it) cd ./aicenter-installer-v21.4.0/infra/common/scripts ./attach_gpu_drivers.sh</h1> -
En caso de una instalación aislada, primero debes crear el archivo en el directorio
aif_infra
, asegurándote de quenvidia-device-plugin.yaml
se encuentra en la misma carpeta.Para crear el archivo, pega el contenido del archivoattach_gpu_drivers.sh
descargado en el paso 1. Ejecuta el siguiente script:./attach_gpu_drivers.sh
./attach_gpu_drivers.sh
- En caso de instalación en línea, ejecute el siguiente script:
El instalador de infraestructura no es idempotente. Esto significa que la ejecución del instalador de nuevo (después de haberlo ejecutado ya una vez) no funcionará. Si este instalador falla, tendrás que volver a aprovisionar una nueva máquina con discos nuevos.
Las causas más habituales de error son que el disco de arranque se llena durante la instalación o que los discos de datos externos están montados/con formato. Recuerda adjuntar solo los discos, sin formato.
Si la instalación falla con discos no formateados y un disco de arranque suficientemente grande, ponte en contacto con nuestro equipo de soporte e incluye un paquete de soporte en tu correo electrónico. Se puede generar un paquete de soporte ejecutando este comando:
curl https://krew.sh/support-bundle | bash
kubectl support-bundle https://kots.io
curl https://krew.sh/support-bundle | bash
kubectl support-bundle https://kots.io
Como alternativa, si no tienes acceso a Internet, puedes crear el archivo support-bundle.yaml con el siguiente texto:
apiVersion: troubleshoot.replicated.com/v1beta1
kind: Collector
metadata:
name: collector-sample
spec:
collectors:
- clusterInfo: {}
- clusterResources: {}
- exec:
args:
- "-U"
- kotsadm
collectorName: kotsadm-postgres-db
command:
- pg_dump
containerName: kotsadm-postgres
name: kots/admin_console
selector:
- app=kotsadm-postgres
timeout: 10s
- logs:
collectorName: kotsadm-postgres-db
name: kots/admin_console
selector:
- app=kotsadm-postgres
- logs:
collectorName: kotsadm-api
name: kots/admin_console
selector:
- app=kotsadm-api
- logs:
collectorName: kotsadm-operator
name: kots/admin_console
selector:
- app=kotsadm-operator
- logs:
collectorName: kotsadm
name: kots/admin_console
selector:
- app=kotsadm
- logs:
collectorName: kurl-proxy-kotsadm
name: kots/admin_console
selector:
- app=kurl-proxy-kotsadm
- secret:
collectorName: kotsadm-replicated-registry
includeValue: false
key: .dockerconfigjson
name: kotsadm-replicated-registry
- logs:
collectorName: rook-ceph-agent
selector:
- app=rook-ceph-agent
namespace: rook-ceph
name: kots/rook
- logs:
collectorName: rook-ceph-mgr
selector:
- app=rook-ceph-mgr
namespace: rook-ceph
name: kots/rook
- logs:
collectorName: rook-ceph-mon
selector:
- app=rook-ceph-mon
namespace: rook-ceph
name: kots/rook
- logs:
collectorName: rook-ceph-operator
selector:
- app=rook-ceph-operator
namespace: rook-ceph
name: kots/rook
- logs:
collectorName: rook-ceph-osd
selector:
- app=rook-ceph-osd
namespace: rook-ceph
name: kots/rook
- logs:
collectorName: rook-ceph-osd-prepare
selector:
- app=rook-ceph-osd-prepare
namespace: rook-ceph
name: kots/rook
- logs:
collectorName: rook-ceph-rgw
selector:
- app=rook-ceph-rgw
namespace: rook-ceph
name: kots/rook
- logs:
collectorName: rook-discover
selector:
- app=rook-discover
namespace: rook-ceph
name: kots/rook
apiVersion: troubleshoot.replicated.com/v1beta1
kind: Collector
metadata:
name: collector-sample
spec:
collectors:
- clusterInfo: {}
- clusterResources: {}
- exec:
args:
- "-U"
- kotsadm
collectorName: kotsadm-postgres-db
command:
- pg_dump
containerName: kotsadm-postgres
name: kots/admin_console
selector:
- app=kotsadm-postgres
timeout: 10s
- logs:
collectorName: kotsadm-postgres-db
name: kots/admin_console
selector:
- app=kotsadm-postgres
- logs:
collectorName: kotsadm-api
name: kots/admin_console
selector:
- app=kotsadm-api
- logs:
collectorName: kotsadm-operator
name: kots/admin_console
selector:
- app=kotsadm-operator
- logs:
collectorName: kotsadm
name: kots/admin_console
selector:
- app=kotsadm
- logs:
collectorName: kurl-proxy-kotsadm
name: kots/admin_console
selector:
- app=kurl-proxy-kotsadm
- secret:
collectorName: kotsadm-replicated-registry
includeValue: false
key: .dockerconfigjson
name: kotsadm-replicated-registry
- logs:
collectorName: rook-ceph-agent
selector:
- app=rook-ceph-agent
namespace: rook-ceph
name: kots/rook
- logs:
collectorName: rook-ceph-mgr
selector:
- app=rook-ceph-mgr
namespace: rook-ceph
name: kots/rook
- logs:
collectorName: rook-ceph-mon
selector:
- app=rook-ceph-mon
namespace: rook-ceph
name: kots/rook
- logs:
collectorName: rook-ceph-operator
selector:
- app=rook-ceph-operator
namespace: rook-ceph
name: kots/rook
- logs:
collectorName: rook-ceph-osd
selector:
- app=rook-ceph-osd
namespace: rook-ceph
name: kots/rook
- logs:
collectorName: rook-ceph-osd-prepare
selector:
- app=rook-ceph-osd-prepare
namespace: rook-ceph
name: kots/rook
- logs:
collectorName: rook-ceph-rgw
selector:
- app=rook-ceph-rgw
namespace: rook-ceph
name: kots/rook
- logs:
collectorName: rook-discover
selector:
- app=rook-discover
namespace: rook-ceph
name: kots/rook
Y a continuación, crea el archivo de paquete de soporte support-bundle utilizando el siguiente comando:
kubectl support-bundle support-bundle.yaml
kubectl support-bundle support-bundle.yaml
Esto creará un archivo llamado supportbundle.tar.gz que puedes cargar al subir un ticket de soporte.