- Introdução
- Requisitos de rede
- Requisitos e instalação de um nó
- Requisitos e instalação de vários nós
- Pós-instalação
- Acesso ao AI Center
- Provisionamento de um tenant do AI Center
- Atualização dos certificados do Orchestrator e do Identity Server
- Redimensionamento de PVC
- Adição de um novo nó ao cluster
- Instalação offline de pacotes de ML
- Configuração do cluster
- Configuração da pós-instalação do FQDN
- Backup e restauração do cluster
- Uso da pilha de monitoramento
- Configuração de uma autenticação do Kerberos
- Provisionamento de uma GPU
- Uso do arquivo de configuração
- Agendamento de nós
- Migração e atualização
- Guia básico de solução de problemas
- Solução de problemas e perguntas frequentes gerais do AI Center
Solução de problemas e perguntas frequentes gerais do AI Center
Ao carregar arquivos de conjunto de dados, pode ocorrer o seguinte erro:
Failed to upload item(s), it may be due to a slow or lost internet connection
Abra o console do navegador e obtenha o DNS do URL do objectstore. Ele estará no formato objectstore.xxx.xx Certifique-se de que o DNS do objectstore pode ser resolvido adicionando ao arquivo host ou conversando com o administrador da rede Depois que o DNS for resolvido, se o certificado não for confiável, certifique-se de confiar no certificado dentro do seu navegador antes de carregar o item.
Problema: erro em páginas de Pipelines embora as permissões estejam em vigor para executar pipelines
Ao tentar exibir ou executar pipelines, pode ocorrer um erro, mesmo que as permissões para executar pipelines estejam em vigor.
Problema: a implantação do serviço pode ficar travada porque o bloqueio do DATABASECHANGELOGLOCK não está sendo liberado por um serviço
Em raras situações, se você reiniciar a máquina duas vezes consecutivas, a implantação do serviço pode ficar travada porque o bloqueio não está sendo liberado por um serviço. Nesse caso, você verá os pods do AI Center reiniciando continuamente.
O script de importação/exportação está falhando com a seguinte mensagem de erro:
cookfile_new.txt: Permission denied
Ao executar os scripts de importação ou exportação, pode ocorrer a seguinte mensagem de erro:
./export.sh: line 2: $'\r': command not found
Esta mensagem de erro é exibida ao importar ou exportar pacotes de ML usando scripts.
Esse problema pode ocorrer ao executar uma automação do UiPath Studio e carregar dados de validação para treinamento usando um conjunto de dados público.
update-mlskills-cm
está ausente nas versões 2021.10.1 e 2021.10.2 do AI Center.
YAML
abaixo.
apiVersion: batch/v1beta1
kind: CronJob
metadata:
name: update-mlskill-cm
namespace: uipath
spec:
concurrencyPolicy: Forbid
failedJobsHistoryLimit: 1
jobTemplate:
spec:
template:
metadata:
annotations:
sidecar.istio.io/inject: "false"
spec:
containers:
- args:
- -XPOST
- ai-deployer-svc.uipath.svc.cluster.local/ai-deployer/v1/system/mlskills:update-cm
image: registry.uipath.com/aicenter/alpine-curl:7.78.0
imagePullPolicy: IfNotPresent
name: update-mlskill-cm
securityContext:
allowPrivilegeEscalation: false
capabilities:
drop:
- NET_RAW
privileged: false
readOnlyRootFilesystem: true
runAsNonRoot: true
dnsPolicy: ClusterFirst
imagePullSecrets:
- name: regcred
restartPolicy: OnFailure
schedulerName: default-scheduler
securityContext: {}
terminationGracePeriodSeconds: 30
ttlSecondsAfterFinished: 120
schedule: 0 */2 * * *
startingDeadlineSeconds: 200
successfulJobsHistoryLimit: 1
suspend: false
apiVersion: batch/v1beta1
kind: CronJob
metadata:
name: update-mlskill-cm
namespace: uipath
spec:
concurrencyPolicy: Forbid
failedJobsHistoryLimit: 1
jobTemplate:
spec:
template:
metadata:
annotations:
sidecar.istio.io/inject: "false"
spec:
containers:
- args:
- -XPOST
- ai-deployer-svc.uipath.svc.cluster.local/ai-deployer/v1/system/mlskills:update-cm
image: registry.uipath.com/aicenter/alpine-curl:7.78.0
imagePullPolicy: IfNotPresent
name: update-mlskill-cm
securityContext:
allowPrivilegeEscalation: false
capabilities:
drop:
- NET_RAW
privileged: false
readOnlyRootFilesystem: true
runAsNonRoot: true
dnsPolicy: ClusterFirst
imagePullSecrets:
- name: regcred
restartPolicy: OnFailure
schedulerName: default-scheduler
securityContext: {}
terminationGracePeriodSeconds: 30
ttlSecondsAfterFinished: 120
schedule: 0 */2 * * *
startingDeadlineSeconds: 200
successfulJobsHistoryLimit: 1
suspend: false
LOGS_STREAMING_ENABLED
para false
. Você também pode adicionar uma variável global logsStreamingEnabled
com o valor definido como false
usando ArgoCD nos detalhes do aplicativo aicenter . Certifique-se de sincronizar o ArgoCD após a conclusão da alteração.
- Mensagem: falha ao carregar itens, talvez devido a uma conexão de internet lenta ou perdida.
- Possível causa
- Solução
- Problema: erro em páginas de Pipelines embora as permissões estejam em vigor para executar pipelines
- Solução
- Problema: a implantação do serviço pode ficar travada porque o bloqueio do DATABASECHANGELOGLOCK não está sendo liberado por um serviço
- Solução
- Problema: script de importação/exportação falha
- Solução
- Mensagem: ./export.sh: Linha 2: $'r': Comando não encontrado
- Solução
- Problema: a URL assinada para conjuntos de dados públicos está falhando
- Solução
- Problema: o cronjob Update-mlskills-cm está ausente
- Solução
- Desativando registros de streaming
- Versões até a 2022.4.2
- Versões a partir da 2022.4.3