- Visão geral
- Requisitos
- Instalação
- Perguntas e respostas: modelos de implantação
- Configuração das máquinas
- Configuração do balanceador de carga
- Configuração do DNS
- Como configurar o Microsoft SQL Server
- Configuração dos certificados
- Instalação online de produção pronta para alta disponibilidade de vários nós
- Instalação offline de produção pronta para alta disponibilidade de vários nós
- Baixando os pacotes de instalação
- Parâmetros do install-uipath.sh
- Como habilitar o High Availability Add-on do Redis para o cluster
- Arquivo de configuração do Document Understanding
- Adicionando um nó de agente dedicado com suporte a GPU
- Conexão do aplicativo Task Mining
- Adição de um nó de agente dedicado ao Task Mining
- Pós-instalação
- Administração de cluster
- Gerenciando produtos
- Gerenciamento do cluster no ArgoCD
- Configuração do servidor NFS externo
- Automatizado: habilitando o backup no cluster
- Automatizado: desabilitando o backup no cluster
- Automatizado, online: restaurando o cluster
- Automatizado, offline: restaurando o cluster
- Manual: habilitando o backup no cluster
- Manual: desabilitando o backup no cluster
- Manual, online: restaurando o cluster
- Manual, offline: restaurando o cluster
- Configuração adicional
- Migrating objectstore from persistent volume to raw disks
- Monitoramento e alertas
- Migração e atualização
- Opções de migração
- Etapa 1: mover os dados da organização do Identity, de independente para o Automation Suite
- Etapa 2: restauração do banco de dados de produtos independente
- Etapa 3: backup do banco de dados da plataforma no Automation Suite
- Etapa 4: mesclando organizações no Automation Suite
- Etapa 5: atualização das strings de conexão do produto migradas
- Etapa 6: migração do Insights independente
- Etapa 7: exclusão do tenant padrão
- B) Migração de um único tenant
- Configuração específica do produto
- Melhores práticas e manutenção
- Solução de problemas
- Como solucionar problemas dos serviços durante a instalação
- Como desinstalar o cluster
- Como limpar os artefatos offline para melhorar o espaço em disco
- Como limpar os dados do Redis
- Como habilitar o registro em log do Istio
- Como limpar logs manualmente
- Como limpar logs antigos armazenados no bucket do sf-logs
- Como desabilitar os logs de streaming para o AI Center
- Como depurar instalações do Automation Suite com falha
- Como excluir imagens do instalador antigo após a atualização
- Como limpar automaticamente instantâneos do Longhorn
- Como desabilitar o descarregamento de soma de verificação do TX
- Como lidar com cifras fracas no TLS 1.2
- Não é possível executar uma instalação offline no SO RHEL 8.4
- Erro ao baixar o pacote
- A instalação offline falha devido a um binário ausente
- Problema de certificado na instalação offline
- First installation fails during Longhorn setup
- Erro de validação da string de conexão ao SQL
- Verificação de pré-requisito para o módulo iscsid do selinux falha
- Azure disk not marked as SSD
- Falha após a atualização do certificado
- Automation Suite not working after OS upgrade
- O Automation Suite requer que Backlog_wait_time seja definido como 1
- Não é possível montar o volume devido a não estar pronto para cargas de trabalho
- O RKE2 falha durante a instalação e atualização
- Falha ao carregar ou baixar dados no objectstore
- PVC resize does not heal Ceph
- Falha no redimensionamento do PVC do Objectstore
- Pod do Rook Ceph ou Looker travado no estado Init
- Erro de anexo de volume StatefulSet
- Falha ao criar volumes persistentes
- Patch de reclamação de armazenamento
- Falha de backup devido ao erro TooManySnapshots
- Todas as réplicas do Longhorn estão com falha
- Configurando um intervalo de tempo limite para os portais de gerenciamento
- Atualizar as conexões de diretório subjacentes
- Não é possível fazer login após a migração
- kinit: não é possível encontrar o KDC para o realm <AD Domain> ao obter credenciais iniciais
- kinit: o Keytab não contém chaves adequadas para *** ao obter credenciais iniciais
- A operação do GSSAPI falhou com erro: um código de status inválido foi fornecido (as credenciais do cliente foram revogadas).
- Alarme recebido para tarefa Kerberos-tgt-update com falha
- Provedor SSPI: servidor não encontrado no banco de dados Kerberos
- Falha do login para o usuário <ADDOMAIN><aduser> Motivo: a conta está desabilitada.
- ArgoCD login failed
- Falha ao obter a imagem do sandbox
- Os pods não são exibidos na UI do ArgoCD
- Falha de teste do Redis
- O servidor RKE2 falha ao iniciar
- Segredo não encontrado no namespace da UiPath
- Após a instalação inicial, o aplicativo ArgoCD entrou no estado Em andamento
- Pods de MongoDB em CrashLoopBackOff ou provisionamento de PVC pendente após exclusão
- Inconsistência inesperada; execute o fsck manualmente
- MongoDB degradado ou aplicativos de negócios após a restauração do cluster
- Operador de autocura ausente e repositório Sf-k8-utils ausente
- Serviços não íntegros após restauração ou reversão do cluster
- Pod RabbitMQ preso em CrashLoopBackOff
- Prometheus no estado CrashloopBackoff com erro de falta de memória (OOM)
- Métricas Ceph-rook ausentes nos painéis de monitoramento
- Os pods não podem se comunicar com o FQDN em um ambiente de proxy
- O Document Understanding não está no menu de navegação esquerdo do Automation Suite
- Status de Falha ao criar uma sessão de rotulagem de dados
- Status de Falha ao tentar implantar uma habilidade de ML
- Trabalho de migração falha no ArgoCD
- Reconhecimento de escrita com o Extrator de formulários inteligente não está funcionando
- Usando a ferramenta de diagnóstico do Automation Suite
- Usando a ferramenta de pacote de suporte do Automation Suite
- Exploração de logs
Como remover um nó do cluster
Após instalar o Automation Suite, você pode remover qualquer nó do cluster para fins de manutenção da máquina ou para liberar recursos não utilizados. Você pode remover nós de servidor, agente, Task Mining e GPU do cluster.
A remoção de um nó do cluster só é possível em configurações de produção prontas para HA de vários nós.
A remoção de nós do cluster não causa tempo de inatividade. No entanto, ainda pode afetar o componente de cache interno se o HAA não estiver configurado.
A remoção do nó de Task Mining ou GPU não irá esperar por trabalhos já agendados, como pipeline de treinamento ou análise. Se esses trabalhos forem excluídos no processo de remoção do nó, você precisará iniciá-los novamente. Certifique-se de que nenhum processo esteja em execução nos nós que você planeja remover.
A execução das etapas a seguir resultaria apenas na remoção dos nós do cluster. A máquina não será completamente limpa e alguns resíduos podem inutilizá-la para uma instalação posterior.
Certifique-se de formatar a máquina e prepará-la para instalação ou para adicioná-la a um cluster existente, seguindo as instruções em Configuração da máquina.
Para remover com êxito um nó do cluster, você deve atender aos seguintes requisitos:
- A capacidade do cluster resultante deve corresponder à capacidade total necessária para executar as cargas de trabalho agendadas antes da remoção do nó. Por exemplo, se as cargas de trabalho totais exigirem vCPU de 32 e 64 GiB de memória, após a remoção do nó, os nós restantes no cluster deverão ter pelo menos a mesma quantidade de recursos. Caso contrário, você não terá permissão para remover os nós.
- O cluster resultante deve ter no mínimo 3 nós de servidor; um número ímpar de nós de servidor também é necessário.
- Se a configuração for multizonal, o cluster resultante deve ter nós de servidor em uma das três zonas.
- O cluster deve estar em um estado saudável, ou seja, todos os nós ou pods são saudáveis. Os pods não estão saudáveis quando estão em qualquer um dos estados a seguir:
Pending
,Error
,Init
,Crashloopbackoff
,Terminating
. - Você não pode remover nós de Task Mining e GPU, a menos que nós adicionais de Task Mining e GPU correspondentes estejam disponíveis.
Para remover um nó do cluster, siga as seguintes etapas:
O script avisa para desligar ou encerrar o nó; ele não exclui o nó do cluster até que você desligue o nó. O script aguarda 5 minutos para que o nó seja encerrado antes de atingir o tempo limite. O script fornece instruções sobre qual nó desligar e em qual ordem. Você também pode executar novamente o script se não tiver encerrado o nó no horário solicitado.
Para automatizar todo o processo de remoção do nó, execute as seguintes etapas:
- Adicione o sinalizador
--skip-node-deletion
ao final do script na etapa 3. - Após o script for bem-sucedido, desative o primeiro nó de destino e execute novamente o script, desta vez sem
--skip-node-deletion
. Se você não tiver desativado o nó na ordem fornecida para o script, então ele falhará. Você sempre pode executar novamente o script, após o nó esperado ter sido desativado. - Repita a etapa anterior até que todos os nós sejam removidos com sucesso.
Para obter o nome dos nós a serem removidos, consulte Como obter o nome do nó.