Automation Suite
2023.10
falso
- Visão geral
- Requisitos
- Recomendado: modelos de implantação
- Manual: preparando a instalação
- Manual: preparando a instalação
- Etapa 1: Configuração do registro compatível com OCI para instalações offline
- Etapa 2: configuração do objectstore externo
- Etapa 3: configuração do High Availability Add-on
- Etapa 4: configuração do Microsoft SQL Server
- Etapa 5: configuração do balanceador de carga
- Etapa 5: configuração do DNS
- Etapa 7: configuração dos ajustes do nível do kernel e do sistema operacional
- Etapa 8: configuração dos discos
- Etapa 9: configuração das portas do nó
- Etapa 10: aplicação de configurações diversas
- Etapa 12: validação e instalação dos pacotes RPM necessários
- Etapa 13: geração de cluster_config.json
- Configuração de Certificados
- Configuração do Banco de Dados
- Configuração externa do Objectstore
- Configuração de URL pré-assinada
- Configuração de registro externo compatível com OCI
- Disaster Recovery: configurações Ativo/Passivo e Ativo/Ativo
- Configuração do High Availability Add-on
- Configuração específica do Orchestrator
- Configuração específica do Insights
- Process Mining-specific configuration
- Configuração específica do Document Understanding
- Automation Suite Robots-specific configuration
- Configuração do monitoramento
- Opcional: configuração do servidor proxy
- Opcional: habilitação da resiliência a falhas zonais em um cluster de produção pronto para alta disponibilidade de vários nós
- Opcional: transmitindo resolv.conf personalizado
- Optional: Increasing fault tolerance
- Parâmetros do install-uipath.sh
- Adicionando um nó de agente dedicado com suporte a GPU
- Adição de um nó de agente dedicado ao Task Mining
- Conexão do aplicativo Task Mining
- Adicionando um nó de agente dedicado para robôs do Automation Suite
- Etapa 15: configuração do registro temporário do Docker para instalações offline
- Etapa 16: validação dos pré-requisitos para a instalação
- Manual: realizando a instalação
- Pós-instalação
- Administração de cluster
- Gerenciando produtos
- Introdução ao portal de administração do cluster
- Migrating objectstore from persistent volume to raw disks
- Migração do High Availability Add-on no cluster para externo
- Migrating data between objectstores
- Migrating in-cluster objectstore to external objectstore
- Mudança para o cluster secundário manualmente em uma configuração Ativo/Passivo
- Disaster Recovery: executando operações pós-instalação
- Convertendo uma instalação existente para configuração multi-local
- Diretrizes sobre atualização de uma implantação Ativo/Passivo ou Ativo/Ativo
- Diretrizes sobre backup e restauração de uma implantação Ativo/Passivo ou Ativo/Ativo
- Redirecting traffic for the unsupported services to the primary cluster
- Monitoramento e alertas
- Migração e atualização
- Etapa 1: mover os dados da organização do Identity, de independente para o Automation Suite
- Etapa 2: restauração do banco de dados de produtos independente
- Etapa 3: backup do banco de dados da plataforma no Automation Suite
- Etapa 4: mesclando organizações no Automation Suite
- Etapa 5: atualização das strings de conexão do produto migradas
- Etapa 6: migração do Orchestrator independente
- Etapa 7: migração do Insights independente
- Etapa 8: exclusão do tenant padrão
- B) Migração de um único tenant
- Migração do Automation Suite no Linux para o Automation Suite no EKS/AKS
- Atualizando o Automação Suite
- Download dos pacotes de instalação e obtenção de todos os arquivos no primeiro nó do servidor
- Recuperação da mais recente configuração aplicada do cluster
- Atualização da configuração de cluster
- Configuração do registro compatível com OCI para instalações offline
- Migração para um registro externo compatível com OCI
- Execução da atualização
- Realização de operações pós-atualização
- Configuração específica do produto
- Uso da ferramenta de configuração do Orchestrator
- Configuração de parâmetros do Orchestrator
- Configurações de aplicativo do Orchestrator
- Configuração do AppSettings
- Configuração do tamanho máximo da solicitação
- Substituição da configuração de armazenamento no nível do cluster
- Configuração dos repositórios de credenciais
- Configuração da chave de criptografia por tenant
- Melhores práticas e manutenção
- Solução de problemas
- Como solucionar problemas dos serviços durante a instalação
- Como desinstalar o cluster
- Como limpar os artefatos offline para melhorar o espaço em disco
- Como limpar os dados do Redis
- Como habilitar o registro em log do Istio
- Como limpar logs manualmente
- Como limpar logs antigos armazenados no pacote do sf-logs
- Como desabilitar os logs de streaming para o AI Center
- Como depurar instalações do Automation Suite com falha
- Como excluir imagens do instalador antigo após a atualização
- Como desabilitar o descarregamento de soma de verificação NIC
- Como atualizar do Automation Suite 2022.10.10 e 2022.4.11 para 2023.10.2
- Como definir manualmente o nível de log do ArgoCD como Info
- Não é possível executar uma instalação offline no SO RHEL 8.4
- Erro ao baixar o pacote
- A instalação offline falha devido a um binário ausente
- Problema de certificado na instalação offline
- First installation fails during Longhorn setup
- Erro de validação da string de conexão ao SQL
- Verificação de pré-requisito para o módulo iscsid do selinux falha
- Azure disk not marked as SSD
- Falha após a atualização do certificado
- Antivírus causa problemas de instalação
- Automation Suite not working after OS upgrade
- O Automation Suite requer que backlog_wait_time seja definido como 0
- Não é possível montar o volume devido a não estar pronto para cargas de trabalho
- Cluster unhealthy after automated upgrade from 2021.10
- Upgrade fails due to unhealthy Ceph
- RKE2 não é iniciado devido a um problema de espaço
- O volume não pode ser montado e permanece no estado de loop anexar/desanexar
- A atualização falha devido a objetos clássicos no banco de dados do Orchestrator
- Um cluster do Ceph foi encontrado em um estado degradado após atualização lado a lado
- Um componente sem integridade do Insights causa uma falha na migração
- A atualização do serviço falha para o Apps
- Tempos limite de atualização no local
- Migração de registro do Docker presa no estágio de exclusão do PVC
- Falha no provisionamento do AI Center após a atualização para a 2023.10
- Falha de atualização em ambientes offline
- Configurando um intervalo de tempo limite para os portais de gerenciamento
- Autenticação não funciona após migração
- kinit: não é possível encontrar o KDC para o realm <AD Domain> ao obter credenciais iniciais
- kinit: o Keytab não contém chaves adequadas para *** ao obter credenciais iniciais
- Falha na operação GSSAPI devido a código de status inválido
- Alarme recebido para trabalho com falha do Kerberos-tgt-update
- Provedor de SSPI: servidor não encontrado no banco de dados Kerberos
- Falha de login para usuário do AD devido a conta desabilitada
- ArgoCD login failed
- Atualizar as conexões de diretório subjacentes
- Falha ao obter a imagem do sandbox
- Os pods não são exibidos na UI do ArgoCD
- Falha de teste do Redis
- O servidor RKE2 falha ao iniciar
- Segredo não encontrado no namespace da UiPath
- O ArgoCD entra em estado Em andamento após a primeira instalação
- Pods de MongoDB em CrashLoopBackOff ou provisionamento de PVC pendente após exclusão
- Unhealthy services after cluster restore or rollback
- Pods presos em Init:0/X
- Métricas Ceph-rook ausentes nos painéis de monitoramento
- O Document Understanding não está no menu de navegação esquerdo do Automation Suite
- Status de Falha ao criar uma sessão de rotulagem de dados
- Status de Falha ao tentar implantar uma habilidade de ML
- Trabalho de migração falha no ArgoCD
- Reconhecimento de escrita com o Extrator de formulários inteligente não está funcionando
- Execução da ferramenta de diagnóstico
- Usando a ferramenta de pacote de suporte do Automation Suite
- Exploração de logs
Início e desligamento de um nó
Guia de instalação do Automation Suite no Linux
Última atualização 19 de abr de 2024
Início e desligamento de um nó
Esta página explica o comportamento de inicialização e desligamento manual e automático do Automation Suite.
Os
rke2-service
inicia e é seguido por node-drainer
e node-uncordon
. node-drainer
não faz nenhuma ação na inicialização, apenas retorna a confirmação de que o serviço está ativo.
O
node-uncordon
é executado apenas uma vez e inicia /opt/node-drain.sh nodestart
, que libera o nó. Durante o procedimento de drenagem que ocorre no desligamento, isso isola o nó, tornando-o não programável. Esse estado persiste quando o serviço do rke2 é iniciado. Portanto, o nó deve ser liberado após a reinicialização de rke2-service
.
Inicialização manual
O serviço é iniciado automaticamente com o Automation Suite. Contudo, se
rke2-service
foi interrompido manualmente, inicie o serviço novamente executando os seguintes comandos:
- Inicie o processo do Kubernetes em execução no nó do servidor:
systemctl start rke2-server
systemctl start rke2-server - Inicie o processo do Kubernetes em execução no nó do servidor:
systemctl start rke2-agent
systemctl start rke2-agent - Depois que o serviço
rke2
for iniciado, libere o nó para garantir que o Kubernetes possa agendar cargas de trabalho neste nó:systemctl restart node-uncordon
systemctl restart node-uncordon - Depois que o nó for iniciado, você deve drenar o nó:
systemctl start node-drain.service
systemctl start node-drain.serviceImportante:Ignorar a etapa 4 pode fazer com que o serviço Kubelet seja desligado de maneira inadequada se o sistema for reiniciado.
Durante o desligamento,
systemd
interrompe os serviços na ordem em que foram iniciados. Como o serviço node-drain
tem a diretiva After=rke2-server.service
ou After=rke2-agent.service
, ele executa sua sequência de desligamento antes do desligamento de rke2-service
.Isso significa que em um sistema devidamente configurado, desligar o nó de forma correta é uma operação segura.
Reinicialização manual
Se você planeja interromper o serviço do rke2 e reinicializar a máquina, execute os seguintes comandos:
-
Para garantir que o cluster esteja íntegro enquanto executa a atividade de manutenção do nó, você deve drenar as cargas de trabalho em execução nesse nó para outros nós.Para drenar o nó, execute o seguinte comando:
systemctl stop node-drain.service
systemctl stop node-drain.service - Interrompa o processo do Kubernetes em execução no nó do servidor:
systemctl stop rke2-server
systemctl stop rke2-server - Interrompa o processo do Kubernetes em execução no nó do agente.
systemctl stop rke2-agent
systemctl stop rke2-agent -
Encerre os serviços e o containerd do rke2 e todos os processos filhos:
Isso já deve estar no caminho, mas está localizado emrke2-killall.sh
rke2-killall.sh/bin/rke2-killall.sh
.
- Os seguintes arquivos de unidade são criados durante a instalação:
rke2-server.service
(somente servidor). Inicia orke2-server
, que inicia o nó do servidor.rke2-agent.service
(apenas agente). Inicia orke2-agent
, o que inicia o nó do agente.node-drain.service
. Usado no momento do desligamento. Executado antes de desligarrke2-agent
ourke2-server
e executa uma drenagem. Tem um tempo limite de 300 segundos.node-uncordon.service
. Usado na inicialização para liberar um nó.var-lib-kubelet.mount
. Autogerado pelo gerador fstab.var-lib-rancher-rke2-server-db.mount
. Autogerado pelo gerador fstab.var-lib-rancher.mount
. Autogerado pelo gerador fstab.
Não há dependências fortes entre os arquivos da unidade. No entanto,
node-drain
e node-uncordon
têm a diretiva After=rke2-server.service
ou After=rke2-agent.service
. Isso significa que esses serviços começarão após o rke2-service
.