Automation Suite - Etapa 3: etapas pós-implantação

Validando a instalação

Para verificar se o Automation Suite foi instalado com sucesso, você deve acessar a conta de armazenamento, dentro do contêiner de sinalizadores . A instalação estará concluída se o conteúdo do arquivo gerado automaticamente chamado installResult (no contêiner) for successful. O conteúdo será failed se a instalação falhar.

Atualização de certificados

Importante:

O processo de instalação gera certificados autoassinados em seu nome. No entanto, o modelo de implantação do Azure também oferece a opção de fornecer um certificado de servidor emitido pela CA no momento da instalação, em vez de usar um certificado autoassinado gerado automaticamente.

Certificados autoassinados expirarão em 90 dias e você deverá substituí-los por certificados assinados por uma CA confiável assim que a instalação for concluída. Se você não atualizar os certificados, a instalação deixará de funcionar após 90 dias.

Para obter instruções, consulte Gerenciamento de certificados.

Exploring flags and logs

Se você precisar de mais informações sobre o processo de instalação do Automation Suite ou outras operações, um bom lugar para começar é a conta de armazenamento usada para armazenar vários sinalizadores e logs durante a implantação e manutenção do cluster.

Para localizar a conta de armazenamento, execute as seguintes etapas:

Navegue até o grupo de recursos em que a implantação foi executada.
Filtre por tipo de recurso Storage Account.
Localize a conta de armazenamento cujo nome termina com st. Por exemplo:
Selecione a conta de armazenamento e clique em Contêineres. Suas opções são flags e logs.

Sinalizadores de contêiner

O contêiner de sinalizadores armazena vários sinalizadores ou arquivos necessários para orquestração ou apenas para relatar o status de várias operações. Em um novo cluster, o conteúdo do contêiner de flags geralmente tem a aparência mostrada no exemplo a seguir:

Os arquivos nos contêineres de sinalizadores são usados para orquestrar várias operações, como o processo de instalação do Automation Suite no cluster ou operações de cluster específicas, como atualização de instância. Por exemplo:

uipath-server-000000.success indica que a instalação da infraestrutura foi concluída com êxito nesse nó específico do cluster;
installResult lê success se a instalação geral for bem-sucedida.

Contêiner de logs

Ao executar uma operação, ela normalmente produz um arquivo de log no contêiner de logs . Em um cluster novo, o conteúdo do contêiner de logs normalmente tem a aparência mostrada no exemplo a seguir:

Cada arquivo no contêiner de logs representa os logs para uma etapa específica do processo de instalação. Por exemplo:

infra-uipath-server-000000.log armazena os logs de instalação da infraestrutura;
fabric.log armazena os logs para a instalação da malha;
services.log armazena os logs para a instalação de aplicativos e serviços.

Acessando saídas de implantação

Quando a instalação estiver concluída, você precisa acessar os Resultados de implantação na aba Resultados.

Para fazer isso, vá para seu Grupo de recursos e, em seguida, para Implantações → mainTemplate (ou algo como Microsoft.Template-DateTime) → Saídas.

Saídas da implantação

Saída	Description
Documentação	Um link para a documentação.
URL	A URL do balanceador de carga. Pode ser usado para acesso direto. Se os domínios personalizados forem habilitados, este é o domínio que você usaria para a ligação CNAME.
KeyVaultURL	A URL do Portal do Azure para o Key Vault criado pela implantação. Ela contém todos os segredos (credenciais) usados na implantação.
ArgoCDURL	A URL para acessar o ArgoCD. Isso está disponível na VNet. O acesso externo a essa URL deve ser configurado conforme descrito na: Etapa 4: Configuração do DNS.
ArgoCDPassword	A senha usada para fazer login no portal ArgoCD.
HostAdminUsername e HostAdminPassword	As credenciais usadas para Administração de Host.
ClusterAdministrationURL	A URL para o portal de administração de cluster.

Todas as credenciais usadas na implantação são armazenadas como segredos dentro de um Key Vault provisionado durante a implantação. Para acessar os segredos, filtre os recursos dentro do Grupo de Recursos, pesquise Vault e, em seguida, clique em Segredos.

Observação:

Se você vir o The operation “List” is not enabled in the key vault’s access policyaviso na guia Segredos guia, siga os seguintes passos:

Vá para Políticas de acesso → Adicionar política de acesso → Configurar o modelo → Gerenciamento de segredo → Selecionar principal .
Selecione seu usuário e clique em Salvar.
Navegue de volta para Segredos . O aviso deve desaparecer e os segredos devem estar visíveis.

Como acessar VMs de cluster

As VMs são provisionadas dentro de uma VNet privada. Você pode acessá-los por meio do Azure Bastion seguindo estas etapas:

Navegue até o grupo de recursos em que você implantou o Automation Suite.
Como os agentes, agentes de GPU e VMs de servidor estão dentro dos conjuntos de dimensionamento, você precisa acessar o conjunto de dimensionamento que contém a instância desejada.
Vá para a seção Instâncias na guia Configurações.
Clique no nome da VM que você deseja conectar.
Clique no botão Conectar e, em seguida, escolha Bastion no menu suspenso.
Insira as credenciais fornecidas na implantação (parâmetros Nome de usuário do administrador e Senha do administrador, que você pode encontrar no keyvault de credenciais, em Segredos) e clique em Conectar.

Requisitos de DNS

Como mencionado na Etapa 1: Preparação de sua implantação do Azure, a implantação do Automation Suite Azure cria um balanceador de carga com um IP público e um rótulo DNS associado. Esta etiqueta DNS é de propriedade da Microsoft.

A implantação também provisiona uma zona de DNS privado dentro da VNet do cluster e adiciona vários registros que são usados durante o processo de instalação e configuração.

Se você optar por se conectar de uma máquina externa, não poderá usar a zona DNS privada para resolver o DNS de vários serviços, portanto, será necessário adicionar esses registros ao arquivo host.

Consulte Etapa 4: Configuração do DNS para obter mais detalhes.

Agora você deve conseguir se conectar a vários serviços em execução em seu cluster.

Acessando o portal de administração de cluster

O portal de administração de cluster é um local centralizado onde você pode encontrar todos os recursos necessários para concluir uma instalação do Automation Suite e executar operações comuns de pós-instalação. Para obter detalhes, consulte Introdução ao portal de administração de cluster.

Para acessar o portal de Administração do Cluster, execute a seguinte etapa:

Acesse o seguinte URL: https://${CONFIG_CLUSTER_FQDN}/uipath-management.

Observação: você não precisa de nenhuma credencial para acessar o portal de administração do cluster.

Acessando a interface geral do Automation Suite

A interface do usuário do Automation Suite de uso geral é usada como portal tanto para os administradores quanto para os usuários da organização. É um recurso comum ao nível de organização a partir do qual todos podem acessar todas as áreas do Automation Suite: páginas de administração, páginas ao nível de plataforma, páginas específicas de serviço e páginas específicas do usuário.

Para acessar o Automation Suite, execute as seguintes etapas:

Acesse a seguinte URL: https://${Loadbalancer_dns}, onde <loadbalancer_dns>é a etiqueta DNS para o balanceador de carga e é encontrado em resultados.
Altere para organização padrão.
O nome de usuário é orgadmin.
Recupere a senha acessando Keyval,Segredos e Senha de Administrador do Host.

Acessando a administração do host

O portal do host é onde os administradores do sistema configuram a instância do Automation Suite. As configurações definidas neste portal são herdadas por todas as suas organizações e algumas podem ser substituídas no nível da organização.

Para acessar a administração do host, execute as seguintes etapas:

Acesse a seguinte URL: https://${Loadbalancer_dns}, onde <loadbalancer_dns> é a etiqueta DNS para o balanceador de carga e é encontrado em Saídas.
Alterne para a organização do Host.
Insira o nome de usuário que você especificou anteriormente como um valor para o parâmetro UiPath Admin Username .
Insira a senha que você especificou anteriormente como um valor para o parâmetro Senha de administrador da UiPath. Recupere a senha acessando CofreDeChaves,Segredos e, então, Senha do admin do host.

Acessando o ArgoCD

Você pode usar o console do ArgoCD para gerenciar produtos instalados.

Para acessar o ArgoCD, siga as seguintes etapas:

Acesse a seguinte URL: https://alm.${Loadbalancer_dns}, Onde <loadbalancer_dns> é a etiqueta DNS para o balanceador de carga e é encontrado em Saídas. Observe que você deve configurar o acesso externo a essa URL, conforme descrito em Etapa 4: Configuração do DNS.
O nome de usuário é admin.
Para acessar a senha, acesse o Resultados guia ou o Keyvault da credencial.

Acessando o Rancher

O Automation Suite usa o Rancher para fornecer ferramentas de gerenciamento de cluster prontas para usar. Isso ajuda você a gerenciar o cluster e acessar o monitoramento e a solução de problemas.

Consulte a Documentação do Rancher para obter mais detalhes.

Consulte Uso da pilha de monitoramento para saber mais sobre como usar o monitoramento do Rancher no Automation Suite.

Para acessar o console Rancher, siga as seguintes etapas:

Acesse o seguinte URL: https://monitoring.${Loadbalancer_dns}, onde <loadbalancerdns> é o rótulo DNS do balanceador de carga e pode ser encontrado entre as Saídas da sua implantação.
O nome de usuário é admin.
Para acessar a senha, execute o passo a passo abaixo.
```
kubectl get secrets/rancher-admin-password -n cattle-system \
-o "jsonpath={.data['password']}" | echo $(base64 -d)kubectl get secrets/rancher-admin-password -n cattle-system \
-o "jsonpath={.data['password']}" | echo $(base64 -d)
```

Como escalonar seu cluster

Os recursos de computação provisionados da implantação consistem em conjuntos de escalonamento do Azure, que permitem fácil escalonamento.

Você pode adicionar mais recursos manualmente a um conjunto de dimensionamento específico, incluindo a adição de nós de servidor, nós de agente ou nós de agente especializados (como nós de GPU).

Você pode executar uma escala manual identificando o conjunto de escala específico e adicionar recursos diretamente.

Para fazer isso, siga os seguintes passos:

Vá para o Portal do Azure e filtre no conjunto de escalonamento específico:
Selecione o conjunto de escalonamento apropriado e clique em Escala.
Modifique o campo Contagem de instâncias usando o controle deslizante ou o campo de entrada ao lado dele e, em seguida, clique em Salvar.

Observação: para conjuntos de escalas do servidor, a contagem de instâncias precisa ser um número ímpar.
A operação de escalonamento deve começar em segundo plano e novos recursos ficam disponíveis após a conclusão.

Concluindo uma atualização

Após executar uma atualização de cluster do Automation Suite, as implantações de modelo do Azure exigem algumas alterações para garantir que um novo nó ingresse corretamente no cluster. Para automatizar as alterações, recomendamos usar o script dedicado. Para obter instruções, consulte a documentação do modelo de implantação do Azure.

Operações de ciclo de vida da VM do Azure

Dica:

O Azure permite uma janela de 15 minutos no máximo para se preparar para o desligamento, enquanto o encerramento normal de um nó do Automation Suite varia de 20 minutos (para nós de agente e GPU) a horas (no caso de nós de servidor).

Para evitar a perda de dados, a política de atualização do VMSS do servidor é definida como manual, e as VMs do servidor têm a proteção para as ações de conjunto de escala habilitadas. Como resultado, recomendamos gerenciar o ciclo de vida dos servidores por meio dos Runbooks fornecidos.

Os runbooks InstanceRefresh, RemoveNodes, RemoveServerse CheckServerZoneResilience têm suporte apenas para implantações de produção prontas para HA de vários nós.

O número de servidores após a execução de qualquer runbook deve ser ímpar e maior que três (por exemplo, você não pode executar uma atualização de instância se tiver 4 servidores; não pode remover um servidor se tiver um total de cinco).

Todas as VMs em VMSSes devem estar no estado Running .

Somente um runbook deve ser executado por vez.

Importante: os runbooks InstanceRefresh, RemoveNodese RemoveServers são afetados por um problema que causa falha nas operações de remoção de nó se os pods de serviço Process Mining (AirFlow) e/ou Automation Suite Robots estiverem agendados no nó.

InstanceRefresh

Description

O runbook InstanceRefresh tem os seguintes casos de uso:

Atualize o VMSS OS SKU nos conjuntos de dimensionamento de servidor, agente e GPU.
Execute uma operação de rotação de nó para um/mais VMSSes.
Outras alterações de configuração do VMSS que foram aplicadas ao VMSS anteriormente.

Uso

Acesse o Portal do Azure e procure o recurso chamado InstanceRefresh.
Clique no botão Iniciar para abrir a lista de parâmetros. Complete os parâmetros considerando:
- Uma operação de rotação de nó é executada em um VMSS somente se o parâmetro REFRESH<node_type> estiver configurado como True. Se vários parâmetros REFRESH<node_type> forem definidos como True, a ordem de rotação do nó VMSS será Servidores -> Agentes -> Agentes de GPU.
- Você deve fornecer o parâmetro NEWOSVERSION para atualizar o VMSS OS SKU. Você pode encontrar o SKU de imagem de VMs do Azure Marketplace disponível usando az vm image list-skus --location <deployment_location> --offer RHEL --publisher RedHat --output table. As VMs atuais não são atualizadas automaticamente para o modelo mais recente (uma operação de rotação de nós é necessária para isso).
  
  Clique no botão OK para iniciar o runbook.

Detalhes da implementação

O runbook InstanceRefresh é um wrapper para o runbook RemoveNodes . Como resultado, o status é rastreado durante a execução de RemoveNodes. Ele atualiza todas as versões do VMSS OS (se necessário) e extrai, com base nos parâmetros recebidos, o nome do host para a operação de rotação do nó e os encaminha para o RemoveNodes. Se o cluster tiver exatamente três servidores, o runbook InstanceRefresh criará três novos servidores; caso contrário, RemoveNodes lida com a expansão para manter pelo menos um servidor em cada zona de disponibilidade o tempo todo.

RemoveNodes

Description

O runbook RemoveNodes tem os seguintes casos de uso:

Remova os nós especificados do cluster do Automation Suite.
Execute uma operação de rotação de nós para uma ou duas VMs.

Uso

Pesquise os nomes de computador dos nós que deseja remover. Para fazer isso, vá para um VMSS e clique em Instances na seção Settings .
Acesse o Portal do Azure e procure o recurso chamado RemoveNodes.
Clique no botão para abrir a lista de parâmetros. Complete os parâmetros considerando o seguinte:

NODESTOBEREMOVEDCOMPUTERNAME é uma lista separada por vírgulas de nomes de computador das VMs que você deseja excluir (por exemplo, pxlqw-agent-000009,pxlqw-agent-00000A) e é o único parâmetro obrigatório. Recomendamos remover os nós de um único VMSS por vez.
ISINSTANCEREFRESH e THREESERVERSSCENARIO são sinalizadores preenchidos pelo wrapper InstanceRefresh .

Clique no botão OK para iniciar o runbook.

Detalhes da implementação

O runbook RemoveNodes tem uma abordagem recursiva para superar o tempo limite de 3 horas de quota justa. Isso remove ou repõe o primeiro ou os dois primeiros nós (o número é escolhido para atender à restrição de número ímpar de servidores) da lista recebida e executa novamente outra instância do runbook com a lista restante.

A operação de reparação de nó requer as seguintes etapas:

Expanda o VMSS com uma ou duas VMs com base no número de nós que serão removidos.
Execute a remoção do nó para as instâncias antigas.

A operação de remoção de nó para um nó requer a execução das seguintes etapas:

Isolar e drenar as instâncias. A operação expira após 20 minutos para um agente e number_of_instances * 60 minutos para servidores.
Pare o serviço rke nas instâncias. A operação expira após 5 minutos.
Remova os nós do cluster do Automation Suite e exclua as VMs. A operação expira após 20 minutos para agentes e number_of_instances * 60 minutos para servidores.

RemoveServers

Description

O runbook RemoveServers tem o seguinte caso de uso:

remova os servidores do cluster do Automation Suite.

Uso

Acesse o Portal do Azure e procure o recurso chamado RemoveServers.
Clique no botão para abrir a lista de parâmetros. Complete os parâmetros considerando o seguinte:

REMOVEDSERVERSCOUNT é o número de servidores que serão removidos. Recomendamos remover não mais do que 2 servidores de cada vez para não atingir o tempo limite de quota justa.

Detalhes da implementação

O runbook RemoveServers remove o número de servidores recebidos como parâmetro das zonas de disponibilidade com mais VMs.

CheckServerZoneResilience

Description

O runbook CheckServerZoneResilience expande o servidor VMSS e usa o runbook RemoveServers para equilibrar os servidores nas zonas de disponibilidade. Isso faz parte do fluxo InstanceRefresh e não deve ser executado manualmente.

AddGpuNode

Description

No cenário em que a implantação inicial foi criada sem um nó de GPU, criamos o VM Scale Set, mas temos um SKU diferente para evitar problemas de disponibilidade de zona/SKU. Este runbook altera o SKU para um SKU de GPU e adiciona um nó.

Importante: não escale o GPU VMSS inicial criado antes de executar este runbook se a implantação inicial tiver sido criada sem nós de GPU.

Uso

Para usar este runbook, execute as seguintes etapas:

Navegue até o grupo de recursos no qual você implantou o Automation Suite, identifique e clique em Conta de Automação.
Clique em Runbooks e, em seguida, no runbook AddGPUNode .
Forneça um nome para o SKU que deseja ter e clique em Iniciar.

Parâmetros:

skuName – o SKU para os nós de GPU VMSS.

Valores permitidos:

Standard_NC8as_T4_v3
Standard_NC12s_v3
Standard_NC24s_v3

RegisterAiCenterExternalOrchestrator

Description

O runbook registra o AI Center no Orchestrator externo fornecido no momento da implantação.

Uso

O documento expõe um único parâmetro obrigatório: IdentityToken, que é um token de acesso de instalação gerado pelo serviço de Identidade externo. Como o token tem uma breve disponibilidade (aproximadamente 1-2 horas), recomendamos gerá-lo antes de executar o runbook. Para obter instruções, consulte Chave de instalação.

BackupCluster

Description

O runbook BackupCluster ajuda você a fazer backup de seu cluster.

Uso

Navegue até o grupo de recursos no qual você implantou o Automation Suite, identifique e clique em Automation Account.
Clique em Runbooks e, em seguida, no runbook BackupCluster .
Forneça um nome para o backup que você deseja criar.
Para iniciar uma operação de backup para o cluster do Automation Suite, clique no botão Iniciar na parte superior da página.
Assim que o status da tarefa runbook for Completed, a operação de backup será concluída. Se o status do trabalho de runbook for Failed, você poderá verificar os logs na conta de armazenamento para obter mais informações.

GetAllBackups

Description

O runbook GetAllBackups ajuda você a exibir uma lista de todos os backups disponíveis, agendados e manuais.

RestoreClusterInitialize, RestoreSnapshot

Description

Esses runbooks ajudam a executar uma restauração do cluster.

Uso

Nota: Ao iniciar o processo de restauração, colocamos o cluster em modo de manutenção. Assim que o processo de restauração for bem-sucedido, tiramos o cluster do modo de manutenção.

Para executar uma operação de restauração, execute as seguintes etapas:

Identifique os arquivos de restauração que deseja usar. Para fazer isso, navegue até sua conta de automação de implantação do Automation Suite e execute o runbook GetAllBackups .
Quando o trabalho do runbook estiver concluído, verifique a parte inferior da guia Saída para obter uma lista de backups disponíveis. Selecione aquele que deseja usar na operação de restauração e copie-o.
Navegue de volta para a conta de automação e execute o runbook RestoreClusterInitialize . Para o parâmetro, cole o nome do arquivo de backup copiado anteriormente. Neste ponto, o processo de restauração é iniciado.
A tarefa RestoreSnapshot é iniciada automaticamente. Quando o trabalho é concluído, o processo de restauração é concluído.

Observação: os logs estão presentes na conta de armazenamento (terminando com st), no contêiner de backups, na pasta restores/<backup-name>/ , onde backup-name é o nome do backup usado para executar a restauração.
Após uma restauração, você deve confirmar se o cluster está em um bom estado (consulte Validando a instalação ou qualquer link de solução de problemas do ArgoCD). Depois disso, você tem a opção de habilitar o backup no cluster executando o runbook RestoreClusterFinalize com o mesmo parâmetro da etapa anterior. Isso habilita backups para o cluster.

Solução de problemas

Caso uma VM falhe ao ingressar no cluster do Automation Suite, uma reversão será tentada. As VMs recém-criadas seguirão as mesmas etapas de uma remoção de nó normal (interromper, drenar, interromper o serviço rke, remover o nó do cluster e excluir as VMs). Você pode encontrar os logs do procedimento de nó de junção na conta de armazenamento, dentro do contêiner de logs , em blobs como infra-<hostname>.log.
Em caso de falha durante a exclusão de nós, qualquer runbook será interrompido e exibirá os logs da etapa que falhou. Corrija o problema, conclua o processo manualmente ou usando o runbook RemoveNodes . Você pode encontrar todos os logs na conta de armazenamento, dentro do contêiner de logs , da seguinte forma:
- Cordão e drenagem – <timestamp>-<runbook_abreviation>-drain_nodes.log
- Pare o serviço rke – <timestamp>-<runbook_abreviation>-stop_rke.log
- Remova o nó do cluster – <timestamp>-<runbook_abreviation>-remove_nodes.log
Em caso de tempo limite, você deve aguardar a etapa finalizar sua execução, verificar os logs e concluir o processo manualmente ou usando o runbook RemoveNodes. Todos os runbooks usam a funcionalidade Comando de Execução do Azure para executar código no contexto das VMs. Uma limitação desse método é que ele não retorna o status da execução. Portanto, as etapas para isolar, drenar e interromper o serviço rke são executadas de forma assíncrona, e o status é mantido com blobs no seguinte formato: <timestamp>-<runbook_abreviation>-<step_name>.<success/fail>.

Etapa 3: etapas de pós-implantação

Validando a instalação

Atualização de certificados

Exploring flags and logs

Sinalizadores de contêiner

Contêiner de logs

Acessando saídas de implantação

Saídas da implantação

Como acessar VMs de cluster

Requisitos de DNS

Acessando o portal de administração de cluster

Acessando a interface geral do Automation Suite

Acessando a administração do host

Acessando o ArgoCD

Acessando o Rancher

Como escalonar seu cluster

Concluindo uma atualização

Operações de ciclo de vida da VM do Azure

InstanceRefresh

Description

Uso

RemoveNodes

Description

Uso

Detalhes da implementação

RemoveServers

Description

Uso

CheckServerZoneResilience

Description

AddGpuNode

Description

Uso

RegisterAiCenterExternalOrchestrator

Description

Uso

BackupCluster

Description

Uso

GetAllBackups

Description

RestoreClusterInitialize, RestoreSnapshot

Description

Uso

Solução de problemas

Was this page helpful?