- Visão geral
- Requisitos
- Recomendado: modelos de implantação
- Manual: preparando a instalação
- Manual: preparando a instalação
- Etapa 1: Configuração do registro compatível com OCI para instalações offline
- Etapa 2: configuração do objectstore externo
- Etapa 3: configuração do High Availability Add-on
- Etapa 4: configuração do Microsoft SQL Server
- Etapa 5: configuração do balanceador de carga
- Etapa 5: configuração do DNS
- Etapa 7: configuração dos ajustes do nível do kernel e do sistema operacional
- Etapa 8: configuração dos discos
- Etapa 9: configuração das portas do nó
- Etapa 10: aplicação de configurações diversas
- Etapa 12: validação e instalação dos pacotes RPM necessários
- Etapa 13: geração de cluster_config.json
- Configuração de Certificados
- Configuração do Banco de Dados
- Configuração externa do Objectstore
- Configuração de URL pré-assinada
- Configuração de registro externo compatível com OCI
- Disaster Recovery: configurações Ativo/Passivo e Ativo/Ativo
- Configuração do High Availability Add-on
- Configuração específica do Orchestrator
- Configuração específica do Insights
- Process Mining-specific configuration
- Configuração específica do Document Understanding
- Automation Suite Robots-specific configuration
- Configuração do monitoramento
- Opcional: configuração do servidor proxy
- Opcional: habilitação da resiliência a falhas zonais em um cluster de produção pronto para alta disponibilidade de vários nós
- Opcional: transmitindo resolv.conf personalizado
- Optional: Increasing fault tolerance
- Parâmetros do install-uipath.sh
- Adicionando um nó de agente dedicado com suporte a GPU
- Adição de um nó de agente dedicado ao Task Mining
- Conexão do aplicativo Task Mining
- Adicionando um nó de agente dedicado para robôs do Automation Suite
- Etapa 15: configuração do registro temporário do Docker para instalações offline
- Etapa 16: validação dos pré-requisitos para a instalação
- Manual: realizando a instalação
- Pós-instalação
- Administração de cluster
- Gerenciando produtos
- Introdução ao portal de administração do cluster
- Migrating objectstore from persistent volume to raw disks
- Migração do High Availability Add-on no cluster para externo
- Migrating data between objectstores
- Migrating in-cluster objectstore to external objectstore
- Mudança para o cluster secundário manualmente em uma configuração Ativo/Passivo
- Disaster Recovery: executando operações pós-instalação
- Convertendo uma instalação existente para configuração multi-local
- Diretrizes sobre atualização de uma implantação Ativo/Passivo ou Ativo/Ativo
- Diretrizes sobre backup e restauração de uma implantação Ativo/Passivo ou Ativo/Ativo
- Redirecting traffic for the unsupported services to the primary cluster
- Monitoramento e alertas
- Migração e atualização
- Etapa 1: mover os dados da organização do Identity, de independente para o Automation Suite
- Etapa 2: restauração do banco de dados de produtos independente
- Etapa 3: backup do banco de dados da plataforma no Automation Suite
- Etapa 4: mesclando organizações no Automation Suite
- Etapa 5: atualização das strings de conexão do produto migradas
- Etapa 6: migração do Orchestrator independente
- Etapa 7: migração do Insights independente
- Etapa 8: exclusão do tenant padrão
- B) Migração de um único tenant
- Migração do Automation Suite no Linux para o Automation Suite no EKS/AKS
- Atualizando o Automação Suite
- Download dos pacotes de instalação e obtenção de todos os arquivos no primeiro nó do servidor
- Recuperação da mais recente configuração aplicada do cluster
- Atualização da configuração de cluster
- Configuração do registro compatível com OCI para instalações offline
- Migração para um registro externo compatível com OCI
- Execução da atualização
- Realização de operações pós-atualização
- Configuração específica do produto
- Uso da ferramenta de configuração do Orchestrator
- Configuração de parâmetros do Orchestrator
- Configurações de aplicativo do Orchestrator
- Configuração do AppSettings
- Configuração do tamanho máximo da solicitação
- Substituição da configuração de armazenamento no nível do cluster
- Configuração dos repositórios de credenciais
- Configuração da chave de criptografia por tenant
- Melhores práticas e manutenção
- Solução de problemas
- Como solucionar problemas dos serviços durante a instalação
- Como desinstalar o cluster
- Como limpar os artefatos offline para melhorar o espaço em disco
- Como limpar os dados do Redis
- Como habilitar o registro em log do Istio
- Como limpar logs manualmente
- Como limpar logs antigos armazenados no pacote do sf-logs
- Como desabilitar os logs de streaming para o AI Center
- Como depurar instalações do Automation Suite com falha
- Como excluir imagens do instalador antigo após a atualização
- Como desabilitar o descarregamento de soma de verificação NIC
- Como atualizar do Automation Suite 2022.10.10 e 2022.4.11 para 2023.10.2
- Como definir manualmente o nível de log do ArgoCD como Info
- Não é possível executar uma instalação offline no SO RHEL 8.4
- Erro ao baixar o pacote
- A instalação offline falha devido a um binário ausente
- Problema de certificado na instalação offline
- First installation fails during Longhorn setup
- Erro de validação da string de conexão ao SQL
- Verificação de pré-requisito para o módulo iscsid do selinux falha
- Azure disk not marked as SSD
- Falha após a atualização do certificado
- Antivírus causa problemas de instalação
- Automation Suite not working after OS upgrade
- O Automation Suite requer que backlog_wait_time seja definido como 0
- Não é possível montar o volume devido a não estar pronto para cargas de trabalho
- Cluster unhealthy after automated upgrade from 2021.10
- Upgrade fails due to unhealthy Ceph
- RKE2 não é iniciado devido a um problema de espaço
- O volume não pode ser montado e permanece no estado de loop anexar/desanexar
- A atualização falha devido a objetos clássicos no banco de dados do Orchestrator
- Um cluster do Ceph foi encontrado em um estado degradado após atualização lado a lado
- Um componente sem integridade do Insights causa uma falha na migração
- A atualização do serviço falha para o Apps
- Tempos limite de atualização no local
- Migração de registro do Docker presa no estágio de exclusão do PVC
- Falha no provisionamento do AI Center após a atualização para a 2023.10
- Falha de atualização em ambientes offline
- Configurando um intervalo de tempo limite para os portais de gerenciamento
- Autenticação não funciona após migração
- kinit: não é possível encontrar o KDC para o realm <AD Domain> ao obter credenciais iniciais
- kinit: o Keytab não contém chaves adequadas para *** ao obter credenciais iniciais
- Falha na operação GSSAPI devido a código de status inválido
- Alarme recebido para trabalho com falha do Kerberos-tgt-update
- Provedor de SSPI: servidor não encontrado no banco de dados Kerberos
- Falha de login para usuário do AD devido a conta desabilitada
- ArgoCD login failed
- Atualizar as conexões de diretório subjacentes
- Falha ao obter a imagem do sandbox
- Os pods não são exibidos na UI do ArgoCD
- Falha de teste do Redis
- O servidor RKE2 falha ao iniciar
- Segredo não encontrado no namespace da UiPath
- O ArgoCD entra em estado Em andamento após a primeira instalação
- Pods de MongoDB em CrashLoopBackOff ou provisionamento de PVC pendente após exclusão
- Unhealthy services after cluster restore or rollback
- Pods presos em Init:0/X
- Métricas Ceph-rook ausentes nos painéis de monitoramento
- O Document Understanding não está no menu de navegação esquerdo do Automation Suite
- Status de Falha ao criar uma sessão de rotulagem de dados
- Status de Falha ao tentar implantar uma habilidade de ML
- Trabalho de migração falha no ArgoCD
- Reconhecimento de escrita com o Extrator de formulários inteligente não está funcionando
- Execução da ferramenta de diagnóstico
- Usando a ferramenta de pacote de suporte do Automation Suite
- Exploração de logs
Basic architecture considerations
Assim como em qualquer implantação em vários locais, as principais considerações de arquitetura para o Automation Suite incluem infraestrutura, latência, fonte de dados, gerenciamento, objetivo de tempo de recuperação, objetivo de ponto de recuperação etc.
Recomendamos usar o mesmo hardware para ambos os clusters. No entanto, o cluster do Automation Suite provavelmente funcionará com configurações de hardware semelhantes com pouca diferença. O hardware heterogêneo pode aumentar a complexidade e retardar a solução de problemas.
A latência tem importância crucial no projeto de um modelo Ativo/Ativo. Ele denota o tempo de ida e volta (RTT) entre os dois clusters do Automation Suite. Um nível de latência mínimo entre os dois sites é ideal, pois reduz muito o risco de perda de dados durante uma interrupção. O RTT deve ficar abaixo de um limite de 10 ms.
Você deve testar com rigor o RTT antes de passar para o estágio de produção, devido ao seu efeito direto nas métricas de desempenho. Se a latência exceder o benchmark de 10 ms entre os dois sites, recomendamos considerar uma configuração Ativo/Passivo em vez de uma configuração Ativo/Ativo.
Qualquer componente que necessite de sincronização deve ter um RTT inferior a 10 ms. Isso inclui servidores SQL, HAA, objectstore, etc.
Os dois clusters do Automation Suite são independentes e não compartilham qualquer configuração. Portanto, qualquer atividade de gerenciamento ou manutenção deve ser feita individualmente nesses clusters. Por exemplo, você deve atualizar as strings de conexão SQL em ambos os clusters, configurar certificados separadamente, etc. Além disso, você deve monitorar os dois clusters de forma independente, atualizá-los individualmente, etc.
O objectstore, combinado com o banco de dados SQL, forma o estado de um produto instalado no Automation Suite.
A configuração do SQL Server desempenha um papel vital em uma implantação em vários locais.Embora o SQL Server seja um componente externo ao Automation Suite, algumas etapas adicionais são necessárias para garantir HA verdadeiro ao trabalhar com o Automation Suite.
MultiSubnetFailover=True
na string de conexão quando o servidor/banco de dados SQL estiver distribuído em várias sub-redes.
Para obter mais detalhes, consulte grupos de disponibilidade Always On e Pré-requisitos, restrições e recomendações para grupos de disponibilidade Always On.
O objectstore externo é imune a possíveis danos devido à falha do nó. A replicação de dados e a disaster recovery podem ser realizadas independentemente do Automation Suite. Como o SQL Server, o objectstore externo deve ser definido em uma configuração de Disaster Recovery de alta disponibilidade. A instância primária do objectstore está localizada fisicamente no datacenter primário e pelo menos uma instância secundária está localizada no datacenter secundário com sincronização de dados habilitada. Você pode configurar um balanceador de carga no objectstore para garantir que ambos os clusters do Automation Suite referem-se aos mesmos endpoints. Isso torna a implantação independente do modo como o objectstore é configurado internamente.
Para AWS S3, o ponto de acesso multirregional não oferece suporte a todas as APIs s3 exigidas por todos os produtos em execução no Automation Suite. Para obter detalhes sobre a lista de APIs de suporte, consulte Usando pontos de acesso multirregionais com operações de API compatíveis.
Você pode criar dois buckets por produto/conjunto em ambas as regiões e habilitar a sincronização. O cluster do Automation Suite em execução na mesma região fará referência aos buckets na mesma região.
A política da sua organização em relação ao RTO é vital ao projetar seu cluster do Automation Suite de vários locais. Para atingir o RTO desejado, leve em consideração os seguintes aspectos:
- Design do Gerenciador de Tráfego;
- Disponibilidade dos nós no cluster secundário/passivo;
- Disponibilidade de carga de trabalho dinâmica no cluster secundário; por exemplo, HabilidadeDeML;
- Gerenciamento de configurações.
Para desbloquear todo o potencial de ambos os clusters, é crucial configurar o Traffic Manager adequadamente. A configuração deve facilitar de forma ideal a distribuição de tráfego para ambos os clusters. Essa estratégia não só garante uma distribuição de carga equilibrada, mas também protege a continuidade dos negócios, mitigando qualquer possível disrupção se algum dos sites sofrer um desligamento completo.
No caso de um desastre que faça com que um site fique totalmente não operacional, o outro site deve ter capacidade suficiente para garantir que a automação de negócios não seja impactada. A incapacidade do local em funcionamento pode afetar negativamente a execução dos negócios e potencialmente ocasionar problemas operacionais significativos.
Alguns produtos, como o AI Center, implantam as habilidades de ML dinamicamente em runtime. A implantação das habilidades em outro cluster é sempre assíncrona. Isso não pode garantir sua disponibilidade. Para garantir que sua solução de automação volte a ficar online no tempo desejado, você pode sincronizar periodicamente as habilidades em outro cluster.
Como as implantações do Automation Suite em vários locais consistem em dois clusters distintos, qualquer operação executada em um dos clusters deve ser executada no outro cluster a tempo de reduzir o desvio. Isso garante que ambos os clusters possuam configurações semelhantes e que nenhum esforço adicional seja necessário durante a recuperação.
A política da sua organização em relação ao Objetivo do Ponto de Recuperação (RPO) é vital ao projetar seu cluster do Automation Suite de vários locais. Para atingir o RPO desejado, você deve levar em consideração os seguintes aspectos:
- Sincronização de dados;
- Backup agendado.
Quando gravados na fonte de dados primária, os dados também devem ser sincronizados com o cluster secundário. No entanto, há risco de perda de dados quando o datacenter está inoperante e os dados não são sincronizados. Configurações de rede exemplares, como alta largura de banda e baixa latência entre os dois centros de dados, podem acelerar a sincronização.
Nem toda recuperação de desastres fornece imunidade total à perda de dados. No entanto, você pode implantar uma estratégia de backup regular e periódica para minimizar o impacto do desastre na recuperação de dados. Para detalhes, consulte Backup e restauração do cluster.