Guia de instalação do Automation Suite

Última atualização 24 de abr de 2024

Uso da pilha de monitoramento

A pilha de monitoramento dos clusters do Automation Suite inclui o Prometheus, Grafana e AlertManager, que são integrados dentro da UI do Rancher Cluster Explorer.

Observação:

As falhas de nó podem ocasionar um desligamento do Kubernetes, o que interromperia os alertas do Prometheus. Para evitar isso, recomendamos configurar um alerta separado no servidor RKE2.

Esta página descreve uma série de cenários de monitoramento. Para obter mais detalhes, consulte a documentação do Rancher sobre o uso do Rancher Monitoring.

Importante:

Ao usar coletores para exportar métricas para ferramentas de terceiros, habilitar o monitoramento de aplicativos pode interromper a funcionalidade do Automation Suite.

Acesso ao painel do Rancher Monitoring

Acesse o Rancher Cluster Explorer por meio do https://monitoring.{cluster_host}. A tela que aparece para você depende de essa ser ou não a primeira vez que você está se conectando ao Rancher Server.
Insira a senha. A senha é a mesma em qualquer caso. Ela pode ser recuperada com o seguinte comando:
```
kubectl get secret -n cattle-system rancher-admin-password -o jsonpath='{.data.password}' | base64 -d && echokubectl get secret -n cattle-system rancher-admin-password -o jsonpath='{.data.password}' | base64 -d && echo
```
Abra o Explorador de clusters clicando no link local na página principal do Rancher Server.
Clique no menu Monitoring na barra lateral.

Verificando alertas atualmente sendo disparados

No painel de Monitoramento, verifique no painel inferior se há alertas acionados no momento. As seguintes capturas de tela mostram vários alertas acionados no momento.

Silenciamento dos alertas

Se os alertas forem muito ruidosos, você poderá silenciá-los. Para isso, siga as seguintes etapas:

Clique no bloco AlertManager no canto superior esquerdo do painel do Monitoring. A tela a seguir é exibida.
Encontre o alerta em questão e selecione Silenciar.
Preencha os detalhes de Criador e Comentário e clique em Criar. O alerta não deve mais ser mostrado no Painel de monitoramento ou ser relatado para qualquer um dos receptores configurados.

Envio de alertas para um receptor externo

É altamente recomendável configurar um receptor externo para os alertas. Dessa forma, os alertas serão enviados conforme acontecerem, ao invés de exigirem uma atualização do painel do Monitoring para ver os alertas mais recentes.

Para obter detalhes sobre como enviar alertas para um receptor externo, consulte a documentação do Rancher em Configuração dos receptores do AlertManager.

Além de um receptor, você deve configurar pelo menos uma rota que use esse receptor. Uma rota define como os alertas são agrupados e quais alertas são enviados para o receptor. Consulte a documentação do Rancher em Configuração de rotas do AlertManager.

Consulte abaixo um exemplo de como os alertas serão exibidos ao usar o receptor do Slack. Clicar no link para o AlertManager levará você até o console do AlertManager, onde os alertas podem ser silenciados e existem outros links para a expressão do Prometheus que acionou o alerta. Clicar na URL do Runbook levará você para esta página, com instruções de correção específicas. Esses links também estão presentes quando os alertas são enviados para outros receptores externos.

Acesso ao painel do Grafana

No painel de Monitoramento, clique no bloco do Grafana. O painel do Grafana agora é exibido.

Monitoramento do service mesh

Você pode monitorar o Istio Service Mesh por meio dos seguintes painéis do Grafana: o Istio Mesh e o Istio Workload.

Painel do Istio Mesh

Esse painel mostra o volume geral de solicitações, assim como as taxas de erros 400 e 500 em todo o service mesh para o período de tempo selecionado. Os dados são exibidos no canto superior direito da janela. Consulte os quatro gráficos na parte superior para obter essas informações.

Ele também mostra a taxa de sucesso imediata no último minuto passado para cada serviço individual. Observe que uma taxa de sucesso de NaN indica que o serviço não está servindo tráfego no momento.

Painel do Istio Workload

Esse painel mostra as métricas de tráfego no intervalo de tempo selecionado no canto superior direito da janela.

Use os selectores na parte superior do painel para detalhar cargas de trabalho específicas. Um namespace de interesse específico é o uipath.

A seção superior mostra métricas gerais, a seção Cargas de trabalho de entrada separa o tráfego com base na origem e a seção Serviços de saída separa o tráfego com base no destino.

Monitoramento de volumes persistentes

Você pode monitorar volumes persistentes por meio do painel do Kubernetes/Volumes persistentes. Você pode rastrear o espaço livre e utilizado para cada volume.

Você também pode verificar o status de cada volume clicando no item Volumes persistentes dentro do menu Armazenamento do Cluster Explorer.

Monitoramento da utilização de hardware

Para verificar a utilização do hardware por nó, você pode usar o painel Nós. Há dados disponíveis sobre a CPU, memória, disco e rede.

Você pode monitorar a utilização do hardware para cargas de trabalho específicas usando o painel do Kubernetes/Compute Resources/Namespace (Workloads). Selecione o namespace uipath para obter os dados necessários.

Criação de um instantâneo visual compartilhável de um gráfico do Grafana

Clique na seta que aponta para baixo ao lado do título do gráfico e, em seguida, selecione Compartilhar.
Clique na guia Instantâneo e defina o Nome do instantâneo, Expiração e Tempo limite.
Clique em Publicar para snapshot.raintank.io.

Para obter mais detalhes, consulte a documentação do Grafana sobre painéis de compartilhamento.

Observação: esse instantâneo é visível na internet pública por qualquer pessoa com o link.

Criação de painéis persistentes personalizados do Grafana

Para obter detalhes sobre como criar painéis do Grafana persistentes personalizados, consulte a documentação do Rancher.

Acesso do administrador ao Grafana

O acesso de administradores ao Grafana normalmente não é necessário nos clusters do Automation Suite, pois os painéis estão disponíveis para acesso de leitura por padrão para usuários anônimos, e a criação de painéis persistentes personalizados deve ser feita usando as instruções nativas vinculadas acima neste documento.

No entanto, o acesso de administradores ao Grafana é possível com as instruções abaixo.

O nome de usuário e senha padrão para o acesso de administradores do Grafana pode ser recuperado da seguinte forma:

kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-user}' | base64 -d && echo
kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-password}' | base64 -d && echokubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-user}' | base64 -d && echo
kubectl get secret -n cattle-monitoring-system rancher-monitoring-grafana -o jsonpath='{.data.admin-password}' | base64 -d && echo

Observe que nos clusters do Automation Suite de alta disponibilidade existem vários pods do Grafana para habilitar o acesso de leitura ininterrupto no caso de falha de nós, assim como um maior volume de consultas de leitura. Isso é incompatível com o acesso de administradores, porque os pods não compartilham o estado da sessão, e o login requer isso. Como solução alternativa, o número de réplicas do Grafana deve ser escalonado temporariamente como uma enquanto se desejar que o administrador tenha acesso. Consulte abaixo instruções sobre como dimensionar o número de réplicas do Grafana:

# scale down
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=1
# scale up
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=2# scale down
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=1
# scale up
kubectl scale -n cattle-monitoring-system deployment/rancher-monitoring-grafana --replicas=2

Consulta do Prometheus

No Painel do Monitoring, clique em Gráfico do Prometheus. Uma nova janela é exibida.

A documentação sobre as métricas disponíveis está aqui:

Criação de alertas personalizados

Você pode criar alertas personalizados usando uma consulta do Prometheus com uma expressão booleana.

Para fazê-lo, clique em Regras do Prometheus no menu Avançado do Painel de monitoramento.
Clique em Criar no canto superior direito da janela para criar um novo alerta, e siga a documentação do Rancher: PrometheusRules
Quando o alerta for acionado, ele deverá ser mostrado no Painel do Monitoring. Além disso, ele será roteado para qualquer um dos receptores configurados.

Monitoramento do status de recursos do Kubernetes

Para consultar o status dos pods, implantações, statefulsets etc., você pode usar a UI do Cluster Explorer. Essa é a mesma página de destino que foi acessada após se conectar ao endpoint do Rancher Server. A página inicial mostra um resumo, com detalhes específicos de cada tipo de recurso à esquerda. Observe o seletor do namespace na parte superior da página. O painel também pode ser substituído pela ferramenta Lens.

Exportação de métricas do Prometheus para um sistema externo

O Prometheus usa o recurso de gravação remota do Prometheus para coletar e exportar métricas do Prometheus para um sistema externo.

Observação: o UiPath não é compatível nem mantém as integrações do endpoint de gravação remota. Entretanto, os endpoints são compatíveis com a instância do Prometheus entregue dentro do Automation Suite.

Para configurar remote_write em um cluster do Automation Suite:

Conecte-se ao ArgoCD.
Clique em Aplicativos.
Navegue até o instalador de malha.
Abra o painel DETALHES DO APLICATIVO e desative a autocorreção.
Navegue até o aplicativo rancher-monitoring.
Abra o painel DETALHES DO APLICATIVO > guia MANIFESTO.
Clique em EDITAR e navegue até a seção valores > prometheus > prometheusSpec.
Adicione as configurações remoteWrite desejadas.

Descubra as configurações disponíveis para a funcionalidade de gravação remota.
SALVE a nova configuração. O aplicativo Rancher Monitoring exibe OutOfSync até a nova configuração ser aplicada.

Observação: o Prometheus não precisa reiniciar para aplicar as novas configurações de gravação remota.
Teste a integração de gravação remota desejada. Retorne à Etapa 8 para adicionar uma nova configuração.

Nesta página

Acesso ao painel do Rancher Monitoring
Verificando alertas atualmente sendo disparados
Silenciamento dos alertas
Envio de alertas para um receptor externo
Acesso ao painel do Grafana
Monitoramento do service mesh
Painel do Istio Mesh
Painel do Istio Workload
Monitoramento de volumes persistentes
Monitoramento da utilização de hardware
Criação de um instantâneo visual compartilhável de um gráfico do Grafana
Criação de painéis persistentes personalizados do Grafana
Acesso do administrador ao Grafana
Consulta do Prometheus
Criação de alertas personalizados
Monitoramento do status de recursos do Kubernetes
Exportação de métricas do Prometheus para um sistema externo

Was this page helpful?

PREVIOUSComo configurar o Splunk

AvançarRunbooks de alertas