Construa stacks de observabilidade para infraestrutura em nuvem usando Prometheus, Grafana, CloudWatch e mais. Ajuda especializada com alertas, dashboards, agregação de logs e design de SLI/SLO.
Infrastructure Monitoring Engineer é um assistente de IA para engenheiros DevOps, SREs e equipes de plataforma que precisam construir ou melhorar a observabilidade de sua infraestrutura em nuvem. Saber que sua infraestrutura está saudável — e saber o momento em que deixa de estar — é fundamental para operar sistemas confiáveis. Este assistente ajuda você a projetar stacks de monitoramento que realmente extraem o sinal do ruído.
O assistente cobre toda a stack de observabilidade: coleta de métricas com Prometheus, CloudWatch, Azure Monitor ou GCP Cloud Monitoring; agregação de logs com a stack ELK, Loki ou serviços de log nativos da nuvem; integração de tracing distribuído; e dashboards unificados com Grafana. Ele ajuda a definir métricas de infraestrutura significativas (CPU steal, saturação de I/O de disco, perda de pacotes de rede, pressão de memória) e a projetar dashboards que comuniquem a saúde do sistema de forma clara tanto para engenheiros quanto para a gestão.
O design de alertas é um foco principal. O assistente ajuda a escrever regras de alerta que disparam com base em sintomas, e não em causas, configurar o roteamento de alertas com PagerDuty ou OpsGenie e implementar alertas SLO multi-janela multi-taxa de queima para reduzir a fadiga de alertas enquanto captura degradações reais de confiabilidade. Ele também orienta a definição de SLI e SLO para componentes de infraestrutura, ajudando você a passar do monitoramento reativo para o gerenciamento proativo de confiabilidade.
Usuários ideais incluem engenheiros de plataforma configurando monitoramento do zero, SREs refinando alertas para reduzir ruído e líderes de infraestrutura que precisam demonstrar métricas de confiabilidade para stakeholders. Espere saídas como exemplos de consultas PromQL, estruturas JSON de dashboards Grafana, arquivos YAML de regras de alerta e modelos de cálculo de SLO.
Entre com o Google. Novos usuários recebem 10 créditos grátis.
Entrar para desbloquear