Monitorización y Observabilidad de Sistemas

10 professional roles

Analista APM y de Rendimiento de Aplicaciones
Analice el rendimiento de aplicaciones utilizando herramientas APM como Datadog, New Relic, Dynatrace y Elastic APM. Identifique cuellos de botella, ajuste la instrumentación y optimice la salud del servicio.
Arquitecto de Métricas Prometheus
Diseñar esquemas de métricas de Prometheus, escribir consultas PromQL y reglas de grabación, gestionar la cardinalidad y construir infraestructura de métricas escalable para sistemas nativos en la nube.
Arquitecto de Pipeline de Observabilidad
Diseñe tuberías de observabilidad escalables para métricas, registros y trazas utilizando OpenTelemetry Collector, Fluentd, Vector y Kafka para unificar datos de telemetría a escala.
Diseñador de SLO y Presupuesto de Errores
Defina SLI, SLO y presupuestos de errores significativos alineados con la experiencia del usuario. Genere reglas de alerta, cálculos de tasa de consumo y reportes de confiabilidad para equipos de SRE.
Ingeniero de Agregación y Análisis de Logs
Construye y optimiza pipelines de agregación de registros utilizando Elasticsearch, Loki, OpenSearch y Splunk. Escribe reglas de análisis, consultas LogQL y esquemas de registro estructurado para sistemas de producción.
Ingeniero de Estrategia de Alertas y Guardia
Diseñar reglas de alerta, rotaciones de guardia, políticas de escalamiento y runbooks que reduzcan el ruido, prevengan la fatiga de alertas y garanticen que el ingeniero adecuado sea notificado para el incidente correcto.
Ingeniero de Monitoreo Sintético y Disponibilidad
Diseñe verificaciones de monitoreo sintético, pruebas de disponibilidad y sondeos de recorridos de usuario utilizando Grafana Synthetic Monitoring, Checkly, Datadog Synthetics y Blackbox Exporter.
Ingeniero de Observabilidad de Kubernetes
Construye observabilidad completa para clústeres de Kubernetes: kube-state-metrics, cAdvisor, exportadores de nodos, agregación de registros de pods y paneles de salud del clúster para equipos de plataforma.
Ingeniero de Panel de Control Grafana
Diseñe y construya paneles de Grafana de nivel productivo con consultas PromQL, LogQL y Tempo, que cubren seguimiento de SLO, visión general de infraestructura y paneles de estado de servicios.
Ingeniero de Rastreo Distribuido
Diseñar e implementar sistemas de trazado distribuido utilizando OpenTelemetry, Jaeger, Zipkin y Tempo para rastrear solicitudes a través de microservicios y localizar cuellos de botella de latencia.