Verteiltes-Tracing-Ingenieur

Entwerfen und Implementieren von verteilten Tracing-Systemen mit OpenTelemetry, Jaeger, Zipkin und Tempo, um Anfragen über Microservices hinweg zu verfolgen und Latenzengpässe zu identifizieren.

Zu verstehen, was mit einer Anfrage passiert, während sie Dutzende von Microservices durchläuft, ist eines der schwierigsten Probleme in der modernen Cloud-Infrastruktur. Der Distributed Tracing Engineer hilft Plattformingenieuren, SREs und Backend-Entwicklern, ihre Systeme zu instrumentieren, Trace-Erfassungspipelines zu entwerfen und umsetzbare Erkenntnisse aus verteilten Trace-Daten zu gewinnen.

Dieser Assistent führt Sie durch den gesamten verteilten Tracing-Stack: Auswahl und Konfiguration von Instrumentierungsbibliotheken wie OpenTelemetry SDKs für Ihre Sprache und Ihr Framework, Einrichtung von Trace-Collectors und -Exporters, Auswahl und Bereitstellung eines Tracing-Backends wie Jaeger, Zipkin, Grafana Tempo oder AWS X-Ray sowie Konfiguration von Sampling-Strategien, die Observability-Abdeckung mit Datenvolumen und Kosten in Einklang bringen.

Wenn Sie ein Latenzproblem, einen mysteriösen Fehleranstieg oder eine langsame benutzerorientierte Transaktion beschreiben, hilft Ihnen der Assistent, Trace-Wasserfälle zu interpretieren, Span-Anomalien zu identifizieren und Trace-Daten mit Logs und Metriken zu korrelieren, um ein vollständiges Bild davon zu erstellen, was schiefgelaufen ist und wo. Er erklärt, wie man Flame-Graphen liest, wie man kaskadierende Fehler über Servicegrenzen hinweg diagnostiziert und wie man Latenz bestimmten nachgelagerten Aufrufen zuordnet.

Der Assistent hilft Ihnen auch dabei, Trace-Instrumentierung zu entwerfen, die über automatische Framework-Spans hinausgeht. Er generiert benutzerdefinierten Span-Code, Baggage-Propagation-Muster und Kontextinjektionslogik für Messaging-Systeme wie Kafka oder RabbitMQ, wo der Trace-Kontext nicht automatisch propagiert wird. Er berät zu Head-basiertem versus Tail-basiertem Sampling und hilft Ihnen, Sampling-Regeln zu schreiben, die die für Sie wichtigsten Traces erfassen.

Ideale Benutzer sind Plattformingenieure, die Observability-Stacks für Microservices-Architekturen ausrollen, SREs, die Produktionsvorfälle untersuchen, bei denen die Ursache mehrere Services umfasst, Backend-Entwickler, die zum ersten Mal Tracing zu einer bestehenden Codebasis hinzufügen, und Entwicklungsteams, die von proprietären APM-Tools zu offenen Standards migrieren. Der Distributed Tracing Engineer hilft Ihnen, aufzuhören zu raten, wo die Zeit in Ihrem System bleibt, und anzufangen, es zu wissen.

🔒 KI-Prompt freischalten

Mit Google anmelden. Neue Nutzer erhalten 10 kostenlose Credits.

Anmelden zum Freischalten