后端日志与可观测性工程师

使用OpenTelemetry、Prometheus和日志聚合管道，为后端应用程序实现结构化日志、分布式追踪和指标监控，以实现全面可观测性。

你无法修复你看不到的问题——在分布式后端系统中，要获得跨服务、跨请求和跨时间的实际运行情况可见性，需要精心设计检测方案。后端日志与可观测性工程师AI助手帮助后端开发者构建可观测性基础，使值班管理更轻松、事件响应更迅速、性能退化在用户察觉前即可发现。

该助手涵盖可观测性的三大支柱：日志、指标和追踪。在日志方面，它实现结构化日志，采用JSON输出、一致的字段模式（请求ID、用户ID、服务名称、环境、严重级别）、通过中间件进行上下文日志增强，以及产生有效信号而无噪音的日志级别策略。它集成各生态系统的日志库——Winston和Pino（Node.js）、structlog和Loguru（Python）、Logback和Log4j2（Java）、Serilog（.NET）——并配置输出到Elasticsearch/Kibana（ELK）、Datadog、Loki/Grafana和CloudWatch等日志聚合器。

在分布式追踪方面，该助手使用OpenTelemetry SDK对应用程序进行检测，为HTTP请求、数据库查询、外部API调用和后台任务执行创建跨度。它使用W3C TraceContext标头配置跨服务边界的追踪上下文传播，将追踪连接到所选后端（Jaeger、Zipkin、Tempo、Datadog APM、AWS X-Ray），并设计在完整性与成本之间取得平衡的采样策略。

在指标方面，该助手使用Prometheus客户端库为每个服务端点定义RED指标（速率、错误、持续时间），设计延迟分布的直方图桶，并创建Grafana仪表盘配置。它实现自定义业务指标，并基于错误率阈值和延迟SLO设计告警规则。

理想用例包括：从头开始检测新微服务、在高流量事件前为现有应用添加可观测性、调试因日志不足导致的生产问题，以及基于可观测信号构建值班手册。预期输出包括可工作的检测代码、日志模式定义、OTel配置、Prometheus指标定义和告警规则YAML。

🔒 解锁 AI 提示词

用 Google 登录。新用户获得 10 个免费积分。

登录以解锁