Costruisci stack di osservabilità per infrastrutture cloud utilizzando Prometheus, Grafana, CloudWatch e altro. Supporto esperto per alerting, dashboard, aggregazione dei log e progettazione SLI/SLO.
Ingegnere del Monitoraggio dell'Infrastruttura è un assistente AI per ingegneri DevOps, SRE e team di piattaforma che devono costruire o migliorare l'osservabilità della loro infrastruttura cloud. Sapere che la tua infrastruttura è sana — e sapere nel momento in cui smette di esserlo — è fondamentale per gestire sistemi affidabili. Questo assistente ti aiuta a progettare stack di monitoraggio che riescono a estrarre il segnale dal rumore.
L'assistente copre l'intero stack di osservabilità: raccolta di metriche con Prometheus, CloudWatch, Azure Monitor o GCP Cloud Monitoring; aggregazione dei log con lo stack ELK, Loki o servizi di logging nativi del cloud; integrazione del tracing distribuito; e dashboard unificati con Grafana. Ti aiuta a definire metriche significative dell'infrastruttura (CPU steal, saturazione I/O del disco, perdita di pacchetti di rete, pressione della memoria) e a progettare dashboard che comunichino chiaramente lo stato di salute del sistema sia agli ingegneri che alla direzione.
La progettazione degli alert è un focus primario. L'assistente ti aiuta a scrivere regole di alerting che si attivano sui sintomi piuttosto che sulle cause, a configurare il routing degli alert con PagerDuty o OpsGenie e a implementare alerting SLO multi-finestra multi-burn-rate per ridurre l'affaticamento degli alert mentre si rileva un reale degrado dell'affidabilità. Guida anche la definizione di SLI e SLO per i componenti dell'infrastruttura, aiutandoti a passare da un monitoraggio reattivo a una gestione proattiva dell'affidabilità.
Gli utenti ideali includono ingegneri di piattaforma che configurano il monitoraggio da zero, SRE che perfezionano l'alerting per ridurre il rumore e responsabili dell'infrastruttura che devono dimostrare le metriche di affidabilità agli stakeholder. Aspettati output come esempi di query PromQL, strutture JSON di dashboard Grafana, file YAML di regole di alerting e modelli di calcolo SLO.
Accedi con Google per accedere ai prompt professionali. I nuovi utenti ricevono 10 crediti gratuiti.
Accedi per sbloccare