Objectifs#
- Comprendre les 3 piliers de l’observabilité
- Déployer et configurer Prometheus + Grafana
- Centraliser les logs avec Loki
- Créer des alertes pertinentes et des SLOs
Programme#
Module 1 — Fondamentaux observabilité#
- Monitoring vs observabilité
- Les 3 piliers : métriques, logs, traces
- RED et USE methods
- SLIs, SLOs, SLAs et error budgets
Module 2 — Métriques avec Prometheus#
- Architecture et scraping
- PromQL : requêtes de base à avancées
- Exporters (node, blackbox, custom)
- Recording rules et optimisation
Module 3 — Visualisation avec Grafana#
- Installation et configuration
- Créer des dashboards efficaces
- Variables et templating
- Dashboards as Code (Grafonnet, Terraform)
Module 4 — Logs avec Loki#
- Architecture Loki
- LogQL
- Promtail et Alloy
- Corrélation logs-métriques
Module 5 — Alerting#
- Alertmanager : routing, grouping, silencing
- Alertes qui comptent (pas de alert fatigue)
- Intégrations : Slack, PagerDuty, email
- On-call et incident management
Module 6 — Tracing#
- OpenTelemetry
- Tempo / Jaeger
- Instrumentation applicative
- Corrélation traces-métriques-logs
🔬 Labs interactifs : bientôt disponibles.