Surveillance avec Prometheus
Apprenez à déployer Prometheus, à collecter des métriques hôtes avec Node Exporter, à interroger des données de séries temporelles avec PromQL et à configurer des alertes avec Prometheus et Alertmanager. Ce cours vous fournit une base pratique en matière de surveillance pour les environnements Linux et les infrastructures modernes.
Pourquoi est-ce important ?
Une gestion opérationnelle efficace repose sur la capacité à mesurer le comportement du système, plutôt que sur une simple résolution de problèmes réactive. Prometheus est devenu une plateforme de surveillance standard pour les infrastructures et les environnements cloud-native, car il permet de collecter des métriques, de gérer des alertes et de visualiser les tendances opérationnelles dans le temps. Comprendre son flux de travail principal est essentiel aux pratiques modernes d'observabilité.
Ce que vous allez apprendre
- Installer et vérifier un serveur de surveillance Prometheus.
- Collecter les métriques d'un hôte Linux avec Node Exporter.
- Interroger des métriques à l'aide d'expressions PromQL de base.
- Configurer des règles d'alerte pour détecter des conditions critiques.
- Utiliser Alertmanager pour gérer et acheminer les alertes plus efficacement.
- Appliquer ces compétences dans un défi de solution de surveillance personnalisée.
Feuille de route du cours
Le cours débute par l'installation de Prometheus afin que vous puissiez mettre en place le serveur de surveillance lui-même. Il se poursuit avec Node Exporter, qui fournit des métriques au niveau de l'hôte, rendant le comportement des ressources Linux visible pour Prometheus.
Ensuite, le cours introduit les bases de PromQL pour vous permettre d'interroger et d'interpréter les données de séries temporelles collectées. Après cela, vous définirez des règles d'alerte, puis aborderez les fondamentaux d'Alertmanager afin que la gestion des alertes dépasse la simple détection de seuils.
Le cours se termine par le défi « Solution de surveillance personnalisée », où la collecte de métriques, l'interrogation, l'alerte et le raisonnement opérationnel sont combinés dans un flux de travail d'observabilité complet.
À qui s'adresse ce cours ?
Ce cours est destiné aux apprenants Linux, aux débutants en SRE et aux praticiens DevOps qui ont besoin de comprendre la surveillance basée sur les métriques plutôt que de se fier uniquement à des vérifications système ponctuelles.
Résultats attendus
À la fin de ce cours, vous serez capable de déployer une pile Prometheus de base, de collecter et d'interroger des métriques système, de définir des alertes pertinentes et de comprendre le flux de travail fondamental derrière la surveillance des infrastructures modernes.




