Comment vérifier si un dump de plantage du noyau est configuré sous Linux

Introduction

Dans ce laboratoire, vous apprendrez à vérifier si le mécanisme de sauvegarde des dumps de noyau (kernel crash dump), kdump, est installé et configuré sur un système Linux. Nous commencerons par vérifier l'état actuel du service kdump en utilisant la commande kdumpctl status.

Ensuite, nous examinerons le fichier de configuration principal de kdump, situé à l'emplacement /etc/kdump.conf, pour comprendre ses paramètres. Enfin, nous inspecterons les paramètres liés aux dumps de noyau dans le répertoire /proc/sys/kernel pour vérifier davantage la configuration du dump de noyau.

Vérifier l'état de kdump avec kdumpctl status

Dans cette étape, nous apprendrons à vérifier l'état de kdump en utilisant la commande kdumpctl. kdump est une fonctionnalité de Linux qui fournit un mécanisme de sauvegarde des dumps de noyau (kernel crash dump). Lorsque le système plante, kdump capture la mémoire du système et l'enregistre dans un fichier, qui peut ensuite être utilisé pour déboguer la cause de l'incident.

La commande kdumpctl est utilisée pour contrôler le service kdump. Nous pouvons l'utiliser pour vérifier si kdump est actuellement en cours d'exécution et activé.

Ouvrez votre terminal. N'oubliez pas que vous pouvez trouver l'icône Xfce Terminal sur le côté gauche de votre bureau.

Maintenant, tapez la commande suivante et appuyez sur Entrée :

kdumpctl status

Cette commande affichera l'état actuel du service kdump. La sortie vous indiquera si kdump est chargé, actif et activé.

Vous devriez voir une sortie similaire à celle-ci :

kdump is loaded
kexec: loaded
kdump: active
kdump: enabled

Cette sortie indique que kdump est correctement configuré et en cours d'exécution sur votre système.

Si vous voyez une sortie différente, cela peut signifier que kdump n'est pas activé ou n'est pas en cours d'exécution. Pour ce laboratoire, nous supposons que kdump est activé et actif.

Comprendre l'état de kdump est la première étape pour gérer les dumps de noyau sur un système Linux.

Cliquez sur Continuer pour passer à l'étape suivante.

Vérifier la configuration de kdump avec cat /etc/kdump.conf

Dans cette étape, nous examinerons le fichier de configuration principal de kdump, qui se trouve à l'emplacement /etc/kdump.conf. Ce fichier contient les paramètres qui contrôlent le comportement de kdump en cas de plantage du système, comme l'emplacement où enregistrer le dump de noyau (kernel crash dump) et les actions à effectuer.

Nous utiliserons la commande cat pour afficher le contenu de ce fichier. La commande cat est un utilitaire de base de Linux utilisé pour concaténer et afficher le contenu de fichiers.

Ouvrez votre terminal s'il n'est pas déjà ouvert.

Maintenant, tapez la commande suivante et appuyez sur Entrée :

cat /etc/kdump.conf

Cette commande affichera tout le contenu du fichier /etc/kdump.conf dans votre terminal.

Vous verrez plusieurs lignes d'options de configuration. Voici quelques options courantes que vous pourriez voir :

path : Spécifie le répertoire où les dumps de noyau sont enregistrés.
core_collector : Définit le programme utilisé pour collecter le dump de noyau (par exemple, makedumpfile).
crashkernel : Configure la quantité de mémoire réservée pour le noyau kdump.
default : Définit l'action par défaut à effectuer après l'enregistrement d'un dump de noyau (par exemple, reboot).

Voici un extrait de ce à quoi pourrait ressembler la sortie (le contenu exact peut varier légèrement) :

## This is a basic kdump configuration file.
#

#path /var/crash

#core_collector makedumpfile -l --message-level 1 -d 31
#core_collector_args -v --message-level 1 -d 31

#crashkernel 128M

#default reboot

Les lignes commençant par # sont des commentaires et sont ignorées par le système. Elles fournissent souvent des explications pour les options de configuration.

En examinant ce fichier, vous pouvez comprendre comment kdump est configuré sur votre système. Vous pouvez modifier ce fichier pour changer le comportement de kdump, mais soyez prudent lorsque vous apportez des modifications aux fichiers de configuration système.

Cliquez sur Continuer pour passer à l'étape suivante.

Inspecter les paramètres de plantage dans /proc/sys/kernel

Dans cette étape, nous explorerons certains paramètres du noyau (kernel) liés aux plantages et à kdump dans le répertoire /proc/sys/kernel. Le système de fichiers /proc est un système de fichiers virtuel qui fournit des informations sur les processus et d'autres informations système. Le répertoire /proc/sys contient des fichiers qui vous permettent de visualiser et de modifier les paramètres du noyau à l'exécution.

Plus précisément, nous examinerons les fichiers liés au comportement en cas de plantage. Nous pouvons à nouveau utiliser la commande cat pour afficher le contenu de ces fichiers.

Ouvrez votre terminal s'il n'est pas déjà ouvert.

Tout d'abord, examinons le fichier panic. Ce fichier contrôle le comportement du noyau en cas de panique (une erreur grave et irréversible). La valeur dans ce fichier représente le nombre de secondes que le noyau attendra avant de redémarrer après une panique.

Tapez la commande suivante et appuyez sur Entrée :

cat /proc/sys/kernel/panic

Vous verrez un seul nombre en sortie, par exemple :

Une valeur de 0 signifie que le noyau ne redémarrera pas automatiquement après une panique. Une valeur positive indique le nombre de secondes à attendre avant de redémarrer.

Ensuite, examinons le fichier panic_on_oops. Un "oops" est une erreur moins grave qu'une panique, mais il peut tout de même indiquer un problème. Ce fichier détermine si un "oops" devrait déclencher une panique complète du noyau.

Tapez la commande suivante et appuyez sur Entrée :

cat /proc/sys/kernel/panic_on_oops

Vous verrez soit 0 soit 1 en sortie :

Une valeur de 0 signifie qu'un "oops" ne provoquera pas de panique. Une valeur de 1 signifie qu'un "oops" déclenchera une panique.

Ces paramètres du noyau sont importants pour comprendre comment votre système réagira aux erreurs et comment kdump pourrait être impliqué dans la capture des informations de plantage.

Cliquez sur Continuer pour terminer ce laboratoire.

Résumé

Dans ce laboratoire, nous avons appris à vérifier si le mécanisme de sauvegarde des dumps de noyau (kernel crash dump), kdump, est configuré et en fonctionnement sur un système Linux. Nous avons commencé par utiliser la commande kdumpctl status pour vérifier l'état actuel du service kdump, en confirmant s'il est chargé, actif et activé. Cela fournit un aperçu rapide de l'état opérationnel de kdump.

Après le contrôle de l'état, nous avons examiné le fichier de configuration principal de kdump, situé à /etc/kdump.conf, en utilisant la commande cat. Cette étape nous permet d'inspecter les paramètres spécifiques qui régissent le comportement de kdump lors d'un plantage du système, comme l'emplacement du dump et les actions à effectuer après le plantage. Comprendre le contenu de ce fichier est essentiel pour configurer et résoudre les problèmes liés à kdump.