Cómo comprobar si está configurado el volcado de memoria en caso de fallo del kernel en Linux

LinuxLinuxBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, aprenderá cómo verificar si el mecanismo de volcado de memoria en caso de fallo del kernel, kdump, está configurado en un sistema Linux. Comenzaremos comprobando el estado actual del servicio kdump utilizando el comando kdumpctl status.

A continuación, examinaremos el archivo de configuración principal de kdump, ubicado en /etc/kdump.conf, para entender sus configuraciones. Finalmente, inspeccionaremos las configuraciones relacionadas con los fallos del kernel en el directorio /proc/sys/kernel para verificar aún más la configuración del volcado de memoria en caso de fallo del kernel.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL linux(("Linux")) -.-> linux/SystemInformationandMonitoringGroup(["System Information and Monitoring"]) linux(("Linux")) -.-> linux/BasicFileOperationsGroup(["Basic File Operations"]) linux/BasicFileOperationsGroup -.-> linux/cat("File Concatenating") linux/SystemInformationandMonitoringGroup -.-> linux/service("Service Managing") subgraph Lab Skills linux/cat -.-> lab-558720{{"Cómo comprobar si está configurado el volcado de memoria en caso de fallo del kernel en Linux"}} linux/service -.-> lab-558720{{"Cómo comprobar si está configurado el volcado de memoria en caso de fallo del kernel en Linux"}} end

Verificar el estado de kdump con kdumpctl status

En este paso, aprenderemos cómo verificar el estado de kdump utilizando el comando kdumpctl. kdump es una característica en Linux que proporciona un mecanismo de volcado de memoria en caso de fallo. Cuando el sistema falla, kdump captura la memoria del sistema y la guarda en un archivo, que luego se puede utilizar para depurar la causa del fallo.

El comando kdumpctl se utiliza para controlar el servicio kdump. Podemos usarlo para verificar si kdump está actualmente en ejecución y habilitado.

Abra su terminal. Recuerde que puede encontrar el icono de Xfce Terminal en el lado izquierdo de su escritorio.

Ahora, escriba el siguiente comando y presione Enter:

kdumpctl status

Este comando mostrará el estado actual del servicio kdump. La salida le dirá si kdump está cargado, activo y habilitado.

Debería ver una salida similar a esta:

kdump is loaded
kexec: loaded
kdump: active
kdump: enabled

Esta salida indica que kdump está correctamente configurado y en ejecución en su sistema.

Si ve una salida diferente, podría significar que kdump no está habilitado o no está en ejecución. Para este laboratorio, asumimos que kdump está habilitado y activo.

Comprender el estado de kdump es el primer paso para gestionar los volcados de memoria en caso de fallo en un sistema Linux.

Haga clic en Continuar para pasar al siguiente paso.

Verificar la configuración de kdump con cat /etc/kdump.conf

En este paso, examinaremos el archivo de configuración principal de kdump, que se encuentra en /etc/kdump.conf. Este archivo contiene configuraciones que controlan cómo se comporta kdump cuando ocurre un fallo del sistema, como dónde guardar el volcado de memoria en caso de fallo y qué acciones realizar.

Utilizaremos el comando cat para mostrar el contenido de este archivo. El comando cat es una utilidad fundamental de Linux que se utiliza para concatenar y mostrar el contenido de archivos.

Abra su terminal si no está abierta.

Ahora, escriba el siguiente comando y presione Enter:

cat /etc/kdump.conf

Este comando imprimirá todo el contenido del archivo /etc/kdump.conf en su terminal.

Verá varias líneas de opciones de configuración. Algunas opciones comunes que puede ver incluyen:

  • path: Especifica el directorio donde se guardan los volcados de memoria en caso de fallo.
  • core_collector: Define el programa utilizado para recopilar el volcado de memoria en caso de fallo (por ejemplo, makedumpfile).
  • crashkernel: Configura la cantidad de memoria reservada para el kernel de kdump.
  • default: Establece la acción predeterminada a realizar después de guardar el volcado de memoria en caso de fallo (por ejemplo, reboot).

A continuación, se muestra un fragmento de cómo podría ser la salida (el contenido exacto puede variar ligeramente):

## This is a basic kdump configuration file.
#

#path /var/crash

#core_collector makedumpfile -l --message-level 1 -d 31
#core_collector_args -v --message-level 1 -d 31

#crashkernel 128M

#default reboot

Las líneas que comienzan con # son comentarios y son ignoradas por el sistema. A menudo proporcionan explicaciones para las opciones de configuración.

Al revisar este archivo, puede entender cómo está configurado kdump en su sistema. Puede modificar este archivo para cambiar el comportamiento de kdump, pero tenga cuidado al realizar cambios en los archivos de configuración del sistema.

Haga clic en Continuar para pasar al siguiente paso.

Inspeccionar la configuración de fallos en /proc/sys/kernel

En este paso, exploraremos algunos parámetros del kernel relacionados con los fallos del sistema y kdump dentro del directorio /proc/sys/kernel. El sistema de archivos /proc es un sistema de archivos virtual que proporciona información sobre los procesos y otras informaciones del sistema. El directorio /proc/sys contiene archivos que le permiten ver y modificar los parámetros del kernel en tiempo de ejecución.

Específicamente, examinaremos archivos relacionados con el comportamiento en caso de fallo. Podemos utilizar nuevamente el comando cat para ver el contenido de estos archivos.

Abra su terminal si no está abierta.

Primero, echemos un vistazo al archivo panic. Este archivo controla el comportamiento del kernel cuando se produce un pánico (un error grave e irrecuperable). El valor en este archivo representa el número de segundos que el kernel esperará antes de reiniciarse después de un pánico.

Escriba el siguiente comando y presione Enter:

cat /proc/sys/kernel/panic

Verá un solo número como salida, por ejemplo:

0

Un valor de 0 significa que el kernel no se reiniciará automáticamente después de un pánico. Un valor positivo indica el número de segundos a esperar antes de reiniciarse.

A continuación, echemos un vistazo al archivo panic_on_oops. Un "oops" es un error menos grave que un pánico, pero aún puede indicar un problema. Este archivo determina si un "oops" debe desencadenar un pánico completo del kernel.

Escriba el siguiente comando y presione Enter:

cat /proc/sys/kernel/panic_on_oops

Verá 0 o 1 como salida:

1

Un valor de 0 significa que un "oops" no causará un pánico. Un valor de 1 significa que un "oops" desencadenará un pánico.

Estos parámetros del kernel son importantes para entender cómo su sistema reaccionará a los errores y cómo kdump podría estar involucrado en la captura de información de fallos.

Haga clic en Continuar para completar este laboratorio.

Resumen

En este laboratorio, aprendimos cómo verificar si el mecanismo de volcado de memoria en caso de fallo del kernel, kdump, está configurado y en funcionamiento en un sistema Linux. Comenzamos utilizando el comando kdumpctl status para verificar el estado actual del servicio kdump, confirmando si está cargado, activo y habilitado. Esto proporciona una visión general rápida del estado operativo de kdump.

Después de verificar el estado, examinamos el archivo de configuración principal de kdump, ubicado en /etc/kdump.conf, utilizando el comando cat. Este paso nos permite inspeccionar las configuraciones específicas que rigen el comportamiento de kdump durante un fallo del sistema, como la ubicación del volcado y las acciones posteriores al fallo. Comprender el contenido de este archivo es crucial para configurar y solucionar problemas de kdump.