Как проверить, настроен ли дамп ядра при аварии в Linux

LinuxLinuxBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом практическом занятии вы узнаете, как проверить, настроен ли и сконфигурирован механизм дампа ядра при сбоях, kdump, на системе Linux. Сначала мы проверим текущий статус службы kdump с помощью команды kdumpctl status.

Затем мы рассмотрим главный файл конфигурации kdump, расположенный по пути /etc/kdump.conf, чтобы понять его настройки. Наконец, мы проверим настройки, связанные с дампами при сбоях, в каталоге /proc/sys/kernel, чтобы дополнительно убедиться в правильной конфигурации дампа ядра при сбоях.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL linux(("Linux")) -.-> linux/BasicFileOperationsGroup(["Basic File Operations"]) linux(("Linux")) -.-> linux/SystemInformationandMonitoringGroup(["System Information and Monitoring"]) linux/BasicFileOperationsGroup -.-> linux/cat("File Concatenating") linux/SystemInformationandMonitoringGroup -.-> linux/service("Service Managing") subgraph Lab Skills linux/cat -.-> lab-558720{{"Как проверить, настроен ли дамп ядра при аварии в Linux"}} linux/service -.-> lab-558720{{"Как проверить, настроен ли дамп ядра при аварии в Linux"}} end

Проверка статуса kdump с помощью команды kdumpctl status

На этом этапе мы узнаем, как проверить статус kdump с помощью команды kdumpctl. kdump - это функция в Linux, которая обеспечивает механизм создания дампов при сбоях системы. Когда система завершается аварийно, kdump захватывает системную память и сохраняет ее в файл, который затем может быть использован для отладки причины сбоя.

Команда kdumpctl используется для управления службой kdump. С ее помощью можно проверить, запущена ли и включена ли в данный момент служба kdump.

Откройте терминал. Помните, что вы можете найти значок Xfce Terminal слева на рабочем столе.

Теперь введите следующую команду и нажмите Enter:

kdumpctl status

Эта команда отобразит текущий статус службы kdump. В выводе будет указано, загружен ли kdump, активен ли он и включен ли.

Вы должны увидеть вывод, похожий на следующий:

kdump is loaded
kexec: loaded
kdump: active
kdump: enabled

Этот вывод означает, что kdump правильно настроен и запущен на вашей системе.

Если вы видите другой вывод, это может означать, что kdump не включен или не запущен. В рамках этого практического занятия мы предполагаем, что kdump включен и активен.

Понимание статуса kdump является первым шагом в управлении дампами при сбоях на системе Linux.

Нажмите Продолжить, чтобы перейти к следующему шагу.

Проверка конфигурации kdump с помощью команды cat /etc/kdump.conf

На этом этапе мы рассмотрим главный файл конфигурации kdump, который находится по пути /etc/kdump.conf. Этот файл содержит настройки, которые определяют, как kdump будет вести себя при аварийном завершении работы системы, например, куда сохранять дамп при сбоях и какие действия предпринять.

Мы будем использовать команду cat для отображения содержимого этого файла. Команда cat - это фундаментальная утилита Linux, используемая для объединения и отображения содержимого файлов.

Откройте терминал, если он еще не открыт.

Теперь введите следующую команду и нажмите Enter:

cat /etc/kdump.conf

Эта команда выведет весь контент файла /etc/kdump.conf в ваш терминал.

Вы увидите несколько строк с параметрами конфигурации. Некоторые общие параметры, которые вы можете увидеть, включают:

  • path: Указывает каталог, где сохраняются дампы при сбоях.
  • core_collector: Определяет программу, используемую для сбора дампа при сбоях (например, makedumpfile).
  • crashkernel: Конфигурирует объем памяти, зарезервированной для ядра kdump.
  • default: Задает действие по умолчанию, которое необходимо выполнить после сохранения дампа при сбоях (например, reboot).

Вот пример того, как может выглядеть вывод (точное содержимое может несколько отличаться):

## This is a basic kdump configuration file.
#

#path /var/crash

#core_collector makedumpfile -l --message-level 1 -d 31
#core_collector_args -v --message-level 1 -d 31

#crashkernel 128M

#default reboot

Строки, начинающиеся с #, являются комментариями и игнорируются системой. Они часто содержат объяснения для параметров конфигурации.

Просмотрев этот файл, вы можете понять, как kdump настроен на вашей системе. Вы можете изменить этот файл, чтобы изменить поведение kdump, но будьте осторожны при внесении изменений в системные файлы конфигурации.

Нажмите Продолжить, чтобы перейти к следующему шагу.

Проверка параметров аварийного завершения в каталоге /proc/sys/kernel

На этом этапе мы рассмотрим некоторые параметры ядра, связанные с аварийным завершением работы системы и kdump, в каталоге /proc/sys/kernel. Файловая система /proc - это виртуальная файловая система, которая предоставляет информацию о процессах и другой системной информации. Каталог /proc/sys содержит файлы, которые позволяют просматривать и изменять параметры ядра во время выполнения.

В частности, мы рассмотрим файлы, связанные с поведением системы при аварийном завершении. Мы снова можем использовать команду cat для просмотра содержимого этих файлов.

Откройте терминал, если он еще не открыт.

Сначала рассмотрим файл panic. Этот файл контролирует поведение ядра при возникновении паники (серьезной, неисправляемой ошибки). Значение в этом файле представляет собой количество секунд, которые ядро будет ждать перед перезагрузкой после паники.

Введите следующую команду и нажмите Enter:

cat /proc/sys/kernel/panic

В качестве вывода вы увидите одно число, например:

0

Значение 0 означает, что ядро не будет автоматически перезагружаться после паники. Положительное значение указывает количество секунд, которые нужно подождать перед перезагрузкой.

Далее рассмотрим файл panic_on_oops. "Oops" - это менее серьезная ошибка, чем паника, но она все еще может указывать на проблему. Этот файл определяет, должна ли "oops" вызвать полную панику ядра.

Введите следующую команду и нажмите Enter:

cat /proc/sys/kernel/panic_on_oops

В качестве вывода вы увидите либо 0, либо 1:

1

Значение 0 означает, что "oops" не вызовет панику. Значение 1 означает, что "oops" вызовет панику.

Эти параметры ядра важны для понимания того, как ваша система будет реагировать на ошибки и как kdump может быть задействован для сбора информации о сбоях.

Нажмите Продолжить, чтобы завершить это практическое занятие.

Резюме

В этом практическом занятии мы научились проверять, настроен ли и запущен ли механизм дампа ядра при аварийном завершении работы системы, kdump, на системе Linux. Мы начали с использования команды kdumpctl status для проверки текущего состояния службы kdump, чтобы убедиться, что она загружена, активна и включена. Это позволяет быстро получить обзор статуса работы kdump.

После проверки статуса мы рассмотрели главный файл конфигурации kdump, расположенный по пути /etc/kdump.conf, с помощью команды cat. Этот этап позволяет нам проверить конкретные настройки, которые определяют поведение kdump при аварийном завершении работы системы, например, место сохранения дампа и действия после аварии. Понимание содержимого этого файла является важным для настройки и устранения неполадок с kdump.