Verificar Despejo de Falha do Kernel no Linux: Guia Completo

Introdução

Neste laboratório, você aprenderá como verificar se o mecanismo de despejo de falhas do kernel, kdump, está configurado em um sistema Linux. Começaremos verificando o status atual do serviço kdump usando o comando kdumpctl status.

Em seguida, examinaremos o arquivo de configuração principal do kdump, localizado em /etc/kdump.conf, para entender suas configurações. Por fim, inspecionaremos as configurações relacionadas a falhas dentro do diretório /proc/sys/kernel para verificar ainda mais a configuração de despejo de falhas do kernel.

Verificar o status do kdump com kdumpctl status

Nesta etapa, aprenderemos como verificar o status do kdump usando o comando kdumpctl. kdump é um recurso no Linux que fornece um mecanismo de despejo de falhas (crash dumping). Quando o sistema trava, o kdump captura a memória do sistema e a salva em um arquivo, que pode ser usado para depurar a causa da falha.

O comando kdumpctl é usado para controlar o serviço kdump. Podemos usá-lo para verificar se o kdump está atualmente em execução e habilitado.

Abra seu terminal. Lembre-se, você pode encontrar o ícone do Xfce Terminal no lado esquerdo da sua área de trabalho.

Agora, digite o seguinte comando e pressione Enter:

kdumpctl status

Este comando exibirá o status atual do serviço kdump. A saída informará se o kdump está carregado, ativo e habilitado.

Você deve ver uma saída semelhante a esta:

kdump is loaded
kexec: loaded
kdump: active
kdump: enabled

Esta saída indica que o kdump está devidamente configurado e em execução no seu sistema.

Se você vir uma saída diferente, pode significar que o kdump não está habilitado ou não está em execução. Para este laboratório, assumimos que o kdump está habilitado e ativo.

Compreender o status do kdump é o primeiro passo para gerenciar despejos de falhas em um sistema Linux.

Clique em Continuar para prosseguir para a próxima etapa.

Verificar a configuração do kdump com cat /etc/kdump.conf

Nesta etapa, examinaremos o arquivo de configuração principal do kdump, que está localizado em /etc/kdump.conf. Este arquivo contém configurações que controlam como o kdump se comporta quando ocorre uma falha no sistema, como onde salvar o despejo de falha e quais ações tomar.

Usaremos o comando cat para exibir o conteúdo deste arquivo. O comando cat é um utilitário Linux fundamental usado para concatenar e exibir o conteúdo de arquivos.

Abra seu terminal, caso ainda não esteja aberto.

Agora, digite o seguinte comando e pressione Enter:

cat /etc/kdump.conf

Este comando imprimirá todo o conteúdo do arquivo /etc/kdump.conf no seu terminal.

Você verá várias linhas de opções de configuração. Algumas opções comuns que você pode ver incluem:

path: Especifica o diretório onde os despejos de falha são salvos.
core_collector: Define o programa usado para coletar o despejo de falha (por exemplo, makedumpfile).
crashkernel: Configura a quantidade de memória reservada para o kernel kdump.
default: Define a ação padrão a ser tomada após um despejo de falha ser salvo (por exemplo, reboot).

Aqui está um trecho de como a saída pode ser (o conteúdo exato pode variar ligeiramente):

## This is a basic kdump configuration file.
#

#path /var/crash

#core_collector makedumpfile -l --message-level 1 -d 31
#core_collector_args -v --message-level 1 -d 31

#crashkernel 128M

#default reboot

Linhas que começam com # são comentários e são ignoradas pelo sistema. Eles geralmente fornecem explicações para as opções de configuração.

Ao revisar este arquivo, você pode entender como o kdump está configurado em seu sistema. Você pode modificar este arquivo para alterar o comportamento do kdump, mas tenha cuidado ao fazer alterações nos arquivos de configuração do sistema.

Clique em Continuar para prosseguir para a próxima etapa.

Inspecionar as configurações de crash em /proc/sys/kernel

Nesta etapa, exploraremos alguns parâmetros do kernel relacionados a falhas e kdump dentro do diretório /proc/sys/kernel. O sistema de arquivos /proc é um sistema de arquivos virtual que fornece informações sobre processos e outras informações do sistema. O diretório /proc/sys contém arquivos que permitem visualizar e modificar os parâmetros do kernel em tempo de execução.

Especificamente, analisaremos arquivos relacionados ao comportamento de falha. Podemos usar o comando cat novamente para visualizar o conteúdo desses arquivos.

Abra seu terminal, caso ainda não esteja aberto.

Primeiro, vamos analisar o arquivo panic. Este arquivo controla o comportamento do kernel quando ocorre um pânico (um erro grave e irrecuperável). O valor neste arquivo representa o número de segundos que o kernel aguardará antes de reiniciar após um pânico.

Digite o seguinte comando e pressione Enter:

cat /proc/sys/kernel/panic

Você verá um único número como saída, por exemplo:

Um valor de 0 significa que o kernel não reiniciará automaticamente após um pânico. Um valor positivo indica o número de segundos a esperar antes de reiniciar.

Em seguida, vamos analisar o arquivo panic_on_oops. Um "oops" é um erro menos grave do que um pânico, mas ainda pode indicar um problema. Este arquivo determina se um "oops" deve acionar um pânico completo do kernel.

Digite o seguinte comando e pressione Enter:

cat /proc/sys/kernel/panic_on_oops

Você verá 0 ou 1 como saída:

Um valor de 0 significa que um "oops" não causará um pânico. Um valor de 1 significa que um "oops" acionará um pânico.

Esses parâmetros do kernel são importantes para entender como seu sistema reagirá a erros e como o kdump pode estar envolvido na captura de informações de falha.

Clique em Continuar para concluir este laboratório.

Resumo

Neste laboratório, aprendemos como verificar se o mecanismo de despejo de falha do kernel, kdump, está configurado e em execução em um sistema Linux. Começamos usando o comando kdumpctl status para verificar o estado atual do serviço kdump, confirmando se ele está carregado, ativo e habilitado. Isso fornece uma visão geral rápida do status operacional do kdump.

Após a verificação do status, examinamos o arquivo de configuração principal do kdump, localizado em /etc/kdump.conf, usando o comando cat. Esta etapa nos permite inspecionar as configurações específicas que regem o comportamento do kdump durante uma falha do sistema, como o local do despejo e as ações pós-falha. Compreender o conteúdo deste arquivo é crucial para configurar e solucionar problemas do kdump.

Como verificar se um despejo de falha do kernel está configurado no Linux

Introdução

Verificar o status do kdump com kdumpctl status

Verificar a configuração do kdump com cat /etc/kdump.conf

Inspecionar as configurações de crash em /proc/sys/kernel

Resumo