Introdução
Neste laboratório, você aprenderá como verificar se o mecanismo de despejo de falhas do kernel, kdump, está configurado em um sistema Linux. Começaremos verificando o status atual do serviço kdump usando o comando kdumpctl status.
Em seguida, examinaremos o arquivo de configuração principal do kdump, localizado em /etc/kdump.conf, para entender suas configurações. Por fim, inspecionaremos as configurações relacionadas a falhas dentro do diretório /proc/sys/kernel para verificar ainda mais a configuração de despejo de falhas do kernel.
Verificar o status do kdump com kdumpctl status
Nesta etapa, aprenderemos como verificar o status do kdump usando o comando kdumpctl. kdump é um recurso no Linux que fornece um mecanismo de despejo de falhas (crash dumping). Quando o sistema trava, o kdump captura a memória do sistema e a salva em um arquivo, que pode ser usado para depurar a causa da falha.
O comando kdumpctl é usado para controlar o serviço kdump. Podemos usá-lo para verificar se o kdump está atualmente em execução e habilitado.
Abra seu terminal. Lembre-se, você pode encontrar o ícone do Xfce Terminal no lado esquerdo da sua área de trabalho.
Agora, digite o seguinte comando e pressione Enter:
kdumpctl status
Este comando exibirá o status atual do serviço kdump. A saída informará se o kdump está carregado, ativo e habilitado.
Você deve ver uma saída semelhante a esta:
kdump is loaded
kexec: loaded
kdump: active
kdump: enabled
Esta saída indica que o kdump está devidamente configurado e em execução no seu sistema.
Se você vir uma saída diferente, pode significar que o kdump não está habilitado ou não está em execução. Para este laboratório, assumimos que o kdump está habilitado e ativo.
Compreender o status do kdump é o primeiro passo para gerenciar despejos de falhas em um sistema Linux.
Clique em Continuar para prosseguir para a próxima etapa.
Verificar a configuração do kdump com cat /etc/kdump.conf
Nesta etapa, examinaremos o arquivo de configuração principal do kdump, que está localizado em /etc/kdump.conf. Este arquivo contém configurações que controlam como o kdump se comporta quando ocorre uma falha no sistema, como onde salvar o despejo de falha e quais ações tomar.
Usaremos o comando cat para exibir o conteúdo deste arquivo. O comando cat é um utilitário Linux fundamental usado para concatenar e exibir o conteúdo de arquivos.
Abra seu terminal, caso ainda não esteja aberto.
Agora, digite o seguinte comando e pressione Enter:
cat /etc/kdump.conf
Este comando imprimirá todo o conteúdo do arquivo /etc/kdump.conf no seu terminal.
Você verá várias linhas de opções de configuração. Algumas opções comuns que você pode ver incluem:
path: Especifica o diretório onde os despejos de falha são salvos.core_collector: Define o programa usado para coletar o despejo de falha (por exemplo,makedumpfile).crashkernel: Configura a quantidade de memória reservada para o kernelkdump.default: Define a ação padrão a ser tomada após um despejo de falha ser salvo (por exemplo,reboot).
Aqui está um trecho de como a saída pode ser (o conteúdo exato pode variar ligeiramente):
## This is a basic kdump configuration file.
#
#path /var/crash
#core_collector makedumpfile -l --message-level 1 -d 31
#core_collector_args -v --message-level 1 -d 31
#crashkernel 128M
#default reboot
Linhas que começam com # são comentários e são ignoradas pelo sistema. Eles geralmente fornecem explicações para as opções de configuração.
Ao revisar este arquivo, você pode entender como o kdump está configurado em seu sistema. Você pode modificar este arquivo para alterar o comportamento do kdump, mas tenha cuidado ao fazer alterações nos arquivos de configuração do sistema.
Clique em Continuar para prosseguir para a próxima etapa.
Inspecionar as configurações de crash em /proc/sys/kernel
Nesta etapa, exploraremos alguns parâmetros do kernel relacionados a falhas e kdump dentro do diretório /proc/sys/kernel. O sistema de arquivos /proc é um sistema de arquivos virtual que fornece informações sobre processos e outras informações do sistema. O diretório /proc/sys contém arquivos que permitem visualizar e modificar os parâmetros do kernel em tempo de execução.
Especificamente, analisaremos arquivos relacionados ao comportamento de falha. Podemos usar o comando cat novamente para visualizar o conteúdo desses arquivos.
Abra seu terminal, caso ainda não esteja aberto.
Primeiro, vamos analisar o arquivo panic. Este arquivo controla o comportamento do kernel quando ocorre um pânico (um erro grave e irrecuperável). O valor neste arquivo representa o número de segundos que o kernel aguardará antes de reiniciar após um pânico.
Digite o seguinte comando e pressione Enter:
cat /proc/sys/kernel/panic
Você verá um único número como saída, por exemplo:
0
Um valor de 0 significa que o kernel não reiniciará automaticamente após um pânico. Um valor positivo indica o número de segundos a esperar antes de reiniciar.
Em seguida, vamos analisar o arquivo panic_on_oops. Um "oops" é um erro menos grave do que um pânico, mas ainda pode indicar um problema. Este arquivo determina se um "oops" deve acionar um pânico completo do kernel.
Digite o seguinte comando e pressione Enter:
cat /proc/sys/kernel/panic_on_oops
Você verá 0 ou 1 como saída:
1
Um valor de 0 significa que um "oops" não causará um pânico. Um valor de 1 significa que um "oops" acionará um pânico.
Esses parâmetros do kernel são importantes para entender como seu sistema reagirá a erros e como o kdump pode estar envolvido na captura de informações de falha.
Clique em Continuar para concluir este laboratório.
Resumo
Neste laboratório, aprendemos como verificar se o mecanismo de despejo de falha do kernel, kdump, está configurado e em execução em um sistema Linux. Começamos usando o comando kdumpctl status para verificar o estado atual do serviço kdump, confirmando se ele está carregado, ativo e habilitado. Isso fornece uma visão geral rápida do status operacional do kdump.
Após a verificação do status, examinamos o arquivo de configuração principal do kdump, localizado em /etc/kdump.conf, usando o comando cat. Esta etapa nos permite inspecionar as configurações específicas que regem o comportamento do kdump durante uma falha do sistema, como o local do despejo e as ações pós-falha. Compreender o conteúdo deste arquivo é crucial para configurar e solucionar problemas do kdump.



