Vamos detalhar kernel panic linux e o diagnóstico inicial de forma prática e técnica.
Kernel Panic: O que é
Um kernel panic ocorre quando o núcleo do Linux encontra um erro crítico do qual não consegue se recuperar. É equivalente ao “Blue Screen of Death” no Windows.
Causas comuns:
- Falha de hardware
- Memória RAM com defeito
- Problemas no disco (bad sectors)
- CPU ou motherboard com defeito
- Módulos do kernel problemáticos
- Drivers mal compilados ou incompatíveis
- Problemas de software
- Atualizações mal aplicadas
- Bibliotecas essenciais corrompidas
- Configurações incorretas
- Parâmetros de boot ou kernel incorretos
Sintomas
- Sistema congela durante boot
- Mensagem de panic com logs do kernel
- Reboot automático ou necessidade de hard reset
- Tela preta com texto de erro (em servidores sem GUI)
Exemplo típico de log de kernel panic:
Kernel panic - not syncing: Fatal exception CPU: 0 PID: 1 Comm: swapper/0 Not tainted Hardware name: ...
Diagnóstico inicial
O diagnóstico precisa ser rápido e sistemático, antes de qualquer reboot que possa complicar a coleta de dados.
1. Verificar logs de boot e kernel
- Se o sistema reinicia automaticamente, configure
kernel.panic = 10no/etc/sysctl.confpara atrasar reboot e permitir leitura. - Logs relevantes:
dmesg | less journalctl -k cat /var/log/messages | grep -i panic
2. Checar hardware
- Memória RAM:
memtest86+oustress --vm 2 --vm-bytes 80% - Disco:
smartctl -a /dev/sdaefsck - CPU e temperatura:
sensorsoulm-sensors
3. Verificar módulos e drivers
- Listar módulos carregados:
lsmod - Verificar módulos recentes ou suspeitos
- Comparar logs de panic com mensagens de módulos
4. Boot em modo de recuperação
- No GRUB, escolha Advanced Options → Recovery Mode
- Permite:
- Reparo de pacotes
- Desmontar e checar sistemas de arquivos
- Remover módulos problemáticos
5. Captura de crash
- Configurar kdump para gerar dump de memória do kernel:
sudo systemctl enable kdump sudo systemctl start kdump
- Permite análise detalhada posterior (
crash /var/crash/...)
Boas práticas de prevenção
- Testar hardware regularmente
- Atualizar kernel de forma controlada
- Manter backups e snapshots antes de atualizações críticas
- Configurar monitoramento de logs e alertas de hardware
FAQ
Um kernel panic é um erro crítico do núcleo do Linux que faz o sistema travar ou reiniciar, geralmente causado por falhas de hardware, drivers ou problemas de software.
As causas mais frequentes incluem memória RAM defeituosa, disco com bad sectors, drivers incompatíveis, atualizações incorretas e configurações de kernel erradas.
Verifique logs do kernel com dmesg ou journalctl -k, teste hardware com memtest86+ e smartctl, revise módulos carregados com lsmod e utilize o modo de recuperação do GRUB.
Sim, mantendo hardware testado, kernel atualizado, backups regulares, snapshots antes de atualizações críticas e monitoramento contínuo de logs.
O kdump captura o dump de memória durante o kernel panic, permitindo uma análise detalhada posterior para identificar a causa do crash.

