Diagnóstico de rede em servidores. Vamos montar um diagnóstico completo de problemas de rede em servidores, estruturando de forma lógica, do básico ao avançado, incluindo identificação de gargalos, logs, ferramentas e interpretação de resultados. Vou detalhar passo a passo.
Problemas de rede em servidores Linux muitas vezes são confundidos com gargalos de CPU ou memória. Antes de iniciar um diagnóstico aprofundado de conectividade, é importante entender como o sistema gerencia recursos internos. No guia completo sobre gerenciamento de memória no Linux na prática, mostramos como o kernel administra RAM, cache e swap em ambientes de produção.
1. Coleta de informações básicas
Antes de qualquer análise profunda, você precisa saber o contexto do servidor e da rede.
- Identificação do servidor:
hostnamectl uname -a cat /etc/os-release
- Interfaces de rede:
ip addr show ip link show
- Rotas:
ip route show
- Tabela ARP:
arp -n
- Verificar conectividade básica:
ping -c 4 8.8.8.8 # Testa saída para internet ping -c 4 <gateway> # Testa gateway ping -c 4 <outro_servidor> # Testa LAN
- Checar DNS:
dig +short google.com nslookup google.com
2. Verificação de tráfego e estatísticas
Isso mostra se há saturação ou perda de pacotes.
- Estatísticas das interfaces:
cat /proc/net/dev
Olhe para RX/TX errors, dropped packets e collisions.
- Utilização de banda em tempo real:
iftop -i eth0 # Visualiza tráfego por conexão nload eth0 # Monitor simples de upload/download
- Checar conexões TCP/UDP:
ss -tulnp # Listar portas abertas ss -s # Resumo de conexões
- Ver conexões lentas ou saturadas:
netstat -anp | grep ESTABLISHED
3. Testes avançados de rede
Esses ajudam a identificar perda de pacotes, latência e jitter.
- Traceroute (rota até o destino):
traceroute 8.8.8.8 mtr 8.8.8.8 # Combina ping + traceroute em tempo real
- Teste de throughput:
iperf3 -s # No servidor iperf3 -c <IP_servidor> # No cliente
- Teste de perda de pacotes e latência:
ping -c 100 -i 0.2 <IP> # ping contínuo para estatísticas
4. Logs e monitoramento do sistema
Erros de rede podem estar registrados no sistema.
- Logs do kernel e rede:
dmesg | grep -i eth journalctl -u NetworkManager journalctl -k
- Logs do firewall e iptables:
sudo iptables -L -v -n sudo nft list ruleset # se usa nftables
- Logs do servidor de aplicação ou webserver:
Erros de timeout, conexões resetadas, etc.
Em muitos cenários, o problema não está na rede em si, mas na saturação de recursos do servidor. Quando a memória está esgotada ou o sistema começa a utilizar swap excessivamente, aplicações podem apresentar latência ou falhas de comunicação. Entenda melhor esse comportamento no artigo como o Linux gerencia memória na prática.
5. Diagnóstico de problemas comuns
Aqui você correlaciona sintomas com causas típicas:
| Sintoma | Possíveis causas |
|---|---|
| Ping alto, variação grande de latência | Congestionamento, link ruim, bufferbloat |
| Perda de pacotes | Cabos, switch, NIC, MTU incorreta, firewall |
| Conexões resetadas frequentes | TCP timeout, aplicação travando, firewall |
| Largura de banda baixa | Saturação da interface, QoS, limitadores |
| Interface caindo ou NIC reiniciando | Hardware, driver, overload |
| DNS lento ou falhando | Servidores DNS, cache corrompido, firewall |
6. Ferramentas adicionais
Para análise mais profunda:
- tcpdump / Wireshark → captura pacotes para análise de protocolos.
tcpdump -i eth0 -nn -s 0 -w captura.pcap
- ethtool → checa estatísticas detalhadas da interface.
ethtool eth0 ethtool -S eth0
- pingplotter / smokePing → monitora latência e perda de forma contínua.
- iperf3 / bwping → teste de banda entre servidores.
- Netdata / Prometheus + Grafana / Zabbix → monitoramento contínuo.
7. Diagnóstico de problemas de DNS
DNS é uma causa comum de lentidão:
dig @8.8.8.8 example.com dig +trace example.com
- Verifique se /etc/resolv.conf aponta para servidores corretos.
- Cheque tempo de resposta (query time) e falhas.
8. Passos de correção
Depois de identificar o problema:
- Cabos, NIC e switch: substitua ou teste em outro segmento.
- MTU incorreta: ajustar MTU para evitar fragmentação.
- Firewall e regras: revisar DROP, REJECT e limites.
- Limites de banda/QoS: ajustar em roteadores ou switches.
- Atualização de driver NIC ou firmware.
- Redundância e failover: usar bonding ou múltiplas rotas.
- Monitoramento contínuo: configurar alertas de latência, perda e saturação.
Diagnosticar problemas de rede exige analisar não apenas conectividade, mas também os recursos internos do servidor. Por isso, recomendamos compreender primeiro como funciona o gerenciamento de memória no Linux em ambientes de produção.
FAQ
Primeiro verifique os recursos do servidor (CPU, memória e disco). Se esses recursos estiverem normais, teste a conectividade com ferramentas como ping, mtr ou traceroute. Se houver latência alta ou perda de pacotes, o problema provavelmente está na rede.
Perda de pacotes ocorre quando dados enviados pela rede não chegam ao destino. Isso pode ser causado por congestionamento, falhas de roteadores, problemas de link ou saturação de banda. Mesmo pequenas perdas podem afetar aplicações como APIs, VoIP e streaming.
O ping mede latência e perda de pacotes entre dois hosts. Já o traceroute mostra o caminho que os pacotes percorrem até o destino, permitindo identificar em qual salto da rede ocorre o problema.
O mtr combina as funcionalidades de ping e traceroute em tempo real. Ele mostra latência, perda de pacotes e estabilidade da conexão em cada salto da rede, sendo uma das ferramentas mais completas para troubleshooting.
Você pode verificar estatísticas da interface com comandos como:
ip -s link
ou
ethtool -S eth0
Se aparecerem erros como dropped packets, CRC errors ou frame errors, pode haver problema físico ou de driver.
Ferramentas como iftop, nload e vnstat permitem visualizar o tráfego de rede em tempo real e identificar quais IPs ou aplicações estão consumindo mais banda.
Veja Mais:
Gerenciamento de Memória no Linux: Guia Prático e Mitos
Decisão estratégica de infraestrutura: comparação técnica para produção
AlmaLinux em Produção: Guia de Boas Práticas e Segurança 2026
Como investigar problemas de performance sem achismo

