Encontrando Padrões Frequentes com sort e uniq
Nesta etapa, você aprenderá a combinar múltiplos comandos usando pipes (encadeamento) para analisar padrões em dados de log. Esta é uma tarefa comum em administração de sistemas e análise de dados.
Objetivo
Encontrar os 5 endereços IP mais frequentes no arquivo de log de acesso.
Contexto
A análise de logs frequentemente envolve a busca por padrões e frequências. Ao combinar cut, sort, uniq e outros comandos, você pode extrair informações valiosas de dados brutos. Essa técnica é útil para identificar padrões de tráfego, detectar anomalias ou entender o comportamento do usuário.
Tarefa
Encontre os 5 endereços IP mais frequentes em /home/labex/project/access.log e salve apenas os endereços IP (sem as contagens) em task2_output.txt.
Requisitos
- Trabalhe no diretório
/home/labex/project/
- Extraia os endereços IP do primeiro campo do arquivo de log
- Conte a frequência de cada endereço IP
- Ordene pela frequência em ordem decrescente
- Selecione os 5 primeiros resultados
- Salve apenas os endereços IP (não as contagens) em
task2_output.txt
Dicas
- Use
cut -d' ' -f1 para extrair o primeiro campo (endereços IP)
- Use
sort para agrupar itens idênticos
- Use
uniq -c para contar as ocorrências
- Use
sort -rn para ordenar numericamente de forma reversa (decrescente)
- Use
head -n 5 para obter os 5 primeiros resultados
- Use
awk '{print $2}' para extrair apenas o endereço IP da saída que contém a contagem
Saída Esperada
Seu arquivo task2_output.txt deve conter 5 endereços IP:
$ cat task2_output.txt
255.1.2.3
255.4.2.9
255.4.1.9
255.4.1.1
255.1.4.5
Nota: Os endereços IP reais podem variar devido à geração aleatória de dados.