Búsqueda de Patrones Frecuentes con sort y uniq
En este paso, aprenderás a combinar múltiples comandos mediante tuberías (pipes) para analizar patrones en datos de registro. Esta es una tarea común en la administración de sistemas y el análisis de datos.
Objetivo
Encontrar las 5 direcciones IP más frecuentes en el archivo de registro de acceso.
Contexto
El análisis de logs a menudo implica encontrar patrones y frecuencias. Al combinar cut, sort, uniq y otros comandos, puedes extraer información valiosa de los datos de texto. Esta técnica es muy útil para identificar patrones de tráfico, detectar anomalías o comprender el comportamiento del usuario.
Tarea
Encuentra las 5 direcciones IP más frecuentes en /home/labex/project/access.log y guarda únicamente las direcciones IP (sin los conteos) en task2_output.txt.
Requisitos
- Trabaja en el directorio
/home/labex/project/.
- Extrae las direcciones IP del primer campo del archivo de registro.
- Cuenta la frecuencia de cada dirección IP.
- Ordena por frecuencia de forma descendente.
- Toma los 5 primeros resultados.
- Guarda solo las direcciones IP (no los conteos) en
task2_output.txt.
Pistas
- Usa
cut -d' ' -f1 para extraer el primer campo (direcciones IP).
- Usa
sort para agrupar elementos idénticos.
- Usa
uniq -c para contar las ocurrencias.
- Usa
sort -rn para ordenar numéricamente de forma inversa (descendente).
- Usa
head -n 5 para obtener los 5 primeros resultados.
- Usa
awk '{print $2}' para extraer solo las direcciones IP de la salida del conteo.
Resultado Esperado
Tu archivo task2_output.txt debería contener 5 direcciones IP:
$ cat task2_output.txt
255.1.2.3
255.4.2.9
255.4.1.9
255.4.1.1
255.1.4.5
Nota: Las direcciones IP reales pueden variar debido a la generación aleatoria de datos.