Identifier des motifs fréquents avec sort et uniq
Dans cette étape, vous apprendrez à combiner plusieurs commandes à l'aide de tubes (pipes) pour analyser des motifs dans les données de logs. C'est une tâche courante en administration système et en analyse de données.
Objectif
Trouver les 5 adresses IP les plus fréquentes dans le fichier journal d'accès.
Contexte
L'analyse de logs implique souvent la recherche de motifs et de fréquences. En combinant cut, sort, uniq et d'autres commandes, vous pouvez extraire des informations significatives à partir de données textuelles. Cette technique est précieuse pour identifier les tendances de trafic, détecter des anomalies ou comprendre le comportement des utilisateurs.
Tâche
Trouvez les 5 adresses IP les plus fréquentes dans /home/labex/project/access.log et enregistrez uniquement les adresses IP (sans les compteurs) dans task2_output.txt.
Exigences
- Travaillez dans le répertoire
/home/labex/project/
- Extrayez les adresses IP du premier champ du fichier log
- Comptez la fréquence de chaque adresse IP
- Triez par fréquence dans l'ordre décroissant
- Conservez les 5 premiers résultats
- Enregistrez uniquement les adresses IP (pas les nombres d'occurrences) dans
task2_output.txt
Astuces
- Utilisez
cut -d' ' -f1 pour extraire le premier champ (les adresses IP)
- Utilisez
sort pour regrouper les éléments identiques
- Utilisez
uniq -c pour compter les occurrences
- Utilisez
sort -rn pour effectuer un tri numérique inverse (décroissant)
- Utilisez
head -n 5 pour obtenir les 5 premiers résultats
- Utilisez
awk '{print $2}' pour extraire uniquement les adresses IP de la sortie du compteur
Résultat attendu
Votre fichier task2_output.txt doit contenir 5 adresses IP :
$ cat task2_output.txt
255.1.2.3
255.4.2.9
255.4.1.9
255.4.1.1
255.1.4.5
Note : Les adresses IP réelles peuvent varier en raison de la génération aléatoire des données.