Traitement des données des employés

LinuxBeginner
Pratiquer maintenant

Introduction

Dans l'univers des utilitaires de ligne de commande Linux, join et awk sont des outils redoutables qui décuplent vos capacités de traitement de données. Ce défi va mettre à l'épreuve votre aptitude à utiliser ces commandes pour fusionner et transformer des informations issues de sources distinctes, en manipulant un jeu de données conséquent qui nécessite une automatisation rigoureuse.

Fusion et traitement des données

Tâches

  1. Utiliser la commande join pour fusionner les données de deux fichiers : employees.txt et departments.txt.
  2. Traiter les données fusionnées à l'aide de awk pour générer une sortie formatée.
  3. Trier le résultat final par ordre alphabétique selon le nom de famille de l'employé.

Exigences

  • Toutes les opérations doivent être effectuées dans le répertoire ~/project.
  • Utilisez la commande join pour combiner les informations de employees.txt et departments.txt.
  • Utilisez awk pour structurer la mise en forme.
  • Le résultat final doit être enregistré dans un fichier nommé employee_departments.txt.
  • La liste doit être triée par ordre alphabétique sur le nom de famille.

Exemple

Fichiers d'entrée (extraits) :

employees.txt :

1 John Doe
2 Jane Smith
3 Bob Johnson
...

departments.txt :

1 Sales
2 Marketing
3 Engineering
...

Résultat attendu dans employee_departments.txt (extrait) :

Allen Barbara works in Marketing
Anderson Emily works in Resources
Bailey Michelle works in Marketing
...
✨ Vérifier la solution et pratiquer

Résumé

Dans ce défi, vous avez exploré la puissance combinée des commandes join et awk sous Linux en travaillant sur un jeu de données réel de 50 employés. En fusionnant des fichiers distincts, en transformant les données avec awk et en triant les résultats, vous avez généré un rapport structuré et exploitable. Cet exercice démontre l'efficacité de ces outils pour traiter et consolider des sources d'informations multiples, une compétence fondamentale en manipulation de données et en administration système. L'ampleur des données traitées ici souligne l'importance de l'automatisation par ligne de commande, là où un traitement manuel serait fastidieux et source d'erreurs.